R2MeCab のバックアップ(No.2) - アールメカブ

アールメカブ


R2MeCab のバックアップ(No.2)


RMeCab

テキストマイニングのためのツール: データ解析・グラフィックス環境 R から日本語形態素解析ソフト和布蕪(MeCab)を呼び出して使うインターフェイス RMeCab の簡易版

_ 参考文献

_ 開発状況

  • 2009年 3月6日 R2MeCab_0.01: 汎用的な docDF()関数の他に RMeCabC(), RMeCabText?()を実装

_ 機能

RMeCab機能?にある三つの関数が使えます.ただし docDF() は RMeCab? の docDF には,新たに引数 nDF を追加. nDF=1 として実行すると,Ngram の N個のタームは別列にもうけます.

> (res <- docDF("data/photo.csv", 3, type = 1, N = 2))
file = photo.csv
file_name =  data/photo.csv opened
number of extracted terms = 14

      TERM      POS1              POS2 photo.csv
1      ,-F 名詞-名詞     サ変接続-一般         1
2      ,-M 名詞-名詞     サ変接続-一般         1
3  ,-Reply 名詞-名詞 サ変接続-固有名詞         1
4    ,-Sex 名詞-名詞     サ変接続-一般         1
5   ,-写真 名詞-名詞     サ変接続-一般         1
6      1-, 名詞-名詞       数-サ変接続         1
7      2-, 名詞-名詞       数-サ変接続         1
8      3-, 名詞-名詞       数-サ変接続         1
9      4-, 名詞-名詞       数-サ変接続         1
10     5-, 名詞-名詞       数-サ変接続         1
11     F-, 名詞-名詞     一般-サ変接続         1
12    ID-, 名詞-名詞 固有名詞-サ変接続         1
13     M-, 名詞-名詞     一般-サ変接続         1
14   Sex-, 名詞-名詞     一般-サ変接続         1
> (res <- docDF("data/photo.csv", 3, type = 1, N = 2, nDF =1))
file = photo.csv
file_name =  data/photo.csv opened
number of extracted terms = 14

    N1    N2      POS1              POS2 photo.csv
1    ,     F 名詞-名詞     サ変接続-一般         1
2    ,     M 名詞-名詞     サ変接続-一般         1
3    , Reply 名詞-名詞 サ変接続-固有名詞         1
4    ,   Sex 名詞-名詞     サ変接続-一般         1
5    ,  写真 名詞-名詞     サ変接続-一般         1
6    1     , 名詞-名詞       数-サ変接続         1
7    2     , 名詞-名詞       数-サ変接続         1
8    3     , 名詞-名詞       数-サ変接続         1
9    4     , 名詞-名詞       数-サ変接続         1
10   5     , 名詞-名詞       数-サ変接続         1
11   F     , 名詞-名詞     一般-サ変接続         1
12  ID     , 名詞-名詞 固有名詞-サ変接続         1
13   M     , 名詞-名詞     一般-サ変接続         1
14 Sex     , 名詞-名詞     一般-サ変接続         1

_ インストール手順

基本的に RMeCab と変わりませんので,詳細はそちらを参考にしてください.

  • まずMeCabをインストールしてください.ここ から win32バイナリmecab-0.97.exe をダウンロードしてインストールします.インストール先は標準設定のまま C:\Program Files\MeCab とします.また文字コードは Shit-Jis のままとします.
  • MeCab?インストール後 Windowsの環境設定で MeCab? へのパスを通します. すなわちコントロール・パネルの[システム]アイテムを起動し、 表示される[システムのプロパティ]ダイアログの[詳細設定]タブ (Windows 2000では[詳細]タブ) をクリックし、[システム環境変数] の PATH の先頭に
    C:\Program Files\MeCab\bin;
    を追加します.
  • 次に R2MeCab_***.zip をRにインストールします.*** の部分はバージョン番号です.Rのメニューから[パッケージ][ローカルにあるzipファイルからのパッケージのインストール]を選んで,ダウンロードした R2MeCab_***.zipファイルを選んでインストールします.[win-libraryを作成したいのですか] と聞いてきた時は OK を押してください(この際,R はユーザーフォルダを作成します).

_ ダウンロード

このページ一番下のファイルをクリックしてください.ファイル名が変更されないように注意してください.