管理者
RMeCab?パッケージ
統計解析・グラフィックス作成環境 R から日本語形態素解析ソフト和布蕪(MeCab)を呼び出して使うインターフェイス
R は ここ から,自分のOSにあったファイルをダウンロードしてください.例えばWindows版なら,[Windows]->[base]とクリックし,R-2.6.2-win32.exeをダウンロードします.後はダブルクリックを繰り返せばインストールできます.
古いバージョン
_ Windows 版バイナリ &ref(): File not found: "RMeCab_0.2.zip" at page "SoftArchive";
インストール手順
- まずMeCab?をインストールしてください.ここ から win32バイナリmecab-0.97.exe をダウンロードしてインストールします.インストール先は標準の C:\Program Files\MeCab で構いません.また文字コードは Shit-Jis のままで構いません.
- 次にwin32 用Rパッケージ &ref(): File not found: "RMeCab_0.2.zip" at page "SoftArchive"; をRにインストールします.Rのメニューから[パッケージ]→[ローカルにあるzipファイルからのパッケージのインストール]を選んで&ref(): File not found: "RMeCab_0.2.zip" at page "SoftArchive";を指定します.
- RMeCab? パッケージをインストールしたら,ここで,いったん R を終了させます.
- 続いて,次の作業をしてください.
C:\Program Files\MeCab\bin にlibmecab.dll というファイルがありますので,これを R のライブラリ関連フォルダにインストールされた RMeCab?パッケージ用のライブラリフォルダ libs にコピーします.例えば C:\Program Files\R\R-2.6.2\library の中に RMeCab\libs? というフォルダができているはずですので,そのフォルダの中に libmecab.dll をコピーしてください.
- なお Vista の場合、インストール後追加したライブラリは、個人名のフォルダの中に「ドキュメント」->「R」->「win-library」->「2.6」があり,その中に RMeCab?\libs フォルダがあるかもしれません。
- 再びRを起動して,メニューから[パッケージの読み込み]を選んで RMeCab? を読み込みます.以下を実行してみてください.
kekka <- RMeCabC("すもももももももものうち")
unlist(kekka)
# 名詞 助詞 名詞 助詞 名詞 助詞 名詞
#"すもも" "も" "もも" "も" "もも" "の" "うち"
# 第二引数 1 を加えると形態素原型を返す.
kekka <- RMeCabC("ご飯を食べた",1)
unlist(kekka)
# 名詞 助詞 動詞 助動詞
# "ご飯" "を" "食べる" "た"
#
kekka <- RMeCabC("ご飯を食べた",0)
unlist(kekka)
# 名詞 助詞 動詞 助動詞
# "ご飯" "を" "食べ" "た"
_ Macintosh 版バイナリ &ref(): File not found: "RMeCab_0.2.tgz" at page "SoftArchive";
インストール手順
- まずMeCab?をインストールしてください.ここからソース版 mecab-0.97.tar.gz を取得します.同じく辞書 mecab-ipadic-2.7.0-20070801.tar.gz もダウンロードしてください.バージョンを表す数字は適当に読み替えてください.
- terminalを起動して,ダウンロードしたフォルダに移動します.仮にこれを tmp フォルダとします.
$ cd tmp
$ tar zxvf mecab-0.97.tar.gz
$ cd mecab-0.97
$ ./configure --with-charset=utf-8
$ make
$ sudo make install
- もしも sudo make install を実行すると make Error , Permission denied などと表示される場合は次のようにしてください.
$ chmod 700 install-sh
$ sudo make install
- 辞書もインストールします
$ tar zxf mecab-ipadic-2.7.0-20070****.tar.gz
$ cd mecab-ipadic-2.7.0-20070****
$ ./configure --with-charset=utf-8
$ make
$ sudo make install
- 次に R を起動します.
メニューから [パッケージとデータ]→[パッケージインストーラ]を選びます.一番上のCRANと表示されているメニューを[このコンピューター上のバイナリパッケージ]に変更します.右下の installボタンを押して,ダウンロードした &ref(): File not found: "RMeCab_0.2.tgz" at page "SoftArchive";を選びます.
- インストールする権限がないといわれた場合は,自分のホームに例えば RLibs などというフォルダを新規作成します。そして,やはりホームに .Renvironというファイルを作成し,中身を次のように編集してください.
R_LIBS=/Users/ishida/Rlibs
ishida の部分は terminal 画面の $ マークの前に表示されているログイン名に変えてください.terminal上では以下のようにしても作成できます.
$ echo 'R_LIBS=/Users/ishida/Rlibs' > .Renviron
$ cat .Renviron
- その上で,Rを起動しなおして,再びRMeCab? パッケージをインストールしてください.
- RMeCab? パッケージを利用するには以下のコードを実行します.
library(RMeCab)
kekka <- RMeCabC("すもももももももものうち")
unlist(kekka)
# 第二引数 1 を加えると形態素原型を返す.
kekka <- RMeCabC("ご飯を食べた",1)
unlist(kekka)
# 名詞 助詞 動詞 助動詞
# "ご飯" "を" "食べる" "た"
#
kekka <- RMeCabC("ご飯を食べた",0)
unlist(kekka)
# 名詞 助詞 動詞 助動詞
# "ご飯" "を" "食べ" "た"
- 万が一文字化けするような場合は,
Sys.getlocale()
Sys.setlocale("LC_CTYPE", "ja_JP.UTF-8")
を実行してみてください.
_ Linux 版