software のバックアップソース(No.5) - アールメカブ

アールメカブ


software のバックアップソース(No.5)

[[管理者]]


RMeCabパッケージ

統計解析・グラフィックス作成環境 &size(18){[[R:http://cran.md.tsukuba.ac.jp/]]}; から日本語形態素解析ソフト''&color(blue){和布蕪};([[MeCab:http://mecab.sourceforge.net/]])''を呼び出して使うインターフェイス

&size(18){[[R:http://cran.md.tsukuba.ac.jp/]]}; は [[ここ:http://cran.md.tsukuba.ac.jp/]] から,自分のOSにあったファイルをダウンロードしてください.例えばWindows版なら,''[Windows]->[base]''とクリックし,''R-2.6.2-win32.exe''をダウンロードします.後はダブルクリックを繰り返せばインストールできます.なお、起動直後に日本語の設定をしてください。メニューの
''[編集]->[GUIプリファレンス]->[Font]'' で ''MS Gothic'' を選び
''[save]'' を押して、そのまま''マイドキュメント''に保存。ここでいったん、R を再起動します。

#contents
[[古いバージョン>SoftArchive]]

* &color(blue){&size(18){Windows 版バイナリ}; };&ref(SoftArchive/RMeCab_0.2.zip); [#a34377ee]

インストール手順
+ まず''&color(red){MeCab};''をインストールしてください.[[ここ:http://mecab.sourceforge.net/]] から [[win32バイナリmecab-0.97.exe:http://sourceforge.net/project/showfiles.php?group_id=177856&package_id=205277]] をダウンロードしてインストールします.インストール先は標準の ''[[C:\Program Files\MeCab]]'' で構いません.また文字コードは Shit-Jis のままで構いません.
+次にwin32 用Rパッケージ &ref(SoftArchive/RMeCab_0.2.zip); をRにインストールします.Rのメニューから''[パッケージ]''→''[ローカルにあるzipファイルからのパッケージのインストール]''を選んで&ref(SoftArchive/RMeCab_0.2.zip);を指定します.
+ RMeCab パッケージをインストールしたら,ここで,いったん ''&color(red){R を終了させます};''.
+ 続いて,次の作業をしてください.
''[[C:\Program Files\MeCab\bin]]'' に''&color(red){libmecab.dll};'' というファイルがありますので,これを R のライブラリ関連フォルダにインストールされた RMeCabパッケージ用のライブラリフォルダ ''libs'' にコピーします.例えば ''[[C:\Program Files\R\R-2.6.2\library]]'' の中に ''[[RMeCab\libs]]'' というフォルダができているはずですので,そのフォルダの中に'' &color(red){libmecab.dll};'' をコピーしてください.
+++ なお Vista の場合、インストール後追加したライブラリは、個人名のフォルダの中に''「ドキュメント」''->''「R」''->''「win-library」''->''「2.6」''があり,その中に ''RMeCab\libs'' フォルダがあるかもしれません。

+ 再びRを起動して,メニューから''[パッケージの読み込み]''を選んで RMeCab を読み込みます.以下を画面の ''&color(blue){>};'' の右に入力して、''Enter'' を押して実行してみてください.

 > kekka <- RMeCabC("すもももももももものうち")
 > unlist(kekka)
 #    名詞     助詞     名詞     助詞     名詞     助詞     名詞 
 #"すもも"     "も"   "もも"     "も"   "もも"     "の"   "うち" 

# 第二引数 1 を加えると形態素原型を返す.
//1.1ヴァージョンより
 > kekka <- RMeCabC("ご飯を食べた",1)
 > unlist(kekka)
 #    名詞     助詞     動詞   助動詞 
 #  "ご飯"     "を" "食べる"     "た" 
 #
 > kekka <- RMeCabC("ご飯を食べた",0)
 > unlist(kekka)
 #    名詞     助詞     動詞   助動詞 
 # "ご飯"   "を" "食べ"   "た" 
* &color(blue){&size(18){Macintosh 版バイナリ};}; &ref(SoftArchive/RMeCab_0.2.tgz); [#u3d0ceba]

インストール手順
+まず''&color(red){MeCab};''をインストールしてください.[[ここ:http://mecab.sourceforge.net/]]から[[ソース版 mecab-0.97.tar.gz:http://sourceforge.net/project/showfiles.php?group_id=177856&package_id=204917]] を取得します.同じく[[辞書 mecab-ipadic-2.7.0-20070801.tar.gz:http://sourceforge.net/project/showfiles.php?group_id=177856&package_id=205275]]  もダウンロードしてください.バージョンを表す数字は適当に読み替えてください.
+ terminalを起動して,ダウンロードしたフォルダに移動します.仮にこれを tmp フォルダとします.
 $ cd tmp
 $ tar zxvf mecab-0.97.tar.gz
 $ cd mecab-0.97
 $ ./configure  --with-charset=utf-8
 $ make
 $ sudo make install
++もしも sudo make install を実行すると make Error , Permission denied などと表示される場合は次のようにしてください.
 $ chmod 700 install-sh
 $ sudo make install
+辞書もインストールします
 $ tar zxf mecab-ipadic-2.7.0-20070****.tar.gz
 $ cd mecab-ipadic-2.7.0-20070****
 $ ./configure --with-charset=utf-8
 $ make
 $ sudo make install
+次に R を起動します.
メニューから'' [パッケージとデータ]→[パッケージインストーラ]''を選びます.一番上の''CRAN''と表示されているメニューを''[このコンピューター上のバイナリパッケージ]''に変更します.右下の ''installボタン''を押して,ダウンロードした &ref(SoftArchive/RMeCab_0.2.tgz);を選びます.
++ インストールする権限がないといわれた場合は,自分のホームに例えば RLibs などというフォルダを新規作成します。そして,やはりホームに ''.Renviron''というファイルを作成し,中身を次のように編集してください.
 R_LIBS=/Users/ishida/Rlibs
''ishida'' の部分は terminal 画面の $ マークの前に表示されているログイン名に変えてください.terminal上では以下のようにしても作成できます.
 $ echo 'R_LIBS=/Users/ishida/Rlibs' > .Renviron
 $ cat .Renviron
++ その上で,Rを起動しなおして,再びRMeCab パッケージをインストールする手続きを行い、ファイルを選ぶ前に ウィンドウ下の ''[ユーザーエリア]'' にチェックを入れておきます.
+ RMeCab パッケージを利用するには以下のコードを画面の ''&color(blue){>};'' の右に入力して、''Enter'' を押して実行します.
 > library(RMeCab)
 > kekka <- RMeCabC("すもももももももものうち")
 > unlist(kekka)
# 第二引数 1 を加えると形態素原型を返す.
//1.1ヴァージョンより
 > kekka <- RMeCabC("ご飯を食べた",1)
 > unlist(kekka)
 #    名詞     助詞     動詞   助動詞 
 #  "ご飯"     "を" "食べる"     "た" 
 #
 > kekka <- RMeCabC("ご飯を食べた",0)
 > unlist(kekka)
 #    名詞     助詞     動詞   助動詞 
 # "ご飯"   "を" "食べ"   "た" 
++ 万が一文字化けするような場合は,
 > Sys.getlocale()
 > Sys.setlocale("LC_CTYPE", "ja_JP.UTF-8")
を実行してみてください.

* &color(blue){&size(18){ Linux 版};}; [#if54b9e9]

- 基本的に Mac 版と変わりません