[[管理人>admin]] について : 参考ページ [[統計的言語処理]]: 保管庫 [[SoftArchive]] : 係り受け解析パッケージ [[RCaBoCha]] - [[R2MeCab]] は [[RMeCab]] の簡易版です //[[Functions>http://rmecab.jp/wiki/index.php?RMeCab機能]] - [[RMeCab機能>RMeCabFunctions]] ---------- &size(20){&color(blue){[[RMeCab]]パッケージ};}; #ref(RealMecab.png,center,nowrap,60%,"和布蕪ってのはこれ") RIGHT:[[RMeCab]]パッケージは[[こちら:http://groups.google.co.jp/group/rmecab]]にも置いてあります。 テキストマイニングのためのツール: データ解析・グラフィックス環境 &size(18){[[R:http://cran.md.tsukuba.ac.jp/]]}; から日本語形態素解析ソフト''&color(blue){和布蕪};([[MeCab:http://mecab.sourceforge.net/]])''を呼び出して使うインターフェイス - ''&color(green){テキストマイニング入門};'':[[RMeCab]]を利用したテキストマイニングについては &htmlinsert(amazontext,asin=4627848412,text=『Rによるテキストマイニング入門』森北出版); //『[[Rによるテキストマイニング入門:http://www.amazon.co.jp/R%E3%81%AB%E3%82%88%E3%82%8B%E3%83%86%E3%82%AD%E3%82%B9%E3%83%88%E3%83%9E%E3%82%A4%E3%83%8B%E3%83%B3%E3%82%B0%E5%85%A5%E9%96%80-%E7%9F%B3%E7%94%B0-%E5%9F%BA%E5%BA%83/dp/4627848412/]]』森北出版,2008.12 を参照いただければ幸いです. - &color(green){2010年 8月26日 RMeCab_0.91 (R-2.11.1 対応)}; mecab本体への引数指定を追加 - &color(green){2010年 6月04日 RMeCab_0.90 (R-2.11.1 対応)}; 特に変更なし - &color(green){2010年 5月10日 RMeCab_0.89 (R-2.11.0 対応)}; すべての関数に dic 引数を追加し, ユーザー辞書を実行時にして出きるようにした(利用例 [[RMeCab.R:http://groups.google.co.jp/group/rmecab]] ).また Windows版には libmecab.dll を同封した. - &color(green){2010年 4月23日 RMeCab_0.88 (R-2.11.0対応)}; collocate()関数の出力を変更.nodeの前と後それぞれの頻度を加えた. - &color(green){2009年 12月17日 RMeCab_0.87 (R-2.10.1対応)}; - &color(green){2009年 11月12日 RMeCab_0.86 (R-2.10.0対応): docNgramDF()関数のバグを修正。}; - &color(green){2009年 8月25日 RMeCab_0.85 (R-2.10.0対応): MeCab本体の最新バージョン(0.98)と組み合わせた。ほかに変更なし。}; - &color(green){2009年 8月25日 RMeCab_0.84 (R-2.9.2対応): あわせてdocNgram2(), docNgramDF()関数にバグがあったので修正.}; - &color(green){2009年 8月24日 RMeCab_0.83: NgramDF(), docDF()関数にバグがあったので修正.}; #contents &size(18){[[R:http://cran.md.tsukuba.ac.jp/]]}; は [[ここ:http://cran.md.tsukuba.ac.jp/]] から,自分のOSにあったファイルをダウンロードしてください.例えばWindows版なら,''[Windows]->[base]''とクリックし,''R-2.*.*-win32.exe''をダウンロードします.後はダブルクリックを繰り返せばインストールできます.なお、Windows版の場合は起動直後に日本語の設定をしてください。メニューの ''[編集]->[GUIプリファレンス]->[Font]'' で ''MS Gothic'' を選び ''[save]'' を押して、保存先はデフォルトそのままに''マイドキュメント''に保存します。その後は ''[OK]'' を押して操作を続行します。なおRを終了させる際、[workspace(作業情報)を保存しますか] と聞いてきますが, No を選んでおきましょう。 * 現在のヴァージョン [#t587e174] ** バージョン 0.91 (R-2.11.1) 2010年 8月26日 [#aa4deb06] すべての関数に mecabrc =”” etc = ”” の二つの引数を追加しました.デフォルトでは空白が指定されています. mecabrc 引数にはrcファイル(.mecabrc)を引用符で囲んで指定します. なお実行前にファイルの有無がチェックされます. etc 引数はその他 mecab 本体へ指定したい引数を引用符で囲んで渡します.この引数の内容についてはチェックを一切行いませんので,利用する場合は,指定内容に整合性があるかどうか十分に注意してください. 二つの新規引数について,詳細は以下も参照ください. http://mecab.sourceforge.net/mecab.html [[RMeCab.R:http://groups.google.co.jp/group/rmecab]] . Windows版には libmecab.dll を同封. -- Windows 32 bit バイナリ(R-2.11.1) ,バージョン 0.901 &ref(SoftArchive/RMeCab_0.91.zip); (おなじファイルは http://groups.google.co.jp/group/rmecab にもあります) -- %% と付属の環境設定ファイル %% RMeCab_0.89からは不要になりました --- %% &ref(SoftArchive/RMeCabInstall.bat); (Rの標準的なライブラリフォルダ設定の場合) %% --- %% &ref(SoftArchive/RMeCabInstallXP.bat);(XPで、ライブラリフォルダがユーザーフォルダ内にあるX場合) %% --- %% &ref(SoftArchive/RMeCabInstallVista.bat); (Vistaで、ライブラリフォルダがユーザーフォルダ内にある場合) %% -- Mac Leopard 用 32 bit バイナリ(R-2.11.1),バージョン 0.91 &ref(SoftArchive/RMeCab_0.91.tgz); (おなじファイルは http://groups.google.co.jp/group/rmecab にもあります) -- Mac Snow Leopard 用 64bit バイナリ(R-2.11.1), &ref(SoftArchive/RMeCab_0.91_x86_64.tgz); (おなじファイルは http://groups.google.co.jp/group/rmecab にもあります) Snow Leopard の場合 ダウンロード後ファイル名を RMeCab_0.91.tgz と修正する必要があります。 -- Linux 32 bit バイナリ(R-2.11.1),バージョン 0.91 &ref(SoftArchive/RMeCab_0.91_R_i686-pc-linux-gnu.tar.gz); (おなじファイルは http://groups.google.co.jp/group/rmecab にもあります) -- Linux 64 bit バイナリ(R-2.11.1),バージョン 0.91 &ref(SoftArchive/RMeCab_0.91_R_x86_64-unknown-linux-gnu.tar.gz); (おなじファイルは http://groups.google.co.jp/group/rmecab にもあります) ダウンロード後ファイル名を RMeCab_0.90.tar.gz と修正する必要があるかもしれません。 ---試用データセット&ref(SoftArchive/data.zip); (Windows), &ref(SoftArchive/data.tar.gz); (Mac, Unix) ** バージョン 0.90 (R-2.11.1) 2010年 6月04日 [#j7ce66bb] R-2.11.1 への対応.他に変更点なし. [[RMeCab.R:http://groups.google.co.jp/group/rmecab]] ). Windows版には libmecab.dll を同封. -- Windows 32 bit バイナリ(R-2.11.1) ,バージョン 0.90 &ref(SoftArchive/RMeCab_0.90.zip); (おなじファイルは http://groups.google.co.jp/group/rmecab にもあります) -- %% と付属の環境設定ファイル %% RMeCab_0.89からは不要になりました --- %% &ref(SoftArchive/RMeCabInstall.bat); (Rの標準的なライブラリフォルダ設定の場合) %% --- %% &ref(SoftArchive/RMeCabInstallXP.bat);(XPで、ライブラリフォルダがユーザーフォルダ内にあるX場合) %% --- %% &ref(SoftArchive/RMeCabInstallVista.bat); (Vistaで、ライブラリフォルダがユーザーフォルダ内にある場合) %% -- Mac 32 bit Leopard バイナリ(R-2.11.1),バージョン 0.90 &ref(SoftArchive/RMeCab_0.90.tgz); (おなじファイルは http://groups.google.co.jp/group/rmecab にもあります) //おなじファイルはここにもあります [[RMeCab_0.89_R_i386-apple-darwin9.8.0.tar.gz:http://groups.google.co.jp/group/rmecab]] ) -- Mac 64bit Snow Leopard バイナリ(R-2.11.1), &ref(SoftArchive/RMeCab_0.90_x86_64.tgz); (おなじファイルは http://groups.google.co.jp/group/rmecab にもあります) //(おなじファイルはここにもあります[[RMeCab_0.89_R_x86_64-apple-darwin9.8.0.tar.gz:http://groups.google.co.jp/group/rmecab]]) Snow Leopard の場合 ダウンロード後ファイル名を RMeCab_0.90.tgz と修正する必要があります。 -- Linux 32 bit バイナリ(R-2.11.1),バージョン 0.90 &ref(SoftArchive/RMeCab_0.90_R_i686-pc-linux-gnu.tar.gz); (おなじファイルは http://groups.google.co.jp/group/rmecab にもあります) //(おなじファイルはここにもあります[[RMeCab_0.89_R_i686-pc-linux-gnu.tar.gz:http://groups.google.co.jp/group/rmecab]]) -- Linux 64 bit バイナリ(R-2.11.1),バージョン 0.90 &ref(SoftArchive/RMeCab_0.90_R_x86_64-unknown-linux-gnu.tar.gz); (おなじファイルは http://groups.google.co.jp/group/rmecab にもあります) //(おなじファイルはここにもあります [[RMeCab_0.89_R_x86_64-unknown-linux-gnu.tar.gz:http://groups.google.co.jp/group/rmecab]]) ダウンロード後ファイル名を RMeCab_0.90.tar.gz と修正する必要があるかもしれません。 ---試用データセット&ref(SoftArchive/data.zip); (Windows), &ref(SoftArchive/data.tar.gz); (Mac, Unix) ** バージョン 0.89 (R-2.11.0) 2010年 5月10日 [#j7ce66bb] すべての関数に dic 引数を追加し, ユーザー辞書を実行時にして出きるようにした(利用例 [[RMeCab.R:http://groups.google.co.jp/group/rmecab]] ).また Windows版には libmecab.dll を同封した. -- Windows 32 bit バイナリ(R-2.11.0),バージョン 0.89 &ref(SoftArchive/RMeCab_0.89.zip); (おなじファイルは http://groups.google.co.jp/group/rmecab にもあります) -- %% と付属の環境設定ファイル %% RMeCab_0.89からは不要になりました --- %% &ref(SoftArchive/RMeCabInstall.bat); (Rの標準的なライブラリフォルダ設定の場合) %% --- %% &ref(SoftArchive/RMeCabInstallXP.bat);(XPで、ライブラリフォルダがユーザーフォルダ内にあるX場合) %% --- %% &ref(SoftArchive/RMeCabInstallVista.bat); (Vistaで、ライブラリフォルダがユーザーフォルダ内にある場合) %% -- Macintosh バイナリ(R-2.11.0),バージョン 0.89 &ref(SoftArchive/RMeCab_0.89_R_i386-apple-darwin9.8.0.tar.gz); (おなじファイルは http://groups.google.co.jp/group/rmecab にもあります) //おなじファイルはここにもあります [[RMeCab_0.89_R_i386-apple-darwin9.8.0.tar.gz:http://groups.google.co.jp/group/rmecab]] ) -- 64bit Snow Leopard 用 Macintosh バイナリ(R-2.11.0), &ref(SoftArchive/RMeCab_0.89_R_x86_64-apple-darwin9.8.0.tar.gz); (おなじファイルは http://groups.google.co.jp/group/rmecab にもあります) //(おなじファイルはここにもあります[[RMeCab_0.89_R_x86_64-apple-darwin9.8.0.tar.gz:http://groups.google.co.jp/group/rmecab]]) ダウンロード後ファイル名を RMeCab_0.89.tgz と修正する必要があるかもしれません。 -- Linux バイナリ(R-2.11.0),バージョン 0.89 &ref(SoftArchive/RMeCab_0.89_R_i686-pc-linux-gnu.tar.gz); (おなじファイルは http://groups.google.co.jp/group/rmecab にもあります) //(おなじファイルはここにもあります[[RMeCab_0.89_R_i686-pc-linux-gnu.tar.gz:http://groups.google.co.jp/group/rmecab]]) -- Linux 64 bit バイナリ(R-2.11.0),バージョン 0.89 &ref(SoftArchive/RMeCab_0.89_R_x86_64-unknown-linux-gnu.tar.gz); (おなじファイルは http://groups.google.co.jp/group/rmecab にもあります) //(おなじファイルはここにもあります [[RMeCab_0.89_R_x86_64-unknown-linux-gnu.tar.gz:http://groups.google.co.jp/group/rmecab]]) ダウンロード後ファイル名を RMeCab_0.89.tar.gz と修正する必要があるかもしれません。 ---試用データセット&ref(SoftArchive/data.zip); (Windows), &ref(SoftArchive/data.tar.gz); (Mac, Unix) ** バージョン 0.88 (R-2.11.0) 2010年 4月23日 [#e32bbc01] R-2.11.0 への対応と collocate()関数の出力を変更. - &color(green){2010年 4月23日 RMeCab_0.88 (R-2.11.0対応)}; collocate()関数の出力を変更.nodeの前と後それぞれの頻度を加えた. - &ref(SoftArchive/README_RMeCab.txt); (Shift-JIS) -- Windows バイナリ(R-2.11.0),バージョン 0.88 &ref(SoftArchive/RMeCab_0.88.zip); (おなじファイルは http://groups.google.co.jp/group/rmecab にもあります) // (おなじファイルはここにもあります[RMeCab_0.88.zip:http://groups.google.co.jp/group/rmecab]] ) と付属の環境設定ファイル --- &ref(SoftArchive/RMeCabInstall.bat); (Rの標準的なライブラリフォルダ設定の場合) --- &ref(SoftArchive/RMeCabInstallXP.bat);(XPで、ライブラリフォルダがユーザーフォルダ内にあるX場合) --- &ref(SoftArchive/RMeCabInstallVista.bat); (Vistaで、ライブラリフォルダがユーザーフォルダ内にある場合) -- Macintosh バイナリ(R-2.11.0),バージョン 0.88 [[RMeCab_0.88.tgz:http://groups.google.co.jp/group/rmecab]] -- 64bit Snow Leopard 用 Macintosh バイナリ(R-2.11.0),[[RMeCab_0.88_R_x86_64-apple-darwin9.8.0.tar.gz:http://groups.google.co.jp/group/rmecab]]. ダウンロード後ファイル名を RMeCab_0.88.tgz と修正する必要があります。 //-- 自力コンパイル版 R 用 Macintosh バイナリ(R-2.10.1),バージョン 0.87 &ref(SoftArchive/RMeCab_0.87_R_i386-apple-darwin9.8.0.tar.gz); //ダウンロード後ファイル名を RMeCab_0.87.tgz と修正する必要があります。 -- Linux バイナリ(R-2.11.0),バージョン 0.88 [[RMeCab_0.88.tar.gz:http://groups.google.co.jp/group/rmecab]] -- Linux 64 bit バイナリ(R-2.11.0),バージョン 0.88 [[RMeCab_0.88_R_x86_64-unknown-linux-gnu.tar.gz:http://groups.google.co.jp/group/rmecab]] ダウンロード後ファイル名を RMeCab_0.88.tar.gz と修正する必要があるかもしれません。 ---試用データセット&ref(SoftArchive/data.zip); (Windows), &ref(SoftArchive/data.tar.gz); (Mac, Unix) ** バージョン 0.87 (R-2.10.1) 2009年 12月17日 [#f8128225] R-2.10.1 への対応版.変更なし. - R-2.10.1 版 &ref(SoftArchive/README_RMeCab.txt); (Shift-JIS) -- Windows バイナリ(R-2.10.1),バージョン 0.87 &ref(SoftArchive/RMeCab_0.87.zip); (おなじファイルは http://groups.google.co.jp/group/rmecab にもあります) //(おなじファイルはここにもあります[[RMeCab_0.87.zip:http://groups.google.co.jp/group/rmecab]] と付属の環境設定ファイル --- &ref(SoftArchive/RMeCabInstall.bat); (Rの標準的なライブラリフォルダ設定の場合) --- &ref(SoftArchive/RMeCabInstallXP.bat);(XPで、ライブラリフォルダがユーザーフォルダ内にあるX場合) --- &ref(SoftArchive/RMeCabInstallVista.bat); (Vistaで、ライブラリフォルダがユーザーフォルダ内にある場合) -- Macintosh バイナリ(R-2.10.1),バージョン 0.87 [[RMeCab_0.87.tgz:http://groups.google.co.jp/group/rmecab]] -- 64bit Snow Leopard 用 Macintosh バイナリ(R-2.10.0),[[RMeCab_0.87_R_x86_64-apple-darwin9.8.0.tar.gz:http://groups.google.co.jp/group/rmecab]]. ダウンロード後ファイル名を RMeCab_0.87.tgz と修正する必要があります。 //-- 自力コンパイル版 R 用 Macintosh バイナリ(R-2.10.1),バージョン 0.87 &ref(SoftArchive/RMeCab_0.87_R_i386-apple-darwin9.8.0.tar.gz); //ダウンロード後ファイル名を RMeCab_0.87.tgz と修正する必要があります。 -- Linux バイナリ(R-2.10.1),バージョン 0.87 [[RMeCab_0.87.tar.gz:http://groups.google.co.jp/group/rmecab]] -- Linux 64 bit バイナリ(R-2.10.1),バージョン 0.87 [[RMeCab_0.87_R_x86_64-unknown-linux-gnu.tar.gz:http://groups.google.co.jp/group/rmecab]] ダウンロード後ファイル名を RMeCab_0.87.tar.gz と修正する必要があるかもしれません。 ---試用データセット&ref(SoftArchive/data.zip); (Windows), &ref(SoftArchive/data.tar.gz); (Mac, Unix) ** バージョン 0.86 (R-2.10.0) 2009年 11月12日 [#gf19ec87] docNgramDF()関数のバグを修正。 - R-2.10.0 版&ref(SoftArchive/README_RMeCab.txt); (Shift-JIS) -- Windows バイナリ(R-2.10.0),バージョン 0.86 &ref(SoftArchive/RMeCab_0.86.zip); と付属の環境設定ファイル --- &ref(SoftArchive/RMeCabInstall.bat); (Rの標準的なライブラリフォルダ設定の場合) --- &ref(SoftArchive/RMeCabInstallXP.bat);(XPで、ライブラリフォルダがユーザーフォルダ内にあるX場合) --- &ref(SoftArchive/RMeCabInstallVista.bat); (Vistaで、ライブラリフォルダがユーザーフォルダ内にある場合) -- Macintosh バイナリ(R-2.10.0),バージョン 0.86 &ref(SoftArchive/RMeCab_0.86.tgz); -- 64bit Snow Leopard 用 Macintosh バイナリ(R-2.10.0),バージョン 0.86. &ref(SoftArchive/RMeCab_0.86_R_x86_64-apple-darwin9.8.0.tar.gz); ダウンロード後ファイル名を RMeCab_0.86.tgz と修正する必要があります。 -- 自力コンパイル版 R 用 Macintosh バイナリ(R-2.10.0),バージョン 0.86 &ref(SoftArchive/RMeCab_0.86_R_i386-apple-darwin9.8.0.tar.gz); ダウンロード後ファイル名を RMeCab_0.86.tgz と修正する必要があります。 -- Linux バイナリ(R-2.10.0),バージョン 0.86 &ref(SoftArchive/RMeCab_0.86.tar.gz); -- Linux 64 bit バイナリ(R-2.10.0),バージョン 0.86 &ref(SoftArchive/RMeCab_0.86_R_x86_64-unknown-linux-gnu.tar.gz); ダウンロード後ファイル名を RMeCab_0.86.tgz と修正する必要があるかもしれません。 ---試用データセット&ref(SoftArchive/data.zip); (Windows), &ref(SoftArchive/data.tar.gz); (Mac, Unix) ** バージョン 0.78 (R-2.8.1) 2009年 3月28日 [#h13e90b6] - R-2.8.1 版&ref(SoftArchive/README_RMeCab.txt); (左記ファイルはShift-JIS形式です) -- docDF()関数の効率が悪かった(解析に異常に時間がかかった)のを修正.また docNgramDF()関数は他の関数と異なり,文書(被験者回答)が行でタームが列なので,重み付け関数に行と列の指定ができるようにした. -- Windows バイナリ(R-2.8.1),バージョン 0.78 &ref(SoftArchive/RMeCab_0.78.zip); と付属の環境設定ファイル --- &ref(SoftArchive/RMeCabInstall.bat); (Rの標準的なライブラリフォルダ設定の場合) --- &ref(SoftArchive/RMeCabInstallXP.bat);(XPで、ライブラリフォルダがユーザーフォルダ内にあるX場合) --- &ref(SoftArchive/RMeCabInstallVista.bat); (Vistaで、ライブラリフォルダがユーザーフォルダ内にある場合) -- Macintosh バイナリ(R-2.8.1),バージョン 0.78 &ref(SoftArchive/RMeCab_0.78.tgz); -- Linux バイナリ(R-2.8.1),バージョン 0.78 &ref(SoftArchive/RMeCab_0.78.tar.gz); --試用データセット&ref(SoftArchive/data.zip); (Windows), &ref(SoftArchive/data.tar.gz); (Mac, Unix) ** バージョン 0.61 (R-2.7.1) 2008年 9月2日 [#x92db5d0] - メモリ関係の微調整:変数の宣言を見直す. -- Windows バイナリ(R-2.7.1),バージョン 0.61&ref(SoftArchive/RMeCab_0.61.zip); と付属の環境設定ファイル &ref(SoftArchive/README_RMeCab.txt); (左記ファイルはShift-JIS形式です) --- &ref(SoftArchive/RMeCabInstall.bat); (Rで標準的なライブラリフォルダ設定の場合) --- &ref(SoftArchive/RMeCabInstallXP.bat);(XPで、ライブラリフォルダがユーザーフォルダ内にある場合) --- &ref(SoftArchive/RMeCabInstallVista.bat); (Vistaで、ライブラリフォルダがユーザーフォルダ内にある場合) -- Macintosh バイナリ(R-2.7.1),バージョン 0.61&ref(SoftArchive/RMeCab_0.61.tgz); -- Linux バイナリ(R-2.7.1),バージョン 0.61 &ref(SoftArchive/RMeCab_0.61.tar.gz); --試用データセット&ref(SoftArchive/data.zip); (Windows), &ref(SoftArchive/data.tar.gz); (Mac, Unix) ** 使い方の手引き; manual.pdf ファイル [#ab06f073] かなり古いマニュアルです.新規に追加された関数 (汎用的 docDF() 関数) や機能(ターム共起行列作成)についての記述はありません. またRMeCab_0.88からユーザー辞書を指定できるようになりましたが,これについても述べていません.&ref(SoftArchive/manual081108.pdf); をクリックするとAdobeReaderが起動します。ファイルが開かれたらAdobeのメニューから保存を選んでください。 ** 注意 [#v1db03f3] - ダウンロードについて ダウンロードの際、''&color(red){ファイル名を一切変更しないください!};'' . Rはインストール時に、ファイル名と中身のチェックを行います.ファイル名が中身の情報と一致しない場合、インストールは行われません.特に Internet Explorer 6 はファイル名に [1] を付記することがあります.この場合は手作業でファイル名を元通りに変更してください. - ワークスペースの保存について RMeCab で日本語テキストを処理した後,Rを終了させる際には,[現在のワークスペースを保存しますか]という問い合わせには NO を選択することを推奨します.YES を選択すると,保存文字コードの関係で,次回 R を起動する際にエラーが生じることがあります.この場合は R の作業フォルダ内の .RData というファイルを削除してから,起動し直してください.作業フォルダは,多くの場合 C:\Document and Settiings\ユーザ名\My Documentsというフォルダです.また Windows では .RData のようにドットで始まるファイルは表示されないことがあります.この場合は,エクスプローラーを起動して,メニューから[ツール][フォルダオプション][表示]を選び,[すべてのファイルとフォルダを表示する]にチェックを入れて下さい. * &color(blue){&size(18){Windows 版 32 bit バイナリ}; }; のインストール方法[#q1476a8b] &ref(SoftArchive/RMeCab_0.90.zip); (おなじファイルは http://groups.google.co.jp/group/rmecab にもあります) [[RMeCab_0.87.zip:http://groups.google.co.jp/group/rmecab]] for R-2.10.1 &ref(SoftArchive/RMeCab_0.61.zip); (R-2.7.1) ご利用は自己責任でお願いします. /////////// &color(green){&size(20){インストール手順};}; + まず''&color(red){[[MeCab:http://mecab.sourceforge.net/]]};''をインストールしてください.[[ここ:http://sourceforge.net/project/showfiles.php?group_id=177856&package_id=205277]] から [[win32バイナリmecab-0.98.exe:http://sourceforge.net/project/showfiles.php?group_id=177856&package_id=205277]] をダウンロードしてインストールします.インストール先は標準設定のまま ''[[C:\Program Files\MeCab]]'' とします.また文字コードは Shit-Jis のままとします. ++ 可能であれば MeCab の環境設定をします.[スタート]-[コントロールパネル]-[システムとメンテナンス]-[システム]-[詳細設定 環境設定] で上のユーザ環境を下の図のように行います. #ref(usrEnv.jpg) #ref(usrEnv2.jpg) + 次に ''&color(blue){RMeCab_***.zip};'' をRにインストールします.*** の部分はバージョン番号です.Rのメニューから''[パッケージ]''→''[ローカルにあるzipファイルからのパッケージのインストール]''を選んで,ダウンロードした ''&color(blue){RMeCab_***.zip};''ファイルを選んでインストールします.[win-libraryを作成したいのですか] と聞いてきた時は OK を押してください(この際,R はユーザーフォルダを作成します). Vista では'Permission denied'とエラーが表示されて,先に進めないことがあります.この場合はいったん R を [終了] させ,もう一度,今度は R のアイコンを右クリックして,[管理者として実行] を選んでください. RMeCab_0.89 以降では,以上でインストール終了です. ++ RMeCab_0.88 以前のバージョンでは, さらに MeCab のライブラリのインストールを行います。MeCab へのパスをWindowsの環境設定で行った場合,続く 3.以下の処理は不要になります.詳しくは &ref(SoftArchive/README_RMeCab.txt); (左記はShift-JISファイルです)をご覧ください. + ここで,Rのライブラリフォルダがどこにあるかを確認してください.Rのコンソール画面で ''.libPaths() '' を実行すると分かります.通常はRがインストールされたフォルダになります. ++この結果の''最初の出力 ([1] のすぐ右横の表示内容)'' が [1] "C:/PROGRA~1/R/R-2*~*.*/library" のように (*の部分はバージョン番号)なっていれば,R 本体と同じ場所にあります.以下の手順の''4.''までを実行してください. ++ ''.libPaths() '' の''最初の出力''が [1] "C:\\Document and Settings\\ishida\\Documents/R/win-library/2.7" あるいは [1] "C:\\Users\\ishida\\Documents/R/win-library/2.7" のようにユーザー名を含んでいる場合は,ユーザーフォルダにライブラリはインストールされています.以下の手順の''4.'' は飛ばして,手順の''5.'',場合によっては ''6.'' までを実行してください. + 続いて, MeCab と R の両方が標準的なフォルダにインストールされた状態であり,またRのライブラリフォルダが R 本体と同じ場所にあれば,&ref(SoftArchive/RMeCabInstall.bat); をダブルクリック してください.''これでインストールは完了です''.さっそく[[RMeCab機能]]を試してみてください.なお[[試用データセット>#data]]を用意しました. + MeCab はデフォルトのままインストール先を変更しなかったが,Rのライブラリフォルダがユーザフォルダになっている場合,XPのユーザーであれば&ref(SoftArchive/RMeCabInstallXP.bat); を,またVistaのユーザーは&ref(SoftArchive/RMeCabInstallVista.bat); を実行して,環境設定を行ってください.これでインストールは完了です. + ''&color(red){ここまでの手順でうまく動作しない場合}; ''. ++ MeCab と R のインストール先を独自に変更した場合や RMeCab が動作しない場合は以下を手作業で実行してください. +++ MeCabをインストールしたフォルダ内の bin フォルダに ''&color(red){libmecab.dll};'' というファイルがありますので,これを R のライブラリ関連フォルダ library にインストールされた RMeCabパッケージフォルダ内の ''libs'' フォルダ内にコピーします. +++ 例えばインストール先が ''[[E:\Program Files\MeCab]]'' ならば,その ''lib'' フォルダ内に ''&color(red){libmecab.dll};'' というファイルがあります.これを R のライブラリ関連フォルダに作成された RMeCabパッケージ用のライブラリフォルダ ''libs'' にコピーします.例えばRのインストール先が ''[[E:\Program Files\R\R-2.*.*]]'' ならば,その ''library'' というフォルダの中に ''[[RMeCab\libs]]'' というフォルダがありますので,そのフォルダ内に'' &color(red){libmecab.dll};'' をコピーしてください. +++ R のインストール先に RMeCabパッケージ用のライブラリフォルダが存在しない場合,別の場所,すなわちユーザーフォルダにインストールされた可能性があります. //''Vistaの場合'' (場合によっては XP でも) 、Rのインストール後にユーザーが追加したRライブラリ類は、&color(red){個人フォルダにインストールされていることがあります};. 例えば個人名のフォルダの中に ''「ドキュメント」''->''「R」''->''「win-library」''->''「2.*」''があり,その中に ''RMeCab\libs'' フォルダがあるかもしれません。Rのコンソール画面で ''.libPaths() ''と実行すると分かります.以下は Vista Home Basic にR-21.0をインストールし、続いて''RMeCab'' をインストールした直後に実行した結果です。 > .libPaths() [1] "C:\\Users\\ishida\\Documents/R/win-library/2.11.0" [2] "C:/PROGRA~1/R/R-211~1.1/library" この場合は ''&color(red){libmecab.dll};'' を ''win-library/2.11'' の中の''[[RMeCab\libs]]'' というフォルダの中に手作業でコピーしてください。 --- MeCab ライブラリのインストールは R を起動してコンソールから次の2行を、一行ずつ実行してもかまいません。 path <- paste(.libPaths(),"RMeCab","libs", sep = "/") file.copy("C:/Program Files/MeCab/bin/libmecab.dll", path ) この場合 RMeCabaInstall.bat を実行する必要はありません。 /////////// * &color(blue){&size(18){Macintosh 版バイナリ};}; のインストール方法[#xeec6040] &color(green){32 bit Leopard 用}; Macintosh バイナリ(R-2.11.1), &ref(SoftArchive/RMeCab_0.90.tgz); : for R-2.11.1 (おなじファイルは http://groups.google.co.jp/group/rmecab にもあります) &color(green){64bit Snow Leopard 用}; Macintosh バイナリ(R-2.11.1), &ref(SoftArchive/RMeCab_0.90_x86_64.tgz); for R-2.11.1 (おなじファイルは http://groups.google.co.jp/group/rmecab にもあります) ダウンロード後 RMeCab_0.89.tgz と名称変更する必要があるかもしれません(ないかもしれませんけど). // &ref(SoftArchive/RMeCab_0.61.tgz); (R-2.7.1) -- ''Power PC''版は http://groups.google.co.jp/group/ishidamotohiro からRMeCab_0.84.tgz を ダウンロードください。 開発環境の文字コードは UTF-8 でした. //ユーザ名とパスワードは半角で mecab です. ご利用は自己責任でお願いします. /////////// インストール手順 --- Mac Port 版 mecab はインストールしないでください.すでにインストールされている方は,以下の手順でソースからインストールしてください(インストール先は別になりますので,実行ファイルなどが上書きされることはありません). //-- macport からインストールする場合は utf-8を指定してください //$ sudo port install mecab +utf8 // $ sudo port install mecab-ipadic-utf8 // //To enable dictionary, rewrite /opt/local/etc/mecabrc // as "dicrc = /opt/local/lib/mecab/dic/ipadic-utf8" // //You can also specify dictionary in the following way: // /opt/local/bin/mecab -d /opt/local/lib/mecab/dic/ipadic-utf8 // - // $ sudo vim /opt/local/etc/mecabrc // dicdir = /opt/local/lib/mecab/dic/ipadic-utf8 --- Leopard には最初からMeCabがインストールされていますが、文字コードが違いますので、以下の手順で別にインストールしてください。オリジナルのMeCabが上書きされることはありません。 + ''&color(red){[[MeCab:http://mecab.sourceforge.net/]]};''本体のインストールには Mac OS X DVD に付属の開発環境をインストールしておく必要があります.DVDの[ユーティリティフォルダ]にある [ターミナル],[X11]と,[Optional Installs] フォルダ内 [Xcode Tools] フォルダにある [XcodeTools.mpkg] をインストールしておいてください. ++ なお,ファイルのダウンロードでは,Ctrl キーを押しながらファイルをクリックしてください.さもないとファイル名が変更されてしまいます.メニューから「リンク先のファイルをダウンロード」を選んでください. +まず''&color(red){[[MeCab:http://mecab.sourceforge.net/]]};''をインストールします.[[ここ:http://mecab.sourceforge.net/]]から[[ソース版 mecab-0.98.tar.gz:http://sourceforge.net/project/showfiles.php?group_id=177856&package_id=204917]] を取得します.同じく[[辞書 mecab-ipadic-2.7.0-20070801.tar.gz:http://sourceforge.net/project/showfiles.php?group_id=177856&package_id=205275]] もダウンロードしてください.バージョンを表す数字は適当に読み替えてください. + terminalを起動して,ダウンロードしたフォルダに移動します.仮にこれを Downloads フォルダとします. $ cd Downloads $ tar zxvf mecab-0.98.tar.gz $ cd mecab-0.98 $ ./configure --with-charset=utf8 $ make $ sudo make install # $ sudo ldconfig ## Linux ではこれが必要 ++もしも sudo make install を実行すると make Error , Permission denied などと表示される場合は次のようにしてください. $ chmod 700 install-sh $ sudo make install +辞書もインストールします $ tar zxf mecab-ipadic-2.7.0-20070****.tar.gz $ cd mecab-ipadic-2.7.0-20070**** $ ./configure --with-charset=utf-8 # ここでエラーが出る場合は PATH を通してみてください # 以下の一行を実行します. $ export PATH=/usr/local/bin:PATH $ make $ sudo make install # 今後のために PATH を追加しておくとよいでしょう $ echo $PATH # を実行して表示された内容に /usr/local/bin が含まれていない場合は # ホームディレクトリに戻って $ cd # 次のコマンドを実行しておきます. $ echo '/usr/local/bin:$PATH' >> .profile %% # $ echo '/usr/local/bin:$PATH' >> .bash_profile%% # ここで引用符はシングルコーテーションです +次に R を起動します.なおアプリケーションフォルダにはRが2種類あります.SnowLeopard では R64 を,また Leopard では R を起動してください. メニューから'' [パッケージとデータ]→[パッケージインストーラ]''を選びます.一番上の''CRAN''と表示されているメニューを''[このコンピューター上のバイナリパッケージ]''に変更します.右下の ''installボタン''を押して,ダウンロードした ''&color(blue){RMeCab_***.tgz};''を選びます.*** の部分はバージョン番号です. ++Rのコンソールには [引数libが欠けています] という警告メッセージが出ますが、これは異常ではありません。これでインストールは完了です ++ インストールする権限がないといわれた場合は,自分のホームに例えば RLibs などというフォルダを新規作成します。そして,やはりホームに ''.Renviron''というファイルを作成し,中身を次のように編集してください. R_LIBS=/Users/ishida/Rlibs ''ishida'' の部分は terminal 画面の $ マークの前に表示されているログイン名に変えてください.terminal上では以下のようにしても作成できます. $ echo 'R_LIBS=/Users/ishida/Rlibs' > .Renviron $ cat .Renviron ++ その上で,Rを起動しなおして,再び''&color(blue){RMeCab_***.tgz};'' パッケージをインストールする手続きを行い、ファイルを選ぶ前に ウィンドウ下の ''[ユーザーエリア]'' にチェックを入れておきます. + これで準備は完了です.さっそく[[RMeCab機能]]を試してみてください.なお[[試用データセット>#data]]を用意しました. ++ 万が一文字化けするような場合は, > Sys.getlocale() > Sys.setlocale("LC_CTYPE", "ja_JP.UTF-8") を実行してみてください. 問題がある場合は,[[ここ:http://groups.google.co.jp/group/rmecab]]の記事も参考にしてください. -- Snow Leopard での注意点 [#m73929a9] - Leopard のときに MeCab をコンパイルし,その後 Snow にアップデートした方.MeCab はそのまま R(32bit) に 32 bit 版 RMeCab を組み合わせてお使い下さい. - Snow にアップデートあるいはクリーンインストールし,その後で改めて MeCab をインストールする方.R64 と 64 bit 版 RMeCab をご利用ください. * R 本体を自力でコンパイルした Mac 用 RMeCab [#jdef54aa] &ref(SoftArchive/RMeCab_0.86_R_i386-apple-darwin9.8.0.tar.gz); (R-2.10.0) あるいは &ref(SoftArchive/RMeCab_0.84_R_i386-apple-darwin9.8.0.tar.gz); (R-2.9.2) をご利用ください。 ファイル名を RMeCab_0.8*.tgz と変えてからインストールしてください。 /////////// * &color(blue){&size(18){ Linux 版バイナリ & ソース};}; のインストール方法[#n6c9a6e0] Linux で mecab をレポジトリからインストールする場合は辞書を utf-8と指定してください.たとえば Ubuntu ならば Synaptic で mecab-ipadic-utf8 を検索して,これだけをインストール指定すれば mecab 本体も自動的にインストールされます.mecabと辞書をソースからコンパイルしてインストールする必要はありません. &color(green){Linux 32 bit}; バイナリ(R-2.11.1),バージョン 0.90 &ref(SoftArchive/RMeCab_0.90_R_i686-pc-linux-gnu.tar.gz); (おなじファイルは http://groups.google.co.jp/group/rmecab にもあります) &color(green){Linux 64 bit}; バイナリ(R-2.11.1),バージョン 0.90 &ref(SoftArchive/RMeCab_0.90_R_x86_64-unknown-linux-gnu.tar.gz); (おなじファイルは http://groups.google.co.jp/group/rmecab にもあります) ダウンロード後ファイル名を RMeCab_0.90.tar.gz と修正する必要があるかもしれません。 // -- &ref(SoftArchive/RMeCab_0.61.tar.gz); (R-2.7.1) //ユーザ名とパスワードは半角で mecab です. + [[和布蕪他インストール]]の最初を参考にしてください. + Mac版とほぼ同じ方法でまず''&color(red){[[MeCab:http://mecab.sourceforge.net/]]};''本体をインストールしてください.次に以下のコマンドでRにインストールします.getwd()関数で表示されたディレクトリにRMeCab_0.**.tar.gz があるとします. 実際は一行で入力してください. install.packages("RMeCab_0.**.tar.gz", destdir=".", repos = NULL) RMeCab_0.**.tar.gzの開発環境の文字コードは UTF-8 でした.なおご利用は自己責任でお願いします. /////////// //* &color(blue){&size(18){64 bit 版 Linux バイナリ & ソース};}; のインストール方法 [#k40ccb4d] // //&ref(SoftArchive/RMeCab_0.86_R_x86_64-unknown-linux-gnu.tar.gz); (64 bit R-2.10.2), //あるいは //&ref(SoftArchive/RMeCab_0.84_R_x86_64-unknown-linux-gnu.tar.gz); (64 bit R-2.9.2), //(インストール前に RMeCab_0.8*.tar.gz と名前を変える必要があるかもしれません) * RMeCabの機能説明は別ページにしました. [#sb463611] - [[RMeCab機能>RMeCabFunctions]] //[[RMeCab機能]] &aname(data); * 試用データセット (2009年08月25日修正) [#ca5cdc89] //ユーザ名とパスワードは半角で mecab です. &ref(SoftArchive/data.zip);(Windowsの方、Shift-Jis) : &ref(SoftArchive/data.tar.gz); (MacおよびUnixユーザーの方, utf-8 ファイル): //&ref(SoftArchive/testSetWin.zip);(Windowsの方、Shift-Jis) : //&ref(SoftArchive/testSetUnix.tar.gz); (MacおよびUnixユーザーの方, utf-8 ファイル): 解凍後,中に含まれる data フォルダをドライブの先頭にコピーして,''RMeCab.R'' ファイル内のコードを実行します.詳しくはフォルダ内の ''README_RMeCab.txt'' を読んでください. * MeCabへの辞書追加 [#yb36b1fb] [[こちら:http://mecab.sourceforge.net/dic.html]]を参照してください 例えば Ubuntu であれば 基広,-1,-1,1000,名詞,固有名詞,人名,名,*,*,基広,モトヒロ,モトヒロ を ishida.csv として作成し,以下を実行. \\ は改行を表しますが, 改行せず, 1 行にまとめて実行してください $ /usr/local/libexec/mecab/mecab-dict-index \\ -d/usr/local/lib/mecab/dic/ipadic -u ishida.dic \\ -f utf-8 -t utf-8 ishida.csv 作成された ishida.dic を利用できるか, まずコマンドラインで試し $ mecab -u ishida.dic 石田基広 石田 名詞,固有名詞,人名,姓,*,*,石田,イシダ,イシダ 基広 名詞,固有名詞,人名,名,*,*,基広,モトヒロ,モトヒロ EOS うまく行っているようだったら, $ cp /usr/local/etc/mecabrc ~/.mecabrc として ishida.dic を以下のように追加する $ vi ~/.mecabrc ; ; Configuration file of MeCab ; ; $Id: mecabrc.in,v 1.3 2006/05/29 15:36:08 taku-ku Exp $; ; dicdir = /usr/local/lib/mecab/dic/ipadic userdic = /home/ishida/git/Document/ishida.dic ; output-format-type = wakati ; input-buffer-size = 8192 ; node-format = %m\n ; bos-format = %S\n ; eos-format = EOS\n なお RMeCab 上で辞書を指定できる仕様を追加する予定です(RMeCab_0.89 から実装予定). &aname(Q); * バージョン履歴:問い合わせ先 [#j507d1f4] //////http://groups.google.co.jp/group/rmecab/ にも置いてます. /////////// - お問い合わせはメールをください.関数の追加についても,気楽にご相談ください. 石田基広 ishida-m(この部分を"@"に変更下さい)ias.tokushima-u.ac.jp - [[SoftArchive]][[ソース>RSource]] -- 掲示板を兼ねてますので,パスワードを設定しています.めかぶです. * R の参考書 [#s358f06f] //&htmlinsert(amazontext,asin=,text=); -&htmlinsert(amazontext,asin=4431712186,text=U・リゲス著『Rの基礎とプログラミング技法』シュプリンガー社); 中級者になるために. -&htmlinsert(amazontext,asin=4431713123,text=B・エヴェリット著『RとS-PLUSによる多変量解析』シュプリンガー社); 解析をばりばり行うために. -&htmlinsert(amazontext,asin=4431100474,text=P・スペクター著『Rデータ自由自在』シュプリンガー社); データをばりばり処理するために. -&htmlinsert(amazontext,asin=4274067572,text=青木繁伸『Rによる統計解析』オーム社); R のプログラミングテクニックを学ぶために. - &htmlinsert(amazontext,asin=4627096011,text=金明哲『Rによるデータサイエンス』森北書店); R での解析手法に慣れるために. - &htmlinsert(amazontext,asin=4777511847,text=舟尾暢男『データ解析環境「R」』工学社); とにかく R を使ってみたい. -&htmlinsert(amazontext,asin=4894717573,text=中澤港『Rによる統計解析の基礎』ピアソンエデュケーション); 統計学と R を同時に学びたい.