[[RMeCab]] テキストマイニングのためのツール: データ解析・グラフィックス環境 &size(18){[[R:http://cran.md.tsukuba.ac.jp/]]}; から日本語形態素解析ソフト''&color(blue){和布蕪};([[MeCab:http://mecab.sourceforge.net/]])''を呼び出して使うインターフェイス [[RMeCab]] の簡易版 #contents *参考文献 [#z7a4a17c] - ''&color(green){テキストマイニング入門};'':[[RMeCab]]を利用したテキストマイニングについては『[[Rによるテキストマイニング入門:http://www.amazon.co.jp/R%E3%81%AB%E3%82%88%E3%82%8B%E3%83%86%E3%82%AD%E3%82%B9%E3%83%88%E3%83%9E%E3%82%A4%E3%83%8B%E3%83%B3%E3%82%B0%E5%85%A5%E9%96%80-%E7%9F%B3%E7%94%B0-%E5%9F%BA%E5%BA%83/dp/4627848412/]]』森北出版,2008.12 を参照いただければ幸いです. *開発状況 [#y5588105] - &color(green){2009年 3月6日 R2MeCab_0.01: 汎用的な docDF()関数の他に RMeCabC(), RMeCabText()};を実装 *機能 [#gba3cd69] [[RMeCab機能]]にある三つの関数が使えます.ただし docDF() は RMeCab の docDF には,新たに引数 nDF を追加. nDF=1 として実行すると,Ngram の N個のタームは別列にもうけます. > (res <- docDF("data/photo.csv", 3, type = 1, N = 2)) file = photo.csv file_name = data/photo.csv opened number of extracted terms = 14 TERM POS1 POS2 photo.csv 1 ,-F 名詞-名詞 サ変接続-一般 1 2 ,-M 名詞-名詞 サ変接続-一般 1 3 ,-Reply 名詞-名詞 サ変接続-固有名詞 1 4 ,-Sex 名詞-名詞 サ変接続-一般 1 5 ,-写真 名詞-名詞 サ変接続-一般 1 6 1-, 名詞-名詞 数-サ変接続 1 7 2-, 名詞-名詞 数-サ変接続 1 8 3-, 名詞-名詞 数-サ変接続 1 9 4-, 名詞-名詞 数-サ変接続 1 10 5-, 名詞-名詞 数-サ変接続 1 11 F-, 名詞-名詞 一般-サ変接続 1 12 ID-, 名詞-名詞 固有名詞-サ変接続 1 13 M-, 名詞-名詞 一般-サ変接続 1 14 Sex-, 名詞-名詞 一般-サ変接続 1 > (res <- docDF("data/photo.csv", 3, type = 1, N = 2, nDF =1)) file = photo.csv file_name = data/photo.csv opened number of extracted terms = 14 N1 N2 POS1 POS2 photo.csv 1 , F 名詞-名詞 サ変接続-一般 1 2 , M 名詞-名詞 サ変接続-一般 1 3 , Reply 名詞-名詞 サ変接続-固有名詞 1 4 , Sex 名詞-名詞 サ変接続-一般 1 5 , 写真 名詞-名詞 サ変接続-一般 1 6 1 , 名詞-名詞 数-サ変接続 1 7 2 , 名詞-名詞 数-サ変接続 1 8 3 , 名詞-名詞 数-サ変接続 1 9 4 , 名詞-名詞 数-サ変接続 1 10 5 , 名詞-名詞 数-サ変接続 1 11 F , 名詞-名詞 一般-サ変接続 1 12 ID , 名詞-名詞 固有名詞-サ変接続 1 13 M , 名詞-名詞 一般-サ変接続 1 14 Sex , 名詞-名詞 一般-サ変接続 1 * &color(green){&size(20){インストール手順};}; [#u795b151] 基本的に [[RMeCab]] と変わりませんので,詳細はそちらを参考にしてください. - まず''&color(red){[[MeCab:http://mecab.sourceforge.net/]]};''をインストールしてください.[[ここ:http://sourceforge.net/project/showfiles.php?group_id=177856&package_id=205277]] から [[win32バイナリmecab-0.97.exe:http://sourceforge.net/project/showfiles.php?group_id=177856&package_id=205277]] をダウンロードしてインストールします.インストール先は標準設定のまま ''[[C:\Program Files\MeCab]]'' とします.また文字コードは Shit-Jis のままとします. - MeCabインストール後 Windowsの環境設定で MeCab へのパスを通します. すなわちコントロール・パネルの[システム]アイテムを起動し、 表示される[システムのプロパティ]ダイアログの[詳細設定]タブ (Windows 2000では[詳細]タブ) をクリックし、[システム環境変数] の PATH の先頭に C:\Program Files\MeCab\bin; を追加します. - 次に ''&color(blue){R2MeCab_***.zip};'' をRにインストールします.*** の部分はバージョン番号です.Rのメニューから''[パッケージ]''→''[ローカルにあるzipファイルからのパッケージのインストール]''を選んで,ダウンロードした ''&color(blue){R2MeCab_***.zip};''ファイルを選んでインストールします.[win-libraryを作成したいのですか] と聞いてきた時は OK を押してください(この際,R はユーザーフォルダを作成します). * ダウンロード [#r43c8ffc] このページ一番下のファイルをクリックしてください.ファイル名が変更されないように注意してください.