テキストマイニングのためのツール: データ解析・グラフィックス環境 R から日本語形態素解析ソフト和布蕪(MeCab)を呼び出して使うインターフェイス RMeCab の簡易版
RMeCab機能?にある三つの関数が使えます.ただし docDF() は RMeCab? の docDF には,新たに引数 nDF を追加. nDF=1 として実行すると,Ngram の N個のタームは別列にもうけます.
> (res <- docDF("data/photo.csv", 3, type = 1, N = 2)) file = photo.csv file_name = data/photo.csv opened number of extracted terms = 14 TERM POS1 POS2 photo.csv 1 ,-F 名詞-名詞 サ変接続-一般 1 2 ,-M 名詞-名詞 サ変接続-一般 1 3 ,-Reply 名詞-名詞 サ変接続-固有名詞 1 4 ,-Sex 名詞-名詞 サ変接続-一般 1 5 ,-写真 名詞-名詞 サ変接続-一般 1 6 1-, 名詞-名詞 数-サ変接続 1 7 2-, 名詞-名詞 数-サ変接続 1 8 3-, 名詞-名詞 数-サ変接続 1 9 4-, 名詞-名詞 数-サ変接続 1 10 5-, 名詞-名詞 数-サ変接続 1 11 F-, 名詞-名詞 一般-サ変接続 1 12 ID-, 名詞-名詞 固有名詞-サ変接続 1 13 M-, 名詞-名詞 一般-サ変接続 1 14 Sex-, 名詞-名詞 一般-サ変接続 1
> (res <- docDF("data/photo.csv", 3, type = 1, N = 2, nDF =1)) file = photo.csv file_name = data/photo.csv opened number of extracted terms = 14 N1 N2 POS1 POS2 photo.csv 1 , F 名詞-名詞 サ変接続-一般 1 2 , M 名詞-名詞 サ変接続-一般 1 3 , Reply 名詞-名詞 サ変接続-固有名詞 1 4 , Sex 名詞-名詞 サ変接続-一般 1 5 , 写真 名詞-名詞 サ変接続-一般 1 6 1 , 名詞-名詞 数-サ変接続 1 7 2 , 名詞-名詞 数-サ変接続 1 8 3 , 名詞-名詞 数-サ変接続 1 9 4 , 名詞-名詞 数-サ変接続 1 10 5 , 名詞-名詞 数-サ変接続 1 11 F , 名詞-名詞 一般-サ変接続 1 12 ID , 名詞-名詞 固有名詞-サ変接続 1 13 M , 名詞-名詞 一般-サ変接続 1 14 Sex , 名詞-名詞 一般-サ変接続 1
基本的に RMeCab と変わりませんので,詳細はそちらを参考にしてください.
C:\Program Files\MeCab\bin;を追加します.
このページ一番下のファイルをクリックしてください.ファイル名が変更されないように注意してください.