R2MeCab のバックアップ差分(No.2) - アールメカブ

アールメカブ


R2MeCab のバックアップ差分(No.2)


  • 追加された行はこの色です。
  • 削除された行はこの色です。
[[RMeCab]]

テキストマイニングのためのツール: データ解析・グラフィックス環境 &size(18){[[R:http://cran.md.tsukuba.ac.jp/]]}; から日本語形態素解析ソフト''&color(blue){和布蕪};([[MeCab:http://mecab.sourceforge.net/]])''を呼び出して使うインターフェイス [[RMeCab]] の簡易版

#contents
*参考文献 [#z7a4a17c]
- ''&color(green){テキストマイニング入門};'':[[RMeCab]]を利用したテキストマイニングについては『[[Rによるテキストマイニング入門:http://www.amazon.co.jp/R%E3%81%AB%E3%82%88%E3%82%8B%E3%83%86%E3%82%AD%E3%82%B9%E3%83%88%E3%83%9E%E3%82%A4%E3%83%8B%E3%83%B3%E3%82%B0%E5%85%A5%E9%96%80-%E7%9F%B3%E7%94%B0-%E5%9F%BA%E5%BA%83/dp/4627848412/]]』森北出版,2008.12
を参照いただければ幸いです.


*開発状況 [#y5588105]
- &color(green){2009年 3月6日 R2MeCab_0.01: 汎用的な docDF()関数の他に RMeCabC(), RMeCabText()};を実装

*機能 [#gba3cd69]
[[RMeCab機能]]にある三つの関数が使えます.ただし docDF() は RMeCab の docDF には,新たに引数 nDF を追加.
nDF=1 として実行すると,Ngram の N個のタームは別列にもうけます.

 > (res <- docDF("data/photo.csv", 3, type = 1, N = 2))
 file = photo.csv
 file_name =  data/photo.csv opened
 number of extracted terms = 14
 
       TERM      POS1              POS2 photo.csv
 1      ,-F 名詞-名詞     サ変接続-一般         1
 2      ,-M 名詞-名詞     サ変接続-一般         1
 3  ,-Reply 名詞-名詞 サ変接続-固有名詞         1
 4    ,-Sex 名詞-名詞     サ変接続-一般         1
 5   ,-写真 名詞-名詞     サ変接続-一般         1
 6      1-, 名詞-名詞       数-サ変接続         1
 7      2-, 名詞-名詞       数-サ変接続         1
 8      3-, 名詞-名詞       数-サ変接続         1
 9      4-, 名詞-名詞       数-サ変接続         1
 10     5-, 名詞-名詞       数-サ変接続         1
 11     F-, 名詞-名詞     一般-サ変接続         1
 12    ID-, 名詞-名詞 固有名詞-サ変接続         1
 13     M-, 名詞-名詞     一般-サ変接続         1
 14   Sex-, 名詞-名詞     一般-サ変接続         1

 > (res <- docDF("data/photo.csv", 3, type = 1, N = 2, nDF =1))
 file = photo.csv
 file_name =  data/photo.csv opened
 number of extracted terms = 14
 
     N1    N2      POS1              POS2 photo.csv
 1    ,     F 名詞-名詞     サ変接続-一般         1
 2    ,     M 名詞-名詞     サ変接続-一般         1
 3    , Reply 名詞-名詞 サ変接続-固有名詞         1
 4    ,   Sex 名詞-名詞     サ変接続-一般         1
 5    ,  写真 名詞-名詞     サ変接続-一般         1
 6    1     , 名詞-名詞       数-サ変接続         1
 7    2     , 名詞-名詞       数-サ変接続         1
 8    3     , 名詞-名詞       数-サ変接続         1
 9    4     , 名詞-名詞       数-サ変接続         1
 10   5     , 名詞-名詞       数-サ変接続         1
 11   F     , 名詞-名詞     一般-サ変接続         1
 12  ID     , 名詞-名詞 固有名詞-サ変接続         1
 13   M     , 名詞-名詞     一般-サ変接続         1
 14 Sex     , 名詞-名詞     一般-サ変接続         1

* &color(green){&size(20){インストール手順};}; [#u795b151]
基本的に [[RMeCab]] と変わりませんので,詳細はそちらを参考にしてください.
- まず''&color(red){[[MeCab:http://mecab.sourceforge.net/]]};''をインストールしてください.[[ここ:http://sourceforge.net/project/showfiles.php?group_id=177856&package_id=205277]] から [[win32バイナリmecab-0.97.exe:http://sourceforge.net/project/showfiles.php?group_id=177856&package_id=205277]] をダウンロードしてインストールします.インストール先は標準設定のまま ''[[C:\Program Files\MeCab]]'' とします.また文字コードは Shit-Jis のままとします.
- MeCabインストール後
Windowsの環境設定で MeCab へのパスを通します.
すなわちコントロール・パネルの[システム]アイテムを起動し、
表示される[システムのプロパティ]ダイアログの[詳細設定]タブ
(Windows 2000では[詳細]タブ)
をクリックし、[システム環境変数] の PATH の先頭に
 C:\Program Files\MeCab\bin;
を追加します.

- 次に ''&color(blue){R2MeCab_***.zip};''  をRにインストールします.*** の部分はバージョン番号です.Rのメニューから''[パッケージ]''→''[ローカルにあるzipファイルからのパッケージのインストール]''を選んで,ダウンロードした ''&color(blue){R2MeCab_***.zip};''ファイルを選んでインストールします.[win-libraryを作成したいのですか] と聞いてきた時は OK を押してください(この際,R はユーザーフォルダを作成します).

* ダウンロード [#r43c8ffc]
このページ一番下のファイルをクリックしてください.ファイル名が変更されないように注意してください.