管理人 について : 参考ページ 統計的言語処理: 形態素解析パッケージ RMeCab
RCaBoChaパッケージ
日本語の係り受け関係を R で解析できるようにします.形態素解析パッケージRMeCabもご参照ください.
今のところRCaBoChaパッケージには以下の関数しかありません.
RCaBoChaFreq?関数 : 否定の係りを判定して頻度を測る
> kekka <- RCaBoChaFreq("今日は鰻が美味しいな.
+ 昨日は鰻が美味しくなかった。")
> kekka
Term1 Freq
1 が 2
2 た 1
3 な 1
4 は 2
5 今日 1
6 昨日 1
7 美味しい 1
8 美味しい+ない 1
9 鰻 2
RCaBoCha関数 : CaBocha? の単純な出力を返す.
> kekka <- RCaBoCha("今日は鰻が食べたいな。")
FROMAT_TREE =
<DATE>今日</DATE>は---D
鰻が-D
食べたいな。
EOS
> kekka # D1 は句の連番,D2 はその係り受け関係を表す
Term1 Term2 POS D1 D2
1 今日 今日 名詞 1 2
2 は は 助詞 1 2
3 鰻 鰻 名詞 2 2
4 が が 助詞 2 2
5 食べ 食べる 動詞 3 -1
6 たい たい 助動詞 3 -1
7 な な 助詞 3 -1
8 。 。 記号 3 -1
ここからダウンロードして,インストールしてください.
Windowsではファイルをダブルクリックし,文字コードは Shift-JISを選び,後は[続ける]を押すだけです.
Linux や Mac OS X ではかなり面倒な手続きが必要です.ここを参考にしてください.
_ 現在のヴァージョン
_ バージョン 0.01 (R-2.7.1) 2008年 8月27日
_ Windows 版バイナリ のインストール方法
RCaBoCha_0.02.zip (R-2.7.1)
と
付属の環境設定ファイル
インストール手順
- まずCaBoChaをインストールしてください.ここ から win32バイナリをダウンロードしてインストールします.インストール先は標準設定のまま C:\Program Files\CaBoCha とします.また文字コードは Shit-Jis のままとします.
- 次に RCaBoCha_***.zip をRにインストールします.*** の部分はバージョン番号です.Rのメニューから[パッケージ]→[ローカルにあるzipファイルからのパッケージのインストール]を選んで,ダウンロードした RCaBoCha_***.zipファイルを選んでインストールします.[win-libraryを作成したいのですか] と聞いてきた時は OK を押してください(この際,R はユーザーフォルダを作成します).
- ここで,Rのライブラリフォルダがどこにあるかを確認してください.Rのコンソール画面で .libPaths() を実行すると分かります.通常はRがインストールされたフォルダになります.
- この結果の最初の出力 ([1] のすぐ右横の表示内容) が
[1] "C:/PROGRA~1/R/R-2*~*.*/library"
のように (*の部分はバージョン番号)なっていれば,R 本体と同じ場所にあります.以下の手順の4.までを実行してください.
- .libPaths() の最初の出力が
[1] "C:\\Document and Settings\\ishida\\Documents/R/win-library/2.7"
あるいは
[1] "C:\\Users\\ishida\\Documents/R/win-library/2.7"
のようにユーザー名を含んでいる場合は,ユーザーフォルダにライブラリはインストールされています.以下の手順の4. は飛ばして,手順の5.,場合によっては 6. までを実行してください.
- 続いて, CaBoCha と R の両方が標準的なフォルダにインストールされた状態であり,またRのライブラリフォルダが R 本体と同じ場所にあれば,RCaBoChaInstall.bat をダブルクリック してください.これでインストールは完了です.さっそく機能を試してみてください.なお試用データセットを用意しました.
- CaBoCha はデフォルトのままインストール先を変更しなかったが,Rのライブラリフォルダがユーザフォルダになっている場合,XPのユーザーであればRCaBoChaInstallXP.bat を,またVistaのユーザーはRCaBoChaInstallVista.bat を実行して,環境設定を行ってください.これでインストールは完了です.
- ここまでの手順でうまく動作しない場合 .
- CaBoCha と R のインストール先を独自に変更した場合や RCaBoCha が動作しない場合は以下を手作業で実行してください.
- CaBoChaをインストールしたフォルダ内の bin フォルダに libcabocha.dll libcrtff.dll というファイルがありますので,この二つを R のライブラリ関連フォルダ library にインストールされた RCaBoChaパッケージフォルダ内の libs フォルダ内にコピーします.
- R のインストール先に RCaBoChaパッケージ用のライブラリフォルダが存在しない場合,別の場所,すなわちユーザーフォルダにインストールされた可能性があります.
例えば個人名のフォルダの中に 「ドキュメント」->「R」->「win-library」->「2.*」があり,その中に RCaBoCha\libs フォルダがあるかもしれません。Rのコンソール画面で .libPaths() と実行すると分かります.以下は Vista Home Basic にR-2.7.1をインストールし、続いてRCaBoCha をインストールした直後に実行した結果です。
> .libPaths()
[1] "C:\\Users\\ishida\\Documents/R/win-library/2.7"
[2] "C:/PROGRA~1/R/R-27~1.1/library"
この場合は libcabocha.dll とlibcrftt.dll を win-library/2.7 の中のRCaBoCha\libs? というフォルダの中に手作業でコピーしてください。
ご利用は自己責任でお願いします.
_ Mac 版バイナリ のインストール方法
RCaBoCha_0.02.tgz (R-2.7.1)
- R を起動します.
メニューから [パッケージとデータ]→[パッケージインストーラ]を選びます.一番上のCRANと表示されているメニューを[このコンピューター上のバイナリパッケージ]に変更します.右下の installボタンを押して,ダウンロードした RCaBoCha_***.tgzを選びます.*** の部分はバージョン番号です.
- インストールする権限がないといわれた場合は,自分のホームに例えば RLibs などというフォルダを新規作成します。そして,やはりホームに .Renvironというファイルを作成し,中身を次のように編集してください.
R_LIBS=/Users/ishida/Rlibs
ishida の部分は terminal 画面の $ マークの前に表示されているログイン名に変えてください.terminal上では以下のようにしても作成できます.
$ echo 'R_LIBS=/Users/ishida/Rlibs' > .Renviron
$ cat .Renviron
- その上で,Rを起動しなおして,再びRCaBoCha_***.tgz パッケージをインストールする手続きを行い、ファイルを選ぶ前に ウィンドウ下の [ユーザーエリア] にチェックを入れておきます.
ご利用は自己責任でお願いします.
_ Linux 版バイナリ のインストール方法
RCaBoCha_0.02.tar.gz (R-2.7.1)
R コンソールで次のように実行してください.
> install.packages("RCaBoCha_0.01.tar.gz", lib.loc = ".",
repos = NULL)
> library(RCaBoCha)