old_info_RMeCab_How_to_Install - RとLinuxと...

RとLinuxと...


old_info_RMeCab_How_to_Install

管理人 について : 参考ページ 統計的言語処理: 保管庫 SoftArchive : 係り受け解析パッケージ RCaBoCha


RMeCabパッケージ

#ref(): File not found: "RealMecab.png" at page "old_info_RMeCab_How_to_Install"

RMeCabパッケージはこちらにも置いてあります。

テキストマイニングのためのツール: データ解析・グラフィックス環境 R から日本語形態素解析ソフト和布蕪(MeCab)を呼び出して使うインターフェイス

  • テキストマイニング入門RMeCabを利用したテキストマイニングについては 『Rによるテキストマイニング入門』森北出版 を参照いただければ幸いです.
  • 2010年 4月23日 RMeCab_0.88 (R-2.11.0対応) collocate()関数の出力を変更.nodeの前と後それぞれの頻度を加えた.またWindows 版に libmecab.dll を同封したので, MeCab を別途インストールす必要は必ずしもなくなった.
  • 2009年 12月17日 RMeCab_0.87 (R-2.10.1対応)
  • 2009年 11月12日 RMeCab_0.86 (R-2.10.0対応): docNgramDF()関数のバグを修正。
  • 2009年 8月25日 RMeCab_0.85 (R-2.10.0対応): MeCab?本体の最新バージョン(0.98)と組み合わせた。ほかに変更なし。
  • 2009年 8月25日 RMeCab_0.84 (R-2.9.2対応): あわせてdocNgram2(), docNgramDF()関数にバグがあったので修正.
  • 2009年 8月24日 RMeCab_0.83: NgramDF(), docDF()関数にバグがあったので修正.
  • 2009年 5月23日 RMeCab_0.82: collocate()関数のバグを修正.

Rここ から,自分のOSにあったファイルをダウンロードしてください.例えばWindows版なら,[Windows]->[base]とクリックし,R-2.*.*-win32.exeをダウンロードします.後はダブルクリックを繰り返せばインストールできます.なお、Windows版の場合は起動直後に日本語の設定をしてください。メニューの [編集]->[GUIプリファレンス]->[Font] で MS Gothic を選び [save] を押して、保存先はデフォルトそのままにマイドキュメントに保存します。その後は [OK] を押して操作を続行します。なおRを終了させる際、[workspace(作業情報)を保存しますか] と聞いてきますが, No を選んでおきましょう。

_ 現在のヴァージョン

_ バージョン 0.88 (R-2.11.0) 2010年 4月23日

R-2.11.0 への対応と collocate()関数の出力を変更.またWindows 版に libmecab.dll を同封したので, MeCab を別途インストールす必要は必ずしもなくなった.

  • 2010年 4月23日 RMeCab_0.88 (R-2.11.0対応) collocate()関数の出力を変更.nodeの前と後それぞれの頻度を加えた.
  • R-2.11.1 版 fileREADME_RMeCab.txt (Shift-JIS)

_ バージョン 0.87 (R-2.10.1) 2009年 12月17日

R-2.10.1 への対応版.変更なし.

_ バージョン 0.86 (R-2.10.0) 2009年 11月12日

docNgramDF()関数のバグを修正。

_ バージョン 0.85 (R-2.10.0) 2009年 10月28日

MeCab?本体の最新バージョン(0.98)と組み合わせた。ほかに変更なし。

  • 自力コンパイル版 R 用 Macintosh バイナリ(R-2.10.0),[[バージョン 0.86 fileRMeCab_0.86_R_i386-apple-darwin9.8.0.tar.gz ダウンロード後ファイル名を RMeCab_0.85.tgz と修正する必要があります。
  • Linux バイナリ(R-2.10.0),バージョン 0.85 fileRMeCab_0.85.tar.gz

_ バージョン 0.84 (R-2.9.2) 2009年 8月25日

R-2.9.2 に対応.あわせて docNgram2(), docNgramDF(), NgramDF(), docDF()関数のバグを修正

_ バージョン 0.78 (R-2.8.1) 2009年 3月28日

  • R-2.8.1 版fileREADME_RMeCab.txt (左記ファイルはShift-JIS形式です)
    • docDF()関数の効率が悪かった(解析に異常に時間がかかった)のを修正.また docNgramDF()関数は他の関数と異なり,文書(被験者回答)が行でタームが列なので,重み付け関数に行と列の指定ができるようにした.
    • Windows バイナリ(R-2.8.1),バージョン 0.78 fileRMeCab_0.78.zip と付属の環境設定ファイル
      • fileRMeCabInstall.bat (Rの標準的なライブラリフォルダ設定の場合)
      • fileRMeCabInstallXP.bat(XPで、ライブラリフォルダがユーザーフォルダ内にあるX場合)
      • fileRMeCabInstallVista.bat (Vistaで、ライブラリフォルダがユーザーフォルダ内にある場合)
    • Macintosh バイナリ(R-2.8.1),バージョン 0.78 fileRMeCab_0.78.tgz
    • Linux バイナリ(R-2.8.1),バージョン 0.78 fileRMeCab_0.78.tar.gz
    • 試用データセットfiledata.zip (Windows), filedata.tar.gz (Mac, Unix)

_ バージョン 0.61 (R-2.7.1) 2008年 9月2日

  • メモリ関係の微調整:変数の宣言を見直す.

_ 使い方の手引き; manual.pdf ファイル

やや古いマニュアルです.新規に追加された関数 (汎用的 docDF() 関数) や機能(ターム共起行列作成)についての記述はありません.filemanual081108.pdf をクリックするとAdobeReader?が起動します。ファイルが開かれたらAdobeのメニューから保存を選んでください。

_ 注意

  • ダウンロードについて ダウンロードの際、ファイル名を一切変更しないください! . Rはインストール時に、ファイル名と中身のチェックを行います.ファイル名が中身の情報と一致しない場合、インストールは行われません.特に Internet Explorer 6 はファイル名に [1] を付記することがあります.この場合は手作業でファイル名を元通りに変更してください.
  • ワークスペースの保存について RMeCab? で日本語テキストを処理した後,Rを終了させる際には,[現在のワークスペースを保存しますか]という問い合わせには NO を選択することを推奨します.YES を選択すると,保存文字コードの関係で,次回 R を起動する際にエラーが生じることがあります.この場合は R の作業フォルダ内の .RData というファイルを削除してから,起動し直してください.作業フォルダは,多くの場合 C:\Document and Settiings\ユーザ名\My Documentsというフォルダです.また Windows では .RData のようにドットで始まるファイルは表示されないことがあります.この場合は,エクスプローラーを起動して,メニューから[ツール][フォルダオプション][表示]を選び,[すべてのファイルとフォルダを表示する]にチェックを入れて下さい.

_ Windows 版バイナリ のインストール方法

fileRMeCab_0.86.zip (R-2.10.0),

fileRMeCab_0.84.zip (R-2.9.2),

fileRMeCab_0.83.zip (R-2.9.1),

fileRMeCab_0.78.zip (R-2.8.1),

fileRMeCab_0.61.zip (R-2.7.1)

と 付属の環境設定ファイル (MeCab?へのPATHをWindowsの環境設定に追加した場合は不要.)fileREADME_RMeCab.txt (左記ファイルはShift-JIS形式です)

  • fileRMeCabInstall.bat (標準的なライブラリフォルダ設定の場合)
  • fileRMeCabInstallXP.bat(ライブラリフォルダがユーザーフォルダ内にあるXPの場合)
  • fileRMeCabInstallVista.bat (ライブラリフォルダがユーザーフォルダ内にあるVISTAの場合) :Vistaの場合ファイルを右クリックして [管理者] として実行します.

ご利用は自己責任でお願いします.

インストール手順

  1. まずMeCabをインストールしてください.ここ から win32バイナリmecab-0.98.exe をダウンロードしてインストールします.インストール先は標準設定のまま C:\Program Files\MeCab とします.また文字コードは Shit-Jis のままとします.
  2. 次に RMeCab_***.zip をRにインストールします.*** の部分はバージョン番号です.Rのメニューから[パッケージ][ローカルにあるzipファイルからのパッケージのインストール]を選んで,ダウンロードした RMeCab_***.zipファイルを選んでインストールします.[win-libraryを作成したいのですか] と聞いてきた時は OK を押してください(この際,R はユーザーフォルダを作成します). Vista では'Permission denied'とエラーが表示されて,先に進めないことがあります.この場合はいったん R を [終了] させ,もう一度,今度は R のアイコンを右クリックして,[管理者として実行] を選んでください.
    1. ここでMeCab?のライブラリのインストールを行います。MeCab? へのパスをWindowsの環境設定で行った場合,続く 3.以下の処理は不要になります.詳しくは fileREADME_RMeCab.txt (左記はShift-JISファイルです)をご覧ください.
  3. ここで,Rのライブラリフォルダがどこにあるかを確認してください.Rのコンソール画面で .libPaths() を実行すると分かります.通常はRがインストールされたフォルダになります.
    1. この結果の最初の出力 ([1] のすぐ右横の表示内容)
      [1] "C:/PROGRA~1/R/R-2*~*.*/library" 
      のように (*の部分はバージョン番号)なっていれば,R 本体と同じ場所にあります.以下の手順の4.までを実行してください.
    2. .libPaths() 最初の出力
      [1] "C:\\Document and Settings\\ishida\\Documents/R/win-library/2.7"
      あるいは
      [1] "C:\\Users\\ishida\\Documents/R/win-library/2.7"
      のようにユーザー名を含んでいる場合は,ユーザーフォルダにライブラリはインストールされています.以下の手順の4. は飛ばして,手順の5.,場合によっては 6. までを実行してください.
  4. 続いて, MeCab? と R の両方が標準的なフォルダにインストールされた状態であり,またRのライブラリフォルダが R 本体と同じ場所にあれば,fileRMeCabInstall.bat をダブルクリック してください.これでインストールは完了です.さっそくRMeCab機能?を試してみてください.なお試用データセットを用意しました.
  5. MeCab? はデフォルトのままインストール先を変更しなかったが,Rのライブラリフォルダがユーザフォルダになっている場合,XPのユーザーであればfileRMeCabInstallXP.bat を,またVistaのユーザーはfileRMeCabInstallVista.bat を実行して,環境設定を行ってください.これでインストールは完了です.
  6. ここまでの手順でうまく動作しない場合
    1. MeCab? と R のインストール先を独自に変更した場合や RMeCab? が動作しない場合は以下を手作業で実行してください.
      1. MeCab?をインストールしたフォルダ内の bin フォルダに libmecab.dll というファイルがありますので,これを R のライブラリ関連フォルダ library にインストールされた RMeCab?パッケージフォルダ内の libs フォルダ内にコピーします.
      2. 例えばインストール先が E:\Program Files\MeCab ならば,その lib フォルダ内に libmecab.dll というファイルがあります.これを R のライブラリ関連フォルダに作成された RMeCab?パッケージ用のライブラリフォルダ libs にコピーします.例えばRのインストール先が E:\Program Files\R\R-2.*.* ならば,その library というフォルダの中に RMeCab\libs? というフォルダがありますので,そのフォルダ内に libmecab.dll をコピーしてください.
      3. R のインストール先に RMeCab?パッケージ用のライブラリフォルダが存在しない場合,別の場所,すなわちユーザーフォルダにインストールされた可能性があります. 例えば個人名のフォルダの中に 「ドキュメント」->「R」->「win-library」->「2.*」があり,その中に RMeCab?\libs フォルダがあるかもしれません。Rのコンソール画面で .libPaths() と実行すると分かります.以下は Vista Home Basic にR-2.7.1をインストールし、続いてRMeCab? をインストールした直後に実行した結果です。
        > .libPaths()
        [1] "C:\\Users\\ishida\\Documents/R/win-library/2.7"
        [2] "C:/PROGRA~1/R/R-27~1.1/library" 
        この場合は libmecab.dllwin-library/2.7 の中のRMeCab\libs? というフォルダの中に手作業でコピーしてください。
  • MeCab? ライブラリのインストールは R を起動してコンソールから次の2行を、一行ずつ実行してもかまいません。
path <- paste(.libPaths(),"RMeCab","libs", sep = "/")
file.copy("C:/Program Files/MeCab/bin/libmecab.dll", path )

この場合 RMeCabaInstall?.bat を実行する必要はありません。

_ Macintosh 版バイナリ のインストール方法

32 bit Leopard 用 Macintosh バイナリ(R-2.11.0),

RMeCab_0.88.tgz

64bit Snow Leopard 用 Macintosh バイナリ(R-2.11.0),

RMeCab_0.88_R_x86_64-apple-darwin9.8.0.tar.gz.

&ref(): File not found: "RMeCab_0.87.tgz" at page "SoftArchive"; (R-2.10.1),

fileRMeCab_0.61.tgz (R-2.7.1)

開発環境の文字コードは UTF-8 でした. ご利用は自己責任でお願いします.

インストール手順

  • Mac Port 版 mecab はインストールしないでください
  • Leopard には最初からMeCab?がインストールされていますが、文字コードが違いますので、以下の手順で別にインストールしてください。オリジナルのMeCab?が上書きされることはありません。
  1. MeCab本体のインストールには Mac OS X DVD に付属の開発環境をインストールしておく必要があります.DVDの[ユーティリティフォルダ]にある [ターミナル],[X11]と,[Optional Installs] フォルダ内 [Xcode Tools] フォルダにある [XcodeTools?.mpkg] をインストールしておいてください.
    1. なお,ファイルのダウンロードでは,Ctrl キーを押しながらファイルをクリックしてください.さもないとファイル名が変更されてしまいます.メニューから「リンク先のファイルをダウンロード」を選んでください.
  2. まずMeCabをインストールします.ここからソース版 mecab-0.98.tar.gz を取得します.同じく辞書 mecab-ipadic-2.7.0-20070801.tar.gz もダウンロードしてください.バージョンを表す数字は適当に読み替えてください.
  3. terminalを起動して,ダウンロードしたフォルダに移動します.仮にこれを Downloads フォルダとします.
    $ cd Downloads
    $ tar zxvf mecab-0.98.tar.gz
    $ cd mecab-0.98
    $ ./configure --with-charset=utf8
    $ make
    $ sudo make install
    # $ sudo ldconfig ## Linux ではこれが必要
    1. もしも sudo make install を実行すると make Error , Permission denied などと表示される場合は次のようにしてください.
      $ chmod 700 install-sh
      $ sudo make install
  4. 辞書もインストールします
    $ tar zxf mecab-ipadic-2.7.0-20070****.tar.gz
    $ cd mecab-ipadic-2.7.0-20070****
    $ ./configure --with-charset=utf-8
    # ここでエラーが出る場合は PATH を通してみてください
    # 以下の一行を実行します.
    # $ export PATH=/usr/local/bin:PATH
    $ make
    $ sudo make install
    # 今後のために PATH を追加しておくとよいでしょう
    # $ echo $PATH
    # を実行して表示された内容に /usr/local/bin が含まれていない場合は
    # ホームディレクトリに戻って
    # $ cd
    # 次のコマンドを実行しておきます.
    # $ echo '/usr/local/bin:$PATH' >> .bash_profile
    # ここで引用符はシングルコーテーションです
  5. 次に R を起動します. メニューから [パッケージとデータ]→[パッケージインストーラ]を選びます.一番上のCRANと表示されているメニューを[このコンピューター上のバイナリパッケージ]に変更します.右下の installボタンを押して,ダウンロードした RMeCab_***.tgzを選びます.*** の部分はバージョン番号です.
    1. Rのコンソールには
      	[引数libが欠けています]
      という警告メッセージが出ますが、これは異常ではありません。これでインストールは完了です
    2. インストールする権限がないといわれた場合は,自分のホームに例えば RLibs などというフォルダを新規作成します。そして,やはりホームに .Renvironというファイルを作成し,中身を次のように編集してください.
      R_LIBS=/Users/ishida/Rlibs
      ishida の部分は terminal 画面の $ マークの前に表示されているログイン名に変えてください.terminal上では以下のようにしても作成できます.
      $ echo 'R_LIBS=/Users/ishida/Rlibs' > .Renviron
      $ cat .Renviron
    3. その上で,Rを起動しなおして,再びRMeCab_***.tgz パッケージをインストールする手続きを行い、ファイルを選ぶ前に ウィンドウ下の [ユーザーエリア] にチェックを入れておきます.
  6. これで準備は完了です.さっそくRMeCab機能?を試してみてください.なお試用データセットを用意しました.
    1. 万が一文字化けするような場合は,
      > Sys.getlocale()
      > Sys.setlocale("LC_CTYPE", "ja_JP.UTF-8")
      を実行してみてください.

問題がある場合は,ここの記事も参考にしてください.

_ Snow Leopard への対応

  • Leopard のときに MeCab? をコンパイルし,その後 Snow にアップデートした方.MeCab? はそのまま R(32bit) と fileRMeCab_0.86.tgz を組み合わせてお使い下さい.
  • Snow にアップデートあるいはクリーンインストールし,その後で改めて MeCab? をインストールする方.R64 とバージョン 0.85 RMeCab_0.86_R_x86_64-apple-darwin9.8.0.tar.gz. をご利用ください.ダウンロード後ファイル名を RMeCab_0.85.tgz と修正する必要があります。

_ R 本体を自力でコンパイルした Mac 用 RMeCab?

fileRMeCab_0.86_R_i386-apple-darwin9.8.0.tar.gz (R-2.10.0) あるいは fileRMeCab_0.84_R_i386-apple-darwin9.8.0.tar.gz (R-2.9.2) をご利用ください。

ファイル名を RMeCab_0.8*.tgz と変えてからインストールしてください。

_ Linux 版バイナリ & ソース のインストール方法

Linux バイナリ(R-2.11.0),バージョン 0.88

RMeCab_0.88.tar.gz

Linux 64 bit バイナリ(R-2.11.0),バージョン 0.88

RMeCab_0.88_R_x86_64-unknown-linux-gnu.tar.gz

ダウンロード後ファイル名を RMeCab_0.88.tar.gz と修正する必要があるかもしれません。

fileRMeCab_0.87.tar.gz (R-2.10.1),

fileRMeCab_0.61.tar.gz (R-2.7.1)

  1. 和布蕪他インストールの最初を参考にしてください.
  2. Mac版とほぼ同じ方法でまずMeCab本体をインストールしてください.次に以下のコマンドでRにインストールします.getwd()関数で表示されたディレクトリにRMeCab_0.**.tar.gz があるとします. 実際は一行で入力してください.
 install.packages("RMeCab_0.**.tar.gz",
                           destdir=".",   repos = NULL)

RMeCab_0.**.tar.gzの開発環境の文字コードは UTF-8 でした.なおご利用は自己責任でお願いします.

_ 64 bit 版 Linux バイナリ & ソース のインストール方法

fileRMeCab_0.86_R_x86_64-unknown-linux-gnu.tar.gz (64 bit R-2.10.2), あるいは fileRMeCab_0.84_R_x86_64-unknown-linux-gnu.tar.gz (64 bit R-2.9.2), (インストール前に RMeCab_0.8*.tar.gz と名前を変える必要があるかもしれません)

  1. 和布蕪他インストールページの MeCab? インストール方法を参考にしてください.
  2. Mac版とほぼ同じ方法でまずMeCab本体をインストールしてください.次に以下のコマンドでRにインストールします.getwd()関数で表示されたディレクトリにRMeCab_0.**.tar.gz があるとします. 実際は一行で入力してください.
 install.packages("RMeCab_0.**.tar.gz",
                           destdir=".",   repos = NULL)

RMeCab_0.**.tar.gzの開発環境の文字コードは UTF-8 でした.なおご利用は自己責任でお願いします.

_ RMeCab?の機能説明は別ページにしました.

  • RMeCab機能?

_ 試用データセット (2009年08月25日修正)

filedata.zip(Windowsの方、Shift-Jis) : filedata.tar.gz (MacおよびUnixユーザーの方, utf-8 ファイル): 解凍後,中に含まれる data フォルダをドライブの先頭にコピーして,RMeCab?.R ファイル内のコードを実行します.詳しくはフォルダ内の README_RMeCab?.txt を読んでください.

_ バージョン履歴:問い合わせ先

  • お問い合わせはメールをください.関数の追加についても,気楽にご相談ください.

石田基広

ishida-m(この部分を"@"に変更下さい)ias.tokushima-u.ac.jp

  • SoftArchiveソース
    • 掲示板を兼ねてますので,パスワードを設定しています.めかぶです.

_ R の参考書

 
Link: admin(10d) RMeCab(10d) SoftArchive(909d) RCaBoCha(1702d) 和布蕪他インストール(2160d) R2MeCab(2476d) RSource(2719d) 統計的言語処理(3031d)
Last-modified: 2010-05-05 (水) 13:32:01 (2581d)