RMeCab のバックアップ(No.16) - アールメカブ

アールメカブ


RMeCab のバックアップ(No.16)


管理人 について : 参考ページ 統計的言語処理: 旧バージョン保管庫 SoftArchive


RMeCabパッケージ

和布蕪ってのはこれ
RMeCabパッケージは http://sites.google.com/site/rmecab/ にも置いてあります。 旧バージョンは http://groups.google.co.jp/group/rmecab にあります.

テキストマイニングのためのツール: データ解析・グラフィックス環境 R から日本語形態素解析ソフト和布蕪(MeCab)を呼び出して使うインターフェイス

  • テキストマイニング入門RMeCabを利用したテキストマイニングについては を参照いただければ幸いです.
    • R のレファレンスです.
  • 初心者向けにRをいちから解説した入門書です.
    • 出版社のサイト
  • 2013 年 10 月 21 日 RMeCab_0.9993 for R-3.0.2 公開 特に変更なし
  • 2013 年 08 月 23 日 RMeCab_0.9992 for R-3.0.1 公開 特に変更なし
  • 2013 年 04 月 04 日 RMeCab_0.9980/90 for R-3.0.0 公開 特に変更なし
  • 2013 年 03 月 19 日 RMeCab_0.997 for R-2.15.3 (R-2.14 でも使えます) 公開 特に変更なし
  • 2012 年 10 月 28 日 RMeCab_0.996 for R-2.15.2 (R-2.14 でも使えます) 公開 特に変更なし
  • 2012 年 06 月 25 日 RMeCab_0.995 for R-2.15.1 (R-2.14 でも使えます) 公開 特に変更なし
  • 2012 年 04 月 03 日 RMeCab_0.994 for R-2.15.0 (R-2.14 でも使えます) 公開
    • Windows 64 bit 版での一部生じていた不具合を修正

Rここ から,自分のOSにあったファイルをダウンロードしてください.例えばWindows版なら,[Windows]->[base]とクリックし,R-2.*.*-win.exeをダウンロードします.後はダブルクリックを繰り返せばインストールできます.なお、Windows版の場合は起動直後に日本語の設定をしてください。メニューの [編集]->[GUIプリファレンス]->[Font] で MS Gothic を選び [save] を押して、保存先はデフォルトそのままにマイドキュメントに保存します。その後は [OK] を押して操作を続行します。なおRを終了させる際、[workspace(作業情報)を保存しますか] と聞いてきますが, No を選んでおきましょう。

_ 現在のヴァージョン

_ バージョン RMeCab_0.9993 ( R-3.0.2) 2013年 10 月 21 日

  • Windows (32/64) 用バイナリ(mecab_0.996  + R-3.0.1) 
  1. Rを起動して,以下のように入力してEnterキーを押してインストールして下さい.
     install.packages ("RMeCab", repos = "http://rmecab.jp/R")
  2. あるいはhttp://web.ias.tokushima-u.ac.jp/linguistik/win.htmlから RMeCab_0.9***.zipをダウンロードしてください.
  • Mac Mountain Lion 用 64 bit バイナリ RMeCab_0.9993 (mecab_0.996 + R-3.0.2 )
  1. Rを起動して,以下のように入力してEnterキーを押してインストールして下さい.
     install.packages ("RMeCab", repos = "http://rmecab.jp/R")
    1. あるいはhttp://web.ias.tokushima-u.ac.jp/linguistik/mlion.htmlから RMeCab_0.999*.tgzをダウンロードしてメニューのパッケージ「ローカルディスクのzipファイル」から読み込んでください.
      1. アプリケーションフォルダ内の R を起動し,メニューの「パッケージとデータ」「パッケージインストーラー」「このコンピューター上のバイナリパッケージ」「インストール」ボタンで RMeCab_0.999*.tgz を選択します.
  • Mac Lion 用 64 bit バイナリ RMeCab_0.99920 (mecab_0.994 or 0.996 + R-3.0.0 )

http://web.ias.tokushima-u.ac.jp/linguistik/lion.html からダウンロードしてください

  • Mac Lion 用 64 bit バイナリ(少し古い mecab_0.99 + R-2.15.2 アプリケーションの R64 で利用; ; R-2.14 でも使えます) fileRMeCab_0.994-2.tgz mecab_0.99 に対応させたバイナリです
  • Snow Leopard 用 64 bit バイナリ RMeCab_0.99600.tgz (mecab_0.998000 + R-3.0.0 アプリケーションの R64 で利用)

http://web.ias.tokushima-u.ac.jp/linguistik/snow.html からダウンロードしてください

  • Ubuntu 10.04_(gcc4.4.3) 32 bit バイナリ(mecab_0.996 + R-3.0.2 )
  1. Rを起動して,以下のように入力してEnterキーを押してインストールして下さい.
     install.packages ("RMeCab", repos = "http://rmecab.jp/R")
    1. あるいはhttp://web.ias.tokushima-u.ac.jp/linguistik/u32.html からダウンロードしてください
  • Ubuntu_10.04_(gcc4.4.3) 64 bit バイナリ(mecab_0.996 + R-3.0.2 )
  1. Rを起動して,以下のように入力してEnterキーを押してインストールして下さい.
     install.packages ("RMeCab", repos = "http://rmecab.jp/R")
    1. あるいは http://web.ias.tokushima-u.ac.jp/linguistik/u64.html からダウンロードしてください
  • さらに枯れた RMeCab_0.9906 CentOS 5 + gcc 4.1.2 で作成

R-2.15.0 + mecab_0.994 on CentOS 5.6 + gcc 4.1.2

  • for R-3.0.0 ; CentOS_5_ 32 bit

http://web.ias.tokushima-u.ac.jp/linguistik/c32.html からダウンロードしてください

$ uname -a
  Linux localhost.localdomain 2.6.18-308.8.2.el5
    #1 SMP Tue Jun 12 09:57:26 EDT 2012 i686 i686 i386 GNU/Linux
$ gcc --version
gcc (GCC) 4.1.2 20080704 (Red Hat 4.1.2-52)
 Copyright (C) 2006 Free Software Foundation, Inc.
  • for R-3.0.0 ; CentOS_5_ 64 bit

http://web.ias.tokushima-u.ac.jp/linguistik/c64.html からダウンロードしてください

you may need: 
$ sudo cat "/usr/local/lib" >>  /etc/ld.config.d/lib.conf
$ sudo /sbin/ldconfig

$ uname -a
Linux localhost.localdomain 2.6.18-238.el5
  #1 SMP Thu Jan 13 15:51:15 EST 2011 x86_64 x86_64 x86_64 GNU/Linux
$ gcc --version
gcc (GCC) 4.1.2 20080704 (Red Hat 4.1.2-52)

_ Windows 版 RMeCab? (32/64 bit) インストール手順

http://code.google.com/p/mecab/downloads/list から mecab_0.996.exe ないし mecab_0.994.exe をダウンロードしてインストールします.

インストール先は標準設定のまま C:\Program Files\MeCab あるいは C:\Program Files(x86)\MeCab とします.また文字コードは Shit-Jis のままとします.

  1. Rを起動して,以下のように入力してEnterキーを押してインストールして下さい.
     install.packages ("RMeCab", repos = "http://rmecab.jp/R")
    1. あるいは http://web.ias.tokushima-u.ac.jp/linguistik/win.html から RMeCab_0.9***.zipをダウンロードしてください.
      1. 次にダウンロードした RMeCab_***.zipをR 32 bit あるいは R 64 bit のいずれかで 1 回インストールします.どちらでも使えるようになります.*** の部分はバージョン番号です.
      2. R 32 bit あるいは R 64 bit のいずれかで 1 回インストールします.どちらでも使えるようになります. Rのメインメニューから[パッケージ]→[ローカルにあるzipファイルからのパッケージのインストール]を選んで,ダウンロードした RMeCab_***.zipファイルを選んでインストールします.[win-libraryを作成したいのですか] と聞いてきた時は OK を押してください(この際,R はユーザーフォルダを作成します). 以上でインストールは終了です

_ Windows版RMeCab_0.88までのインストール方法

_ Macintosh 版バイナリ のインストール方法

64bit Mountain Lion 用 Macintosh バイナリ

  1. Rを起動して,以下のように入力してEnterキーを押してインストールして下さい.
     install.packages ("RMeCab", repos = "http://rmecab.jp/R")
    1. あるいは http://web.ias.tokushima-u.ac.jp/linguistik/mlion.html 以下から RMeCab_0.9***.tgzをダウンロードしてください.
      1. アプリケーションフォルダ内の R を起動し,メニューの「パッケージとデータ」「パッケージインストーラー」「このコンピューター上のバイナリパッケージ」「インストール」ボタンで RMeCab_0.99*0.tgz を選択します.

http://web.ias.tokushima-u.ac.jp/linguistik/lion.html からダウンロードしてください

64bit Lion 用 Macintosh バイナリ

  1. http://web.ias.tokushima-u.ac.jp/linguistik/lion.html から RMeCab_0.99901.tgzをダウンロードしてください.
    1. アプリケーションフォルダ内の R を起動し,メニューの「パッケージとデータ」「パッケージインストーラー」「このコンピューター上のバイナリパッケージ」「インストール」ボタンで RMeCab_0.99*0.tgz を選択します.

64bit Snow Leopard 用 Macintosh バイナリ

  • mecab_0.994 をインストールして Snow Leopard 用 64 bit バイナリ版 R で利用する場合

http://web.ias.tokushima-u.ac.jp/linguistik/snow.html からダウンロードしてください

  • filemecab-0.98.tar.gz をインストールして Snow Leopard 用 64 bit バイナリ版 Rで使う場合 (R-2.14.1 アプリケーションのR64で利用)

開発環境の文字コードは UTF-8 でした. ご利用は自己責任でお願いします.

インストール手順

  • MeCab? は Homebrew でインストールするか,あるいはソースからコンパイルして下さい. Mac Port 版 mecab は使えないかもしれません.ソースからインストールするには以下の手順を参考にしてください.
  • Leopard には最初からMeCab?がインストールされていますが、文字コードが違いますので、以下の手順で別にインストールしてください。オリジナルのMeCab?が上書きされることはありません。
  1. MeCab本体のインストールには 開発環境をインストールしておく必要があります.AppStore? から Xcode をインストールして下さい.Xcode で で検索をかければ直ぐに出てきます.無料です. 2012年2月に公開されたXcode 4.3 for Lionでは、Xcodeのインストール時にコマンドラインツールがインストールされないようになっています。
    • ただしLion用のXcode4.3では追加でコマンドラインツールをインストールする必要があります.Xcodeにおいて[Xcode]メニューの[Preferences...]を選んだ後に[Downloads]をクリックし、[Components]タブの[Command Line Tools]の右側にある[Install]ボタンをクリックします。
      和布蕪ってのはこれ
    • Marverick + Xcode 5 を使う場合は、ターミナルで sudo xcode-select --install を実行します。
  2. まずMeCabをインストールします. http://code.google.com/p/mecab/downloads/list からソース版mecab_0.996.tar.gz あるいは mecab-0.994.tar.gzを取得します. 同じくhttp://code.google.com/p/mecab/downloads/list から 辞書mecab-ipadic-2.7.0-20070801.tar.gz http://code.google.com/p/mecab/downloads/detail?name=mecab-ipadic-2.7.0-20070801.tar.gz もダウンロードしてください.バージョンを表す数字は適当に読み替えてください.
  3. terminalを起動して,ダウンロードしたフォルダに移動します.仮にこれを Downloads フォルダとします.
    $ cd Downloads 
    $ tar zxvf mecab-0.996.tar.gz #
      # #  $ tar zxvf mecab-0.98.tar.gz # RMeCab0.98 を使う場合
    $ cd mecab-0.996
    $ ./configure --with-charset="utf8"
    $ make
    # もしも Symbol _libconv 関連のエラーが出た場合は
    #    $ make clean
    #    $  ./configure --with-charset="utf8" LDFLAGS="-liconv"
    #    $ make
    #    とやり直して下さい
    
    $ sudo make install
    # $ sudo ldconfig ## Linux ではこれが必要
    1. もしも sudo make install を実行すると make Error , Permission denied などと表示される場合は次のようにしてください.
      $ chmod 700 install-sh
      $ sudo make install
  4. 辞書もインストールします
    $ tar zxf mecab-ipadic-2.7.0-20070****.tar.gz
    $ cd mecab-ipadic-2.7.0-20070****
    $ ./configure --with-charset="utf-8"
    # ここでエラーが出る場合は PATH を通してみてください
    # 以下の一行を実行します.
    $ export PATH=/usr/local/bin:PATH
    $ make
    $ sudo make install
    # 今後のために PATH を追加しておくとよいでしょう
    $ echo $PATH
    # を実行して表示された内容に /usr/local/bin が含まれていない場合は
    # ホームディレクトリに戻って
    $ cd
    # 次のコマンドを実行しておきます.
    $ echo '/usr/local/bin:$PATH' >> .profile
    # $ echo '/usr/local/bin:$PATH' >> .bash_profile # ここで引用符はシングルコーテーションです
  5. 次に R を起動します.なおR-2.ではアプリケーションフォルダにはRが2種類あります. R64 を起動してください.R-3.0.0はRアイコンは一つだけですので,Rを起動します.
  1. 以下のように入力してEnterキーを押してインストールして下さい.
     install.packages ("RMeCab", repos = "http://rmecab.jp/R")
    1. あるいはhttp://web.ias.tokushima-u.ac.jp/linguistik/mlion.htmlから RMeCab_0.9***.tar.gzをダウンロードしてください. メニューから [パッケージとデータ]→[パッケージインストーラ]を選びます.一番上のCRANと表示されているメニューを[このコンピューター上のバイナリパッケージ]に変更します.右下の installボタンを押して,ダウンロードした RMeCab_***.tgzを選びます.*** の部分はバージョン番号です.
      1. Rのコンソールには
         [引数libが欠けています]
        という警告メッセージが出ますが、これは異常ではありません。これでインストールは完了です
    2. インストールする権限がないといわれた場合は,自分のホームに例えば RLibs などというフォルダを新規作成します。そして,やはりホームに .Renvironというファイルを作成し,中身を次のように編集してください.
      R_LIBS=/Users/ishida/Rlibs
      ishida の部分は terminal 画面の $ マークの前に表示されているログイン名に変えてください.terminal上では以下のようにしても作成できます.
      $ echo 'R_LIBS=/Users/ishida/Rlibs' > .Renviron
      $ cat .Renviron
    3. その上で,Rを起動しなおして,再びRMeCab_***.tgz パッケージをインストールする手続きを行い、ファイルを選ぶ前に ウィンドウ下の [ユーザーエリア] にチェックを入れておきます.
  2. これで準備は完了です.さっそくRMeCab機能?を試してみてください.なお試用データセットを用意しました.

_ Linux 版バイナリ & ソース のインストール方法

UbuntuであればRはレポジトリからインストールしても構いません. ただしUbuntuレポジトリのMeCab?はバージョンが古いので使わないで下さい.

$  sudo echo "deb http://cran.ism.ac.jp/bin/linux/ubuntu ???/ " >> /etc/apt/sources.list  #???をUbuntuのバージョンに合わせて修正
# 詳細は http://cran.ism.ac.jp/bin/linux/ubuntu/README.html
$ sudo apt-key adv --keyserver keyserver.ubuntu.com --recv-keys 51716619E084DAB9
$ sudo apt-get update
$ sudo apt-get install r-base
$ sudo apt-get install r-base-dev

R をソースからインストールする場合は,以下の手順に従って下さい(--enable-R-shlib オプションを付けてconfigureしてください)

sudo apt-get install build-essential gfortran xorg-dev
sudo apt-get install libreadline-dev libcairo-dev
tar zxf R-2.15.0.tar.gz
cd R-2.15.0
./configure --enable-R-shlib 
make
sudo make install

まずMeCabをインストールします.手順は Mac 版の場合と同じです. UbuntuレポジトリのMeCab?はバージョンが古いので使わないで下さい.

http://code.google.com/p/mecab/downloads/list からソース版 mecab-0.994.tar.gzを取得します.

同じくhttp://code.google.com/p/mecab/downloads/list から 辞書mecab-ipadic-2.7.0-20070801.tar.gz http://code.google.com/p/mecab/downloads/detail?name=mecab-ipadic-2.7.0-20070801.tar.gz もダウンロードしてください.バージョンを表す数字は適当に読み替えてください.

  1. terminalを起動して,ダウンロードしたフォルダに移動します.仮にこれを Downloads フォルダとします.
    $ cd Downloads
    $ tar zxvf mecab-0.994.tar.gz
    $ cd mecab-0.994
    $ ./configure --with-charset="utf8"
    $ make
    # もしも Symbol _libconv 関連のエラーが出た場合は
    #    $ make clean
    #    $  ./configure --with-charset="utf8" LDFLAGS="-liconv"
    #    $ make
    #    とやり直して下さい
    
    $ sudo make install
    $ sudo ldconfig ## Linux ではこれが必要
    1. もしも sudo make install を実行すると make Error , Permission denied などと表示される場合は次のようにしてください.
      $ chmod 700 install-sh
      $ sudo make install
  2. 辞書もインストールします
    $ tar zxf mecab-ipadic-2.7.0-20070****.tar.gz
    $ cd mecab-ipadic-2.7.0-20070****
    $ ./configure --with-charset="utf-8"
    # ここでエラーが出る場合は PATH を通してみてください
    # 以下の一行を実行します.
    $ export PATH=/usr/local/bin:PATH
    $ make
    $ sudo make install
    # 今後のために PATH を追加しておくとよいでしょう
    $ echo $PATH
    # を実行して表示された内容に /usr/local/bin が含まれていない場合は
    # ホームディレクトリに戻って
    $ cd
    # 次のコマンドを実行しておきます.
    $ echo '/usr/local/bin:$PATH' >> .profile

Ubuntu 10.04 (gcc4.4.3) 32 bit

mecab_0.994 or 996 + R-3.0.1 で利用

  1. Rを起動して,以下のように入力してEnterキーを押してインストールして下さい.
     install.packages ("RMeCab", repos = "http://rmecab.jp/R")
    1. あるいは http://web.ias.tokushima-u.ac.jp/linguistik/u32.html から RMeCab_0.9***.tar.gzをダウンロードしてください.
> getwd() # ダウンロードしたフォルダで
[1] "/home/ishida/Downloads"
> dir()
[1] "RMeCab_0.995_R_i686-pc-linux-gnu.tar.gz" 
># インストールを実行する                             
> install.packages ("RMeCab_0.995_R_i686-pc-linux-gnu.tar.gz", repos = NULL)
># あるいは install.packages ("R/home/ishida/Downloads/MeCab_0.995_R_i686-pc-linux-gnu.tar.gz")
パッケージを ‘/home/ishida/R/i686-pc-linux-gnu-library/2.15’ 中にインストールします 
(‘lib’ が指定されていないので) 
 *binary* package ‘RMeCab’ ...

* DONE (RMeCab)
  • 少し枯れた Linux 用 RMeCab? --- gcc4.3.3 と (自力コンパイルされた)mecab-0.993 との組み合わせ: &ref(): File not found: "RMeCab_0.9905_R_i686-pc-linux-gnu.tar.gz" at page "SoftArchive"; for R-2.15.0
  • さらに枯れた RMeCab_0.9906 CentOS 5 + gcc 4.1.2 で作成

R-2.15.0 +mecab_0.994 on CentOS 5.6 + gcc 4.1.2

http://web.ias.tokushima-u.ac.jp/linguistik/c32.html からダウンロードしてください

Ubuntu 10.04 (gcc4.4.3) 64 bit

mecab_0.994 or 996 + R-3.0.1 で利用する場合

  1. Rを起動して,以下のように入力してEnterキーを押してインストールして下さい.
     install.packages ("RMeCab", repos = "http://rmecab.jp/R")
  2. あるいは http://web.ias.tokushima-u.ac.jp/linguistik/u64.html から RMeCab_0.9***.tar.gzをダウンロードしてください.
  • さらに枯れた RMeCab_0.9906 CentOS 5 + gcc 4.1.2 で作成

R-2.15.0 + mecab_0.994 on CentOS 5.6 + gcc 4.1.2

http://web.ias.tokushima-u.ac.jp/linguistik/c64.html からダウンロードしてください

  1. 和布蕪他インストールの最初を参考にしてください.
  2. Mac版とほぼ同じ方法でまずMeCab本体をインストールしてください.次に以下のコマンドでRにインストールします.getwd()関数で表示されたディレクトリにRMeCab_0.**.tar.gz があるとします. 実際は一行で入力してください.
 install.packages("RMeCab_0.**.tar.gz",
                           destdir=".",   repos = NULL)

RMeCab_0.**.tar.gzの開発環境の文字コードは UTF-8 でした.なおご利用は自己責任でお願いします.

_ RMeCab?の機能説明は別ページにしました.

_ 試用データセット (2009年11月25日修正)

filedata.zip(Windowsの方、Shift-Jis) : filedata.tar.gz (MacおよびUnixユーザーの方, utf-8 ファイル):

解凍後,中に含まれる data フォルダをドライブの先頭にコピーして,RMeCab?.R ファイル内のコードを実行します.詳しくはフォルダ内の README_RMeCab?.txt を読んでください.

_ RMeCabで辞書を指定

_ バージョン履歴:問い合わせ先

_ Mac/Linuxで library(RMeCab?)でロードに失敗する場合

以下をコンソールで実行して再インストールしてください.

install.packages ("RMeCab", repos = "http://rmecab.jp/R", type = "source")
  • お問い合わせはメールをください.関数の追加についても,気楽にご相談ください.

石田基広

ishida-m(この部分を"@"に変更下さい)ias.tokushima-u.ac.jp

_ R の参考書

  • R のレファレンスです.
  • 初心者向けにRをいちから解説した入門書です.
  • 中級者になるために.
  • 解析をばりばり行うために.
  • データをばりばり処理するために.
  • R のプログラミングテクニックを学ぶために.
  • R での解析手法に慣れるために.
  • とにかく R を使ってみたい.
  • 統計学と R を同時に学びたい.