管理人 について : 参考ページ 統計的言語処理: 旧バージョン保管庫 SoftArchive
RMeCabパッケージ
R は ここ から,自分のOSにあったファイルをダウンロードしてください.例えばWindows版なら,[Windows]->[base]とクリックし,R-2.*.*-win.exeをダウンロードします.後はダブルクリックを繰り返せばインストールできます.なお、Windows版の場合は起動直後に日本語の設定をしてください。メニューの [編集]->[GUIプリファレンス]->[Font] で MS Gothic を選び [save] を押して、保存先はデフォルトそのままにマイドキュメントに保存します。その後は [OK] を押して操作を続行します。なおRを終了させる際、[workspace(作業情報)を保存しますか] と聞いてきますが, No を選んでおきましょう。
install.packages ("RMeCab", repos = "http://rmecab.jp/R")
install.packages ("RMeCab", repos = "http://rmecab.jp/R")
http://web.ias.tokushima-u.ac.jp/linguistik/mlion.html からダウンロードしてください
install.packages ("RMeCab", repos = "http://rmecab.jp/R")
http://code.google.com/p/mecab/downloads/list から mecab_0.996.exe をダウンロードしてインストールします.
インストール先は標準設定のまま C:\Program Files\MeCab あるいは C:\Program Files(x86)\MeCab とします.また文字コードは Shit-Jis のままとします.
install.packages ("RMeCab", repos = "http://rmecab.jp/R")
sudo port install mecab mecab-ipadic-utf8
$ cd Downloads $ tar zxvf mecab-0.996.tar.gz # # # $ tar zxvf mecab-0.98.tar.gz # RMeCab0.98 を使う場合 $ cd mecab-0.996 $ ./configure --with-charset="utf8" $ make # もしも Symbol _libconv 関連のエラーが出た場合は # $ make clean # $ ./configure --with-charset="utf8" LDFLAGS="-liconv" # $ make # とやり直して下さい $ sudo make install # $ sudo ldconfig ## Linux ではこれが必要
$ chmod 700 install-sh $ sudo make install
$ tar zxf mecab-ipadic-2.7.0-20070****.tar.gz $ cd mecab-ipadic-2.7.0-20070**** $ ./configure --with-charset="utf-8" # # ここでエラーが出る場合は PATH を通してみてください # # 以下の一行を実行します. # # $ export PATH=/usr/local/bin:PATH $ make $ sudo make install # 試してみる $ mecab すもももももももものうち すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ も 助詞,係助詞,*,*,*,*,も,モ,モ もも 名詞,一般,*,*,*,*,もも,モモ,モモ も 助詞,係助詞,*,*,*,*,も,モ,モ もも 名詞,一般,*,*,*,*,もも,モモ,モモ の 助詞,連体化,*,*,*,*,の,ノ,ノ うち 名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ EOS CtrlキーとC キーの同時押しで終了 # 万が一 mecabが無いと言われた場合はPATHを通す # $ echo $PATH # # を実行して表示された内容に /usr/local/bin が含まれていない場合は # # ホームディレクトリに戻って # $ cd # # 次のコマンドを実行しておきます. # # echo export PATH='/usr/local/bin:$PATH' >> ~/.profile
開発環境の文字コードは UTF-8 でした. ご利用は自己責任でお願いします.
$ sudo echo "deb http://cran.ism.ac.jp/bin/linux/ubuntu ???/ " >> /etc/apt/sources.list #???をUbuntuのバージョンに合わせて修正 # 詳細は http://cran.ism.ac.jp/bin/linux/ubuntu/README.html $ sudo apt-key adv --keyserver keyserver.ubuntu.com --recv-keys 51716619E084DAB9 $ sudo apt-get update $ sudo apt-get install r-base $ sudo apt-get install r-base-dev
sudo apt-get install build-essential gfortran xorg-dev sudo apt-get install libreadline-dev libcairo-dev tar zxf R-2.15.0.tar.gz cd R-2.15.0 ./configure --enable-R-shlib make sudo make install
sudo apt-get install mecab libmecab-dev sudo apt-get install mecab-ipadic-utf8
$ cd Downloads $ tar zxvf mecab-0.996.tar.gz $ cd mecab-0.996 $ ./configure --with-charset="utf8" $ make # もしも Symbol _libconv 関連のエラーが出た場合は # $ make clean # $ ./configure --with-charset="utf8" LDFLAGS="-liconv" # $ make # とやり直して下さい $ sudo make install $ sudo ldconfig ## Linux ではこれが必要
$ chmod 700 install-sh $ sudo make install
$ tar zxf mecab-ipadic-2.7.0-20070****.tar.gz $ cd mecab-ipadic-2.7.0-20070**** $ ./configure --with-charset="utf-8" # ここでエラーが出る場合は PATH を通してみてください # 以下の一行を実行します. $ export PATH=/usr/local/bin:PATH $ make $ sudo make install # 今後のために PATH を追加しておくとよいでしょう $ echo $PATH # を実行して表示された内容に /usr/local/bin が含まれていない場合は # ホームディレクトリに戻って $ cd # 次のコマンドを実行しておきます. $ echo '/usr/local/bin:$PATH' >> .profile
install.packages ("RMeCab", repos = "http://rmecab.jp/R")
data.zip(Windowsの方、Shift-Jis) : data.tar.gz (MacおよびUnixユーザーの方, utf-8 ファイル):
解凍後,中に含まれる data フォルダをドライブの先頭にコピーして,RMeCab?.R ファイル内のコードを実行します.詳しくはフォルダ内の README_RMeCab?.txt を読んでください.
ここ を参照してください。
以下をコンソールで実行して再インストールしてください.
install.packages ("RMeCab", repos = "http://rmecab.jp/R", type = "source")
# # その1 tmp <- textConnection("tmp", "w") writeLines ("国境の長いトンネルを抜けると雪国であった。夜の底が白くなった。信号所に汽車が止まった。向側の座席から娘が立って来て、島村の前のガラス窓を落とした。雪の冷気が流れ込んだ。",con = tmp) textConnectionValue(tmp) readLines(tmp) library(RMeCab) RMeCabC(tmp) RMeCabFreq(tmp) close(tmp) # # その2 dummy <- c ("私は真面目な学生です。", "彼女は数学専攻の学生です。", "彼らは物理学を専攻している。") tmpdir <- tempdir () for (i in seq(dummy) ){ td <- tempfile("tmp", tmpdir = tmpdir) write( dummy [i] , file = td) if (file.exists (td)) cat( td, "exists", "\n") } library (RMeCab) x <- docMatrix (tmpdir) x
石田基広
ishida-m(この部分を"@"に変更下さい)ias.tokushima-u.ac.jp
テキストマイニングのためのツール: データ解析・グラフィックス環境 R から日本語形態素解析ソフト和布蕪(MeCab)を呼び出して使うインターフェイス