* 基本 [#abd5144a] R と MeCab の両方が既にインストールされているのならば R を起動し、コンソールで以下を実行すれば[[RMeCab]]パッケージのインストールは完了です。 install.packages("RMeCab", repos = "http://rmecab.jp/R") 実行できるか、以下を試してみましょう。 library(RMeCab) res <- RMeCabC("すもももももももものうち") unlist (res) 次のように表示されれば、インストールは成功しています。 > unlist (res) 名詞 助詞 名詞 助詞 名詞 助詞 名詞 "すもも" "も" "もも" "も" "もも" "の" "うち" ''以上''です。 MeCabのインストールから始めたいという方は、以下、自身のOSに対応したセクションの解説を参照してください。http://sites.google.com/site/rmecab/ でも説明しています(内容はこのページと同じです)。 * 『Rで学ぶテキストマイニング』データセット(2016年09月15日修正) [#a3937e84] - Windows用 Shif-Jis コード: https://github.com/IshidaMotohiro/data_sjis - Mac / Linux 用 UTF8 コード: https://github.com/IshidaMotohiro/data_utf8 ダウンロードし、解凍後、data_sjis/utf-8-master というフォルダを data という名前に変更してお使いください #ref(data.png,left,nowrap,80%) //- Windows用 Shif-Jis コード: http://web.ias.tokushima-u.ac.jp/linguistik/RMeCab/data.zip //- Mac / Linux 用 UTF8 コード: http://web.ias.tokushima-u.ac.jp/linguistik/RMeCab/data.tar.gz * RMeCabの機能説明は別ページにしました. [#sb463611] - [[RMeCab機能>RMeCabFunctions]] --------------- &htmlinsert(amazon,transitional,"asins=486354216X");&htmlinsert(amazon,transitional,"asins=432012393X"); &htmlinsert(amazon,transitional,"asins=4797382309");&htmlinsert(amazon,transitional,"asins=4320123735"); &htmlinsert(amazon,transitional,"asins=432011082X");&htmlinsert(amazon,transitional,"asins=432011048X"); &htmlinsert(amazon,transitional,"asins=4627848412");&htmlinsert(amazon,transitional,"asins=4863542011"); &htmlinsert(amazon,transitional,"asins=486354135X");&htmlinsert(amazon,transitional,"asins=4320110293"); &htmlinsert(amazon,transitional,"asins=4621061313");&htmlinsert(amazon,transitional,"asins=4621062204"); &htmlinsert(amazon,transitional,"asins=4621061364");&htmlinsert(amazon,transitional,"asins=4621061542"); &htmlinsert(amazon,transitional,"asins=462106164X");&htmlinsert(amazon,transitional,"asins=4621061550"); &htmlinsert(amazon,transitional,"asins=4621061399");&htmlinsert(amazon,transitional,"asins=4621061534"); &htmlinsert(amazon,transitional,"asins=4621061356");&htmlinsert(amazon,transitional,"asins=4621065270"); &htmlinsert(amazon,transitional,"asins=489476654X");&htmlinsert(amazon,transitional,"asins=4320110331"); [[管理人>admin]] について : 参考ページ [[統計的言語処理]]: 旧バージョン保管庫 [[SoftArchive]] // : 係り受け解析パッケージ [[RCaBoCha]] //- [[R2MeCab]] は [[RMeCab]] の簡易版です -- [[RMeCab]] を使った[[twitter解析の記事:http://www.atmarkit.co.jp/fcoding/articles/stat/05/stat05b.html]] - [[RMeCab機能>RMeCabFunctions]] - [[各種解析のヒント>RMeCab_Tips]] ---------- &size(20){&color(blue){[[RMeCab]]パッケージ};}; #ref(RealMecab.png,center,nowrap,60%,"和布蕪ってのはこれ")和布蕪ってのはこれ // RIGHT:[[RMeCab]]パッケージは http://sites.google.com/site/rmecab/ にも置いてあります。 // 旧バージョンは http://groups.google.co.jp/group/rmecab にあります. //テキストマイニングのためのツール: データ解析・グラフィックス環境 &size(18){[[R:http://cran.md.tsukuba.ac.jp/]]}; から日本語形態素解析ソフト''&color(blue){和布蕪};([[MeCab:http://mecab.sourceforge.net/]])''を呼び出して使うインターフェイス //- ''&color(green){テキストマイニング入門};'':[[RMeCab]]を利用したテキストマイニングについては //&htmlinsert(amazontext,asin=4627848412,text=『Rによるテキストマイニング入門』森北出版); //を参照いただければ幸いです. //#htmlinsert(amazon,transitional,"asins=4627848412") //-- &htmlinsert(amazontext,asin=4863540930,text=『R言語逆引きハンドブック』シーアンドアール研究所); R のレファレンスです. //#htmlinsert(amazon,transitional,"asins=4863540930") //-- &htmlinsert(amazontext,asin=4320110293,text=『Rで学ぶデータ・プログラミング入門 ―RStudioを活用する―』共立出版); 初心者向けにRをいちから解説した入門書です. //--- [[出版社のサイト:http://www.kyoritsu-pub.co.jp/kenpon/bookDetail/9784320110298]] //#htmlinsert(amazon,transitional,"asins=4320110293") - &color(green){2017 年 04 月 24 日 RMeCab_0.99997 for R-3.4.0 公開}; docMatrixDF()関数(データフレームのテキスト列から文書単語行列を生成の出力で、列名を OBS からROW に変更。各列は、もとのデータフレームの行(回答者)に対応する - &color(green){2016 年 12 月 27 日 RMeCab_0.99995 for R-3.3.2 公開}; - &color(green){2016 年 05 月 06 日 RMeCab_0.99994 for R-3.3.0 公開}; - &color(green){2015 年 12 月 18 日 RMeCab_0.99993 for R-3.2.3 公開}; リファクタリングを予定しているため、ソースを整理しました - &color(green){2015 年 12 月 11 日 RMeCab_0.99992 for R-3.2.3 公開}; Windows版で、解析対象とするファイルの名前がアスキー文字列でない(つまりファイル名が日本語の)場合に、一部の関数がファイルの存在を認識しないことを修正 - &color(green){2015 年 04 月 17 日 RMeCab_0.9999 for R-3.2.0 公開}; ユーザーのmecabrcファイルを指定する際、パスにチルダが含まれているとRごと落ちることを修正 - &color(green){2014 年 03 月 10 日 RMeCab_0.9995 for R-3.0.3 公開}; Mac/Maverick & Homebrew版Rに対応 - &color(green){2013 年 12 月 17 日 RMeCab_0.9994 for R-3.0.2 公開}; メモリ空間を拡張 - 旧バージョン保管庫 [[SoftArchive]] #contents &size(18){[[R:http://cran.md.tsukuba.ac.jp/]]}; は [[ここ:http://cran.ism.ac.jp/]] から,自分のOSにあったファイルをダウンロードしてください.例えばWindows版なら,''[Windows]->[base]''とクリックし,''R-3.*.*-win.exe''をダウンロードします.後はダブルクリックを繰り返せばインストールできます. - グラフで日本語を正しく表示させるために設定ファイルを用意します。以下をR のコンソールで実行すると、ホームフォルダに .Rprofile というファイルが作成されます。以降、は起動時にこのファイル内部の設定を読み込むので、グラフなどで日本語が正しく表示されます。 source ("http://rmecab.jp/R/Rprofile.R") # この設定は次回の起動から有効になりますので、いったんRないしRStudioを終了させます なおRを終了させる際、[workspace(作業情報)を保存しますか] と聞いてきますが, No を選んでおきましょう。 // ***************** // // -試用データセット&ref(SoftArchive/data.zip); (Windows), &ref(SoftArchive/data.tar.gz); (Mac, Unix) // ************************************************** Windows **********************************************// * &color(green){&size(20){Windows 版 RMeCab (32/64 bit) インストール手順};}; [#f952c9af] http://code.google.com/p/mecab/downloads/list から &color(red){mecab_0.996.exe}; をダウンロードしてインストールします. インストール先は標準設定のままとします( ''[[C:\Program Files\MeCab]]'' あるいは ''[[C:\Program Files(x86)\MeCab]]'' となっているはずです) .また文字コードは Shit-Jis のままとします. + Rを起動して,以下のように入力してEnterキーを押してインストールして下さい.別にMeCabがインストールされていれば、これで完了です。 install.packages ("RMeCab", repos = "http://rmecab.jp/R") //++ あるいは http://web.ias.tokushima-u.ac.jp/linguistik/win.html から RMeCab_0.9***.zipをダウンロードしてください. //+++ 次にダウンロードした ''&color(blue){RMeCab_***.zip};''をR 32 bit あるいは R 64 bit のいずれかで 1 回インストールします.どちらでも使えるようになります.*** の部分はバージョン番号です. //+++ R 32 bit あるいは R 64 bit のいずれかで 1 回インストールします.どちらでも使えるようになります. //Rのメインメニューから[パッケージ]→[ローカルにあるzipファイルからのパッケージのインストール]を選んで,ダウンロードした RMeCab_***.zipファイルを選んでインストールします.[win-libraryを作成したいのですか] と聞いてきた時は OK を押してください(この際,R はユーザーフォルダを作成します). ''以上でインストールは完了です''. ++ バイナリファイルをダウンロートしたい方は http://web.ias.tokushima-u.ac.jp/linguistik/win.htmlからどうぞ。 *[[Windows版RMeCab_0.88までのインストール方法>WindowsRMeCab_0.88]] [#ifa3639e] //*************************************** Mac ******************************************************// * &color(blue){&size(18){Mac OS X 版バイナリ};}; のインストール方法[#xeec6040] +MeCabのインストール ++ プログラムのソースをダウンロードしてインストールします。以下 a か b いずれかの方法でインストールしてください(ただし b を推奨します)。 +++ Hombrewでインストール (homebrew http://brew.sh/index_ja.html はマックで一般的に使われているパッケージ管理システムです。別途インストールが必要です) brew install mecab brew install mecab-ipadic 以上です +++ ''&color(red){[[MeCab:http://taku910.github.io/mecab/]]};''ソースからのインストール(可能であれば、この方法でインストールしてください)。 まず開発環境をインストールしておく必要があります.「アプリケーション」の「ユーティリティー」フォルダにあるターミナルを起動します。以下のよう入力してEnterを押します。 xcode-select --install #ref(xcode_c.png,left,nowrap,80%) Xcodeを入手する必要はありません。コマンドラインツールだけをインストールします。ライセンスに同意すると、インストールが開始します。 //AppStore から Xcode をインストールして下さい.Xcode で検索をかければ直ぐに出てきます.無料です. //続いてコマンドラインツールという追加機能をインストールします。時期によってインストール方法が違うので、Googleなどで検索してください。(アプリケーションフォルダにあるユーティリティーからターミナルを起動し gcc と入力してEnterを押してみてください。コマンドラインツールがインストールされていなればダイアログが出現します。インストールされていれば、no input file とエラーが出ます。) //--- 注意: El CapitanではMeCabのインストール先として想定されている /usr フォルダへの書き込みが制限されてしまいました。MeCabをインストールするには書き込み権限を付与する必要があります。まずターミナルを起動して /usr/local ディレクトリが存在することを確認します。 // ls -la /usr/local //ここで万が一、存在していない(エラーが出る)場合は、「"el capitan" "/usr/local" が存在しない場合」をグーグルで検索してみてください。存在していれば、以下のコマンドを実行して書き込み権限を与える(エンターを押すと管理者としてのパスワード入力が求められます)。 // sudo chown $(whoami):admin /usr/local && sudo chown -R $(whoami):admin /usr/local ''&color(red){[[MeCab:http://mecab.sourceforge.net/]]};''をインストールします. http://code.google.com/p/mecab/downloads/list からソース版&color(red){mecab_0.996.tar.gz}; を取得します. /// Controlキーを押しながらクリックするとメニューがでるので、[名前を付けて保存] を選びます。ファイル名はそのまま、[ファイルの種類] を [すべて] にして、保存します(このようにしないと勝手にMacでは解凍されます)。 #ref(macdownload.png,center,nowrap,60%,"和布蕪ってのはこれ") 続いて辞書mecab-ipadic-2.7.0-20070801.tar.gz もダウンロードしてください(naist辞書を使うこともできます、このページ下を参照してください). /// Controlキーを押しながらクリックするとメニューがでるので、[名前を付けて保存] を選びます。ファイル名はそのまま、[ファイルの種類] を [すべて] にして、保存します(このようにしないと勝手にMacでは解凍されます)。バージョンを表す数字は適当に読み替えてください. terminalを起動して,ダウンロードしたフォルダに移動します.仮にこれを Downloads フォルダとします. /// # 右の命令でダウンロードすることもできます curl -OL http://mecab.googlecode.com/files/mecab-0.996.tar.gz /// # 右の命令でダウンロードすることもできます curl -OL http://mecab.googlecode.com/files/mecab-ipadic-2.7.0-20070801.tar.gz $ cd Downloads $ tar zxvf mecab-0.996.tar.gz # $ cd mecab-0.996 $ ./configure --with-charset="utf8" $ make # もしも Symbol _libconv 関連のエラーが出た場合は # $ make clean # $ ./configure --with-charset="utf8" LDFLAGS="-liconv" # $ make # とやり直して下さい $ sudo make install ## もしも sudo make install を実行すると make Error , Permission denied などと表示される場合は次のようにしてください. ## $ chmod 700 install-sh ## $ sudo make install 辞書もインストールします $ cd ~/Downloads $ tar zxf mecab-ipadic-2.7.0-20070****.tar.gz $ cd mecab-ipadic-2.7.0-20070**** $ ./configure --with-charset="utf-8" # # ここでエラーが出る場合は PATH を通してみてください # # 以下の一行を実行します. # # $ export PATH=/usr/local/bin:PATH $ make $ sudo make install # 試してみる $ mecab すもももももももものうち すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ も 助詞,係助詞,*,*,*,*,も,モ,モ もも 名詞,一般,*,*,*,*,もも,モモ,モモ も 助詞,係助詞,*,*,*,*,も,モ,モ もも 名詞,一般,*,*,*,*,もも,モモ,モモ の 助詞,連体化,*,*,*,*,の,ノ,ノ うち 名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ EOS CtrlキーとC キーの同時押しで終了 # 万が一 mecabが無いと言われた場合はPATHを通す # $ echo $PATH # # を実行して表示された内容に /usr/local/bin が含まれていない場合は # # ホームディレクトリに戻って # $ cd # # 次のコマンドを実行しておきます. # # echo export PATH='/usr/local/bin:$PATH' >> ~/.profile /// + 次に R を起動します.なおR-2.ではアプリケーションフォルダにはRが2種類あります. R64 を起動してください.R-3.0.0以降のバージョンではRアイコンは一つだけですので,Rを起動します. ++ 以下のように入力してEnterキーを押してインストールして下さい.MeCabがインストールされていれば、これで完了です。 install.packages ("RMeCab", repos = "http://rmecab.jp/R") ''以上でインストールは完了です''. +++ バイナリファイルをダウンロードしたい場合[[for Mavericks:http://web.ias.tokushima-u.ac.jp/linguistik/maverick.html]]あるいは[[for Mountain Lion:http://web.ias.tokushima-u.ac.jp/linguistik/mlion.html]]からもダウンロードできます。 // ************************************************** Linux **********************************************// * &color(blue){&size(18){ Linux 版};}; のインストール方法[#n6c9a6e0] +Rのインストール 以下の(1-1)か(1-2)のいずれかの手順でインストールします。 ++ (1-1)レポジトリからRをインストール $ sudo echo "deb http://cran.ism.ac.jp/bin/linux/ubuntu ???/ " >> /etc/apt/sources.list #???をUbuntuのバージョンに合わせて修正 # 詳細は http://cran.ism.ac.jp/bin/linux/ubuntu/README.html $ sudo apt-key adv --keyserver keyserver.ubuntu.com --recv-keys 51716619E084DAB9 $ sudo apt-get update $ sudo apt-get install r-base $ sudo apt-get install r-base-dev ++ (1-2) あるいはR をソースからインストールする。以下の手順に従って下さい(--enable-R-shlib オプションを付けてconfigureしてください) sudo apt-get install build-essential gfortran xorg-dev sudo apt-get install libreadline-dev libcairo-dev tar zxf R-3.2.2.tar.gz cd R-3.2.2 ./configure --enable-R-shlib make sudo make install + ''&color(red){[[MeCab:http://mecab.sourceforge.net/]]};''をUbuntuレポジトリからか、あるいはソースからインストールしてください。 ++ (1-1)レポジトリからMeCabをインストール sudo apt install build-essential mecab libmecab-dev mecab-ipadic mecab-ipadic-utf8 ++ ソースからMeCabをインストール http://code.google.com/p/mecab/downloads/list からソース版 mecab-0.996.tar.gzを取得します. 同じくhttp://code.google.com/p/mecab/downloads/list から 辞書mecab-ipadic-2.7.0-20070801.tar.gz http://code.google.com/p/mecab/downloads/detail?name=mecab-ipadic-2.7.0-20070801.tar.gz もダウンロードしてください(naist辞書を使うこともできます、このページ下を参照してください).バージョンを表す数字は適当に読み替えてください. +++ terminalを起動して,ダウンロードしたフォルダに移動します.仮にこれを Downloads フォルダとします. $ cd Downloads $ tar zxvf mecab-0.996.tar.gz $ cd mecab-0.996 $ ./configure --with-charset="utf8" $ make # もしも Symbol _libconv 関連のエラーが出た場合は # $ make clean # $ ./configure --with-charset="utf8" LDFLAGS="-liconv" # $ make # とやり直して下さい $ sudo make install $ sudo ldconfig ## Linux ではこれが必要 +++もしも sudo make install を実行すると make Error , Permission denied などと表示される場合は次のようにしてください. $ chmod 700 install-sh $ sudo make install +++辞書もインストールします $ tar zxf mecab-ipadic-2.7.0-20070****.tar.gz $ cd mecab-ipadic-2.7.0-20070**** $ ./configure --with-charset="utf-8" # ここでエラーが出る場合は PATH を通してみてください # 以下の一行を実行します. $ export PATH=/usr/local/bin:PATH $ make $ sudo make install # 今後のために PATH を追加しておくとよいでしょう $ echo $PATH # を実行して表示された内容に /usr/local/bin が含まれていない場合は # ホームディレクトリに戻って $ cd # 次のコマンドを実行しておきます. $ echo '/usr/local/bin:$PATH' >> .profile + RMeCabのインストール ++ Rを起動して,以下のように入力してEnterキーを押してインストールして下さい.これで完了です。 install.packages ("RMeCab", repos = "http://rmecab.jp/R") # install.packages ("RMeCab", repos = "http://rmecab.jp/R", type = "source") # mecab を apt install コマンドでインストールした場合 ''以上でインストールは完了です''. +++ バイナリファイルは[[for 32 bit:http://web.ias.tokushima-u.ac.jp/linguistik/u32.html]] あるいは [[for 64 bit:http://web.ias.tokushima-u.ac.jp/linguistik/u64.html]] でダウンロードできます。 &aname(data); // * 試用データセット (2009年11月25日修正) [#ca5cdc89] * 『Rで学ぶテキストマイニング』データセット(2015年12月17日修正) [#a3937e84] - Windows用 Shif-Jis コード: http://web.ias.tokushima-u.ac.jp/linguistik/RMeCab/data.zip - Mac / Linux 用 UTF8 コード: http://web.ias.tokushima-u.ac.jp/linguistik/RMeCab/data.tar.gz // &ref(SoftArchive/data.zip);(Windowsの方、Shift-Jis) : &ref(SoftArchive/data.tar.gz); (MacおよびUnixユーザーの方, utf-8 ファイル): 解凍後,中に含まれる data フォルダをドライブの先頭にコピーして,''RMeCab.R'' ファイル内のコードを実行します.詳しくはフォルダ内の ''README_RMeCab.txt'' を読んでください. * [[RMeCabで辞書を指定>MeCab_Dictionary]] [#teb7708a] * naist-jdicを使う [#s03807b1] [[ここ:https://sites.google.com/site/rmecab/home/naist-jdicwo-shiu]] を参照してください。 //&aname(Q); //* バージョン履歴:問い合わせ先 [#j507d1f4] * UniDic を使う [#ha41b197] [[ここ:https://sites.google.com/site/rmecab/home/unidic]] を参照してください。 &aname(type); * Mac/Linuxで library(RMeCab)でロードに失敗する場合 [#e65e48c6] 以下をコンソールで実行して再インストールしてください. install.packages ("RMeCab", repos = "http://rmecab.jp/R", type = "source") ** ソースファイルは以下に置いています。 [#gba7ac23] // https://bitbucket.org/motohiro_ishida/rmecab https://github.com/IshidaMotohiro/RMeCab * FAQ [#u90e70b9] - Q) RMeCabの諸関数にファイルではなく、文字列を渡したい - A) 以下のようにしてください。 # # その1 tmp <- textConnection("kawabata", "w") writeLines ("国境の長いトンネルを抜けると雪国であった。夜の底が白くなった。信号所に汽車が止まった。向側の座席から娘が立って来て、島村の前のガラス窓を落とした。雪の冷気が流れ込んだ。",con = tmp) textConnectionValue(tmp) readLines(tmp) library(RMeCab) RMeCabC(tmp) RMeCabFreq(tmp) close(tmp) # # その2 dummy <- c ("私は真面目な学生です。", "彼女は数学専攻の学生です。", "彼らは物理学を専攻している。") tmpdir <- tempdir () for (i in seq(dummy) ){ td <- tempfile("tmp", tmpdir = tmpdir) write( dummy [i] , file = td) if (file.exists (td)) cat( td, "exists", "\n") } library (RMeCab) x <- docMatrix (tmpdir) x - お問い合わせはメールをください.関数の追加についても,気楽にご相談ください. 石田基広 ishida-m(この部分を"@"に変更下さい)ias.tokushima-u.ac.jp * R の参考書 [#s358f06f] テキストマイニングのためのツール: データ解析・グラフィックス環境 &size(18){[[R:http://cran.md.tsukuba.ac.jp/]]}; から日本語形態素解析ソフト''&color(blue){和布蕪};([[MeCab:http://mecab.sourceforge.net/]])''を呼び出して使うインターフェイス - ''&color(green){テキストマイニング入門};'':[[RMeCab]]を利用したテキストマイニングについては &htmlinsert(amazontext,asin=4627848412,text=『Rによるテキストマイニング入門』森北出版); を参照いただければ幸いです. #htmlinsert(amazon,transitional,"asins=4627848412") -- &htmlinsert(amazontext,asin=4863540930,text=『R言語逆引きハンドブック』シーアンドアール研究所); R のレファレンスです. #htmlinsert(amazon,transitional,"asins=4863540930") -- &htmlinsert(amazontext,asin=4320110293,text=『Rで学ぶデータ・プログラミング入門 ―RStudioを活用する―』共立出版); 初心者向けにRをいちから解説した入門書です. --- [[出版社のサイト:http://www.kyoritsu-pub.co.jp/kenpon/bookDetail/9784320110298]] #htmlinsert(amazon,transitional,"asins=4320110293") -&htmlinsert(amazontext,asin=4863540930,text=『R言語逆引きハンドブック』シーアンドアール研究所); R のレファレンスです. - &htmlinsert(amazontext,asin=4320110293,text=『Rで学ぶデータ・プログラミング入門 ―RStudioを活用する―』共立出版); 初心者向けにRをいちから解説した入門書です. -&htmlinsert(amazontext,asin=4431712186,text=U・リゲス著『Rの基礎とプログラミング技法』シュプリンガー社); 中級者になるために. -&htmlinsert(amazontext,asin=4431713123,text=B・エヴェリット著『RとS-PLUSによる多変量解析』シュプリンガー社); 解析をばりばり行うために. -&htmlinsert(amazontext,asin=4431100474,text=P・スペクター著『Rデータ自由自在』シュプリンガー社); データをばりばり処理するために. -&htmlinsert(amazontext,asin=4274067572,text=青木繁伸『Rによる統計解析』オーム社); R のプログラミングテクニックを学ぶために. - &htmlinsert(amazontext,asin=4627096011,text=金明哲『Rによるデータサイエンス』森北書店); R での解析手法に慣れるために. - &htmlinsert(amazontext,asin=4777511847,text=舟尾暢男『データ解析環境「R」』工学社); とにかく R を使ってみたい. -&htmlinsert(amazontext,asin=4894717573,text=中澤港『Rによる統計解析の基礎』ピアソンエデュケーション); 統計学と R を同時に学びたい.