#author("2022-11-18T16:58:58+09:00","","") #author("2023-02-02T14:13:30+09:00","","") * 基本 [#abd5144a] - &color(green){2022 年 05 月 02 日 RMeCab_1.10 for R-4.2.0 (64bit・UTF-8のみ対応) 公開}; - &color(green){2022 年 04 月 29 日 RMeCab_1.08 for R-4.2.0 (64bit・UTF-8のみ対応) 公開}; - &color(green){2021 年 11 月 27 日 M1 MacOSX 用の注意を追記}; - &color(green){2021 年 05 月 27 日 RMeCab_1.07 for R-4.1.0 (M1 Mac 用バイナリを追加で作成) 公開}; - &color(green){2021 年 01 月 11 日 RMeCab_1.06 for R-4.0.3 (MacおよびLinuxでは辞書としてneologdを指定できるようになりました) 公開}; R と MeCab (ただしWindowsでは64bit UTF-8辞書版)の両方が既にインストールされているのならば R を起動し、コンソールで以下を実行すれば[[RMeCab]]パッケージのインストールは完了です。 # Windows あるいは Mac の場合 install.packages("RMeCab", repos = "http://rmecab.jp/R") # Linux あるいは、Mac で上記の命令がエラーとなる場合 install.packages("RMeCab", repos = "https://rmecab.jp/R", type = "source") install.packages("RMeCab", repos = "http://rmecab.jp/R", type = "source") # httpsだとエラーになる場合(手もとのマシンのセキュリティアップデートをしてください) あるいは GitHub からインストールもできます。 # Windows で Rtools4 と MeCab をすでにインストールしている場合、あるいはMac あるいは Linux の場合 install.packages("remotes") remotes::install_github("IshidaMotohiro/RMeCab") 実行できるか、以下を試してみましょう。 library(RMeCab) res <- RMeCabC("すもももももももものうち") unlist (res) 次のように表示されれば、インストールは成功しています。(なお、利用辞書にneologdを設定している場合、"すもももももももものうち"全体が一語として表示されます)。 > unlist (res) 名詞 助詞 名詞 助詞 名詞 助詞 名詞 "すもも" "も" "もも" "も" "もも" "の" "うち" MeCabのインストールから始めたいという方は、以下、自身のOSに対応したセクションの解説を参照してください。 // https://sites.google.com/view/rmecab/ http://sites.google.com/site/rmecab/ https://rmecab.jp/new/ でも説明しています(内容はこのページと同じです)。 -- 質問は https://github.com/IshidaMotohiro/RMeCab/issues に Issue として投稿してください * 『Rで学ぶテキストマイニング』データセット(2017年06月30日修正) [#a3937e84] https://github.com/IshidaMotohiro/TextMining //- Windows用 Shif-Jis コード: https://github.com/IshidaMotohiro/data_sjis //- Mac / Linux 用 UTF8 コード: https://github.com/IshidaMotohiro/data_utf8 // //ダウンロードし、解凍後、data_sjis/utf-8-master というフォルダを data という名前に変更してお使いください //#ref(data.png,left,nowrap,80%) //- Windows用 Shif-Jis コード: http://web.ias.tokushima-u.ac.jp/linguistik/RMeCab/data.zip //- Mac / Linux 用 UTF8 コード: http://web.ias.tokushima-u.ac.jp/linguistik/RMeCab/data.tar.gz * RMeCabの機能説明は別ページにしました. [#sb463611] - [[RMeCab機能>RMeCabFunctions]] //* install.packages()で DESCRIPTIONが開けないというエラーが出る [#y068c7fe] //- ネットワーク関係のエラーです。[[https://sites.google.com/site/rmecab/home/install]]を参照してください。 --------------- &htmlinsert(amazon,transitional,"asins=486354393X"); &htmlinsert(amazon,transitional,"asins=4627885113");&htmlinsert(amazon,transitional,"asins=4320113454"); &htmlinsert(amazon,transitional,"asins=4627848420");&htmlinsert(amazon,transitional,"asins=4320124162"); &htmlinsert(amazon,transitional,"asins=486354216X");&htmlinsert(amazon,transitional,"asins=432012393X"); &htmlinsert(amazon,transitional,"asins=4797382309");&htmlinsert(amazon,transitional,"asins=4320123735"); &htmlinsert(amazon,transitional,"asins=432011082X");&htmlinsert(amazon,transitional,"asins=432011048X"); &htmlinsert(amazon,transitional,"asins=4627848412");&htmlinsert(amazon,transitional,"asins=4863542011"); &htmlinsert(amazon,transitional,"asins=486354135X");&htmlinsert(amazon,transitional,"asins=4320110293"); &htmlinsert(amazon,transitional,"asins=4621061313");&htmlinsert(amazon,transitional,"asins=4621062204"); &htmlinsert(amazon,transitional,"asins=4621061364");&htmlinsert(amazon,transitional,"asins=4621061542"); &htmlinsert(amazon,transitional,"asins=462106164X");&htmlinsert(amazon,transitional,"asins=4621061550"); &htmlinsert(amazon,transitional,"asins=4621061399");&htmlinsert(amazon,transitional,"asins=4621061534"); &htmlinsert(amazon,transitional,"asins=4621061356");&htmlinsert(amazon,transitional,"asins=4621065270"); &htmlinsert(amazon,transitional,"asins=489476654X");&htmlinsert(amazon,transitional,"asins=4320110331"); [[管理人>admin]] について : 参考ページ [[統計的言語処理]]: 旧バージョン保管庫 [[SoftArchive]] // : 係り受け解析パッケージ [[RCaBoCha]] //- [[R2MeCab]] は [[RMeCab]] の簡易版です -- [[RMeCab]] を使った[[twitter解析の記事:http://www.atmarkit.co.jp/fcoding/articles/stat/05/stat05b.html]] - [[RMeCab機能>RMeCabFunctions]] - [[各種解析のヒント>RMeCab_Tips]] // http://rmecab.jp/new/forums/ でどうぞ。 ---------- &size(20){&color(blue){[[RMeCab]]パッケージ};}; #ref(RealMecab.png,center,nowrap,60%,"和布蕪ってのはこれ")和布蕪ってのはこれ // RIGHT:[[RMeCab]]パッケージは http://sites.google.com/site/rmecab/ にも置いてあります。 // 旧バージョンは http://groups.google.co.jp/group/rmecab にあります. //テキストマイニングのためのツール: データ解析・グラフィックス環境 &size(18){[[R:http://cran.md.tsukuba.ac.jp/]]}; から日本語形態素解析ソフト''&color(blue){和布蕪};([[MeCab:http://mecab.sourceforge.net/]])''を呼び出して使うインターフェイス //- ''&color(green){テキストマイニング入門};'':[[RMeCab]]を利用したテキストマイニングについては //&htmlinsert(amazontext,asin=4627848412,text=『Rによるテキストマイニング入門』森北出版); //を参照いただければ幸いです. //#htmlinsert(amazon,transitional,"asins=4627848412") //-- &htmlinsert(amazontext,asin=4863540930,text=『R言語逆引きハンドブック』シーアンドアール研究所); R のレファレンスです. //#htmlinsert(amazon,transitional,"asins=4863540930") //-- &htmlinsert(amazontext,asin=4320110293,text=『Rで学ぶデータ・プログラミング入門 ―RStudioを活用する―』共立出版); 初心者向けにRをいちから解説した入門書です. //--- [[出版社のサイト:http://www.kyoritsu-pub.co.jp/kenpon/bookDetail/9784320110298]] //#htmlinsert(amazon,transitional,"asins=4320110293") - &color(green){2022 年 05 月 02 日 RMeCab_1.10 for R-4.2.0 (64bit・UTF-8のみ対応) 公開}; - &color(green){2021 年 05 月 27 日 RMeCab_1.07 for R-4.1.0 (M1 Mac 用バイナリを追加で作成) 公開}; - &color(green){2021 年 01 月 11 日 RMeCab_1.06 for R-4.0.3 公開}; ipadicに加え[[neologd辞書:https://github.com/neologd/mecab-ipadic-neologd]] に対応しました。 /usr/local/etc/mecabrc を以下のように変更するか、オリジナルのmecabrcをホームフォルダに .mecabrc という名前で保存し以下のように変更してください。 dicdir = /usr/local/lib/mecab/dic/mecab-ipadic-neologd ;dicdir = /usr/local/lib/mecab/dic/ipadic - &color(green){2020 年 04 月 28 日 RMeCab_1.05 for R-4.0.0 公開}; - &color(green){2019 年 06 月 10 日 RMeCab_1.04 for R-3.6.0 公開}; RMeCabText()を大規模テキストに適用可能とした - &color(green){2019 年 06 月 03 日 RMeCab_1.03 for R-3.6.0 公開}; docDF() を大規模テキスト・データフレームに適用可能とした - &color(green){2019 年 05 月 27 日 RMeCab_1.02 for R-3.6.0 公開}; 使用メモリを拡張した - &color(green){2019 年 04 月 28 日 RMeCab_1.01 for R-3.6.0 公開}; - &color(green){2017 年 08 月 04 日 RMeCab_0.99999 for R-3.4.1 公開}; 一部の関数 (RMeCabText(), RMeCabC()) でメモリ周りのエラーが生じることがあったのを修正しました - &color(green){2017 年 07 月 10 日 RMeCab_0.99998 for R-3.4.1 公開}; 一部の関数で解析対象となる文書ファイル数を 512 に制限していたのを解除 - &color(green){2017 年 04 月 24 日 RMeCab_0.99997 for R-3.4.0 公開}; docMatrixDF()関数(データフレームのテキスト列から文書単語行列を生成の出力で、列名を OBS からROW に変更。各列は、もとのデータフレームの行(回答者)に対応する - &color(green){2016 年 12 月 27 日 RMeCab_0.99995 for R-3.3.2 公開}; - &color(green){2016 年 05 月 06 日 RMeCab_0.99994 for R-3.3.0 公開}; - &color(green){2015 年 12 月 18 日 RMeCab_0.99993 for R-3.2.3 公開}; リファクタリングを予定しているため、ソースを整理しました - &color(green){2015 年 12 月 11 日 RMeCab_0.99992 for R-3.2.3 公開}; Windows版で、解析対象とするファイルの名前がアスキー文字列でない(つまりファイル名が日本語の)場合に、一部の関数がファイルの存在を認識しないことを修正 - &color(green){2015 年 04 月 17 日 RMeCab_0.9999 for R-3.2.0 公開}; ユーザーのmecabrcファイルを指定する際、パスにチルダが含まれているとRごと落ちることを修正 - &color(green){2014 年 03 月 10 日 RMeCab_0.9995 for R-3.0.3 公開}; Mac/Maverick & Homebrew版Rに対応 - &color(green){2013 年 12 月 17 日 RMeCab_0.9994 for R-3.0.2 公開}; メモリ空間を拡張 - 旧バージョン保管庫 [[SoftArchive]] #contents &size(18){[[R:http://cran.md.tsukuba.ac.jp/]]}; は [[ここ:http://cran.ism.ac.jp/]] から,自分のOSにあったファイルをダウンロードしてください.特にMacユーザーは自身のアーキテクチャ(Intel CPU or M1 cpu)に合わせて、適切なインストーラーを選んでください。なお、Windowsを利用している場合、パッケージのインストール先が OneDrive にならないように気をつけてください。最初にパッケージをインストールする前に、コンピュータのシステム設定詳細で変数名 R_LIBS_USER 変数値として C:\work (など自身の書き込み権限があり、かつ日本語全角文字を含まないフォルダ)を入力してOKを押し、設定を保存します。 #ref(RStudio_libs.png,center,nowrap,50%,"システム環境の設定") - グラフで日本語を正しく表示させるために設定ファイルを用意します。以下をR のコンソールで実行すると、ホームフォルダに .Rprofile というファイルが作成されます。以降、は起動時にこのファイル内部の設定を読み込むので、グラフなどで日本語が正しく表示されます。 source ("http://rmecab.jp/R/Rprofile.R") # この設定は次回の起動から有効になりますので、いったんRないしRStudioを終了させます なおRを終了させる際、[workspace(作業情報)を保存しますか] と聞いてきますが, No を選んでおきましょう。 // ***************** // // -試用データセット&ref(SoftArchive/data.zip); (Windows), &ref(SoftArchive/data.tar.gz); (Mac, Unix) // ************************************************** Windows **********************************************// * &color(green){&size(20){Windows 版 RMeCab (32/64 bit) インストール手順};}; [#f952c9af] R-4.2.0 以降、オリジナルのMeCabでは動作しません。ここ https://github.com/ikegami-yukino/mecab/releases から 64bit版MeCabをダウンロードし、辞書として必ずUTF-8を指定してください。なお、公式の32bi版MeCabをすでにインストールしている場合は、必ずアンインストールしてから、64bit版をインストールし直してください。 また、RMeCabで解析するファイルは UTF-8 で保存してください(WindowsのデフォルトはShift-JISであり、ニ全角文字が含まれるCSVファイルなどもRMeCabに読ませる場合はUTF-8に変更してください)。 // https://taku910.github.io/mecab/ から &color(red){mecab_0.996.exe}; // をダウンロードしてインストールします. インストール先は標準設定のままとします( ''[[C:\Program Files\MeCab]]'' となっているはずです) .また文字コードは UTF-8 に変更します. // あるいは ''[[C:\Program Files(x86)\MeCab]]'' となっているはずです) .また文字コードは Shit-Jis のままとします. + Rを起動して,以下のように入力してEnterキーを押してインストールして下さい.別にMeCabがインストールされていれば、これで完了です。注意:はじめてRとRStudioをインストールした場合、パッケージの追加作業はR本体を起動して行ってください。最初からRStudioを使うと、WindowsのOneDriveにパッケージのインストール先が用意され、トラブルを起こすことがあります。最初にR本体でパッケージをインストールすると、以降、RStudioでも、パッケージのインストール先としてがC:/Users/****/Documents/R/win-library/認識されます。 install.packages ("RMeCab", repos = "https://rmecab.jp/R") //++ 何らかの理由でダウンロードエラーとなる場合、以下のようにして RMeCab_1.04.zipをダウンロードしてください. // http://rmecab.jp/R/bin/windows/contrib/3.6/RMeCab_1.04.zip // メニューの「パッケージ」「ローカルなzipファイル」を選んでダウンロードしたRMeCabを選択. //++ あるいは http://web.ias.tokushima-u.ac.jp/linguistik/win.html から RMeCab_0.9***.zipをダウンロードしてください. //+++ 次にダウンロードした ''&color(blue){RMeCab_***.zip};''をR 32 bit あるいは R 64 bit のいずれかで 1 回インストールします.どちらでも使えるようになります.*** の部分はバージョン番号です. //+++ R 32 bit あるいは R 64 bit のいずれかで 1 回インストールします.どちらでも使えるようになります. //Rのメインメニューから[パッケージ]→[ローカルにあるzipファイルからのパッケージのインストール]を選んで,ダウンロードした RMeCab_***.zipファイルを選んでインストールします.[win-libraryを作成したいのですか] と聞いてきた時は OK を押してください(この際,R はユーザーフォルダを作成します). ''以上でインストールは完了です''. //++ お使いのWindowsマシンのスペックによっては 64bit 版 R では動作しないことがあります。右クリックで管理者として起動すると正常に動作できる可能性があります。あるいは、32bit 版 Rでお試しください。 // また、MeCab本体がデフォルトとは違うフォルダにインストールされている場合、インストール先(デフォルトだとC:\Program Files (x86)\MeCab\etc) // にあるmecabrcをコピーし、自分のホームフォルダ(C:\Users\mynameあるいはC:\Users\myname\documents)に、頭にドットを付けた .mecabrc ファイルとして用意する必要があります。 // その際、dicdir = を編集します。ちなみにデフォルトだとdicdir = C:\Program Files (x86)\MeCab\dic\ipadicとなっています。 // ++ バイナリファイルをダウンロートしたい方は http://web.ias.tokushima-u.ac.jp/linguistik/win.htmlからどうぞ。 *[[Windows版RMeCab_0.88までのインストール方法>WindowsRMeCab_0.88]] [#ifa3639e] ちなみにWindows 64bit版R-4.1 でRMeCabを実行すると落ちることがあるのは、MeCab本体をインストールした際、Windowsの環境設定で32bit版MeCabが優先されるよう設定されてしまい、RMeCabに同封されている64bit版MeCabが読み込まれないせいだと思われます。Windowsの環境設定PATHからMeCabを消してしまえば、64bit版RでRMeCabは動作します。 //*************************************** Mac ******************************************************// * &color(blue){&size(18){Mac OS X 版};}; のインストール方法[#xeec6040] +MeCabのインストール ++ ソースからインストールします(Homebrewは推奨しません)。以下、ソースからのインストールする方法を紹介します。なお、M1 (Apple silicon arm64 ) MacOSX には M1版R-arm64.pkgをインストールしてください。また、MeCabをビルドするターミナルでRosettaが動かないように設定してください。さもないとArm64用MeCabがビルドされません。詳細は https://rmecab.jp/new/forums/topic/rmecab%e3%81%ae%e3%82%a4%e3%83%b3%e3%82%b9%e3%83%88%e3%83%bc%e3%83%ab%e3%82%a8%e3%83%a9%e3%83%bc-2/#post-8111 あるいは MeCabのインストール(for M1 Sillicon macOS ): https://youtu.be/0ePI8a9kNUI を参照してください。 // (ただし a のソースファイルからのインストールを推奨します)。 +++ ''&color(red){[[MeCab:http://taku910.github.io/mecab/]]};''ソースからのインストール ///(可能であれば、この方法でインストールしてください)。 まず開発環境をインストールしておく必要があります.「アプリケーション」の「ユーティリティー」フォルダにあるターミナルを起動します。以下のよう入力してEnterを押します。 xcode-select --install #ref(xcode_c.png,left,nowrap,80%) Xcodeを入手する必要はありません。コマンドラインツールだけをインストールします。ライセンスに同意すると、インストールが開始します。 //AppStore から Xcode をインストールして下さい.Xcode で検索をかければ直ぐに出てきます.無料です. //続いてコマンドラインツールという追加機能をインストールします。時期によってインストール方法が違うので、Googleなどで検索してください。(アプリケーションフォルダにあるユーティリティーからターミナルを起動し gcc と入力してEnterを押してみてください。コマンドラインツールがインストールされていなればダイアログが出現します。インストールされていれば、no input file とエラーが出ます。) //--- 注意: El CapitanではMeCabのインストール先として想定されている /usr フォルダへの書き込みが制限されてしまいました。MeCabをインストールするには書き込み権限を付与する必要があります。まずターミナルを起動して /usr/local ディレクトリが存在することを確認します。 // ls -la /usr/local //ここで万が一、存在していない(エラーが出る)場合は、「"el capitan" "/usr/local" が存在しない場合」をグーグルで検索してみてください。存在していれば、以下のコマンドを実行して書き込み権限を与える(エンターを押すと管理者としてのパスワード入力が求められます)。 // sudo chown $(whoami):admin /usr/local && sudo chown -R $(whoami):admin /usr/local ''&color(red){[[MeCab:http://taku910.github.io/mecab/]]};''をインストールします.なお[[Homebrew版MeCabを利用する場合はこちらを参照:http://rmecab.jp/new/homebrew%E7%89%88mecab%E3%81%A8rmecab%E3%81%AE%E9%80%A3%E6%90%BA/]]してください。 http://taku910.github.io/mecab/ からソース版&color(red){mecab_0.996.tar.gz}; を取得します. /// Controlキーを押しながらクリックするとメニューがでるので、[名前を付けて保存] を選びます。ファイル名はそのまま、[ファイルの種類] を [すべて] にして、保存します(このようにしないと勝手にMacでは解凍されます)。 #ref(macdownload.png,center,nowrap,60%,"和布蕪ってのはこれ") 続いて辞書mecab-ipadic-2.7.0-20070801.tar.gz もダウンロードしてください(naist辞書を使うこともできます、このページ下を参照してください). /// Controlキーを押しながらクリックするとメニューがでるので、[名前を付けて保存] を選びます。ファイル名はそのまま、[ファイルの種類] を [すべて] にして、保存します(このようにしないと勝手にMacでは解凍されます)。バージョンを表す数字は適当に読み替えてください. terminalを起動して,ダウンロードしたフォルダに移動します.仮にこれを Downloads フォルダとします. /// # 右の命令でダウンロードすることもできます curl -OL http://mecab.googlecode.com/files/mecab-0.996.tar.gz /// # 右の命令でダウンロードすることもできます curl -OL http://mecab.googlecode.com/files/mecab-ipadic-2.7.0-20070801.tar.gz $ cd Downloads $ tar zxvf mecab-0.996.tar.gz # $ cd mecab-0.996 $ ./configure --with-charset="utf8" $ make # もしも Symbol _libconv 関連のエラーが出た場合は # $ make clean # $ ./configure --with-charset="utf8" LDFLAGS="-liconv" # $ make # とやり直して下さい $ sudo make install ## もしも sudo make install を実行すると make Error , Permission denied などと表示される場合は次のようにしてください. ## $ chmod 700 install-sh ## $ sudo make install 辞書もインストールします $ cd ~/Downloads $ tar zxf mecab-ipadic-2.7.0-20070****.tar.gz $ cd mecab-ipadic-2.7.0-20070**** $ ./configure --with-charset="utf-8" # # ここでエラーが出る場合は PATH を通してみてください # # 以下の一行を実行します. # # $ export PATH=/usr/local/bin:PATH $ make $ sudo make install # 試してみる $ mecab すもももももももものうち すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ も 助詞,係助詞,*,*,*,*,も,モ,モ もも 名詞,一般,*,*,*,*,もも,モモ,モモ も 助詞,係助詞,*,*,*,*,も,モ,モ もも 名詞,一般,*,*,*,*,もも,モモ,モモ の 助詞,連体化,*,*,*,*,の,ノ,ノ うち 名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ EOS CtrlキーとC キーの同時押しで終了 # 万が一 mecabが無いと言われた場合はPATHを通す # $ echo $PATH # # を実行して表示された内容に /usr/local/bin が含まれていない場合は # # ホームディレクトリに戻って # $ cd # # 次のコマンドを実行しておきます. # # echo export PATH='/usr/local/bin:$PATH' >> ~/.profile 以上でMeCabのインストールは終了です。 //++ 推奨しませんgな、あるいは Hombrew から MeCab をインストール (homebrew http://brew.sh/index_ja.html はマックで一般的に使われているパッケージ管理システムです。別途インストールが必要です) // // brew install mecab // brew install mecab-ipadic // // 以上です。まれにHomebrewでは動作しない場合があります。その場合は[[Hombrewでの辞書設定:http://rmecab.jp/new/homebrew%e7%89%88mecab%e3%81%a8rmecab%e3%81%ae%e9%80%a3%e6%90%ba/]]を参照ください。 ++ 準備が整ったので RMeCabをインストールします。以下のように入力してEnterキーを押して下さい.これで完了です。 install.packages ("RMeCab", repos = "https://rmecab.jp/R") # httpsだとエラーになる場合 install.packages ("RMeCab", repos = "http://rmecab.jp/R") (手もとのマシンのセキュリティアップデートをしてください) # 上の1行でエラーが生じる場合は、以下で再インストールしてください # remove.pacakges("RMeCab") install.packages ("RMeCab", repos = "https://rmecab.jp/R", type = "source") あるいは以下のようにしてもインストールできます。 install.packages("devtools") devtools::install_github("IshidaMotohiro/RMeCab") ''以上でインストールは完了です''. +++ バイナリファイルをダウンロードしたい場合[[for Mavericks:http://web.ias.tokushima-u.ac.jp/linguistik/maverick.html]]あるいは[[for Mountain Lion:http://web.ias.tokushima-u.ac.jp/linguistik/mlion.html]]からもダウンロードできます。 // ************************************************** Linux **********************************************// * &color(blue){&size(18){ Linux 版};}; のインストール方法[#n6c9a6e0] +Rのインストール 以下の(1-1)か(1-2)のいずれかの手順でインストールします。 ++ (1-1)レポジトリからRをインストール $ sudo echo "deb http://cran.ism.ac.jp/bin/linux/ubuntu ???/ " >> /etc/apt/sources.list #???をUbuntuのバージョンに合わせて修正 # 詳細は http://cran.ism.ac.jp/bin/linux/ubuntu/README.html $ sudo apt-key adv --keyserver keyserver.ubuntu.com --recv-keys 51716619E084DAB9 $ sudo apt-get update $ sudo apt-get install r-base $ sudo apt-get install r-base-dev ++ (1-2) あるいはR をソースからインストールする。以下の手順に従って下さい(--enable-R-shlib オプションを付けてconfigureしてください) sudo apt-get install build-essential gfortran xorg-dev sudo apt-get install libreadline-dev libcairo-dev tar zxf R-3.2.2.tar.gz cd R-3.2.2 ./configure --enable-R-shlib make sudo make install + ''&color(red){[[MeCab:http://taku910.github.io/mecab/]]};''をUbuntuレポジトリからか、あるいはソースからインストールしてください。 ++ (1-1)レポジトリからMeCabをインストール sudo apt install build-essential mecab libmecab-dev mecab-ipadic mecab-ipadic-utf8 ++ ソースからMeCabをインストール http://taku910.github.io/mecab/ からソース版 mecab-0.996.tar.gzを取得します. 同じく辞書 mecab-ipadic-2.7.0-20070801.tar.gz もダウンロードしてください(naist辞書を使うこともできます、このページ下を参照してください).バージョンを表す数字は適当に読み替えてください. +++ terminalを起動して,ダウンロードしたフォルダに移動します.仮にこれを Downloads フォルダとします. $ cd Downloads $ tar zxvf mecab-0.996.tar.gz $ cd mecab-0.996 $ ./configure --with-charset="utf8" $ make # もしも Symbol _libconv 関連のエラーが出た場合は # $ make clean # $ ./configure --with-charset="utf8" LDFLAGS="-liconv" # $ make # とやり直して下さい $ sudo make install $ sudo ldconfig ## Linux ではこれが必要 +++もしも sudo make install を実行すると make Error , Permission denied などと表示される場合は次のようにしてください. $ chmod 700 install-sh $ sudo make install +++辞書もインストールします $ tar zxf mecab-ipadic-2.7.0-20070****.tar.gz $ cd mecab-ipadic-2.7.0-20070**** $ ./configure --with-charset="utf-8" # ここでエラーが出る場合は PATH を通してみてください # 以下の一行を実行します. $ export PATH=/usr/local/bin:PATH $ make $ sudo make install # 今後のために PATH を追加しておくとよいでしょう $ echo $PATH # を実行して表示された内容に /usr/local/bin が含まれていない場合は # ホームディレクトリに戻って $ cd # 次のコマンドを実行しておきます. $ echo '/usr/local/bin:$PATH' >> .profile + RMeCabのインストール ++ Rを起動して,以下のように入力してEnterキーを押してインストールして下さい.これで完了です。 install.packages ("RMeCab", repos = "https://rmecab.jp/R", type = "source") あるいは以下のようにしてもインストールできます。 install.packages("devtools") devtools::install_github("IshidaMotohiro/RMeCab") // # install.packages ("RMeCab", repos = "http://rmecab.jp/R", type = "source") # mecab を apt install コマンドでインストールした場合 ''以上でインストールは完了です''. +++ バイナリファイルは[[for 32 bit:http://web.ias.tokushima-u.ac.jp/linguistik/u32.html]] あるいは [[for 64 bit:http://web.ias.tokushima-u.ac.jp/linguistik/u64.html]] でダウンロードできます。 &aname(data); // * 試用データセット (2009年11月25日修正) [#ca5cdc89] * 『Rで学ぶテキストマイニング』データセット(2015年12月17日修正) [#a3937e84] - Windows用 Shif-Jis コード: http://web.ias.tokushima-u.ac.jp/linguistik/RMeCab/data.zip - Mac / Linux 用 UTF8 コード: http://web.ias.tokushima-u.ac.jp/linguistik/RMeCab/data.tar.gz // &ref(SoftArchive/data.zip);(Windowsの方、Shift-Jis) : &ref(SoftArchive/data.tar.gz); (MacおよびUnixユーザーの方, utf-8 ファイル): 解凍後,中に含まれる data フォルダをドライブの先頭にコピーして,''RMeCab.R'' ファイル内のコードを実行します.詳しくはフォルダ内の ''README_RMeCab.txt'' を読んでください. * [[RMeCabで辞書を指定>MeCab_Dictionary]] [#teb7708a] * neologd を使う [#xecb1486] 詳細は https://rmecab.jp/new/ を参照してください。 以下のようにインストールします。 $ git clone –depth 1 https://github.com/neologd/mecab-ipadic-neologd.git $ cd mecab-ipadic-neologd $ ./bin/install-mecab-ipadic-neologd -n インストール先の確認 $ mecab -d /usr/lib/mecab/dic/mecab-ipadic-neologd $ mecab -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd 動作確認 $ echo “8月3日に放送された「中居正広の金曜日のスマイルたちへ」(TBS系)で、1日たった5分でぽっこりおなかを解消するというダイエット方法を紹介。キンタ ロー。にも密着。” | mecab RMeCabでNeologdを使う準備 /usr/local/etc/mecabrc を開いて以下のように変更するか、オリジナルのこのmecabrcファイルをホームフォルダに .mecabrc という隠しファイルとして保存し、これを以下のように変更してください ; Configuration file of MeCab ; $Id: mecabrc.in,v 1.3 2006/05/29 15:36:08 taku-ku Exp $; ; dicdir = /usr/local/lib/mecab/dic/ipadic dicdir = /usr/local/lib/mecab/dic/mecab-ipadic-neologd コマンドラインで、たとえば、以下のように操作します。 $ cp /usr/local/etc/mecabrc ~/.mecabrc $ sed -i -e 's/dicdir = \/usr\/local\/lib\/mecab\/dic\/ipadic/dicdir = \/usr\/local\/lib\/mecab\/dic\/mecab-ipadic-neologd/' ~/.mecabrc * naist-jdicを使う [#s03807b1] [[ここ:https://sites.google.com/site/rmecab/home/naist-jdicwo-shiu]] を参照してください。 //&aname(Q); //* バージョン履歴:問い合わせ先 [#j507d1f4] * UniDic を使う [#ha41b197] [[ここ:https://sites.google.com/site/rmecab/home/unidic]] を参照してください。 //&aname(type); //* Mac/Linuxで library(RMeCab)でロードに失敗する場合 [#e65e48c6] // //以下をコンソールで実行して再インストールしてください. // // install.packages ("RMeCab", repos = "http://rmecab.jp/R", type = "source") ** ソースファイルは以下に置いています。 [#gba7ac23] // https://bitbucket.org/motohiro_ishida/rmecab https://github.com/IshidaMotohiro/RMeCab * FAQ [#u90e70b9] - Q) RMeCabの諸関数にファイルではなく、文字列を渡したい - A) 以下のようにしてください。 # # その1 tmp <- textConnection("kawabata", "w") writeLines ("国境の長いトンネルを抜けると雪国であった。夜の底が白くなった。信号所に汽車が止まった。向側の座席から娘が立って来て、島村の前のガラス窓を落とした。雪の冷気が流れ込んだ。",con = tmp) textConnectionValue(tmp) readLines(tmp) library(RMeCab) RMeCabC(tmp) RMeCabFreq(tmp) close(tmp) # # その2 dummy <- c ("私は真面目な学生です。", "彼女は数学専攻の学生です。", "彼らは物理学を専攻している。") tmpdir <- tempdir () for (i in seq(dummy) ){ td <- tempfile("tmp", tmpdir = tmpdir) write( dummy [i] , file = td) if (file.exists (td)) cat( td, "exists", "\n") } library (RMeCab) x <- docMatrix (tmpdir) x * RMeCabを引用いただく場合 [#x8e9a54d] 以下のいずれかの方法でいかがでしょうか? - 著書を参考文献に記載いただくか -- 石田基広 (2017) 『Rによるテキストマイニング入門第2版』森北出版(東京) 183頁 -- 石田基広 (2008) 『Rによるテキストマイニング入門』森北出版(東京) 173頁 - あるいはRで以下のようにすると情報が表示されますので、これを参考にしていただく library(RMeCab) citation("RMeCab") Rでパッケージを引用する場合の一般的な書式です。ただし、この表示通りに引用しなければならないというわけではありません。 //- お問い合わせはメールをください.関数の追加についても,気楽にご相談ください. // // 石田基広// // // ishida-m(この部分を"@"に変更下さい)ias.tokushima-u.ac.jp * R の参考書 [#s358f06f] テキストマイニングのためのツール: データ解析・グラフィックス環境 &size(18){[[R:http://cran.md.tsukuba.ac.jp/]]}; から日本語形態素解析ソフト''&color(blue){和布蕪};([[MeCab:http://mecab.sourceforge.net/]])''を呼び出して使うインターフェイス - ''&color(green){テキストマイニング入門};'':[[RMeCab]]を利用したテキストマイニングについては &htmlinsert(amazontext,asin=4627848412,text=『Rによるテキストマイニング入門』森北出版); を参照いただければ幸いです. #htmlinsert(amazon,transitional,"asins=4627848412") -- &htmlinsert(amazontext,asin=4863540930,text=『R言語逆引きハンドブック』シーアンドアール研究所); R のレファレンスです. #htmlinsert(amazon,transitional,"asins=4863540930") -- &htmlinsert(amazontext,asin=4320110293,text=『Rで学ぶデータ・プログラミング入門 ―RStudioを活用する―』共立出版); 初心者向けにRをいちから解説した入門書です. --- [[出版社のサイト:http://www.kyoritsu-pub.co.jp/kenpon/bookDetail/9784320110298]] #htmlinsert(amazon,transitional,"asins=4320110293") -&htmlinsert(amazontext,asin=4863540930,text=『R言語逆引きハンドブック』シーアンドアール研究所); R のレファレンスです. - &htmlinsert(amazontext,asin=4320110293,text=『Rで学ぶデータ・プログラミング入門 ―RStudioを活用する―』共立出版); 初心者向けにRをいちから解説した入門書です. -&htmlinsert(amazontext,asin=4431712186,text=U・リゲス著『Rの基礎とプログラミング技法』シュプリンガー社); 中級者になるために. -&htmlinsert(amazontext,asin=4431713123,text=B・エヴェリット著『RとS-PLUSによる多変量解析』シュプリンガー社); 解析をばりばり行うために. -&htmlinsert(amazontext,asin=4431100474,text=P・スペクター著『Rデータ自由自在』シュプリンガー社); データをばりばり処理するために. -&htmlinsert(amazontext,asin=4274067572,text=青木繁伸『Rによる統計解析』オーム社); R のプログラミングテクニックを学ぶために. - &htmlinsert(amazontext,asin=4627096011,text=金明哲『Rによるデータサイエンス』森北書店); R での解析手法に慣れるために. - &htmlinsert(amazontext,asin=4777511847,text=舟尾暢男『データ解析環境「R」』工学社); とにかく R を使ってみたい. -&htmlinsert(amazontext,asin=4894717573,text=中澤港『Rによる統計解析の基礎』ピアソンエデュケーション); 統計学と R を同時に学びたい.