R と MeCab? (ただしWindowsでは64bit UTF-8辞書版)の両方が既にインストールされているのならば R を起動し、コンソールで以下を実行すればRMeCabパッケージのインストールは完了です。
# Windows あるいは Mac の場合 install.packages("RMeCab", repos = "http://rmecab.jp/R") # Linux あるいは、Mac で上記の命令がエラーとなる場合 install.packages("RMeCab", repos = "https://rmecab.jp/R", type = "source") install.packages("RMeCab", repos = "http://rmecab.jp/R", type = "source") # httpsだとエラーになる場合(手もとのマシンのセキュリティアップデートをしてください)
あるいは GitHub? からインストールもできます。
# Windows で Rtools4 と MeCab をすでにインストールしている場合、あるいはMac あるいは Linux の場合 install.packages("remotes") remotes::install_github("IshidaMotohiro/RMeCab")
実行できるか、以下を試してみましょう。
library(RMeCab) res <- RMeCabC("すもももももももものうち") unlist (res)
次のように表示されれば、インストールは成功しています。(なお、利用辞書にneologdを設定している場合、"すもももももももものうち"全体が一語として表示されます)。
> unlist (res) 名詞 助詞 名詞 助詞 名詞 助詞 名詞 "すもも" "も" "もも" "も" "もも" "の" "うち"
MeCab?のインストールから始めたいという方は、以下、自身のOSに対応したセクションの解説を参照してください。 https://rmecab.jp/new/ でも説明しています(内容はこのページと同じです)。
https://github.com/IshidaMotohiro/TextMining
管理人 について : 参考ページ 統計的言語処理: 旧バージョン保管庫 SoftArchive
RMeCabパッケージ
dicdir = /usr/local/lib/mecab/dic/mecab-ipadic-neologd ;dicdir = /usr/local/lib/mecab/dic/ipadic
R は ここ から,自分のOSにあったファイルをダウンロードしてください.特にMacユーザーは自身のアーキテクチャ(Intel CPU or M1 cpu)に合わせて、適切なインストーラーを選んでください。なお、Windowsを利用している場合、パッケージのインストール先が OneDrive? にならないように気をつけてください。最初にパッケージをインストールする前に、コンピュータのシステム設定詳細でユーザ環境として R_USER に、自身の書き込み権限があり、かつ日本語全角文字を含まないフォルダを指定することをお勧めします。
source ("http://rmecab.jp/R/Rprofile.R") # この設定は次回の起動から有効になりますので、いったんRないしRStudioを終了させます
なおRを終了させる際、[workspace(作業情報)を保存しますか] と聞いてきますが, No を選んでおきましょう。
R-4.2.0 以降、オリジナルのMeCab?では動作しません。ここ https://github.com/ikegami-yukino/mecab/releases から 64bit版MeCab?をダウンロードし、辞書として必ずUTF-8を指定してください。なお、公式の32bi版MeCab?をすでにインストールしている場合は、必ずアンインストールしてから、64bit版をインストールし直してください。
また、RMeCab?で解析するファイルは UTF-8 で保存してください(WindowsのデフォルトはShift-JISであり、ニ全角文字が含まれるCSVファイルなどもRMeCab?に読ませる場合はUTF-8に変更してください)。
インストール先は標準設定のままとします( C:\Program Files\MeCab となっているはずです) .また文字コードは UTF-8 に変更します.
install.packages ("RMeCab", repos = "https://rmecab.jp/R")以上でインストールは完了です.
ちなみにWindows 64bit版R-4.1 でRMeCab?を実行すると落ちることがあるのは、MeCab?本体をインストールした際、Windowsの環境設定で32bit版MeCab?が優先されるよう設定されてしまい、RMeCab?に同封されている64bit版MeCab?が読み込まれないせいだと思われます。Windowsの環境設定PATHからMeCab?を消してしまえば、64bit版RでRMeCab?は動作します。
xcode-select --installXcodeを入手する必要はありません。コマンドラインツールだけをインストールします。ライセンスに同意すると、インストールが開始します。 MeCabをインストールします.なおHomebrew版MeCabを利用する場合はこちらを参照してください。 http://taku910.github.io/mecab/ からソース版mecab_0.996.tar.gz を取得します. 続いて辞書mecab-ipadic-2.7.0-20070801.tar.gz もダウンロードしてください(naist辞書を使うこともできます、このページ下を参照してください). terminalを起動して,ダウンロードしたフォルダに移動します.仮にこれを Downloads フォルダとします.
$ cd Downloads $ tar zxvf mecab-0.996.tar.gz # $ cd mecab-0.996 $ ./configure --with-charset="utf8" $ make # もしも Symbol _libconv 関連のエラーが出た場合は # $ make clean # $ ./configure --with-charset="utf8" LDFLAGS="-liconv" # $ make # とやり直して下さい $ sudo make install ## もしも sudo make install を実行すると make Error , Permission denied などと表示される場合は次のようにしてください. ## $ chmod 700 install-sh ## $ sudo make install 辞書もインストールします $ cd ~/Downloads $ tar zxf mecab-ipadic-2.7.0-20070****.tar.gz $ cd mecab-ipadic-2.7.0-20070**** $ ./configure --with-charset="utf-8" # # ここでエラーが出る場合は PATH を通してみてください # # 以下の一行を実行します. # # $ export PATH=/usr/local/bin:PATH $ make $ sudo make install # 試してみる $ mecab すもももももももものうち すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ も 助詞,係助詞,*,*,*,*,も,モ,モ もも 名詞,一般,*,*,*,*,もも,モモ,モモ も 助詞,係助詞,*,*,*,*,も,モ,モ もも 名詞,一般,*,*,*,*,もも,モモ,モモ の 助詞,連体化,*,*,*,*,の,ノ,ノ うち 名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ EOS CtrlキーとC キーの同時押しで終了 # 万が一 mecabが無いと言われた場合はPATHを通す # $ echo $PATH # # を実行して表示された内容に /usr/local/bin が含まれていない場合は # # ホームディレクトリに戻って # $ cd # # 次のコマンドを実行しておきます. # # echo export PATH='/usr/local/bin:$PATH' >> ~/.profile 以上でMeCabのインストールは終了です。
install.packages ("RMeCab", repos = "https://rmecab.jp/R") # httpsだとエラーになる場合 install.packages ("RMeCab", repos = "http://rmecab.jp/R") (手もとのマシンのセキュリティアップデートをしてください) # 上の1行でエラーが生じる場合は、以下で再インストールしてください # remove.pacakges("RMeCab") install.packages ("RMeCab", repos = "https://rmecab.jp/R", type = "source")あるいは以下のようにしてもインストールできます。
install.packages("devtools") devtools::install_github("IshidaMotohiro/RMeCab")以上でインストールは完了です.
$ sudo echo "deb http://cran.ism.ac.jp/bin/linux/ubuntu ???/ " >> /etc/apt/sources.list #???をUbuntuのバージョンに合わせて修正 # 詳細は http://cran.ism.ac.jp/bin/linux/ubuntu/README.html $ sudo apt-key adv --keyserver keyserver.ubuntu.com --recv-keys 51716619E084DAB9 $ sudo apt-get update $ sudo apt-get install r-base $ sudo apt-get install r-base-dev
sudo apt-get install build-essential gfortran xorg-dev sudo apt-get install libreadline-dev libcairo-dev tar zxf R-3.2.2.tar.gz cd R-3.2.2 ./configure --enable-R-shlib make sudo make install
sudo apt install build-essential mecab libmecab-dev mecab-ipadic mecab-ipadic-utf8
$ cd Downloads $ tar zxvf mecab-0.996.tar.gz $ cd mecab-0.996 $ ./configure --with-charset="utf8" $ make # もしも Symbol _libconv 関連のエラーが出た場合は # $ make clean # $ ./configure --with-charset="utf8" LDFLAGS="-liconv" # $ make # とやり直して下さい $ sudo make install $ sudo ldconfig ## Linux ではこれが必要
$ chmod 700 install-sh $ sudo make install
$ tar zxf mecab-ipadic-2.7.0-20070****.tar.gz $ cd mecab-ipadic-2.7.0-20070**** $ ./configure --with-charset="utf-8" # ここでエラーが出る場合は PATH を通してみてください # 以下の一行を実行します. $ export PATH=/usr/local/bin:PATH $ make $ sudo make install # 今後のために PATH を追加しておくとよいでしょう $ echo $PATH # を実行して表示された内容に /usr/local/bin が含まれていない場合は # ホームディレクトリに戻って $ cd # 次のコマンドを実行しておきます. $ echo '/usr/local/bin:$PATH' >> .profile
install.packages ("RMeCab", repos = "https://rmecab.jp/R", type = "source")あるいは以下のようにしてもインストールできます。
install.packages("devtools") devtools::install_github("IshidaMotohiro/RMeCab")以上でインストールは完了です.
解凍後,中に含まれる data フォルダをドライブの先頭にコピーして,RMeCab?.R ファイル内のコードを実行します.詳しくはフォルダ内の README_RMeCab?.txt を読んでください.
以下のようにインストールします。
$ git clone –depth 1 https://github.com/neologd/mecab-ipadic-neologd.git $ cd mecab-ipadic-neologd $ ./bin/install-mecab-ipadic-neologd -n
インストール先の確認
$ mecab -d /usr/lib/mecab/dic/mecab-ipadic-neologd
動作確認
$ echo “8月3日に放送された「中居正広の金曜日のスマイルたちへ」(TBS系)で、1日たった5分でぽっこりおなかを解消するというダイエット方法を紹介。キンタ ロー。にも密着。” | mecab
RMeCab?でNeologdを使う準備
/usr/local/etc/mecabrc を開いて以下のように変更するか、オリジナルのこのmecabrcファイルをホームフォルダに .mecabrc という隠しファイルとして保存し、これを以下のように変更してください
; Configuration file of MeCab ; $Id: mecabrc.in,v 1.3 2006/05/29 15:36:08 taku-ku Exp $; ; dicdir = /usr/local/lib/mecab/dic/ipadic dicdir = /usr/local/lib/mecab/dic/mecab-ipadic-neologd
コマンドラインで、たとえば、以下のように操作します。
$ cp /usr/local/etc/mecabrc ~/.mecabrc $ sed -i -e 's/dicdir = \/usr\/local\/lib\/mecab\/dic\/ipadic/dicdir = \/usr\/local\/lib\/mecab\/dic\/mecab-ipadic-neologd/' ~/.mecabrc
ここ を参照してください。
ここ を参照してください。
https://github.com/IshidaMotohiro/RMeCab
# # その1 tmp <- textConnection("kawabata", "w") writeLines ("国境の長いトンネルを抜けると雪国であった。夜の底が白くなった。信号所に汽車が止まった。向側の座席から娘が立って来て、島村の前のガラス窓を落とした。雪の冷気が流れ込んだ。",con = tmp) textConnectionValue(tmp) readLines(tmp) library(RMeCab) RMeCabC(tmp) RMeCabFreq(tmp) close(tmp) # # その2 dummy <- c ("私は真面目な学生です。", "彼女は数学専攻の学生です。", "彼らは物理学を専攻している。") tmpdir <- tempdir () for (i in seq(dummy) ){ td <- tempfile("tmp", tmpdir = tmpdir) write( dummy [i] , file = td) if (file.exists (td)) cat( td, "exists", "\n") } library (RMeCab) x <- docMatrix (tmpdir) x
以下のいずれかの方法でいかがでしょうか?
library(RMeCab) citation("RMeCab")Rでパッケージを引用する場合の一般的な書式です。ただし、この表示通りに引用しなければならないというわけではありません。
テキストマイニングのためのツール: データ解析・グラフィックス環境 R から日本語形態素解析ソフト和布蕪(MeCab)を呼び出して使うインターフェイス