install RMeCab

Windows

最初に mecab-0.996.exe をhttp://taku910.github.io/mecab/ からダウンロードして、ダブルクリックでインストールしておきます.

RMeCabをインストールします。Rを起動して,以下のように入力してEnterキーを押してインストールして下さい.

install.packages(“RMeCab”, repos = “https://rmecab.jp/R”)

注意:はじめてRとRStudioをインストールした場合、パッケージの追加作業はR本体を起動して行ってください。最初からRStudioを使うと、WindowsのOneDriveにパッケージのインストール先が用意され、トラブルを起こすことがあります。最初にR本体でパッケージをインストールすると、以降、RStudioでも、パッケージのインストール先としてがC:/Users/****/Documents//win-library/認識されます。


お使いのWindowsマシンによっては 64bit 版 では動作しないことがあります。この場合は、32bit 版 Rでお試しください。


また、MeCab本体がデフォルトとは違うフォルダにインストールされている場合、インストール先(デフォルトだとC:\Program Files (x86)\MeCab\etc)
にあるmecabrcをコピーし、自分のホームフォルダ(C:\Users\mynameあるいはC:\Users\myname\documents)に、頭にドットを付けた .mecabrc ファイルとして用意する必要があります。その際、dicdir = を編集します。ちなみにデフォルトだとdicdir = C:\Program Files (x86)\MeCab\dic\ipadicとなっています。

Mac

以下の手順でMeCabをインストールしてください。

(1) MeCabのインストール


(A) ソースからインストールする
(A-1)
はじめにコマンドラインツールをインストールします。「アプリケーション」の「ユーティリティー」フォルダにあるターミナルを起動します。以下のように入力してEnterを押します。

xcode-select –install

Xcodeを入手する必要はありません。コマンドラインツールだけをインストールします。ライセンスに同意すると、インストールが開始します。
以上で、MeCabをインストールする用意が整いました。

(A-2)
http://taku910.github.io/mecab/ から mecab-0.996.tar.gz をダウンロードしてインストールする手順
Finderのユーティリティフォルダにあるターミナルという黒いアイコンのソフトを起動します。


以下、このターミナル内に $ の右側の文字列をコピーして貼り付けEnterを押します。なお$マークそのものは入力しません。
本体をダウンロードしてインストールします(以下の手順の二番目で自動的にダウンロードされますが、数秒かかります)。途中でログインパスワードの入力を求められます。


$ cd ~/Downloads
$ curl -fsSL “https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7cENtOXlicTFaRUE” -o mecab-0.996.tar.gz
$ tar xf mecab-0.996.tar.gz
$ cd mecab-0.996
$ ./configure –with-charset=utf8
$ make
$ sudo make install


(A-3)
辞書 mecab-ipadic-2.7.0-20070801.tar.gz もインストールします (以下の手順の二番目で自動的にダウンロードされます、数秒かかります)。


$ cd ~/Downloads
$ curl -fsSL “https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7MWVlSDBCSXZMTXM” -o mecab-ipadic-2.7.0-20070801.tar.gz
$ tar zvxf mecab-ipadic-2.7.0-20070801.tar.gz
$ tar xf mecab-ipadic-2.7.0-20070801.tar.gz
$ cd mecab-ipadic-2.7.0-20070801
$ ./configure –with-charset=utf-8
$ make
$ sudo make install


(B) インストールの確認
試してみる :ターミナルでmecabと入力してEnterキーを押し、さらに すもももももももものうち と入力してEnterを押す

$ mecab
すもももももももものうち
すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも 名詞,一般,*,*,*,*,もも,モモ,モモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも 名詞,一般,*,*,*,*,もも,モモ,モモ
の 助詞,連体化,*,*,*,*,の,ノ,ノ
うち 名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
EOS

CtrlキーとC キーの同時押しで終了


# 万が一 mecabが無いと言われた場合はPATHを通す
# cd
# echo export PATH=’/usr/local/bin:$PATH’ >> ~/.profile


(2) RMeCabのインストール

Rを起動して,以下のように入力してEnterキーを押してインストールして下さい.


install.packages(“RMeCab”, repos = “https://rmecab.jp/R”, type = “source”)


あるいは以下のようにしてもインストールできます。


install.packages(“devtools”)
devtools::install_github(“IshidaMotohiro/RMeCab”)


以上です。


Linux (Ubuntu 10.04以降)

Rのインストール


(1) Rは(1-1) (1-2) のいずれかの方法でインストールします。
以下、このターミナル内に $ の右側の文字列をコピーして貼り付けEnterを押します。なお$マークそのものは入力しません。
(1-1) Ubuntuのレポジトリからインストール
$ sudo echo “deb http://cran.ism.ac.jp/bin//ubuntu ???/ ” >> /etc/apt/sources.list #???をUbuntuのバージョンに合わせて修正
# 詳細は http://cran.ism.ac.jp/bin//ubuntu/README.html
$ sudo apt-key adv –keyserver keyserver.ubuntu.com –recv-keys 51716619E084DAB9
$ sudo apt-get update
$ sudo apt-get install -base
$ sudo apt-get install -base-dev
(1-2) あるいは最新版のR をソースからコンパイルします.Ubuntuならば以下の手順で開発環境を用意します.
$ sudo apt-get install build-essential gfortran xorg-dev
$ sudo apt-get install libreadline-dev libcairo-dev
# Rをダウンロードしたフォルダに移動します
$ tar zxf -3.*.*.tar.gz
$ cd -3.*.*
$ ./configure –enable-R-shlib
# LaTeXの環境場入っていない場合,
# 以下の警告が表示されます.これは文字通り,マニュアルPDFを作成できなかったということですが.
# R の機能そのものに影響はありません.
configure: WARNING: you cannot build info or HTML versions of the R manuals
configure: WARNING: you cannot build PDF versions of the R manuals
configure: WARNING: you cannot build PDF versions of vignettes and help pages
$ make
$ sudo make install
$ sudo ldconfig


(2) mecabを以下のようにインストールします。


ソースからコンパイル・インストールします。以下、このターミナル内に $ の右側の文字列をコピーして貼り付けEnterを押します。なお$マークそのものは入力しません。途中でログインパスワードの入力を求められます。
http://taku910.github.io/mecab/ から mecab-0.996.tar.gzをインストールします(以下の手順の二番目で自動的にダウンロードされますが、数秒かかります)。


$ cd Downloads
$ curl -fsSL “https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7cENtOXlicTFaRUE” -o mecab-0.996.tar.gz
$ tar xf mecab-0.996.tar.gz
$ cd mecab-0.996
$ ./configure –with-charset=utf8
$ make
$ sudo make install
$ sudo ldconfig ## ではこれが必要


同じく 辞書mecab-ipadic-2.7.0-20070801.tar.gz もインストールします(以下の手順の二番目で自動的にダウンロードされますが、数秒かかります)。


$ cd ~/Downloads
$ curl -fsSL “https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7MWVlSDBCSXZMTXM” -o mecab-ipadic-2.7.0-20070801.tar.gz
$ tar xf mecab-ipadic-2.7.0-20070801.tar.gz
$ cd mecab-ipadic-2.7.0-20070801
$ ./configure –with-charset=utf-8
$ make
$ sudo make install
$ sudo ldconfig ## ではこれが必要


(3) RMeCabをインストール


Rを起動して,以下のように入力してEnterキーを押してインストールして下さい.


install.packages(“RMeCab”, repos = “https://rmecab.jp/R”, type = “source”)


あるいは以下のようにしてもインストールできます。


install.packages(“devtools”)
devtools::install_github(“IshidaMotohiro/RMeCab”)

neologd を使う

以下のようにインストールします。

$ git clone –depth 1 https://github.com/neologd/mecab-ipadic-neologd.git
$ cd mecab-ipadic-neologd
$ ./bin/install-mecab-ipadic-neologd -n

インストール先の確認

$ mecab -d /usr/lib/mecab/dic/mecab-ipadic-neologd

動作確認

$ echo “8月3日に放送された「中居正広の金曜日のスマイルたちへ」(TBS系)で、1日たった5分でぽっこりおなかを解消するというダイエット方法を紹介。キンタ ロー。にも密着。” | mecab

RMeCab?でNeologdを使う準備

/usr/local/etc/mecabrc を開いて以下のように変更するか、オリジナルのこのmecabrcファイルをホームフォルダに .mecabrc という隠しファイルとして保存し、これを以下のように変更してください

; Configuration file of MeCab
; $Id: mecabrc.in,v 1.3 2006/05/29 15:36:08 taku-ku Exp $;
; dicdir = /usr/local/lib/mecab/dic/ipadic
dicdir = /usr/local/lib/mecab/dic/mecab-ipadic-neologd

コマンドラインで、たとえば、以下のように操作します。

$ cp /usr/local/etc/mecabrc ~/.mecabrc
$ sed -i -e ‘s/dicdir = \/usr\/local\/lib\/mecab\/dic\/ipadic/dicdir = \/usr\/local\/lib\/mecab\/dic\/mecab-ipadic-neologd/’ ~/.mecabrc


試用データセット


https://github.com/IshidaMotohiro/TextMining


ソース


https://github.com/IshidaMotohiro/RMeCab


* 質問は以下に気楽に投げてください
RMeCab質問掲示板 http://rmecab.jp/new/forums/
Slack R wakalang http://rmecab.jp/new/forums/

No tags for this post.
カテゴリー: 未分類 パーマリンク