トップ
新規
一覧
単語検索
最終更新
ヘルプ
ログイン
アールメカブ
R2MeCab
をテンプレートにして作成
開始行:
[[RMeCab]]の簡易版
テキストマイニングのためのツール: データ解析・グラフィッ...
#contents
*参考文献 [#z0749aa7]
- ''&color(green){テキストマイニング入門};'':[[RMeCab]]...
&htmlinsert(amazontext,asin=4627848412,text=『Rによるテキ...
//『[[Rによるテキストマイニング入門:http://www.amazon.co....
を参照いただければ幸いです.
//- ''&color(green){テキストマイニング入門};'':[[RMeCab]...
//を参照いただければ幸いです.
*開発状況 [#y5588105]
- &color(green){2010年 04月29日 R2MeCab_0.14 (R-2.11.0 対...
- &color(green){2009年 12月17日 R2MeCab_0.13 (R-2.10.1 対...
- &color(green){2009年 8月25日 R2MeCab_0.12 (R-2.10.0 対...
- &color(green){2009年 8月25日 R2MeCab_0.11 (R-2.9.2対応)...
- &color(green){2009年 8月24日 R2MeCab_0.10: docDF()関数...
- &color(green){2009年 4月18日 R2MeCab_0.08: R-2.9.0への...
- &color(green){2009年 3月29日 R2MeCab_0.07: docDF()関数...
- &color(green){2009年 3月27日 R2MeCab_0.06: NgramDF2()...
- &color(green){2009年 3月23日 docDF()関数に共起行列を作...
- &color(green){2009年 3月10日 R2MeCab_0.04:デフォルトの...
- &color(green){2009年 3月9日 R2MeCab_0.03:微調整};
- &color(green){2009年 3月6日 R2MeCab_0.02:微調整};
- &color(green){2009年 3月6日 R2MeCab_0.01: 汎用的な docD...
*機能 [#gba3cd69]
//[[RMeCab機能]]にある三つの関数が使えます.
- &size(20){&color(blue){docDF()関数};};
//『Rによるテキストマイニング入門』森北書店には記載があり...
第 1 引数で指定されたファイル (フォルダが指定された場合は...
//target, column = 0, type = 0, pos = c("名詞","形容詞"),...
-- target : 引数はファイル名ないしフォルダ名,あるいはデー...
-- column : はデータフレームを指定する場合,列(番号ある...
-- type : 0 は文字のGramを 1はタームのGramを作成.デフォ...
-- pos : 引数は pos = c("名詞", "形容詞","記号") のように...
-- minFreq : 全文書を通じての総頻度の閾値を指定する.デ...
//が,docMatrix() 関数の場合とは異なり,全テキストを通じ...
-- N: は Ngram の場合の N の数.デフォルトは1
//-- sym: 未実装.
//引数は,抽出タームに句読点なので記号を含めるかを指定す...
//-- kigo = "記号": は総計に記号を含むか含まないか.sym =...
-- Genkei:活用語を原型 (0) にするか,表層形(1) にするか...
-- weight = "tf*idf*norm" などの重みを指定可能.デフォル...
-- nDF : N個のタームそれぞれを独立した列に取る.デフォル...
-- co 共起行列の作成
Ngram
> setwd("C:/data")
> (res <- docDF("doc")) # docフォルダの全ファイルを対象に
file = doc1.txt
file = doc2.txt
file = doc3.txt
file_name = doc/doc1.txt opened
file_name = doc/doc2.txt opened
file_name = doc/doc3.txt opened
number of extracted terms = 15
now making a data frame. wait a while!
Ngram doc1.txt doc2.txt doc3.txt
1 。 1 1 1
2 い 0 0 1
3 す 1 1 1
4 で 1 1 1
5 の 0 1 0
6 は 1 1 1
7 ま 0 0 1
8 を 0 0 1
9 ん 0 0 1
10 女 0 1 1
11 学 1 2 2
12 彼 0 1 1
13 数 0 1 1
14 生 1 1 0
15 私 1 0 0
ターム・文章行列
> (res <- docDF("doc", type = 1, N=1))
file = doc1.txt
file = doc2.txt
file = doc3.txt
file_name = doc/doc1.txt opened
file_name = doc/doc2.txt opened
file_name = doc/doc3.txt opened
number of extracted terms = 13
now making a data frame. wait a while!
TERM POS1 POS2 doc1.txt doc2.txt doc3.txt
1 。 記号 句点 1 1 1
2 いる 動詞 非自立 0 0 1
3 で 助詞 接続助詞 0 0 1
4 です 助動詞 * 1 1 0
5 の 助詞 連体化 0 1 0
6 は 助詞 係助詞 1 1 1
7 ます 助動詞 * 0 0 1
8 を 助詞 格助詞 0 0 1
9 学ぶ 動詞 自立 0 0 1
10 学生 名詞 一般 1 1 0
11 彼女 名詞 代名詞 0 1 1
12 数学 名詞 一般 0 1 1
13 私 名詞 代名詞 1 0 0
名詞と形容詞を対象にTri-gramで行列
> (res <- docDF("doc", pos = c("名詞","形容詞"), type = ...
number of extracted terms = 1
TERM POS1 POS2
1 彼女-数学-学生 名詞-名詞-名詞 代名詞-一般-一般
doc1.txt doc2.txt doc3.txt
0 1 0
データフレームを解析する
> (target <- read.csv("photo.csv"))
ID Sex Reply
1 1 M 写真とってくれよ
2 2 F 写真とってください
3 3 M 写真とってね
4 4 F 写真とってください
5 5 M 写真とってっす
# データフレームの3列目からBi-gram行列
> (res <- docDF(target, col = 3, N = 2))
# col はデータフレーム列あるいは名前
number of extracted terms = 13
Ngram Row1 Row2 Row3 Row4 Row5
1 く-だ 0 1 0 1 0
2 く-れ 1 0 0 0 0
3 さ-い 0 1 0 1 0
4 だ-さ 0 1 0 1 0
5 っ-す 0 0 0 0 1
6 っ-て 1 1 1 1 1
7 て-く 1 1 0 1 0
8 て-っ 0 0 0 0 1
9 て-ね 0 0 1 0 0
10 と-っ 1 1 1 1 1
11 れ-よ 1 0 0 0 0
12 写-真 1 1 1 1 1
13 真-と 1 1 1 1 1
タームのバイグラム
> (res <- docDF(target, col = 3, type = 1, N = 2))
number of extracted terms = 7
now making a data frame. wait a while!
TERM POS1 POS2 Row1 Row2 Row3...
1 くれる-よ 動詞-助詞 非自立-終助詞 1 0 0...
2 て-くださる 助詞-動詞 接続助詞-非自立 0 1 0...
3 て-くれる 助詞-動詞 接続助詞-非自立 1 0 0...
4 て-っす 助詞-助動詞 接続助詞-* 0 0 0...
5 て-ね 助詞-助詞 接続助詞-終助詞 0 0 1...
6 とる-て 動詞-助詞 自立-接続助詞 1 1 1...
7 写真-とる 名詞-動詞 一般-自立 1 1 1...
タームのバイグラムを表層形で
> (res <- docDF(target, col = 3, type = 1, N = 2, Genkei...
number of extracted terms = 7
now making a data frame. wait a while!
TERM POS1 POS2 Row1 Row2 Row3...
1 くれ-よ 動詞-助詞 非自立-終助詞 1 0 0...
2 て-ください 助詞-動詞 接続助詞-非自立 0 1 0...
3 て-くれ 助詞-動詞 接続助詞-非自立 1 0 0...
4 て-っす 助詞-助動詞 接続助詞-* 0 0 0...
5 て-ね 助詞-助詞 接続助詞-終助詞 0 0 1...
6 とっ-て 動詞-助詞 自立-接続助詞 1 1 1...
7 写真-とっ 名詞-動詞 一般-自立 1 1 1...
各タームを独立に列を取って
> (res <- docDF("doc", type=1, N=2,pos = c("名詞","動詞"),
Genkei = 1, nDF = 1))
...
number of extracted terms = 5
now making a data frame. wait a while!
N1 N2 POS1 POS2 doc1.txt doc2.txt doc3...
1 学ん い 動詞-動詞 自立-非自立 0 0 ...
2 彼女 数学 名詞-名詞 代名詞-一般 0 1 ...
3 数学 学ん 名詞-動詞 一般-自立 0 0 ...
4 数学 学生 名詞-名詞 一般-一般 0 1 ...
5 私 学生 名詞-名詞 代名詞-一般 1 0 ...
共起行列
> (res <- docDF("data/doc", type = 1, co = 1))
file_name = data/doc/doc1.txt opened
file_name = data/doc/doc2.txt opened
file_name = data/doc/doc3.txt opened
number of extracted terms = 13
now making a data frame. wait a while!
TERM POS1 POS2 。 いる で です の は ます を 学...
1 。 記号 句点 3 1 1 2 1 3 1 1 ...
2 いる 動詞 非自立 1 1 1 0 0 1 1 1 ...
3 で 助詞 接続助詞 1 1 1 0 0 1 1 1 ...
4 です 助動詞 * 2 0 0 2 1 2 0 0 ...
5 の 助詞 連体化 1 0 0 1 1 1 0 0 ...
6 は 助詞 係助詞 3 1 1 2 1 3 1 1 ...
7 ます 助動詞 * 1 1 1 0 0 1 1 1 ...
8 を 助詞 格助詞 1 1 1 0 0 1 1 1 ...
9 学ぶ 動詞 自立 1 1 1 0 0 1 1 1 ...
10 学生 名詞 一般 2 0 0 2 1 2 0 0 ...
11 彼女 名詞 代名詞 2 1 1 1 1 2 1 1 ...
12 数学 名詞 一般 2 1 1 1 1 2 1 1 ...
13 私 名詞 代名詞 1 0 0 1 0 1 0 0 ...
長文テキスト集合
> res <- docDF("writers", type = 1, N=1)
## 鴎外と漱石あわせて 8 テキスト.解析に数分かかります
> head(res)
TERM POS1 POS2 ogai_gan.txt ...
1 ' 名詞 サ変接続 0 ...
2 , 名詞 サ変接続 0 ...
3 あい 名詞 一般 0 ...
4 あか 名詞 一般 0 ...
5 あかるい 形容詞 自立 0 ...
6 あざやか 名詞 一般 0 ...
...
- &size(20){&color(blue){RMeCabC()関数};}; : 短文の処理
> library(RMeCab)
> kekka <- RMeCabC("すもももももももものうち")
> unlist(kekka)
# 第二引数 1 を加えると形態素原型を返します.
//1.1ヴァージョンより
> kekka <- RMeCabC("ご飯を食べた", 1)
> unlist(kekka)
# 名詞 助詞 動詞 助動詞
# "ご飯" "を" "食べる" "た"
# 第二引数なしだと
> kekka <- RMeCabC("ご飯を食べた")
> unlist(kekka)
# 名詞 助詞 動詞 助動詞
# "ご飯" "を" "食べ" "た"
# 名詞だけ取り出したければ
unlist(kekka) [names(unlist(kekka)) == "名詞"]
# ご飯
# R-2.8.0 をMacOSXやLinuxでご利用の場合は
# 以下の3行を実行しないと動作しないかもしれません
kekka <- unlist(kekka)
Encoding(kekka) <- "UTF-8"
Encoding(names(kekka)) <- "UTF-8"
/////////////////////////////////////////////////////////...
//# 入力する文章が長い場合は第三引数を指定してください....
// # 目安は入力する文章の文字数の2倍です。
// > kekka <- RMeCabC("...を食べた",0, 2056)
/////////////////////////////////////////////////////////...
- &size(20){&color(blue){RMeCabText()関数};}; : ファイ...
# その他,和布蕪の出力をそのままリスト形式で出力する関数
> RMeCabText("data/sakura.txt")
# こんな結果
#[[1]]
# [1] "昨日" "名詞" "副詞可能" "*" "*" ...
# [7] "*" "昨日" "キノウ" "キノー"
#
#[[2]]
# [1] "も" "助詞" "係助詞" "*" "*" "*" ...
# [9] "モ" "モ"
* &color(green){&size(20){インストール手順};}; [#u795b151]
基本的に [[RMeCab]] と変わりませんので,詳細はそちらを参...
- Windows の方は,まず''&color(red){[[MeCab:http://mecab....
- MeCabインストール後
Windowsの環境設定で MeCab へのパスを通します.最新の注意...
すなわちコントロール・パネルの[システム]アイテムを起動...
表示される[システムのプロパティ]ダイアログの[詳細設定...
(Windows 2000では[詳細]タブ)
をクリックし、[システム環境変数] の PATH の先頭に
C:\Program Files\MeCab\bin;
を追記します.最後のセミコロンを忘れないようにしてくださ...
- 次に ''&color(blue){R2MeCab_***.zip};'' をRにインスト...
* ダウンロード [#r43c8ffc]
- Windows
[[R2MeCab_0.14 for R-2.11.0 Windows 32 bit ここ:http://g...
&ref(R2MeCab_0.13.zip); for R-2.10.0 :Windows
&ref(R2MeCab_0.12.zip); for R-2.10.0 :Windows
&ref(R2MeCab_0.11.zip); for R-2.9.2 :Windows
&ref(R2MeCab_0.10.zip); for R-2.9.1 : Windows
&ref(R2MeCab_0.07.zip); for R-2.8.1
-- 試用データ &ref(SoftArchive/data.zip);
- Macintosh
[[R2MeCab_0.14 for R-2.11.0 on Mac ここ:http://groups.g...
&ref(R2MeCab_0.13.tgz); for R-2.10.0 :
&ref(R2MeCab_0.12.tgz); for R-2.10.0 :
&ref(R2MeCab_0.11.tgz); for R-2.9.2 :
&ref(R2MeCab_0.10.tgz); for R-2.9.1 :
&ref(R2MeCab_0.07.tgz); for R-2.8.1
- Linux
[[R2MeCab_0.14 for R-2.11.0 on Linux ここ:http://groups...
&ref(R2MeCab_0.13.tar.gz); for R-2.10.0 :
&ref(R2MeCab_0.12.tar.gz); for R-2.10.0 :
&ref(R2MeCab_0.11.tar.gz); for R-2.9.2 :
&ref(R2MeCab_0.10.tar.gz); for R-2.9.1 :
&ref(R2MeCab_0.07.tar.gz); for R-2.8.1
-- 試用データ &ref(SoftArchive/data.tar.gz);
* R の参考書 [#kf4f6471]
//&htmlinsert(amazontext,asin=,text=);
-&htmlinsert(amazontext,asin=4431712186,text=U・リゲス著...
-&htmlinsert(amazontext,asin=4431713123,text=B・エヴェリ...
-&htmlinsert(amazontext,asin=4431100474,text=P・スペクタ...
-&htmlinsert(amazontext,asin=4274067572,text=青木繁伸『R...
- &htmlinsert(amazontext,asin=4627096011,text=金明哲『Rに...
- &htmlinsert(amazontext,asin=4777511847,text=舟尾暢男『...
-&htmlinsert(amazontext,asin=4894717573,text=中澤港『Rに...
* お問い合わせ [#n854cdd7]
ishida-m(at_mark)ias.tokushima-u.ac.jp
にお願いします.
終了行:
[[RMeCab]]の簡易版
テキストマイニングのためのツール: データ解析・グラフィッ...
#contents
*参考文献 [#z0749aa7]
- ''&color(green){テキストマイニング入門};'':[[RMeCab]]...
&htmlinsert(amazontext,asin=4627848412,text=『Rによるテキ...
//『[[Rによるテキストマイニング入門:http://www.amazon.co....
を参照いただければ幸いです.
//- ''&color(green){テキストマイニング入門};'':[[RMeCab]...
//を参照いただければ幸いです.
*開発状況 [#y5588105]
- &color(green){2010年 04月29日 R2MeCab_0.14 (R-2.11.0 対...
- &color(green){2009年 12月17日 R2MeCab_0.13 (R-2.10.1 対...
- &color(green){2009年 8月25日 R2MeCab_0.12 (R-2.10.0 対...
- &color(green){2009年 8月25日 R2MeCab_0.11 (R-2.9.2対応)...
- &color(green){2009年 8月24日 R2MeCab_0.10: docDF()関数...
- &color(green){2009年 4月18日 R2MeCab_0.08: R-2.9.0への...
- &color(green){2009年 3月29日 R2MeCab_0.07: docDF()関数...
- &color(green){2009年 3月27日 R2MeCab_0.06: NgramDF2()...
- &color(green){2009年 3月23日 docDF()関数に共起行列を作...
- &color(green){2009年 3月10日 R2MeCab_0.04:デフォルトの...
- &color(green){2009年 3月9日 R2MeCab_0.03:微調整};
- &color(green){2009年 3月6日 R2MeCab_0.02:微調整};
- &color(green){2009年 3月6日 R2MeCab_0.01: 汎用的な docD...
*機能 [#gba3cd69]
//[[RMeCab機能]]にある三つの関数が使えます.
- &size(20){&color(blue){docDF()関数};};
//『Rによるテキストマイニング入門』森北書店には記載があり...
第 1 引数で指定されたファイル (フォルダが指定された場合は...
//target, column = 0, type = 0, pos = c("名詞","形容詞"),...
-- target : 引数はファイル名ないしフォルダ名,あるいはデー...
-- column : はデータフレームを指定する場合,列(番号ある...
-- type : 0 は文字のGramを 1はタームのGramを作成.デフォ...
-- pos : 引数は pos = c("名詞", "形容詞","記号") のように...
-- minFreq : 全文書を通じての総頻度の閾値を指定する.デ...
//が,docMatrix() 関数の場合とは異なり,全テキストを通じ...
-- N: は Ngram の場合の N の数.デフォルトは1
//-- sym: 未実装.
//引数は,抽出タームに句読点なので記号を含めるかを指定す...
//-- kigo = "記号": は総計に記号を含むか含まないか.sym =...
-- Genkei:活用語を原型 (0) にするか,表層形(1) にするか...
-- weight = "tf*idf*norm" などの重みを指定可能.デフォル...
-- nDF : N個のタームそれぞれを独立した列に取る.デフォル...
-- co 共起行列の作成
Ngram
> setwd("C:/data")
> (res <- docDF("doc")) # docフォルダの全ファイルを対象に
file = doc1.txt
file = doc2.txt
file = doc3.txt
file_name = doc/doc1.txt opened
file_name = doc/doc2.txt opened
file_name = doc/doc3.txt opened
number of extracted terms = 15
now making a data frame. wait a while!
Ngram doc1.txt doc2.txt doc3.txt
1 。 1 1 1
2 い 0 0 1
3 す 1 1 1
4 で 1 1 1
5 の 0 1 0
6 は 1 1 1
7 ま 0 0 1
8 を 0 0 1
9 ん 0 0 1
10 女 0 1 1
11 学 1 2 2
12 彼 0 1 1
13 数 0 1 1
14 生 1 1 0
15 私 1 0 0
ターム・文章行列
> (res <- docDF("doc", type = 1, N=1))
file = doc1.txt
file = doc2.txt
file = doc3.txt
file_name = doc/doc1.txt opened
file_name = doc/doc2.txt opened
file_name = doc/doc3.txt opened
number of extracted terms = 13
now making a data frame. wait a while!
TERM POS1 POS2 doc1.txt doc2.txt doc3.txt
1 。 記号 句点 1 1 1
2 いる 動詞 非自立 0 0 1
3 で 助詞 接続助詞 0 0 1
4 です 助動詞 * 1 1 0
5 の 助詞 連体化 0 1 0
6 は 助詞 係助詞 1 1 1
7 ます 助動詞 * 0 0 1
8 を 助詞 格助詞 0 0 1
9 学ぶ 動詞 自立 0 0 1
10 学生 名詞 一般 1 1 0
11 彼女 名詞 代名詞 0 1 1
12 数学 名詞 一般 0 1 1
13 私 名詞 代名詞 1 0 0
名詞と形容詞を対象にTri-gramで行列
> (res <- docDF("doc", pos = c("名詞","形容詞"), type = ...
number of extracted terms = 1
TERM POS1 POS2
1 彼女-数学-学生 名詞-名詞-名詞 代名詞-一般-一般
doc1.txt doc2.txt doc3.txt
0 1 0
データフレームを解析する
> (target <- read.csv("photo.csv"))
ID Sex Reply
1 1 M 写真とってくれよ
2 2 F 写真とってください
3 3 M 写真とってね
4 4 F 写真とってください
5 5 M 写真とってっす
# データフレームの3列目からBi-gram行列
> (res <- docDF(target, col = 3, N = 2))
# col はデータフレーム列あるいは名前
number of extracted terms = 13
Ngram Row1 Row2 Row3 Row4 Row5
1 く-だ 0 1 0 1 0
2 く-れ 1 0 0 0 0
3 さ-い 0 1 0 1 0
4 だ-さ 0 1 0 1 0
5 っ-す 0 0 0 0 1
6 っ-て 1 1 1 1 1
7 て-く 1 1 0 1 0
8 て-っ 0 0 0 0 1
9 て-ね 0 0 1 0 0
10 と-っ 1 1 1 1 1
11 れ-よ 1 0 0 0 0
12 写-真 1 1 1 1 1
13 真-と 1 1 1 1 1
タームのバイグラム
> (res <- docDF(target, col = 3, type = 1, N = 2))
number of extracted terms = 7
now making a data frame. wait a while!
TERM POS1 POS2 Row1 Row2 Row3...
1 くれる-よ 動詞-助詞 非自立-終助詞 1 0 0...
2 て-くださる 助詞-動詞 接続助詞-非自立 0 1 0...
3 て-くれる 助詞-動詞 接続助詞-非自立 1 0 0...
4 て-っす 助詞-助動詞 接続助詞-* 0 0 0...
5 て-ね 助詞-助詞 接続助詞-終助詞 0 0 1...
6 とる-て 動詞-助詞 自立-接続助詞 1 1 1...
7 写真-とる 名詞-動詞 一般-自立 1 1 1...
タームのバイグラムを表層形で
> (res <- docDF(target, col = 3, type = 1, N = 2, Genkei...
number of extracted terms = 7
now making a data frame. wait a while!
TERM POS1 POS2 Row1 Row2 Row3...
1 くれ-よ 動詞-助詞 非自立-終助詞 1 0 0...
2 て-ください 助詞-動詞 接続助詞-非自立 0 1 0...
3 て-くれ 助詞-動詞 接続助詞-非自立 1 0 0...
4 て-っす 助詞-助動詞 接続助詞-* 0 0 0...
5 て-ね 助詞-助詞 接続助詞-終助詞 0 0 1...
6 とっ-て 動詞-助詞 自立-接続助詞 1 1 1...
7 写真-とっ 名詞-動詞 一般-自立 1 1 1...
各タームを独立に列を取って
> (res <- docDF("doc", type=1, N=2,pos = c("名詞","動詞"),
Genkei = 1, nDF = 1))
...
number of extracted terms = 5
now making a data frame. wait a while!
N1 N2 POS1 POS2 doc1.txt doc2.txt doc3...
1 学ん い 動詞-動詞 自立-非自立 0 0 ...
2 彼女 数学 名詞-名詞 代名詞-一般 0 1 ...
3 数学 学ん 名詞-動詞 一般-自立 0 0 ...
4 数学 学生 名詞-名詞 一般-一般 0 1 ...
5 私 学生 名詞-名詞 代名詞-一般 1 0 ...
共起行列
> (res <- docDF("data/doc", type = 1, co = 1))
file_name = data/doc/doc1.txt opened
file_name = data/doc/doc2.txt opened
file_name = data/doc/doc3.txt opened
number of extracted terms = 13
now making a data frame. wait a while!
TERM POS1 POS2 。 いる で です の は ます を 学...
1 。 記号 句点 3 1 1 2 1 3 1 1 ...
2 いる 動詞 非自立 1 1 1 0 0 1 1 1 ...
3 で 助詞 接続助詞 1 1 1 0 0 1 1 1 ...
4 です 助動詞 * 2 0 0 2 1 2 0 0 ...
5 の 助詞 連体化 1 0 0 1 1 1 0 0 ...
6 は 助詞 係助詞 3 1 1 2 1 3 1 1 ...
7 ます 助動詞 * 1 1 1 0 0 1 1 1 ...
8 を 助詞 格助詞 1 1 1 0 0 1 1 1 ...
9 学ぶ 動詞 自立 1 1 1 0 0 1 1 1 ...
10 学生 名詞 一般 2 0 0 2 1 2 0 0 ...
11 彼女 名詞 代名詞 2 1 1 1 1 2 1 1 ...
12 数学 名詞 一般 2 1 1 1 1 2 1 1 ...
13 私 名詞 代名詞 1 0 0 1 0 1 0 0 ...
長文テキスト集合
> res <- docDF("writers", type = 1, N=1)
## 鴎外と漱石あわせて 8 テキスト.解析に数分かかります
> head(res)
TERM POS1 POS2 ogai_gan.txt ...
1 ' 名詞 サ変接続 0 ...
2 , 名詞 サ変接続 0 ...
3 あい 名詞 一般 0 ...
4 あか 名詞 一般 0 ...
5 あかるい 形容詞 自立 0 ...
6 あざやか 名詞 一般 0 ...
...
- &size(20){&color(blue){RMeCabC()関数};}; : 短文の処理
> library(RMeCab)
> kekka <- RMeCabC("すもももももももものうち")
> unlist(kekka)
# 第二引数 1 を加えると形態素原型を返します.
//1.1ヴァージョンより
> kekka <- RMeCabC("ご飯を食べた", 1)
> unlist(kekka)
# 名詞 助詞 動詞 助動詞
# "ご飯" "を" "食べる" "た"
# 第二引数なしだと
> kekka <- RMeCabC("ご飯を食べた")
> unlist(kekka)
# 名詞 助詞 動詞 助動詞
# "ご飯" "を" "食べ" "た"
# 名詞だけ取り出したければ
unlist(kekka) [names(unlist(kekka)) == "名詞"]
# ご飯
# R-2.8.0 をMacOSXやLinuxでご利用の場合は
# 以下の3行を実行しないと動作しないかもしれません
kekka <- unlist(kekka)
Encoding(kekka) <- "UTF-8"
Encoding(names(kekka)) <- "UTF-8"
/////////////////////////////////////////////////////////...
//# 入力する文章が長い場合は第三引数を指定してください....
// # 目安は入力する文章の文字数の2倍です。
// > kekka <- RMeCabC("...を食べた",0, 2056)
/////////////////////////////////////////////////////////...
- &size(20){&color(blue){RMeCabText()関数};}; : ファイ...
# その他,和布蕪の出力をそのままリスト形式で出力する関数
> RMeCabText("data/sakura.txt")
# こんな結果
#[[1]]
# [1] "昨日" "名詞" "副詞可能" "*" "*" ...
# [7] "*" "昨日" "キノウ" "キノー"
#
#[[2]]
# [1] "も" "助詞" "係助詞" "*" "*" "*" ...
# [9] "モ" "モ"
* &color(green){&size(20){インストール手順};}; [#u795b151]
基本的に [[RMeCab]] と変わりませんので,詳細はそちらを参...
- Windows の方は,まず''&color(red){[[MeCab:http://mecab....
- MeCabインストール後
Windowsの環境設定で MeCab へのパスを通します.最新の注意...
すなわちコントロール・パネルの[システム]アイテムを起動...
表示される[システムのプロパティ]ダイアログの[詳細設定...
(Windows 2000では[詳細]タブ)
をクリックし、[システム環境変数] の PATH の先頭に
C:\Program Files\MeCab\bin;
を追記します.最後のセミコロンを忘れないようにしてくださ...
- 次に ''&color(blue){R2MeCab_***.zip};'' をRにインスト...
* ダウンロード [#r43c8ffc]
- Windows
[[R2MeCab_0.14 for R-2.11.0 Windows 32 bit ここ:http://g...
&ref(R2MeCab_0.13.zip); for R-2.10.0 :Windows
&ref(R2MeCab_0.12.zip); for R-2.10.0 :Windows
&ref(R2MeCab_0.11.zip); for R-2.9.2 :Windows
&ref(R2MeCab_0.10.zip); for R-2.9.1 : Windows
&ref(R2MeCab_0.07.zip); for R-2.8.1
-- 試用データ &ref(SoftArchive/data.zip);
- Macintosh
[[R2MeCab_0.14 for R-2.11.0 on Mac ここ:http://groups.g...
&ref(R2MeCab_0.13.tgz); for R-2.10.0 :
&ref(R2MeCab_0.12.tgz); for R-2.10.0 :
&ref(R2MeCab_0.11.tgz); for R-2.9.2 :
&ref(R2MeCab_0.10.tgz); for R-2.9.1 :
&ref(R2MeCab_0.07.tgz); for R-2.8.1
- Linux
[[R2MeCab_0.14 for R-2.11.0 on Linux ここ:http://groups...
&ref(R2MeCab_0.13.tar.gz); for R-2.10.0 :
&ref(R2MeCab_0.12.tar.gz); for R-2.10.0 :
&ref(R2MeCab_0.11.tar.gz); for R-2.9.2 :
&ref(R2MeCab_0.10.tar.gz); for R-2.9.1 :
&ref(R2MeCab_0.07.tar.gz); for R-2.8.1
-- 試用データ &ref(SoftArchive/data.tar.gz);
* R の参考書 [#kf4f6471]
//&htmlinsert(amazontext,asin=,text=);
-&htmlinsert(amazontext,asin=4431712186,text=U・リゲス著...
-&htmlinsert(amazontext,asin=4431713123,text=B・エヴェリ...
-&htmlinsert(amazontext,asin=4431100474,text=P・スペクタ...
-&htmlinsert(amazontext,asin=4274067572,text=青木繁伸『R...
- &htmlinsert(amazontext,asin=4627096011,text=金明哲『Rに...
- &htmlinsert(amazontext,asin=4777511847,text=舟尾暢男『...
-&htmlinsert(amazontext,asin=4894717573,text=中澤港『Rに...
* お問い合わせ [#n854cdd7]
ishida-m(at_mark)ias.tokushima-u.ac.jp
にお願いします.
ページ名: