software
_ 試用データセット(2008年4月4日修正)
testSetWin.zip(Windowsの方、Shift-Jis) : &ref(): File not found: "testSetUnix.zip" at page "SoftArchive"; (MacおよびUnixユーザーの方, utf-8 ファイル): 解凍後,中に含まれる data フォルダごとドライブの先頭などにコピーして,その中のRMeCab?.R ファイル内のコードを実行します.詳しくはフォルダ内の README.txt を読んでください.
_ RMeCaBパッケージ
_ バージョン 0.45
ユーザ名とパスワードは半角で mecab です.
- Windows バイナリ,バージョン 0.45 &ref(): File not found: "RMeCab_0.45.zip" at page "SoftArchive";
- Macintosh バイナリ,バージョン 0.45 &ref(): File not found: "RMeCab_0.45.tgz" at page "SoftArchive";
- Linux バイナリ,バージョン 0.45 &ref(): File not found: "RMeCab_0.45.tar.gz" at page "SoftArchive";
_ バージョン 0.44
- Windows バイナリ,バージョン 0.44 &ref(): File not found: "RMeCab_0.44.zip" at page "SoftArchive";
- Macintosh バイナリ,バージョン 0.44 &ref(): File not found: "RMeCab_0.44.tgz" at page "SoftArchive";
- Linux バイナリ,バージョン 0.44 &ref(): File not found: "RMeCab_0.44.tar.gz" at page "SoftArchive";
- collocate 関数の出力に総トークン数と,総形態素数に関する情報を追加
_ バージョン 0.43
- Windows バイナリ,バージョン 0.43 &ref(): File not found: "RMeCab_0.43.zip" at page "SoftArchive";
- Macintosh バイナリ,バージョン 0.43 &ref(): File not found: "RMeCab_0.43.tgz" at page "SoftArchive";
- Linux バイナリ,バージョン 0.43 &ref(): File not found: "RMeCab_0.43.tar.gz" at page "SoftArchive";
_ バージョン 0.42
- Windows バイナリ,バージョン 0.42 &ref(): File not found: "RMeCab_0.42.zip" at page "SoftArchive";
- Macintosh バイナリ,バージョン 0.42 &ref(): File not found: "RMeCab_0.42.tgz" at page "SoftArchive";
- Linux バイナリ,バージョン 0.42 &ref(): File not found: "RMeCab_0.42.tar.gz" at page "SoftArchive";
- N-gramカウント,およびコロケーションカウント用の関数を追加
_ バージョン 0.41
- Windows バイナリ,バージョン 0.41 &ref(): File not found: "RMeCab_0.41.zip" at page "SoftArchive";
- Macintosh バイナリ,バージョン 0.41 &ref(): File not found: "RMeCab_0.41.tgz" at page "SoftArchive";
- Linux バイナリ,バージョン 0.41 &ref(): File not found: "RMeCab_0.41.tar.gz" at page "SoftArchive";
- バージョン 0.40 で文書行列に TF-IDF などの重み付けを行う場合, [ [TOTAL-TOKENS] ] 行や[ [LESS-THAN-1] ] 行まで含めて計算していたのを修正し,これらの行を削除した結果に重み付けを行うようにした.
_ バージョン 0.40
- Windows バイナリ,バージョン 0.40 &ref(): File not found: "RMeCab_0.40.zip" at page "SoftArchive";
- Macintosh バイナリ,バージョン 0.40 &ref(): File not found: "RMeCab_0.40.tgz" at page "SoftArchive";
- Linux バイナリ,バージョン 0.40 &ref(): File not found: "RMeCab_0.40.tar.gz" at page "SoftArchive";
- バージョン 0.39 docMatrix()関数に minFreq オプションを復活させた.また品詞や最低頻度を指定して文書行列を出力する際,テキストの総語数などの情報を表示させる.例えばテキストの総token数は [ [TOTAL-TOKENS] ]という行に,また指定された品詞(pos <- c("名詞","
形容詞","動詞") )のうち,指定された頻度(minFreq =1) 未満のものを, [ [LESS-THAN-1] ] という行として,文書行列に含めた.
_ バージョン 0.39
- Windows バイナリ,バージョン 0.39 &ref(): File not found: "RMeCab_0.39.zip" at page "SoftArchive";
- Macintosh バイナリ,バージョン 0.39 &ref(): File not found: "RMeCab_0.39.tgz" at page "SoftArchive";
- Linux バイナリ,バージョン 0.39 &ref(): File not found: "RMeCab_0.39.tar.gz" at page "SoftArchive";
- 文書ターム行列を作成する際,文書が大きいとメモリが足りなくなり R が落ちることがある。そこでC++ソースを見直して,メモリの調整を行った。
_ バージョン 0.38
- Windows バイナリ,バージョン 0.38 &ref(): File not found: "RMeCab_0.38.zip" at page "SoftArchive";
- Macintosh バイナリ,バージョン 0.38 &ref(): File not found: "RMeCab_0.38.tgz" at page "SoftArchive";
- Linux バイナリ,バージョン 0.38 &ref(): File not found: "RMeCab_0.38.tar.gz" at page "SoftArchive";
- 文書ターム行列を作成する際,文書が大きいとメモリが足りなくなり R が落ちることがある。そこでC++ソースを見直して,メモリの調整を行った。
_ バージョン 0.37
- Windows バイナリ,バージョン 0.37
- Macintosh バイナリ,バージョン 0.37
- Linux バイナリ,バージョン 0.37
- 英文マニュアルを一部追加作成.MeCab? は辞書にない単語の原形を * として返してしまうことがあることに気がついた.
陀多と云う男が一人
陀多 名詞,一般,*,*,*,*,*
そこで,こうした場合,入力された語形をそのまま返すよう修正.またC++コードを見直して,メモリ管理を多少改善させた.に RMeCabDoc?()関数を追加.これに伴い,RMeCabDoc?.R,RMeCabDoc?.Rd を追加した.
_ バージョン 0.36
- Windows バイナリ,バージョン 0.36 &ref(): File not found: "RMeCab_0.36.zip" at page "SoftArchive";
- Macintosh バイナリ,バージョン 0.36 &ref(): File not found: "RMeCab_0.36.tgz" at page "SoftArchive";
- Linux バイナリ,バージョン 0.36 &ref(): File not found: "RMeCab_0.36.tar.gz" at page "SoftArchive";
- 英文マニュアルを一部追加作成.docMatrix ()関数がファイルの一行目しか読んでいないバグを修正.C++コードに RMeCabDoc?()関数を追加.これに伴い,RMeCabDoc?.R,RMeCabDoc?.Rd を追加した.
_ バージョン 0.35
- Windows バイナリ,バージョン 0.35 &ref(): File not found: "RMeCab_0.35.zip" at page "SoftArchive";
- Macintosh バイナリ,バージョン 0.35 &ref(): File not found: "RMeCab_0.35.tgz" at page "SoftArchive";
- Linux バイナリ,バージョン 0.35 &ref(): File not found: "RMeCab_0.35.tar.gz" at page "SoftArchive";
- 英文マニュアルを一部作成.C++コードを一部手直した.それに関連して R コードを見直した.
_ バージョン 0.34
- Windows バイナリ,バージョン 0.34
- Macintosh バイナリ,バージョン 0.34
- Linux バイナリ,バージョン 0.34
- 日本語・文書ターム行列の作成関数を追加.また行列に重み(TF/IDF)をつけられるようにした.
_ バージョン 0.33
- Windows バイナリ,バージョン 0.33 &ref(): File not found: "RMeCab_0.33.zip" at page "SoftArchive";
- Macintosh バイナリ,バージョン 0.33 &ref(): File not found: "RMeCab_0.33.tgz" at page "SoftArchive";
- データフレームを第一引数として,第二引数で指定された列に含まれる日本語文章を解析して返す.
_ バージョン 0.32
- Windows バイナリ,バージョン 0.32 &ref(): File not found: "RMeCab_0.32.zip" at page "SoftArchive";
- Macintosh バイナリ,バージョン 0.32 &ref(): File not found: "RMeCab_0.32.tgz" at page "SoftArchive";
- ファイルを読み込んで形態素原型とその頻度表を作成し,データフレームとして返す関数を追加
_ バージョン 0.2
- Windows バイナリ,バージョン 0.2 &ref(): File not found: "RMeCab_0.2.zip" at page "SoftArchive";
- Macintosh バイナリ,バージョン 0.2 &ref(): File not found: "RMeCab_0.2.tgz" at page "SoftArchive";
_ バージョン 0.1
_ ご感想などのご報告