SoftArchive のバックアップ(No.12) - アールメカブ

アールメカブ


SoftArchive のバックアップ(No.12)


software

_ 試用データセット(2008年3月31日修正)

filetestSetWin.zip(Windowsの方、Shift-Jis) : &ref(): File not found: "testSetUnix.zip" at page "SoftArchive"; (MacおよびUnixユーザーの方, utf-8 ファイル): 解凍後,中に含まれる data フォルダごとドライブの先頭などにコピーして,その中のRMeCab?.R ファイル内のコードを実行します.詳しくはフォルダ内の README.txt を読んでください.

_ RMeCaBパッケージ

_ バージョン 0.38

  • Windows バイナリ,バージョン 0.38 &ref(): File not found: "RMeCab_0.38.zip" at page "SoftArchive";
  • Macintosh バイナリ,バージョン 0.38 &ref(): File not found: "RMeCab_0.38.tgz" at page "SoftArchive";
  • Linux バイナリ,バージョン 0.38 &ref(): File not found: "RMeCab_0.38.tar.gz" at page "SoftArchive";
    • 文書ターム行列を作成する際,文書が大きいとメモリが足りなくなり R が落ちることがある。そこでC++ソースを見直して,メモリの調整を行った。

_ バージョン 0.37

  • Windows バイナリ,バージョン 0.37
  • Macintosh バイナリ,バージョン 0.37
  • Linux バイナリ,バージョン 0.37
    • 英文マニュアルを一部追加作成.MeCab? は辞書にない単語の原形を * として返してしまうことがあることに気がついた.
      陀多と云う男が一人
      陀多    名詞,一般,*,*,*,*,*

そこで,こうした場合,入力された語形をそのまま返すよう修正.またC++コードを見直して,メモリ管理を多少改善させた.に RMeCabDoc?()関数を追加.これに伴い,RMeCabDoc?.R,RMeCabDoc?.Rd を追加した.

_ バージョン 0.36

  • Windows バイナリ,バージョン 0.36 &ref(): File not found: "RMeCab_0.36.zip" at page "SoftArchive";
  • Macintosh バイナリ,バージョン 0.36 &ref(): File not found: "RMeCab_0.36.tgz" at page "SoftArchive";
  • Linux バイナリ,バージョン 0.36 &ref(): File not found: "RMeCab_0.36.tar.gz" at page "SoftArchive";
    • 英文マニュアルを一部追加作成.docMatrix ()関数がファイルの一行目しか読んでいないバグを修正.C++コードに RMeCabDoc?()関数を追加.これに伴い,RMeCabDoc?.R,RMeCabDoc?.Rd を追加した.

_ バージョン 0.35

  • Windows バイナリ,バージョン 0.35 &ref(): File not found: "RMeCab_0.35.zip" at page "SoftArchive";
  • Macintosh バイナリ,バージョン 0.35 &ref(): File not found: "RMeCab_0.35.tgz" at page "SoftArchive";
  • Linux バイナリ,バージョン 0.35 &ref(): File not found: "RMeCab_0.35.tar.gz" at page "SoftArchive";
    • 英文マニュアルを一部作成.C++コードを一部手直した.それに関連して R コードを見直した.

_ バージョン 0.34

  • Windows バイナリ,バージョン 0.34
  • Macintosh バイナリ,バージョン 0.34
  • Linux バイナリ,バージョン 0.34
    • 日本語・文書ターム行列の作成関数を追加.また行列に重み(TF/IDF)をつけられるようにした.

_ バージョン 0.33

  • Windows バイナリ,バージョン 0.33 &ref(): File not found: "RMeCab_0.33.zip" at page "SoftArchive";
  • Macintosh バイナリ,バージョン 0.33 &ref(): File not found: "RMeCab_0.33.tgz" at page "SoftArchive";
    • データフレームを第一引数として,第二引数で指定された列に含まれる日本語文章を解析して返す.

_ バージョン 0.32

  • Windows バイナリ,バージョン 0.32 &ref(): File not found: "RMeCab_0.32.zip" at page "SoftArchive";
  • Macintosh バイナリ,バージョン 0.32 &ref(): File not found: "RMeCab_0.32.tgz" at page "SoftArchive";
    • ファイルを読み込んで形態素原型とその頻度表を作成し,データフレームとして返す関数を追加

_ バージョン 0.2

  • Windows バイナリ,バージョン 0.2 &ref(): File not found: "RMeCab_0.2.zip" at page "SoftArchive";
  • Macintosh バイナリ,バージョン 0.2 &ref(): File not found: "RMeCab_0.2.tgz" at page "SoftArchive";
    • 形態素原型をえるオプションを追加

_ バージョン 0.1

  • Linux バイナリ,バージョン 0.1
    • とりあえず動くだけのもの.