SoftArchive のバックアップ(No.100) - アールメカブ

アールメカブ


SoftArchive のバックアップ(No.100)


software

Rここ から,自分のOSにあったファイルをダウンロードしてください.例えばWindows版なら,[Windows]->[base]とクリックし,R-2.*.*-win32.exeをダウンロードします.後はダブルクリックを繰り返せばインストールできます.なお、Windows版の場合は起動直後に日本語の設定をしてください。メニューの [編集]->[GUIプリファレンス]->[Font] で MS Gothic を選び [save] を押して、保存先はデフォルトそのままにマイドキュメントに保存します。その後は [OK] を押して操作を続行します。なおRを終了させる際、workspace(作業情報)を保存するかと聞いてきますが,Yes でも No でもどちらでもお好みで。

_ 注意

ダウンロードの際、ファイル名を一切変更しないください! . Rはインストール時に、ファイル名と中身のチェックを行います.ファイル名が中身の情報と一致しない場合、インストールは行われません.特に Internet Explorer 6 はファイル名に [1] を付記することがあります.この場合は手作業でファイル名を元通りに変更してください.

_ 開発状況

  • 2012 年 06 月 25 日 RMeCab_0.995 公開 for R-2.15.1 mecab_0.994 に対応させたバイナリです.
  • 2012 年 04 月 03 日 Windows 版 RMeCab_0.994 (R-2.15.0) 公開 Windows 64 bit 版で生じていた一部不具合を修正
  • 2012 年 03 月 03 日 Windows 版 RMeCab_0.99{0}2.zip (R-2.14.2) 公開
  • 2012 年 02 月 17 日 RMeCab_0.990/1 (R-2.14.1 対応) mecab-0.98 と mecab-0.993 それぞれ別々に対応したバイナリを作り直しました. 前者用が RMeCab_0.990 後者用が RMeCab_0.991 です.
  • 2011 年 12 月 30 日 RMeCab_0.99 (R-2.14.1 対応) R-2.14.0 でis.nan関数の仕様に変更があったので,これにあわせRスクリプトを書き直しました.その他に変更はありません. なお開発は MeCab_0.98 をベースにしていますが,最近公開された最新のMeCab_0.99 でも動作します.
  • 2011 年 11 月 01 日 RMeCab_0.98 (R-2.14.0 対応) R-2.14.0 用にコンパイルし直しました.また Windows用 64bit バイナリに修正を加えました.その他に変更はありません.
  • 2011 年 10 月 11 日 RMeCab_0.97 (R-2.13.2 対応) R-2.13.2 用にコンパイルし直しました.また Windows用 64bit バイナリに修正を加えました.その他に変更はありません.
  • 2011 年 07 月 11 日 RMeCab_0.96 (R-2.13.1 対応) R-2.13.1 用にコンパイルし直しました.また Windows用 64bit バイナリに修正を加えました.その他に変更はありません.
  • 2011 年 04 月 14 日 RMeCab_0.95 (R-2.13.0 対応) R-2.13.0 用にコンパイルし直しました.また Windows用 64bit バイナリに修正を加えました.その他に変更はありません.
  • 2011 年 03 月 02 日 RMeCab_0.94 (R-2.12.2 対応) R-2.12.2 用にコンパイルし直しました.特に変更はありません.Windows1の場合,R 32 bit あるいは R 64 bit のいずれかで 1 回インストールします.どちらでも使えるようになります.手動で libmecab.dll をコピーなどする必要はありません,
  • 2010年 12 月 18 日 RMeCab_0.93 (R-2.12.1 対応) R 32 bit あるいは R 64 bit のいずれかで 1 回インストールします.どちらでも使えるようになります.
  • 2010年 10 月 18 日 RMeCab_0.92 (R-2.12.0対応) R 32 bit あるいは R 64 bit のいずれかで 1 回インストールします.どちらでも使えるようになります.
  • 2010年 8月26日 RMeCab_0.91 (R-2.11.1対応) mecabへの引数を追加
  • 2010年 6月04日 RMeCab_0.90 (R-2.11.1対応) R-2.11.1 への対応以外に変更なし
  • 2010年 5月10日 RMeCab_0.89 (R-2.11.0対応) すべての関数に dic 引数を追加し, ユーザー辞書を実行時にして出きるようにした(利用例 RMeCab.R utf-8 ).また Windows版には libmecab.dll を同封した.
  • 2010年 4月23日 RMeCab_0.88 (R-2.11.0対応) collocate()関数の出力を変更.nodeの前と後それぞれの頻度を加えた.
  • 2009年 12月17日 RMeCab_0.87 (R-2.10.1 対応): 特に変更なし.
  • 2009年 11月12日 RMeCab_0.86 (R-2.10.0対応): docNgramDF()関数のバグを修正。
  • 2009年 8月25日 RMeCab_0.85 (R-2.10.0対応): MeCab?本体の最新バージョン(0.98)と組み合わせた。ほかに変更なし。
  • 2009年 8月25日 RMeCab_0.84 (R-2.9.2対応): あわせてdocNgram2(), docNgramDF()関数にバグがあったので修正.
  • 2009年 8月24日 RMeCab_0.83: NgramDF(), docDF()関数にバグがあったので修正.
  • 2009年 5月23日 RMeCab_0.82: collocate()関数のバグを修正.
  • 2009年 4月18日 RMeCab_0.79: R-2.9.0に対応.
  • 2009年 3月28日 RMeCab_0.78: docDF()関数の効率が悪かった(解析に異常に時間がかかった)のを修正.また docNgramDF()関数は他の関数と異なり,文書(被験者回答)が行でタームが列なので,重み付け関数に行と列の指定ができるようにした.
  • 2009年 3月28日 RMeCab_0.77: docDF()関数の効率が悪いので,とりあえずデータフレームの特定列を対象に,文字ないしタームの N-gram行列を抽出する docNgramDF()関数を追加しておいた
  • 2009年 3月27日 RMeCab_0.76: NgramDF2()関数にバグがあったのを修正.またフリーズと誤解されないよう解析中に * を出力するようにした.
  • 2009年 3月23日 RMeCab_0.75: docDF()関数に co 引数を追加.ターム共起行列を作成する.
  • 2009年 3月19日 RMeCab_0.74: docMatrix()関数,docMatrix2()関数,docMatrixDF()関数に co 引数を追加.ターム共起行列を作成する.
  • 2009年 3月10日 RMeCab_0.73: docDF()関数のデフォルトのターム出力を全品詞に修正.
  • 2009年 3月5日 RMeCab_0.70: 汎用的な docDF()関数を追加.単独ファイル,ディレクトリ,あるいはデータフレームの特定列を対象に Ngram あるいは ターム文書行列を作成する.
  • 2009年 2月10日 RMeCab_0.67のRMeCabFreq?()関数にバグがあった.内部でセパレータに , を利用していたため,このトークンを持つファイルを処理すると R が落ちてしまった.RMeCab_0.68を作成.
  • 2008年 12月24日 R-2.8.1 用バイナリを作成.R-2.8.0には文字コードの不具合があったので修正を待っていた.
  • 2008年 11月05日 R-2.8.1 バイナリを作成 R-2.8.0には文字コードに関する不具合あり.
  • 2008年 11月07日 Mac OS X 版,Linux版 R-2.8.0 に合わせたデータ修正.マニュアルも修正
  • 2008年 11月05日 R-2.8.0 バイナリを作成
  • 2008年 09月2日 RMeCab0.61 でとりあえず安定版とする
  • 機能追加 2008年 08月23日: RMeCab? 本体にdocMatrix2()関数、docNgram2()関数、NgramDF2()関数を追加。それぞれ旧来のdocMatrix()関数、docNgram()関数、NgramDF()関数に機能を追加したもの。詳しくは、試用データセットfiledata2.zip (Windows), filedata2.tar.gz (Mac, Unix) の fileRMeCab.R コード内のコメント、あるいはマニュアル filemanual081108.pdfをご参照ください.
  • 2008年 08月15日: RMeCab? 本体をアップデート(docMatrix()関数のメッセージを少し詳しいものに変更.RMeCabDF()関数に列番号と列名のどちらでも指定できるようにした)
  • 2008年 8月2日: Rのライブラリがユーザーホームにある場合の環境設定ファイルfileRMeCabInstallXP.batfileRMeCabInstallVista.bat を作成
  • 2008年 08月18日: RMeCab? 本体に関数を追加.docMatrixDF()関数は,データフレームの指定列を対象に文書・ターム行列を作成.あわせて,マニュアル filemanual0818.pdfとデータセット filedata.zip (Windows), filedata.tar.gz (Mac, Unix)を作成し直した.
  • 2008年 08月15日: RMeCab? 本体をアップデート(docMatrix()関数のメッセージを少し詳しいものに変更.RMeCabDF()関数に列番号と列名のどちらでも指定できるようにした)
  • 2008年 8月2日: Rのライブラリがユーザーホームにある場合の環境設定ファイルfileRMeCabInstallXP.batfileRMeCabInstallVista.bat を作成
  • 2008年 07月22日: RMeCab? 本体をアップデート(Ngram()関数の文字カウント機能のバグをフィックス)
  • 2008年 06月28日: docMatrix関数に出力メッセージを追加
  • 2008年 06月26日: RMeCab? 本体をアップデート(RMeCabC関数のメモリ関係のバグをフィックス)
  • 2008年 06月18日: RMeCab? 本体をアップデート(微調整で機能に変化なし)
  • 2008年 06月14日: RMeCab? 本体と試用データセットfilemanual.pdf をアップデート

_ 使い方の手引き

  • 2009年以降追加した関数や機能の説明はありません) filemanual081108.pdf
    • お問い合わせはメールをください ishida-m(この部分を"@"に変更下さい)ias.tokushima-u.ac.jp

_ 現在のヴァージョン

_ RMeCab_0.995 for R-2.15.1

mecab_0.994 に対応させたバイナリです.

_ RMeCab_0.994 は mecab_0.993 に対応させたバイナリです.機能は RMeCab0.99 と変わりません.

  • Windows (32/64) 用バイナリ(R-2.15.0) 
    • Windows 64 bit 版での一部不具合を修正 バージョン 0.994  fileRMeCab_0.994.zip for mecab_0.993.exe ; 
  • Mac
    • Mac Lion 用 64 bit バイナリ(mecab_0.993 + R-2.15.0 アプリケーションの R64 で利用)

fileRMeCab_0.994.tgz mecab_0.993 に対応させたバイナリです

  • Snow Leopard 用 64 bit バイナリ(mecab_0.993 + R-2.15.0 アプリケーションの R64 で利用)

fileRMeCab_0.9904.tgz mecab_0.993 に対応させたバイナリです

  • Linux 32 bit バイナリ(mecab_0.993 + R-2.15.0) RMeCab_0.994 は mecab_0.993 に対応させたバイナリです.機能は RMeCab0.99 と変わりません.

fileRMeCab_0.994_R_i686-pc-linux-gnu.tar.gz

  • 少し枯れた RMeCab? gcc4.3.3 と (自力コンパイルされた)filemecab-0.98.tar.gz との組み合わせ:

fileRMeCab_0.990_R_i686-pc-linux-gnu.tar.gz

  • Linux 64 bit バイナリ(R-2.15.0)

fileRMeCab_0.994_R_x86_64-unknown-linux-gnu.tar.gz

  • 少し枯れた RMeCab? gcc4.3.3 と (自力コンパイルされた)filemecab-0.98.tar.gz との組み合わせ:

fileRMeCab_0.990_R_x86_64-unknown-linux-gnu.tar.gz (おなじファイルはhttp://sites.google.com/site/rmecab/ にもあります)

_ バージョン 0.99{0}{2,3} (R-2.14.2) 2012年 03 月 03 日

RMeCab_0.99{2,3} は mecab_0.993 に対応させたバイナリです.機能は RMeCab0.99 と変わりません.

RMeCab_0.9902 は filemecab-0.98.tar.gz に対応させたバイナリです.機能は RMeCab0.99 と変わりません.

  • 注意:RMeCab_0.9902 以前ではWindows 64 bit版で若干動作が不安定です.例えば以下は Windows 64 bit 版R-2.14.2 用 RMeCab_0.9902 でファイルの読み込みに失敗するがあるかもしれません.
    res <- docDF ( doc) # 一度目は期待通り抽出するが
    res <- docDF ( doc) # 続けて実行するとタームをまったく抽出してくれない
    そこで RMeCab_0.9902 を Windows 64 bit 版 R-2.14.2 で使う場合,以下のように try() 関数でラップして実行してください.
    ''res <- try(RMeCabC("日本語の文字列"))''
    ''res <- try ( docDF (doc)  )''
    try 関数内部で実行することでエラーが起こることがないと思います. RMeCab_0.9902 以前でも Windows 32 bit 版 R-2.14.2 では,try() 関数を使う必要はありません.
  • Mac Lion / Snow Leopard 用 64 bit バイナリ(mecab_0.993 + R-2.14.2 アプリケーションの R64 で利用)

fileRMeCab_0.992.tgz mecab_0.993 に対応させたバイナリです

  • Mac Lion / Snow Leopard 用 64 bit バイナリ(mecab_0.98 + R-2.14.2 アプリケーションの R64 で利用)

fileRMeCab_0.9902.tgz filemecab-0.98.tar.gz に対応させたバイナリです

  • Linux 32 bit バイナリ(mecab_0.993 + R-2.14.2),バージョン 0.992 or 0.9902

RMeCab_0.992 は mecab_0.993 に対応させたバイナリです.機能は RMeCab0.99 と変わりません.

RMeCab_0.9902 は filemecab-0.98.tar.gz に対応させたバイナリです.機能は RMeCab0.99 と変わりません.

fileRMeCab_0.992_R_i686-pc-linux-gnu.tar.gz

(おなじファイルはhttp://sites.google.com/site/rmecab/ にもあります)

  • Linux 64 bit バイナリ(R-2.14.2),バージョン 0.992 or 0.9902

fileRMeCab_0.992_R_x86_64-unknown-linux-gnu.tar.gz

_ バージョン 0.99{0}{2,3} (R-2.14.2) 2012年 03 月 03 日

RMeCab_0.99{2,3} は mecab_0.993 に対応させたバイナリです.機能は RMeCab0.99 と変わりません.

RMeCab_0.9902 は filemecab-0.98.tar.gz に対応させたバイナリです.機能は RMeCab0.99 と変わりません.

  • 注意:RMeCab_0.9902 以前ではWindows 64 bit版で若干動作が不安定です.例えば以下は Windows 64 bit 版R-2.14.2 用 RMeCab_0.9902 でファイルの読み込みに失敗するがあるかもしれません.
    res <- docDF ( doc) # 一度目は期待通り抽出するが
    res <- docDF ( doc) # 続けて実行するとタームをまったく抽出してくれない
    そこで RMeCab_0.9902 を Windows 64 bit 版 R-2.14.2 で使う場合,以下のように try() 関数でラップして実行してください.
    ''res <- try(RMeCabC("日本語の文字列"))''
    ''res <- try ( docDF (doc)  )''
    try 関数内部で実行することでエラーが起こることがないと思います. RMeCab_0.9902 以前でも Windows 32 bit 版 R-2.14.2 では,try() 関数を使う必要はありません.
  • Mac Lion / Snow Leopard 用 64 bit バイナリ(mecab_0.993 + R-2.14.2 アプリケーションの R64 で利用)

fileRMeCab_0.992.tgz mecab_0.993 に対応させたバイナリです

  • Mac Lion / Snow Leopard 用 64 bit バイナリ(mecab_0.98 + R-2.14.2 アプリケーションの R64 で利用)

fileRMeCab_0.9902.tgz filemecab-0.98.tar.gz に対応させたバイナリです

  • Linux 32 bit バイナリ(mecab_0.993 + R-2.14.2),バージョン 0.992 or 0.9902

RMeCab_0.992 は mecab_0.993 に対応させたバイナリです.機能は RMeCab0.99 と変わりません.

RMeCab_0.9902 は filemecab-0.98.tar.gz に対応させたバイナリです.機能は RMeCab0.99 と変わりません.

fileRMeCab_0.992_R_i686-pc-linux-gnu.tar.gz

(おなじファイルはhttp://sites.google.com/site/rmecab/ にもあります)

  • Linux 64 bit バイナリ(R-2.14.2),バージョン 0.992 or 0.9902

fileRMeCab_0.992_R_x86_64-unknown-linux-gnu.tar.gz

_ バージョン 0.990/1 (R-2.14.1) 2012年 02 月 17 日

RMeCab_0.991 は mecab_0.993 に対応させたバイナリです.機能は RMeCab0.99 と変わりません.

RMeCab_0.990 は mecab_0.98 に対応させたバイナリです.機能は RMeCab0.99 と変わりません.

Windows 版は mecab-0.98 での利用をお勧めします.win32バイナリ mecab_0.98 は http://sourceforge.net/projects/mecab/files/mecab-win32/0.98/mecab-0.98.exe/download からダウロードできます.

Windows版 Rのための 32 bit および 64 bit 両方への対応.libmecabとlibmecab64を同封しています.

  • Windows (32/64) 用バイナリ(R-2.14.1) ,バージョン 0.990 &ref(): File not found: "RMeCab_0.990.zip" at page "SoftArchive";

注意:Windows 64 bit版 R-2.14.1 用 RMeCab? では若干動作が不安定です.例えば以下は Windows 64 bit 版R-2.14.1 用 RMeCab? でファイルの読み込みに失敗するがあるかもしれません.

res <- docDF ( doc) # 一度目は期待通り抽出するが
res <- docDF ( doc) # 続けて実行するとタームをまったく抽出してくれない

そこで Windows 64 bit 版 R-2.14.1 用 RMeCab? では以下のよう try() 関数でラップして実行してください.

''res <- try(RMeCabC("日本語の文字列"))''
''res <- try ( docDF (doc)  )''

try 関数内部で実行することでエラーが起こることがないと思います.

Windows 32 bit 版 R-2.14.1 では,try() 関数を使う必要はありません.

  • Mac Lion / Snow Leopard 用 64 bit バイナリ(mecab_0.993 + R-2.14.1 アプリケーションの R64 で利用)

fileRMeCab_0.991.tgz

  • Mac Lion / Snow Leopard 用 64 bit バイナリ(mecab_0.98 + R-2.14.1 アプリケーションの R64 で利用)

fileRMeCab_0.990.tgz

  • Linux 32 bit バイナリ(mecab_0.993 + R-2.14.1),バージョン 0.991

RMeCab_0.991 は mecab_0.993 に対応させたバイナリです.機能は RMeCab0.99 と変わりません.

RMeCab_0.990 は filemecab-0.98.tar.gz に対応させたバイナリです.機能は RMeCab0.99 と変わりません.

fileRMeCab_0.991_R_i686-pc-linux-gnu.tar.gz

(おなじファイルはhttp://sites.google.com/site/rmecab/ にもあります)

  • Linux 64 bit バイナリ(R-2.14.1),バージョン 0.99

fileRMeCab_0.991_R_x86_64-unknown-linux-gnu.tar.gz

_ バージョン 0.99 (R-2.14.1) 2011年 12 月 29 日

Windows版 Rのための 32 bit および 64 bit 両方への対応.libmecabとlibmecab64を同封しています.

  • Windows (32/64) 用バイナリ(R-2.14.1) ,バージョン 0.99 fileRMeCab_0.99.zip

注意:Windows 64 bit版 R-2.14.1 用 RMeCab? では若干動作が不安定です.例えば以下は Windows 64 bit 版R-2.14.1 用 RMeCab? でファイルの読み込みに失敗するがあるかもしれません.

res <- docDF ( doc) # 一度目は期待通り抽出するが
res <- docDF ( doc) # 続けて実行するとタームをまったく抽出してくれない

そこで Windows 64 bit 版 R-2.14.1 用 RMeCab? では以下のよう try() 関数でラップして実行してください.

''res <- try(RMeCabC("日本語の文字列"))''
''res <- try ( docDF (doc)  )''

try 関数内部で実行することでエラーが起こることがないと思います.

Windows 32 bit 版 R-2.14.1 では,try() 関数を使う必要はありません.

ダウンロード後ファイル名を RMeCab_0.99.tar.gz と修正する必要があるかもしれません。

_ バージョン 0.98 (R-2.14.0) 2011年 11 月 01 日

Windows版 Rのための 32 bit および 64 bit 両方への対応.libmecabとlibmecab64を同封しています.

  • Windows (32/64) 用バイナリ(R-2.14.0) ,バージョン 0.98 fileRMeCab_0.98.zip

注意:Windows 64 bit版 R-2.14.0 用 RMeCab? では若干動作が不安定です.例えば以下は Windows 64 bit 版R-2.14.0 用 RMeCab? でファイルの読み込みに失敗するがあるかもしれません.

res <- docDF ( doc) # 一度目は期待通り抽出するが
res <- docDF ( doc) # 続けて実行するとタームをまったく抽出してくれない

そこで Windows 64 bit 版 R-2.14.0 用 RMeCab? では以下のよう try() 関数でラップして実行してください.

''res <- try(RMeCabC("日本語の文字列"))''
''res <- try ( docDF (doc)  )''

try 関数内部で実行することでエラーが起こることがないと思います.

Windows 32 bit 版 R-2.14.0 では,try() 関数を使う必要はありません.

ダウンロード後ファイル名を RMeCab_0.98.tar.gz と修正する必要があるかもしれません。

_ バージョン 0.97 (R-2.13.2) 2011年 10 月 11 日

Windows版 Rのための 32 bit および 64 bit 両方への対応.libmecabとlibmecab64を同封しています.

  • Windows (32/64) 用バイナリ(R-2.13.2) ,バージョン 0.97 fileRMeCab_0.97.zip

注意:Windows 64 bit版 R-2.13.2 用 RMeCab? では若干動作が不安定です.例えば以下は Windows 64 bit 版R-2.13.2 用 RMeCab? でファイルの読み込みに失敗するがあるかもしれません.

res <- docDF ( doc) # 一度目は期待通り抽出するが
res <- docDF ( doc) # 続けて実行するとタームをまったく抽出してくれない

そこで Windows 64 bit 版 R-2.13.0 用 RMeCab? では以下のよう try() 関数でラップして実行してください.

res <- try ( docDF (doc)  )

Windows 32 bit 版 R-2.13.2 では,try() 関数を使う必要はありません.

ダウンロード後ファイル名を RMeCab_0.97.tar.gz と修正する必要があるかもしれません。

_ バージョン 0.96 (R-2.13.1) 2011年 07 月 11 日

Windows版 Rのための 32 bit および 64 bit 両方への対応.libmecabとlibmecab64を同封しています.

  • Windows (32/64) 用バイナリ(R-2.13.1) ,バージョン 0.96 fileRMeCab_0.96.zip

注意:Windows 64 bit版 R-2.13.1 用 RMeCab? では若干動作が不安定です.例えば以下は Windows 64 bit 版R-2.13.1 用 RMeCab? でファイルの読み込みに失敗するがあるかもしれません.

res <- docDF ( doc) # 一度目は期待通り抽出するが
res <- docDF ( doc) # 続けて実行するとタームをまったく抽出してくれない

そこで Windows 64 bit 版 R-2.13.0 用 RMeCab? では以下のよう try() 関数でラップして実行してください.

res <- try ( docDF (doc)  )

Windows 32 bit 版 R-2.13.1 では,try() 関数を使う必要はありません.

ダウンロード後ファイル名を RMeCab_0.96.tar.gz と修正する必要があるかもしれません。

_ バージョン 0.95 (R-2.13.0) 2011年 04 月 14 日

Windows版 Rのための 32 bit および 64 bit 両方への対応.libmecabとlibmecab64を同封しています.

  • Windows (32/64) 用バイナリ(R-2.13.0) ,バージョン 0.95 fileRMeCab_0.95.zip

ダウンロード後ファイル名を RMeCab_0.95.tar.gz と修正する必要があるかもしれません。

_ バージョン 0.94 (R-2.12.2) 2011年 03 月 02 日

Windows版 Rのための 32 bit および 64 bit 両方への対応.libmecabとlibmecab64を同封しています.

  • 注意:Windows 版 R-2.12.1 64 bit での動作はやや不安定なことがあります.32bit版 R での動作に問題ありません.Windows 版 R-2.12.2 64 bit では.例えば
res <- RMeCabC("日本語の文字列")

は1回目はエラーになることがあります.代入式ではなく,RMeCabC("日本語の文字列") 単独の場合はエラーになりません.すなわち

res <- RMeCabC("日本語の文字列")#にエラーが起こった場合
RMeCabC("日本語の文字列") # 一度 代入無しで実行し
res <- RMeCabC("日本語の文字列") # 再び代入するとエラーは出ません

そこでWindows 版 R-2.12.2 64bitでは以下のようエラー対策を重ねて実行してください.Windows 版 R-2.12.2 32 bit版では不要です.

res <- try(RMeCabC("日本語の文字列"))

try 関数内部で実行することでエラーが起こることないと思います.

  • Windows (32/64) 用バイナリ(R-2.12.2) ,バージョン 0.94 fileRMeCab_0.94.zip

ダウンロード後ファイル名を RMeCab_0.94.tar.gz と修正する必要があるかもしれません。

_ バージョン 0.93 (R-2.12.1) 2010年 12月 18日

fileRMeCab_0.93.zip

  1. R 32 bit あるいは R 64 bit のいずれかで 1 回インストールします.どちらでも使えるようになります. メニューから[パッケージ]→[ローカルにあるzipファイルからのパッケージのインストール]を選んで,ダウンロードした RMeCab_***.zipファイルを選んでインストールします.[win-libraryを作成したいのですか] と聞いてきた時は OK を押してください(この際,R はユーザーフォルダを作成します).
    1. Vista では'Permission denied'とエラーが表示されて,先に進めないことがあります.この場合はいったん R を [終了] させ,もう一度,今度は R のアイコンを右クリックして,[管理者として実行] を選んでください. RMeCab_0.89 以降では,以上でインストール終了です.以下の3に続く手続きは不要です.
    2. 注意 :Windows 版 R-2.12.0-64 bit での動作はやや不安定なことがあります.R-2.12.0-32 bit版 での動作に問題ありません.Windows 版 R-2.12.0(64 bit) では.例えば
res <- RMeCabC("日本語の文字列")

は1回目はエラーになることがあります.代入式ではなく,RMeCabC("日本語の文字列") 単独の場合はエラーになりません.すなわち

res <- RMeCabC("日本語の文字列")#にエラーが起こった場合
RMeCabC("日本語の文字列") # 一度 代入無しで実行し
res <- RMeCabC("日本語の文字列") # 再び代入するとエラーは出ません

そこでWindows版 R-2.12.0(64 bit) では以下のようエラー対策を重ねて実行してください.Windows版 R-2.12.0(32 bit版)では不要です.

res <- try(RMeCabC("日本語の文字列"))

try 関数内部で実行することで実際にはエラーが起こることないと思います.

  • Windows (32/64) 用バイナリ(R-2.12.1) ,バージョン 0.93 fileRMeCab_0.93.zip

ダウンロード後ファイル名を RMeCab_0.93.tar.gz と修正する必要があるかもしれません。

_ バージョン 0.92 (R-2.12.0) 2010年 10月 18日

Windows版 Rのための32 bit および 64 bit 両方への対応.libmecabとlibmecab64を同封しています.

  • 注意:Windows 版 R-2.12.0 (64 bit) での動作はやや不安定です.32bit版 R での動作に問題ありません.Windows 版 R-2.12.0 (64 bit) では.例えば
res <- RMeCabC("日本語の文字列")

は1回目はエラーになることがあります.代入式ではなく,RMeCabC("日本語の文字列") 単独の場合はエラーになりません.すなわち

res <- RMeCabC("日本語の文字列")#にエラーが起こった場合
RMeCabC("日本語の文字列") # 一度 代入無しで実行し
res <- RMeCabC("日本語の文字列") # 再び代入するとエラーは出ません

そこでWindows 版 R-2.12.0(64bit)では以下のようエラー対策を重ねて実行してください.Windows 版 R-2.12.0(32 bit版)では不要です.

res <- try(RMeCabC("日本語の文字列"))

try 関数内部で実行することで実際にはエラーが起こることは少ないと思います.

  • Windows (32/64) 用バイナリ(R-2.12.0) ,バージョン 0.92 fileRMeCab_0.92.zip

ダウンロード後ファイル名を RMeCab_0.92.tar.gz と修正する必要があるかもしれません。

_ バージョン 0.91 (R-2.11.1) 2010年 8月26日

mecabへの引数を追加 RMeCab.R . Windows版には libmecab.dll を同封.

Snow Leopard の場合 ダウンロード後ファイル名を RMeCab_0.91.tgz と修正する必要があります。

ダウンロード後ファイル名を RMeCab_0.90.tar.gz と修正する必要があるかもしれません。

_ バージョン 0.90 (R-2.11.1) 2010年 6月04日

R-2.11.1 への対応.他に変更点なし. RMeCab.R utf-8 ). Windows版には libmecab.dll を同封.

Snow Leopard の場合 ダウンロード後ファイル名を RMeCab_0.90.tgz と修正する必要があります。

ダウンロード後ファイル名を RMeCab_0.90.tar.gz と修正する必要があるかもしれません。

_ バージョン 0.89 (R-2.11.0) 2010年 5月10日

すべての関数に dic 引数を追加し, ユーザー辞書を実行時にして出きるようにした(利用例 RMeCab.R utf-8 ).また Windows版には libmecab.dll を同封した.

_ バージョン 0.88 (R-2.11.0) 2010年 4月23日

R-2.11.0 への対応と collocate()関数の出力を変更.

  • 2010年 4月23日 RMeCab_0.88 (R-2.11.0対応) collocate()関数の出力を変更.nodeの前と後それぞれの頻度を加えた.
  • fileREADME_RMeCab.txt (Shift-JIS)

_ バージョン 0.87 (R-2.10.1) 2009年 12月17日

R-2.10.1 への対応版.変更なし.

  • R-2.10.1 版 fileREADME_RMeCab.txt (Shift-JIS)
    • Windows バイナリ(R-2.10.1),バージョン 0.87 RMeCab_0.87.zip と付属の環境設定ファイル
      • fileRMeCabInstall.bat (Rの標準的なライブラリフォルダ設定の場合)
      • fileRMeCabInstallXP.bat(XPで、ライブラリフォルダがユーザーフォルダ内にあるX場合)
      • fileRMeCabInstallVista.bat (Vistaで、ライブラリフォルダがユーザーフォルダ内にある場合)
    • Macintosh バイナリ(R-2.10.1),バージョン 0.87 RMeCab_0.86.tgz
    • 64bit Snow Leopard 用 Macintosh バイナリ(R-2.10.0),RMeCab_0.87_R_x86_64-apple-darwin9.8.0.tar.gz. ダウンロード後ファイル名を RMeCab_0.87.tgz と修正する必要があります。
    • 自力コンパイル版 R 用 Macintosh バイナリ(R-2.10.1),バージョン 0.87 &ref(): File not found: "RMeCab_0.87_R_i386-apple-darwin9.8.0.tar.gz" at page "SoftArchive"; ダウンロード後ファイル名を RMeCab_0.87.tgz と修正する必要があります。
    • Linux バイナリ(R-2.10.1),バージョン 0.87 RMeCab_0.87.tar.gz
    • Linux 64 bit バイナリ(R-2.10.1),バージョン 0.87 RMeCab_0.87_R_x86_64-unknown-linux-gnu.tar.gz ダウンロード後ファイル名を RMeCab_0.87.tar.gz と修正する必要があるかもしれません。

_ バージョン 0.86 (R-2.10.0) 2009年 11月12日

docNgramDF()関数のバグを修正。

_ バージョン 0.85 (R-2.10.0) 2009年 10月28日

MeCab?本体の最新バージョン(0.98)と組み合わせた。ほかに変更なし。

_ バージョン 0.84 (R-2.9.2) 2009年 8月25日

  • R-2.9.2 版fileREADME_RMeCab.txt (Shift-JIS)
    • Windows バイナリ(R-2.9.2),バージョン 0.84

fileRMeCab_0.84.zip と付属の環境設定ファイル

  • fileRMeCabInstall.bat (Rの標準的なライブラリフォルダ設定の場合)
  • fileRMeCabInstallXP.bat(XPで、ライブラリフォルダがユーザーフォルダ内にあるX場合)
  • fileRMeCabInstallVista.bat (Vistaで、ライブラリフォルダがユーザーフォルダ内にある場合)

_ バージョン 0.83 (R-2.9.1) 2009年 8月24日

_ バージョン 0.82 (R-2.9.0) 2009年 5月23日

_ バージョン 0.81 (R-2.9.0) 試作未公開;

_ バージョン 0.80 (R-2.9.0) 文字コード周りを大きく修正.試作未公開;

_ バージョン 0.79 (R-2.9.0) 2009年 4月18日

_ バージョン 0.78 (R-2.8.1) 安定版 2009年 3月28日

  • R-2.8.1 版fileREADME_RMeCab.txt (Shift-JIS)
    • docDF()関数の効率が悪かったのを修正.また docNgramDF()関数は他の関数と異なり,文書(被験者回答)が行でタームが列なので,重み付け関数に行と列の指定ができるようにした.
    • Windows バイナリ(R-2.8.1),バージョン 0.78 fileRMeCab_0.78.zip と付属の環境設定ファイル
      • fileRMeCabInstall.bat (Rの標準的なライブラリフォルダ設定の場合)
      • fileRMeCabInstallXP.bat(XPで、ライブラリフォルダがユーザーフォルダ内にあるX場合)
      • fileRMeCabInstallVista.bat (Vistaで、ライブラリフォルダがユーザーフォルダ内にある場合)
    • Macintosh バイナリ(R-2.8.1),バージョン 0.78 fileRMeCab_0.78.tgz
    • Linux バイナリ(R-2.8.1),バージョン 0.78 fileRMeCab_0.78.tar.gz
    • 試用データセットfiledata.zip (Windows), filedata.tar.gz (Mac, Unix)

_ バージョン 0.77 (R-2.8.1) 安定版 2009年 3月28日

  • R-2.8.1 版fileREADME_RMeCab.txt (Shift-JIS)
    • docDF()関数の効率が悪いので,とりあえずデータフレームの特定列を対象に,文字ないしタームの N-gram行列を抽出する docNgramDF()関数を追加しておいた.
    • Windows バイナリ(R-2.8.1),バージョン 0.77 fileRMeCab_0.77.zip と付属の環境設定ファイル
      • fileRMeCabInstall.bat (Rの標準的なライブラリフォルダ設定の場合)
      • fileRMeCabInstallXP.bat(XPで、ライブラリフォルダがユーザーフォルダ内にあるX場合)
      • fileRMeCabInstallVista.bat (Vistaで、ライブラリフォルダがユーザーフォルダ内にある場合)
    • Macintosh バイナリ(R-2.8.1),バージョン 0.77 fileRMeCab_0.77.tgz
    • Linux バイナリ(R-2.8.1),バージョン 0.77 fileRMeCab_0.77.tar.gz
    • 試用データセットfiledata.zip (Windows), filedata.tar.gz (Mac, Unix)

_ バージョン 0.76 (R-2.8.1) 安定版 2009年 3月27日

  • R-2.8.1 版fileREADME_RMeCab.txt (Shift-JIS)
    • NgramDF2()関数にバグがあったのを修正.
    • Windows バイナリ(R-2.8.1),バージョン 0.76 fileRMeCab_0.76.zip と付属の環境設定ファイル
      • fileRMeCabInstall.bat (Rの標準的なライブラリフォルダ設定の場合)
      • fileRMeCabInstallXP.bat(XPで、ライブラリフォルダがユーザーフォルダ内にあるX場合)
      • fileRMeCabInstallVista.bat (Vistaで、ライブラリフォルダがユーザーフォルダ内にある場合)
    • Macintosh バイナリ(R-2.8.1),バージョン 0.76 &ref(): File not found: "RMeCab_0.76.tgz" at page "SoftArchive";
    • Linux バイナリ(R-2.8.1),バージョン 0.76 fileRMeCab_0.76.tar.gz
    • 試用データセットfiledata.zip (Windows), filedata.tar.gz (Mac, Unix)

_ バージョン 0.75 (R-2.8.1) 安定版 2009年 3月23日

  • R-2.8.1 版fileREADME_RMeCab.txt (Shift-JIS)
    • docDF()関数に引数 co を追加し,ターム共起行列を作成できるようにした.
    • Windows バイナリ(R-2.8.1),バージョン 0.75fileRMeCab_0.75.zip と付属の環境設定ファイル
      • fileRMeCabInstall.bat (Rの標準的なライブラリフォルダ設定の場合)
      • fileRMeCabInstallXP.bat(XPで、ライブラリフォルダがユーザーフォルダ内にあるX場合)
      • fileRMeCabInstallVista.bat (Vistaで、ライブラリフォルダがユーザーフォルダ内にある場合)
    • Macintosh バイナリ(R-2.8.1),バージョン 0.75 fileRMeCab_0.75.tgz
    • Linux バイナリ(R-2.8.1),バージョン 0.75 fileRMeCab_0.75.tar.gz
    • 試用データセットfiledata.zip (Windows), filedata.tar.gz (Mac, Unix)

_ バージョン 0.74 (R-2.8.1) 安定版 2009年 3月19日

  • R-2.8.1 版fileREADME_RMeCab.txt (Shift-JIS)
    • docMatrix(), docMatrix2(), docMatrixDF()関数に引数 co を追加し,ターム共起行列を作成できるようにした.
    • Windows バイナリ(R-2.8.1),バージョン 0.74fileRMeCab_0.74.zip と付属の環境設定ファイル
      • fileRMeCabInstall.bat (Rの標準的なライブラリフォルダ設定の場合)
      • fileRMeCabInstallXP.bat(XPで、ライブラリフォルダがユーザーフォルダ内にあるX場合)
      • fileRMeCabInstallVista.bat (Vistaで、ライブラリフォルダがユーザーフォルダ内にある場合)
    • Macintosh バイナリ(R-2.8.1),バージョン 0.74 fileRMeCab_0.74.tgz
    • Linux バイナリ(R-2.8.1),バージョン 0.74 fileRMeCab_0.74.tar.gz
    • 試用データセットfiledata.zip (Windows), filedata.tar.gz (Mac, Unix)

_ バージョン 0.73 (R-2.8.1) ほぼ安定 2009年 3月10日

  • R-2.8.1 版fileREADME_RMeCab.txt (Shift-JIS)
    • 汎用的な docDF()関数?を追加.単独ファイル,ディレクトリ,あるいはデータフレームの特定列を対象に Ngram あるいは ターム文書行列を作成する.
    • Windows バイナリ(R-2.8.1),バージョン 0.73fileRMeCab_0.73.zip と付属の環境設定ファイル
      • fileRMeCabInstall.bat (Rの標準的なライブラリフォルダ設定の場合)
      • fileRMeCabInstallXP.bat(XPで、ライブラリフォルダがユーザーフォルダ内にあるX場合)
      • fileRMeCabInstallVista.bat (Vistaで、ライブラリフォルダがユーザーフォルダ内にある場合)
    • Macintosh バイナリ(R-2.8.1),バージョン 0.73 fileRMeCab_0.73.tgz
    • Linux バイナリ(R-2.8.1),バージョン 0.73 fileRMeCab_0.73.tar.gz
    • 試用データセットfiledata.zip (Windows), filedata.tar.gz (Mac, Unix)

_ バージョン 0.72 (R-2.8.1) 試作未公開;

_ バージョン 0.71 (R-2.8.1) docDF関数が検証途中 2009年 3月06日

  • R-2.8.1 版fileREADME_RMeCab.txt (Shift-JIS)
    • RMeCab_0.70の docDF()関数にバグがあったのを修正.
    • Windows バイナリ(R-2.8.1),バージョン 0.71fileRMeCab_0.71.zip と付属の環境設定ファイル
      • fileRMeCabInstall.bat (Rの標準的なライブラリフォルダ設定の場合)
      • fileRMeCabInstallXP.bat(XPで、ライブラリフォルダがユーザーフォルダ内にあるX場合)
      • fileRMeCabInstallVista.bat (Vistaで、ライブラリフォルダがユーザーフォルダ内にある場合)
    • Macintosh バイナリ(R-2.8.1),バージョン 0.71 fileRMeCab_0.71.tgz
    • Linux バイナリ(R-2.8.1),バージョン 0.71 fileRMeCab_0.71.tar.gz
    • 試用データセットfiledata.zip (Windows), filedata.tar.gz (Mac, Unix)

_ バージョン 0.70 (R-2.8.1) docDF関数が検証途中 2009年 3月05日

  • R-2.8.1 版fileREADME_RMeCab.txt (Shift-JIS)
    • 汎用的な docDF()関数を追加.単独ファイル,ディレクトリ,あるいはデータフレームの特定列を対象に Ngram あるいは ターム文書行列を作成する.
    • Windows バイナリ(R-2.8.1),バージョン 0.70fileRMeCab_0.70.zip と付属の環境設定ファイル
      • fileRMeCabInstall.bat (Rの標準的なライブラリフォルダ設定の場合)
      • fileRMeCabInstallXP.bat(XPで、ライブラリフォルダがユーザーフォルダ内にあるX場合)
      • fileRMeCabInstallVista.bat (Vistaで、ライブラリフォルダがユーザーフォルダ内にある場合)
    • Macintosh バイナリ(R-2.8.1),バージョン 0.70 fileRMeCab_0.70.tgz
    • Linux バイナリ(R-2.8.1),バージョン 0.70 fileRMeCab_0.70.tar.gz
    • 試用データセットfiledata.zip (Windows), filedata.tar.gz (Mac, Unix)

_ バージョン 0.69 (R-2.8.1) 試作未公開;

_ バージョン 0.68 (R-2.8.1) 安定版 2009年 2月10日

  • R-2.8.1 版fileREADME_RMeCab.txt (Shift-JIS)
    • RMeCab_0.67 の RMeCabFreq?()関数には不具合がありました.特定の記号が含まれていると R が落ちてしまいました.これを修正しました.
    • Windows バイナリ(R-2.8.1),バージョン 0.68fileRMeCab_0.68.zip と付属の環境設定ファイル
      • fileRMeCabInstall.bat (Rの標準的なライブラリフォルダ設定の場合)
      • fileRMeCabInstallXP.bat(XPで、ライブラリフォルダがユーザーフォルダ内にあるX場合)
      • fileRMeCabInstallVista.bat (Vistaで、ライブラリフォルダがユーザーフォルダ内にある場合)
    • Macintosh バイナリ(R-2.8.1),バージョン 0.68 fileRMeCab_0.68.tgz
    • Linux バイナリ(R-2.8.1),バージョン 0.68 fileRMeCab_0.68.tar.gz
    • 試用データセットfiledata.zip (Windows), filedata.tar.gz (Mac, Unix)

_ バージョン 0.67 (R-2.8.1) 安定版 2008年12月24日

  • R-2.8.1 版fileREADME_RMeCab.txt (Shift-JIS)
    • 以前のR-2.8.0は文字コードに不具合があります.RMeCab?そのものは変更されていませんが,できれば R を2.8.1 にバージョンアップしてご利用下さい.
    • Windows バイナリ(R-2.8.1),バージョン 0.67fileRMeCab_0.67.zip と付属の環境設定ファイル
      • fileRMeCabInstall.bat (Rの標準的なライブラリフォルダ設定の場合)
      • fileRMeCabInstallXP.bat(XPで、ライブラリフォルダがユーザーフォルダ内にあるX場合)
      • fileRMeCabInstallVista.bat (Vistaで、ライブラリフォルダがユーザーフォルダ内にある場合)
    • Macintosh バイナリ(R-2.8.1),バージョン 0.67 fileRMeCab_0.67.tgz
    • Linux バイナリ(R-2.8.1),バージョン 0.67 fileRMeCab_0.67.tar.gz
    • 試用データセットfiledata.zip (Windows), filedata.tar.gz (Mac, Unix)

_ バージョン 0.66 (R-2.8.0) 2008年11月10日

_ バージョン 0.65 (R-2.8.0) 2008年11月8日

  • エスケープ記号類をカウントしていたのを修正
  • R-2.8.0 版

_ バージョン 0.64 (R-2.8.0) 2008年11月8日

文字コードまわりの不具合を調整

  • R-2.8.0 版
    • Windows バイナリ(R-2.8.0),バージョン 0.64fileRMeCab_0.64.zip と付属の環境設定ファイル
      • fileRMeCabInstall.bat (Rの標準的なライブラリフォルダ設定の場合)
      • fileRMeCabInstallXP.bat(XPで、ライブラリフォルダがユーザーフォルダ内にあるX場合)
      • fileRMeCabInstallVista.bat (Vistaで、ライブラリフォルダがユーザーフォルダ内にある場合)
    • Macintosh バイナリ(R-2.8.0),バージョン 0.64fileRMeCab_0.64.tgz
    • Linux バイナリ(R-2.8.0),バージョン 0.64 fileRMeCab_0.64.tar.gz

_ バージョン 0.63 (R-2.8.0) 2008年11月6日

未公開

_ バージョン 0.62 (R-2.8.0) 2008年11月5日

  • R-2.8.0 版
    • Windows バイナリ(R-2.8.0),バージョン 0.62fileRMeCab_0.62.zip と付属の環境設定ファイル
      • fileRMeCabInstall.bat (Rの標準的なライブラリフォルダ設定の場合)
      • fileRMeCabInstallXP.bat(XPで、ライブラリフォルダがユーザーフォルダ内にあるX場合)
      • fileRMeCabInstallVista.bat (Vistaで、ライブラリフォルダがユーザーフォルダ内にある場合)
    • Macintosh バイナリ(R-2.8.0),バージョン 0.61fileRMeCab_0.62.tgz
    • Linux バイナリ(R-2.8.0),バージョン 0.62 fileRMeCab_0.62.tar.gz

_ バージョン 0.61 (R-2.7.1) 安定版 2008年 9月2日

  • メモリ関係の微調整:変数宣言の見直し
    • Windows バイナリ(R-2.7.1),バージョン 0.61fileRMeCab_0.61.zip と付属の環境設定ファイル
      • fileRMeCabInstall.bat (Rの標準的なライブラリフォルダ設定の場合)
      • fileRMeCabInstallXP.bat(XPで、ライブラリフォルダがユーザーフォルダ内にあるX場合)
      • fileRMeCabInstallVista.bat (Vistaで、ライブラリフォルダがユーザーフォルダ内にある場合)
    • Macintosh バイナリ(R-2.7.1),バージョン 0.61fileRMeCab_0.61.tgz
    • Linux バイナリ(R-2.7.1),バージョン 0.61 fileRMeCab_0.61.tar.gz

_ バージョン 0.60 (R-2.7.1) 2008年 9月1日

  • メモリ関係の微調整:使われていない変数が残っていたので削除
    • Windows バイナリ(R-2.7.1),バージョン 0.60fileRMeCab_0.60.zip と付属の環境設定ファイル
    • Macintosh バイナリ(R-2.7.1),バージョン 0.60fileRMeCab_0.60.tgz
    • Linux バイナリ(R-2.7.1),バージョン 0.60 fileRMeCab_0.60.tar.gz

_ バージョン 0.59 (R-2.7.1) 2008年 8月23日

  • RMeCab? 本体にdocMatrix2()関数、docNgram2()関数、Ngram2()関数を追加。それぞれ旧来のdocMatrix()関数、docNgram()関数、Ngram()関数に機能を追加したもの。詳しくは、試用データセットfiledata2.zip (Windows), filedata2.tar.gz (Mac, Unix) の RMeCab?.Rコード内のコメント、あるいはマニュアル filemanual0823.pdfをご参照ください.
    • Windows バイナリ(R-2.7.1),バージョン 0.59fileRMeCab_0.59.zip と付属の環境設定ファイル
    • Macintosh バイナリ(R-2.7.1),バージョン 0.59fileRMeCab_0.59.tgz
    • Linux バイナリ(R-2.7.1),バージョン 0.59 fileRMeCab_0.59.tar.gz

_ バージョン 0.58 (R-2.7.0) 2008年 8月20日

  • 開発バージョン未公開

_ バージョン 0.57 (R-2.7.0) 2008年 8月18日

  • Windows バイナリ(R-2.7.0),バージョン 0.57fileRMeCab_0.57.zip と付属の環境設定ファイル
  • Macintosh バイナリ(R-2.7.0),バージョン 0.57fileRMeCab_0.57.tgz
  • Linux バイナリ(R-2.7.1),バージョン 0.57 fileRMeCab_0.57.tar.gz
    • 関数を新規追加.docMatrixDF()関数は,データフレームの指定された列から文書・ターム行列を作成する.引数はdocMatrix()関数と同じ(ただしtype引数はなく,形態素原型のみが抽出).pos引数で抽出する品詞,minFreq引数で全被験者(テキスト)での合計頻度の最低値,weight引数で重みを決める.

_ バージョン 0.56 (R-2.7.0) 2008年 8月15日

  • Windows バイナリ(R-2.7.0),バージョン 0.56fileRMeCab_0.56.zip と付属の環境設定ファイル fileRMeCabInstall.bat
  • Macintosh バイナリ(R-2.7.0),バージョン 0.56fileRMeCab_0.56.tgz
  • Linux バイナリ(R-2.7.1),バージョン 0.56 fileRMeCab_0.56.tar.gz
    • docMatrix関数を重みを付けないで実行する場合,行列情報を含む行が二つあることを表示するメッセージを追加した.RMeCabDF 関数で,第2引数に列番号の他,列名を指定できるようにした.

_ バージョン 0.55 (R-2.7.0) 2008年 7月22日

  • Windows バイナリ(R-2.7.0),バージョン 0.55fileRMeCab_0.55.zip と付属の環境設定ファイル fileRMeCabInstall.bat
  • Macintosh バイナリ(R-2.7.0),バージョン 0.55fileRMeCab_0.55.tgz
  • Linux バイナリ(R-2.7.0),バージョン 0.55 fileRMeCab_0.55.tar.gz
    • Ngram関数で type引数に 0 を指定した場合,つまり文字単位でN-gram を求めた場合,ファイル末尾の文字をカウントしていなかったのを修正.またマニュアルを少し修正追加した.

_ バージョン 0.54 (R-2.7.0) 2008年 6月26日

  • Windows バイナリ(R-2.7.0),バージョン 0.54fileRMeCab_0.54.zip と付属の環境設定ファイル fileRMeCabInstall.bat
  • Macintosh バイナリ(R-2.7.0),バージョン 0.54fileRMeCab_0.54.tgz
  • Linux バイナリ(R-2.7.0),バージョン 0.54 fileRMeCab_0.54.tar.gz
    • docMatrix関数に出力メッセージを追加; RMeCabC()関数のメモリ関係のバグをフィックス.

_ バージョン 0.53 (R-2.7.0) 2008年 6月18日

_ バージョン 0.52 (R-2.7.0) 2008年 6月14日

_ バージョン 0.51 2008年 6月13日

_ バージョン 0.50 2008年 5月12日

_ バージョン 0.49 β 2008年 5月5日

  • Windows バイナリ(R-2.7.0),バージョン 0.49&ref(): File not found: "RMeCab_0.49.zip" at page "SoftArchive"; と付属の環境設定ファイル fileRMeCabInstall.bat
  • Macintosh バイナリ(R-2.7.0),バージョン 0.49 &ref(): File not found: "RMeCab_0.49.tgz" at page "SoftArchive";
  • Linux バイナリ(R-2.7.0),バージョン 0.49 &ref(): File not found: "RMeCab_0.49.tar.gz" at page "SoftArchive";
    • バージョン 0.48 を R-2.7.0 でコンパイルした.

_ バージョン 0.48 β 2008年 5月5日

  • Windows バイナリ(R-2.6.2),バージョン 0.48&ref(): File not found: "RMeCab_0.48.zip" at page "SoftArchive"; と付属の環境設定ファイル fileRMeCabInstall.bat
  • Macintosh バイナリ(R-2.6.2),バージョン 0.48 &ref(): File not found: "RMeCab_0.48.tgz" at page "SoftArchive";
  • Linux バイナリ(R-2.6.2),バージョン 0.48 &ref(): File not found: "RMeCab_0.48.tar.gz" at page "SoftArchive";
    • ターム・文書行列作成の際の重みを見直した.局所的重みに「文書頻度 TF」,「対数頻度」,「バイナリ頻度」の 3 種類を,大域的重みに「IDF」,「大域的IDF」,「確率的IDF」,「エントロピー」の 4 種類,そしてコサイン正規化関数一つを実装し直した.

_ バージョン 0.47 β 2008年4月28日

  • Windows バイナリ,バージョン 0.47&ref(): File not found: "RMeCab_0.47.zip" at page "SoftArchive"; と付属の環境設定ファイル fileRMeCabInstall.bat
  • Macintosh バイナリ,バージョン 0.47 &ref(): File not found: "RMeCab_0.47.tgz" at page "SoftArchive";
  • Linux バイナリ,バージョン 0.47 &ref(): File not found: "RMeCab_0.47.tar.gz" at page "SoftArchive";
    • docNgram(), makeNgram(), rmSing() 関数を追加.Ngramを作成する場合にディレクトリを指定可能とした.ディレクトリ内のファイルすべてについて Ngram を計り,行にテキスト名,列にNgram名を備えたデータフレームを返す.またMeCab? の出力から品詞情報が「記号」の要素を除く

_ バージョン 0.46

  • Windows バイナリ,バージョン 0.46&ref(): File not found: "RMeCab_0.46.zip" at page "SoftArchive";
  • Macintosh バイナリ,バージョン 0.46 &ref(): File not found: "RMeCab_0.46.tgz" at page "SoftArchive";
  • Linux バイナリ,バージョン 0.46 &ref(): File not found: "RMeCab_0.46.tar.gz" at page "SoftArchive";
    • collocate 関数の出力から T-score, MI-score,対数尤度比(G^2)を求める関数 collScores()関数を追加.

_ バージョン 0.45

  • Windows バイナリ,バージョン 0.45 &ref(): File not found: "RMeCab_0.45.zip" at page "SoftArchive";
  • Macintosh バイナリ,バージョン 0.45 &ref(): File not found: "RMeCab_0.45.tgz" at page "SoftArchive";
  • Linux バイナリ,バージョン 0.45 &ref(): File not found: "RMeCab_0.45.tar.gz" at page "SoftArchive";
    • collocate 関数の出力を修正。

_ バージョン 0.44

  • Windows バイナリ,バージョン 0.44 &ref(): File not found: "RMeCab_0.44.zip" at page "SoftArchive";
  • Macintosh バイナリ,バージョン 0.44 &ref(): File not found: "RMeCab_0.44.tgz" at page "SoftArchive";
  • Linux バイナリ,バージョン 0.44 &ref(): File not found: "RMeCab_0.44.tar.gz" at page "SoftArchive";
    • collocate 関数の出力に総トークン数と,総形態素数に関する情報を追加

_ バージョン 0.43

  • Windows バイナリ,バージョン 0.43 &ref(): File not found: "RMeCab_0.43.zip" at page "SoftArchive";
  • Macintosh バイナリ,バージョン 0.43 &ref(): File not found: "RMeCab_0.43.tgz" at page "SoftArchive";
  • Linux バイナリ,バージョン 0.43 &ref(): File not found: "RMeCab_0.43.tar.gz" at page "SoftArchive";
    • エラー処理を追加

_ バージョン 0.42

  • Windows バイナリ,バージョン 0.42 &ref(): File not found: "RMeCab_0.42.zip" at page "SoftArchive";
  • Macintosh バイナリ,バージョン 0.42 &ref(): File not found: "RMeCab_0.42.tgz" at page "SoftArchive";
  • Linux バイナリ,バージョン 0.42 &ref(): File not found: "RMeCab_0.42.tar.gz" at page "SoftArchive";
    • N-gramカウント,およびコロケーションカウント用の関数を追加

_ バージョン 0.41

  • Windows バイナリ,バージョン 0.41 &ref(): File not found: "RMeCab_0.41.zip" at page "SoftArchive";
  • Macintosh バイナリ,バージョン 0.41 &ref(): File not found: "RMeCab_0.41.tgz" at page "SoftArchive";
  • Linux バイナリ,バージョン 0.41 &ref(): File not found: "RMeCab_0.41.tar.gz" at page "SoftArchive";
    • バージョン 0.40 で文書行列に TF-IDF などの重み付けを行う場合, [ [TOTAL-TOKENS] ] 行や[ [LESS-THAN-1] ] 行まで含めて計算していたのを修正し,これらの行を削除した結果に重み付けを行うようにした.

_ バージョン 0.40

  • Windows バイナリ,バージョン 0.40 &ref(): File not found: "RMeCab_0.40.zip" at page "SoftArchive";
  • Macintosh バイナリ,バージョン 0.40 &ref(): File not found: "RMeCab_0.40.tgz" at page "SoftArchive";
  • Linux バイナリ,バージョン 0.40 &ref(): File not found: "RMeCab_0.40.tar.gz" at page "SoftArchive";
    • バージョン 0.39 docMatrix()関数に minFreq オプションを復活させた.また品詞や最低頻度を指定して文書行列を出力する際,テキストの総語数などの情報を表示させる.例えばテキストの総token数は [ [TOTAL-TOKENS] ]という行に,また指定された品詞(pos <- c("名詞"," 形容詞","動詞") )のうち,指定された頻度(minFreq  =1) 未満のものを, [ [LESS-THAN-1] ] という行として,文書行列に含めた.

_ バージョン 0.39

  • Windows バイナリ,バージョン 0.39 &ref(): File not found: "RMeCab_0.39.zip" at page "SoftArchive";
  • Macintosh バイナリ,バージョン 0.39 &ref(): File not found: "RMeCab_0.39.tgz" at page "SoftArchive";
  • Linux バイナリ,バージョン 0.39 &ref(): File not found: "RMeCab_0.39.tar.gz" at page "SoftArchive";
    • 文書ターム行列を作成する際,文書が大きいとメモリが足りなくなり R が落ちることがある。そこでC++ソースを見直して,メモリの調整を行った。

_ バージョン 0.38

  • Windows バイナリ,バージョン 0.38 &ref(): File not found: "RMeCab_0.38.zip" at page "SoftArchive";
  • Macintosh バイナリ,バージョン 0.38 &ref(): File not found: "RMeCab_0.38.tgz" at page "SoftArchive";
  • Linux バイナリ,バージョン 0.38 &ref(): File not found: "RMeCab_0.38.tar.gz" at page "SoftArchive";
    • 文書ターム行列を作成する際,文書が大きいとメモリが足りなくなり R が落ちることがある。そこでC++ソースを見直して,メモリの調整を行った。

_ バージョン 0.37

  • Windows バイナリ,バージョン 0.37
  • Macintosh バイナリ,バージョン 0.37
  • Linux バイナリ,バージョン 0.37
    • 英文マニュアルを一部追加作成.MeCab? は辞書にない単語の原形を * として返してしまうことがあることに気がついた.
      陀多と云う男が一人
      陀多    名詞,一般,*,*,*,*,*

そこで,こうした場合,入力された語形をそのまま返すよう修正.またC++コードを見直して,メモリ管理を多少改善させた.に RMeCabDoc?()関数を追加.これに伴い,RMeCabDoc?.R,RMeCabDoc?.Rd を追加した.

_ バージョン 0.36

  • Windows バイナリ,バージョン 0.36 &ref(): File not found: "RMeCab_0.36.zip" at page "SoftArchive";
  • Macintosh バイナリ,バージョン 0.36 &ref(): File not found: "RMeCab_0.36.tgz" at page "SoftArchive";
  • Linux バイナリ,バージョン 0.36 &ref(): File not found: "RMeCab_0.36.tar.gz" at page "SoftArchive";
    • 英文マニュアルを一部追加作成.docMatrix ()関数がファイルの一行目しか読んでいないバグを修正.C++コードに RMeCabDoc?()関数を追加.これに伴い,RMeCabDoc?.R,RMeCabDoc?.Rd を追加した.

_ バージョン 0.35

  • Windows バイナリ,バージョン 0.35 &ref(): File not found: "RMeCab_0.35.zip" at page "SoftArchive";
  • Macintosh バイナリ,バージョン 0.35 &ref(): File not found: "RMeCab_0.35.tgz" at page "SoftArchive";
  • Linux バイナリ,バージョン 0.35 &ref(): File not found: "RMeCab_0.35.tar.gz" at page "SoftArchive";
    • 英文マニュアルを一部作成.C++コードを一部手直した.それに関連して R コードを見直した.

_ バージョン 0.34

  • Windows バイナリ,バージョン 0.34
  • Macintosh バイナリ,バージョン 0.34
  • Linux バイナリ,バージョン 0.34
    • 日本語・文書ターム行列の作成関数を追加.また行列に重み(TF/IDF)をつけられるようにした.

_ バージョン 0.33

  • Windows バイナリ,バージョン 0.33 &ref(): File not found: "RMeCab_0.33.zip" at page "SoftArchive";
  • Macintosh バイナリ,バージョン 0.33 &ref(): File not found: "RMeCab_0.33.tgz" at page "SoftArchive";
    • データフレームを第一引数として,第二引数で指定された列に含まれる日本語文章を解析して返す.

_ バージョン 0.32

  • Windows バイナリ,バージョン 0.32 &ref(): File not found: "RMeCab_0.32.zip" at page "SoftArchive";
  • Macintosh バイナリ,バージョン 0.32 &ref(): File not found: "RMeCab_0.32.tgz" at page "SoftArchive";
    • ファイルを読み込んで形態素原型とその頻度表を作成し,データフレームとして返す関数を追加

_ バージョン 0.2

  • Windows バイナリ,バージョン 0.2 &ref(): File not found: "RMeCab_0.2.zip" at page "SoftArchive";
  • Macintosh バイナリ,バージョン 0.2 &ref(): File not found: "RMeCab_0.2.tgz" at page "SoftArchive";
    • 形態素原型をえるオプションを追加

_ バージョン 0.1

  • Linux バイナリ,バージョン 0.1
    • とりあえず動くだけのもの.

_ ご感想などのご報告

お問い合わせはメールをください

ishida-m(この部分を"@"に変更下さい)ias.tokushima-u.ac.jp

開発秘話 [#u48c7b65]

$ export MACOSX_DEPLOYMENT_TARGET=10.3R CMD SHLIB  
$ RMeCab.cpp -dynamiclib -L/usr/local/lib -lmecab
$ tar -zcf RMeCab_0.68.tgz RMeCab