R_lsaで日本語 のバックアップの現在との差分(No.1) - アールメカブ

アールメカブ


R_lsaで日本語 のバックアップの現在との差分(No.1)


  • 追加された行はこの色です。
  • 削除された行はこの色です。
[[Rの備忘録]]

* lsa パッケージで日本語文書を扱うのは問題ありそう. [#j1b31b54]
textmatrix() 関数の出力がおかしい.

そこでRMeCab で実装することにする.

* 日本語文書をRで特異値分解する [#sefdcfb5]

lsaは日本語ロケールの環境ではロード出来ないので,

- Windows版R ならば
 Sys.setlocale("LC_CTYPE", "C")
として英語設定にした上で
 library(lsa)
再び 
 Sys.setlocale("LC_CTYPE", "Japanese_Japane.932")
 Sys.setlocale("LC_CTYPE", "Japanese_Japan.932")
でWindowsのロケールに戻してしまう.姑息だが,これが一番簡単.

l