Rの備忘録 のバックアップ(No.57) - アールメカブ

アールメカブ


Rの備忘録 のバックアップ(No.57)


_ 自作パッケージ

  • RMeCabパッケージ データ解析・グラフィックス環境 R から日本語形態素解析ソフト和布蕪( MeCab )を呼び出して使うインターフェイス
    • R2MeCabRMeCabのサブセット.実装関数は三つだけです.
  • RCaBoChaパッケージ データ解析・グラフィックス環境 R から日本語係り受け判定ソフト南瓜( CaBoCha )を呼び出して使うインターフェイス

_ R の参考書

  • :R でコーパス・テキスト・言語処理を行うための入門書ですが,第3章にRの包括的な入門があります.
  • 中級者になるために.
  • 解析をばりばり行うために.
  • データをばりばり処理するために.
  • R のプログラミングテクニックを学ぶために.
  • R での解析手法に慣れるために.
  • とにかく R を使ってみたい.
  • 統計学と R を同時に学びたい.

_ 資料

_ R についての最近のメモ

  • 順列と組み合わせ なぜかデフォルトでは関数がない

&mimetex({13}_P_{3});

prod(1:13) / prod(1:10)

&mimetex({13}_C_{3});

prod(1:13) / prod(1:3) * prod(1:10) 
  • ESS

Mac 版 ESS で R を起動したらローケルが C になっている. emacs.elに以下を追記したら,日本語で起動できた.しばらく Mac でESS を使っていなかったのだが,以前は,以下2行はなくとも日本語モードで起動したような気がするのだが.

(set-locale-environment "utf-8")
(setenv "LANG"  "ja_JP.UTF-8")

ついでに ESS 上では

options(device = "quartz")

と指定する..Rprofile の設定も見直す.

X11.options(fonts=c("-ipamona-gothic-medium-r-normal--0-0-0-0-m-0-jisx0212.1",
"-adobe-symbol-*-*-*-*-%d-*-*-*-*-*-*-*"))
ps.options(family= "Japan1")

####

X11.options(fonts=c("-misc-vl gothic-medium-r-normal--%d-*-*-*-*-*-jisx0201.1976-*",
   "-adobe-symbol-*-*-*-*-%d-*-*-*-*-*-*-*"))

ps.options(family= "Japan1Ryumin")

パッケージのインストールのたびに tcl のウィジェットが起動するのはうっとうしいので,次のようにコンパイルした.

./configure --without-tcltk

_ 小技

  • 時間の取得
    substring(Sys.time(),0,10)
  • 列に NA があるかをチェック
    x <- c(1,3,NA,5,NA)
    any(is.na(x))
    which(is.na(x))
    x[which(is.na(x))]
any(is.na(data$x))
data$x[which(is.na(data$x))] # それはどこ
# こんな風に書いてみても良いかな
ifelse(any(is.na( data$x )), which(is.na( data$x )), "not found")
  • 正規化された行列からの距離行列の作成
     sqrt(2 * (1 -   X %*% t(X) ) ) # 『Rで学ぶクラスタ解析』p.75より
  • anticonservative p-value が小さすぎと... Baayen p.248

_ Rについての古いメモ

不適切な記述がかなり残っていると思われる.

お気づきの点がありましたら管理者へご連絡下さい