Rの備忘録 のバックアップソース(No.33) - アールメカブ

アールメカブ


Rの備忘録 のバックアップソース(No.33)

#contents
* 自作パッケージ [#x2383529]
- &size(20){&color(blue){[[RMeCab]]パッケージ};}; 
データ解析・グラフィックス環境 &size(18){[[R:http://cran.md.tsukuba.ac.jp/]]}; から日本語形態素解析ソフト''&color(blue){和布蕪};( [[MeCab:http://mecab.sourceforge.net/]] )''を呼び出して使うインターフェイス
-- [[R2MeCab]] :[[RMeCab]]のサブセット.実装関数は三つだけです.

-&size(20){&color(blue){[[RCaBoCha]]パッケージ};}; 
データ解析・グラフィックス環境 &size(18){[[R:http://cran.md.tsukuba.ac.jp/]]}; から日本語係り受け判定ソフト''&color(blue){南瓜};( [[CaBoCha:http://sourceforge.net/projects/cabocha/]] )''を呼び出して使うインターフェイス
//** [[R_source>RSource]] [#p537302d]

* 資料 [#sb73f487]
-第91回行動計量シンポジウム  &ref(管理者/TextMining2.pdf);
-行動計量学会第35回全国大会 関係 (チュートリアルpdf &ref(管理者/HowToR.pdf); &発表pdf &ref(管理者/bsj2007.pdf); )
//&発表pdf):http://150.59.18.68/]]


* R についての最近のメモ [#t035a44c]
//CENTER:&size(22){&color(red){R を使い始めた頃からのメモ};}; 
//////////////////////////////////////////////////////////////
-[[R_入力ソースの判定]]
-[[readRegistry]]
-[[sapplyの使い方>R_sapply]]
-[[Rのスコープと環境R_scope_environment>R_scope_environment]]
-[[チルダ演算子 R_tilde>R_tilde]]
-[[Rによる潜在意味インデキシング R_lsa>R_lsa]]
-[[R_cosine距離]]
-[[トレリス・グラフィックスパラメータの取得R_trellis.par.get>R_trellis.par.get]]
-[[R_Lattice]]
-[[Power PC 版 Mac 用パッケージ R_PowerPC>R_PowerPC]]
-[[二度を超えるセーブバージョンの使用廃止予定です]]
-[[パッケージの作成 Rpackage_build>Rpackage_build]]
- R-2.8.1のインストール

パッケージのインストールのたびに tcl のウィジェットが起動するのはうっとうしいので,次のようにコンパイルした.
 ./configure --without-tcltk

-[[多重ロジットモデルの結果の解釈方法>R_multinom]]
-[[サンプルを二つに分ける方法>R_sample]]
//-[[水準の再構成 R_reFactor>R_reFactor]]
- 作業中にパッケージを取り外すには
 detach(package:MASS)
-[[正規分布とT分布の比較の話で>R_dnorm_dt]]
-[[ローケルの確認>R_locale]]
-[[R_GGobi]]
- [[R_ファイル処理]]
- [[Rで漢字を読み方順に並べる RdeKanjiSort>RdeKanjiSort]]
- [[R_rownamesとrow.names関数]]
- [[R_source関数]]
- [[eval()関数とparse()関数>R_文字を要素とするベクトルを結合する]]
- [[R_文字を要素とするベクトルを結合する]]
- パッケージを引用したい時
 citation("hoge")
-[[RjpWikiのRでグラフ理論:http://www.okada.jp.org/RWiki/?R%20%A4%C7%A5%B0%A5%E9%A5%D5%CD%FD%CF%C0]]
-[[横(列)に変数を取った横型データを縦型データフレームに変換>R_stack]]
-効果を表す母数を識別するための制約については:松田 紀之 著『質的情報の多変量解析』 の[[効果項の推定:http://www.sci.kagoshima-u.ac.jp/%7Eebsa/matsuda01/pdf/ch03-02.pdf]]や
[[効果ベクトルβ, デザイン行列 X の構成:http://www.sci.kagoshima-u.ac.jp/%7Eebsa/matsuda01/pdf/chAB.pdf]],あるいは[[ここの資料:http://www.e.u-tokyo.ac.jp/~kunitomo/Hsiao3J.pdf]]33ページをみるように.
-[[R_winBUGS_structure]]
-[[資料:RでBayesの基礎 jags>R_Bayes_jags]]
-[[資料:RでBayesの基礎 ポアソン回帰>Bayes_Poisson]]
-[[長さが100のベクトル生成]]
-[[xaxt_yaxt_パラメータと正規分布の図]]
-[[RCaBoCha_make]] の作成
-[[C++ソース内でベクトルの欠損値を見つけ出す方法>CPP_VECTOR_NA_FIND]]
- 因子と水準
--[[水準の再構成>R_reFactor]]
--[[R_カテゴリを融合する]]
--[[R_データのカテゴリ化]]
--[[R_ファクターの削減]]
--[[水準の順序化>hidden_R_ordered]]
--[[同じカテゴリには同じ色を使いたい>R_Tips0]]
-[[R_Alphabet]]
-[[R_Tcl/TK]]
-[[R_Cut関数の使い方]]
-[[C++のソース側で文書行列の作成まで行ってしまう>hidden_DocTermMatrix]]
-[[C++のソースからRにMatrixを返す>hidden_R_Matrix]]
-[[R_CMD_check]]
- [[R-2.7.0 で日本語を含んだ文字をプロット]]
- 関数の表示のさせ方.忘れてた.
 > methods(biplot) # で確認して
 > getS3method("biplot", "default") 任意のメソッドを表示
-[[R_列名が異なる二つのデータフレームを一つに統合]]
- [[バイプロット R_biplot]]
- R_名前付きベクトルから名前を取る:  as.vector() を使えば良い
- [[R_文書ターム行列作成]]
- [[R_Cソースでデータフレームを生成>hidden_R_Cソースでデータフレームを生成]]
- [[R_Cソースで文字ベクトルを生成]]
-[[Rパッケージ作成>hidden_R_Packages]]
- [[順序制約のあるカテゴリカルデータの扱い>hidden_R_ordered]]については[[粕谷先生:http://kasuya.ecology1.org/stats/orderr1.html]]や[[三中先生:http://qdai.way-nifty.com/qjes/2008/01/index.html]]のサイトに説明がある
-[[Rでベクトルの要素を別の集合の要素と比較する]]
- Rで対応分析を実行する簡単な例 &ref{corresp.R};
-[[R_ftable関数の出力からラベルを取り出す]]
//-[[同じカテゴリには同じ色を使いたい>R_Tips0]]
-[[R_二値の集計]]
//-[[R_ファクターの削減]]
//-[[R_データのカテゴリ化]]
-[[R_font.size]]
-[[R_ftableの属性]]
//-[[R_カテゴリを融合する]]
-[[R_列名で列を削除する]]
-[[Rでパッケージ作成>hidden_R_Packages]]
-[[Rでリスト処理]]
-[[小技>#lce6a8c4]]
-[[日本語形態素解析,和布蕪とのインターフェイス>hidden_RへCから名前付きベクトルを要素とするリストを返す]]
-[[RへCからリスト]]
-[[RへCから文字列]]
-[[Rと和布蕪>hidden_Rと和布蕪]]
-[[dim()関数が必要となる場面>R_dim]]
-[[RでBayes]]
-[[Rでstring_Kernel]]
-[[R_lsaで日本語]]
-[[R_tokenizer]]
-[[Rでコンコーダンサー>R_concordancer]]
- sprintf関数は,ループ内ではさらに cat しないと出力しない模様
-[[Rの正規表現]]
-[[R_tmパッケージの使い方]]
-[[R_Plot_Marginの処理]]
-[[R_Sweave]]
-[[R_対数線形モデル]]
-[[R_片側検定]]
-[[R_複数のページに渡るグラフィックス]]
-[[語彙の成長曲線を描く lnre() 関数>R_lnre]]
-[[R_lines]]
-[[R_頻度区間調整]]
-[[調整済みRが大きくとも残差からモデルが否定される例>R_Adj.r.squared]]
-[[R_回帰分析とbreakpoint]]
-[[R_Designパッケージ]]
-[[R_SupportVectorMachines]]
-[[ベクトルのリサイクル R_VectorRecyle>R_VectorRecyle]]
-[[R_ClassificationAndRegressionTrees]]
-[[R_Divisive_Clustering_diana関数とnj関数]]
-[[R_Baayen]]
-[[R_prcomp_proportion]]
-[[R_2変量正規分布]]
-[[R_コントラスト]]
-[[R_4次元配列]]
-[[R_二元配置モデルでの summary.lm のパラメータの意味]]
-[[hidden_R_ESS]]
- [[Macでのコンパイルオプション>hidden_MacMake]]


* 小技 [#lce6a8c4]
- 時間の取得
 substring(Sys.time(),0,10)
- 列に NA があるかをチェック
 x <- c(1,3,NA,5,NA)
 any(is.na(x))
 which(is.na(x))
 x[which(is.na(x))]

 any(is.na(data$x))
 data$x[which(is.na(data$x))] # それはどこ
 # こんな風に書いてみても良いかな
 ifelse(any(is.na( data$x )), which(is.na( data$x )), "not found")

- 正規化された行列からの距離行列の作成
  sqrt(2 * (1 -   X %*% t(X) ) ) # 『Rで学ぶクラスタ解析』p.75より
* Rについての古いメモ [#jc2e7a4f]
不適切な記述がかなり残っていると思われる. 

-[[R_fromOldHtml3_2]] 
-[[R_fromOldHtml3]] 
-[[R_fromOldHtml2_2]] 
-[[R_fromOldHtml2]] 
-[[R_fromOldHtml1_2]] 
-[[R_fromOldHtml1]] 
-[[R_データの読み込み]] 

お気づきの点がありましたら[[管理者]]へご連絡下さい