R_二値の集計
最近,よく調べもせず,その場しのぎのコードでごまかしているような気がするなぁ.
Peter Dalgaard 「Rによる医療統計学」p.187 に生データを対象にロジスティック回帰分析を行う方法の説明もあるが,色々とデータをいじり回した挙句に,分析に向かうような場合のためのメモ.
ある反応にYesかNoについて,要因をクロスした集計を行いたい場合,xtabs()関数などで,モデル式を使って集計することになるが,反応を表す変数を最後の項にすればいい.
xyz が二値反応だとすれば ftable(xtabs(xyz ~ Age + Sex, data = dat))
はだめ
ftable(xtabs(~ Age + Sex + xyz , data = dat))
がよろしい.
このオブジェクトは ftableクラスなので,
class(dat2) <- "matrix" # 行や列のカテゴリをリセットする attr(dat2, "row.vars") <- NULL attr(dat2, "col.vars") <- NULL dat2
必要ならさらに行と列名を追加
dimnames(dat2) <- list(c("Age1", "Age2"), c("Male", "Female"))
としておけば,あとあとロジスティック回帰分析用のデータなどを作成するのに便利.
ロジスティック回帰分析用の結果求まった各変数の係数の解釈については Faraway p.105などが詳しい.
Link: R_old_tips2(1908d)
Rの備忘録(3944d)
日録2008年_2月(5703d)
Last-modified: 2010-01-09 (土) 17:32:10 (5383d)