R_データのカテゴリ化
R_ファクターの削減 も参照
あるいはデータのファクター化
たとえば,アンケート集計で,男が1女が2とされている場合,summaryなど使うと,無意味な平均値などを得てしまいますよ.
dat$Sex[1:10] [1] 2 2 2 2 2 2 2 2 1 2 2 summary(dat$Sex) Min. 1st Qu. Median Mean 3rd Qu. Max. 1.000 2.000 2.000 1.787 2.000 2.000
まあ,ほとんどFemaleばかりだとは分かります.
dat$Sex <- factor(dat$Sex) summary(dat$Sex) 1 2 61 225
さらにこうしておけばわかりやすいですね.
levels (dat$Sex) <- c("M","F") summary(dat$Sex) M F 61 225
これは一度に
dat$Sex <- factor(dat$Sex, labels = c("M", "F"))
でも可能.
Link: R_old_tips2(1916d)
Rの備忘録(3952d)
日録2008年_2月(5711d)
R_ファクターの削減(5721d)
Last-modified: 2009-02-14 (土) 14:25:58 (5721d)