R_データのカテゴリ化 - RとLinuxと...

RとLinuxと...


R_データのカテゴリ化

Rの備忘録

R_ファクターの削減 も参照

あるいはデータのファクター化

たとえば,アンケート集計で,男が1女が2とされている場合,summaryなど使うと,無意味な平均値などを得てしまいますよ.

dat$Sex[1:10] 
[1] 2 2 2 2 2 2 2 2 1 2 2
summary(dat$Sex)
  Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
 1.000   2.000   2.000   1.787   2.000   2.000 

まあ,ほとんどFemaleばかりだとは分かります.

dat$Sex <- factor(dat$Sex)
summary(dat$Sex)
 1   2 
61 225 

さらにこうしておけばわかりやすいですね.

levels (dat$Sex) <- c("M","F")
 summary(dat$Sex)
 M   F 
61 225

これは一度に

dat$Sex <- factor(dat$Sex, labels = c("M", "F"))

でも可能.

Last-modified: 2009-02-14 (土) 14:25:58 (3595d)