[[Rの備忘録]]
[[R_ファクターの削減]] も参照
あるいはデータのファクター化
たとえば,アンケート集計で,男が1女が2とされている場合,summaryなど使うと,無意味な平均値などを得てしまいますよ.
dat$Sex[1:10]
[1] 2 2 2 2 2 2 2 2 1 2 2
summary(dat$Sex)
Min. 1st Qu. Median Mean 3rd Qu. Max.
1.000 2.000 2.000 1.787 2.000 2.000
まあ,ほとんどFemaleばかりだとは分かります.
dat$Sex <- factor(dat$Sex)
summary(dat$Sex)
1 2
61 225
さらにこうしておけばわかりやすいですね.
levels (dat$Sex) <- c("M","F")
summary(dat$Sex)
M F
61 225
これは一度に
dat$Sex <- factor(dat$Sex, labels = c("M", "F"))
でも可能.