R_データのカテゴリ化 の変更点 - アールメカブ

アールメカブ


R_データのカテゴリ化 の変更点


[[Rの備忘録]]



[[R_ファクターの削減]] も参照


あるいはデータのファクター化

たとえば,アンケート集計で,男が1女が2とされている場合,summaryなど使うと,無意味な平均値などを得てしまいますよ.

 dat$Sex[1:10] 
 [1] 2 2 2 2 2 2 2 2 1 2 2
 summary(dat$Sex)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  1.000   2.000   2.000   1.787   2.000   2.000 

まあ,ほとんどFemaleばかりだとは分かります.
 dat$Sex <- factor(dat$Sex)
 summary(dat$Sex)
  1   2 
 61 225 
さらにこうしておけばわかりやすいですね.
 levels (dat$Sex) <- c("M","F")
  summary(dat$Sex)
  M   F 
 61 225

これは一度に
 dat$Sex <- factor(dat$Sex, labels = c("M", "F"))
でも可能.