R_Divisive_Clustering_diana関数とnj関数のバックアップ(No.2)

バックアップ一覧
差分を表示
現在との差分を表示
ソースを表示
R_Divisive_Clustering_diana関数とnj関数へ行く。
- 1 (2007-09-27 (木) 11:27:34)
- 2 (2007-09-27 (木) 12:40:05)

パプアニューギニアとオセアニアの諸言語の系統発生を，それらの分布的特徴を使って分類するという課題である．

Baayen Analyzing Linguistic Data のpp.154--

phylogeny.dist <- dist(phylogeny[, 3:ncol(phylogeny)], 
         method = "binary")

# 一方の言語のラベルを大文字に変更し，他方は小文字のままにして対照する

plotname <- as.character(phylogeny$Language)
plotname[phylogeny$Family == "Papuan"] <-  
    toupper(plotname[phylogeny$Family == "Papuan"])

# plot する．ここで引数 which.plot = 2 の意味は，print.diana がデフォルトで出力するふたつのグラフの二つめのみを表示するよう指定している．

Divisive Clustering

plot(diana(phylogeny.dist), labels = plotname, 
cex = 0.8,  main = " ", xlab = " ",  which.plot = 2)

なお Baayen では col = c("black","white") と言う引数が与えられているが，これは print.diana メソッドに固有の定義はないようである．

neighbor-joining による unrooted tree を作成する

library(ape)

phylogeny.dist.tr <- nj(phylogeny.dist)

＃ nj オブジェクトのラベルはデフォルトでは数値なので変更する　

families <- 
    as.character(phylogeny$Family[as.numeric
        (phylogeny.dist.tr$tip.label)])

languages <- 
    as.character(phylogeny$Language[as.numeric
        (phylogeny.dist.tr$tip.label)])

phylogeny.dist.tr$tip.label <- languages

plot(phylogeny.dist.tr, type = "u", 
      font = as.numeric(as.factor(families)))

引数 type = "u" は unrooted tree を指定．また各ノードは少なくとも三つの枝を持つ．パプア諸語とオセアン諸語がきれいに分類されているのが分かる．

二つまとめて png 画像にする．十分なマージンが必要なので par(mfrow = c(1,2), oma = c(1,1,1,1), mar = c(1,1,1,1), bg = "white"); dev.print(device = png, file = "baayen156.png",width = 480, height = 480) と実行する．

アールメカブ

R_Divisive_Clustering_diana関数とnj関数 のバックアップ(No.2)

R_Divisive_Clustering_diana関数とnj関数のバックアップ(No.2)