トップ
新規
一覧
単語検索
最終更新
ヘルプ
ログイン
アールメカブ
R_文書ターム行列作成
をテンプレートにして作成
開始行:
[[Rの備忘録]]
日本語テキストを解析した結果からターム文書行列を作成する.
lsa パッケージでは正しく解析できないので,自作する.
ちなみに lsa パッケージの textmatrix はこんな感じ.オプシ...
textmatrix <- function( mydir, stemming=FALSE, language=...
minWordLength=2, minDocFreq=1, stopwords=NULL,
vocabulary=NULL ) {
dummy = lapply( dir(mydir, full.names=TRUE), textvect...
stemming, language, minWordLength, minDocFreq, sto...
vocabulary)
if (!is.null(vocabulary)) {
dtm = t(xtabs(Freq ~ ., data = do.call("rbind", d...
result = matrix(0, nrow=length(vocabulary), ncol=...
rownames(result) = vocabulary
result[rownames(dtm),] = dtm[rownames(dtm),]
colnames(result) = colnames(dtm)
dtm = result
gc()
} else {
dtm = t(xtabs(Freq ~ ., data = do.call("rbind", d...
}
environment(dtm) = new.env()
class(dtm) = "textmatrix"
return ( dtm )
}
終了行:
[[Rの備忘録]]
日本語テキストを解析した結果からターム文書行列を作成する.
lsa パッケージでは正しく解析できないので,自作する.
ちなみに lsa パッケージの textmatrix はこんな感じ.オプシ...
textmatrix <- function( mydir, stemming=FALSE, language=...
minWordLength=2, minDocFreq=1, stopwords=NULL,
vocabulary=NULL ) {
dummy = lapply( dir(mydir, full.names=TRUE), textvect...
stemming, language, minWordLength, minDocFreq, sto...
vocabulary)
if (!is.null(vocabulary)) {
dtm = t(xtabs(Freq ~ ., data = do.call("rbind", d...
result = matrix(0, nrow=length(vocabulary), ncol=...
rownames(result) = vocabulary
result[rownames(dtm),] = dtm[rownames(dtm),]
colnames(result) = colnames(dtm)
dtm = result
gc()
} else {
dtm = t(xtabs(Freq ~ ., data = do.call("rbind", d...
}
environment(dtm) = new.env()
class(dtm) = "textmatrix"
return ( dtm )
}
ページ名: