アールメカブ › フォーラム › RMeCab › collocateとcollScoresでの英文の処理について
collocateとcollScoresで英文テキスト(単語間はスペース)を対象としたコロケーション分析を試してみたところ、正しく処理できているように見えます。 本来英文テキストの処理を念頭に置いて作られたものではないと思いますが、英文テキストの処理に利用する場合に何か問題などはあるでしょうか。
お返事が遅くなりました。
RMeCabが英文に対応しているということではなく、 MeCabの方で、英語のテキストを正しく単語に分割 できれば、それをRのデータとして保存できるという ことです。MeCabには、英文のレンマ化などの機能は なく(動詞などの活用形はすべて別の語として扱われる)、 かつ品詞も推定できませんので、その点は制約になり ます。 が、表層語がカウントできれば良いということであれば、 問題ないと思います。
ご回答ありがとうございます。 はい、表層形で簡易的にコロケーション分析をするという場合を考えていました。 表層形の処理には英語でも利用できるということで、便利に利用できます。 ありがとうございました。