collocateとcollScoresでの英文の処理について

アールメカブ フォーラム RMeCab collocateとcollScoresでの英文の処理について

  • このトピックには2件の返信、1人の参加者があり、最後にishiiにより4年、 5ヶ月前に更新されました。
3件の投稿を表示中 - 1 - 3件目 (全3件中)
  • 投稿者
    投稿
  • #2111
    ishii
    ゲスト

    collocateとcollScoresで英文テキスト(単語間はスペース)を対象としたコロケーション分析を試してみたところ、正しく処理できているように見えます。
    本来英文テキストの処理を念頭に置いて作られたものではないと思いますが、英文テキストの処理に利用する場合に何か問題などはあるでしょうか。

    #2118
    ishida
    キーマスター

    お返事が遅くなりました。

    RMeCabが英文に対応しているということではなく、
    MeCabの方で、英語のテキストを正しく単語に分割
    できれば、それをRのデータとして保存できるという
    ことです。MeCabには、英文のレンマ化などの機能は
    なく(動詞などの活用形はすべて別の語として扱われる)、
    かつ品詞も推定できませんので、その点は制約になり
    ます。
    が、表層語がカウントできれば良いということであれば、
    問題ないと思います。

    #2119
    ishii
    ゲスト

    ご回答ありがとうございます。
    はい、表層形で簡易的にコロケーション分析をするという場合を考えていました。
    表層形の処理には英語でも利用できるということで、便利に利用できます。
    ありがとうございました。

3件の投稿を表示中 - 1 - 3件目 (全3件中)
  • フォーラム「RMeCab」には新規投稿および返信を追加できません。