neologd辞書等のスペースを含む単語の扱いにつきまして

アールメカブ フォーラム RMeCab neologd辞書等のスペースを含む単語の扱いにつきまして

  • このトピックには1件の返信、1人の参加者があり、最後にスーパーコピー ヴィトン デニム edwinにより4年前に更新されました。
2件の投稿を表示中 - 1 - 2件目 (全2件中)
  • 投稿者
    投稿
  • #871
    tashiro
    ゲスト

    いつもRMeCabには大変お世話になっております。

    neologd辞書を用いてdocDF(type = 1)を実行しますと、後述のようなエラーが帰ってきてしまいます。
    調べましたところ、https://teratail.com/questions/87538という記事に行き当たりました。
    記事内容は真実でしょうか。
    もしそうでしたら、そのような単語も扱えるようご対応願うことなどできませんでしょうか。
    RMeCabをneologd辞書で組み合わせて使う機会は一般的に多く存在すると思われ、
    このエラーは仕様です、で片付けられてはあまりに残念です。

    お忙しいところ恐縮ですが、どうぞご検討のほどお願いいたします。

    > df <- data.frame(col = “Mac OS”)
    > a <- docDF(df, “col”, dic = neolog_path, type = 1)
    number of extracted terms = 1
    now making a data frame. wait a while!
    Error in docDF(df, “col”, dic = neolog, type = 1) :
    SET_STRING_ELT() can only be applied to a ‘character vector’, not a ‘integer’

    mecab_0.996.tar.gaソースよりインストール
    > sessionInfo()
    R version 3.4.2 (2017-09-28)
    Platform: x86_64-apple-darwin15.6.0 (64-bit)
    Running under: macOS Sierra 10.12.6

    Matrix products: default
    BLAS: /System/Library/Frameworks/Accelerate.framework/Versions/A/Frameworks/vecLib.framework/Versions/A/libBLAS.dylib
    LAPACK: /Library/Frameworks/R.framework/Versions/3.4/Resources/lib/libRlapack.dylib

    locale:
    [1] en_US.UTF-8/en_US.UTF-8/en_US.UTF-8/C/en_US.UTF-8/en_US.UTF-8

    attached base packages:
    [1] stats graphics grDevices utils datasets methods base

    other attached packages:
    [1] RMeCab_0.99999

    loaded via a namespace (and not attached):
    [1] compiler_3.4.2 tools_3.4.2

    #872
    石田基広
    ゲスト

    ご投稿ありがとうございます。
    RMeCabでneologd辞書を利用するとエラーが生じるのは、引用くださったサイトの説明にあるとおりです。
    サイトの説明にもあるとおり、これはRMeCab内部でスペースを作業用の区切りとして利用しているためです。逆に言えば、作業用の区切りとしてスペース以外を指定できるようにすれば、RMeCabでもneologd辞書が利用できるようになるのですが、新たな区切り文字の選定と、その検証に着手する時間が取れないでいます。
    ただ、neologd辞書を使いたいというご要望は他にも頂いていますので、今すぐにというわけにはいかないいのですが、必ず実現したいと思います。実装できしだい、当方のサイトでアナウンスさせていただきます。

    • この返信は7年、 1ヶ月前にishidaが編集しました。
2件の投稿を表示中 - 1 - 2件目 (全2件中)
  • フォーラム「RMeCab」には新規投稿および返信を追加できません。