Rの文字化け

アールメカブ フォーラム RMeCab Rの文字化け

  • このトピックには7件の返信、1人の参加者があり、最後にBoogampにより2年、 11ヶ月前に更新されました。
8件の投稿を表示中 - 1 - 8件目 (全8件中)
  • 投稿者
    投稿
  • #878
    yukiko
    ゲスト

    はじめまして。
    Mac版Rだと、グラフを描くさいに日本語が文字化けするので、
    BootcampでWindowsを入れてRを試したら、グラフは文字化けしないのですが、RMeCabを試すと
    險伜捷
    “すもももももももものうち”
    など日本語が文字化けしてしまいます。

    書いてあるWindowsの手順でインストールしました。
    逆にMacだとこっちの文字化けはありません。
    グラフを描きたいので、いっそPythonでやろうかとも迷っています。。

    Macのほうは環境設定の問題だと思うのですが、Win版の文字化けについて解決法があればご教示いただければ幸いです。

    #879
    石田基広
    ゲスト

    ファイルの文字コードがUTF-8になっているのではないでしょうか?
    WindowsではCP932を想定しているので、UTF-8を入力させると文字化けしてしまいます。

    Macで文字化けを防ぐには
    par(family = “HiraKakuProN-W3”)

    としてからplot(()する。あるいはplot()内部で family = “HiraKakuProN-W3” を指定する。
    ggplot2 であれは ggplot() + theme_bw(base_family = “HiaKakuProN-W3”)と設定します。
    Macでfamilyに指定できるのは他に “HiraMinProN-W6”, “HiraKakuProN-W6” です。

    #880
    yukiko
    ゲスト

    返信遅れて申し訳ありません。
    レスありがとうございます。

    windows
    読み込んだファイルはWindowsで作成したので、文字コードはそのままのはずです。
    しかし、前にRMeCabで処理したところ、もともと日本語のファイルが文字化けした(エンコードした?)ことがありました。MeCabや辞書のダウンロードしたものに不具合があったということでしょうか。

    Mac
    plotは使っておらず、ヒストグラムやwordcloudで描画するときに日本語が文字化けしてしまいます。

    このサイトを参考に、
    ヒストグラムテスト <- c(13,14,7,12,10,6,8,15,4,14,9,6,10,12,5,12,8,8,12,15)
    hist(ヒストグラムテスト)
    とした場合、日本語の部分だけ文字化けします。
    Rprofileの書き換えも行ったつもりなのですが、変化がなかったので、それが失敗したということでしょうか。

    環境が複雑で申し訳ありませんが、ご教示いただけると幸いです。

    #881
    yukiko
    ゲスト

    追記

    winにおいて“すもももももももものうち”の文字化けは解消しました。
    wordcloudの描画を試すさいのエラー表示が、

    Error in tolower(txt) : invalid multibyte string 111

    となっています。これはwordcloudサイドのエラーなのかとも思ったのですが、ヒストグラムの時も文字化けするので、他に原因があるのでしょうか。。

    Macで済むのがいちばん良いと思うのですが、環境設定が複雑な気がするので、winの方が解決しやすいのかも…?

    #882
    石田基広
    ゲスト

    返信が遅くなりました。
    ご利用の環境はWindowsで、ただしMacのBootcamp上で稼働している。また MeCab のインストールではShift-jisを選択。かつ処理対象のファイルはすべてWindows用にCP932に変更されており、ファイルの文字コードに問題はないということであれば、
    Error in tolower(txt) : invalid multibyte string 111
    というエラーが生じるのは、Windows版Rのデフォルト文字コードが正しく設定されていないのではないかと思います。
    Sys.getlocae()の表示が以下のようになっているでしょうか?
    [1] “LC_COLLATE=Japanese_Japan.932;LC_CTYPE=Japanese_Japan.932;LC_MONETARY=Japanese_Japan.932;LC_NUMERIC=C;LC_TIME=Japanese_Japan.932”

    このように表示されていないのであれば、以下のように設定して試してみてください。

    Sys.setlocale(“LC_ALL”, ‘Japanese_Japan.932’)

    #883
    yukiko
    ゲスト

    ご返信ありがとうございます。

    > Sys.getlocae()
    Sys.getlocae() でエラー:
    関数 “Sys.getlocae” を見つけることができませんでした
    > Sys.setlocale(“LC_ALL”, ‘Japanese_Japan.932’)
    > Sys.getlocae()
    Sys.getlocae() でエラー:
    関数 “Sys.getlocae” を見つけることができませんでした
    >

    試してみたら、このようになってしまいました。。

    #884
    yukiko
    ゲスト

    あ、すみません。
    今さっき色々試していたら文字化けせずに描画できました。

    wordcloudは文字コード以外の問題だったと思います。

    #885
    石田基広
    ゲスト

    解決したようで、なによりです。上のコードですが、タイポがあり、正確には以下です。
    また機会があれば、試してみてください。
    Sys.setlocale()

8件の投稿を表示中 - 1 - 8件目 (全8件中)
  • フォーラム「RMeCab」には新規投稿および返信を追加できません。