- このトピックには7件の返信、1人の参加者があり、最後にBoogampにより3年、 5ヶ月前に更新されました。
-
投稿者投稿
-
2017年12月16日 5:08 AM #878yukikoゲスト
はじめまして。
Mac版Rだと、グラフを描くさいに日本語が文字化けするので、
BootcampでWindowsを入れてRを試したら、グラフは文字化けしないのですが、RMeCabを試すと
險伜捷
“すもももももももものうち”
など日本語が文字化けしてしまいます。書いてあるWindowsの手順でインストールしました。
逆にMacだとこっちの文字化けはありません。
グラフを描きたいので、いっそPythonでやろうかとも迷っています。。Macのほうは環境設定の問題だと思うのですが、Win版の文字化けについて解決法があればご教示いただければ幸いです。
2017年12月16日 3:14 PM #879石田基広ゲストファイルの文字コードがUTF-8になっているのではないでしょうか?
WindowsではCP932を想定しているので、UTF-8を入力させると文字化けしてしまいます。Macで文字化けを防ぐには
par(family = “HiraKakuProN-W3”)としてからplot(()する。あるいはplot()内部で family = “HiraKakuProN-W3” を指定する。
ggplot2 であれは ggplot() + theme_bw(base_family = “HiaKakuProN-W3”)と設定します。
Macでfamilyに指定できるのは他に “HiraMinProN-W6”, “HiraKakuProN-W6” です。2017年12月22日 8:10 AM #880yukikoゲスト返信遅れて申し訳ありません。
レスありがとうございます。windows
読み込んだファイルはWindowsで作成したので、文字コードはそのままのはずです。
しかし、前にRMeCabで処理したところ、もともと日本語のファイルが文字化けした(エンコードした?)ことがありました。MeCabや辞書のダウンロードしたものに不具合があったということでしょうか。Mac
plotは使っておらず、ヒストグラムやwordcloudで描画するときに日本語が文字化けしてしまいます。
このサイトを参考に、
ヒストグラムテスト <- c(13,14,7,12,10,6,8,15,4,14,9,6,10,12,5,12,8,8,12,15)
hist(ヒストグラムテスト)
とした場合、日本語の部分だけ文字化けします。
Rprofileの書き換えも行ったつもりなのですが、変化がなかったので、それが失敗したということでしょうか。環境が複雑で申し訳ありませんが、ご教示いただけると幸いです。
2017年12月22日 8:16 AM #881yukikoゲスト追記
winにおいて“すもももももももものうち”の文字化けは解消しました。
wordcloudの描画を試すさいのエラー表示が、Error in tolower(txt) : invalid multibyte string 111
となっています。これはwordcloudサイドのエラーなのかとも思ったのですが、ヒストグラムの時も文字化けするので、他に原因があるのでしょうか。。
Macで済むのがいちばん良いと思うのですが、環境設定が複雑な気がするので、winの方が解決しやすいのかも…?
2017年12月24日 5:06 PM #882石田基広ゲスト返信が遅くなりました。
ご利用の環境はWindowsで、ただしMacのBootcamp上で稼働している。また MeCab のインストールではShift-jisを選択。かつ処理対象のファイルはすべてWindows用にCP932に変更されており、ファイルの文字コードに問題はないということであれば、
Error in tolower(txt) : invalid multibyte string 111
というエラーが生じるのは、Windows版Rのデフォルト文字コードが正しく設定されていないのではないかと思います。
Sys.getlocae()の表示が以下のようになっているでしょうか?
[1] “LC_COLLATE=Japanese_Japan.932;LC_CTYPE=Japanese_Japan.932;LC_MONETARY=Japanese_Japan.932;LC_NUMERIC=C;LC_TIME=Japanese_Japan.932”このように表示されていないのであれば、以下のように設定して試してみてください。
Sys.setlocale(“LC_ALL”, ‘Japanese_Japan.932’)
2017年12月26日 6:55 AM #883yukikoゲストご返信ありがとうございます。
> Sys.getlocae()
Sys.getlocae() でエラー:
関数 “Sys.getlocae” を見つけることができませんでした
> Sys.setlocale(“LC_ALL”, ‘Japanese_Japan.932’)
> Sys.getlocae()
Sys.getlocae() でエラー:
関数 “Sys.getlocae” を見つけることができませんでした
>試してみたら、このようになってしまいました。。
2017年12月26日 7:14 AM #884yukikoゲストあ、すみません。
今さっき色々試していたら文字化けせずに描画できました。wordcloudは文字コード以外の問題だったと思います。
2017年12月26日 9:26 AM #885石田基広ゲスト解決したようで、なによりです。上のコードですが、タイポがあり、正確には以下です。
また機会があれば、試してみてください。
Sys.setlocale() -
投稿者投稿
- フォーラム「RMeCab」には新規投稿および返信を追加できません。