R_iconv のバックアップ(No.1) - アールメカブ

アールメカブ


R_iconv のバックアップ(No.1)


Rの備忘録

Linux の UTF-8 で書いた R スクリプトで日本語の処理を行っていて,このファイルを Windows ユーザーに渡す場合,ファイルそのものを Shift-Jis に変換すればいいのだが,何となく気にくわない.そこで,iconv() 関数などを駆使する.もっとも,これが効率的でスマートな方法だとは言わない.

まず文字コードを調べる

$ echo -n '記号' | hexdump -C
00000000  e8 a8 98 e5 8f b7  

ユニコード (UCS-2) であれば,

$ echo "記号" | iconv -t UCS-2 | hexdump
0000000 8a18 53f7 000a