R_iconv のバックアップソース(No.1) - アールメカブ

アールメカブ


R_iconv のバックアップソース(No.1)

[[Rの備忘録]]

Linux の UTF-8 で書いた R スクリプトで日本語の処理を行っていて,このファイルを Windows ユーザーに渡す場合,ファイルそのものを Shift-Jis に変換すればいいのだが,何となく気にくわない.そこで,iconv() 関数などを駆使する.もっとも,これが効率的でスマートな方法だとは言わない.

まず文字コードを調べる
 $ echo -n '記号' | hexdump -C
 00000000  e8 a8 98 e5 8f b7  
ユニコード (UCS-2) であれば,
 $ echo "記号" | iconv -t UCS-2 | hexdump
 0000000 8a18 53f7 000a