日録2010年8月 のバックアップ(No.32) - アールメカブ

アールメカブ


日録2010年8月 のバックアップ(No.32)


過去の日録

_ 2010 年 08 月 29 日 (日曜)晴

  • 05:40 起床
  • 07:20 研究室
  • 午前
    • RCaBoCha のアップデートを続ける.昨日は,活用語を表層形のまま出力するか,あるいは活用形のまま出力するかのオプション設定の追加を行なっていなかったので,追加した.
  • 午後

_ 2010 年 08 月 28 日 (土曜)晴

  • 05:40 起床
  • 07:20 研究室
  • 充電
  • 午前
    • RCaBoCha のアップデートを続ける
  • 午後
    • とりあえずRCaBoCha のアップデートが一段落ついた

_ 2010 年 08 月 27 日 (金曜)晴

  • 05:40 起床
  • 07:20 研究室
  • 午前
    • RCaBoCha のアップデートに着手. 以下が予定の作業
      • 係り受けを充実させる
      • mecabrc, cabocharc のリソースファイルの指定を可能にする
  • 午後
    • とりあえずRCaBoCha のアップデートを継続

_ 2010 年 08 月 26 日 (木曜)晴

  • 05:40 起床
  • 07:20 研究室
  • 午前
    • RMeCab から MeCab? 本体へ直接,引数を渡すことができるよう拡張した.小さな変更なんだが,結局,半日かかってしまった
RMeCab_0.91を公開しました

すべての関数に
  mecabrc =””
  etc = ””
の二つの引数を追加しました.デフォルトでは空白が指定されています.

 mecabrc 引数にはrcファイル(.mecabrc)を引用符で囲んで指定します.
なお実行前にファイルの有無がチェックされます.

etc 引数はその他 mecab 本体へ指定したい引数を引用符で囲んで渡します.
この引数の内容についてはチェックを一切行いませんので,利用する場合は,
指定内容に整合性があるかどうか十分に注意してください.
二つの新規引数について,詳細は以下も参照ください.
http://mecab.sourceforge.net/mecab.html

_ 2010 年 08 月 25 日 (水曜)晴

  • 05:40 起床
  • 07:20 研究室

_ 2010 年 08 月 24 日 (火曜)晴

  • 05:40 起床
  • 07:20 研究室

_ 2010 年 08 月 23 日 (月曜)晴

  • 05:40 起床
  • 07:20 研究室
  • 午前
    • 頼まれていた原稿を編集部に送る.Word推奨なのだが,TeXで作成したので,テキストファイルに変換し,画像は eps のまま zip で固めて送る.
  • 午後

_ 2010 年 08 月 22 日 (日曜)晴

  • 05:40 起床
  • 07:20 研究室

_ 2010 年 08 月 21 日 (土曜)晴

  • 05:40 起床
  • 07:20 研究室
  • 午前
    • にそってカイゼンしてみる
  • 午後
    • R と 日本語WordnetをつなぐインターフェイスをC++で作成
      > dyn.load("MySqlite.so")
      > .Call("sql","犬" )
      犬           犬           犬           犬           犬           
      "いぬ"   "まわし者"       "イヌ"     "スパイ"     "ドッグ"      
      犬           犬           犬           犬           犬          
      "回者"       "密偵"     "工作員"     "廻し者"       "廻者"  
      ...

とか動かす

  • Rinternals.h で CPP でコードを書く場合,
    extern C {}
    で囲まないとエラーが出たと記憶していたんだが,エラーは出ず,単に動作しないだけなんだけど,前からそうだっけ

_ 2010 年 08 月 20 日 (金曜)晴

  • 05:40 起床
  • 07:20 研究室

_ 2010 年 08 月 19日 (木曜)晴

  • 05:40 起床
  • 07:20 研究室
  • 午前
  • 午後
    • スライドの残りにとりかかる

_ 2010 年 08 月 18 日 (水曜)晴

  • 05:40 起床
  • 07:20 研究室
  • 午前
    • ptexLiveのインストールをUbuntu10.04でためしてみる
  • 午後
    • 箱ヒゲ図のヒゲの長さは,なぜ四分位範囲やヒンジ散布度の 1.5 倍か.Tukey の趣旨は,標準正規分布の四分位範囲から求めた99%区間ということか
      x <- qnorm(0.75) - qnorm(0.25) ; pnorm(qnorm(0.75) + x*1.5 )

_ 2010 年 08 月 17 日 (火曜)晴

  • 05:40 起床
  • 07:20 研究室
  • 午前
    • 9月8日のスライド準備を始める
  • 午後
    • を拾い読み始めた.これは読み応えがある.
    • mecab のWindows64bitバイナリを作成しようと思って MinGW64bit環境を設定し(というか,再構築し),実行してみたんだけど,makeの途中でエラー.こりゃ,手強いかな.VisualStudio?でやってみようかな.

_ 2010 年 08 月 16 日 (月曜)晴

  • 05:40 起床
  • 07:20 研究室

_ 2010 年 08 月 15 日 (日曜)晴

  • 05:40 起床
  • 07:20 研究室
  • 午前
    • Mac Book Air にmecabを自力コンパイルではなく, port で入れてみた.
$sudo port mecab +utf8
To enable dictionary, rewrite /opt/local/etc/mecabrc
 as "dicrc = /opt/local/lib/mecab/dic/ipadic-utf8"
You can also specify dictionary in the following way:
/opt/local/bin/mecab -d /opt/local/lib/mecab/dic/ipadic-utf8
$ sudo port install mecab-ipadic-utf8
$ sudo vim /opt/local/etc/mecabrc
 dicdir = /opt/local/lib/mecab/dic/ipadic-utf8

RMeCab では,そのままでは使えない.

  • 初心者向け『R統計解析』の執筆.
  • 午後
    • 初心者向け『R統計解析』の執筆.

_ 2010 年 08 月 14 日 (土曜)晴

  • 05:40 起床
  • 07:20 研究室
  • 午前
    • 初心者向け『R統計解析』の執筆.
  • 午後
    • 初心者向け『R統計解析』の執筆.

_ 2010 年 08 月 13 日 (金曜)晴

  • 05:40 起床
  • 07:20 研究室
  • 午前
    • RMeCab の data および RMeCab?.R を修正してみた
  • 午後
    • 初心者向け『R統計解析』の執筆.

_ 2010 年 08 月 12 日 (木曜)晴・曇

  • 05:40 起床
  • 07:20 研究室
  • 午前
    • Wubi で Windows 7 に構築している Ubuntu に,レポジトリから TeX を突っこんでみた.当然,UTF-8 は使えないので,nkf による文字コードコンバートを行なう.
  • 午後
    • 自宅の Dell Studio に入れた Ubuntu のwlanがおかしいので,再インストールなどしてみた.この際,レポジトリに用意されている TeX R MeCab? を入れてみた.当然といえば当然だが,nkf を介せば日本語UTF-8でも問題なく使える.RMeCab をパッケージとして加えて実行してみたが,まったく問題ない.

_ 2010 年 08 月 11 日 (水曜)晴

  • 05:30 起床
  • 07:10 研究室
  • 午前
    • Ubuntu のデフォルトフォント変更は,$HOMEに.fonts.conf を置いても読み込まれないようだった.仕方ないので,/etc/fonts/conf.avail/69-language-selector-ja-jp.conf を直接編集する.ただ VL-Gothic にすると,Takao との品質の差が歴然とする.後者の方が美しいのだ.後者が円マークではなく,バックスラッシュを表示してくれればいいのだが.
    • 初心者向け『R統計解析』の執筆.
  • 午後
    • 初心者向け『R統計解析』の執筆.とりあえず第 1 章は完成

_ 2010 年 08 月 10 日 (火曜)曇・雨

  • 05:00 起床
  • 06:50 研究室
  • 午前
    • 初心者向け『R統計解析』の執筆に着手した.
  • 午後
    • Ghostscript周りでファイルパスのチルダが \ {} に置きかえられてしまう件で /usr/share/gostscript/Resource/Init/gs_init.ps などを観てみたが,問題箇所はなさそう.
      • R の postscript() ではチルダをパスに使える.R のCairoPS と platex コマンドで,パスにチルダが使えない.この二つが共通に呼び出しているコマンドはなんだ

_ 2010 年 08 月 9 日 (月曜)晴・曇

  • 05:30 起床
  • 07:10 研究室
  • 午前
  • 午後
    • 初心者向け『R統計解析』の執筆に着手した.

_ 2010 年 08 月 8 日 (日曜)晴

  • 05:30 起床
  • 07:10 研究室
$ dvipdfmx -f ipa.map -o main.pdf main.dvi 

_ 2010 年 08 月 7 日 (土曜)晴

  • 05:30 起床
  • 07:10 研究室

_ 2010 年 08 月 5 日 (金曜)晴

  • 05:00 起床
  • 06:40 研究室

_ 2010 年 08 月 5 日 (木曜)雨/晴

  • 06:30 起床
  • 07:50 研究室
  • 午前
    • 相変らず,職場のメールサーバーがダウンしている.復旧見込なしと.
    • A Beginner's Guide to R の翻訳継続
  • 午後
    • A Beginner's Guide to R の翻訳継続
      • plot の pch 引数に 0 が使えないとあった.むろん pch = 0 は有効である.白抜きの四角形となる.col 引数と混同しているらしい.もっとも col引数でも 0 は指定できる.ただ,プロットの背景色と一致してしまうだけだ
    • 発注していた がきたのだが,アンプを繋げないと,実用的ではなさそう
    • 充電

_ 2010 年 08 月 4 日 (水曜)晴

  • 06:30 起床
  • 07:50 研究室
  • 午前
    • SKK を使っていたが,MozcにGUI設定が追加されたことを知り,変換をMozcに変えてみた. 基本的にはここの指示に従った.ただ5月に一度導入したこともあったので,そのソースディレクトリは改名して,あらたにレポジトリを投入した.
    • ただ Emacsインラインでの動作がどうも気にいらない.また安定しない.変換は素晴らしいが,どうもしっくりこない.なのでSKKに戻す.時間の無駄だった
  • 午後
    • gimp で eps を作成しても,その eps をgimp が読めない.とりあえず gimp portable をやめ,インストール版の gimp にかえ,さらに環境変数 GS_PROG も削除し,かわりに gs/binの4ファイルを,Gimp/bin にこぴー.
      • ただ GS_PROGはパスだけでなく,パスと実行ファイルまで含めなければいけなかったのかもしれない,明日試す.
    • でGimp で作成した eps をLinux の pLaTeX で処理すると \includegraphics{~/git/Document/tmp/Fig1.15.eps}
      ! LaTeX Error: Cannot determine size of graphic in \unhbox\voidb@x \penalty \@M
      \ {}/git/Document/tmp/Fig1.15.eps (no BoundingBox).
      どう調べても,[bb= 0 0 400 400] などを追加しても,こんどは
      ! Missing \endcsname inserted.
      とエラー.ふっと思って
      \includegraphics{/home/git/Document/tmp/Fig1.15.eps}
      と絶対パスに変えたら通った.CairoPS でもファイルパスにチルダをはさむとエラーになっていた.
      • どうもファイルパスの ~ が,勝手に \~{} というダミー記法に置き換えられているようだ.どうしてだろう.

_ 2010 年 08 月 3 日 (火曜)晴

  • 05:40 起床
  • 07:20 研究室

_ 2010 年 08 月 2 日 (月曜)晴

  • 06:30 起床
  • 07:50 研究室

_ 2010 年 08 月 1 日 (日曜)晴

  • 06:30 起床
  • 07:50 研究室