日録2008年_2月 のバックアップ(No.10) - アールメカブ

アールメカブ


日録2008年_2月 のバックアップ(No.10)


過去の日録

_ 2008年 2月 4日(月) 晴

  • 06:00 起床
    • 昨日あれだけ飲んだのだが,別に何ともない...
    • 07:20 研究室着 (整頓)
  • 午前
    • Yahooにこういうテキスト解析サービスがある.
    • NTCIR Test Collection のデータコレクションNTCIR-3 CLIR: Topics and Relevance Judgments (17.2 MB)をダウンロード.
    • CaboCha がUTF-8に対応したという情報があったので,さっそくインストールしてみた.拡張子が bz2 となっている圧縮ファイルの解凍方法をすぐ忘れてしまう.
      bzip2 -cd cabocha-0.60pre2.tar.bz2 | tar xf -
      • configure は通ったが,make が通らない.CRF++: Yet Another CRF toolkitが必要なもよう.configureの際,意味なさそうだが, UTF8オプションをつけてみた.configureファイルを確認すると,実際,意味なし.
        ./configure --with-charset=UTF8
        make
        sudo  make install
        sudo ldconfig # これを忘れないように
        その上で Cabocha0.60pre2をインストール
        ./configure --with-charset=UTF8
        make
        sudo  make install
        sudo ldconfig # これも忘れないうちに実行しておく
        実行してみる.
        $ cabocha
        僕は,今日大学で授業があるんだ.
           僕は,-----D
         今日大学で---D
               授業が-D
             あるんだ.
        EOS
        $ cabocha -f1
        僕は,今日大学で授業があるんだ.
        * 0 3D 0/1 -1.541709 
        僕      名詞,代名詞,一般,*,*,*,僕,ボク,ボク     O
        は      助詞,係助詞,*,*,*,*,は,ハ,ワ    O
        ,      記号,読点,*,*,*,*,,,,,,      O
        * 1 3D 1/2 -1.541709
        今日    名詞,副詞可能,*,*,*,*,今日,キョウ,キョー        O
        大学    名詞,一般,*,*,*,*,大学,ダイガク,ダイガク        O
        で      助詞,格助詞,一般,*,*,*,で,デ,デ O
        * 2 3D 0/1 -1.541709
        授業    名詞,サ変接続,*,*,*,*,授業,ジュギョウ,ジュギョー        O
        が      助詞,格助詞,一般,*,*,*,が,ガ,ガ O
        * 3 -1D 1/2 0.000000
        ある    動詞,自立,*,*,五段・ラ行,基本形,ある,アル,アル  O
        ん      名詞,非自立,一般,*,*,*,ん,ン,ン O
        だ      助動詞,*,*,*,特殊・ダ,基本形,だ,ダ,ダ   O
        .      記号,句点,*,*,*,*,.,.,.      O
        EOS
        いい模様.
  • 午後.乾麺
    • CaboChaのCインターフェイスを試してみる.
    • CaboCha? Java をキーワードにGoogleしていたら,Swigなるものを見つけた.Swigについてはここのサイトなど参考になる.
    • Rでこういう初期化方法もあるのか.Albert Bayes p.48
      > summ2 <- c()
      > summ2
      NULL
    • ある方が作成したRによる統計関連のpdfファイルを見ていたら,Rで作成されたeps画像内のHelveticaフォントを表示できない.Adobe Reader 8「Helvetica」フォントを検出または作成できません.というエラーが出るようになった.先週ぐらいまでは何の問題もなかったはずなので,この間のUbuntuアップデートによる影響なのか?やれやれ,これは去年まで使っていたFedoraで,自分が作成したpdfでも頻出した現象である.作る側の対処は分かっているのだが.
      • いったん右クリックして,別のビューアーで開いた後,ダブルクリックしてAdobe Reader 8で開いたら,ちゃんとHelveticaを表示するようになった.わけが分からん.

_ 2008年 2月 3日(日) 曇

  • 06:00 起床
  • 午後
    • 自宅のUbuntuにwineとR2WinBUGSをインストール.
    • 昼から寝るまで,ちびちびとやっていたら一升まるまる空けてしまった模様.
  • 定時就寝

_ 2008年 2月 2日(土) 曇

  • 06:00 起床
    • 07:20 研究室着 (整頓)
  • 午前
  • 午後.乾麺.ヨーグルト.
    • 例によってベイズ.
  • 整頓して定時帰宅、2合のんで定時就寝

_ 2008年 2月 1日(金) 曇

  • 06:00 起床
    • 07:20 研究室着 (整頓)
  • 午前
    • 充電.
    • Bayes 関連の調べ物.
    • 授業用にVBでHashtableを作成.
    • 黒マックにFinkをインストール sudo でClosest URLを使うよう指定した.
  • 午後.来客と外食.
    • 東京から電話.
    • 16:20-18:40 ゼミ.
  • 定時帰宅,4合ばかりのんで定時就寝.『算法少女』を一気に読んだ.