日録2007_11月 - RとLinuxと...

RとLinuxと...


日録2007_11月

e日録2007_9月 日録2007_10月 過去の日録

12月のイベント

新刊です.『最短経路の本』シュプリンガー・ジャパン

最短経路の本ーレナのふしぎな数学の旅

_ 2007年11月30日 (金) 晴

  • 06:00 起床
  • 07:30 研究室
  • 午前
    • スライド作成の続き. \tabular環境の中に\itemize環境を入れたらエラーになった.やむなくminipage環境でラップする.
    • 10:00 来客二人.
    • 郵便局へ用事
    • お昼.来客と弁当
  • 午後
    • 時世のことは書かない主義でブログを続けているのだが,YAHOOニュースのヘッドラインに「中国海軍のイージス艦視察計画、米側抗議で中止」.何を考えているやら...
    • Springer のH氏からメール.『最短経路の本』のサイトが立ち上がったそう.本を手にするのが楽しみ.
    • prosper でスライドを作成する際,自分の覚書として,一枚ごとにコメントのスライドをはさんでいる.実際のプレゼンでは,この偶数枚目のスライドは表示しないわけなので,この部分をコメントアウトする,あるいはこの部分だけを取り出す(印刷する)ためのperlプログラムを書いておいた.perl のループ処理では continue が next だったり,break が last だったり,久しぶり書くと,ちと厄介.
    • 16:20 ゼミ.なかなか頑張った模様.
  • 帰宅間際 H 氏来訪.教務について相談ごと.
  • 白鶴飲んで遅めに就寝

_ 2007年11月29日 (木) 曇

  • 06:00 起床
  • 07:30 研究室 (整頓).
  • 午前
    • 統計関係で送られてきた英語メールが溜まってしまったなぁ.眺めるのも,もはや面倒になってしまった.
    • スライド作成.今日中に終わらせるぞ.
    • languageRパッケージの growth.fnc() が作成したオブジェクトから eps 画像を作成すると,何やらグラフィックスパラメータが特殊らしく,TeX で文書に埋め込むときに,用紙の設定が変わってしまう模様.すなわちこれを埋め込んだスライド一枚だけが縦に立ち上がってしまう.いろいろ試行錯誤したが,どうもうまくいかん.やむなく,ストレートな処理ではあるが,グラフィックスソフトのGimpで一度読み込んで,改めて eps 形式で保存し直したら,うまくスライドに収まった.
    • 人様が作成したスクリプトに文句言って申し訳ないが,pukiwiki.elは使い勝手がいまいちだなぁ.
    • 生態学会で行われた R 講習会には異常な?数の参加申し込みがあった模様.生態学会ではRは必須の分析ツールになっているのだそうです.
    • お昼.乾麺
  • 午後
    • 12:50-14:20 演習
    • スライド作成.ほぼ完成しつつある.
    • 18:00 予算の書類下記.面倒だ...
  • 定時帰宅、定時就寝。
  •  何気なく「数学ガール」読み返す。ミルカさんのセリフ。
    「どうして<<調和級数は正の無限大に発散する>>
     と言えるかというと---」

_ 2007年11月28日 (水) 曇

  • 06:00 起床
    • N 軒屋に立ち番.
  • 07:30 研究室
  • 午前
    • 朝一で演習.今日は一日授業ばかりで余裕がない.
    • 10:30 - 12:00 会議(将来構想).会議後,H氏とご相談.
  • 午後
    • 12:50 - 16:00 講義.終わって工学部食堂.特別420.とんかつとカレーコロッケ.目玉焼き.気のせいか,コロッケの数が多かったような..先週,まちがって余計なお金を払ってしまったことを向こうも気づいたのかな?(笑)
    • ちょっと調べもの.ついでに書類書き.
    • 18:00 -19:10 大学院演習.
  • 帰宅後,白鶴ぐびぐび.
  • 定時より遅れて就寝

_ 2007年11月27日 (火) 曇

  • 06:00 起床
    • N 軒屋に立ち番ありそう.パトカーとすれ違う.
  • 07:30 研究室 (整頓).
  • 午前
    • さて,今日中にスライドを完成させようか.
    • お昼.乾麺.
  • 午後
    • Springer から,カバーデザイン等の連絡メール.
    • Peter Dalgaard から,R-2.6.1 is released というアナウンス.
    • TeX の propser パッケージなどを使って pdf のプレゼン資料を使う場合,しおり部分の日本語は文字化けする.euc 環境の場合,シオリ部分の文字コードをユニコード化するスクリプトプログラムがあって,調整できたのだが,もともと utf-8で書いている場合はどうするのか?googleても,あまり情報ないな.
    • Springer からカバーと帯のデザインが届いた.
    • minipageの処理がうまくいかないことがある.特に prosper を使っている場合.強引にこうしてみた

_ 2007年11月26日 (月) 晴

  • 06:00 起床
    • N 軒屋に立ち番あり.
  • 07:30 研究室 (整頓).
  • 午前
    • 朝一でSpringerに校正の結果を伝える.
    • その他,いろいろ書類書きで午前はつぶれてしまった.
    • お昼.乾麺
  • 午後
    • さて,統数研用のスライド作成.
    • Zipf の分布はゼータ分布と呼ばれる.すなわちZipf の法則で,彼の提案する確率モデルが,リーマンのゼータ関数で指数が1の場合であるという意味を考える.
    • zipfRパッケージで語彙頻度を spectrum クラスで表したオブジェクトをプロットする関数がある.対数化を指定するなら log = "xy" とオプション指定すれば良いのだが,描画される軸のメモリの意味に頭を悩ます.x軸は頻度の順番らしいのだが,y軸は何だ? 生のカウントで 1200 となるメモリが 1e+03 となっている.プロット領域は対数化されているのだが,その軸ラベルはそのままではないか.分かりにくいなぁ.
    • スライドを作成しつつ,内容がまとまってきた.来週末が講演会だが,何とかなりそう.
    • リーマンのゼータ関数 ζ(a)=1+(12)a+(13)a...+(1N)a... でパラメータ a がグラフの切片を決定する.
    • うーん.なぜリーマンのゼータ関数なのか...
    • ちょっとまとめる.Zipfの分布 πz=Cza では,n項の確率は,ゼータ関数のn項で求められる.ところでZipf分布では,定数Cがある.逆に,ゼータ関数をZipf分布で表すなら,各項の確率の和全体を定数Cで除算した式で表される.
(π1+π2+...πn+...)1C=1+(12)a+(13)a...+(1N)a...
  • 14:30 -16:05 演習.
  • Springer から電話があった模様.
  • スライド作り.だいぶまとまってきた.
  • 定時帰宅,定時就寝.

_ 2007年11月25日 (日) 晴

  • 06:30 起床.
  • 午後
    • 校正を確認し,Springer へメール.
    • 22:00 Springer から電話.編集の打ち合わせ.頭が下がる思いである.こっちは良い気持ちで酔っていたので,呂律が回っていなかったかもしれない...今後もよろしくお願いします.
  • 23:30 就寝

_ 2007年11月24日 (土) 晴

  • 06:30 起床.
  • 08:00 研究室 (整頓).
  • 午前
    • Springer から最終校正で,15章分の pdf が完成したとのメールが届いていた.発信日時は昨晩の23時半.連休中というのに,夜中まで残業で大変だと思う.こっちも,ちゃんとチェックします.幾つか校正もれをはっけんした.
    • こういうサイト があるんですね.15 Oct 07 付け記事で中国の原潜の写真を公開中.
    • お昼.乾麺
  • 午後
    • ひたすらスライド書き.
    • ジャパンカップダートの結果.7-11.
    • prosper で pdf プレゼン資料を作っているのだが,\includegraphics{image} としている場合,image.eps と拡張子を付けないとエラーになる場合がある.普通は要らないはずなのだが,同じファイル内なのに,部分的にコンパイルエラーを起こす.なぜだろう.
    • Nautlis を使って,横の Fedora マシンに ssh 接続しようとしても開かない.何度か試行しているうちに,Nautlis がローカルなディレクトリの表示もしなくなってしまった.一度ログアウトすれば何となるかと思いきや,際ログイン後のデスクトップが真っ暗.幸い,メニューバーにターミナルを登録していたので,ここから sudo shutdown -r now で再起動した.再起動後は,正常に動作する.何だったんだ.
    • 大昔に作ったテキスト解析プログラムを自分で見直す.
    • これまた,少し前に作成した言語確率分布の報告内容を自分で見直す.
      EraInzolia
  • 定時帰宅。珍しく白ワイン。イタリア Era Inzolia と入浴後白鶴。

_ 2007年11月23日 (金) 晴

  • 06:30 起床.
    • 久しぶりN軒屋交差点で police が立ち番していた.
  • 08:00 研究室 (整頓).
  • 午前
    • Springer に奥付の校正を送る.
    • 充電
    • ジャパンカップダート.ゆっくり検討する暇もない.7-14で良いだろう.
    • 今のDELLのキーボードはペコペコしていて気に入らない.大昔のDELLのキーボードは,その点,良かった.ただ,サイズがいかにもアメリカ人仕様で,恐ろしく重い上,机を大きく占領してしまう(パソコン本体の筐体もそうであった.こっちはすでに処分してしまったが,キーボードだけ,未だに残している).で,今気に入っているNMBとか言うメーカのキーボードを接続するためのPS/2→USB交換ケーブルを物色.これなど安いが,本当に動作するんだろうか.まあ,安いし,Amazonで注文しちまえ.ルータも端子が足りなくなったのでもう一台補充する.これこれで良いだろう.安いし.
    • さて,スライド作成.
    • マシン変えてから tmパッケージをインストールしていなかった.インストールしてみたら,どこかでこけている模様.しようがないので,一つずつ入れてみる.
      install.packages("cba")
      install.packages("filehash")
      install.packages("XML")
      install.packages("rJava")
      install.packages("RWeka")
      install.packages("Snowball")
      install.packages("tm")
      install.packages("gsubfn")
      install.packages("Rstem", 
      repos = "http://www.omegahat.org/R"
      ,type = "source")
      rJava でこけていた.
configure: error: Java Development Kit (JDK) is missing
   or not registered in R
Make sure R is configured with full Java support (including JDK).
 Run
R CMD javareconf
as root to add Java support to R.

If you don't have root privileges, run
R CMD javareconf -e
to set all Java-related variables and then install rJava.

言われたとおり,実行する.

$ sudo R CMD javareconf

Java interpreter : /usr/bin/java
Java version     : 1.4.2-02
Java home path   : /usr/lib/j2se/1.4/jre
Java compiler    : /usr/bin/javac
Java headers gen.: /usr/bin/javah
Java archive tool: /usr/bin/jar
Java library path: $(JAVA_HOME)/lib/i386/client:
  $(JAVA_HOME)/lib/i386:$(JAVA_HOME)/../lib/i386::
  /usr/lib:/lib:/usr/lib/j2se/i386:/usr/lib/jni
JNI linker flags : -L$(JAVA_HOME)/lib/i386/client
  -L$(JAVA_HOME)/lib/i386 -L$(JAVA_HOME)/../lib/i386
   -L -L/usr/lib -L/lib -L/usr/lib/j2se/i386 -L/usr/lib/jni -ljvm
JNI cpp flags    : -I/usr/lib/j2se/1.4/jre/../include
    -I/usr/lib/j2se/1.4/jre/../include/linux

Updating Java configuration in /usr/local/lib/R
Done.

で,rJava をインストールして,次に RWeka を入れようとしたら.

Exception in thread "main" java.lang.UnsupportedClassVersionError:
getsp (Unsupported major.minor version 49.0)
RWeka needs at least Java version 1.5/5.0.
ERROR: configuration failed for package 'RWeka'

ubuntuでの Java のヴァージョンは確かに

$ java -version
 java version "1.4.2-02"
 Java(TM) 2 Runtime Environment,
   Standard Edition (build Blackdown-1.4.2-02)
Java HotSpot(TM) Client VM
   (build Blackdown-1.4.2-02, mixed mode)

弱っちまう.Synapticで探して,sun-java6-jdk と ,sun-java6-javadb, sun-java6-fontsをインストール.その上で

$ sudo update-java-alternatives -s java-6-sun

を実行した.update-java-alternatives大量のメッセージが出るな.

で,念のため,rJava からインストールしなおす.すると tm でこける.

Error occurred during initialization of VM
java.lang.OutOfMemoryError: unable to create new native thread
ERROR: lazy loading failed for package 'tm'

もう一度

$ sudo R CMD javareconf
 Java interpreter : /usr/bin/java
 Java version     : 1.6.0_03
 Java home path   : /usr/lib/jvm/java-6-sun-1.6.0.03/jre
 Java compiler    : /usr/bin/javac
 Java headers gen.: /usr/bin/javah
 Java archive tool: /usr/bin/jar
 Java library path: $(JAVA_HOME)/lib/i386/server:
  $(JAVA_HOME)/lib/i386:$(JAVA_HOME)/../lib/i386::
    /usr/java/packages/lib/i386:/lib:/usr/lib
 JNI linker flags : -L$(JAVA_HOME)/lib/i386/server
   -L$(JAVA_HOME)/lib/i386 -L$(JAVA_HOME)/../lib/i386
     -L -L/usr/java/packages/lib/i386 -L/lib -L/usr/lib -ljvm
 JNI cpp flags    : -I/usr/lib/jvm/java-6-sun-1.6.0.03/jre/../include
   -I/usr/lib/jvm/java-6-sun-1.6.0.03/jre/../include/linux

 Updating Java configuration in /usr/local/lib/R
 Done.

こうして,もう一度 tm と Rstem をインストール.ついでに,gsub もインストール.小一時間かかった...

  • で,R_tmパッケージの使い方もすっかり忘れてしまっている.
  • 今年の春に調達したMacBook? Proの登録確認が今頃来た.購入直後に登録したはず.なんで,こんな時期に登録確認メールがくるのか?
  • R でコンコーダンス作成と言う投稿を見つけた.ただし,回答なし.
    • これを見て,こんなの書いてみた.
  • 定時帰宅,やや酒飲んで定時就寝.

_ 2007年11月22日 (木) 晴

  • 06:10 起床.今日は特に寒い.
  • 07:40 研究室 (整頓).
  • 午前
    • T氏来訪.学務に関する話.
    • 統数研用のスライド作成.languageRzipfR の話をするのだが,それぞれで実装されている関数の名前と出力が入り組んでいて,ややこしい.
    • ここら を参考に uim.el を synaptic でインストールし,uimを使って,変換候補をインラインに表示させようと思っているのだが,うまくいかない.http://d.hatena.ne.jp/mrkn/.また見直そう.
;; 変換候補を標準でインライン表示にする
(setq uim-candidate-display-inline t)
;; LEIMのセットアップをしつつuim.elを読み込む
(require 'uim-leim)
(setq default-input-method "japanese-anthy-uim")
  • お昼.来客と外食.
  • 午後
    • 引き続き,スライド作り.
    • Springer から,この連休中に連絡を取れるか問い合わせ.連絡も何も,私は連休になるなんて知りませんでした...
    • R のプログラムで以下のようにしたら,期待通りの結果はでなかった.これは alice の各トークンをベクトル化したデータを,冒頭から長さを変えて,回帰分析して,そのパラメータを比較するという意図.
alice.spcN <- list(25)
for(i in 1:25){
  alice.spc.tmp <-  text2spc.fnc(alice[1:i*1000])
  alice.spcN[[i]] <- lm(alice.spc.tmp$Vm ~ alice.spc.tmp$m)
}

:演算子の方が優先度が高いらしく,alice[1:(i*1000)]と,括弧でくくらないとしないといけないよう.

  • 16:05 ゼミ.課題をまったく進めていない模様.こっちが弱ってしまうな.
  • wine Domaine Bernard Delagrange, 1996 と白鶴。
    Domaine Bernard Delagrane
  • 定時帰宅,かなり飲んで遅く就寝

_ 2007年11月21日 (水) 晴

  • 05:30 起床.今日は特に寒い.
  • 07:00 研究室.
  • 午前
    • Canada の Baayen から返信が来ていた.'there is always one more bug' と.
    • 朝一演習.寒くなったせいか,欠席者あり.ケシカラン.
    • スライド作成.
  • 午後
    • 12:50 - 16:05 講義.終わった後工学部で特別定食400.白身魚と焼肉の定食.
    • Springer カバー文言の確認.校了の旨,連絡メールを送る.
    • 夕方の大学院演習までスライド作り.
    • 大学院演習.
  • 定時より遅れて帰宅し,やや酒のんで,遅れて就寝

_ 2007年11月20日 (火) 晴

  • 06:00 起床.
  • 07:30 研究室.
  • 午前
    • Springer の再校をもう一度見直して,中央郵便局より発送.
    • これから15時までに別の原稿を仕上げねばならん...
      • 間に合うかしら...
    • 学内のDNS の調子がまだおかしいではないか.
    • 午前中に原稿仕上がった.
  • 午後
    • お昼.ヨーグルトとチョコレート,お菓子.
    • t分布に関する教材を作成
    • 統数研でのプレゼンのスライド作りに入る
    • 14:35-16:05 演習.授業前に他ゼミの卒業生が焼酎下げて遊びに寄る.
    • Baayen にメールを書かねば.
    • 帰宅後,Springer から届いていた「まえかき」,「あとかき」について,校了の旨,連絡メールを送る.
  • 定時帰宅,定時就寝

_ 2007年11月19日 (月) 晴

  • 06:00 起床.寒い.
  • 午前
    • Springer の校正に専念する.
  •  午後
    •  昼ご飯も抜き、ひたすら校正。
    • 夜21:30。一応校正終わる。昨日今日と部屋に缶詰め。さすがにくたくた。
    • 風呂はいりながら、数学ガール再読。Zipfの法則を思い起こしながら、リーマンのゼータ関数調和級数 の項を再び楽しむ。
  • 23:30 酒を飲む気力も失せ、就寝。

_ 2007年11月18日 (日) 晴

  • 06:00 起床.寒い.
    • Springer の校正.
    • 校正に関連して欲張りアルゴリズム について,ちょっと調べる.さらに
      [0,1[ 
      のような表記法があることを知った.[0,1) のことである.開区間と閉区間の説明というページに確かに説明があった.
    • 夕方まで校正仕事を続ける.
  • 定時就寝

_ 2007年11月17日 (土) 晴

  • 06:00 起床
  • 07:20 研究室着(整頓)
  • 午前
    • Springer から 1,904,711都市を巡る最短経路問題の下界と最良解の差についての問い合わせがきた.現在の最良解はhttp://www.tsp.gatech.edu/world/から,少なくとも2007年6月時点の最良の下界は,7,512,218,268 であり,Keld Helsgaunの解は,これよりたか だか0.04987% だけ大きいことは確かなのだが,問題は原著者執筆時期の最良解なのだが...
    • Emacs 21は,起動時に固まることがよくある.ターミナルで xkill とし、カーソルでウィンドウを指定し、左クリック。
    • 半角キーで日本語変換に変わるのは不便.[SCIM開始] の設定をZenkaku_Hankaku から Control+Zenkaku_Hankakuに変更.
    • 昨日あたりから,また学内の DNS がこけている模様.管理担当の先生たち,早く業者に管理を委託してくれませんか?
    • ネットワークの接続状況がかなり悪い.それなりに規模の大きな組織のネットワークなのだから,素人教員が手を出すべきではない.経験もノウハウもある専門業者に任せるべき.
    • お昼.乾麺.
  • 午後
    • 旧友から久しぶりのメール
    • 学内ネットワーク,ますます調子悪し.工学部の先生なんかに任せたらあかん.
    • おやつ.ヨーグルト.
    • Baayen の作成したlanguageRパッケージのバグを発見.
      x <- 0
      y <- 0
      z <- 0
      for(i in 1:length(alice)){
       x <- nchar(alice[i])
       if(x > y) {
         y <- x
         z <- i
       }
      }
      x;y;z
      alice[z]
    • Baayen は大学を移籍した模様.
  • 定時帰宅。
    • Springer から第二校が届いていた.
  • ワイン。 Domaine Bernard Delagrange Beaune 1985。
    Domaine Bernard Delagrane Beaune 1985
  • 遅めに就寝

_ 2007年11月16日 (金) 曇

  • 06:00 起床
  • 07:20 研究室着(整頓)
  • 午前
    • Springer に原稿送った.
    • カイ二乗検定は,分布を仮定せずに適用できると書いている文献が結構ある.しかし,カイ二乗分布そのものは,確率変数 X が,それぞれ正規分布にしたがっている時に導かれる分布である.前から気になっていたので,ちょっと調べた.関連する証明を豊田秀樹「数理統計ハンドブック」p.293 に見つけた.要するに多項分布へ拡張できるということらしい.
    • お昼.来客があって一緒に弁当.
  • 午後
    • 12:00 -13:00 会議(将来構想).直後に H 氏陪席のもと,Y氏と話.
    • プレゼン資料作り.対数尤度比検定についてまとめる.
    • 16:20 - 17:45 ゼミ.なぜ黙っていても,課題を自ら進めようとしないのかな?よくわからん....
  • 定時帰宅。ワイン。Domaine Bernard Delagrange Beaune 1978。
    Domaine Bernard Delagrane Beaune 1978
  • ワインの後,白鶴だか何だかを飲んで就寝.

_ 2007年11月15日 (木) 晴

  • 06:00 起床.
  • 07:20 研究室着
  • 午前
    • 依頼された php と Postgresql のプログラムを書く.スペルミスによるエラーを見つけるのに時間かかってしまった.
    • Springer から依頼された「後書き」を書き終えた.これから推敲しよう.
  • 午後
    • 12:50 - 14:20 演習.
    • おやつ,乾麺.
    • 訳者後書きの草稿.宣伝になるかもしれないから?,今,ここに公開してしまっても構わないだろう.

本書は数学と日常生活の関わりを,グラフ理論を例に解き明かした「物語」である.物語を書き上げたのはドイツ数学会の大ベテランと気鋭の若手のコンビである.二人は,読者の側に特別な数学知識を要求せず,また複雑な数式の展開も避けつつ物語を展開させている.しかし読者は,本書を通読した後,大学の情報科学で必要とされる基本知識を身に付けていることに気がつくことだろう.

物語は,数学の苦手なドイツ人高校生ルツが,父親からパソコンを贈ってもらったことに始まる.ところが,このパソコンにはある秘密が隠されていた.人と会話ができる「最新のソフトウェア」であるビムが密かにインストールされていたのである.そしてルツとビムとの出会いから物語は進んでいくのである.

ルツの「数学が一体何の役に立つの」という素朴な疑問を受けて,ビムは,彼女の故郷である北国ハンブルクへの最短のドライブコースや,彼女が日常利用しているミュンヘン交通網を例に,その背景にある数学的理論,すなわちグラフ理論の解説を始める.さらには数学理論を現実に応用するための「アルゴリズム」についても説明していく.普通の数学書ならば抽象的で理解しにくい内容も,ビムの具体的かつ当意即妙な話術にかかると,数学嫌いのルツにも自然と飲み込めていくのである.

やがて話題は,グラフ理論の「創始者」ともいえるオイラーの業績へ及んでいく.ビムは,有名な「ケーニヒスベルクの橋」の問題の背景とオイラーの出した答えを,ルツと彼女のボーイフレンドであるヤンの二人に丁寧に解き明かしていく.「橋」の問題は,さらに現代のゴミ収集車の「最適な」作業ルートの設計方法に通じるものである.そしてついには,難解な「巡回セールスマン問題」や「組み合わせ理論」が,そもそもなぜ「難解であるのか」,その理由をも二人は理解するに至るのである.こうしてルツとヤンは,数学に対する苦手意識を克服していく.

一方,我々読者もまた,ルツとビム,そしてヤンらの織りなす物語を通して,グラフ理論とその応用分野を理解していくことになる.読者は,時には数学あるいはコンピューターの発展の背景にある数学者たちの努力や逸話を垣間見るであろう.さらにはビムが何者であるのか,なぜルツのパソコンに忍び込んでいたのか,推理を重ねることでもあろう.そしてルツと両親との間の微妙なやりとりや,ボーイフレンドであるヤンとの関係にやきもきもするであろう.

このように,本書はグラフ理論を中心とした数学の解説書であると同時に,女子高生ルツを主人公とした「青春小説」でもある.気構えることなく,純粋に物語として楽しんで読むこともできるのである.読み終えた時,読者は物語に対する深い満足感をえると同時に,グラフ理論と情報科学の基礎をも習得できている.それが本書の特色である.

原書のタイトルは Das Geheiminis der k\"{u}rzesten Weges (最短経路の秘密)である.原著者の詳細は扉にも紹介があるので,ここでは繰り返さない.訳出にあたっては,「物語」であることを念頭におき,平易な日本語を心がけたつもりである.また,やや込み入った数学的解説では,読みやすさを重視して,かなり大胆に意訳した場面もある.読者の皆さんの判断を仰ぎたいと思う.

なお,本書には多くの URL が引用されているが,原著者の前書きにも書かれているとおり,本書の刊行後もそれらのサイトへのアクセスが可能かどうかは定かではない.しかし,本書の内容を参考に,ぜひ自ら検索サイトを利用して,最新の情報を探してみてほしい.読者はそこに本書に補足する内容や,新しい知見や情報をえることができるかもしれない.さらには本書を通して培った知識を発展させることも可能であろう.

  • 講演のスライド作成に入る.corpora_0.3-2.tar.gz を Rにインストールしてみた.
  • H氏来訪.TeXのお話.
  • Rを使って,無理やり collocation (kick bucket みたいなペア)を取り出すプログラム(と言うほどのものでないが...)を作成してみた.alice は languageR パッケージに付随するデータセットである.,
alice.rabbit <- which(alice == "rabbit")
for(i in alice.rabbit){
 x <- i - 3
 y <- i + 3
 if(x< 0) x <- 0
 if(y > length(alice)) y <- length(alice)
 cat(alice[x:y])
 cat("\n")
}

これで,Alice in Wondeland に rabbit と言う単語が出てくるすべての箇所を抜き出して,その前後3単語の環境を含めて表示する.

  • 定時帰宅。今日は結婚記念日だそうな。と言うわけでワイン。Domaine Bernard Delagrange Volnay 1969。さすがにうまい。
    Domaine Bernard Delagrane volnay 1969
  • ワインの後,白鶴だか何だかを飲んで就寝.

_ 2007年11月14日 (水) 晴

  • 06:45 起床.寝坊した.
    • だいぶ遅れて家を出たけど,N軒屋交差点にpoliceはいなかった.
  • 07:40 研究室着
  • 午前
    • 充電
    • 今日は一日忙しい.まず 10:10まで演習.
    • お昼.乾麺.
    • OpenOffice? のプリンタ出力がうまくいかない.他のソフトは問題ないのだが.
    • Springer から,「後書き」を書いてほしいと依頼.また,今週中に校正を送ると.今回は第二校があるのか.後書きの締切りは来週月曜.第二校の校正は来週末くらいかな?
  • 午後
    • 12:50 - 16:05 講義
      • 合間に食堂.特定食.間違って520払った.
    • 16:10 - 17:50 演習
    • 18:00 - 19:30 大学院
    • 要望があった,ポインタの使い方.簡単な例1
      #include <iostream>
      using namespace std;
      
      void test(int * x){
      // void test(int x[]) でも良い
       x[0] = 1;
       x[1] = 5;
       //  return x;// これはダメ
      }
      
      int main(){
       int x[ ] = {0,0};
       test(x);
       cout << *x << " and "
       << *x+1 << " and "
       << *(x+1) << endl;
       return (0);
      }
  • 定時より遅れて就寝.

_ 2007年11月13日 (火) 晴

  • 06:00 起床
    • 少し遅れて家を出たら,N軒屋交差点にpoliceが立っていた.
  • 07:30 研究室着
  • 午前
    • サーバーが Nov 12 21:20:59 にダウンしていた.理由は不明.まだ調べていない.
    • yahooのニュースに,自衛隊装備品に「正露丸」復活というニュース.「ロシアを征服するという意味を込めて「征露丸」と名づけられた」そうな.余談だがLinuxで使っている日本語変換ソフトはAnthyで,あまり効率よくないのだが,「正露丸」は一発で漢字変換できた.
    • デフォルトの yatex だと,勝手に80文字で改行してくれる./usr/share/emacs/site-lisp/yatex/yatex.el の 691 行目をコメントアウトする.
      ;  (turn-on-auto-fill)			;1.63
    • emacs での日本語文字コード設定だが,
      (set-buffer-file-coding-system 'utf-8)
      などと utf-8 としている場合と,utf-8-unix としている場合があるのだが,挙動に違いがあるのだろうか?以下の部分で utf-8-unix を使っている例はないようだが.
      (coding-system-put 'utf-8 'category 'utf-8) 
    • 来月出張するので名刺を作っておかねば.
    • beamer のフォルダは/usr/local/teTeX/share/texm-dist/tex/latex/beamer であるので,ここに不足分のスタイルファイルを追加することとする. sudo cp beamercolorthemewolverine.sty /usr/local/teTeX/share/ texmf-dist/tex/latex/beamer/ sudo cp beamerthemeAnnArbor?.sty /usr/local/teTeX/share/ texmf-dist/tex/latex/beamer/ マニュアルは/usr/local/teTeX/share/texm-dist/doc/latex/beamerにある.マニュアルのbeameruserguide.pdf へのシンボリックリックを progSource/Tex に張っておく.確かにこのマニュアルは詳細である.その他に大量のサンプルが,このディレクトリ下の examples にある.
    • 昨晩,Nov 12 21:20:59 にサーバがダウンした理由が判明.gpm が起動しているログが残っている.それで,推測する.
    • beamer はコンパイルできるのだが,dvipdfmx を実行すると大量の WARNIGS が出る.作成される pdf も期待通りではない.何か足りないのか?
  • 午後
    • 乾麺.ヨーグルト.
    • 12月08日用のスライド作りに入る.今更ながら,結構,大変.
    • 14:35-16:05 演習
    • Altmann を読みつつ,スライド作成.発表の流れは,一応構想できた.
    • 研究室の電話が朝から何度か鳴る度に無視し,うるさくなってベル音を消す設定にしていたのだが,やがて携帯の方にもかかってきた.Springer の数学編集部からであった模様.私が研究室の電話を取るのは,条件反射でついつい手を伸ばしてしまった時だけです.
      • で,話題は,原書の主人公 Ruth のカタカナ表記について,日本人に受け入れやすいよう,名前そのものを変更することも含めて検討したいとのことであった.一応,原著者に確認を取るとのこと.
    • zvab 軽油で発注した Widerholungen in Texten が届いていた.
  • 定時帰宅,定時就寝

_ 2007年11月12日 (月) 晴

  • 05:55 起床
  • 07:10 研究室着(整頓)
  • 午前
    • Beamer のスタイル類はここにある.
    • ただ,どこに配置したものか?
      export TEXINPUTS=.:/usr/local/teTeX/share/texmf//:~/tex/style//:
      のように環境変数を設定するのは ptetex3 に妙な影響を及ぼしそうなので,デフォルトスタイルと同じ場所に置く方が良さそうだが,その場合もどこが適当だろうか?
    • pdf ファイルを開こうとしたら,「Acrobat Reader 8はまだインストールされていません。」というメッセージが出て,AdobeReader_jpn-8.1.1-1.i386.deb のダウンロードが始まるが,スーパユーザーではないので当然,インストールは失敗する.朝一の大量のパッケージアップデートと関係あるのか? ここから,ファイルを拾ってきて,手作業でインストール.
      $ sudo dpkg -i AdobeReader_jpn-8.1.1-1.i386.deb
    • /usr/local/teTeX/share/texmf/dvips/config.ps をオリジナルに戻し,kanji.map を参照する処理は省いた.
    • さて Ubuntu 上にプレゼン作成用の TeX ツールも整ったので,学会発表資料をバリバリ作成するか.
    • サンプル数が大量になる場合のカイ二乗検定の問題について,ちょっと調べておくつもりでThe Generalized Chi^2 Goodness-of-fit Testを複写依頼. S. P. Pederson and M.E. Johnson, Estimating model discrepancy, Technometrics vol 32, no.3 (1990)は大学図書館にあるので,複写のために足を運ばねばならない.と思ったら,vol 32, no.1 までしか所蔵していないようなので,やはり複写依頼を送る.
    • Y 氏来訪.ネットワーク設定について質問される.
    • Niehaus p.254 に,Mischtext には Hyperpoisson 分布が適合すると,いきなり説明がある.根拠は? その他,p. 258 の k の推定式 0.4126q-1.647 もどこから出てきたのか?そもそもそのページ隣にある,各テキストについての k と一致しないではないか?
  • 午後
    • お昼.Special.コロッケ,煮込み「風」ハンバーグ,目玉焼き.
    • 食堂の帰りに南棟2階に立ち寄った.ドアが開いたまま授業を行っている部屋があった,何気なく覗くと,黒板の前で学生がバリバリ数式を書いていて,それを O 先生が見守っている最中であった.そういう状況ではあったが,こちらに会釈をしてくれる.
    • また Y 氏来訪.
    • Springer からメール.原書のラテン語部分について,独語からではなく,ラテン語から直接訳してほしいと...
    • H氏来訪.
  • 定時帰宅,定時就寝

_ 2007年11月11日 (日) 晴

  • 06:55 起床
  • 午前
    • Mac Port を使った Mac での Tex 環境についてのサイトをブックマークしておく.
    • dvips の文字化け問題再考.ここのサイトなどを読みつつ,頭を整理する.
    • dvips の文字化け問題解決.cidfmap に記載したフォントパスを間違えていた. /usr/share/ghostscript/8.61/lib/cidfmap に
/IPAGothic	<< /FileType /TrueType /Path
  (/usr/share/fonts/truetype/ipamona/ipag-mona.ttf)
   /CSI [(Japan1) 6] >> ;
/IPAMincho	<< /FileType /TrueType /Path
  (/usr/share/fonts/truetype/ipamona/ipam-mona.ttf)
   /CSI [(Japan1) 6] >> ;
%
/IPAGothic-Regular	/IPAGothic ;
/IPAMincho-Regular	/IPAMincho ;
/Ryumin-Light		/IPAMincho ;
/GothicBBB-Medium	/IPAGothic ;
/HeiseiMin-W3		/Ryumin-Light		;
/HeiseiKakuGo-W5	/GothicBBB-Medium	;
/Adobe-Japan1		/Ryumin-Light		;
/Adobe-Japan2		/Ryumin-Light		;

のように記載すればよい.フォントは適宜調整.

  • そもそもptetex3において/usr/local/teTeX/share/texmf/dvips/config.ps に kanji.map を追加する処理は不要のよう.
  • また
    sudu mktexlsr
    mktexlsr: Updating /var/lib/texmf/ls-R-TEXMFMAIN... 
    mktexlsr: Updating /var/lib/texmf/ls-R-TEXLIVE... 
    mktexlsr: Updating /var/lib/texmf/ls-R... 
    mktexlsr: Done.
    は不要ではないか.
  • この様に苦労して prosper の環境を整えたのだが,Beamer という便利そうなプレゼンテーションドキュメント作成ツールを見つけてしまった.これなら dvips を介さず,dvipdfmxで直接 pdf を出力できる模様.
  • こういうプラグインがある.IEやNetscapしか許容しないサイトへの対策.
  • エリザベス女王杯.ウオッカが直前になって出走中止.
  • 意味なく酒飲んで就寝.

_ 2007年11月10日 (土) 晴

  • 06:55 起床
    • 土曜だというのに,ヘルメット姿で中学生が自転車通学しているのだが?
  • 08:00 研究室着(整頓)
  • 午前
    • 週の半ばぐらいから周辺に風邪をひいている人が増えた.引くのは勝手ですが,人前に出るときは,マスクぐらいはした方がいいですよ.
    • 10:00 頃から消防車のサイレンがけたたましい.11時半になってもまだ鳴っている.
    • お昼.乾麺.
  • 午後
    • ゼロ打ち切りの負の二項分布 についてメモ. MathML で \binom 命令を使うと,Firefox で表示されないので不便だ.
    • 時々 Emacs が args out of range: とか言って,打鍵を受け付けなくなる.Anthyをoff にして,C-g で抜ける.
    • latex2html をGUIでインストール.libnetpbm10 netpbm perl-doc が追加でインストールされる..latex2html-init は以前のマシンの設定を流用するが,一ヶ所
      $LATEX = '/usr/local/teTex/bin/platex --kanji=utf8';
      の部分を変更した.
    • メニューが日本語にならないので,調子に乗って,日本語パッチ版のlatex2html もコンパイルし,インストールしてみたが,これは utf-8 に対応していない模様.make uninstall が効かないので,
      sudo rm /usr/loca/bin/latex2html 
      sudo rm -Rf  /usr/local/lib/latex2html
      cp -p /usr/local/bin/texexpand ~/BackUp/
      sudo rm -Rf /usr/local/bin/texexpand
      sudo rm -Rf /usr/local/share/lib/latex2html/
      と消しておく.ただ,次は mktexlsr に実行されているので,残しておいた.でもこのコマンドで作成されるリストファイルは百害あって一利なしかもしれない.
      /usr/local/teTeX/share/texmf/tex/latex/html/
    • 明日のエリザベス女王杯.3-7 と常識的に...
    • ファイルを新規に作成する際,同時に新規のディレクトリを作ろうとしたら,Emacsに
      Use C-u M-x make-directory RET RET 
      to create directory and its parents
      と怒られた.
    • その Emacs だが,bash で設定している環境変数 PATH を無視することがある.
      ~/research/Tex/papers/p2007$ which -a platex
      /usr/local/teTeX/bin/platex
      /usr/bin/platex
      なんだが,yatex 上で C-c l すると,後者が実行されることがよくある.bashの環境変数には落とし穴があるそうだけど.
    • prosper でプレゼン資料を作ろうと思って,雛形で試してみた.dvips でポストスクリプトに変換し,その上で ps2pdf14 で pdf ファイルを作成する必要がある.ところがdvips で作成した ps ファイルが文字化けしているのに初めて気がついた. /usr/share/ghostscript/8.61/lib/cidfmap を見ると,確かに有効な記述がない.ところが編集しても効かない.Ghostscript8.61 と utf-8 環境では日本語ps は厳しいのか?思いつくのは,
      dpkg-reconfigure cmap-adobe-japan1
      を「明示的に」あるいは「マニュアルで」実行していないことだが,関係なさそう.
  • 飲むだけ飲んでやや遅い時間に就寝.

_ 2007年11月9日 (金) 晴

  • 05:35 起床
  • 07:00 研究室着(整頓)
  • 午前
    • Sichel の混合ポアソン分布について,その理論的根拠を確認しなおすため,B. Niehaus p.216 を参照する.Sichel の混合ポアソン分布については,以前ここのpdfファイルに,また関連する内容をここにまとめた.
      • Niehaus には,言語の解析単位を句から語へと移行した場合,新たなパラメータの導入が必要であることをAltmannは示したとある.確かに Altmann は,自身の仮説に基づいて,基本的な離散分布に基づく数式から,独自の式を導出してはいる.また,各種のサンプルを集め,分布の適合度を検定している.しかし,私には,彼の適合度の検定方法は恣意的なような気がしてならない.
      • p.220 に,テキストサンプルが 17 なら,各種確率モデルを比較するのに適当であるが,10以下では足りないとあるが,この17と言う数字は,Niehausが各ジャンルごとに今回収集できたサンプル数に過ぎない.
    • 昨日 JTextField? クラスのオブジェクトのイベントをとる方法を考えていた.カーソルが入ったときにイベントが出るのだろうと思っていたが,そうでなく,エンターが押されたときにイベントが出るようであった. JTextFieldの簡単な例
    • 今日もネットワークが断続的に不調の様子.管理センターの先生たちは,いつになったら,はるかにノウハウの豊富な一般業者にネットワーク管理を委託してくれるのだろうか.
    • 午前.来客.
  • 午後
    • 12:00 - 13:00 会議(将来構想).後半は出席者二人の口論.
      • 14:00 - T 氏来訪.先ほどの会議について.
      • 14:30 学生二人.続いて S 氏来訪.やはり先ほどの会議について.加えて,Web アプリケーションについて,もろもろの話.
    • 研究室入り口のパソコンは,どこか別室に設置したいが,しかし授業に困るし.
      • 16:30 ゼミ.一人欠席.
      • 別のゼミで「さくらサーバー」をレンタルしたいと言う相談が舞い込む.
  • 定時より遅れて帰宅
  • 意味なく飲酒し,定時より遅れて就寝

_ 2007年11月8日 (木) 快晴

  • 06:05 起床
  • 07:20 研究室着
    • 学務関係のメールが数通.昨日授業で欠席した会議(将来構想)は大荒れだったらしい...
    • T 氏来訪.会議の様子など伺う.
    • 昨日ドイツの古本屋2軒に,それぞれ別の本の注文メールを送ったが,その返事が二つとも来ていた.どちらも「すぐに送る」との返答.一軒からは航空便を望むかという問い合わせもあったので,そうしてくりゃれ,と返信する.こちらの価格は本体 99,00 ユーロ + 航空便で 19,00 ユーロ.数字の間のコンマは,米国や日本風に書けば 99.00, 19.00 のことである.返信は独語で書いてみた.
    • 欧文テキストを句に分解して解析すると言う作業を忘れていた.手順を思い出さねば.
      • TreeTagger を新システムにしてからまだインストールしていなかった.Chunker の方のリンクが切れている.旧マシンからコピーした.
      • install-tagger.shを開いてみると,サイトで用意されている german-big-par-linux-3.1 をインストールする指示がない.手作業で追加して,
if [ -r german-big-par-linux-3.1.bin.gz ]
then
   gzip -cd german-big-par-linux-3.1.bin.gz > lib/german.par
   echo 'German Big parameter file (Linux) installed.'
fi

スクリプトを走らせる.10月の日録でも書いたがcmd/filter-chunker-output-german.perl の perl パスを修正し,gawk を GUI でインストール. 指示どおり bash_aliases に

:$HOME/progSource/TreeTagger/cmd:$HOME/progSource/TreeTagger/bin

を追記しておく.

  • さて,問題は文字コード,独語の場合,iso-8859-1 で用意したファイルでないと解析には不都合が出る模様.
  • 久しぶり Eclipse でプログラミング.Eclispe にはコード補完の他,便利な機能が満載されているのだが,何をどうするのか,すっかり忘れてしまった.少し手間かけてメモを作成しておこう.
  • 全体会議
  • 微妙に日本酒飲んで就寝.

_ 2007年11月7日 (水) 快晴

  • 06:05 起床
    • N軒屋の交差点に差しかかった時,パトカーとすれ違った.どうも交差点の police は私の出勤より遅く,参勤するらしい.立ち番する曜日のパターンをカウントしようかと思っていたが中止.
  • 07:20 研究室着(整頓)
  • 午前
    • 8:35 - 10:10 演習
    • Java に興味を持つ学生用に Eclipse資料を作成.内容は昔懐かしい Applet!
      • 久しぶり作ってみると,Thread クラスの仕様はどうだったっけとか,Runnable インターフェイスの stop メソッドが deprecate されていた,などなどと思い出すことが多い.
  • お昼,乾麺,お菓子.
  • 午後
  • 定時帰宅,定時就寝
  • 微妙に日本酒飲んで就寝.

_ 2007年11月6日 (火) 雨

  • 06:05 起床
  • 07:20 研究室着(整頓)
  • 午前
  • 午後
    • 14:35-16:05 演習.
    • 授業用に Visual C++ の教材2を作成.
    • 帰り間際だが,何だか腹が減ったので,ヨーグルト食す.
  • 定時帰宅,定時就寝

_ 2007年11月5日 (月) 曇/雨

  • 06:05 起床
  • 07:20 研究室着(整頓)
  • 午前
  • 午後
    • お昼.Special \400.焼肉?白身魚のフライ.どっちも固かった.
    • Literate programming (文芸的プログラミング) Sweave をさらに調整. 文芸的プログラミングとは,「プログラムのソースコードと、対応するドキュメントを結びつけて、一つのファイルにすること」翻訳はここ>. 「ドキュメントチャンクは最初の文字としてサイン (@) を持ち、その後には空白か改行文字が続く。」 「コードチャンクは、最初の行が <<name >>= で始まり、その行の残りはコメントであり無視される。」
    • 言語統計解析に関する R パッケージについて調査.
    • 0-truncated Poisson distribution を R で実現する方法. http://finzi.psych.upenn.edu/R/Rhelp02a/archive/55114.html
      rtpois <- function(N, lambda) 
        qpois(runif(N, dpois(0, lambda), 1), lambda)
      rtpois(100,5)
      他にVGAMパッケージに Zipois 関数が実装されている.ここには負の二項分布のパラメータ推定関数もある.
    • .Stex ファイル? を yatex モードで編集するため以下のように emacs.el 編集してみた..tex を .?tex とした.
      (cons (cons "\\.?tex$" 'yatex-mode) auto-mode-alist))
  • 定時帰宅,定時就寝

_ 2007年11月4日 (日) 晴

  • 06:30 起床
  • 午前
    • 自宅のPC の Ubuntu on XP で TeX を設定.
  • 午後
    • 昼から牡蠣の土手鍋で一杯やってしまった.よって,その後,一切仕事できず...
    • 就寝前に未練たらしく Sweave の設定.結局,Sweave が TeX-Live の latex の方を呼び出すようになっていることを修正するのは保留し,以下のように pTeX の方を再コンパイル.
      KANJi_CODE=UTF
      のオプションをはずし,bash に
      alias platex='platex --kanji=utf8'
      を設定すれば,ess-swv.el で M-x l で latex in TeX-Live が呼び出されることは変わりないが,普通の TeX ソースが作成されるのは間違いないので,これを yatex 等でコンパイルすれば良い.
  • 定時帰宅,定時就寝

_ 2007年11月3日 (土) 晴

  • 06:05 起床
  • 07:20 研究室着(整頓)
    • 昨日に引き続き,去年作成した日本語テキスト解析プログラムをチェックする.Perl は,簡単に作成できるから,あれこれ大量にスクリプトを作っている.だが,個別の目的ごとにプログラムを作ってしまうので,後で転用しようにも,いつどんなプログラムを作成したか,そして,それをどこに保存したかをすぐに忘れてしまう.マニュアルまで作成し,後で転用できるようにすることを考えると,プログラムはすべて Eclipse 上で Java か C++ で作るべきか.もちろん Autoconf や doxygen などを駆使して,Emacs 上ですべて完結すると言う手もあるが...
    • phrase.R スクリプトで,cutRuby.pl, forCabocha.pl で解析済みの 111 個のテキストについて,その確率分布を,区間を 1,3,5 とずらしながら適合度を測るという処理を一括して行っている.出力は,個々のテキストごとに加えて,各テキストの結果を行ごとにまとめて一枚の csv ファイルにまとめたものもある.この後者のファイルから,全体の適合度をチェッするためのスクリプトを checkResults.R として保存.
    • 適合度を測るのに,χ二乗検定やその派生である Cohen のオメガは,やはり問題があるな...
    • Man-Whiteny検定での R の出力が気になったので,ちょっとチェックした.そもそも「正確な」 P 値が,「近似的に」正規分布を仮定して計算できるという言い方が分かりにくい.
    • お昼乾麺
  • 午後
    • 対数線形モデルは,要因に対応がないことが前提とされている.
    • いつもの解析手順は,まず仮説を立て,その仮説に基づいて複数の解析を一度に自動実行できる R スクリプトを作成し,一気に走らせる.解析結果を参考に Tex でレポートにまとめる.というものだが,前々から,二度手間だなぁと思っていた.ubuntuに乗り換えたのを機に,この際,Sweave ですべてを処理しようと思う.その覚書 R_Sweave?作成.
    • うーーん,Sweave をコンパイルしようとすると TexLive? の方が呼び出されるなぁ.何でだろうか?
    • いろいろいじっていて,つい,export TEXMF などとやってしまった.おかげで,Texの環境がおかしくなったようで,また utf-8 のソースが通らなくなった.ptex3をコンパイルし直してみようとすると,これもエラー.どうも $HOME/.texmf-var/ に妙な設定ファイルがあるらしい.これをディレクごと削除して,再コンパイル可能に.そして再インストール.
    • それでも直らん? バックアップ取っておいた emacs.ubuntu.el と差し替えたら,ただこれだけで文字化け直った.わけが分からん...ついでに ESS も再インストール.
    • 結局,Sweave をインクルードした tex ソースは euc-jp でないと文字化けする...この作業で半日潰してしまった...
  • 疲れて帰路.落ち着いて少し考える.ええっと,ptex3 はデフォルトでは euc によるファイルを入力としている.しかし,utf-8 で作成されたファイルでも,euc にコンバートして,コンパイルする.すると,どこかのタイミングで対象ファイルの文字コードを判定し,適当なフィルタを通しているということか.
    • Sweave は latex のみサポートしていて,platex には対応していないということかな?
    • ファイル共有で,GUI で設定できそうなメニューが用意されているが,smbpassws -a でsambaユーザーとパスワードの登録を忘れてはいけない.
  • 23:00 Vosne-Romanee 2004 で就寝.
    Vosne Romane

_ 2007年11月2日 (金) 曇

  • 06:05 起床
    • 今朝も交差点に police おらず.
  • 07:20 研究室着
    • ps/2 -> USB 端子を入手せねば,お気に入りのキーボードが使えん...
    • セントロニクス端子のついた古いノートの Windows パソコンがあったので,それをそのままプリンタサーバーにした.ルータで遮断して,ネットワークサービスでパケットフィルタリングを行い(137:udp,138:udp,139:tcp,445:tcp + 443),ウィルス対策ソフトを入れて,普段はネットワークケーブルを外して運用.そのうち Linux でプリンタサーバーを構築しようと思うが,暇ないだろうなぁ.
    • XP on VMware に MP10 を設定.
    • XP on VMware at Ubuntu in DELL Inspiron に Windows Mobile ActiveSync? がインストールできない. XP on VMware at Fedora5 in Opteron AMD 64 にはインストールできたのだが...
    • お昼乾麺.
  • 午後
    • Baayenに移ろう.
      • 混合モデルが成立した背景についての説明が p.283 にある.それは良いのだが,fixed effects の例として, SOA (stimulus onset asynchrony, the time between the presentation of a prime or distractor and the presentation of the target in chronometric experiment) と.英語ネーティブには,これで説明になってるんだろうか?しかし,それは許す.でも,splitplotデータに SOA 何て変数はないぞ...
      • R on ubuntu7.10 にまだ languageR をインストールしていなかった.さっそく実行.なかなか高速で非常に気分が良い.
      • Baayen で引き続き,混合モデルの有効な例として,言語心理学での実験例が紹介される.しかし,どうもその実験データの目的と意味がよく分からない.正確には,その「実験の意義」が納得できない.統計分析は複雑なわりには,実験の発想や道具立てが素朴過ぎるような気がしてならないのだが,あるいは実験とは,このように素朴であるべきなのか?
    • Baayen 打ちきって,佐々木義之編『変量効果の推定とBLUP法』をひもとく.
    • Ubuntu でフィルタリングせずに文字変換を行うプログラムは recode だそうな.
      recode EUC-JP..UTF-8 target.txt
    • 久しぶり,青空文庫テキストの分析に着手.
      • R で解析し,csv ファイルとして出力したファイルを OpenOffice?SpreadSheet? で眺めていて,何気なく countif 関数を使ったら,第二引数を指定する段階でフリーズ.わけが分からん.111のテキストに適合度の検定を行って,そのうち何パーセントのテキストが 0.01 水準で帰無仮説が保留されたかを調べたいだけなので,この確認も R で行おう.
      • 昔,こんなプログラムを書いたはず,と思ってハードディスク内をあちらこちら探しても,もちろん見つかりゃしない.こういうことがないように,これからは,この Wiki に保存しておこう.
      • 昔のプログラム見つけた.さて,中のコードを読まねばならぬ.自作ながら,複雑なコードを書いているなぁ.
    • Thunderbird の迷惑メールフィルタリング機能は,ロシア語にも対応しているのか?
  • 定時帰宅,定時就寝

_ 2007年11月1日 (木) 曇

  • 06:05 起床
    • 今朝も交差点に police おらず.
  • 07:20 研究室着
    • Ubuntu 7.10 への完全以降に着手する.ついでなのでメーラーも Thunderbirdへ移行.
    • Windows Mobile の ActiveSync? をインストールしようとしたが,VMware 上ではこの機器の USB を認識しない模様.それはいいが,W-Zero 3 との接続を切った後も,W-Zero側の画面ライトが完全消灯しなくなった.しょうがないからminiSDを突っ込んだままリセット.
    • Wilcoxon検定 を編集.
    • USB <-> セントロニクス 変換ケーブルが欲しい
    • ヨーグルト,コーヒー.
  • 午後
    • 演習.演習後,工学部にてカレー 250.
    • fontforge を synaptic でインストールし,フォントの設定
      • Firefox のデフォルトのフォントは sans-serif 14 だったので IP モナー UI ゴシックに変えてみる.
    • 昨日から今日と,色々雑用が入ってしまった.少し体制立て直さねば.
    • 「教えて君」のため時間割く.
    • H 氏来訪.懇談会の様子など伺う.
    • 片側検定について質問を受けた.ここに要点をまとめた.
  • 23:00 就寝.
 
Last-modified: 2007-12-01 (土) 12:18:18 (4069d)