''[[日録2007_9月]]'' ''[[日録2007_10月]]'' [[過去の日録]] * 2007年11月17日 (土) 晴 [#fec84c93] - 06:00 起床 - 07:20 研究室着(整頓) - 午前 -- Springer から 1,904,711都市を巡る最短経路問題の下界と最良解の差についての問い合わせがきた.現在の最良解はhttp://www.tsp.gatech.edu/world/から,少なくとも2007年6月時点の最良の下界は,7,512,218,268 であり,Keld Helsgaunの解は,これよりたか だか0.04987% だけ大きいことは確かなのだが,問題は原著者執筆時期の最良解なのだが... -- Emacs 21は,起動時に固まることがよくある. -- 半角キーで日本語変換に変わるのは不便.[SCIM開始] の設定をZenkaku_Hankaku から Control+Zenkaku_Hankakuに変更. -- 昨日あたりから,また学内の DNS がこけている模様.管理担当の先生たち,早く業者に管理を委託してくれませんか? -- ネットワークの接続状況がかなり悪い.それなりに規模の大きな組織のネットワークなのだから,素人教員が手を出すべきではない.経験もノウハウもある専門業者に任せるべき. -- お昼.乾麺. - 午後 -- 旧友から久しぶりのメール -- 学内ネットワーク,ますます調子悪し.工学部の先生なんかに任せたらあかん. -- おやつ.ヨーグルト. -- Baayen の作成した''languageR''パッケージのバグを発見. x <- 0 y <- 0 z <- 0 for(i in 1:length(alice)){ x <- nchar(alice[i]) if(x > y) { y <- x z <- i } } x;y;z alice[z] * 2007年11月16日 (金) 曇 [#j7a1849b] - 06:00 起床 - 07:20 研究室着(整頓) - 午前 -- Springer に原稿送った. -- カイ二乗検定は,分布を仮定せずに適用できると書いている文献が結構ある.しかし,カイ二乗分布そのものは,確率変数 X が,それぞれ正規分布にしたがっている時に導かれる分布である.前から気になっていたので,ちょっと調べた.関連する証明を豊田秀樹「数理統計ハンドブック」p.293 に見つけた.要するに多項分布へ拡張できるということらしい. -- お昼.来客があって一緒に弁当. - 午後 -- 12:00 -13:00 会議(将来構想).直後に H 氏陪席のもと,Y氏と話. -- プレゼン資料作り.[[対数尤度比検定]]についてまとめる. -- 16:20 - 17:45 ゼミ.なぜ黙っていても,課題を自ら進めようとしないのかな?よくわからん.... - 定時帰宅。ワイン。Domaine Bernard Delagrange Beaune 1978。 #ref(wine20071116.PNG,nowrap,right,Domaine Bernard Delagrane Beaune 1978) - ワインの後,白鶴だか何だかを飲んで就寝. * 2007年11月15日 (木) 晴 [#qc0de864] - 06:00 起床. - 07:20 研究室着 - 午前 -- 依頼された php と Postgresql のプログラムを書く.スペルミスによるエラーを見つけるのに時間かかってしまった. -- Springer から依頼された「後書き」を書き終えた.これから推敲しよう. - 午後 -- 12:50 - 14:20 演習. -- おやつ,乾麺. -- 訳者後書きの草稿.宣伝になるかもしれないから?,今,ここに公開してしまっても構わないだろう. >本書は数学と日常生活の関わりを,グラフ理論を例に解き明かした「物語」である.物語を書き上げたのはドイツ数学会の大ベテランと気鋭の若手のコンビである.二人は,読者の側に特別な数学知識を要求せず,また複雑な数式の展開も避けつつ物語を展開させている.しかし読者は,本書を通読した後,大学の情報科学で必要とされる基本知識を身に付けていることに気がつくことだろう. > >物語は,数学の苦手なドイツ人高校生ルツが,父親からパソコンを贈ってもらったことに始まる.ところが,このパソコンにはある秘密が隠されていた.人と会話ができる「最新のソフトウェア」であるビムが密かにインストールされていたのである.そしてルツとビムとの出会いから物語は進んでいくのである. > >ルツの「数学が一体何の役に立つの」という素朴な疑問を受けて,ビムは,彼女の故郷である北国ハンブルクへの最短のドライブコースや,彼女が日常利用しているミュンヘン交通網を例に,その背景にある数学的理論,すなわちグラフ理論の解説を始める.さらには数学理論を現実に応用するための「アルゴリズム」についても説明していく.普通の数学書ならば抽象的で理解しにくい内容も,ビムの具体的かつ当意即妙な話術にかかると,数学嫌いのルツにも自然と飲み込めていくのである. > >やがて話題は,グラフ理論の「創始者」ともいえるオイラーの業績へ及んでいく.ビムは,有名な「ケーニヒスベルクの橋」の問題の背景とオイラーの出した答えを,ルツと彼女のボーイフレンドであるヤンの二人に丁寧に解き明かしていく.「橋」の問題は,さらに現代のゴミ収集車の「最適な」作業ルートの設計方法に通じるものである.そしてついには,難解な「巡回セールスマン問題」や「組み合わせ理論」が,そもそもなぜ「難解であるのか」,その理由をも二人は理解するに至るのである.こうしてルツとヤンは,数学に対する苦手意識を克服していく. > >一方,我々読者もまた,ルツとビム,そしてヤンらの織りなす物語を通して,グラフ理論とその応用分野を理解していくことになる.読者は,時には数学あるいはコンピューターの発展の背景にある数学者たちの努力や逸話を垣間見るであろう.さらにはビムが何者であるのか,なぜルツのパソコンに忍び込んでいたのか,推理を重ねることでもあろう.そしてルツと両親との間の微妙なやりとりや,ボーイフレンドであるヤンとの関係にやきもきもするであろう. > >このように,本書はグラフ理論を中心とした数学の解説書であると同時に,女子高生ルツを主人公とした「青春小説」でもある.気構えることなく,純粋に物語として楽しんで読むこともできるのである.読み終えた時,読者は物語に対する深い満足感をえると同時に,グラフ理論と情報科学の基礎をも習得できている.それが本書の特色である. > >原書のタイトルは Das Geheiminis der k\"{u}rzesten Weges (最短経路の秘密)である.原著者の詳細は扉にも紹介があるので,ここでは繰り返さない.訳出にあたっては,「物語」であることを念頭におき,平易な日本語を心がけたつもりである.また,やや込み入った数学的解説では,読みやすさを重視して,かなり大胆に意訳した場面もある.読者の皆さんの判断を仰ぎたいと思う. > >なお,本書には多くの URL が引用されているが,原著者の前書きにも書かれているとおり,本書の刊行後もそれらのサイトへのアクセスが可能かどうかは定かではない.しかし,本書の内容を参考に,ぜひ自ら検索サイトを利用して,最新の情報を探してみてほしい.読者はそこに本書に補足する内容や,新しい知見や情報をえることができるかもしれない.さらには本書を通して培った知識を発展させることも可能であろう. -- 講演のスライド作成に入る.corpora_0.3-2.tar.gz を Rにインストールしてみた. //URL 'http://cran.md.tsukuba.ac.jp/src/contrib/corpora_0.3-2.tar.gz' を試しています -- H氏来訪.TeXのお話. -- Rを使って,無理やり collocation (kick bucket みたいなペア)を取り出すプログラム(と言うほどのものでないが...)を作成してみた.alice は ''languageR'' パッケージに付随するデータセットである., alice.rabbit <- which(alice == "rabbit") for(i in alice.rabbit){ x <- i - 3 y <- i + 3 if(x< 0) x <- 0 if(y > length(alice)) y <- length(alice) cat(alice[x:y]) cat("\n") } これで,Alice in Wondeland に rabbit と言う単語が出てくるすべての箇所を抜き出して,その前後3単語の環境を含めて表示する. - 定時帰宅。今日は結婚記念日だそうな。と言うわけでワイン。Domaine Bernard Delagrange Volnay 1969。さすがにうまい。 #ref(wine20071115.PNG,nowrap,right,Domaine Bernard Delagrane volnay 1969) - ワインの後,白鶴だか何だかを飲んで就寝. * 2007年11月14日 (水) 晴 [#b13e930a] - 06:45 起床.寝坊した. -- だいぶ遅れて家を出たけど,N軒屋交差点にpoliceはいなかった. -07:40 研究室着 - 午前 -- 今日は一日忙しい.まず 10:10まで演習. -- お昼.乾麺. -- OpenOffice のプリンタ出力がうまくいかない.他のソフトは問題ないのだが. -- Springer から,「後書き」を書いてほしいと依頼.また,今週中に校正を送ると.今回は第二校があるのか.後書きの締切りは来週月曜.第二校の校正は来週末くらいかな? - 午後 -- 12:50 - 16:05 講義 --- 合間に食堂.特定食.間違って520払った. -- 16:10 - 17:50 演習 -- 18:00 - 19:30 大学院 -- 要望があった,ポインタの使い方.簡単な例1 #include <iostream> using namespace std; void test(int * x){ // void test(int x[]) でも良い x[0] = 1; x[1] = 5; // return x;// これはダメ } int main(){ int x[ ] = {0,0}; test(x); cout << *x << " and " << *x+1 << " and " << *(x+1) << endl; return (0); } - 定時より遅れて就寝. * 2007年11月13日 (火) 晴 [#d9485183] - 06:00 起床 -- 少し遅れて家を出たら,N軒屋交差点にpoliceが立っていた. -07:30 研究室着 - 午前 -- サーバーが Nov 12 21:20:59 にダウンしていた.理由は不明.まだ調べていない. -- yahooのニュースに,自衛隊装備品に「正露丸」復活というニュース.「ロシアを征服するという意味を込めて「征露丸」と名づけられた」そうな.余談だがLinuxで使っている日本語変換ソフトはAnthyで,あまり効率よくないのだが,「正露丸」は一発で漢字変換できた. -- デフォルトの yatex だと,勝手に80文字で改行してくれる./usr/share/emacs/site-lisp/yatex/yatex.el の 691 行目をコメントアウトする. ; (turn-on-auto-fill) ;1.63 -- emacs での日本語文字コード設定だが, (set-buffer-file-coding-system 'utf-8) などと utf-8 としている場合と,utf-8-unix としている場合があるのだが,挙動に違いがあるのだろうか?以下の部分で utf-8-unix を使っている例はないようだが. (coding-system-put 'utf-8 'category 'utf-8) -- 来月出張するので名刺を作っておかねば. -- beamer のフォルダは/usr/local/teTeX/share/texm-dist/tex/latex/beamer であるので,ここに不足分のスタイルファイルを追加することとする. sudo cp beamercolorthemewolverine.sty /usr/local/teTeX/share/ texmf-dist/tex/latex/beamer/ sudo cp beamerthemeAnnArbor.sty /usr/local/teTeX/share/ texmf-dist/tex/latex/beamer/ マニュアルは/usr/local/teTeX/share/texm-dist/doc/latex/beamerにある.マニュアルのbeameruserguide.pdf へのシンボリックリックを progSource/Tex に張っておく.確かにこのマニュアルは詳細である.その他に大量のサンプルが,このディレクトリ下の examples にある. -- 昨晩,Nov 12 21:20:59 にサーバがダウンした理由が判明.gpm が起動しているログが残っている.それで,推測する. // 誰かが,本体のマウスをいじっている様子が分かる.多分,それから強引に電源を落とした模様. -- beamer はコンパイルできるのだが,dvipdfmx を実行すると大量の WARNIGS が出る.作成される pdf も期待通りではない.何か足りないのか? - 午後 -- 乾麺.ヨーグルト. -- 12月08日用のスライド作りに入る.今更ながら,結構,大変. -- 14:35-16:05 演習 -- Altmann を読みつつ,スライド作成.発表の流れは,一応構想できた. -- 研究室の電話が朝から何度か鳴る度に無視し,うるさくなってベル音を消す設定にしていたのだが,やがて携帯の方にもかかってきた.Springer の数学編集部からであった模様.私が研究室の電話を取るのは,条件反射でついつい手を伸ばしてしまった時だけです. --- で,話題は,原書の主人公 Ruth のカタカナ表記について,日本人に受け入れやすいよう,名前そのものを変更することも含めて検討したいとのことであった.一応,原著者に確認を取るとのこと. -- zvab 軽油で発注した Widerholungen in Texten が届いていた. - 定時帰宅,定時就寝 * 2007年11月12日 (月) 晴 [#fcd7621e] - 05:55 起床 -07:10 研究室着(整頓) - 午前 -- Beamer のスタイル類は[[ここ>ftp://ftp.nara.wide.ad.jp/pub/TeX/CTAN/macros/latex/contrib/beamer/]]にある. -- ただ,どこに配置したものか? export TEXINPUTS=.:/usr/local/teTeX/share/texmf//:~/tex/style//: のように環境変数を設定するのは ptetex3 に妙な影響を及ぼしそうなので,デフォルトスタイルと同じ場所に置く方が良さそうだが,その場合もどこが適当だろうか? -- pdf ファイルを開こうとしたら,「Acrobat Reader 8はまだインストールされていません。」というメッセージが出て,AdobeReader_jpn-8.1.1-1.i386.deb のダウンロードが始まるが,スーパユーザーではないので当然,インストールは失敗する.朝一の大量のパッケージアップデートと関係あるのか? [[ここ>http://www.adobe.com/jp/products/acrobat/readstep2_allversions.html]]から,ファイルを拾ってきて,手作業でインストール. $ sudo dpkg -i AdobeReader_jpn-8.1.1-1.i386.deb -- /usr/local/teTeX/share/texmf/dvips/config.ps をオリジナルに戻し,kanji.map を参照する処理は省いた. -- さて Ubuntu 上にプレゼン作成用の TeX ツールも整ったので,学会発表資料をバリバリ作成するか. -- サンプル数が大量になる場合のカイ二乗検定の問題について,ちょっと調べておくつもりで[[The Generalized Chi^2 Goodness-of-fit Test>http://links.jstor.org/sici?sici=0039-0526(1994)43%3A2%3C247%3ATGGT%3E2.0.CO%3B2-B]]を複写依頼. S. P. Pederson and M.E. Johnson, Estimating model discrepancy, Technometrics vol 32, no.3 (1990)は大学図書館にあるので,複写のために足を運ばねばならない.と思ったら,vol 32, no.1 までしか所蔵していないようなので,やはり複写依頼を送る. -- Y 氏来訪.ネットワーク設定について質問される. -- Niehaus p.254 に,Mischtext には Hyperpoisson 分布が適合すると,いきなり説明がある.根拠は? その他,p. 258 の k の推定式 &mathml(0.4126 q^{-1.647}); もどこから出てきたのか?そもそもそのページ隣にある,各テキストについての k と一致しないではないか? - 午後 -- お昼.Special.コロッケ,煮込み「風」ハンバーグ,目玉焼き. -- 食堂の帰りに南棟2階に立ち寄った.ドアが開いたまま授業を行っている部屋があった,何気なく覗くと,黒板の前で学生がバリバリ数式を書いていて,それを O 先生が見守っている最中であった.そういう状況ではあったが,こちらに会釈をしてくれる. -- また Y 氏来訪. -- Springer からメール.原書のラテン語部分について,独語からではなく,ラテン語から直接訳してほしいと... -- H氏来訪. - 定時帰宅,定時就寝 * 2007年11月11日 (日) 晴 [#d3d0e13f] - 06:55 起床 - 午前 -- Mac Port を使った [[Mac での Tex 環境>http://osx.miko.org/index.php/Beginning_OS_X_10.5/%E3%82%A2%E3%83%97%E3%83%AA%E5%B0%8E%E5%85%A5%E7%B7%A8]]についてのサイトをブックマークしておく. -- dvips の文字化け問題再考.ここの[[サイト>http://nox-insomniae.ddo.jp/insomnia/2007/07/17212729.html]]などを読みつつ,頭を整理する. -- dvips の文字化け問題解決.cidfmap に記載したフォントパスを間違えていた. //sudo cp ~/Backup/cidfmap.ishida /usr/share/ghostscript/8.61/lib/cidfmap に /IPAGothic << /FileType /TrueType /Path (/usr/share/fonts/truetype/ipamona/ipag-mona.ttf) /CSI [(Japan1) 6] >> ; /IPAMincho << /FileType /TrueType /Path (/usr/share/fonts/truetype/ipamona/ipam-mona.ttf) /CSI [(Japan1) 6] >> ; % /IPAGothic-Regular /IPAGothic ; /IPAMincho-Regular /IPAMincho ; /Ryumin-Light /IPAMincho ; /GothicBBB-Medium /IPAGothic ; /HeiseiMin-W3 /Ryumin-Light ; /HeiseiKakuGo-W5 /GothicBBB-Medium ; /Adobe-Japan1 /Ryumin-Light ; /Adobe-Japan2 /Ryumin-Light ; // //////////////// // /Ryumin-Light << /FileType /TrueType /Path // (/usr/share/fonts/truetype/kochi/kochi-mincho.ttf) // /SubfontID 0 /CSI [(Japan1) 2] >> ; // /GothicBBB-Medium << /FileType /TrueType /Path // (/usr/share/fonts/truetype/kochi/kochi-gothic.ttf) // /SubfontID 0 /CSI [(Japan1) 2] >> ; // /Ryumin-Light << /FileType /TrueType /Path (/usr/share/fonts/truetype/ipamona/ipag-mona.ttf) /SubfontID 0 /CSI [(Japan1) 2] >> ; // /GothicBBB-Medium << /FileType /TrueType /Path (/usr/share/fonts/truetype/ipamona/ipag-mona.ttf) /SubfontID 0 /CSI [(Japan1) 2] >> ; のように記載すればよい.フォントは適宜調整. -- そもそもptetex3において/usr/local/teTeX/share/texmf/dvips/config.ps に kanji.map を追加する処理は不要のよう. --また sudu mktexlsr mktexlsr: Updating /var/lib/texmf/ls-R-TEXMFMAIN... mktexlsr: Updating /var/lib/texmf/ls-R-TEXLIVE... mktexlsr: Updating /var/lib/texmf/ls-R... mktexlsr: Done. は不要ではないか. -- この様に苦労して [[prosper>http://mechanics.civil.tohoku.ac.jp/soft/node10.html]] の環境を整えたのだが,[[Beamer>http://www-nsc.es.hokudai.ac.jp/~miya/beamer/beamer-memo.html]] という便利そうなプレゼンテーションドキュメント作成ツールを見つけてしまった.これなら dvips を介さず,dvipdfmxで直接 pdf を出力できる模様. -- [[こういうプラグイン>http://chrispederick.com/work/user-agent-switcher/]]がある.IEやNetscapしか許容しないサイトへの対策. -- エリザベス女王杯.ウオッカが直前になって出走中止. - 意味なく酒飲んで就寝. * 2007年11月10日 (土) 晴 [#i0ed55f8] - 06:55 起床 -- 土曜だというのに,ヘルメット姿で中学生が自転車通学しているのだが? - 08:00 研究室着(整頓) - 午前 -- 週の半ばぐらいから周辺に風邪をひいている人が増えた.引くのは勝手ですが,人前に出るときは,マスクぐらいはした方がいいですよ. -- 10:00 頃から消防車のサイレンがけたたましい.11時半になってもまだ鳴っている. -- お昼.乾麺. - 午後 -- [[ゼロ打ち切りの負の二項分布]] についてメモ. [[MathML]] で \binom 命令を使うと,Firefox で表示されないので不便だ. -- 時々 Emacs が args out of range: とか言って,打鍵を受け付けなくなる.Anthyをoff にして,C-g で抜ける. -- [[latex2html>http://homepage3.nifty.com/peterpan/l2h_JP/manual.html]] をGUIでインストール.libnetpbm10 netpbm perl-doc が追加でインストールされる..latex2html-init は以前のマシンの設定を流用するが,一ヶ所 $LATEX = '/usr/local/teTex/bin/platex --kanji=utf8'; の部分を変更した. -- メニューが日本語にならないので,調子に乗って,[[日本語パッチ版のlatex2html>http://takeno.iee.niit.ac.jp/~shige/TeX/latex2html/data/README.patch-2002jp-2.0]] もコンパイルし,インストールしてみたが,これは utf-8 に対応していない模様.make uninstall が効かないので, sudo rm /usr/loca/bin/latex2html sudo rm -Rf /usr/local/lib/latex2html cp -p /usr/local/bin/texexpand ~/BackUp/ sudo rm -Rf /usr/local/bin/texexpand sudo rm -Rf /usr/local/share/lib/latex2html/ と消しておく.ただ,次は mktexlsr に実行されているので,残しておいた.でもこのコマンドで作成されるリストファイルは百害あって一利なしかもしれない. /usr/local/teTeX/share/texmf/tex/latex/html/ -- 明日のエリザベス女王杯.3-7 と常識的に... -- ファイルを新規に作成する際,同時に新規のディレクトリを作ろうとしたら,Emacsに Use C-u M-x make-directory RET RET to create directory and its parents と怒られた. -- その Emacs だが,bash で設定している環境変数 PATH を無視することがある. ~/research/Tex/papers/p2007$ which -a platex /usr/local/teTeX/bin/platex /usr/bin/platex なんだが,yatex 上で C-c l すると,後者が実行されることがよくある.bashの環境変数には[[落とし穴>http://ameblo.jp/topsoul]]があるそうだけど. -- prosper でプレゼン資料を作ろうと思って,雛形で試してみた.dvips でポストスクリプトに変換し,その上で ps2pdf14 で pdf ファイルを作成する必要がある.ところがdvips で作成した ps ファイルが文字化けしているのに初めて気がついた. /usr/share/ghostscript/8.61/lib/cidfmap を見ると,確かに有効な記述がない.ところが編集しても効かない.Ghostscript8.61 と utf-8 環境では日本語ps は厳しいのか?思いつくのは, dpkg-reconfigure cmap-adobe-japan1 を「明示的に」あるいは「マニュアルで」実行していないことだが,関係なさそう. //自宅に戻り,自宅のPCで/usr/share/ghostscript/8.61/lib$ vi cidfmap などもいじってみたが,関係なさそう.そもそも tex や ps 関係の設定ファイルはあちらこちらに散在していて,どこかどう関連しているのか,分かりにくい. - 飲むだけ飲んでやや遅い時間に就寝. * 2007年11月9日 (金) 晴 [#ba4ed6df] - 05:35 起床 - 07:00 研究室着(整頓) - 午前 -- Sichel の混合ポアソン分布について,その理論的根拠を確認しなおすため,B. Niehaus p.216 を参照する.Sichel の混合ポアソン分布については,以前[[ここのpdfファイル>http://www.ias.tokushima-u.ac.jp/linguistik/temp/projects.pdf]]に,また関連する内容を[[ここ>http://www.ias.tokushima-u.ac.jp/linguistik/nlp/gengoProject/index.html]]にまとめた. //#mathml(\frac{1}{2} \frac{(2 \sqrt{\frac{(1-q)}{a} q)^2)}{} --- Niehaus には,言語の解析単位を句から語へと移行した場合,新たなパラメータの導入が必要であることをAltmannは示したとある.確かに Altmann は,自身の仮説に基づいて,基本的な離散分布に基づく数式から,独自の式を導出してはいる.また,各種のサンプルを集め,分布の適合度を検定している.しかし,私には,彼の適合度の検定方法は恣意的なような気がしてならない. --- p.220 に,テキストサンプルが 17 なら,各種確率モデルを比較するのに適当であるが,10以下では足りないとあるが,この17と言う数字は,Niehausが各ジャンルごとに今回収集できたサンプル数に過ぎない. -- 昨日 JTextField クラスのオブジェクトのイベントをとる方法を考えていた.カーソルが入ったときにイベントが出るのだろうと思っていたが,そうでなく,エンターが押されたときにイベントが出るようであった. [[JTextFieldの簡単な例]]. -- 今日もネットワークが断続的に不調の様子.管理センターの先生たちは,いつになったら,はるかにノウハウの豊富な一般業者にネットワーク管理を委託してくれるのだろうか. -- 午前.来客. - 午後 -- 12:00 - 13:00 会議(将来構想).後半は出席者二人の口論. --- 14:00 - T 氏来訪.先ほどの会議について. --- 14:30 学生二人.続いて S 氏来訪.やはり先ほどの会議について.加えて,Web アプリケーションについて,もろもろの話. -- 研究室入り口のパソコンは,どこか別室に設置したいが,しかし授業に困るし. --- 16:30 ゼミ.一人欠席. --- 別のゼミで「さくらサーバー」をレンタルしたいと言う相談が舞い込む. - 定時より遅れて帰宅 - 意味なく飲酒し,定時より遅れて就寝 * 2007年11月8日 (木) 快晴 [#p1040de8] - 06:05 起床 - 07:20 研究室着 -- 学務関係のメールが数通.昨日授業で欠席した会議(将来構想)は大荒れだったらしい... -- T 氏来訪.会議の様子など伺う. -- 昨日ドイツの古本屋2軒に,それぞれ別の本の注文メールを送ったが,その返事が二つとも来ていた.どちらも「すぐに送る」との返答.一軒からは航空便を望むかという問い合わせもあったので,そうしてくりゃれ,と返信する.こちらの価格は本体 99,00 ユーロ + 航空便で 19,00 ユーロ.数字の間のコンマは,米国や日本風に書けば 99.00, 19.00 のことである.返信は独語で書いてみた. -- 欧文テキストを句に分解して解析すると言う作業を忘れていた.手順を思い出さねば. --- [[TreeTagger>http://www.ims.uni-stuttgart.de/projekte/corplex/TreeTagger/]] を新システムにしてからまだインストールしていなかった.Chunker の方のリンクが切れている.旧マシンからコピーした. --- install-tagger.shを開いてみると,サイトで用意されている german-big-par-linux-3.1 をインストールする指示がない.手作業で追加して, if [ -r german-big-par-linux-3.1.bin.gz ] then gzip -cd german-big-par-linux-3.1.bin.gz > lib/german.par echo 'German Big parameter file (Linux) installed.' fi スクリプトを走らせる.[[10月の日録でも書いた>日録2007_10月#TreeTagger]]がcmd/filter-chunker-output-german.perl の perl パスを修正し,gawk を GUI でインストール. 指示どおり bash_aliases に :$HOME/progSource/TreeTagger/cmd:$HOME/progSource/TreeTagger/bin を追記しておく. --- さて,問題は文字コード,独語の場合,[[iso-8859-1>hidden_iso-8859-1]] で用意したファイルでないと解析には不都合が出る模様. -- 久しぶり Eclipse でプログラミング.Eclispe にはコード補完の他,便利な機能が満載されているのだが,何をどうするのか,すっかり忘れてしまった.少し手間かけて[[メモを作成>Eclipse]]しておこう. -- 全体会議 - 微妙に日本酒飲んで就寝. * 2007年11月7日 (水) 快晴 [#y3ac4824] - 06:05 起床 -- N軒屋の交差点に差しかかった時,パトカーとすれ違った.どうも交差点の police は私の出勤より遅く,参勤するらしい.立ち番する曜日のパターンをカウントしようかと思っていたが中止. - 07:20 研究室着(整頓) - 午前 -- 8:35 - 10:10 演習 -- Java に興味を持つ学生用に [[Eclipse>http://eclipsewiki.net/eclipse/]] の[[資料を作成>Prog_JavaApplet]].内容は昔懐かしい Applet! --- 久しぶり作ってみると,Thread クラスの仕様はどうだったっけとか,Runnable インターフェイスの stop メソッドが deprecate されていた,などなどと思い出すことが多い. -- お昼,乾麺,お菓子. - 午後 -- 12:50 - 16:05 講義. --- 「落ち葉クリーンアップ」とか言うメールが来ている.Google の迷惑メールフィルタは強力で,最近,迷惑メールを受け取ることはまれになったが,うまうま抜けてきたらしい.さっそく,迷惑メールに登録. -- 16:05 - 17:30 演習 -- [[Thesaurus of univariate discrete probability distributions>http://www.buchhandel.de/detailansicht.aspx?isbn=978-3-87773-025-6]] ,さらに Altmann, Gabriel:Wiederholungen in Texten をhttp://www.zvab.com/で発注. -- R でマージンを処理する方法を尋ねられたので書いてみた.[[R_Plot_Marginの処理]]と [[R_正規分布のプロット図]]. - 定時帰宅,定時就寝 - 微妙に日本酒飲んで就寝. * 2007年11月6日 (火) 雨 [#dc9bcaa8] - 06:05 起床 - 07:20 研究室着(整頓) - 午前 -- Zipf-Mandelbrot (principle of least effort)再考 --- &mathml(P_x = P (x+b)^{-a}); --- フラクタルを説明するいい資料はないかと探していたら,こんなページを発見. http://momi.jwu.ac.jp/~physm/buturi01/fra01/fractal.html -- お昼.乾麺,お菓子. - 午後 -- 14:35-16:05 演習. -- 授業用に Visual C++ の[[教材2>http://www.ias.tokushima-u.ac.jp/linguistik/2004/HowTo2.doc]]を作成. -- 帰り間際だが,何だか腹が減ったので,ヨーグルト食す. - 定時帰宅,定時就寝 * 2007年11月5日 (月) 曇/雨 [#y71957f4] - 06:05 起床 - 07:20 研究室着(整頓) - 午前 -- 研究室の Ubuntu の TeX 環境を,前日就寝前の対応策に基づいて再コンパイル. -- メールの受信を完全に Gmail に統一した. -- 来月の統数研での講演用の原稿準備をそろそろ開始しよう. -- 関連して,ちょっと過去の議論を整理. [[Haufigkeitsverteilungen in Texten:http://www.amazon.de/H%C3%A4ufigkeitsverteilungen-Texten-Karl-H-Best/dp/3933043085/]] と[[The Distribution of Word and Sentence Length:http://www.amazon.de/Distribution-Word-Sentence-Length/dp/3884762761/]]を[[再参照>Research_Haeufigkeiten]]. -- 東工大の[[間瀬 茂 先生>http://www.is.titech.ac.jp/~mase/index-j.html]]から御近著 [[Rプログラミングマニュアル>http://www.saiensu.co.jp/?page=book_details&ISBN=ISBN978-4-901683-50-0&YEAR=2007]] の献本を頂いた.中身が盛り沢山で,眺めているだけでも楽しいが,装丁がまた,とても立派な本である. -- thunderbird の改行折り返しについては 110 文字が適当であろうという面白い話を見つけた. http://d.hatena.ne.jp/h12o/20061208/thunderbird_wraplength -- また http://www.zvab.com/ で本を注文せねばならん.今度は Wiederholungen in Texten [[Thesaurus of univariate discrete probability distributions>http://www.buchhandel.de/detailansicht.aspx?isbn=978-3-87773-025-6]] の在庫を持つサイトを見つけたが... - 午後 -- お昼.Special \400.焼肉?白身魚のフライ.どっちも固かった. -- ''&color(blue){Literate programming (文芸的プログラミング)};'' [[Sweave>http://www.ci.tuwien.ac.at/~leisch/Sweave/FAQ.html]] をさらに調整. 文芸的プログラミングとは,「&color(red){プログラムのソースコードと、対応するドキュメントを結びつけて、一つのファイルにすること};」翻訳は[[ここ>:http://www.okada.jp.org/RWiki/?Sweave%20%A5%DE%A5%CB%A5%E5%A5%A2%A5%EB%CC%F5]]. 「ドキュメントチャンクは最初の文字としてサイン (@) を持ち、その後には空白か改行文字が続く。」 「コードチャンクは、最初の行が <<name >>= で始まり、その行の残りはコメントであり無視される。」 -- 言語統計解析に関する R パッケージについて調査. -- 0-truncated Poisson distribution を R で実現する方法. http://finzi.psych.upenn.edu/R/Rhelp02a/archive/55114.html rtpois <- function(N, lambda) qpois(runif(N, dpois(0, lambda), 1), lambda) rtpois(100,5) 他にVGAMパッケージに Zipois 関数が実装されている.ここには負の二項分布のパラメータ推定関数もある. -- [[.Stex ファイル>R_Sweave]] を yatex モードで編集するため以下のように emacs.el 編集してみた..tex を .?tex とした. (cons (cons "\\.?tex$" 'yatex-mode) auto-mode-alist)) - 定時帰宅,定時就寝 * 2007年11月4日 (日) 晴 [#gb534d3c] - 06:30 起床 - 午前 -- 自宅のPC の Ubuntu on XP で TeX を設定. - 午後 -- 昼から牡蠣の土手鍋で一杯やってしまった.よって,その後,一切仕事できず... //http://coders.g.hatena.ne.jp/bellbind/?word=*%5BTeX%5D -- 就寝前に未練たらしく Sweave の設定.結局,Sweave が TeX-Live の latex の方を呼び出すようになっていることを修正するのは保留し,以下のように pTeX の方を再コンパイル. KANJi_CODE=UTF のオプションをはずし,bash に alias platex='platex --kanji=utf8' を設定すれば,ess-swv.el で M-x l で latex in TeX-Live が呼び出されることは変わりないが,普通の TeX ソースが作成されるのは間違いないので,これを yatex 等でコンパイルすれば良い. - 定時帰宅,定時就寝 * 2007年11月3日 (土) 晴 [#v99a6d66] - 06:05 起床 - 07:20 研究室着(整頓) -- 昨日に引き続き,去年作成した日本語テキスト解析プログラムをチェックする.Perl は,簡単に作成できるから,あれこれ大量にスクリプトを作っている.だが,個別の目的ごとにプログラムを作ってしまうので,後で転用しようにも,いつどんなプログラムを作成したか,そして,それをどこに保存したかをすぐに忘れてしまう.マニュアルまで作成し,後で転用できるようにすることを考えると,プログラムはすべて Eclipse 上で Java か C++ で作るべきか.もちろん Autoconf や doxygen などを駆使して,Emacs 上ですべて完結すると言う手もあるが... -- phrase.R スクリプトで,cutRuby.pl, forCabocha.pl で解析済みの 111 個のテキストについて,その確率分布を,区間を 1,3,5 とずらしながら適合度を測るという処理を一括して行っている.出力は,個々のテキストごとに加えて,各テキストの結果を行ごとにまとめて一枚の csv ファイルにまとめたものもある.この後者のファイルから,全体の適合度をチェッするためのスクリプトを checkResults.R として保存. -- 適合度を測るのに,χ二乗検定やその派生である Cohen のオメガは,やはり問題があるな... -- [[Man-Whiteny検定]]での R の出力が気になったので,ちょっとチェックした.そもそも「正確な」 P 値が,「近似的に」正規分布を仮定して計算できるという言い方が分かりにくい. -- お昼乾麺 - 午後 -- 対数線形モデルは,[[要因に対応がないことが前提>R_対数線形モデル]]とされている. -- いつもの解析手順は,まず仮説を立て,その仮説に基づいて複数の解析を一度に自動実行できる R スクリプトを作成し,一気に走らせる.解析結果を参考に Tex でレポートにまとめる.というものだが,前々から,二度手間だなぁと思っていた.ubuntuに乗り換えたのを機に,この際,Sweave ですべてを処理しようと思う.その覚書 [[R_Sweave]]作成. -- うーーん,Sweave をコンパイルしようとすると TexLive の方が呼び出されるなぁ.何でだろうか? -- いろいろいじっていて,つい,export TEXMF などとやってしまった.おかげで,Texの環境がおかしくなったようで,また utf-8 のソースが通らなくなった.ptex3をコンパイルし直してみようとすると,これもエラー.どうも $HOME/.texmf-var/ に妙な設定ファイルがあるらしい.これをディレクごと削除して,再コンパイル可能に.そして再インストール. -- それでも直らん? バックアップ取っておいた emacs.ubuntu.el と差し替えたら,ただこれだけで文字化け直った.わけが分からん...ついでに ESS も再インストール. -- 結局,Sweave をインクルードした tex ソースは euc-jp でないと文字化けする...この作業で半日潰してしまった... - 疲れて帰路.落ち着いて少し考える.ええっと,ptex3 はデフォルトでは euc によるファイルを入力としている.しかし,utf-8 で作成されたファイルでも,euc にコンバートして,コンパイルする.すると,どこかのタイミングで対象ファイルの文字コードを判定し,適当なフィルタを通しているということか. -- Sweave は latex のみサポートしていて,platex には対応していないということかな? -- ファイル共有で,GUI で設定できそうなメニューが用意されているが,smbpassws -a でsambaユーザーとパスワードの登録を忘れてはいけない. - 23:00 Vosne-Romanee 2004 で就寝. #ref(wine20071103.PNG,nowrap,around,nolink,Vosne Romane) * 2007年11月2日 (金) 曇 [#ac43ddba] - 06:05 起床 -- 今朝も交差点に police おらず. - 07:20 研究室着 -- ps/2 -> USB 端子を入手せねば,お気に入りのキーボードが使えん... -- セントロニクス端子のついた古いノートの Windows パソコンがあったので,それをそのままプリンタサーバーにした.ルータで遮断して,ネットワークサービスでパケットフィルタリングを行い(137:udp,138:udp,139:tcp,445:tcp + 443),ウィルス対策ソフトを入れて,普段はネットワークケーブルを外して運用.そのうち Linux でプリンタサーバーを構築しようと思うが,暇ないだろうなぁ. -- XP on VMware に MP10 を設定. -- XP on VMware at Ubuntu in DELL Inspiron に Windows Mobile ActiveSync がインストールできない. XP on VMware at Fedora5 in Opteron AMD 64 にはインストールできたのだが... -- お昼乾麺. - 午後 -- [[Baayen>R_Baayen]]に移ろう. --- 混合モデルが成立した背景についての説明が p.283 にある.それは良いのだが,fixed effects の例として, SOA (stimulus onset asynchrony, the time between the presentation of a prime or distractor and the presentation of the target in chronometric experiment) と.英語ネーティブには,これで説明になってるんだろうか?しかし,それは許す.でも,[[splitplotデータ>http://cged.genes.nig.ac.jp/RGM2/R_current/library/languageR/man/splitplot.html]]に SOA 何て変数はないぞ... --- R on ubuntu7.10 にまだ languageR をインストールしていなかった.さっそく実行.なかなか高速で非常に気分が良い. --- Baayen で引き続き,混合モデルの有効な例として,言語心理学での実験例が紹介される.しかし,どうもその実験データの目的と意味がよく分からない.正確には,その「実験の意義」が納得できない.統計分析は複雑なわりには,実験の発想や道具立てが素朴過ぎるような気がしてならないのだが,あるいは実験とは,このように素朴であるべきなのか? -- Baayen 打ちきって,佐々木義之編『変量効果の推定とBLUP法』をひもとく. -- Ubuntu でフィルタリングせずに文字変換を行うプログラムは recode だそうな. recode EUC-JP..UTF-8 target.txt -- 久しぶり,青空文庫テキストの分析に着手. --- R で解析し,csv ファイルとして出力したファイルを OpenOffice の SpreadSheet で眺めていて,何気なく countif 関数を使ったら,第二引数を指定する段階でフリーズ.わけが分からん.111のテキストに適合度の検定を行って,そのうち何パーセントのテキストが 0.01 水準で帰無仮説が保留されたかを調べたいだけなので,この確認も R で行おう. --- 昔,こんなプログラムを書いたはず,と思ってハードディスク内をあちらこちら探しても,もちろん見つかりゃしない.こういうことがないように,これからは,この Wiki に保存しておこう. --- 昔のプログラム見つけた.さて,中のコードを読まねばならぬ.自作ながら,複雑なコードを書いているなぁ. -- Thunderbird の迷惑メールフィルタリング機能は,ロシア語にも対応しているのか? - 定時帰宅,定時就寝 * 2007年11月1日 (木) 曇 [#oc75cabd] - 06:05 起床 -- 今朝も交差点に police おらず. - 07:20 研究室着 -- Ubuntu 7.10 への完全以降に着手する.ついでなのでメーラーも Thunderbirdへ移行. -- Windows Mobile の ActiveSync をインストールしようとしたが,VMware 上ではこの機器の USB を認識しない模様.それはいいが,W-Zero 3 との接続を切った後も,W-Zero側の画面ライトが完全消灯しなくなった.しょうがないからminiSDを突っ込んだままリセット. -- [[Wilcoxon検定]] を編集. -- USB <-> セントロニクス 変換ケーブルが欲しい -- ヨーグルト,コーヒー. - 午後 -- 演習.演習後,工学部にてカレー 250. -- fontforge を synaptic でインストールし,[[フォントの設定>hidden_Ubuntu7.10_fontの設定]]. --- Firefox のデフォルトのフォントは sans-serif 14 だったので IP モナー UI ゴシックに変えてみる. -- 昨日から今日と,色々雑用が入ってしまった.少し体制立て直さねば. -- 「教えて君」のため時間割く. -- H 氏来訪.懇談会の様子など伺う. -- 片側検定について質問を受けた.[[ここ>R_片側検定]]に要点をまとめた. - 23:00 就寝.