日録2010年8月
_ 2010 年 08 月 31 日 (火曜)晴
- 05:40 起床
- 07:20 研究室
- 午前
- RCaBoCha のアップデート.
- 午後
- スライドの作成
_ 2010 年 08 月 30 日 (月曜)晴
- 05:40 起床
- 07:20 研究室
- 午前
- RCaBoCha のアップデート
- 午後
- 原稿の最終提出のため,やや早めに帰宅し,共著者らと相談する
_ 2010 年 08 月 29 日 (日曜)晴
- 05:40 起床
- 07:20 研究室
- 午前
- RCaBoCha のアップデートを続ける.昨日は,活用語を表層形のまま出力するか,あるいは活用形のまま出力するかのオプション設定の追加を行なっていなかったので,追加した.
- 午後
_ 2010 年 08 月 28 日 (土曜)晴
- 05:40 起床
- 07:20 研究室
- 充電
_ 2010 年 08 月 27 日 (金曜)晴
- 05:40 起床
- 07:20 研究室
- 午前
- RCaBoCha のアップデートに着手.
以下が予定の作業
- 係り受けを充実させる
- mecabrc, cabocharc のリソースファイルの指定を可能にする
- RCaBoCha のアップデートに着手.
以下が予定の作業
- 午後
- とりあえずRCaBoCha のアップデートを継続
_ 2010 年 08 月 26 日 (木曜)晴
- 05:40 起床
- 07:20 研究室
RMeCab_0.91を公開しました すべての関数に mecabrc =”” etc = ”” の二つの引数を追加しました.デフォルトでは空白が指定されています. mecabrc 引数にはrcファイル(.mecabrc)を引用符で囲んで指定します. なお実行前にファイルの有無がチェックされます. etc 引数はその他 mecab 本体へ指定したい引数を引用符で囲んで渡します. この引数の内容についてはチェックを一切行いませんので,利用する場合は, 指定内容に整合性があるかどうか十分に注意してください. 二つの新規引数について,詳細は以下も参照ください. http://mecab.sourceforge.net/mecab.html
- 午後
- RCaBoCha の開発を再開
_ 2010 年 08 月 25 日 (水曜)晴
- 05:40 起床
- 07:20 研究室
- 午前
- A Beginner's Guide to R の冒頭の献辞が残っていたので訳出.
- 午後
_ 2010 年 08 月 24 日 (火曜)晴
- 05:40 起床
- 07:20 研究室
- 午前
- Emacs Wiki に R のオムニ補完を行なうパッケージac-R.elが公開されていたので導入する.
- 午後
- 成績の提出
- A First Course in Bayesian Statistical Methods
を読む.
- これ,数式の展開も詳しく,初心者にはうってつけと思われる
_ 2010 年 08 月 23 日 (月曜)晴
- 05:40 起床
- 07:20 研究室
- 午前
- 頼まれていた原稿を編集部に送る.Word推奨なのだが,TeXで作成したので,テキストファイルに変換し,画像は eps のまま zip で固めて送る.
- 午後
_ 2010 年 08 月 22 日 (日曜)晴
- 05:40 起床
- 07:20 研究室
- 午前
- 午後
_ 2010 年 08 月 21 日 (土曜)晴
- 05:40 起床
- 07:20 研究室
- 午前
- 午後
- R と 日本語WordnetをつなぐインターフェイスをC++で作成
> dyn.load("MySqlite.so") > .Call("sql","犬" ) 犬 犬 犬 犬 犬 "いぬ" "まわし者" "イヌ" "スパイ" "ドッグ" 犬 犬 犬 犬 犬 "回者" "密偵" "工作員" "廻し者" "廻者" ...
- R と 日本語WordnetをつなぐインターフェイスをC++で作成
とか動かす
- Rinternals.h で CPP でコードを書く場合,
extern C {}
で囲まないとエラーが出たと記憶していたんだが,エラーは出ず,単に動作しないだけなんだけど,前からそうだっけ
_ 2010 年 08 月 20 日 (金曜)晴
- 05:40 起床
- 07:20 研究室
- 午前
- が面白い
- 計算機関係の本を追っていたのだが,ちょっと数学忘れ気味かもしれない.数値があわなくなったので,別の本にうつる
- A First Course in Bayesian Statistical Methods を読む.
- 午後
- R の RSqliteパッケージを使って日本語Wordnet DB を操作してみる.RCaBoCha に組込みたいが,その際は C++ で実装する.久しぶりなので Scheme を見つけるのに手間どる.
_ 2010 年 08 月 19日 (木曜)晴
- 05:40 起床
- 07:20 研究室
- 午前
- メインのUbuntuもptexLive2009に変更した.
- すこし原稿を離れ,本を読む. と A First Course in Bayesian Statistical Methods を それぞれ2時間ほど集中して読んだ.
- 午後
- スライドの残りにとりかかる
_ 2010 年 08 月 18 日 (水曜)晴
- 05:40 起床
- 07:20 研究室
- 午前
- ptexLiveのインストールをUbuntu10.04でためしてみる
- 午後
- 箱ヒゲ図のヒゲの長さは,なぜ四分位範囲やヒンジ散布度の 1.5 倍か.Tukey の趣旨は,標準正規分布の四分位範囲から求めた99%区間ということか
x <- qnorm(0.75) - qnorm(0.25) ; pnorm(qnorm(0.75) + x*1.5 )
- 箱ヒゲ図のヒゲの長さは,なぜ四分位範囲やヒンジ散布度の 1.5 倍か.Tukey の趣旨は,標準正規分布の四分位範囲から求めた99%区間ということか
_ 2010 年 08 月 17 日 (火曜)晴
- 05:40 起床
- 07:20 研究室
- 午前
- 9月8日のスライド準備を始める
- 午後
- を拾い読み始めた.これは読み応えがある.
- mecab のWindows64bitバイナリを作成しようと思って MinGW64bit環境を設定し(というか,再構築し),実行してみたんだけど,makeの途中でエラー.こりゃ,手強いかな.VisualStudio?でやってみようかな.
_ 2010 年 08 月 16 日 (月曜)晴
- 05:40 起床
- 07:20 研究室
- 午前
- いろいろとたまっている本を読みだす.たとえば A First Course in Bayesian Statistical Methods などである.
- 午後
- いろいろとたまっている本を読みだす
- 充電
_ 2010 年 08 月 15 日 (日曜)晴
- 05:40 起床
- 07:20 研究室
- 午前
- Mac Book Air にmecabを自力コンパイルではなく, port で入れてみた.
$sudo port mecab +utf8 To enable dictionary, rewrite /opt/local/etc/mecabrc as "dicrc = /opt/local/lib/mecab/dic/ipadic-utf8" You can also specify dictionary in the following way: /opt/local/bin/mecab -d /opt/local/lib/mecab/dic/ipadic-utf8 $ sudo port install mecab-ipadic-utf8 $ sudo vim /opt/local/etc/mecabrc dicdir = /opt/local/lib/mecab/dic/ipadic-utf8
が RMeCab では,そのままでは使えない.
- 初心者向け『R統計解析』の執筆.
- 午後
- 初心者向け『R統計解析』の執筆.
_ 2010 年 08 月 14 日 (土曜)晴
- 05:40 起床
- 07:20 研究室
- 午前
- 初心者向け『R統計解析』の執筆.
- 午後
- 初心者向け『R統計解析』の執筆.
_ 2010 年 08 月 13 日 (金曜)晴
- 05:40 起床
- 07:20 研究室
_ 2010 年 08 月 12 日 (木曜)晴・曇
- 05:40 起床
- 07:20 研究室
- 午前
- Wubi で Windows 7 に構築している Ubuntu に,レポジトリから TeX を突っこんでみた.当然,UTF-8 は使えないので,nkf による文字コードコンバートを行なう.
- 午後
_ 2010 年 08 月 11 日 (水曜)晴
- 05:30 起床
- 07:10 研究室
- 午前
- Ubuntu のデフォルトフォント変更は,$HOMEに.fonts.conf を置いても読み込まれないようだった.仕方ないので,/etc/fonts/conf.avail/69-language-selector-ja-jp.conf を直接編集する.ただ VL-Gothic にすると,Takao との品質の差が歴然とする.後者の方が美しいのだ.後者が円マークではなく,バックスラッシュを表示してくれればいいのだが.
- 初心者向け『R統計解析』の執筆.
- 午後
- 初心者向け『R統計解析』の執筆.とりあえず第 1 章は完成
_ 2010 年 08 月 10 日 (火曜)曇・雨
- 05:00 起床
- 06:50 研究室
- 午前
- 初心者向け『R統計解析』の執筆に着手した.
- 午後
- Ghostscript周りでファイルパスのチルダが \ {} に置きかえられてしまう件で /usr/share/gostscript/Resource/Init/gs_init.ps などを観てみたが,問題箇所はなさそう.
- R の postscript() ではチルダをパスに使える.R のCairoPS と platex コマンドで,パスにチルダが使えない.この二つが共通に呼び出しているコマンドはなんだ
- Ghostscript周りでファイルパスのチルダが \ {} に置きかえられてしまう件で /usr/share/gostscript/Resource/Init/gs_init.ps などを観てみたが,問題箇所はなさそう.
_ 2010 年 08 月 9 日 (月曜)晴・曇
- 05:30 起床
- 07:10 研究室
- 午前
- Bayesian computation with R の翻訳の後書きを書き上げた.
- 午後
- 初心者向け『R統計解析』の執筆に着手した.
_ 2010 年 08 月 8 日 (日曜)晴
- 05:30 起床
- 07:10 研究室
- 午前
- A Beginner's Guide to R の翻訳の見直しをすすめる.
- dvipdfmx で作成した pdf を AcrobatReader? on Ubuntu で開くと \textgt がまるで効いていない.対処は他からフォントをもってくることだが,対処がなされていない Linux マシンを考慮して ipa.map を作成してフォントを埋め込む
$ dvipdfmx -f ipa.map -o main.pdf main.dvi
- 午後.
- 17:15 A Beginner's Guide to R の翻訳完了し,プリントアウト完了
_ 2010 年 08 月 7 日 (土曜)晴
- 05:30 起床
- 07:10 研究室
- 午前
- A Beginner's Guide to R の翻訳をほぼ終えた.
- 午後.
- A Beginner's Guide to R の翻訳原稿の見なおしにはいる
_ 2010 年 08 月 5 日 (金曜)晴
- 05:00 起床
- 06:40 研究室
- 午前
- A Beginner's Guide to R の翻訳継続
- 午後.来客と食事
- A Beginner's Guide to R の翻訳継続
- 職場のメールサーバー復旧
_ 2010 年 08 月 5 日 (木曜)雨/晴
- 06:30 起床
- 07:50 研究室
- 午前
- 相変らず,職場のメールサーバーがダウンしている.復旧見込なしと.
- A Beginner's Guide to R の翻訳継続
- 午後
- A Beginner's Guide to R
の翻訳継続
- plot の pch 引数に 0 が使えないとあった.むろん pch = 0 は有効である.白抜きの四角形となる.col 引数と混同しているらしい.もっとも col引数でも 0 は指定できる.ただ,プロットの背景色と一致してしまうだけだ
- 発注していた がきたのだが,アンプを繋げないと,実用的ではなさそう
- 充電
- A Beginner's Guide to R
の翻訳継続
_ 2010 年 08 月 4 日 (水曜)晴
- 06:30 起床
- 07:50 研究室
- 午前
- SKK を使っていたが,MozcにGUI設定が追加されたことを知り,変換をMozcに変えてみた. 基本的にはここの指示に従った.ただ5月に一度導入したこともあったので,そのソースディレクトリは改名して,あらたにレポジトリを投入した.
- ただ Emacsインラインでの動作がどうも気にいらない.また安定しない.変換は素晴らしいが,どうもしっくりこない.なのでSKKに戻す.時間の無駄だった
- 午後
- gimp で eps を作成しても,その eps をgimp が読めない.とりあえず gimp portable をやめ,インストール版の gimp にかえ,さらに環境変数 GS_PROG も削除し,かわりに gs/binの4ファイルを,Gimp/bin にこぴー.
- ただ GS_PROGはパスだけでなく,パスと実行ファイルまで含めなければいけなかったのかもしれない,明日試す.
- でGimp で作成した eps をLinux の pLaTeX で処理すると
\includegraphics{~/git/Document/tmp/Fig1.15.eps}
! LaTeX Error: Cannot determine size of graphic in \unhbox\voidb@x \penalty \@M \ {}/git/Document/tmp/Fig1.15.eps (no BoundingBox).
どう調べても,[bb= 0 0 400 400] などを追加しても,こんどは! Missing \endcsname inserted.
とエラー.ふっと思って\includegraphics{/home/git/Document/tmp/Fig1.15.eps}
と絶対パスに変えたら通った.CairoPS でもファイルパスにチルダをはさむとエラーになっていた.- どうもファイルパスの ~ が,勝手に \~{} というダミー記法に置き換えられているようだ.どうしてだろう.
- gimp で eps を作成しても,その eps をgimp が読めない.とりあえず gimp portable をやめ,インストール版の gimp にかえ,さらに環境変数 GS_PROG も削除し,かわりに gs/binの4ファイルを,Gimp/bin にこぴー.
- A Beginner's Guide to R の翻訳継続
_ 2010 年 08 月 3 日 (火曜)晴
- 05:40 起床
- 07:20 研究室
- 午前
- A Beginner's Guide to R の翻訳継続
- 午後.
- A Beginner's Guide to R の翻訳継続
_ 2010 年 08 月 2 日 (月曜)晴
- 06:30 起床
- 07:50 研究室
- 午前
- A Beginner's Guide to R の翻訳継続
- 午後.
- A Beginner's Guide to R の翻訳継続
_ 2010 年 08 月 1 日 (日曜)晴
- 06:30 起床
- 07:50 研究室
- 午前
- A Beginner's Guide to R の翻訳継続
- 午後.
- A Beginner's Guide to R の翻訳継続
Link: RMeCab(644d)
RCaBoCha(4421d)
過去の日録(4939d)
AdobeReader9(5196d)
Mozc(5209d)
Last-modified: 2010-09-02 (木) 12:56:48 (5180d)