日録2009年3月 のバックアップソース(No.53) - アールメカブ

アールメカブ


日録2009年3月 のバックアップソース(No.53)

[[過去の日録]]


[[Lattice Multivariate Data Visualization with R:http://www.springer.com/statistics/computational/book/978-0-387-75968-5]]

//http://d.hatena.ne.jp/hdtooo/20081208/1228754676
#ref(R_Lattice/lattice113.png)

* 2009 年 3 月 31 日 (火) 曇 [#v56af9f1]
-- 06:00 起床
-- 07:30 研究室着
- 午前
-- postfix の設定 
- 午後
-- 依頼されていた書評の執筆に移る.さっさと筆が進む.

* 2009 年 3 月 30 日 (月) 晴 [#zee08b6c]
-- 06:00 起床
-- 07:30 研究室着
- 午前
-- [[RMeCab]] 0.78 の公開.docDF()関数の実装にミスがあり,余計なループを繰り返していた.なので,解析に余計に時間がかかっていた.
-- 行列が大きくなると,共起行列の作成にメモリも時間もかかる.疎な行列は,やはり,それように処理しないといけないだろう.これは [[RCaBoCha]]での課題としよう.

* 2009 年 3 月 29 日 (日) 晴 [#v61f6b2b]
-- 一日自宅

* 2009 年 3 月 28 日 (土) 曇 [#y05d3cb5]
-- 06:00 起床
-- 07:30 研究室着
- 午前
-- [[RMeCab]] の docDF() 関数,また共起行列作成の見直し.
時間がかかりすぎる.行列計算の方法を変えた.
- 午後 外へ食事
//bigmac 200 * 4
-午後
-- O さんから、docDF()関数はあまりに遅いと指摘があって、見直すと、ループ処理を大きく間違えていた.時間がかかるはずである.

* 2009 年 3 月 27 日 (金) 曇 [#k914a6e9]
-- 06:00 起床
-- 07:30 研究室着
-- 朝早く,職務として学内学生用端末をチェック.とんだ時間つぶしである.
-午後.蓬莱焼き飯600.
-- [[R_Baayen]]
* 2009 年 3 月 27 日 (金) 曇 [#g6907df4]
-- 06:00 起床
-- 07:30 研究室着
- 午前
-- 朝早く,職務として学内学生用端末をチェック.とんだ時間つぶしである.
-午後.蓬莱焼き飯600.
-- [[R_Baayen]]
-- [[RMeCab]] のNgramDF2()関数にバグがあったので修正.ついでに処理実行中に * を出力させることにした.

* 2009 年 3 月 26 日 (木) 晴 [#o0e88a84]
-- 06:00 起床
-- 07:30 研究室着
- 午前
-- 気になるログがあったが,CUIで調べるのも疲れたので,Munin を導入してみた.
--- しかし,Munin はどの程度負荷がかかるのだろうか?
-- [[R_Baayen]]
- 午後
-- [[R_Baayen]]

* 2009 年 3 月 25 日 (水) 晴 [#hce811a0]
-- 06:00 起床
-- 07:30 研究室着
- 午前
--[[R_Baayen]]
- 午後
-- 例によって,テキストの出力が一致しない.今回は,数値の端数ではなく,出力の自由度が違う.lmerの出力なんだが,ランダム項で切片と傾きのパラメータを推測すると,この二つの相関係数も推定されるのだが,普通に anova 出力させると,このパラメータも含まれて出されるはず.
うーん,なんか見落としているのだろうか?それとも,例によって間違いか.原著者は,かなり試行錯誤しながら書いているので,モデル式を変更したにもかかわらず,出力は変更前のものをそのまま残している可能性もある(現にあった).
-- Apple から電話があった.


* 2009 年 3 月 24 日 (火) 晴 [#geb80208]
-- 06:00 起床
-- 07:30 研究室着
- 午前
--[[R_Baayen]]
--- 誤植(誤解?)が多くてかなわん.
- 午後
-- 去年の今頃,Baayen に languageR パッケージの実装ミスを伝えたところ,どうやらパッケージの方は修正しているらしいが,修正前のパッケージを使った結果が,そのまま出版されたテキストには残っているなぁ.


* 2009 年 3 月 23 日 (月) 晴 [#fa81dcad]
-- 06:00 起床
-- 07:30 研究室着
- 午前
-- [[RMeCab]]と[[R2MeCab]] の dofDF() 関数に共起行列を作成する機能を追加.これで[[RMeCab]] には,必要な関数を可能な限り追加できたと思う.
-- 次は [[RCaBoCha]] の係り受け機能の整備だな.
- 午後
-- 何気なく,検索していたら,[[こんなページ:http://yebo-blog.blogspot.com/2008/07/mac-os-xmecab.html]]を見つけた.
Mac OS X 10.5 には,MeCab がデフォルトで入っているのね.
 $ ls /usr/lib/libmecab.*
 /usr/lib/libmecab.1.0.0.dylib	/usr/lib/libmecab.dylib
 /usr/lib/libmecab.1.dylib
 $ ls /usr/include/mecab*
 /usr/include/mecab.h
 $ ls -CFR /usr/lib/mecab/dic/apple
つまり,Mac OS X 10.5 であれば,[[RMeCab]] をインストールするのに,わざわざ MeCab をインストールする必要はないのであった.
-- iTunes のアカウント作成をすると,クレジットカードの入力を要求される.いやだなと思っていたら,右下の無料「アプリケーションを入手」をクリックして,新規アカウントを作成し,送り返されてくるメールのリンクをクリックすると,iTunes が自動で起動し,新規アカウントを取得できる.[[ここ:http://shopdd.blog51.fc2.com/blog-entry-788.html]]を参照した.
-- 夕方まで[[R_Baayen]]
-- 卒業式余波がやってきて,帰り遅くなる.

* 2009 年 3 月 22 日 (日) 雨 [#ta399431]
-- 06:10 起床
-- 自宅で仕事.自宅マックに subversion をインストール.
-- 充電

* 2009 年 3 月 21 日 (土) 晴 [#h3d4d630]
-- 06:10 起床
-- 07:40 研究室着
- 午前
-- [[RMeCab]]用のデータファイル &ref(SoftArchive/data.zip);を更新した.
-- Epson のミニノートにインストールした Ubuntu の調整
- 午後
-- プリンタを設定
-- [[R_Baayen]] 相変わらず誤植が多く,数値の掲載ミスが多いなぁ.

* 2009 年 3 月 20 日 (金) 雨 [#za035a9c]
-- 06:00 起床
-- 07:20 研究室着
- 午前
-- Windows版 [[RMeCab]]のコンパイルに使っていたのは Ubuntu にインストールした VMWare仮想環境上の XP なのだが,この環境で RMeCab が落ちるようになった.ところが別のマシン数台のXPやVistaで試してみても,RMeCab は落ちたりしない.正常に動作する.変だなと思って,MeCabを単体で起動しようとするとエラー.
どうやら MeCab が壊れた?らしい.そんなことがあるのかと思いつつ,MeCab本体を再インストールしたら,当然ながら RMeCab も正常に動作するようになった.後学のため,MeCab が壊れた際,プロンプト画面に表示されたエラー内容をコピーしておけばよかった.
-- Epson のミニノートに Wubi を使って Ubuntu をインストール
- 午後.蓬莱小焼き飯520.
-- Epson のミニノートのWindowsの方に R パッケージ構築環境を整備
-- JasPer JPEG-2000のアップデートがあったが,サーバーには関係しないよう.

* 2009 年 3 月 19 日 (木) 晴 [#db87b5d0]
-- 06:00 起床
-- 07:20 研究室着
- 午前
-- [[RMeCab]] に共起行列作成機能を追加し RMeCab_0.74とする.
- 午後
-- 13:10-14:00 会議
-- Epson のミニノートを設定
-- 無線LANをいくら設定してもつながらない.半ばキレかけながら,マニュアルをはじめて袋から出して見ると,デフォルトでは無線LAN のスイッチが切れていることを知った...
-- 14:30-17:00 会議

* 2009 年 3 月 18 日 (水) 晴 [#g18aeb81]
-- 06:00 起床
-- 07:20 研究室着
- 午前
-- [[RMeCab]] に共起行列作成機能を付ける準備を始めた.
-- 11:00- 12:30 心理のS先生らと TextMining についてちょっとした話.
- 午後
-- 共起行列だが,共起の意味をどうとらえるか難しい.

* 2009 年 3 月 17 日 (火) 晴 [#b6b41a4a]
-- 06:00 起床
-- 07:20 研究室着
- 午前
-- 先週末からの懸案の解決方法がわかった。ようするに明示的に文字コードを指定しない問題である。真っ先に疑っていたのだが、しかし短い文章の場合はちゃんと解析した結果が返ってくるので,これ以外の可能性ばかりを検討していた.

  NSString* request =
   [[NSString stringWithFormat:@"%@%@", Url, query] 
      stringByAddingPercentEscapesUsingEncoding:
           NSUTF8StringEncoding];
- 午後
-- Baayen

* 2009 年 3 月 16 日 (月) 晴 [#te2bfc74]
-- 06:00 起床
-- 07:20 研究室着
- 午前
-- 体調ひどく悪し。
-- 09:00-13:00 大学院面接。がっくり疲れた。
-午後
-- 14:15-16:00 ジンジの面接
-- iPhoneでMeCab解析の続き。
--- 複数の形態素からなる文章を解析させる操作をすると、アプリが落ちる。デバッグすると、

 NSXMLParserErrorDomain error 5.
と出る。この中身は[[ここ:http://forums.macrumors.com/showthread.php?t=568251]]によれば
 Code:
 
 NSXMLParserPrematureDocumentEndError
 The document ended unexpectedly.
 
 Available in Mac OS X v10.3 and later.
 
 Declared in NSXMLParser.h

ということなのだが。さらに検索すると[[こういう情報:http://www.iphonedevsdk.com/forum/iphone-sdk-development/12355-can-not-parse-simple-xml.html]]もあった。
>
The problem is that is an invalid xmll document. There is only one root elment allowed in the XML document. Most if not all parsers will fail on that. Try chaning you xml from:
<
だとすると NSXMLParserは使えないということになる.しかしクエリーの結果をファイルに保存して、これを読み込ませるとうまくいく。
-- うーーん。ここに[[こんな情報:http://www.osxentwicklerforum.de/thread.php?postid=62076]]があった。明日試してみよう。
>
Hehehe, fileURLWithPath statt URLWithString, dann geht's, hab das hier mal ausprobiert. 
<
--- [翌日:試してみたが,結果は変わらん...]

//[[ここの情報:http://discussions.apple.com/thread.jspa?threadID=1716226&tstart=839]]が参考になるかもしれない。明日試してみよう。


* 2009 年 3 月 15 日 (日) 晴 [#g2e0daa0]
-- 07:00 起床
- 午後。自宅で仕事。

* 2009 年 3 月 14 日 (土) 雨 [#e664e3e1]
-- 07:00 起床
-- 08:20 研究室着
- 午前
-- iPod Touch と Xcode をあれこれいじる.
-午後
-- iPod Touch で最初のアプリケーションを作った。日本語文章を入力すると形態素解析し、その結果をテーブルに表示するというごく簡単なプログラムである。


* 2009 年 3 月 13 日 (金) 雨 [#dce2e4e6]
-- 06:10 起床
-- 07:30 研究室着
- 午前
-- [[iPodTouch の認証と実機へのインストール>Provisioning設定]].えらい手間取った.
- 午後
-- [[Baayen>R_Baayen]] 関連で依頼されている仕事.落ち着いて iPod SDK のチェックをする時間もない...


* 2009 年 3 月 12 日 (木) 晴 [#ba2fa677]
-- 05:30 起床
-- 07:00 研究室着
- 午前
--  iPhone SDK をいじってみる.
-- 花粉症の薬をもらいにいく.受付が勘違いして,受け取りが大幅に遅れた.
- 午後
-- [[Baayen>R_Baayen]] 関連で依頼されている仕事にかかる.Baayen のホームページにアクセスできない.

* 2009 年 3 月 11 日 (水) 晴 [#pae34de2]
-- 06:20 起床
-- 07:40 研究室着
- 午前
--  iPhone SDK をいじってみる.
-- Object Cでコードを書くのは初めてだが、ストレスたまる。
たとえば文字列オブジェクトの初期化は

 NSString * mystring;
 mystring = [[ NSString alloc] initWithString:@"iPod Touch" autorelease];

とする。以下でもいいらしい。

 mystring = [NSString stringWithString:@"iPod Touch"];

が,引数が増えてくると,とたんに混乱してくる.
- 午後
-- DELLのVista に TeX Meadow Yatex をインストール.
-- 15:00-17:00 ジンジ会議.

* 2009 年 3 月 10 日 (火) 晴 [#j71fe9bd]
-- 06:00 起床
-- 07:30 研究室着
- 午前
-- ちょっと一段落したので iPhone SDK をいじってみる.
-- ところが,この SDK のダウンロードがなかなか終わらない.
-- ようやくダウンロードが終わったが,今度はインストールに時間がかかる.もっとも Visual Studio もインストールには時間がかかったものだが.
- 午後.蓬莱小焼きめし520
-- SDK を引き続き試してみる.
-- 定番の HelloWorldを作ってみる.Xcodeを使ってFramework をいじるのははじめてなので,[[いろいろとまどうこと:>UIKit]]が多い.

* 2009 年 3 月 9 日 (月) 曇 [#xf70b2c4]
-- 06:00 起床
-- 07:30 研究室着
- 午前
-- いろいろとプログラミング作業
- 午後
--16:00-18:30 ジンジの会議

* 2009 年 3 月 8 日 (日) 曇 [#ge696755]
-- 07:00 起床
- 午前.
-- 自転車のブレーキワイヤとブレーキシューの交換に行ったが,2時間,4205 円かかってしまった.


* 2009 年 3 月 7 日 (土) 晴 [#c54f1d36]
-- 06:00 起床
-- 07:30 研究室着
- 午前
-- [[RMeCab]] と [[R2MeCab]] に新規追加した関数のバグ削除.
- 午後
-- サーバーのアドレスを変更した.ついでにアップデート.
-- [[R2MeCab]] の様子を見て,CRAN に登録したいと思う.


* 2009 年 3 月 6 日 (金) 雨・曇 [#u1fb0b9d]
-- 06:00 起床
-- 07:30 研究室着
- 午前
-- [[RMeCab]] に関数を追加する作業.
-- 10:00-11:00 会議
- 午後
-- [[RMeCab]]が肥大化してしまったので,[[R2MeCab]]なんてものを作った.
//http://mamopage.blog65.fc2.com/blog-entry-232.html

* 2009 年 3 月 5 日 (木) 曇 [#k6ab90a7]
-- 06:00 起床
-- 07:30 研究室着
- 午前
-- [[RMeCab]] に関数を追加する作業.
- 午後
-- [[RMeCab]] に関数を追加する作業.
-- 14:20-17:00 会議
--,

* 2009 年 3 月 4 日 (水) 曇 [#f7182d32]
-- 06:00 起床
-- 07:30 研究室着
- 午前
--昨日完成させた [[Lattice Multivariate Data Visualization with R:http://www.springer.com/statistics/computational/book/978-0-387-75968-5]] 訳稿を整理.
-午後
-- [[RMeCab]] に関数を追加する作業.

-- [[RMeCab]] に関数を追加する作業.
* 2009 年 3 月 3 日 (火) 曇 [#pac227e3]
-- 06:00 起床
-- 07:30 研究室着
- 午前
-- [[Lattice Multivariate Data Visualization with R:http://www.springer.com/statistics/computational/book/978-0-387-75968-5]]
- 午後
-- [[Lattice Multivariate Data Visualization with R:http://www.springer.com/statistics/computational/book/978-0-387-75968-5]]をひとまず完成.
-,
* 2009 年 3 月 2 日 (月) 曇 [#cb912249]
-- 08:00 起床
-- 09:30 研究室着
- 午前,午後とも
-- [[Lattice Multivariate Data Visualization with R:http://www.springer.com/statistics/computational/book/978-0-387-75968-5]]

* 2009 年 3 月 1 日 (日) 晴 [#p30f3a16]
- 一日自宅