日録2008年_08月
_ 2008年 8 月 31 日 (日) 晴
- 06:10 起床
- 午前
- 自宅で発表用のスライド
_ 2008年 8 月 30 日 (土) 雨
- 06:10 起床
- 午前
- 自宅で発表用のスライド
_ 2008年 8 月 30 日 (金) 雨
- 06:10 起床
- 午前
- 自宅で発表用のスライド
- 午後.お弁当
- 13:00 研究室着
- R で作成した eps 画像は背景が透過であった.par()の bg オプションのデフォルトであった.dev.copy2eps(file = "file.eps", bg ="white") とバッググラウンドを指定.画像オプションもいろいろ忘れているなぁ.
- 手前味噌になってしまうのかもしれないけど,R本は和洋ほとんど手元にあり,いろいろめくってみるのだけど,最後の砦はリゲスの『Rの基礎とプログラミング技法』になるなぁ.
- biplot()関数でx,yそれぞれの軸のtickmark を描かないようにするには
axes = FALSE
ではなくyaxt = "n", xaxt = "n"
とせにゃきゃならん.覚えておこう
_ 2008年 8 月 29 日 (金) 晴
- 06:10 起床
- 07:30 研究室着,
- 午前
- 昨日の続きでMacにRCaBoChaの作業
- 午後.少し後れてお弁当.
- T氏来訪
- やや遅く就寝,...
_ 2008年 8 月 28 日 (木) 雨
- 06:10 起床
- 07:30 研究室着
- 午前
- 昨日の続きでMacにCaBoChaをインストール
- マルチバイト文字(列)とワイド文字(列)の変換の整理をした.
- 午後.麺
- RCaBoChaの作業
- 途中,K氏来訪
- やや遅く就寝,...
_ 2008年 8 月 27 日 (水) 雨
- 06:10 起床
- 07:30 研究室着
- 午前
- RCaBoChaの実装に入る.とりあえずCaBochaのCインターフェイスを再確認.いけそう.
- 午後.麺
- とりあえず CaBocha? を使って形態素解析を行う R コードを書いてみよう.一応,動く.
> kekka <- RCaBoCha("今晩は鰻を食べたいな。") FROMAT_TREE = 今晩は---D 鰻を-D 食べたいな。 EOS * cid = 0 link = 2 surface = 今晩 pos = 名詞 morph = 今晩 * cid = 1 link = 2 surface = 鰻 pos = 名詞 morph = 鰻 * cid = 2 link = -1 surface = 食べ pos = 動詞 morph = 食べる > kekka NULL
- 形態素解析については,CaBoCha は MeCab? を呼んでいるだけだと思う.CaBoChaは係り受けの判定に必要なわけだが,一応 RCaBoCha の中にも形態素解析機能を付けておくか.
- 一応,ひな形はできた.
> kekka <- RCaBoCha("今日は鰻が食べたいな。") FROMAT_TREE = <DATE>今日</DATE>は---D 鰻が-D 食べたいな。 EOS > kekka Term1 Term2 POS D1 D2 1 今日 今日 名詞 1 2 2 は は 助詞 1 2 3 鰻 鰻 名詞 2 2 4 が が 助詞 2 2 5 食べ 食べる 動詞 3 -1 6 たい たい 助動詞 3 -1 7 な な 助詞 3 -1 8 。 。 記号 3 -1
- Mac に TinySVMをインストールするのに手こずる.
- とりあえず CaBocha? を使って形態素解析を行う R コードを書いてみよう.一応,動く.
- 定時就寝,
_ 2008年 8 月 26 日 (火) 雨・曇
- 06:20 起床
- 07:40 研究室着
- 午前
- S出版用の後書きを書き上げて,送付
- 午後.麺
- RMeCabのマニュアルを書き換えた.
- T 氏,K 氏来訪.
- 定時就寝,
_ 2008年 8 月 25 日 (月)
- 06:30 起床
- 充電
- 07:40 研究室着,
- 午前
- S出版用の後書き作成に着手
- 午後.麺
- 後書き執筆
- K 氏来訪
- 定時就寝,
_ 2008年 8 月 24 日 (日)
- 06:00 起床
- 自宅で国際学会向けの作業
- 定時就寝
_ 2008年 8 月 23 日 (土)
- 06:00 起床
- 自宅でRMeCab の作業と,S出版校正作業
- 定時就寝
_ 2008年 8 月 22 日 (金)
- 06:00 起床
- 自宅でRMeCab の作業と,S出版校正作業
- 定時就寝
_ 2008年 8 月 21 日 (木)
- 06:00 起床
- 自宅でRMeCab の作業と,S出版校正作業
- 定時就寝...
_ 2008年 8 月 20 日 (水)
- 06:00 起床
- 自宅でRMeCab の作業と,国際学会向けの作業
- 定時就寝...
_ 2008年 8 月 19 日 (火)
- 06:00 起床
- 07:30 研究室着
- 午前
- RMeCab にさらに関数を追加する.これまでの関数はターム文書行列の作成する最後の段階を R に任せていたのだが,行列の作成亜までをすべてC++側で実装してみることに.具体的には docMatrix(), Ngram(), NgramDF()関数が対象となる.
- 午後.麺
- RMeCab の作業.
- 15:00-16:30 会議
- 16:30-18:00 テキストマイニング研究会
- 定時就寝
_ 2008年 8 月 18 日 (月)
- 06:00 起床
- 07:30 研究室着,
- 午前
- RMeCab に関数を追加.データフレームの指定列からターム・文章行列を作成できるようにした.今回は,行列の作成まで,すべてC++側で行った.
- 午後.麺
- RMeCab の作業.
- 定時就寝
_ 2008年 8 月 17日 (日)
- 06:00 起床
- 定時就寝...
_ 2008年 8 月 16 日 (土)
- 06:00 起床
- 07:30 研究室着,
- 午前
- RMeCab に,データフレームのある列に記録された文章から,文書・ターム行列を作成する機能を追加しようと考えた.これまでは,一時ディレクトリを作成する方法で行っていた.さて textConnecntion() 関数を使えば良いかと思っていたが,実は,そんなに簡単ではなかった.結構大きな変更になるので,少し後回しにする.
- 午後.少し先の定食屋へ
- rglパッケージの rgl.texts()関数? で、ラベルに日本語を出そうとしているんだが、どうもうまくいかんなぁ。
- 定時就寝...
_ 2008年 8 月 15 日 (金)
- 06:00 起床
- 07:30 研究室着
- 午前
- 日本語配慮表現の分析.関東と近畿の違いが割合はっきり出たようだ.
- 午後.麺
- R のメーリングリストにhow to draw a 4d picture with density estimation?というのがあったので,期待して中身をみてみたら I want to draw it as a 3d picture とあって,単なる3dのタイポであった.
- Vista でRを実行する際,一時ディレクトリを作って,そこにファイルを作成するという処理を行ってみた.ところが,エラーになる.Vista ではファイルの区切りに "\\" をつかわないといけないのであった.
- と思ったら,別の部分のミスであった...
- 心理データの分析
- RMeCabのバージョンアップ.docMatrix()関数の出力メッセージをやや詳しく変更.RMeCabDF()関数の引数で,列番号と列名のどちらでも指定できるようにした.
- 定時就寝...
_ 2008年 8 月 14 日 (木)
- 06:00 起床
- 07:30 研究室着,
- 午前
- 日本語配慮表現の分析
- 午後.お弁当
- 日本語配慮表現について,S 先生と相談.
- 定時就寝,...
_ 2008年 8 月 13 日 (水)
- 06:00 起床
- 07:30 研究室着
- 午前
- 午後.麺
- RMeCab の RMeCabDF()関数は,現在,列番号を指定するようにしているが,そのためには行番号が確認できる必要がある.
which(colnames(dat)== "Q7A2") [1] 33
そこで,列名でも指定できるように修正しよう.そのために,モード等の確認を行う.cn <- "hoge" cn %in% colnames(dat) ! ( cn %in% colnames(dat) ) cn <- c("hoge1", "hoge2") is.character(cn) mode(cn) class(dat[,cn]) is.factor(dat[,cn]) is.character(dat[,cn]) mode (dat[1,cn])
- 夏休みに入ったせいなのか,Rのメーリングリストにも,やれ「 Ubuntu でRをインストールする方法を教えろ」だの,「T検定を行う方法を教えろ」だの,えらい初歩的な問い合わせが増えているなぁ.古参の回答者たちも,いい加減に切れるんじゃないか?
- RMeCab の RMeCabDF()関数は,現在,列番号を指定するようにしているが,そのためには行番号が確認できる必要がある.
- 定時就寝,...
_ 2008年 8 月 12 日 (火)
- 06:10 起床
- 07:30 研究室着,
- 午前
- 三菱UFJ銀行に振り込みに出向く
- 午後.麺
- さすがに疲れたので,ぼーっとして過ごす.
- 定時帰宅,定時就寝,...
_ 2008年 8 月 11 日 (月)
- 06:00 起床
- 一日自宅で共著者と原稿の最終チェック.
- 自転車の後輪チューブの交換と,ついでブレーキの調整.30分もかからずすんだ.2600円.
- S 出版に原稿を送付.
- 国際計算機統計学会から, 横浜での国際大会IASC の原稿について連絡があったそうな.
_ 2008年 8 月 10 日 (日)
- 06:00 起床
- 一日自宅で共著者と原稿の最終チェック.
- 自転車の後輪チューブ,空気の入れすぎと,この暑さで,破裂させてしまった.
_ 2008年 8 月 9 日 (土)
- 06:30 起床
- 08:00 研究室着,
- 午前
- 原稿の再チェック
- 午後.麺2
- 原稿の再チェック
_ 2008年 8 月 8 日 (金)
- 06:00 起床
- 一日自宅で共著者と原稿の最終チェック.
_ 2008年 8 月 7 日 (木)
- 06:00 起床
- 07:30 研究室着,
- 午前
- 行動計量学会の事前登録で,参加費の振込先がUFJ銀行になっていた.郵便局かPayPal?にしてくれていればありがたいのに.
- 言語セッションの司会はD大のJ先生.また,お世話になってしまうなぁ.
- 午後.蓬来でチャーハン小520と餃子350.
- 明日は研究室に来ないかもしれないので,できるだけ仕事を済ませておく.
- Linux版の Adobe Reader で印刷している最中,次のような警告がコンソールに表示された.初めてみるが,なんだ?
(acroread:7505): Gtk-CRITICAL **: gtk_progress_set_percentage: assertion `percentage >= 0 && percentage <= 1.0' failed
- 一応,作業は終了した.
- 定時帰宅,定時就寝
_ 2008年 8 月 6 日 (水)
- 06:00 起床
- 07:30 研究室着,
- 午前
- S出版原稿の再チェック
- 心理学の先生と統計関連学会についての話
- 午後.麺2
- 修論審査
- 原稿再チェック
- 定時帰宅,定時就寝
_ 2008年 8 月 5 日 (火)
- 06:00 起床
- 07:30 研究室着,
- 午前
- 昨日,sudo apt-get update に失敗したまま,今日の朝,Synaptic でレポジトリを変更しようとすると,
/var/lib/apt/lists/lockが取得できませんでした - open (11 Resources temporarily unavailable) ディレクトリをロックできません
なるエラーに遭遇.$ sudo apt-get autoclean
を実行後,Synaptic のレポジトリで[その他]を選び,ミラーを自動選択させる.jait が選ばれたよう.tcl8.4, tcl8.4-deb, tk8.4, tk8.4-deb を導入した. - 続けて R-2.7.1 を Tcl/Tk オプションを付けてコンパイル.
- 昨日,sudo apt-get update に失敗したまま,今日の朝,Synaptic でレポジトリを変更しようとすると,
- 午後.麺
- S 出版の原稿見直し
- 明日は修論の審査など忙しい
- 定時帰宅,定時就寝,
_ 2008年 8 月 4 日 (月)
- 06:00 起床
- 07:30 研究室着,
- 午前
- Baayen を引っ張り出して眺める.languageR パッケージを更新しようと思ったら,依存の指定が R-2.7.1 以上になっている.しようがないので R-2.7.1に更新しようと思う.今回はtcl/tk のオプションを付けておこうと思うので,synaptic から tcl8.4, tk8.4 をインストールしようとしたら,レポジトリにアクセスできない.もともとアクセスの悪いミラーだが.やれやれ.apt-get install も同じ.ただ,気になるメッセージがある.
$ sudo apt-get install tcl8.4 パッケージリストを読み込んでいます... 完了 依存関係ツリーを作成しています Reading state information... 完了 The following packages were automatically installed and are no longer required: libpq4 "apt-get autoremove"を使ってこれらを削除してください。 提案パッケージ: tclreadline 以下のパッケージが新たにインストールされます: tcl8.4 エラー http://jp.archive.ubuntu.com gutsy/main tcl8.4 8.4.15-1build1 接続失敗 E: いくつかのアーカイブが取得できません。 apt-get update を実行するか --fix-missing オプションを付けて試してみてください。
- Baayen を引っ張り出して眺める.languageR パッケージを更新しようと思ったら,依存の指定が R-2.7.1 以上になっている.しようがないので R-2.7.1に更新しようと思う.今回はtcl/tk のオプションを付けておこうと思うので,synaptic から tcl8.4, tk8.4 をインストールしようとしたら,レポジトリにアクセスできない.もともとアクセスの悪いミラーだが.やれやれ.apt-get install も同じ.ただ,気になるメッセージがある.
- libpq4 て,何だったか?
- PostgreSQL C client library か.Ubuntu に移行してから,もっぱら MySQL なので,必要ではないのだが.
- 午後.久しぶりに蓬来でチャーハン600と餃子350.食べ過ぎた...
- S 出版より原稿期限の確認.問題なしと伝える.
_ 2008年 8 月 3 日 (日)
- 06:30 起床
- 終日,S 出版の原稿修正にあてる
- 定時就寝...
_ 2008年 8 月 2 日 (土)
- 06:30 起床
- 07:50 研究室着,
- 午前
- Rにパッケージを導入する際,例えば Vista などでは,C:\Program Files\R\R-2.7.1\library 以下を触ろうとせず,ユーザに書き込み権限のあるフォルダ C:\Document and Settings\ishida\Document や C:\Users\ishida\Document 以下に R\win-library\2.7 というフォルダを作成して,そこにインストールするようだ.こうした環境でRMeCabを利用する場合, MeCab? 付属の libmecab.dll は,こちらのフォルダにコピーしてやらなければならない.そこで,Rのライブラリがユーザーのホームディレクトリに作成された場合を想定して,専用の環境設定ファイルRMeCabInstallXP.bat とRMeCabInstallVista.bat を作成した。 もっとも %USERPROFILE% という環境変数を利用していているだけだが.
- 珍しく来客.
- 午後.麺2
- RMeCab ページの調整
- 珍しく来客.教務関係で,学生と教務委員長を交えて相談
- 定時帰宅、定時就寝
_ 2008年 8 月 1 日 (金)
- 06:00 起床
- 07:30 研究室着,
- 午前
- DELL Vista の Illustrator C3 を再インストール.
- Windows は,全くやっかいなOSだな.かといってMacintoshも困るが... Illustratorを前回インストールし,認証完了後,気がつくと,C3 の実行ファイルがハードディスクから消えていた.googleっても,まるで情報無し.しようがないのでサポートへ電話すると,向こうも初めてのケースだと絶句していたが,割合親切な対応で,とりあえずハードディスクからIllustrator の情報を完全消去し,その上で再インストールをしてみるよう勧められた.レジストリをいじるスクリプトをダウンロードする.ところが,こいつが Windows Installer Clean Upをインストールしていないと実行できない.ダウンロードし,こいつを実行しようとすると,今度は
- DELL Vista の Illustrator C3 を再インストール.
Script: C:\Users\CS\AppData\Local\Temp\IXP000.TMP\StartMsi.vbs Line: 17 Char: 1 Error: Permission denied Code: 800A0046 Source: Microsoft VBScript runtime error
とエラー.右クリックで実行.Adobe Reader ごと消す. で,Illustrator C3 を再インストール.
- R で作成した eps は Illustrator C3 で Helvetica が無いとかいって,読み込めない.仕方ないので,pdfにする.
pdf(file = "hoge.pdf", family = "Japan1")
- 午後.来客と弁当
- M出版用の画像作成.すべてpdfで作成し,Illustratorで確認.
- 16:30--18:30ゼミ
- 帰宅後,定時より遅れて就寝
Link: RMeCab(421d)
R_Baayen(1030d)
RCaBoCha(4198d)
和布蕪他インストール(4656d)
過去の日録(4716d)
CaBoCha(4964d)
R_Graphics_axes(5690d)
wcstok_wcstombs_etc(5692d)
R_tempfile(5705d)
R_Tcl/TK(5722d)
R_Plot_Marginの処理(5987d)
Last-modified: 2008-09-02 (火) 16:37:22 (5687d)