[[過去の日録]] * 2008年 8 月 29 日 (金) 晴 [#k77c35c7] - 06:10 起床 -- 07:30 研究室着, - 午前 -- 昨日の続きでMacに[[RCaBoCha]]の作業 - 午後.少し後れてお弁当. -- T氏来訪 * 2008年 8 月 28 日 (木) 雨 [#ga0012a8] - 06:10 起床 -- 07:30 研究室着 - 午前 -- 昨日の続きでMacに[[CaBoChaをインストール>和布蕪他インストール]] -- [[マルチバイト文字(列)とワイド文字(列)の変換>wcstok_wcstombs_etc]]の整理をした. - 午後.麺 -- [[RCaBoCha]]の作業 -- 途中,K氏来訪 -- やや遅く就寝,... * 2008年 8 月 27 日 (水) 雨 [#hc9ccdff] - 06:10 起床 -- 07:30 研究室着 - 午前 -- [[RCaBoCha]]の実装に入る.とりあえず[[CaBochaのCインターフェイス>CaBoCha]]を再確認.いけそう. - 午後.麺 -- とりあえず CaBocha を使って形態素解析を行う R コードを書いてみよう.一応,動く. > kekka <- RCaBoCha("今晩は鰻を食べたいな。") FROMAT_TREE = 今晩は---D 鰻を-D 食べたいな。 EOS * cid = 0 link = 2 surface = 今晩 pos = 名詞 morph = 今晩 * cid = 1 link = 2 surface = 鰻 pos = 名詞 morph = 鰻 * cid = 2 link = -1 surface = 食べ pos = 動詞 morph = 食べる > kekka NULL -- 形態素解析については,CaBoCha は MeCab を呼んでいるだけだと思う.CaBoChaは係り受けの判定に必要なわけだが,一応 RCaBoCha の中にも形態素解析機能を付けておくか. -- 一応,[[ひな形>RCaBoCha]]はできた. > kekka <- RCaBoCha("今日は鰻が食べたいな。") FROMAT_TREE = <DATE>今日</DATE>は---D 鰻が-D 食べたいな。 EOS > kekka Term1 Term2 POS D1 D2 1 今日 今日 名詞 1 2 2 は は 助詞 1 2 3 鰻 鰻 名詞 2 2 4 が が 助詞 2 2 5 食べ 食べる 動詞 3 -1 6 たい たい 助動詞 3 -1 7 な な 助詞 3 -1 8 。 。 記号 3 -1 -- Mac に TinySVMをインストールするのに手こずる. - 定時就寝, * 2008年 8 月 26 日 (火) 雨・曇 [#p74d8628] - 06:20 起床 -- 07:40 研究室着 - 午前 -- S出版用の後書きを書き上げて,送付 - 午後.麺 -- [[RMeCab]]のマニュアルを書き換えた. -- T 氏,K 氏来訪. - 定時就寝, * 2008年 8 月 25 日 (月) [#deee99e8] - 06:30 起床 -- 充電 -- 07:40 研究室着, - 午前 -- S出版用の後書き作成に着手 - 午後.麺 -- 後書き執筆 -- K 氏来訪 - 定時就寝, * 2008年 8 月 24 日 (日) [#wc710361] - 06:00 起床 -- 自宅で国際学会向けの作業 - 定時就寝 * 2008年 8 月 23 日 (土) [#sb26860c] - 06:00 起床 -- 自宅で[[RMeCab]] の作業と,S出版校正作業 - 定時就寝 * 2008年 8 月 22 日 (金) [#c96aae2f] - 06:00 起床 -- 自宅で[[RMeCab]] の作業と,S出版校正作業 - 定時就寝 * 2008年 8 月 21 日 (木) [#mfec171a] - 06:00 起床 -- 自宅で[[RMeCab]] の作業と,S出版校正作業 - 定時就寝... * 2008年 8 月 20 日 (水) [#gc1c057e] - 06:00 起床 -- 自宅で[[RMeCab]] の作業と,国際学会向けの作業 - 定時就寝... * 2008年 8 月 19 日 (火) [#ecd13cab] - 06:00 起床 -- 07:30 研究室着 - 午前 -- [[RMeCab]] にさらに関数を追加する.これまでの関数はターム文書行列の作成する最後の段階を R に任せていたのだが,行列の作成亜までをすべてC++側で実装してみることに.具体的には docMatrix(), Ngram(), NgramDF()関数が対象となる. - 午後.麺 -- [[RMeCab]] の作業. -- 15:00-16:30 会議 -- 16:30-18:00 テキストマイニング研究会 - 定時就寝 * 2008年 8 月 18 日 (月) [#k49142a8] - 06:00 起床 -- 07:30 研究室着, - 午前 -- [[RMeCab]] に関数を追加.データフレームの指定列からターム・文章行列を作成できるようにした.今回は,行列の作成まで,すべてC++側で行った. - 午後.麺 -- [[RMeCab]] の作業. - 定時就寝 * 2008年 8 月 17日 (日) [#zdeafdc4] - 06:00 起床 - 定時就寝... * 2008年 8 月 16 日 (土) [#y67c7367] - 06:00 起床 -- 07:30 研究室着, - 午前 -- [[RMeCab]] に,データフレームのある列に記録された文章から,文書・ターム行列を作成する機能を追加しようと考えた.これまでは,一時ディレクトリを作成する方法で行っていた.さて textConnecntion() 関数を使えば良いかと思っていたが,実は,そんなに簡単ではなかった.結構大きな変更になるので,少し後回しにする. - 午後.少し先の定食屋へ //2010 -- ''rgl''パッケージの [[rgl.texts()関数>R_rgl.texts]] で、ラベルに日本語を出そうとしているんだが、どうもうまくいかんなぁ。 - 定時就寝... * 2008年 8 月 15 日 (金) [#jca3e773] - 06:00 起床 -- 07:30 研究室着 - 午前 -- 日本語配慮表現の分析.関東と近畿の違いが割合はっきり出たようだ. - 午後.麺 -- R のメーリングリストにhow to draw a 4d picture with density estimation?というのがあったので,期待して中身をみてみたら I want to draw it as a 3d picture とあって,単なる3dのタイポであった. -- Vista でRを実行する際,[[一時ディレクトリを作って,そこにファイルを作成するという処理>R_tempfile]]を行ってみた.ところが,エラーになる.Vista ではファイルの区切りに "\\" をつかわないといけないのであった. --- と思ったら,別の部分のミスであった... -- 心理データの分析 -- [[RMeCab]]のバージョンアップ.docMatrix()関数の出力メッセージをやや詳しく変更.RMeCabDF()関数の引数で,列番号と列名のどちらでも指定できるようにした. - 定時就寝... * 2008年 8 月 14 日 (木) [#z073a8b5] - 06:00 起床 -- 07:30 研究室着, - 午前 -- 日本語配慮表現の分析 - 午後.お弁当 -- 日本語配慮表現について,S 先生と相談. - 定時就寝,... * 2008年 8 月 13 日 (水) [#w17c911a] - 06:00 起床 -- 07:30 研究室着 - 午前 -- 充電 -- Ubuntuの起動時に some BusyBox failed to set xfermode が出て initrmfs の BusyBox プロンプトに移って,止まってしまった.う〜ん,この辺はよく分からんというか,調べるの面倒だなぁ.とりあえず強制終了し,再起動すると,無事ブートできた,initramfs の仕組みについて,[[このページ:http://blog.gcd.org/archives/51053466.html]]を眺めてみる. -- 日本語と韓国語,それぞれで行われたアンケートデータの解析に入る - 午後.麺 -- [[RMeCab]] の RMeCabDF()関数は,現在,列番号を指定するようにしているが,そのためには行番号が確認できる必要がある. which(colnames(dat)== "Q7A2") [1] 33 そこで,列名でも指定できるように修正しよう.そのために,モード等の確認を行う. cn <- "hoge" cn %in% colnames(dat) ! ( cn %in% colnames(dat) ) cn <- c("hoge1", "hoge2") is.character(cn) mode(cn) class(dat[,cn]) is.factor(dat[,cn]) is.character(dat[,cn]) mode (dat[1,cn]) -- 夏休みに入ったせいなのか,[[Rのメーリングリスト:https://stat.ethz.ch/mailman/listinfo/r-help]]にも,やれ「 Ubuntu でRをインストールする方法を教えろ」だの,「T検定を行う方法を教えろ」だの,えらい初歩的な問い合わせが増えているなぁ.古参の回答者たちも,いい加減に切れるんじゃないか? - 定時就寝,... * 2008年 8 月 12 日 (火) [#jde1a689] - 06:10 起床 -- 07:30 研究室着, - 午前 -- 三菱UFJ銀行に振り込みに出向く - 午後.麺 -- さすがに疲れたので,ぼーっとして過ごす. - 定時帰宅,定時就寝,... * 2008年 8 月 11 日 (月) [#i4947290] - 06:00 起床 -- 一日自宅で共著者と原稿の最終チェック. -- 自転車の後輪チューブの交換と,ついでブレーキの調整.30分もかからずすんだ.2600円. -- S 出版に原稿を送付. -- 国際計算機統計学会から, [[横浜での国際大会IASC:http://jasp.ism.ac.jp/~iasc2008/index.html]] の原稿について連絡があったそうな. * 2008年 8 月 10 日 (日) [#o5796b71] - 06:00 起床 -- 一日自宅で共著者と原稿の最終チェック. -- 自転車の後輪チューブ,空気の入れすぎと,この暑さで,破裂させてしまった. * 2008年 8 月 9 日 (土) [#aa1d3aa6] - 06:30 起床 -- 08:00 研究室着, - 午前 -- 原稿の再チェック - 午後.麺2 -- 原稿の再チェック * 2008年 8 月 8 日 (金) [#je5caf73] - 06:00 起床 -- 一日自宅で共著者と原稿の最終チェック. * 2008年 8 月 7 日 (木) [#v4004d69] - 06:00 起床 -- 07:30 研究室着, - 午前 -- 行動計量学会の事前登録で,参加費の振込先がUFJ銀行になっていた.郵便局かPayPalにしてくれていればありがたいのに. -- 言語セッションの司会はD大のJ先生.また,お世話になってしまうなぁ. - 午後.蓬来でチャーハン小520と餃子350. -- 明日は研究室に来ないかもしれないので,できるだけ仕事を済ませておく. -- Linux版の Adobe Reader で印刷している最中,次のような警告がコンソールに表示された.初めてみるが,なんだ? (acroread:7505): Gtk-CRITICAL **: gtk_progress_set_percentage: assertion `percentage >= 0 && percentage <= 1.0' failed -- 一応,作業は終了した. - 定時帰宅,定時就寝 * 2008年 8 月 6 日 (水) [#s567f0ba] - 06:00 起床 -- 07:30 研究室着, - 午前 -- S出版原稿の再チェック -- 心理学の先生と統計関連学会についての話 - 午後.麺2 -- 修論審査 -- 原稿再チェック - 定時帰宅,定時就寝 * 2008年 8 月 5 日 (火) [#ueb1805d] - 06:00 起床 -- 07:30 研究室着, - 午前 -- 昨日,sudo apt-get update に失敗したまま,今日の朝,Synaptic でレポジトリを変更しようとすると, /var/lib/apt/lists/lockが取得できませんでした - open (11 Resources temporarily unavailable) ディレクトリをロックできません なるエラーに遭遇. $ sudo apt-get autoclean を実行後,Synaptic のレポジトリで[その他]を選び,ミラーを自動選択させる.jait が選ばれたよう.tcl8.4, tcl8.4-deb, tk8.4, tk8.4-deb を導入した. -- 続けて R-2.7.1 を [[Tcl/Tk オプションを付けて>R_Tcl/TK]]コンパイル. - 午後.麺 -- S 出版の原稿見直し -- 明日は修論の審査など忙しい - 定時帰宅,定時就寝, * 2008年 8 月 4 日 (月) [#ue3ff58a] - 06:00 起床 -- 07:30 研究室着, - 午前 -- [[Baayen>R_Baayen]] を引っ張り出して眺める.''languageR'' パッケージを更新しようと思ったら,依存の指定が R-2.7.1 以上になっている.しようがないので R-2.7.1に更新しようと思う.今回はtcl/tk のオプションを付けておこうと思うので,synaptic から tcl8.4, tk8.4 をインストールしようとしたら,レポジトリにアクセスできない.もともとアクセスの悪いミラーだが.やれやれ.apt-get install も同じ.ただ,気になるメッセージがある. $ sudo apt-get install tcl8.4 パッケージリストを読み込んでいます... 完了 依存関係ツリーを作成しています Reading state information... 完了 The following packages were automatically installed and are no longer required: libpq4 "apt-get autoremove"を使ってこれらを削除してください。 提案パッケージ: tclreadline 以下のパッケージが新たにインストールされます: tcl8.4 エラー http://jp.archive.ubuntu.com gutsy/main tcl8.4 8.4.15-1build1 接続失敗 E: いくつかのアーカイブが取得できません。 apt-get update を実行するか --fix-missing オプションを付けて試してみてください。 --libpq4 て,何だったか? --- PostgreSQL C client library か.Ubuntu に移行してから,もっぱら MySQL なので,必要ではないのだが. - 午後.久しぶりに蓬来でチャーハン600と餃子350.食べ過ぎた... -- S 出版より原稿期限の確認.問題なしと伝える. * 2008年 8 月 3 日 (日) [#tf4e35ed] - 06:30 起床 -- 終日,S 出版の原稿修正にあてる - 定時就寝... * 2008年 8 月 2 日 (土) [#id4de572] - 06:30 起床 -- 07:50 研究室着, - 午前 -- Rにパッケージを導入する際,例えば Vista などでは,C:\Program Files\R\R-2.7.1\library 以下を触ろうとせず,ユーザに書き込み権限のあるフォルダ C:\Document and Settings\ishida\Document や C:\Users\ishida\Document 以下に R\win-library\2.7 というフォルダを作成して,そこにインストールするようだ.こうした環境で[[RMeCab]]を利用する場合, MeCab 付属の libmecab.dll は,こちらのフォルダにコピーしてやらなければならない.そこで,Rのライブラリがユーザーのホームディレクトリに作成された場合を想定して,専用の環境設定ファイル&ref(SoftArchive/RMeCabInstallXP.bat); と&ref(SoftArchive/RMeCabInstallVista.bat); を作成した。 もっとも %USERPROFILE% という環境変数を利用していているだけだが. -- 珍しく来客. - 午後.麺2 -- [[RMeCab]] ページの調整 -- 珍しく来客.教務関係で,学生と教務委員長を交えて相談 - 定時帰宅、定時就寝 * 2008年 8 月 1 日 (金) [#xcfc9a85] - 06:00 起床 -- 07:30 研究室着, - 午前 -- DELL Vista の Illustrator C3 を再インストール. --- Windows は,全くやっかいなOSだな.かといってMacintoshも困るが... Illustratorを前回インストールし,認証完了後,気がつくと,C3 の実行ファイルがハードディスクから消えていた.googleっても,まるで情報無し.しようがないのでサポートへ電話すると,向こうも初めてのケースだと絶句していたが,割合親切な対応で,とりあえずハードディスクからIllustrator の情報を完全消去し,その上で再インストールをしてみるよう勧められた.[[レジストリをいじるスクリプトをダウンロードする:http://support.adobe.co.jp/faq/faq/qadoc.sv?231362+002]].ところが,こいつが [[Windows Installer Clean Up:http://support.microsoft.com/kb/290301/ja]]をインストールしていないと実行できない.ダウンロードし,こいつを実行しようとすると,今度は Script: C:\Users\CS\AppData\Local\Temp\IXP000.TMP\StartMsi.vbs Line: 17 Char: 1 Error: Permission denied Code: 800A0046 Source: Microsoft VBScript runtime error とエラー.右クリックで実行.Adobe Reader ごと消す. で,Illustrator C3 を再インストール. -- R で作成した eps は Illustrator C3 で Helvetica が無いとかいって,読み込めない.仕方ないので,pdfにする. pdf(file = "hoge.pdf", family = "Japan1") - 午後.来客と弁当 -- M出版用の画像作成.すべてpdfで作成し,Illustratorで確認. -- 16:30--18:30ゼミ -- 帰宅後,定時より遅れて就寝