日録2010年12月 のバックアップ(No.20) - アールメカブ

アールメカブ


日録2010年12月 のバックアップ(No.20)


過去の日録

_ 2010 年 12 月 19 日 (日) 晴

  • 06:00 起床
  • 07:30 研究室

_ 2010 年 12 月 18 日 (土) 晴

  • 07:00 起床
  • 08:50 研究室
  • 午前
    • C&R 社の仕事を進める
    • RMeCab _0.93を用意した

_ 2010 年 12 月 17 日 (金) 晴

  • 04:30 起床
  • 06:00 研究室

_ 2010 年 12 月 16 日 (木) 晴

  • 04:30 起床
  • 06:00 研究室

_ 2010 年 12 月 15 日 (水) 晴

  • 04:30 起床
  • 05:40 研究室

_ 2010 年 12 月 14 日 (火) 雨/晴

  • 03:50 起床
  • 05:20 研究室

_ 2010 年 12 月 13 日 (月) 雨

  • 06:30 起床
  • 07:50 研究室

_ 2010 年 12 月 12 日 (日) 晴

  • 06:30 起床
  • 07:50 研究室

_ 2010 年 12 月 11 日 (土) 晴

  • 06:30 起床
  • 07:50 研究室
  • の翻訳作業
  • の下訳が完了した.

_ 2010 年 12 月 10 日 (金) 晴

  • 05:00 起床
  • 06:20 研究室
  • 午前
    • の翻訳作業
    • RColorBrewer って の Neuwirth が作者だったのか

_ 2010 年 12 月 09 日 (木) 晴

  • 05:00 起床
  • 06:20 研究室
  • 午前
    • の翻訳作業
  • 午後
    • 12:50-14:25 演習
    • 15:00-18:30 会議
      • 長すぎる...
    • 充電

_ 2010 年 12 月 08 日 (水) 晴

  • 04:50 起床
  • 06:30 研究室
  • 午前
    • 08:40-10:10 演習
  • 午後
    • 14:35-16:00 講義

_ 2010 年 12 月 07 日 (火) 雨・曇

  • 04:50 起床
  • 06:30 研究室
  • 午前
    • 自宅のノートパソコンのUbuntuを再構築したのだが,その際,RMeCab の返値がおかしかったので,R-2.12.0 対策が足りていないのか,と考え,研究室の Ubuntu で試したところ,何の異常もない. そこで気が付いた.昨日,MeCab? を導入する際に,コンパイルオプションでの文字コード指定を忘れていたのであった,
$ ./configure --with-charset=utf8
  • 午後
    • の翻訳作業を進めているのだが,こんな一節がある.

There are two built-in themes. The default, \f{theme_gray}, uses a very light grey background with white gridlines. ... We can still see the gridlines to aid in the judgement of position ..., but they have little visual impact and we can easily ``tune'' them out. The grey background gives the plot a similar colour (in a typographical sense) to the remainder of the text, ensuring that the graphics fit in with the flow of a text without jumping out with a bright white background. Finally, the grey background creates a continuous field of colour which ensures that the plot is perceived as a single visual entity.

plot.jpg

実は,ggplot2 のこのグラフも,最初はなじめないテーマ設定だなぁ,と感じていたが,慣れてきた今では,上の説明もなるほどと思う.

_ 2010 年 12 月 06 日 (月) 晴

  • 07:50 起床
  • 09:00 研究室
  • 午前
    • の翻訳作業
  • 午後

_ 2010 年 12 月 05 日 (日) 晴

  • 自宅で の翻訳作業

_ 2010 年 12 月 04 日 (土) 晴

  • 06:10 起床
  • 07:30 研究室
  • 午後
    • の翻訳作業

_ 2010 年 12 月 03 日 (金) 晴

  • 06:10 起床
  • 風が強い
  • 07:30 研究室
  • 午前
    • の翻訳作業
    • C&R社向け原稿
  • 午後.来客と食事
    • ヤマダ電機で Pocket Wifi を検討
    • の翻訳作業

_ 2010 年 12 月 02 日 (木) 晴

  • 06:10 起床
  • 07:30 研究室
  • 午前
    • の翻訳作業
  • 午後
    • 12:50-14:25 演習
    • の翻訳作業
    • 16:30 会議

_ 2010 年 12 月 01 日 (水) 晴

  • 06:10 起床
  • 07:30 研究室
  • 午前
    • 08:40-10:10 演習
    • Rでグラフを作成する際,色覚に問題がある人にも優しい色を選ぶにはdichromatパッケージ を使います.
  • 午後
    • 14:35-16:05
    • の翻訳作業
    • RMeCabのdocMatrix2の出力を頻度順に並び替えるコードを泥縄で書いたが,もう少し,ましな方法があるわな
res2 <- docMatrix2("writers", pos = c("名詞","形容詞"),  minFreq = 5)

# 各行(ターム)の頻度合計を列に追加したデータフレームを作成する
#  あるいはオブジェクトを上書きしてしまう.
# ついでに降順に並び替える

z <- data.frame(term = rownames(res2)[ order(rowSums(res2), decreasing= T ) ] ,
                   sums = rowSums(res2)[order(rowSums(res2), decreasing  = T )] )
# 頻度別の単語数は
table(z$sums)
# 頻度が100を超えるタームを抽出
z[z$sums > 100,]
# Termが"の"の行を確認
res[rownames(res)  == "の", ]
Bootrec /FixMbr

で復活させた.