トップ
新規
一覧
単語検索
最終更新
ヘルプ
ログイン
アールメカブ
hidden_iPhoneクロスコンパイル
をテンプレートにして作成
開始行:
[[Programming]]
iPhone/iPod にはmecabが入っているらしいのだが,これ (libm...
>
JBスレで聞いた後このスレみつけてマルチになちゃって申し訳...
MeCabとMeCab辞書をクロスコンパイルしたくて
HOWTO Build The iPhone Toolchain on OS X 10.5.* (Leopard)
http://iphone-dev.googlecode.com/issues/attachment?aid=-3...
これ見てtoolchainのインストールは成功したと思うんですが、...
の実践が全然分からなくて手も足も出ないです。
http://mecab.sourceforge.net/
これクロスコンパイルできた方是非実践方法教えてください。
<
>
CC=arm-apple-darwin-gcc ./configureして、
出来たMakefileは大抵ネイティブのbintoolが使われるように
なっちゃっているのでそれを修正、makeという感じ。
でもmecabの辞書ってプラットフォーム関係ないんじゃないの?
辞書が目的ならmecabをクロスコンパイルする意味は無いと思う...
ネイティブでmecabをコンパイルして、
Mac上でipadicをビルドすればよいと思う。
昔kakasiをiPod touchで動かした経験からすると、
実機でmecabを動かすとメモリ足りなくて再起動かかると思うよ。
mecabのinstall-shに実行権が付いてなかったので注意してくだ...
<
[[ここ:http://unkar.jp/read/pc11.2ch.net/iPhone/122195866...
>
iPhoneのsys.dicとWin上で生成したMeCabのsys.dicを比較して...
辞書構造が違う気がする(文字コード以外に)
MeCabの辞書はMeCabのHPにも書かれているとおり
単語検索にDoubleArrayを使ってるけど
iPhoneのほうはHashTableぽい
あとWinのMeCabでは"-t UTF-16LE"と指定するだけだと通らなか...
Linux(Mac)環境かソースいじらないとだめなのかも
さらにMeCabに付属のIPA辞書のCSVは解析表示用に品詞などが入...
それをiPhone用に書き直す必要がありそう
iPhone用のフォーマットはたぶん
"よみ",左文脈ID,右文脈ID,単語コスト,"漢字"
になるのかな
つまり
1.DoubleArray以外の検索アルゴリズムを指定
2.文字コードをUTF-16に指定
3.辞書csvをiPhoneに適した形に整形
ができればOK
・・・自分でやる気はない
<
>
sys.dicについてちょっと色々調べてみた。
GentooLinux上でmecab,mecab-ipadicをコンパイルして、mecab-...
$ ../mecab-0.97/src/mecab-dict-index -o ../ipadict_test -...
でsys.dic, char.bin, matrix.bin, unk.dicを生成。これをiPh...
とりあえずmecabで生成したものをチェック
$ mecab -d ./ipadict_test -D
filename: ./ipadict_test/sys.dic
version: 102
charset: UTF-16LE
type: 0
size: 392126
left size: 1316
right size: 1316
同様にiPhoneのをチェックしてみる
$ mecab -d ./TextInput_ja.bundle -D
tagger.cpp(149) [tokenizer_.open(*param)] tokenizer.cpp(1...
どうやらunk.dicにDEFAULTってのが必要らしいんだが、それが...
$ mecab -d ./TextInput_ja.bundle -D
filename: ./TextInput_ja.bundle/sys.dic
version: 102
charset: UTF-16LE
type: 0
size: 310682
left size: 1695
right size: 1695
読めた!!
使ってみた。
$ mecab -d ./ipadict_test
iPhoneが大好きです。
iPhone 名詞,固有名詞,組織,*,*,*,*
が 助詞,格助詞,一般,*,*,*,が,ガ,ガ
大好き 名詞,形容動詞語幹,*,*,*,*,大好き,ダイスキ,ダイスキ
です 助動詞,*,*,*,特殊・デス,基本形,です,デス,デス
。 記号,句点,*,*,*,*,。,。,。
EOS
^C
$ mecab -d ./TextInput_ja.bundle
iPhoneが大好きです。
iPhone 名詞,一般,*,*,*,*,*
が 名詞,一般,*,*,*,*,*
大好 記号,一般,*,*,*,*,*
きです 名詞,一般,*,*,*,*,*
。 名詞,サ変接続,*,*,*,*,*
EOS
^C
結果は違うものの何となく、dicrcとかで形式をうまく指定すれ...
誰か続きよろ。
<
終了行:
[[Programming]]
iPhone/iPod にはmecabが入っているらしいのだが,これ (libm...
>
JBスレで聞いた後このスレみつけてマルチになちゃって申し訳...
MeCabとMeCab辞書をクロスコンパイルしたくて
HOWTO Build The iPhone Toolchain on OS X 10.5.* (Leopard)
http://iphone-dev.googlecode.com/issues/attachment?aid=-3...
これ見てtoolchainのインストールは成功したと思うんですが、...
の実践が全然分からなくて手も足も出ないです。
http://mecab.sourceforge.net/
これクロスコンパイルできた方是非実践方法教えてください。
<
>
CC=arm-apple-darwin-gcc ./configureして、
出来たMakefileは大抵ネイティブのbintoolが使われるように
なっちゃっているのでそれを修正、makeという感じ。
でもmecabの辞書ってプラットフォーム関係ないんじゃないの?
辞書が目的ならmecabをクロスコンパイルする意味は無いと思う...
ネイティブでmecabをコンパイルして、
Mac上でipadicをビルドすればよいと思う。
昔kakasiをiPod touchで動かした経験からすると、
実機でmecabを動かすとメモリ足りなくて再起動かかると思うよ。
mecabのinstall-shに実行権が付いてなかったので注意してくだ...
<
[[ここ:http://unkar.jp/read/pc11.2ch.net/iPhone/122195866...
>
iPhoneのsys.dicとWin上で生成したMeCabのsys.dicを比較して...
辞書構造が違う気がする(文字コード以外に)
MeCabの辞書はMeCabのHPにも書かれているとおり
単語検索にDoubleArrayを使ってるけど
iPhoneのほうはHashTableぽい
あとWinのMeCabでは"-t UTF-16LE"と指定するだけだと通らなか...
Linux(Mac)環境かソースいじらないとだめなのかも
さらにMeCabに付属のIPA辞書のCSVは解析表示用に品詞などが入...
それをiPhone用に書き直す必要がありそう
iPhone用のフォーマットはたぶん
"よみ",左文脈ID,右文脈ID,単語コスト,"漢字"
になるのかな
つまり
1.DoubleArray以外の検索アルゴリズムを指定
2.文字コードをUTF-16に指定
3.辞書csvをiPhoneに適した形に整形
ができればOK
・・・自分でやる気はない
<
>
sys.dicについてちょっと色々調べてみた。
GentooLinux上でmecab,mecab-ipadicをコンパイルして、mecab-...
$ ../mecab-0.97/src/mecab-dict-index -o ../ipadict_test -...
でsys.dic, char.bin, matrix.bin, unk.dicを生成。これをiPh...
とりあえずmecabで生成したものをチェック
$ mecab -d ./ipadict_test -D
filename: ./ipadict_test/sys.dic
version: 102
charset: UTF-16LE
type: 0
size: 392126
left size: 1316
right size: 1316
同様にiPhoneのをチェックしてみる
$ mecab -d ./TextInput_ja.bundle -D
tagger.cpp(149) [tokenizer_.open(*param)] tokenizer.cpp(1...
どうやらunk.dicにDEFAULTってのが必要らしいんだが、それが...
$ mecab -d ./TextInput_ja.bundle -D
filename: ./TextInput_ja.bundle/sys.dic
version: 102
charset: UTF-16LE
type: 0
size: 310682
left size: 1695
right size: 1695
読めた!!
使ってみた。
$ mecab -d ./ipadict_test
iPhoneが大好きです。
iPhone 名詞,固有名詞,組織,*,*,*,*
が 助詞,格助詞,一般,*,*,*,が,ガ,ガ
大好き 名詞,形容動詞語幹,*,*,*,*,大好き,ダイスキ,ダイスキ
です 助動詞,*,*,*,特殊・デス,基本形,です,デス,デス
。 記号,句点,*,*,*,*,。,。,。
EOS
^C
$ mecab -d ./TextInput_ja.bundle
iPhoneが大好きです。
iPhone 名詞,一般,*,*,*,*,*
が 名詞,一般,*,*,*,*,*
大好 記号,一般,*,*,*,*,*
きです 名詞,一般,*,*,*,*,*
。 名詞,サ変接続,*,*,*,*,*
EOS
^C
結果は違うものの何となく、dicrcとかで形式をうまく指定すれ...
誰か続きよろ。
<
ページ名: