MeCabをインストールする on Debian lenny
使ってみたくなったので、開発機のDebian(lenny)にMeCabをインストールした。
MeCabのデフォルトはeuc-jpなので、
***-utf8をインストールするのがポイント。
TODO:
- perlの環境を整える
- 辞書のカスタマイズ方法などを調査する
- Twitterの投稿をクロールしてコンテンツ解析する
- Google IMEの辞書とMeCabを融合できるか調査
$ sudo aptitude install mecab mecab-ipadic-utf8 mecab-jumandic-utf8 mecab-utils libmecab1UTF8な環境で使いたい人は、
MeCabのデフォルトはeuc-jpなので、
***-utf8をインストールするのがポイント。
satoshi@debian:~$ mecabPerfect!
すもももももももものうち
すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも 名詞,一般,*,*,*,*,もも,モモ,モモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも 名詞,一般,*,*,*,*,もも,モモ,モモ
の 助詞,連体化,*,*,*,*,の,ノ,ノ
うち 名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
EOS
TODO:
- perlの環境を整える
- 辞書のカスタマイズ方法などを調査する
- Twitterの投稿をクロールしてコンテンツ解析する
- Google IMEの辞書とMeCabを融合できるか調査