MeCabをインストールする on Debian lenny

使ってみたくなったので、開発機のDebian(lenny)にMeCabをインストールした。
$ sudo aptitude install mecab mecab-ipadic-utf8 mecab-jumandic-utf8 mecab-utils libmecab1
UTF8な環境で使いたい人は、
MeCabのデフォルトはeuc-jpなので、
***-utf8をインストールするのがポイント。
satoshi@debian:~$ mecab
すもももももももものうち
すもも  名詞,一般,*,*,*,*,すもも,スモモ,スモモ
も      助詞,係助詞,*,*,*,*,も,モ,モ
もも    名詞,一般,*,*,*,*,もも,モモ,モモ
も      助詞,係助詞,*,*,*,*,も,モ,モ
もも    名詞,一般,*,*,*,*,もも,モモ,モモ
の      助詞,連体化,*,*,*,*,の,ノ,ノ
うち    名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
EOS
Perfect!

TODO:
- perlの環境を整える
- 辞書のカスタマイズ方法などを調査する
- Twitterの投稿をクロールしてコンテンツ解析する
- Google IMEの辞書とMeCabを融合できるか調査

人気の投稿