形態素解析エンジンmecabをjavaから使う @ Ubuntu 10.0.4
形態素解析エンジンMeCabをjavaから使ってみた。
libmecab-javaは、swigによるmecabのjava binding。
辞書はIPA。
詳しくは、 以下を参照。
http://mecab.sourceforge.net/bindings.html
動作確認のコードとコマンドは以下の通り
これで動作確認OK。
libmecab-javaは、swigによるmecabのjava binding。
辞書はIPA。
詳しくは、 以下を参照。
http://mecab.sourceforge.net/bindings.html
動作確認のコードとコマンドは以下の通り
$ sudo aptitude install
$ cat TestMecab.java
import org.chasen.mecab.MeCab;
import org.chasen.mecab.Tagger;
import org.chasen.mecab.Node;
public class TestMecab {
static {
try {
System.loadLibrary("MeCab");
} catch (UnsatisfiedLinkError e) {
System.err.println("Cannot load the example native code.\nMake sure your LD_LIBRARY_PATH contains \'.\'\n" + e);
System.exit(1);
}
}
public static void main(String[] argv) {
System.out.println(MeCab.VERSION);
Tagger tagger = new Tagger();
String str = "太郎は二郎にこの本を渡した。";
System.out.println(tagger.parse(str));
Node node = tagger.parseToNode(str);
for (;node != null; node = node.getNext()) {
System.out.println(node.getSurface() + "\t" + node.getFeature());
}
//System.out.println ("EOS\n");
}
}
$ javac -cp /usr/share/java/MeCab.jar TestMecab.java
$ java -cp /usr/share/java/MeCab.jar:. TestMecab
0.98
太郎 名詞,固有名詞,人名,名,*,*,太郎,タロウ,タロー
は 助詞,係助詞,*,*,*,*,は,ハ,ワ
二郎 名詞,固有名詞,人名,名,*,*,二郎,ジロウ,ジロー
に 助詞,格助詞,一般,*,*,*,に,ニ,ニ
この 連体詞,*,*,*,*,*,この,コノ,コノ
本 名詞,一般,*,*,*,*,本,ホン,ホン
を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
渡し 動詞,自立,*,*,五段・サ行,連用形,渡す,ワタシ,ワタシ
た 助動詞,*,*,*,特殊・タ,基本形,た,タ,タ
。 記号,句点,*,*,*,*,。,。,。
EOS
BOS/EOS,*,*,*,*,*,*,*,*
これで動作確認OK。