形態素解析エンジンmecabをjavaから使う @ Ubuntu 10.0.4

形態素解析エンジンMeCabをjavaから使ってみた。

libmecab-javaは、swigによるmecabのjava binding。
辞書はIPA。
詳しくは、 以下を参照。
http://mecab.sourceforge.net/bindings.html

動作確認のコードとコマンドは以下の通り
  $ sudo aptitude install
  $ cat TestMecab.java 
  import org.chasen.mecab.MeCab;
  import org.chasen.mecab.Tagger;
  import org.chasen.mecab.Node;
  
  public class TestMecab {
      static {
          try {
              System.loadLibrary("MeCab");
          } catch (UnsatisfiedLinkError e) {
              System.err.println("Cannot load the example native code.\nMake sure your LD_LIBRARY_PATH contains \'.\'\n" + e);
              System.exit(1);
          }
      }
     
      public static void main(String[] argv) {
          System.out.println(MeCab.VERSION);
          Tagger tagger = new Tagger();
          String str = "太郎は二郎にこの本を渡した。";
          System.out.println(tagger.parse(str));
          Node node = tagger.parseToNode(str);
          for (;node != null; node = node.getNext()) {
              System.out.println(node.getSurface() + "\t" + node.getFeature());
          }
          //System.out.println ("EOS\n");
      }
  }
  $ javac -cp /usr/share/java/MeCab.jar   TestMecab.java
  $ java  -cp /usr/share/java/MeCab.jar:. TestMecab
  0.98
  太郎    名詞,固有名詞,人名,名,*,*,太郎,タロウ,タロー
  は      助詞,係助詞,*,*,*,*,は,ハ,ワ
  二郎    名詞,固有名詞,人名,名,*,*,二郎,ジロウ,ジロー
  に      助詞,格助詞,一般,*,*,*,に,ニ,ニ
  この    連体詞,*,*,*,*,*,この,コノ,コノ
  本      名詞,一般,*,*,*,*,本,ホン,ホン
  を      助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
  渡し    動詞,自立,*,*,五段・サ行,連用形,渡す,ワタシ,ワタシ
  た      助動詞,*,*,*,特殊・タ,基本形,た,タ,タ
  。      記号,句点,*,*,*,*,。,。,。
  EOS
  
          BOS/EOS,*,*,*,*,*,*,*,*


これで動作確認OK。

人気の投稿