hadoop の examples を動かしてみる @ debian lenny

開発機のDebian lennyにhadoopのセットアップが完了したので、
動作確認をしてみる。動作確認は、
http://oss.infoscience.co.jp/hadoop/common/docs/current/quickstart.html
を参考にやってみた。

準備としては、適当にテキストファイルを用意するだけ。
動作確認のログは以下の通り。
$ mkdir -p hadoop_examples/input
$ cd hadoop_examples/
$ cat input/sample.txt
aaabaaa
bbb
ccc
aaa
bbb
ccc
111
222
333
aaa
dddaaa
$ /usr/bin/hadoop jar /usr/lib/hadoop/hadoop-0.18.3-6cloudera0.3.0-examples.jar grep input output 'aaa'
(略)
$ cat output/part-00000
5       aaa
たしかに、'aaa'という文字列は、5回登場している。
正規表現での指定も可能みたいなので、やってみた。
$ hadoop jar /usr/lib/hadoop/hadoop-0.18.3-6cloudera0.3.0-examples.jar grep input output '[a-z]{4,}'
$ cat output/part-00000
1       aaabaaa
1       dddaaa
というわけで、なんとなく動いていることが確認できました。