CassandraとHadoop Hbaseなどの性能比較

Cassandra versus HBase performance study の結果が興味深かったので、メモ。 Yahoo.incの社員が、以下のcloud serviceについて ベンチマークをとったようです。
  • cassandra 0.4 and 0.5
  • MySQL
  • Hbase
  • Sherpa
結果については、PDFの通りだけど、 個人的な感想を書いちゃうと以下の通り
  • cassandraはリアルタイム処理系としてはいけてるんじゃないか
    • バージョンが上がることで性能がかなり上がっているので将来性がありそう
  • MySQLベースのものはスケールしにくい?
    • 現状の話、今後改善されるのかも
  • Hbaseはリアルタイム系処理を想定されて作られているのか?
    • cassandraとHbaseを同じ土俵で比べない方がいい気がする
自分が言うリアルタイム系処理、とは、 多くのユーザに同時にアクセスされ、そのリクエストに対する応答を リアルタイムで返さなければいけない、という処理を指している。 Hbaseはリアルタイム系処理というよりも、 非同期処理向きなのかな、と思う。設計理念的に。 何にせよ、興味深い資料だった。