8月
30
■mysql5.1.xで実現する日本語全文検索3種
現在CentOSを利用している頻度が高いこともあって、mysqlの日本語全文検索にはmysql5.0系のTritonnプロジェクト版を利用することが多い。いずれmysql5.1系で日本語全文検索に対応しないといけないケースが出ると思うので、実現方法のメモ。
1) N-Gram (bi-gram) 全文検索プラグイン
http://sites.google.com/site/mysqlbigram/home-j
2) MySQL full-text parser plugin collection
http://sourceforge.net/apps/mediawiki/mysqlftppc/index.php?title=Home-j
3) groongaストレージエンジン
http://www.mysql.gr.jp/mysqlml/mysql/msg/15373
たぶん1から順番に難易度が高くなる?
Tritonnプロジェクトの後継で高度な検索も実現できるgroongaストレージエンジンが、パフォーマンスや長期運用の観点からは面白そう。index作成更新が高速であり、MyISAMのテーブルロックする仕様をカバーできるという点でも、高頻度で書き込みやindex更新のあるSNS系プログラムでは、パフォーマンスの向上が期待できる。
8/18時点ではテストリリースということなので、安定するまでもうしばらく時間がかかりそうだが、継続してwatchすることにする。差し当たってUbuntu 10.04 LTS Serverで実験してみたいところ。