■mysql5.1.xで実現する日本語全文検索3種
 現在CentOSを利用している頻度が高いこともあって、mysqlの日本語全文検索にはmysql5.0系のTritonnプロジェクト版を利用することが多い。いずれmysql5.1系で日本語全文検索に対応しないといけないケースが出ると思うので、実現方法のメモ。

1) N-Gram (bi-gram) 全文検索プラグイン
 http://sites.google.com/site/mysqlbigram/home-j

2) MySQL full-text parser plugin collection
 http://sourceforge.net/apps/mediawiki/mysqlftppc/index.php?title=Home-j

3) groongaストレージエンジン
 http://www.mysql.gr.jp/mysqlml/mysql/msg/15373

たぶん1から順番に難易度が高くなる?
Tritonnプロジェクトの後継で高度な検索も実現できるgroongaストレージエンジンが、パフォーマンスや長期運用の観点からは面白そう。index作成更新が高速であり、MyISAMのテーブルロックする仕様をカバーできるという点でも、高頻度で書き込みやindex更新のあるSNS系プログラムでは、パフォーマンスの向上が期待できる。

8/18時点ではテストリリースということなので、安定するまでもうしばらく時間がかかりそうだが、継続してwatchすることにする。差し当たってUbuntu 10.04 LTS Serverで実験してみたいところ。

,
とりあえず付けておく無駄ではなかったなまぁまぁ読めたちょっと役に立ったかなかなり良かったかも (まだ評価されていません)
Loading...
Trackback

only 1 comment untill now

  1. Linux/CGP作業メモ » mysql5.1.xで実現する日本語全文検索3種: いずれmysql5.1系で日本語全文検索に対応しないといけないケースが出ると思うので、実現方法のメモ。 1) N-Gram (bi-gram) … http://bit.ly/dgI8wJ