BloGroonga

2016-05-31

「MySQLとPostgreSQLと日本語全文検索2」開催のお知らせ #mypgft

2016年2月9日(年に一度の肉の日)にMySQLとPostgreSQLと日本語全文検索というイベントを開催しました。MySQL・PostgreSQLで日本語全文検索を実現するための情報を提供するイベントです。「勉強会に行ってみた!」第23回「MySQLとPostgreSQLと日本語全文検索」 | Geekroid(仮)としてイベントレポートが記事になっているので参考にしてください。イベントページに資料へのリンクがあるので内容に興味がある人はイベントページも参照してください。

このイベントが好評だったため第2弾を開催することになりました。前回からちょうど4ヶ月後の2016年6月9日開催です。

会場は今回もDMM.comラボさんに提供してもらえることになりました。ありがとうございます!

今回もMySQL InnoDBの全文検索・pg_bigmMroongaPGroongaの紹介があります。どれもそれぞれのプロダクトに関わっている人が紹介します。

前回は「日本語全文検索に興味はあるけど触ったことはない人」を対象者としていましたが、今回は「少しでも触ったことがある人」(インストールしてチュートリアルをやってみたくらいでOK)を対象者としています。紹介内容も触ったことある人向けで用意します。触っておくと理解が進むはずなので、参加する人はどのプロダクトでもよいので一度触ってみてください。触ってみるための情報は前述のイベントページに書いているので参考にしてください。

今回も事例紹介があります。前回は会場を提供してくれたDMM.comラボさんからDMM.comラボでの日本語全文検索の利用事例紹介としてMroongaの利用事例の紹介がありました。今回はVVAULT AUDITというサーバーログ管理ソフトウェアでのPGroongaの利用事例の紹介があります。WindowsでPGroongaを使っている事例なので興味のある方はぜひご参加ください。

このイベントでは参加者の質問に答えるコーナーがあります。イベント登録時に質問を入力しておくと、イベント内で登壇者が回答します。現時点では次のような質問があがっています。MySQL・PostgreSQLで日本語全文検索をするにあたり気になることがある方はイベントページから登録するときに質問を入力してください。

  • インデックスの差分更新について
  • MariaDBの欠点について、他のデータベースとの比較を交えて伺いたいと思います。
  • 運用上考慮する必要がある点があれば。
  • 全文検索が得意なこと、苦手なこと。
  • MariaDB10系以降でMroonga storage modeの使い方を知りたいです
  • インデックス生成のコストについて
  • MySQLやPostgreSQLなどとLuceneなどを使った全文検索エンジンをどのように使い分けているか。どのようなことを考慮して使い分けているのか
  • SolrやElasticsearchのようなガチの環境ではなくRDBでカバーしているもので大規模なものだとどの程度のデータ規模まで実用に耐えるものなのでしょうか。チューニングやスキーマ、中に入っているデータのパターンにもよるかとは思いますが、どのくらいの目処で専用エンジンに載せ替えていくのがいいのかという判断材料があると助かります。
  • MySQL/PostgrerSQLとも、形態素解析エンジンとして、Mecabを使っているが、Mecabの開発が終わっていそうなのが気になる。他の日本語形態素解析エンジンに切り替える予定等あるのか。
  • 最近PostgreSQLをよく使うのでPGroongaを使う事でどの位の差が出るのか確認出来ればと思います。

2016年6月9日(来週の木曜日)開催のMySQLとPostgreSQLと日本語全文検索2では、MySQL・PostgreSQLで日本語全文検索を実現したいみなさんの参加をお待ちしています。