BloGroonga

2015-03-20

Groonga "Tokenizer" Talksを開催

2015-03-20(金)19:30より「トークナイザー」にテーマを絞ったGroongaイベントGroonga "Tokenizer" Talksを開催しました。会場提供はGMOメディアさんです。ありがとうございました!

N-gramベースの話は、Groonga(Mroonga)を使った特許検索サイトPatentFieldを開発・運営している@naoa_yさんにしてもらいました。タイトルは「Groongaの可変型Ngramトークナイザーについて」で、Groongaの全文検索の流れとN-gramベースのトークナイザーでの高速化の方法を1つ(オーバーラップしたトークンでの検索を省略する方法)を紹介してくれました。

形態素解析ベースの話は、ジャストシステムで自然言語処理周りの開発にも関わっている内田さんが拡張型NLP JMAT(ジェイマット)の機能について紹介してくれました。(資料は後日公開してもらえる予定なので、資料が公開されたらここにリンクを張ります。)発表資料は「JMAT -ジャストシステムの日本語解析エンジンのご紹介-」です。

イベントはUstreamの配信を予定していたのですが、機材トラブルにより配信できませんでした。すみません。。。内容は発表資料やTwitterで#groongaで検索した結果(だれかがToggeterにまとめてくれたらリンクを張り替えます)を参考にしてください。

イベントでは発表資料にあることだけでなく、関連する話題に関する質疑応答やGroonga内部の作りについての質疑応答もありました。参加者の方はトークナイザーやGroongaに関する理解を深めることができたのではないでしょうか。

@naoa_yさんの高速化の方法は時間内では1つしか紹介できなかったので、Groonga "Tokenizer" Talks 2として第2回目の開催を検討しています。第2回目が開催されることになったらここでアナウンスするので、興味がある方は参加してみてください。