13. Groongaの起源以前について#

竹中直純(未来検索ブラジル創業者、現代表取締役)

2024年12月

13.1. インターネット界隈の状況#

2003年、インターネット検索におけるGoogleの覇権が確立した頃、日本でもYahoo! Japanなど多くの大手サービスがGoogleの検索エンジンを採用する動きがありました。その中でNTTが提供していたgooが自社製検索エンジンおよびクローラーシステムを捨てるビジネス上の決断をしたことにGroongaの開発は端を発します。

検索エンジンはインターネットの出現後、爆発的に増えるコンテンツからユーザーが必要とする情報を適切に見つけるために絶対に欠かせない技術であり、インターネットユーザーの行動を握るだけでなく、変える可能性のある技術だということは技術者だけでなく、インターネットを文化として捉える多くのユーザーの目にも明らかでした。

ソフトウェア技術から見た検索エンジンはトークナイズやツリー構築、インデクス方法、それぞれの高速化、多言語対応など重要な要素技術の塊であり、生半可な努力でできるものではありません。クローラー技術についても同様です。特に日本語については前述トークナイザ、語尾表現の揺れ、異種文字の混在、異体字の存在など、西欧語に存在しない数々の課題があり、パソコン時代から綿々と引き継がれてきた細かいノウハウの上に成立するのが検索エンジン技術です。このような技術的蓄積をあっさり捨てて、「外国製」のエンジンに乗り換えるという経営判断を見て、日本語圏に居る技術者として、とても切迫した危機感を(筆者は)覚えました。単なる商材としてソフトウェアが扱われ、文化的側面や価値が顧みられることがないことの証左として「Googleでいいじゃん」という決定がされることが2003年時点でのインターネットビジネスの国内事情だったのです。

13.2. ブラジル社の誕生とSenna#

そこで、この状況になんとか一矢報いることができないだろうかと考えて作られたのが有限会社未来検索ブラジル(以下ブラジル社)でした。当時は株式会社設立のための資本金は1000万円以上という法的縛りがあったので300万円の資本で作ることができる有限会社が選ばれました。また、設立者のひとりである西村博之氏は当時2ちゃんねるの管理人であり、開発者でもありましたが、全掲示板を横断的に検索するサービスを提供できておらず、部分的なコンテンツが制限付で検索できるようなボランティアサービスが点々といくつか存在する状況を改善したいという欲求があり、それはまさにgooで要らなくなりつつあったNTTの検索エンジン技術を2ちゃんねるで活用するという好機でもありました。

ブラジル社の設立から二年ほどはNTTのライセンスを受けて検索エンジンソフトウェア(eva)を使用し、2ちゃんねる検索サービスを構築していたものの、その間、全く新規のオリジナル検索エンジンを構想し開発していました。また、そのソフトウェアはオープンであるべきだという考えもこの時期に確立し、現在まで続いています。その新規エンジンの名前はSennaといいます。ブラジル社の"ブラジル"と高速さをアピールするためにつけた名前でした。「せんな」と発音する方がたくさんいましたが、そういう経緯で生まれたエンジンなので「せな」が正しい発音です。

その頃、2005年あたりは日本社会ではライブドア社が繁栄のピーク時期を迎えていて、その代表である堀江貴文氏はGoogleに対抗できる検索サービスを構築したいと公言していました。ブラジル社としては千載一遇の機会だと思い、オリジナル検索エンジンであるSennaを拡張し、分散サーバー対応などを行い、少なくとも検索精度とスピードでは当時のGoogleに負けない大規模な検索サービスを構築する計画を立て、堀江氏と協議を重ねました。この計画は、いわゆるライブドア事件によって頓挫したわけですが、実施されていたらインターネットの歴史が少し変わったのではないかと考えます。

13.3. そしてGroongaへ#

また、Sennaが稼働し始めてまもなく、ソフトウェア技術者間でよく言われる「同一要素技術のソフトウェアはとにかく三回書く」を地で行く活動がブラジル社創業者の一人である森大二郎氏によって行われ、三度目の正直としてGroongaの開発が始まることになります。この間、ブラジル社は一貫して純国産検索エンジン技術を未来に繋ぐ明確なビジョンを基に開発活動を続けました。

Groongaの名前について森氏から正史をもらえましたので記しておきます。

福岡の誇るプログレバンド「たけのうちカルテット」の安達ひでや氏から、ブルーノートスケールの起源をたどると東アフリカのグルンガ村に行き着くと聞いたことが強く印象に残っていたため、それにあやかってGroongaと命名しました。

Sennaとは全く異なる命名の考え方で、それならその時に社名を「未来検索アフリカ」に変えてもよかったのかもしれません。

その後、さらに単にオープンソースであるだけでなく開発をコミュニティに委ねる開発スタイルをとることで、デバッグ、機能拡張、ドキュメントの拡充など、ブラジル社内リソースの制限がない多面的、発展的な活動が可能になると考えクリアコード社をはじめとする各開発者とのリンクを強めていくことになります。

続きはコントリビューターの方々によって書き継がれることを期待してこの項を終えます。