Groonga 14.0.7リリース
Groonga 14.0.7をリリースしました!
それぞれの環境毎のインストール方法: インストール
変更内容
主な変更点は以下の通りです。
改良
-
[NormalizerNFKC] 新しいオプション
unify_latin_alphabet_with
を追加しました。このオプションは、以下のように発音記号付きの文字と発音記号なしの文字を同じ文字とみなすことができます。
ただし、この機能は
LATIN (SMALL|CAPITAL) LETTER X WITH XXX
にのみフォーカスしています。LATIN (SMALL|CAPITAL) LETTER X + COMBINING XXX
はサポートしていません。以下の例で、
ngoan
でngoằn
を取得できることが確認できます。table_create --name Contents --flags TABLE_HASH_KEY --key_type ShortText column_create --table Contents --name content --type ShortText load --table Contents [ {"_key":"1", "content":"con đường ngoằn nghoèo"}, ] table_create \ --name Terms \ --flags TABLE_PAT_KEY \ --key_type ShortText \ --default_tokenizer TokenBigram \ --normalizer 'NormalizerNFKC150("unify_latin_alphabet_with", true)' column_create \ --table Terms \ --name index_content \ --flags COLUMN_INDEX|WITH_POSITION \ --type Contents \ --source content select --table Contents --query content:@ngoan [ [ 0, 0.0, 0.0 ], [ [ [ 1 ], [ [ "_id", "UInt32" ], [ "_key", "ShortText" ], [ "content", "ShortText" ] ], [ 1, "1", "con đường ngoằn nghoèo" ] ] ] ]
注意:
現在のノーマライザーには、以下の問題があります。
小文字の
U+0130 LATIN CAPITAL LETTER I WITH DOT ABOVE
はU+0069 LATIN SMALL LETTER I
でなければなりませんが、現在の実装では、U+0069 LATIN SMALL LETTER I
+U+0307 COMBINING DOT ABOVE
を使ってしまいます。この問題は、NormalizerNFKC160から修正する予定です。
-
simdjson をサポートしました。
現状、RapidJSONのサポートも維持しますが、RapidJSONは今後サポートをやめる予定です。
修正
-
ログローテートが有効な時にクラッシュする問題を修正しました。
この問題は、以下の条件で発生します。
a. 以下のオプションを指定して、ファイルにロギングする時。
--log-path <path>
--query-log-path <path>
b. 以下のオプションを指定して、ログローテートが有効な時。
--log-rotate-threshold-size <threshold>
--query-log-rotate-threshold-size <threshold>
c. 以下のオプションを指定して、プロセスIDの出力が有効な時。
--log-flags process_id
おわりに
毎週火曜日の 12:15 - 12:45 にGroonga関連のイベントをオンラインで実施しています。
各イベントの予定はconnpassのページに記載しています。
(上記のページで参加登録しなくても資料やイベントは閲覧可能です。)
今までのオンラインイベントは、以下の場所に格納されていて、いつでも視聴できます!
興味のある方はぜひ視聴してみてください。 それでは、Groongaでガンガン検索してください!