[groonga-dev,03414] Re: 日付データと、highlight_htmlのことについて押してください。

Zurück zum Archiv-Index

Kouhei Sutou kou****@clear*****
2015年 8月 16日 (日) 12:06:16 JST


須藤です。

In <CA+Tq****@mail*****>
  "[groonga-dev,03413] Re: 日付データと、highlight_htmlのことについて押してください。" on Sat, 15 Aug 2015 01:42:22 +0900,
  Hiroyuki Sato <hiroy****@gmail*****> wrote:

> ちなみに、二つのカラムが同じ型(ex ShortText)である場合
> インデックス用のテーブルを別々にしたほうが良いケースはありますでしょうか?
> 
> 例えば
> 
> http://groonga.org/ja/docs/tutorial/match_columns.html?highlight=複数%20カラム%20インデックス
> こちらのtitle,messageのような場合
> 
> titleはTitleIndexテーブル、messageはMessageIndexとするようなケースです。
> それぞれで異なるトークナイズの方法が違う場合はそれぞれ別にテーブルを作る必要がある
> という理解で良いでしょうか?

はい、トークナイズの方法が違うときはそれぞれ別にテーブルを作
る必要があります。

データの傾向が違うときも別にした方がよいです。
極端な例ですが、韓国語と日本語のデータがある場合は、別にした
方がよいです。一緒にしても共通のトークンがほとんどないからで
す。

共通のトークンがある場合は同じテーブルにするとトークン管理用
の情報を共有できるので、効率がよいです。(ディスク効率もよい
ですし、同じトークンを登録しなくてもよいので更新時の効率もよ
いです。)


-- 
須藤 功平 <kou****@clear*****>
株式会社クリアコード <http://www.clear-code.com/>

Groongaベースの全文検索システムを総合サポート:
  http://groonga.org/ja/support/
パッチ採用 - プログラミングが楽しい人向けの採用プロセス:
  http://www.clear-code.com/recruitment/
コードリーダー育成支援 - 自然とリーダブルコードを書くチームへ:
  http://www.clear-code.com/services/code-reader/




groonga-dev メーリングリストの案内
Zurück zum Archiv-Index