Kouhei Sutou
kou****@clear*****
2015年 8月 16日 (日) 12:06:16 JST
須藤です。 In <CA+Tq****@mail*****> "[groonga-dev,03413] Re: 日付データと、highlight_htmlのことについて押してください。" on Sat, 15 Aug 2015 01:42:22 +0900, Hiroyuki Sato <hiroy****@gmail*****> wrote: > ちなみに、二つのカラムが同じ型(ex ShortText)である場合 > インデックス用のテーブルを別々にしたほうが良いケースはありますでしょうか? > > 例えば > > http://groonga.org/ja/docs/tutorial/match_columns.html?highlight=複数%20カラム%20インデックス > こちらのtitle,messageのような場合 > > titleはTitleIndexテーブル、messageはMessageIndexとするようなケースです。 > それぞれで異なるトークナイズの方法が違う場合はそれぞれ別にテーブルを作る必要がある > という理解で良いでしょうか? はい、トークナイズの方法が違うときはそれぞれ別にテーブルを作 る必要があります。 データの傾向が違うときも別にした方がよいです。 極端な例ですが、韓国語と日本語のデータがある場合は、別にした 方がよいです。一緒にしても共通のトークンがほとんどないからで す。 共通のトークンがある場合は同じテーブルにするとトークン管理用 の情報を共有できるので、効率がよいです。(ディスク効率もよい ですし、同じトークンを登録しなくてもよいので更新時の効率もよ いです。) -- 須藤 功平 <kou****@clear*****> 株式会社クリアコード <http://www.clear-code.com/> Groongaベースの全文検索システムを総合サポート: http://groonga.org/ja/support/ パッチ採用 - プログラミングが楽しい人向けの採用プロセス: http://www.clear-code.com/recruitment/ コードリーダー育成支援 - 自然とリーダブルコードを書くチームへ: http://www.clear-code.com/services/code-reader/