Kouhei Sutou
kou****@clear*****
2014年 9月 26日 (金) 20:57:17 JST
須藤です。 In <54252****@fdiar*****> "[groonga-dev,02816] Re: IN NATURAL LANGUAGE MODEにおける検索スコア" on Fri, 26 Sep 2014 10:50:23 +0200, Kazuhiko <kazuh****@fdiar*****> wrote: >> 「boolean」ってスコアは小さめっていう意味合いもあったんでし >> たっけ。私は、ANDとかORを使って検索できる、っていう意味なの >> かなぁと思っていました。 > > boolean、つまり「あったらTrue、なかったらFalse」で、Trueの数を返すものだ > と思っていました。少なくともMyISAMだとそうです。 それでORは説明できると思いますが、ANDが説明できないような。。。 >> もしかしたら、なんですけど、かずひこさんが求めている挙動って >> >> "word1 word2 word3" IN BOOLEAN MODE >> >> (word1 OR word2 OR word3)だったりしないかなぁと思いました。 > > 求めている挙動は、「適当にキーワードを多めにつっこんだら、いい感じのスコ > アでソートされて返ってくる」です。 > > 上述の仕様の違いで、Mroonga in boolean modeは、MyISAM in boolean modeよ > りはましな結果になりそうですが、やっぱりキーワードごとの重みが考慮される > ほうが「いい感じのスコアでソート」になりそうなので、(word1 OR word2 OR > word3)だとあまり嬉しくありません。以下、比較実験しました。 例を示してくれてありがとうございます! ただ、この例だとどのcontentが上位にくるのが妥当なのかわから ないので、「望ましい挙動」がわからないなぁと思いました。 「fine tomorrow bell」で検索したら「Ring the bell.」が一番上 位になってうれしい。。。の?みたいな感じです。 -- 須藤 功平 <kou****@clear*****> 株式会社クリアコード <http://www.clear-code.com/> Groongaベースの全文検索システムを総合サポート: http://groonga.org/ja/support/ パッチ採用 - プログラミングが楽しい人向けの採用プロセス: http://www.clear-code.com/recruitment/ コードリーダー育成支援 - 自然とリーダブルコードを書くチームへ: http://www.clear-code.com/services/code-reader/