From lestrrat @ gmail.com Wed Jan 4 12:19:48 2006 From: lestrrat @ gmail.com (Daisuke Maki) Date: Wed, 4 Jan 2006 12:19:48 +0900 Subject: [Senna-dev 186] =?iso-2022-jp?b?c2VubmEbJEIkTiVtJTAbKEI=?= Message-ID: 突然ですが、sennaのログの出力先の設定とかってどこでやるんでしょうか? /var/senna/senna.confとか?あとデフォルトの値とかってqwik.jpにありますか? --d -------------- next part -------------- HTMLの添付ファイルを保管しました... URL: http://lists.sourceforge.jp/mailman/archives/senna-dev/attachments/20060104/20342f0a/attachment-0002.htm From morita @ razil.jp Fri Jan 6 16:20:40 2006 From: morita @ razil.jp (morita @ razil.jp) Date: Fri, 6 Jan 2006 16:20:40 +0900 Subject: [Senna-dev 187] =?iso-2022-jp?b?UmU6IHNlbm5hGyRCJE4lbSUwGyhC?= In-Reply-To: References: Message-ID: <20060106072040.GA31023@fracture.net.dhis.org> >>> Daisuke Maki さんは書きました: > 突然ですが、sennaのログの出力先の設定とかってどこでやるんでしょうか? > /var/senna/senna.confとか?あとデフォルトの値とかってqwik.jpにありますか? いえ。。ちょっとイケてない仕様なのでまだ公開していないです。 現状では、/var/senna/log というディレクトリを作ると、 (書き込み権限があれば)そこにsenna.logというファイルにログ情報を書き出します。 ベースのディレクトリパス(/var/senna)は、configure時に --with-sennahome という オプションで指定することができます。 -- morita From morita @ razil.jp Mon Jan 30 11:59:10 2006 From: morita @ razil.jp (morita @ razil.jp) Date: Mon, 30 Jan 2006 11:59:10 +0900 Subject: [Senna-dev 188] MySQL 2ind patch released Message-ID: <20060130025910.GA21505@fracture.net.dhis.org> rev75でmysql-2ind.diffというパッチファイルを新たにつけました。 これはMySQL+sennaにおいて全文検索で大量の結果がヒットした場合に 特定のクエリで応答が極端に遅くなる問題に一部対処するものです。 1. limit指定で出力を制限しても応答が遅い問題 select columns from table where match(a) against(b) limit 1000, 10 のように、オフセットに大きな値を指定するとテーブルスキャンが発生し、 応答が遅くなっていました。 2. count(*)等で件数を取得するだけでも応答が遅い問題 select count(*) from table where match(a) against(b); のように件数を取得するだけでもテーブルスキャンが発生し、 応答が遅くなっていました。 3. 全文検索以外の条件で絞り込む処理が遅い問題 select columns from table where match(a) against(b) and c like 'hoge%'; のように、全文検索以外に他のカラムに関する条件を指定した場合、 そのカラムにインデックスが張られていてもテーブルスキャンが発生し、 応答が遅くなっていました。 4. 全文検索以外の条件でソートする処理が遅い問題 select columns from table where match(a) against(b) order by c; のように、ソート条件を指定した場合、そのカラムにインデックスが 張られていてもテーブルスキャンが発生し、応答が遅くなっていました。 本パッチによって上記のクエリについてはテーブルスキャンが削減されるために、 検索速度が劇的に向上します。 動作条件 - MySQL4.0.26で動作を確認しました。他の版では動作未確認です。 - 上記4つのクエリパタン以外では効果が得られるとは限りません。 全文検索条件で大量のレコードがヒットすることによって発生する ディスクI/Oが性能阻害要因である場合にのみ効果が期待できます。 - in boolean modeは未サポートです。 - 本パッチはまだα版です。MySQLの安定性に及ぼす影響等は未確認です。 使い方 - mysqlをbuildする時に、mysql.*.senna.diffを当てた後に、 mysql-2ind.diffをさらに当てます。それからmakeします。 - 1. 2.のパタンについては、特に意識することなく、 通常通りにSQLを発行するだけで本パッチの効果が得られます。 - 3. 4.のパタンについては、絞り込みやソート時に使用したいインデックスを 以下のように明示的に指定する必要があります。 select columns from table force index(c) where match(a) against(b) and c like 'hoge%'; select columns from table force index(c) where match(a) against(b) order by c; (主キーであれば force index(PRIMARY) のように指定します) 今後の予定 - 安定性を確認し、mysql.*.senna.diff とマージします。 - 対応するクエリパタンを増やします。 - in boolean mode もサポートします。 -- morita From a @ razil.jp Mon Jan 30 13:56:21 2006 From: a @ razil.jp (Tasuku SUENAGA) Date: Mon, 30 Jan 2006 13:56:21 +0900 Subject: [Senna-dev 189] =?iso-2022-jp?b?MjAwNi0wMS0zMBskQkhHGyhCcG9ydHM=?= =?iso-2022-jp?b?GyRCJE46bkAuGyhC?= Message-ID: <20060130135619.D9E3.A@razil.jp> こんにちは。 FreeBSDでのmakeに苦労している方のために、 portsのtextproc/sennaをrevision 75に対応したものを 以下に置きました。 http://tasuku.suenaga.name/pub/senna/senna20060130-ports.tar.gz 有用であれば幸いです。 -- Tasuku SUENAGA From kuriyama @ imgsrc.co.jp Tue Jan 31 00:32:09 2006 From: kuriyama @ imgsrc.co.jp (Jun Kuriyama) Date: Tue, 31 Jan 2006 00:32:09 +0900 Subject: [Senna-dev 190] =?iso-2022-jp?b?UmU6IDIwMDYtMDEtMzAbJEJIRxsoQnBv?= =?iso-2022-jp?b?cnRzGyRCJE46bkAuGyhC?= In-Reply-To: <20060130135619.D9E3.A@razil.jp> References: <20060130135619.D9E3.A@razil.jp> Message-ID: <7moe1tzq86.wl%kuriyama@imgsrc.co.jp> At Mon, 30 Jan 2006 13:56:21 +0900, Tasuku SUENAGA wrote: > FreeBSDでのmakeに苦労している方のために、 > portsのtextproc/sennaをrevision 75に対応したものを > 以下に置きました。 > http://tasuku.suenaga.name/pub/senna/senna20060130-ports.tar.gz  うう、さぼっててごめんなさい。mecab のパッチ、って不要になったんでし たっけ。それならかなりすっきりするかな。ML でそんなような話を読んだよ うな気がするのですが、 http://qwik.jp/senna/8.html のあたりはまだ更新されていないだけでしょうか。  何にしろ検証して ports も更新しておきます。 -- Jun Kuriyama // IMG SRC, Inc. // FreeBSD Project From a @ razil.jp Tue Jan 31 00:44:22 2006 From: a @ razil.jp (Tasuku SUENAGA) Date: Tue, 31 Jan 2006 00:44:22 +0900 Subject: [Senna-dev 191] =?iso-2022-jp?b?UmU6IDIwMDYtMDEtMzAbJEJIRxsoQnBv?= =?iso-2022-jp?b?cnRzGyRCJE46bkAuGyhC?= In-Reply-To: <7moe1tzq86.wl%kuriyama@imgsrc.co.jp> References: <20060130135619.D9E3.A@razil.jp> <7moe1tzq86.wl%kuriyama@imgsrc.co.jp> Message-ID: <20060131004414.7C9A.A@razil.jp> こんばんは。 On Tue, 31 Jan 2006 00:32:09 +0900 Jun Kuriyama wrote: >  うう、さぼっててごめんなさい。mecab のパッチ、って不要になったんでし > たっけ。それならかなりすっきりするかな。ML でそんなような話を読んだよ > うな気がするのですが、 mecabを呼ぶsenna側で同期を取るようにしたため、 パッチが不要になりました。 というわけで、mecab-razilも役割を終えたのかな、と思っております。 > http://qwik.jp/senna/8.html > のあたりはまだ更新されていないだけでしょうか。 修正しましたー。指摘ありがとうございます。 >  何にしろ検証して ports も更新しておきます。 ありがとうございます。 皆さん助かると思います! -- Tasuku SUENAGA