From shinsuke @ yahoo.co.jp Thu Nov 12 22:47:13 2009 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Thu, 12 Nov 2009 22:47:13 +0900 Subject: [fess-user 1] =?iso-2022-jp?b?Q29kZVppbmUbJEIkS0YzRn4yckBiNS07diRyN0c6XBsoQg==?= Message-ID: 菅谷です。 「Fessで作るApache Solrベースの全文検索サーバー 〜 導入編 」という タイトルで CodeZine に掲載しました。Fessを利用した検索サーバーの 構築方法がわかりやすく説明されていると思います。 http://codezine.jp/article/detail/4526 ぜひ、ご利用ください。 shinsuke From mshibata @ shimadzu.co.jp Tue Nov 24 20:39:15 2009 From: mshibata @ shimadzu.co.jp (Masayuki Shibata) Date: Tue, 24 Nov 2009 20:39:15 +0900 Subject: [fess-user 2] =?iso-2022-jp?b?UERGIBskQkZiJE5KODt6TnM4ITp3GyhC?= Message-ID: <200911241139.AA11955@ea8055.shimadzu.co.jp> はじめまして 柴田 と申します。 トラッカーを拝見すると 1.1.0 の時点でそれまでできていなかった題記について できるようになったとありますが、当方の環境では PDF 内文字列がヒットしない のです。 何か条件があるのでしょうか? Word, Excel, PowerPoint については、全部かどうかはわかりませんが、ヒット していることは確認しています。 SF.jp のフォーラムにもメーリングリストアーカイブにも記事がありませんので、 いきなり質問させていただいていますが、ほかに過去の情報を見られるところが ありましたら当方の見落としですので、参照先をお知らせいただけるとうれしい です。 From mshibata @ shimadzu.co.jp Tue Nov 24 21:09:18 2009 From: mshibata @ shimadzu.co.jp (Masayuki Shibata) Date: Tue, 24 Nov 2009 21:09:18 +0900 Subject: [fess-user 3] =?iso-2022-jp?b?RGlnZXN0IBskQkcnPloxWyQoGyhC?= Message-ID: <200911241209.AA11956@ea8055.shimadzu.co.jp> 立て続けに質問で申し訳ありません。 柴田です。 (ほかの柴田さんとの区別のため今後「柴田@亀岡市」と表記したいと思います。) 実は Subversion 上で Word や Excel などのドキュメントを管理して いまして、試しにそれらを検索しようとしています。 Digest 認証 をかけているのですが、Fess でインデックスを作ろうと しているあたりで認証に失敗しているようです。 ログを見ると... [Robot-20091124204918359-1-1] INFO org.apache.commons.httpclient.HttpMethodDirector - Failure authenticating with DIGEST 'trac'@bunbun:80 ...とあります。 Apache httpd.conf から Fess ウェブ認証設定に対し... ServerName bunbun → ホスト名 (イントラネット運用です) Listen 80 → ポート AuthType Digest → 認証方法 AuthName trac → レルム ...とし、 ユーザー名、パスワードは Subversion リポジトリにログインするとき に使えているものを使っています。 ウェブ設定名は上記でログインできる以下の URL を参照するようにな っています。 http://bunbun/svn/..... 上記の設定で何か思い違いがあるでしょうか? ちなみに先のメールで書き忘れましたが、Fess を動かしているのは Windows Xp Pro の localhost 環境で、参照先の Subversion は、イン トラネット上にあり、これも Windows (ですが Server版) です。 Trac Lightning というツールで同時インストールされる Subversion をアクセスしようとしています。 Subversion ではありませんが、認証のないケースでは (PDF 内文字列 検索以外) 検索できていますので、インストールまではうまく行ってい ると思います。 ---------- Shibata, Masayuki Manager, Software Development Shimadzu Corporation Analytical Measuring Instruments Division Research & Development Department Telephone: 075-823-1441 Japan Facsimile: 075-823-1365 Japan E-mail: mshibata @ shimadzu.co.jp From shinsuke @ yahoo.co.jp Wed Nov 25 05:37:04 2009 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Wed, 25 Nov 2009 05:37:04 +0900 Subject: [fess-user 4] Re: =?iso-2022-jp?b?UERGIBskQkZiJE5KODt6TnM4ITp3GyhC?= In-Reply-To: <200911241139.AA11955@ea8055.shimadzu.co.jp> References: <200911241139.AA11955@ea8055.shimadzu.co.jp> Message-ID: 菅谷です。 PDFについては種類があり、Acrobat DistillerやOpenOfficeなどで 生成されたものを確認しました。確認したもの以外の種類に属している 可能性もあるので、確認したいと考えていますが、可能でしたらその PDFか、同様のツールで生成した適当なPDFをいただけないでしょうか? Fessに関するやりとりについては、今まで私のブログでフィードバックを もらったりしていましたが、今後はこの ML をメインにできればと 思います。 よろしくお願いします。 shinsuke 2009年11月24日20:39 Masayuki Shibata : > はじめまして 柴田 と申します。 > > トラッカーを拝見すると 1.1.0 の時点でそれまでできていなかった題記について > できるようになったとありますが、当方の環境では PDF 内文字列がヒットしない > のです。 > > 何か条件があるのでしょうか? > > Word, Excel, PowerPoint については、全部かどうかはわかりませんが、ヒット > していることは確認しています。 > > SF.jp のフォーラムにもメーリングリストアーカイブにも記事がありませんので、 > いきなり質問させていただいていますが、ほかに過去の情報を見られるところが > ありましたら当方の見落としですので、参照先をお知らせいただけるとうれしい > です。 > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user > From shinsuke @ yahoo.co.jp Wed Nov 25 06:32:34 2009 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Wed, 25 Nov 2009 06:32:34 +0900 Subject: [fess-user 5] Re: =?iso-2022-jp?b?RGlnZXN0IBskQkcnPloxWyQoGyhC?= In-Reply-To: <200911241209.AA11956@ea8055.shimadzu.co.jp> References: <200911241209.AA11956@ea8055.shimadzu.co.jp> Message-ID: 菅谷です。 設定的には問題なさそうに見えます。 その部分の commons-httpclient の実装を見ると、 原因はわかりませんが、AuthState が期待する値と なぜか異なってしまっているように見えます(それの 前後にWARNなど他に何か出力されていないでしょうか?)。 たとえば、以下のようにして、すべて任意にしては どうでしょうか? ホスト名 (空) ポート -1 レルム名 (空) 認証方法 Digest認証 よろしくお願いします。 shinsuke 2009年11月24日21:09 Masayuki Shibata : > 立て続けに質問で申し訳ありません。 > 柴田です。 > (ほかの柴田さんとの区別のため今後「柴田@亀岡市」と表記したいと思います。) > > 実は Subversion 上で Word や Excel などのドキュメントを管理して > いまして、試しにそれらを検索しようとしています。 > > Digest 認証 をかけているのですが、Fess でインデックスを作ろうと > しているあたりで認証に失敗しているようです。 > > ログを見ると... > [Robot-20091124204918359-1-1] INFO org.apache.commons.httpclient.HttpMethodDirector - Failure > authenticating with DIGEST 'trac'@bunbun:80 > ...とあります。 > > Apache httpd.conf から Fess ウェブ認証設定に対し... > ServerName bunbun → ホスト名 (イントラネット運用です) > Listen 80 → ポート > AuthType Digest → 認証方法 > AuthName trac → レルム > ...とし、 > > ユーザー名、パスワードは Subversion リポジトリにログインするとき > に使えているものを使っています。 > > ウェブ設定名は上記でログインできる以下の URL を参照するようにな > っています。 > http://bunbun/svn/..... > > 上記の設定で何か思い違いがあるでしょうか? > > ちなみに先のメールで書き忘れましたが、Fess を動かしているのは > Windows Xp Pro の localhost 環境で、参照先の Subversion は、イン > トラネット上にあり、これも Windows (ですが Server版) です。 > > Trac Lightning というツールで同時インストールされる Subversion > をアクセスしようとしています。 > > Subversion ではありませんが、認証のないケースでは (PDF 内文字列 > 検索以外) 検索できていますので、インストールまではうまく行ってい > ると思います。 > > ---------- > Shibata, Masayuki > Manager, Software Development > Shimadzu Corporation > Analytical Measuring Instruments Division > Research & Development Department > Telephone: 075-823-1441 Japan > Facsimile: 075-823-1365 Japan > E-mail: mshibata @ shimadzu.co.jp > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user > From mshibata @ shimadzu.co.jp Wed Nov 25 11:31:11 2009 From: mshibata @ shimadzu.co.jp (Masayuki Shibata) Date: Wed, 25 Nov 2009 11:31:11 +0900 Subject: [fess-user 6] Re: =?iso-2022-jp?b?UERGIBskQkZiJE5KODt6TnM4ITp3GyhC?= In-Reply-To: References: Message-ID: <200911250231.AA11958@ea8055.shimadzu.co.jp> 柴田@亀岡市です。 本件、一度全部インデックスを消して一から設定をやりなおしたところ PDF も検索されるようになりました。 設定はしなおしましたが基本は変わっていません。変えたのは複数のウ ェブサイトを検索するのに1つの設定にまとめていたのを、試行のスピ ードアップのため、1つずつに分割して有効無効を個別に切り替えられ るようにしたくらいだと思います。 原因不明ですが、使い始めの混乱の中で色々触っていたのが原因という ことで、本件いったんご放念ください。 しばらくこれで様子を見てみます。 >菅谷です。 > >PDFについては種類があり、Acrobat DistillerやOpenOfficeなどで >生成されたものを確認しました。確認したもの以外の種類に属している >可能性もあるので、確認したいと考えていますが、可能でしたらその >PDFか、同様のツールで生成した適当なPDFをいただけないでしょうか? > >Fessに関するやりとりについては、今まで私のブログでフィードバックを >もらったりしていましたが、今後はこの ML をメインにできればと >思います。 > >よろしくお願いします。 > >shinsuke > > >2009年11月24日20:39 Masayuki Shibata : >> はじめまして 柴田 と申します。 >> >> トラッカーを拝見すると 1.1.0 の時点でそれまでできていなかった題記について >> できるようになったとありますが、当方の環境では PDF 内文字列がヒットしない >> のです。 >> >> 何か条件があるのでしょうか? >> >> Word, Excel, PowerPoint については、全部かどうかはわかりませんが、ヒット >> していることは確認しています。 >> >> SF.jp のフォーラムにもメーリングリストアーカイブにも記事がありませんので、 >> いきなり質問させていただいていますが、ほかに過去の情報を見られるところが >> ありましたら当方の見落としですので、参照先をお知らせいただけるとうれしい >> です。 >> >> _______________________________________________ >> Fess-user mailing list >> Fess-user @ lists.sourceforge.jp >> http://lists.sourceforge.jp/mailman/listinfo/fess-user >> > >_______________________________________________ >Fess-user mailing list >Fess-user @ lists.sourceforge.jp >http://lists.sourceforge.jp/mailman/listinfo/fess-user > ---------- Shibata, Masayuki Manager, Software Development Shimadzu Corporation Analytical Measuring Instruments Division Research & Development Department Telephone: 075-823-1441 Japan Facsimile: 075-823-1365 Japan E-mail: mshibata @ shimadzu.co.jp From mshibata @ shimadzu.co.jp Wed Nov 25 12:04:46 2009 From: mshibata @ shimadzu.co.jp (Masayuki Shibata) Date: Wed, 25 Nov 2009 12:04:46 +0900 Subject: [fess-user 7] Re: =?iso-2022-jp?b?RGlnZXN0IBskQkcnPloxWyQoGyhC?= In-Reply-To: References: Message-ID: <200911250304.AA11959@ea8055.shimadzu.co.jp> 柴田@亀岡市です。 >ホスト名 (空) >ポート -1 >レルム名 (空) >認証方法 Digest認証 ...をやってみましたが状況変わりません。 その前後のログを貼っておきます。 関係あるかどうかわかりませんが、http://bunbun/svn 以下に認証が 必要で http://bunbun/ 直下はフリーです。 2009-11-25 11:34:09,703 [http-8080-1] INFO org.apache.commons.httpclient.auth.AuthChallengeProcessor - basic authentication scheme selected 2009-11-25 11:34:09,734 [http-8080-1] INFO org.apache.commons.httpclient.auth.AuthChallengeProcessor - basic authentication scheme selected 2009-11-25 11:35:15,234 [chronos-pool-3-thread-4] INFO jp.sf.fess.task.CrawlTask - Crawler Starting.. 2009-11-25 11:35:15,265 [Robot-20091125113515234-1-1] INFO org.seasar.robot.S2RobotThread - Crawling URL: http://bunbun/svn/xxxxxx/root/trunk/doc/ 2009-11-25 11:35:15,265 [Robot-20091125113515234-1-1] INFO org.seasar.robot.client.http.CommonsHttpClient - Checking URL: http://bunbun/robots.txt 2009-11-25 11:35:15,312 [Robot-20091125113515234-1-1] INFO org.apache.commons.httpclient.auth.AuthChallengeProcessor - digest authentication scheme selected 2009-11-25 11:35:15,328 [Robot-20091125113515234-1-1] INFO org.apache.commons.httpclient.HttpMethodDirector - Failure authenticating with DIGEST 'trac'@bunbun:80 2009-11-25 11:37:10,359 [chronos-pool-3-thread-4] INFO jp.sf.fess.helper.WebIndexHelper - [EXEC TIME] crawling time: 115109ms 2009-11-25 11:37:15,281 [Thread-39] INFO jp.sf.fess.solr.IndexUpdater - [EXEC TIME] index update time: 0ms 2009-11-25 11:37:15,281 [chronos-pool-3-thread-4] INFO jp.sf.fess.helper.FileSystemIndexHelper - No crawling target urls. 2009-11-25 11:37:15,281 [chronos-pool-3-thread-4] INFO org.apache.commons.httpclient.auth.AuthChallengeProcessor - basic authentication scheme selected 2009-11-25 11:37:15,296 [chronos-pool-3-thread-4] INFO jp.sf.fess.task.CrawlTask - [EXEC TIME] index optimize time: 15ms 2009-11-25 11:37:15,296 [chronos-pool-3-thread-4] INFO jp.sf.fess.task.CrawlTask - Finished Crawler >菅谷です。 > >設定的には問題なさそうに見えます。 >その部分の commons-httpclient の実装を見ると、 >原因はわかりませんが、AuthState が期待する値と >なぜか異なってしまっているように見えます(それの >前後にWARNなど他に何か出力されていないでしょうか?)。 > >たとえば、以下のようにして、すべて任意にしては >どうでしょうか? > >ホスト名 (空) >ポート -1 >レルム名 (空) >認証方法 Digest認証 > >よろしくお願いします。 > >shinsuke > > >2009年11月24日21:09 Masayuki Shibata : >> 立て続けに質問で申し訳ありません。 >> 柴田です。 >> (ほかの柴田さんとの区別のため今後「柴田@亀岡市」と表記したいと思います。) >> >> 実は Subversion 上で Word や Excel などのドキュメントを管理して >> いまして、試しにそれらを検索しようとしています。 >> >> Digest 認証 をかけているのですが、Fess でインデックスを作ろうと >> しているあたりで認証に失敗しているようです。 >> >> ログを見ると... >> [Robot-20091124204918359-1-1] INFO org.apache.commons.httpclient.HttpMethodDirector - Failure >> authenticating with DIGEST 'trac'@bunbun:80 >> ...とあります。 >> >> Apache httpd.conf から Fess ウェブ認証設定に対し... >> ServerName bunbun → ホスト名 (イントラネット運用です) >> Listen 80 → ポート >> AuthType Digest → 認証方法 >> AuthName trac → レルム >> ...とし、 >> >> ユーザー名、パスワードは Subversion リポジトリにログインするとき >> に使えているものを使っています。 >> >> ウェブ設定名は上記でログインできる以下の URL を参照するようにな >> っています。 >> http://bunbun/svn/..... >> >> 上記の設定で何か思い違いがあるでしょうか? >> >> ちなみに先のメールで書き忘れましたが、Fess を動かしているのは >> Windows Xp Pro の localhost 環境で、参照先の Subversion は、イン >> トラネット上にあり、これも Windows (ですが Server版) です。 >> >> Trac Lightning というツールで同時インストールされる Subversion >> をアクセスしようとしています。 >> >> Subversion ではありませんが、認証のないケースでは (PDF 内文字列 >> 検索以外) 検索できていますので、インストールまではうまく行ってい >> ると思います。 >> >> ---------- >> Shibata, Masayuki >> Manager, Software Development >> Shimadzu Corporation >> Analytical Measuring Instruments Division >> Research & Development Department >> Telephone: 075-823-1441 Japan >> Facsimile: 075-823-1365 Japan >> E-mail: mshibata @ shimadzu.co.jp >> >> _______________________________________________ >> Fess-user mailing list >> Fess-user @ lists.sourceforge.jp >> http://lists.sourceforge.jp/mailman/listinfo/fess-user >> > >_______________________________________________ >Fess-user mailing list >Fess-user @ lists.sourceforge.jp >http://lists.sourceforge.jp/mailman/listinfo/fess-user > ---------- Shibata, Masayuki Manager, Software Development Shimadzu Corporation Analytical Measuring Instruments Division Research & Development Department Telephone: 075-823-1441 Japan Facsimile: 075-823-1365 Japan E-mail: mshibata @ shimadzu.co.jp From mshibata @ shimadzu.co.jp Wed Nov 25 18:08:13 2009 From: mshibata @ shimadzu.co.jp (Masayuki Shibata) Date: Wed, 25 Nov 2009 18:08:13 +0900 Subject: [fess-user 8] =?iso-2022-jp?b?GyRCJVUlISUkJWslNyU5JUYlYCUvJW0hPCVrQF9EaiROGyhC?= =?iso-2022-jp?b?IFVSTCAbJEJKODt6TnMbKEI=?= Message-ID: <200911250908.AA11962@ea8055.shimadzu.co.jp> 柴田@亀岡市です。 http://fess.sourceforge.jp/ja/file-crawl-guide.html では、 file:/home/taro/ file:/c:/Documents/taro/ ...とあるのですが、URL だと file:///home/taro/ file:///c:/Documents/taro/ ...('/'*3) それがファイルサーバー \\server\Test Documents 上を指す 場合の URL は # *2 という説もあるようなのですが、いずれにせよ Fess の記法は独自? file://///server/Test%20Documents/ ...('/'*5) らしいのですが、色々試行錯誤してみると Fess では file:////server/Test%20Documents/ ...('/'*4) で所望のフォルダにクロールしに行くようです。 #ローカルの場合 *3 と *2 に2つの説があるので、*4 のが正しい URL #かも知れませんが、ここはそもそも Fess 独自記法のところ? その結果、Fess で検索をかけるとヒットした一覧が出るのですが、リンク 先情報は file://server/Test%20Documents/ ...('/'*2) が返ってきており、これは正しい URL ではありませんのでリ ンク先のファイルが開かないという状況になっているように思います。 #ローカルのファイルなら *2 の説での正しい URL ですが、このケース #ではファイルサーバー上ですので... ローカルのファイルの場合、そもそも http:// 形式でたどり着けるとこ ろにファイルを公開していないといけませんので、その前提でマッピング することはあるのですが、イントラ運用だとファイルサーバーにそもそも たどり着けます (Windows サーバーで Web Service を立ち上げてないこ とも多い) ので file:// 形式でマッピングなしのままリンクを辿りたい という使い方になります。 ...という想定で試しているのですが、上記の状態です。 何か当方の勘違いがあるかも知れませんが、何かお気づきの点がありまし たらご教示いただけると助かります。 From mshibata @ shimadzu.co.jp Wed Nov 25 18:34:56 2009 From: mshibata @ shimadzu.co.jp (Masayuki Shibata) Date: Wed, 25 Nov 2009 18:34:56 +0900 Subject: [fess-user 9] Re: =?iso-2022-jp?b?GyRCJVUlISUkJWslNyU5JUYlYCUvJW0hPCVrQF8bKEI=?= =?iso-2022-jp?b?GyRCRGokThsoQiBVUkwgGyRCSjg7ek5zGyhC?= In-Reply-To: <200911250908.AA11962@ea8055.shimadzu.co.jp> References: <200911250908.AA11962@ea8055.shimadzu.co.jp> Message-ID: <200911250934.AA11963@ea8055.shimadzu.co.jp> 柴田です。追加です。 file:// のリンク文字列ですが、ファイルサーバー上のファイルです ので日本語のものやスペースを含むものがありえます。 現状ではエンコードされてない文字列のままリンクが貼られています ので文字化けしてます。 記事サマリの下に緑の文字でエンコードした URL が出るので、それを file:///// の記法に直すと FireFox ではファイルにたどり着けました。 IE6 だとエンコードしたままではダメで、元の日本語文字列にデコー ドしてやらないといけなさそうな感じです。 そこまでサポートするかどうかですが、ファイルサーバーのケースは イントラネットしかありませんので、file: で始まる URL は日本語に デコードして UTF-8 で戻してやる方が手堅いかも知れません。 逆に必ず http:// にマッピングするという想定ならデコードした状態 がよいでしょう。 >柴田@亀岡市です。 > >http://fess.sourceforge.jp/ja/file-crawl-guide.html では、 > >file:/home/taro/ >file:/c:/Documents/taro/ > >...とあるのですが、URL だと > >file:///home/taro/ >file:///c:/Documents/taro/ > >...('/'*3) それがファイルサーバー \\server\Test Documents 上を指す >場合の URL は ># *2 という説もあるようなのですが、いずれにせよ Fess の記法は独自? > >file://///server/Test%20Documents/ > >...('/'*5) らしいのですが、色々試行錯誤してみると Fess では > >file:////server/Test%20Documents/ > >...('/'*4) で所望のフォルダにクロールしに行くようです。 >#ローカルの場合 *3 と *2 に2つの説があるので、*4 のが正しい URL >#かも知れませんが、ここはそもそも Fess 独自記法のところ? > >その結果、Fess で検索をかけるとヒットした一覧が出るのですが、リンク >先情報は > >file://server/Test%20Documents/ > >...('/'*2) が返ってきており、これは正しい URL ではありませんのでリ >ンク先のファイルが開かないという状況になっているように思います。 >#ローカルのファイルなら *2 の説での正しい URL ですが、このケース >#ではファイルサーバー上ですので... > >ローカルのファイルの場合、そもそも http:// 形式でたどり着けるとこ >ろにファイルを公開していないといけませんので、その前提でマッピング >することはあるのですが、イントラ運用だとファイルサーバーにそもそも >たどり着けます (Windows サーバーで Web Service を立ち上げてないこ >とも多い) ので file:// 形式でマッピングなしのままリンクを辿りたい >という使い方になります。 > >...という想定で試しているのですが、上記の状態です。 > >何か当方の勘違いがあるかも知れませんが、何かお気づきの点がありまし >たらご教示いただけると助かります。 ---------- Shibata, Masayuki Manager, Software Development Shimadzu Corporation Analytical Measuring Instruments Division Research & Development Department Telephone: 075-823-1441 Japan Facsimile: 075-823-1365 Japan E-mail: mshibata @ shimadzu.co.jp From shinsuke @ yahoo.co.jp Wed Nov 25 21:55:28 2009 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Wed, 25 Nov 2009 21:55:28 +0900 Subject: [fess-user 10] Re: =?iso-2022-jp?b?GyRCJVUlISUkJWslNyU5JUYlYCUvJW0hPCVrQF8bKEI=?= =?iso-2022-jp?b?GyRCRGokThsoQiBVUkwgGyRCSjg7ek5zGyhC?= In-Reply-To: <200911250934.AA11963@ea8055.shimadzu.co.jp> References: <200911250908.AA11962@ea8055.shimadzu.co.jp> <200911250934.AA11963@ea8055.shimadzu.co.jp> Message-ID: 菅谷です。 ご指摘いただきありがとうございます。 file:// 問題は #19684 のチケットで整理したいと思います。 仕様的には UTF-8 で URL エンコードした URI としています。 内部のライブラリで file:// が file:/ に置換される動きをして いたため、独自っぽくなってしまいました。ファイルサーバーも あるので、何とかしたいと思います。 > IE6 だとエンコードしたままではダメで、元の日本語文字列にデコー > ドしてやらないといけなさそうな感じです。 IE6 はテストリソースもあるので、テストスコープから 外していたりしますが、IE だと同じ感じかと思いますので、 あとで、チケットあげて日本語に戻すように対応したいと 思います。 shinsuke 2009年11月25日18:34 Masayuki Shibata : > 柴田です。追加です。 > > file:// のリンク文字列ですが、ファイルサーバー上のファイルです > ので日本語のものやスペースを含むものがありえます。 > > 現状ではエンコードされてない文字列のままリンクが貼られています > ので文字化けしてます。 > > 記事サマリの下に緑の文字でエンコードした URL が出るので、それを > file:///// の記法に直すと FireFox ではファイルにたどり着けました。 > > IE6 だとエンコードしたままではダメで、元の日本語文字列にデコー > ドしてやらないといけなさそうな感じです。 > > そこまでサポートするかどうかですが、ファイルサーバーのケースは > イントラネットしかありませんので、file: で始まる URL は日本語に > デコードして UTF-8 で戻してやる方が手堅いかも知れません。 > > 逆に必ず http:// にマッピングするという想定ならデコードした状態 > がよいでしょう。 > > >>柴田@亀岡市です。 >> >>http://fess.sourceforge.jp/ja/file-crawl-guide.html では、 >> >>file:/home/taro/ >>file:/c:/Documents/taro/ >> >>...とあるのですが、URL だと >> >>file:///home/taro/ >>file:///c:/Documents/taro/ >> >>...('/'*3) それがファイルサーバー \\server\Test Documents 上を指す >>場合の URL は >># *2 という説もあるようなのですが、いずれにせよ Fess の記法は独自? >> >>file://///server/Test%20Documents/ >> >>...('/'*5) らしいのですが、色々試行錯誤してみると Fess では >> >>file:////server/Test%20Documents/ >> >>...('/'*4) で所望のフォルダにクロールしに行くようです。 >>#ローカルの場合 *3 と *2 に2つの説があるので、*4 のが正しい URL >>#かも知れませんが、ここはそもそも Fess 独自記法のところ? >> >>その結果、Fess で検索をかけるとヒットした一覧が出るのですが、リンク >>先情報は >> >>file://server/Test%20Documents/ >> >>...('/'*2) が返ってきており、これは正しい URL ではありませんのでリ >>ンク先のファイルが開かないという状況になっているように思います。 >>#ローカルのファイルなら *2 の説での正しい URL ですが、このケース >>#ではファイルサーバー上ですので... >> >>ローカルのファイルの場合、そもそも http:// 形式でたどり着けるとこ >>ろにファイルを公開していないといけませんので、その前提でマッピング >>することはあるのですが、イントラ運用だとファイルサーバーにそもそも >>たどり着けます (Windows サーバーで Web Service を立ち上げてないこ >>とも多い) ので file:// 形式でマッピングなしのままリンクを辿りたい >>という使い方になります。 >> >>...という想定で試しているのですが、上記の状態です。 >> >>何か当方の勘違いがあるかも知れませんが、何かお気づきの点がありまし >>たらご教示いただけると助かります。 > > ---------- > Shibata, Masayuki > Manager, Software Development > Shimadzu Corporation > Analytical Measuring Instruments Division > Research & Development Department > Telephone: 075-823-1441 Japan > Facsimile: 075-823-1365 Japan > E-mail: mshibata @ shimadzu.co.jp > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user > From shinsuke @ yahoo.co.jp Thu Nov 26 13:38:11 2009 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Thu, 26 Nov 2009 13:38:11 +0900 Subject: [fess-user 11] Re: =?iso-2022-jp?b?GyRCJVUlISUkJWslNyU5JUYlYCUvJW0hPCVrQF8bKEI=?= =?iso-2022-jp?b?GyRCRGokThsoQiBVUkwgGyRCSjg7ek5zGyhC?= In-Reply-To: References: <200911250908.AA11962@ea8055.shimadzu.co.jp> <200911250934.AA11963@ea8055.shimadzu.co.jp> Message-ID: 菅谷です。 1.1.2-SNAPSHOTで修正しておきました。 http://fess.sourceforge.jp/repository/snapshot/ パスの指定方法は java.io.File が扱う URI に 従っています。以下のようになります。 /home/taro -> file:/home/taro c:\memo.txt -> file:/c:/memo.txt \\server\memo.txt -> file:////server/memo.txt shinsuke 2009年11月25日21:55 Shinsuke Sugaya : > 菅谷です。 > > ご指摘いただきありがとうございます。 > > file:// 問題は #19684 のチケットで整理したいと思います。 > 仕様的には UTF-8 で URL エンコードした URI としています。 > 内部のライブラリで file:// が file:/ に置換される動きをして > いたため、独自っぽくなってしまいました。ファイルサーバーも > あるので、何とかしたいと思います。 > >> IE6 だとエンコードしたままではダメで、元の日本語文字列にデコー >> ドしてやらないといけなさそうな感じです。 > > IE6 はテストリソースもあるので、テストスコープから > 外していたりしますが、IE だと同じ感じかと思いますので、 > あとで、チケットあげて日本語に戻すように対応したいと > 思います。 > > shinsuke > > > 2009年11月25日18:34 Masayuki Shibata : >> 柴田です。追加です。 >> >> file:// のリンク文字列ですが、ファイルサーバー上のファイルです >> ので日本語のものやスペースを含むものがありえます。 >> >> 現状ではエンコードされてない文字列のままリンクが貼られています >> ので文字化けしてます。 >> >> 記事サマリの下に緑の文字でエンコードした URL が出るので、それを >> file:///// の記法に直すと FireFox ではファイルにたどり着けました。 >> >> IE6 だとエンコードしたままではダメで、元の日本語文字列にデコー >> ドしてやらないといけなさそうな感じです。 >> >> そこまでサポートするかどうかですが、ファイルサーバーのケースは >> イントラネットしかありませんので、file: で始まる URL は日本語に >> デコードして UTF-8 で戻してやる方が手堅いかも知れません。 >> >> 逆に必ず http:// にマッピングするという想定ならデコードした状態 >> がよいでしょう。 >> >> >>>柴田@亀岡市です。 >>> >>>http://fess.sourceforge.jp/ja/file-crawl-guide.html では、 >>> >>>file:/home/taro/ >>>file:/c:/Documents/taro/ >>> >>>...とあるのですが、URL だと >>> >>>file:///home/taro/ >>>file:///c:/Documents/taro/ >>> >>>...('/'*3) それがファイルサーバー \\server\Test Documents 上を指す >>>場合の URL は >>># *2 という説もあるようなのですが、いずれにせよ Fess の記法は独自? >>> >>>file://///server/Test%20Documents/ >>> >>>...('/'*5) らしいのですが、色々試行錯誤してみると Fess では >>> >>>file:////server/Test%20Documents/ >>> >>>...('/'*4) で所望のフォルダにクロールしに行くようです。 >>>#ローカルの場合 *3 と *2 に2つの説があるので、*4 のが正しい URL >>>#かも知れませんが、ここはそもそも Fess 独自記法のところ? >>> >>>その結果、Fess で検索をかけるとヒットした一覧が出るのですが、リンク >>>先情報は >>> >>>file://server/Test%20Documents/ >>> >>>...('/'*2) が返ってきており、これは正しい URL ではありませんのでリ >>>ンク先のファイルが開かないという状況になっているように思います。 >>>#ローカルのファイルなら *2 の説での正しい URL ですが、このケース >>>#ではファイルサーバー上ですので... >>> >>>ローカルのファイルの場合、そもそも http:// 形式でたどり着けるとこ >>>ろにファイルを公開していないといけませんので、その前提でマッピング >>>することはあるのですが、イントラ運用だとファイルサーバーにそもそも >>>たどり着けます (Windows サーバーで Web Service を立ち上げてないこ >>>とも多い) ので file:// 形式でマッピングなしのままリンクを辿りたい >>>という使い方になります。 >>> >>>...という想定で試しているのですが、上記の状態です。 >>> >>>何か当方の勘違いがあるかも知れませんが、何かお気づきの点がありまし >>>たらご教示いただけると助かります。 >> >> ---------- >> Shibata, Masayuki >> Manager, Software Development >> Shimadzu Corporation >> Analytical Measuring Instruments Division >> Research & Development Department >> Telephone: 075-823-1441 Japan >> Facsimile: 075-823-1365 Japan >> E-mail: mshibata @ shimadzu.co.jp >> >> _______________________________________________ >> Fess-user mailing list >> Fess-user @ lists.sourceforge.jp >> http://lists.sourceforge.jp/mailman/listinfo/fess-user >> > From mshibata @ shimadzu.co.jp Thu Nov 26 20:34:21 2009 From: mshibata @ shimadzu.co.jp (Masayuki Shibata) Date: Thu, 26 Nov 2009 20:34:21 +0900 Subject: [fess-user 12] Re: =?iso-2022-jp?b?GyRCJVUlISUkJWslNyU5JUYlYCUvJW0hPCVrQF8bKEI=?= =?iso-2022-jp?b?GyRCRGokThsoQiBVUkwgGyRCSjg7ek5zGyhC?= In-Reply-To: References: Message-ID: <200911261134.AA11973@ea8055.shimadzu.co.jp> 柴田@亀岡市 です。 さきほどテストしたところ、正常に動作していることを確認しました。 ありがとうございました。 >菅谷です。 > >1.1.2-SNAPSHOTで修正しておきました。 > >http://fess.sourceforge.jp/repository/snapshot/ > >パスの指定方法は java.io.File が扱う URI に >従っています。以下のようになります。 > >/home/taro -> file:/home/taro >c:\memo.txt -> file:/c:/memo.txt >\\server\memo.txt -> file:////server/memo.txt > >shinsuke > >2009年11月25日21:55 Shinsuke Sugaya : >> 菅谷です。 >> >> ご指摘いただきありがとうございます。 >> >> file:// 問題は #19684 のチケットで整理したいと思います。 >> 仕様的には UTF-8 で URL エンコードした URI としています。 >> 内部のライブラリで file:// が file:/ に置換される動きをして >> いたため、独自っぽくなってしまいました。ファイルサーバーも >> あるので、何とかしたいと思います。 >> >>> IE6 だとエンコードしたままではダメで、元の日本語文字列にデコー >>> ドしてやらないといけなさそうな感じです。 >> >> IE6 はテストリソースもあるので、テストスコープから >> 外していたりしますが、IE だと同じ感じかと思いますので、 >> あとで、チケットあげて日本語に戻すように対応したいと >> 思います。 >> >> shinsuke >> >> >> 2009年11月25日18:34 Masayuki Shibata : >>> 柴田です。追加です。 >>> >>> file:// のリンク文字列ですが、ファイルサーバー上のファイルです >>> ので日本語のものやスペースを含むものがありえます。 >>> >>> 現状ではエンコードされてない文字列のままリンクが貼られています >>> ので文字化けしてます。 >>> >>> 記事サマリの下に緑の文字でエンコードした URL が出るので、それを >>> file:///// の記法に直すと FireFox ではファイルにたどり着けました。 >>> >>> IE6 だとエンコードしたままではダメで、元の日本語文字列にデコー >>> ドしてやらないといけなさそうな感じです。 >>> >>> そこまでサポートするかどうかですが、ファイルサーバーのケースは >>> イントラネットしかありませんので、file: で始まる URL は日本語に >>> デコードして UTF-8 で戻してやる方が手堅いかも知れません。 >>> >>> 逆に必ず http:// にマッピングするという想定ならデコードした状態 >>> がよいでしょう。 >>> >>> >>>>柴田@亀岡市です。 >>>> >>>>http://fess.sourceforge.jp/ja/file-crawl-guide.html では、 >>>> >>>>file:/home/taro/ >>>>file:/c:/Documents/taro/ >>>> >>>>...とあるのですが、URL だと >>>> >>>>file:///home/taro/ >>>>file:///c:/Documents/taro/ >>>> >>>>...('/'*3) それがファイルサーバー \\server\Test Documents 上を指す >>>>場合の URL は >>>># *2 という説もあるようなのですが、いずれにせよ Fess の記法は独自? >>>> >>>>file://///server/Test%20Documents/ >>>> >>>>...('/'*5) らしいのですが、色々試行錯誤してみると Fess では >>>> >>>>file:////server/Test%20Documents/ >>>> >>>>...('/'*4) で所望のフォルダにクロールしに行くようです。 >>>>#ローカルの場合 *3 と *2 に2つの説があるので、*4 のが正しい URL >>>>#かも知れませんが、ここはそもそも Fess 独自記法のところ? >>>> >>>>その結果、Fess で検索をかけるとヒットした一覧が出るのですが、リンク >>>>先情報は >>>> >>>>file://server/Test%20Documents/ >>>> >>>>...('/'*2) が返ってきており、これは正しい URL ではありませんのでリ >>>>ンク先のファイルが開かないという状況になっているように思います。 >>>>#ローカルのファイルなら *2 の説での正しい URL ですが、このケース >>>>#ではファイルサーバー上ですので... >>>> >>>>ローカルのファイルの場合、そもそも http:// 形式でたどり着けるとこ >>>>ろにファイルを公開していないといけませんので、その前提でマッピング >>>>することはあるのですが、イントラ運用だとファイルサーバーにそもそも >>>>たどり着けます (Windows サーバーで Web Service を立ち上げてないこ >>>>とも多い) ので file:// 形式でマッピングなしのままリンクを辿りたい >>>>という使い方になります。 >>>> >>>>...という想定で試しているのですが、上記の状態です。 >>>> >>>>何か当方の勘違いがあるかも知れませんが、何かお気づきの点がありまし >>>>たらご教示いただけると助かります。 >>> >>> ---------- >>> Shibata, Masayuki >>> Manager, Software Development >>> Shimadzu Corporation >>> Analytical Measuring Instruments Division >>> Research & Development Department >>> Telephone: 075-823-1441 Japan >>> Facsimile: 075-823-1365 Japan >>> E-mail: mshibata @ shimadzu.co.jp >>> >>> _______________________________________________ >>> Fess-user mailing list >>> Fess-user @ lists.sourceforge.jp >>> http://lists.sourceforge.jp/mailman/listinfo/fess-user >>> >> > >_______________________________________________ >Fess-user mailing list >Fess-user @ lists.sourceforge.jp >http://lists.sourceforge.jp/mailman/listinfo/fess-user > ---------- Shibata, Masayuki Manager, Software Development Shimadzu Corporation Analytical Measuring Instruments Division Research & Development Department Telephone: 075-823-1441 Japan Facsimile: 075-823-1365 Japan E-mail: mshibata @ shimadzu.co.jp From mshibata @ shimadzu.co.jp Thu Nov 26 20:54:18 2009 From: mshibata @ shimadzu.co.jp (Masayuki Shibata) Date: Thu, 26 Nov 2009 20:54:18 +0900 Subject: [fess-user 13] =?iso-2022-jp?b?GyRCJTUlJCVIGyhCIChIVE1MKSAbJEIkTiVSJUMlSCU1GyhC?= =?iso-2022-jp?b?GyRCJV4laiQsST08KCQ1JGwkSiQkGyhC?= Message-ID: <200911261154.AA11974@ea8055.shimadzu.co.jp> 柴田@亀岡市です。 当方では NetCommons (http://www.netcommons.org/) という Apache + PHP で動く CMS (ブラウザからコンテンツを入力編集できるサーバーソフト) を 利用しているのですが、そこを対象に Fess でクロールしたら HitList.jpg のような状態になります。 赤枠で囲んだところのリンクをたたくと確かに検索した文字「SVN」は存在 してて、ちゃんと動作はしているのですが、ヒットした文字列周辺のサマリ (...というのでしょうか?) が表示されていません。 クロールする対象が Word や PDF などバイナリ文書の場合は、中身のサマ リはちゃんと表示されます。 リンク先は例えば HitPage.jpg のようなページで、ブラウザでソース表示 してみると普通に HTML になっています。 何かサマリが表示されるのに条件があるのでしょうか? ---------- Shibata, Masayuki Manager, Software Development Shimadzu Corporation Analytical Measuring Instruments Division Research & Development Department Telephone: 075-823-1441 Japan Facsimile: 075-823-1365 Japan E-mail: mshibata @ shimadzu.co.jp -------------- next part -------------- テキスト形式以外の添付ファイルを保管しました... ファイル名: HitPage.jpg 型: image/jpeg サイズ: 160181 バイト 説明: 無し URL: http://lists.sourceforge.jp/mailman/archives/fess-user/attachments/20091126/53f92a66/attachment-0002.jpg -------------- next part -------------- テキスト形式以外の添付ファイルを保管しました... ファイル名: HitList.jpg 型: image/jpeg サイズ: 78592 バイト 説明: 無し URL: http://lists.sourceforge.jp/mailman/archives/fess-user/attachments/20091126/53f92a66/attachment-0003.jpg From shinsuke @ yahoo.co.jp Thu Nov 26 23:43:45 2009 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Thu, 26 Nov 2009 23:43:45 +0900 Subject: [fess-user 14] Re: =?iso-2022-jp?b?GyRCJTUlJCVIGyhCIChIVE1MKSAbJEIkTiVSJUMbKEI=?= =?iso-2022-jp?b?GyRCJUglNSVeJWokLEk9PCgkNSRsJEokJBsoQg==?= In-Reply-To: <200911261154.AA11974@ea8055.shimadzu.co.jp> References: <200911261154.AA11974@ea8055.shimadzu.co.jp> Message-ID: 菅谷です。 結果のサマリー部分は、HTMLの場合、meta タグの description で 文字列を取得できた場合はそれが表示されます。確かに、ウェブアプリに よっては、適切でない description が入っていたりで、気になりますね…。 というわけで、meta タグの description を使わないオプションを 追加しました。スナップショットリリースで利用可能です。デフォルトでは 使う設定になっているので、webapps/fess/WEB-INF/classes/app.diconで false というように useDigest を false にすると、コンテンツ部分から それっぽいところを取得するようになります。 shinsuke 2009年11月26日20:54 Masayuki Shibata : > 柴田@亀岡市です。 > > 当方では NetCommons (http://www.netcommons.org/) という Apache + PHP > で動く CMS (ブラウザからコンテンツを入力編集できるサーバーソフト) を > 利用しているのですが、そこを対象に Fess でクロールしたら HitList.jpg > のような状態になります。 > > 赤枠で囲んだところのリンクをたたくと確かに検索した文字「SVN」は存在 > してて、ちゃんと動作はしているのですが、ヒットした文字列周辺のサマリ > (...というのでしょうか?) が表示されていません。 > > クロールする対象が Word や PDF などバイナリ文書の場合は、中身のサマ > リはちゃんと表示されます。 > > リンク先は例えば HitPage.jpg のようなページで、ブラウザでソース表示 > してみると普通に HTML になっています。 > > 何かサマリが表示されるのに条件があるのでしょうか? > > ---------- > Shibata, Masayuki > Manager, Software Development > Shimadzu Corporation > Analytical Measuring Instruments Division > Research & Development Department > Telephone: 075-823-1441 Japan > Facsimile: 075-823-1365 Japan > E-mail: mshibata @ shimadzu.co.jp > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user > > From shinsuke @ yahoo.co.jp Thu Nov 26 23:49:37 2009 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Thu, 26 Nov 2009 23:49:37 +0900 Subject: [fess-user 15] Re: =?iso-2022-jp?b?RGlnZXN0IBskQkcnPloxWyQoGyhC?= In-Reply-To: <200911250304.AA11959@ea8055.shimadzu.co.jp> References: <200911250304.AA11959@ea8055.shimadzu.co.jp> Message-ID: 菅谷です。 ありがとうございます。 こちらでまだ、これを再現できる環境が用意できず、 手が回っていないので、少々お待ちください…。 shinsuke 2009年11月25日12:04 Masayuki Shibata : > 柴田@亀岡市です。 > >>ホスト名 (空) >>ポート -1 >>レルム名 (空) >>認証方法 Digest認証 > > ...をやってみましたが状況変わりません。 > > その前後のログを貼っておきます。 > > 関係あるかどうかわかりませんが、http://bunbun/svn 以下に認証が > 必要で http://bunbun/ 直下はフリーです。 > > 2009-11-25 11:34:09,703 [http-8080-1] INFO > org.apache.commons.httpclient.auth.AuthChallengeProcessor - basic authentication scheme selected > 2009-11-25 11:34:09,734 [http-8080-1] INFO > org.apache.commons.httpclient.auth.AuthChallengeProcessor - basic authentication scheme selected > 2009-11-25 11:35:15,234 [chronos-pool-3-thread-4] INFO jp.sf.fess.task.CrawlTask - Crawler > Starting.. > 2009-11-25 11:35:15,265 [Robot-20091125113515234-1-1] INFO org.seasar.robot.S2RobotThread - > Crawling URL: http://bunbun/svn/xxxxxx/root/trunk/doc/ > 2009-11-25 11:35:15,265 [Robot-20091125113515234-1-1] INFO > org.seasar.robot.client.http.CommonsHttpClient - Checking URL: http://bunbun/robots.txt > 2009-11-25 11:35:15,312 [Robot-20091125113515234-1-1] INFO > org.apache.commons.httpclient.auth.AuthChallengeProcessor - digest authentication scheme selected > 2009-11-25 11:35:15,328 [Robot-20091125113515234-1-1] INFO > org.apache.commons.httpclient.HttpMethodDirector - Failure authenticating with DIGEST > 'trac'@bunbun:80 > 2009-11-25 11:37:10,359 [chronos-pool-3-thread-4] INFO jp.sf.fess.helper.WebIndexHelper - [EXEC > TIME] crawling time: 115109ms > 2009-11-25 11:37:15,281 [Thread-39] INFO jp.sf.fess.solr.IndexUpdater - [EXEC TIME] index update > time: 0ms > 2009-11-25 11:37:15,281 [chronos-pool-3-thread-4] INFO jp.sf.fess.helper.FileSystemIndexHelper - > No crawling target urls. > 2009-11-25 11:37:15,281 [chronos-pool-3-thread-4] INFO > org.apache.commons.httpclient.auth.AuthChallengeProcessor - basic authentication scheme selected > 2009-11-25 11:37:15,296 [chronos-pool-3-thread-4] INFO jp.sf.fess.task.CrawlTask - [EXEC TIME] > index optimize time: 15ms > 2009-11-25 11:37:15,296 [chronos-pool-3-thread-4] INFO jp.sf.fess.task.CrawlTask - Finished > Crawler > >>菅谷です。 >> >>設定的には問題なさそうに見えます。 >>その部分の commons-httpclient の実装を見ると、 >>原因はわかりませんが、AuthState が期待する値と >>なぜか異なってしまっているように見えます(それの >>前後にWARNなど他に何か出力されていないでしょうか?)。 >> >>たとえば、以下のようにして、すべて任意にしては >>どうでしょうか? >> >>ホスト名 (空) >>ポート -1 >>レルム名 (空) >>認証方法 Digest認証 >> >>よろしくお願いします。 >> >>shinsuke >> >> >>2009年11月24日21:09 Masayuki Shibata : >>> 立て続けに質問で申し訳ありません。 >>> 柴田です。 >>> (ほかの柴田さんとの区別のため今後「柴田@亀岡市」と表記したいと思います。) >>> >>> 実は Subversion 上で Word や Excel などのドキュメントを管理して >>> いまして、試しにそれらを検索しようとしています。 >>> >>> Digest 認証 をかけているのですが、Fess でインデックスを作ろうと >>> しているあたりで認証に失敗しているようです。 >>> >>> ログを見ると... >>> [Robot-20091124204918359-1-1] INFO org.apache.commons.httpclient.HttpMethodDirector - Failure >>> authenticating with DIGEST 'trac'@bunbun:80 >>> ...とあります。 >>> >>> Apache httpd.conf から Fess ウェブ認証設定に対し... >>> ServerName bunbun → ホスト名 (イントラネット運用です) >>> Listen 80 → ポート >>> AuthType Digest → 認証方法 >>> AuthName trac → レルム >>> ...とし、 >>> >>> ユーザー名、パスワードは Subversion リポジトリにログインするとき >>> に使えているものを使っています。 >>> >>> ウェブ設定名は上記でログインできる以下の URL を参照するようにな >>> っています。 >>> http://bunbun/svn/..... >>> >>> 上記の設定で何か思い違いがあるでしょうか? >>> >>> ちなみに先のメールで書き忘れましたが、Fess を動かしているのは >>> Windows Xp Pro の localhost 環境で、参照先の Subversion は、イン >>> トラネット上にあり、これも Windows (ですが Server版) です。 >>> >>> Trac Lightning というツールで同時インストールされる Subversion >>> をアクセスしようとしています。 >>> >>> Subversion ではありませんが、認証のないケースでは (PDF 内文字列 >>> 検索以外) 検索できていますので、インストールまではうまく行ってい >>> ると思います。 >>> >>> ---------- >>> Shibata, Masayuki >>> Manager, Software Development >>> Shimadzu Corporation >>> Analytical Measuring Instruments Division >>> Research & Development Department >>> Telephone: 075-823-1441 Japan >>> Facsimile: 075-823-1365 Japan >>> E-mail: mshibata @ shimadzu.co.jp >>> >>> _______________________________________________ >>> Fess-user mailing list >>> Fess-user @ lists.sourceforge.jp >>> http://lists.sourceforge.jp/mailman/listinfo/fess-user >>> >> >>_______________________________________________ >>Fess-user mailing list >>Fess-user @ lists.sourceforge.jp >>http://lists.sourceforge.jp/mailman/listinfo/fess-user >> > > ---------- > Shibata, Masayuki > Manager, Software Development > Shimadzu Corporation > Analytical Measuring Instruments Division > Research & Development Department > Telephone: 075-823-1441 Japan > Facsimile: 075-823-1365 Japan > E-mail: mshibata @ shimadzu.co.jp > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user > From mshibata @ shimadzu.co.jp Fri Nov 27 13:44:24 2009 From: mshibata @ shimadzu.co.jp (Masayuki Shibata) Date: Fri, 27 Nov 2009 13:44:24 +0900 Subject: [fess-user 16] =?iso-2022-jp?b?GyRCMj8kKyUoJWkhPCQsPVAkRiQkJGskaCQmJEo1JCQsGyhC?= =?iso-2022-jp?b?GyRCJDckXiQ5GyhC?= Message-ID: <200911270444.AA11981@ea8055.shimadzu.co.jp> 柴田@亀岡市です。 インデックス作成時にターミナル画面を眺めているとエラーらしき文字列 が... 画面の上の方に流れて消えた部分にも最後の5行があったので、最低2回 は出ていたようです。 何か当方でやれることはありますか? 情報: [] webapp=/solr path=/update params={wt=javabin&version=2.2} status=0 QTim e=172 Exception in thread "Robot-20091127132552187-1-3" java.lang.ClassCastException: java.lang.NoClassDefFoundError cannot be cast to java.lang.Exception at org.seasar.robot.helper.impl.LogHelperImpl.log(LogHelperImpl.java:148 ) at org.seasar.robot.S2RobotThread.log(S2RobotThread.java:107) at org.seasar.robot.S2RobotThread.run(S2RobotThread.java:226) at java.lang.Thread.run(Thread.java:619) Exception in thread "Robot-20091127132552187-1-4" java.lang.ClassCastException: java.lang.NoClassDefFoundError cannot be cast to java.lang.Exception at org.seasar.robot.helper.impl.LogHelperImpl.log(LogHelperImpl.java:148 ) at org.seasar.robot.S2RobotThread.log(S2RobotThread.java:107) at org.seasar.robot.S2RobotThread.run(S2RobotThread.java:226) at java.lang.Thread.run(Thread.java:619) Exception in thread "Robot-20091127132552187-1-5" java.lang.ClassCastException: java.lang.NoClassDefFoundError cannot be cast to java.lang.Exception at org.seasar.robot.helper.impl.LogHelperImpl.log(LogHelperImpl.java:148 ) at org.seasar.robot.S2RobotThread.log(S2RobotThread.java:107) at org.seasar.robot.S2RobotThread.run(S2RobotThread.java:226) at java.lang.Thread.run(Thread.java:619) Exception in thread "Robot-20091127132552187-1-1" java.lang.ClassCastException: java.lang.NoClassDefFoundError cannot be cast to java.lang.Exception at org.seasar.robot.helper.impl.LogHelperImpl.log(LogHelperImpl.java:148 ) at org.seasar.robot.S2RobotThread.log(S2RobotThread.java:107) at org.seasar.robot.S2RobotThread.run(S2RobotThread.java:226) at java.lang.Thread.run(Thread.java:619) Exception in thread "Robot-20091127132552187-1-2" java.lang.ClassCastException: java.lang.NoClassDefFoundError cannot be cast to java.lang.Exception at org.seasar.robot.helper.impl.LogHelperImpl.log(LogHelperImpl.java:148 ) at org.seasar.robot.S2RobotThread.log(S2RobotThread.java:107) at org.seasar.robot.S2RobotThread.run(S2RobotThread.java:226) at java.lang.Thread.run(Thread.java:619) 2009/11/27 13:28:56 org.apache.solr.update.processor.LogUpdateProcessor finish From mshibata @ shimadzu.co.jp Fri Nov 27 14:12:59 2009 From: mshibata @ shimadzu.co.jp (Masayuki Shibata) Date: Fri, 27 Nov 2009 14:12:59 +0900 Subject: [fess-user 17] Re: =?iso-2022-jp?b?GyRCJVUlISUkJWslNyU5JUYlYCUvJW0hPCVrQF8bKEI=?= =?iso-2022-jp?b?GyRCRGokThsoQiBVUkwgGyRCSjg7ek5zGyhC?= In-Reply-To: <200911261134.AA11973@ea8055.shimadzu.co.jp> References: <200911261134.AA11973@ea8055.shimadzu.co.jp> Message-ID: <200911270512.AA11982@ea8055.shimadzu.co.jp> 柴田@亀岡市 です。 リンク先の文字列は UTF-8 にデコードされているのですね? ではダイジェスト (...というみたいですね) 下に緑色で表示される 文字列はエンコードされたものですが、こちらはどうされますか? file:/ で始まるリンク先のはデコードしてしまってもよいような... 正しい仕様の範囲ではあるのですが、当然のことながらデコード文 字列なのでかなり長いことが多いです。 >柴田@亀岡市 です。 > >さきほどテストしたところ、正常に動作していることを確認しました。 > >ありがとうございました。 > >>菅谷です。 >> >>1.1.2-SNAPSHOTで修正しておきました。 >> >>http://fess.sourceforge.jp/repository/snapshot/ >> >>パスの指定方法は java.io.File が扱う URI に >>従っています。以下のようになります。 >> >>/home/taro -> file:/home/taro >>c:\memo.txt -> file:/c:/memo.txt >>\\server\memo.txt -> file:////server/memo.txt >> >>shinsuke >> >>2009年11月25日21:55 Shinsuke Sugaya : >>> 菅谷です。 >>> >>> ご指摘いただきありがとうございます。 >>> >>> file:// 問題は #19684 のチケットで整理したいと思います。 >>> 仕様的には UTF-8 で URL エンコードした URI としています。 >>> 内部のライブラリで file:// が file:/ に置換される動きをして >>> いたため、独自っぽくなってしまいました。ファイルサーバーも >>> あるので、何とかしたいと思います。 >>> >>>> IE6 だとエンコードしたままではダメで、元の日本語文字列にデコー >>>> ドしてやらないといけなさそうな感じです。 >>> >>> IE6 はテストリソースもあるので、テストスコープから >>> 外していたりしますが、IE だと同じ感じかと思いますので、 >>> あとで、チケットあげて日本語に戻すように対応したいと >>> 思います。 >>> >>> shinsuke >>> >>> >>> 2009年11月25日18:34 Masayuki Shibata : >>>> 柴田です。追加です。 >>>> >>>> file:// のリンク文字列ですが、ファイルサーバー上のファイルです >>>> ので日本語のものやスペースを含むものがありえます。 >>>> >>>> 現状ではエンコードされてない文字列のままリンクが貼られています >>>> ので文字化けしてます。 >>>> >>>> 記事サマリの下に緑の文字でエンコードした URL が出るので、それを >>>> file:///// の記法に直すと FireFox ではファイルにたどり着けました。 >>>> >>>> IE6 だとエンコードしたままではダメで、元の日本語文字列にデコー >>>> ドしてやらないといけなさそうな感じです。 >>>> >>>> そこまでサポートするかどうかですが、ファイルサーバーのケースは >>>> イントラネットしかありませんので、file: で始まる URL は日本語に >>>> デコードして UTF-8 で戻してやる方が手堅いかも知れません。 >>>> >>>> 逆に必ず http:// にマッピングするという想定ならデコードした状態 >>>> がよいでしょう。 >>>> >>>> >>>>>柴田@亀岡市です。 >>>>> >>>>>http://fess.sourceforge.jp/ja/file-crawl-guide.html では、 >>>>> >>>>>file:/home/taro/ >>>>>file:/c:/Documents/taro/ >>>>> >>>>>...とあるのですが、URL だと >>>>> >>>>>file:///home/taro/ >>>>>file:///c:/Documents/taro/ >>>>> >>>>>...('/'*3) それがファイルサーバー \\server\Test Documents 上を指す >>>>>場合の URL は >>>>># *2 という説もあるようなのですが、いずれにせよ Fess の記法は独自? >>>>> >>>>>file://///server/Test%20Documents/ >>>>> >>>>>...('/'*5) らしいのですが、色々試行錯誤してみると Fess では >>>>> >>>>>file:////server/Test%20Documents/ >>>>> >>>>>...('/'*4) で所望のフォルダにクロールしに行くようです。 >>>>>#ローカルの場合 *3 と *2 に2つの説があるので、*4 のが正しい URL >>>>>#かも知れませんが、ここはそもそも Fess 独自記法のところ? >>>>> >>>>>その結果、Fess で検索をかけるとヒットした一覧が出るのですが、リンク >>>>>先情報は >>>>> >>>>>file://server/Test%20Documents/ >>>>> >>>>>...('/'*2) が返ってきており、これは正しい URL ではありませんのでリ >>>>>ンク先のファイルが開かないという状況になっているように思います。 >>>>>#ローカルのファイルなら *2 の説での正しい URL ですが、このケース >>>>>#ではファイルサーバー上ですので... >>>>> >>>>>ローカルのファイルの場合、そもそも http:// 形式でたどり着けるとこ >>>>>ろにファイルを公開していないといけませんので、その前提でマッピング >>>>>することはあるのですが、イントラ運用だとファイルサーバーにそもそも >>>>>たどり着けます (Windows サーバーで Web Service を立ち上げてないこ >>>>>とも多い) ので file:// 形式でマッピングなしのままリンクを辿りたい >>>>>という使い方になります。 >>>>> >>>>>...という想定で試しているのですが、上記の状態です。 >>>>> >>>>>何か当方の勘違いがあるかも知れませんが、何かお気づきの点がありまし >>>>>たらご教示いただけると助かります。 >>>> >>>> ---------- >>>> Shibata, Masayuki >>>> Manager, Software Development >>>> Shimadzu Corporation >>>> Analytical Measuring Instruments Division >>>> Research & Development Department >>>> Telephone: 075-823-1441 Japan >>>> Facsimile: 075-823-1365 Japan >>>> E-mail: mshibata @ shimadzu.co.jp >>>> >>>> _______________________________________________ >>>> Fess-user mailing list >>>> Fess-user @ lists.sourceforge.jp >>>> http://lists.sourceforge.jp/mailman/listinfo/fess-user >>>> >>> >> >>_______________________________________________ >>Fess-user mailing list >>Fess-user @ lists.sourceforge.jp >>http://lists.sourceforge.jp/mailman/listinfo/fess-user >> > >---------- >Shibata, Masayuki >Manager, Software Development >Shimadzu Corporation >Analytical Measuring Instruments Division >Research & Development Department >Telephone: 075-823-1441 Japan >Facsimile: 075-823-1365 Japan >E-mail: mshibata @ shimadzu.co.jp > >_______________________________________________ >Fess-user mailing list >Fess-user @ lists.sourceforge.jp >http://lists.sourceforge.jp/mailman/listinfo/fess-user > ---------- Shibata, Masayuki Manager, Software Development Shimadzu Corporation Analytical Measuring Instruments Division Research & Development Department Telephone: 075-823-1441 Japan Facsimile: 075-823-1365 Japan E-mail: mshibata @ shimadzu.co.jp From mshibata @ shimadzu.co.jp Fri Nov 27 14:22:33 2009 From: mshibata @ shimadzu.co.jp (Masayuki Shibata) Date: Fri, 27 Nov 2009 14:22:33 +0900 Subject: [fess-user 18] Re: =?iso-2022-jp?b?GyRCJVUlISUkJWslNyU5JUYlYCUvJW0hPCVrQF8bKEI=?= =?iso-2022-jp?b?GyRCRGokThsoQiBVUkwgGyRCSjg7ek5zGyhC?= In-Reply-To: <200911270512.AA11982@ea8055.shimadzu.co.jp> References: <200911270512.AA11982@ea8055.shimadzu.co.jp> Message-ID: <200911270522.AA11983@ea8055.shimadzu.co.jp> おっと、リンクタイトル (添付ファイル参照) もでした... バタバタしてスミマセン。 >柴田@亀岡市 です。 > >リンク先の文字列は UTF-8 にデコードされているのですね? > >ではダイジェスト (...というみたいですね) 下に緑色で表示される >文字列はエンコードされたものですが、こちらはどうされますか? > >file:/ で始まるリンク先のはデコードしてしまってもよいような... > >正しい仕様の範囲ではあるのですが、当然のことながらデコード文 >字列なのでかなり長いことが多いです。 > > >>柴田@亀岡市 です。 >> >>さきほどテストしたところ、正常に動作していることを確認しました。 >> >>ありがとうございました。 >> >>>菅谷です。 >>> >>>1.1.2-SNAPSHOTで修正しておきました。 >>> >>>http://fess.sourceforge.jp/repository/snapshot/ >>> >>>パスの指定方法は java.io.File が扱う URI に >>>従っています。以下のようになります。 >>> >>>/home/taro -> file:/home/taro >>>c:\memo.txt -> file:/c:/memo.txt >>>\\server\memo.txt -> file:////server/memo.txt >>> >>>shinsuke >>> >>>2009年11月25日21:55 Shinsuke Sugaya : >>>> 菅谷です。 >>>> >>>> ご指摘いただきありがとうございます。 >>>> >>>> file:// 問題は #19684 のチケットで整理したいと思います。 >>>> 仕様的には UTF-8 で URL エンコードした URI としています。 >>>> 内部のライブラリで file:// が file:/ に置換される動きをして >>>> いたため、独自っぽくなってしまいました。ファイルサーバーも >>>> あるので、何とかしたいと思います。 >>>> >>>>> IE6 だとエンコードしたままではダメで、元の日本語文字列にデコー >>>>> ドしてやらないといけなさそうな感じです。 >>>> >>>> IE6 はテストリソースもあるので、テストスコープから >>>> 外していたりしますが、IE だと同じ感じかと思いますので、 >>>> あとで、チケットあげて日本語に戻すように対応したいと >>>> 思います。 >>>> >>>> shinsuke >>>> >>>> >>>> 2009年11月25日18:34 Masayuki Shibata : >>>>> 柴田です。追加です。 >>>>> >>>>> file:// のリンク文字列ですが、ファイルサーバー上のファイルです >>>>> ので日本語のものやスペースを含むものがありえます。 >>>>> >>>>> 現状ではエンコードされてない文字列のままリンクが貼られています >>>>> ので文字化けしてます。 >>>>> >>>>> 記事サマリの下に緑の文字でエンコードした URL が出るので、それを >>>>> file:///// の記法に直すと FireFox ではファイルにたどり着けました。 >>>>> >>>>> IE6 だとエンコードしたままではダメで、元の日本語文字列にデコー >>>>> ドしてやらないといけなさそうな感じです。 >>>>> >>>>> そこまでサポートするかどうかですが、ファイルサーバーのケースは >>>>> イントラネットしかありませんので、file: で始まる URL は日本語に >>>>> デコードして UTF-8 で戻してやる方が手堅いかも知れません。 >>>>> >>>>> 逆に必ず http:// にマッピングするという想定ならデコードした状態 >>>>> がよいでしょう。 >>>>> >>>>> >>>>>>柴田@亀岡市です。 >>>>>> >>>>>>http://fess.sourceforge.jp/ja/file-crawl-guide.html では、 >>>>>> >>>>>>file:/home/taro/ >>>>>>file:/c:/Documents/taro/ >>>>>> >>>>>>...とあるのですが、URL だと >>>>>> >>>>>>file:///home/taro/ >>>>>>file:///c:/Documents/taro/ >>>>>> >>>>>>...('/'*3) それがファイルサーバー \\server\Test Documents 上を指す >>>>>>場合の URL は >>>>>># *2 という説もあるようなのですが、いずれにせよ Fess の記法は独自? >>>>>> >>>>>>file://///server/Test%20Documents/ >>>>>> >>>>>>...('/'*5) らしいのですが、色々試行錯誤してみると Fess では >>>>>> >>>>>>file:////server/Test%20Documents/ >>>>>> >>>>>>...('/'*4) で所望のフォルダにクロールしに行くようです。 >>>>>>#ローカルの場合 *3 と *2 に2つの説があるので、*4 のが正しい URL >>>>>>#かも知れませんが、ここはそもそも Fess 独自記法のところ? >>>>>> >>>>>>その結果、Fess で検索をかけるとヒットした一覧が出るのですが、リンク >>>>>>先情報は >>>>>> >>>>>>file://server/Test%20Documents/ >>>>>> >>>>>>...('/'*2) が返ってきており、これは正しい URL ではありませんのでリ >>>>>>ンク先のファイルが開かないという状況になっているように思います。 >>>>>>#ローカルのファイルなら *2 の説での正しい URL ですが、このケース >>>>>>#ではファイルサーバー上ですので... >>>>>> >>>>>>ローカルのファイルの場合、そもそも http:// 形式でたどり着けるとこ >>>>>>ろにファイルを公開していないといけませんので、その前提でマッピング >>>>>>することはあるのですが、イントラ運用だとファイルサーバーにそもそも >>>>>>たどり着けます (Windows サーバーで Web Service を立ち上げてないこ >>>>>>とも多い) ので file:// 形式でマッピングなしのままリンクを辿りたい >>>>>>という使い方になります。 >>>>>> >>>>>>...という想定で試しているのですが、上記の状態です。 >>>>>> >>>>>>何か当方の勘違いがあるかも知れませんが、何かお気づきの点がありまし >>>>>>たらご教示いただけると助かります。 >>>>> >>>>> ---------- >>>>> Shibata, Masayuki >>>>> Manager, Software Development >>>>> Shimadzu Corporation >>>>> Analytical Measuring Instruments Division >>>>> Research & Development Department >>>>> Telephone: 075-823-1441 Japan >>>>> Facsimile: 075-823-1365 Japan >>>>> E-mail: mshibata @ shimadzu.co.jp >>>>> >>>>> _______________________________________________ >>>>> Fess-user mailing list >>>>> Fess-user @ lists.sourceforge.jp >>>>> http://lists.sourceforge.jp/mailman/listinfo/fess-user >>>>> >>>> >>> >>>_______________________________________________ >>>Fess-user mailing list >>>Fess-user @ lists.sourceforge.jp >>>http://lists.sourceforge.jp/mailman/listinfo/fess-user >>> >> >>---------- >>Shibata, Masayuki >>Manager, Software Development >>Shimadzu Corporation >>Analytical Measuring Instruments Division >>Research & Development Department >>Telephone: 075-823-1441 Japan >>Facsimile: 075-823-1365 Japan >>E-mail: mshibata @ shimadzu.co.jp >> >>_______________________________________________ >>Fess-user mailing list >>Fess-user @ lists.sourceforge.jp >>http://lists.sourceforge.jp/mailman/listinfo/fess-user >> > >---------- >Shibata, Masayuki >Manager, Software Development >Shimadzu Corporation >Analytical Measuring Instruments Division >Research & Development Department >Telephone: 075-823-1441 Japan >Facsimile: 075-823-1365 Japan >E-mail: mshibata @ shimadzu.co.jp > >_______________________________________________ >Fess-user mailing list >Fess-user @ lists.sourceforge.jp >http://lists.sourceforge.jp/mailman/listinfo/fess-user > ---------- Shibata, Masayuki Manager, Software Development Shimadzu Corporation Analytical Measuring Instruments Division Research & Development Department Telephone: 075-823-1441 Japan Facsimile: 075-823-1365 Japan E-mail: mshibata @ shimadzu.co.jp -------------- next part -------------- テキスト形式以外の添付ファイルを保管しました... ファイル名: Image2.gif 型: image/gif サイズ: 53184 バイト 説明: 無し URL: http://lists.sourceforge.jp/mailman/archives/fess-user/attachments/20091127/76f3864c/attachment-0001.gif From shinsuke @ yahoo.co.jp Fri Nov 27 14:33:16 2009 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Fri, 27 Nov 2009 14:33:16 +0900 Subject: [fess-user 19] Re: =?iso-2022-jp?b?GyRCMj8kKyUoJWkhPCQsPVAkRiQkJGskaCQmJEobKEI=?= =?iso-2022-jp?b?GyRCNSQkLCQ3JF4kORsoQg==?= In-Reply-To: <200911270444.AA11981@ea8055.shimadzu.co.jp> References: <200911270444.AA11981@ea8055.shimadzu.co.jp> Message-ID: 菅谷です。 ご指摘いただきありがとうございます。 ソースコード上では修正したので、1〜2時間後には 自動ビルドでスナップショットリリースが更新されていると 思います。 shinsuke 2009年11月27日13:44 Masayuki Shibata : > 柴田@亀岡市です。 > > インデックス作成時にターミナル画面を眺めているとエラーらしき文字列 > が... > > 画面の上の方に流れて消えた部分にも最後の5行があったので、最低2回 > は出ていたようです。 > > 何か当方でやれることはありますか? > > 情報: [] webapp=/solr path=/update params={wt=javabin&version=2.2} status=0 QTim > e=172 > Exception in thread "Robot-20091127132552187-1-3" java.lang.ClassCastException: > java.lang.NoClassDefFoundError cannot be cast to java.lang.Exception > at org.seasar.robot.helper.impl.LogHelperImpl.log(LogHelperImpl.java:148 > ) > at org.seasar.robot.S2RobotThread.log(S2RobotThread.java:107) > at org.seasar.robot.S2RobotThread.run(S2RobotThread.java:226) > at java.lang.Thread.run(Thread.java:619) > Exception in thread "Robot-20091127132552187-1-4" java.lang.ClassCastException: > java.lang.NoClassDefFoundError cannot be cast to java.lang.Exception > at org.seasar.robot.helper.impl.LogHelperImpl.log(LogHelperImpl.java:148 > ) > at org.seasar.robot.S2RobotThread.log(S2RobotThread.java:107) > at org.seasar.robot.S2RobotThread.run(S2RobotThread.java:226) > at java.lang.Thread.run(Thread.java:619) > Exception in thread "Robot-20091127132552187-1-5" java.lang.ClassCastException: > java.lang.NoClassDefFoundError cannot be cast to java.lang.Exception > at org.seasar.robot.helper.impl.LogHelperImpl.log(LogHelperImpl.java:148 > ) > at org.seasar.robot.S2RobotThread.log(S2RobotThread.java:107) > at org.seasar.robot.S2RobotThread.run(S2RobotThread.java:226) > at java.lang.Thread.run(Thread.java:619) > Exception in thread "Robot-20091127132552187-1-1" java.lang.ClassCastException: > java.lang.NoClassDefFoundError cannot be cast to java.lang.Exception > at org.seasar.robot.helper.impl.LogHelperImpl.log(LogHelperImpl.java:148 > ) > at org.seasar.robot.S2RobotThread.log(S2RobotThread.java:107) > at org.seasar.robot.S2RobotThread.run(S2RobotThread.java:226) > at java.lang.Thread.run(Thread.java:619) > Exception in thread "Robot-20091127132552187-1-2" java.lang.ClassCastException: > java.lang.NoClassDefFoundError cannot be cast to java.lang.Exception > at org.seasar.robot.helper.impl.LogHelperImpl.log(LogHelperImpl.java:148 > ) > at org.seasar.robot.S2RobotThread.log(S2RobotThread.java:107) > at org.seasar.robot.S2RobotThread.run(S2RobotThread.java:226) > at java.lang.Thread.run(Thread.java:619) > 2009/11/27 13:28:56 org.apache.solr.update.processor.LogUpdateProcessor finish > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user > From mshibata @ shimadzu.co.jp Fri Nov 27 19:38:20 2009 From: mshibata @ shimadzu.co.jp (Masayuki Shibata) Date: Fri, 27 Nov 2009 19:38:20 +0900 Subject: [fess-user 20] =?iso-2022-jp?b?GyRCOCE6dyQ1JGwkSiQkGyhCIFBERiAbJEIkLCQiJGobKEI=?= =?iso-2022-jp?b?GyRCJF4kOSEjGyhC?= In-Reply-To: <200911250231.AA11958@ea8055.shimadzu.co.jp> References: <200911250231.AA11958@ea8055.shimadzu.co.jp> Message-ID: <200911271038.AA11991@ea8055.shimadzu.co.jp> 柴田@亀岡市です。 以前「PDF 内の文字列検索」のスレッドで報告していたのと多分同じ 現象なのだと思いますが、絶対クロール範囲にあるはずの PDF でヒ ットしていないものがあります。 この PDF は以前はヒットしていたもので、何度かスナップショット をいただいているごとにインデックスを1から作り直しているのです が、今回作成したインデックスから漏れたようです。 以前も1からインデックス作り直したら直ったので、これも作り直し たら直りそうですが、どこかの時点で何らかの原因で作り損ねて、そ れ以降ヒットしないものができてしまうなら、それはちょっと問題か と思います。 一回は失敗してスルーするけど、次にインデックス作成時に拾えるな らよいのですが、どうもそういうこともなさそうな雰囲気です。 以前はヒットしていたので、PDF を作るのに使ったツールの差という のでもありません (Acrobat 5 の Distiller で作った純正 PDF で発 生してますし)。 検索対象の PDF が多いので気づいただけで PDF に限定されない現象 かも知れませんが... 「何かエラーが出ているような気がします」のスレッドで対処してい ただいた修正で直る可能性はありますか? 何か調査した方がよいものがありましたらお知らせください。 ---------- Shibata, Masayuki Manager, Software Development Shimadzu Corporation Analytical Measuring Instruments Division Research & Development Department Telephone: 075-823-1441 Japan Facsimile: 075-823-1365 Japan E-mail: mshibata @ shimadzu.co.jp From shinsuke @ yahoo.co.jp Fri Nov 27 21:26:33 2009 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Fri, 27 Nov 2009 21:26:33 +0900 Subject: [fess-user 21] Re: =?iso-2022-jp?b?GyRCOCE6dyQ1JGwkSiQkGyhCIFBERiAbJEIkLCQiGyhC?= =?iso-2022-jp?b?GyRCJGokXiQ5ISMbKEI=?= In-Reply-To: <200911271038.AA11991@ea8055.shimadzu.co.jp> References: <200911250231.AA11958@ea8055.shimadzu.co.jp> <200911271038.AA11991@ea8055.shimadzu.co.jp> Message-ID: 菅谷です。 確認ポイントとしては、対象クロールセッションにおいて fess.out でその PDF がクロールされているかを確認して いただくと良いかと思います。 > 「何かエラーが出ているような気がします」のスレッドで対処してい > ただいた修正で直る可能性はありますか? その状況ですと、クロールスレッドが終了したと思われるので、 クロール自体が正常終了していない気がします。ですので、 直る可能性はあるかと思います。 あと、1.2系のスナップショットはまだ大胆に開発しているので 上記のようなことに遭遇する可能性はあるかと思います。一方 1.1系のスナップショットは必要最小限の変更にしているので、 安定していると思います。一応、今までいただいた情報の修正は 1.1系に反映してあると思います (2つあると修正が手間なので 早く1.2系にしたいところですが…) shinsuke 2009年11月27日19:38 Masayuki Shibata : > 柴田@亀岡市です。 > > 以前「PDF 内の文字列検索」のスレッドで報告していたのと多分同じ > 現象なのだと思いますが、絶対クロール範囲にあるはずの PDF でヒ > ットしていないものがあります。 > > この PDF は以前はヒットしていたもので、何度かスナップショット > をいただいているごとにインデックスを1から作り直しているのです > が、今回作成したインデックスから漏れたようです。 > > 以前も1からインデックス作り直したら直ったので、これも作り直し > たら直りそうですが、どこかの時点で何らかの原因で作り損ねて、そ > れ以降ヒットしないものができてしまうなら、それはちょっと問題か > と思います。 > > 一回は失敗してスルーするけど、次にインデックス作成時に拾えるな > らよいのですが、どうもそういうこともなさそうな雰囲気です。 > > 以前はヒットしていたので、PDF を作るのに使ったツールの差という > のでもありません (Acrobat 5 の Distiller で作った純正 PDF で発 > 生してますし)。 > > 検索対象の PDF が多いので気づいただけで PDF に限定されない現象 > かも知れませんが... > > 「何かエラーが出ているような気がします」のスレッドで対処してい > ただいた修正で直る可能性はありますか? > > 何か調査した方がよいものがありましたらお知らせください。 > > ---------- > Shibata, Masayuki > Manager, Software Development > Shimadzu Corporation > Analytical Measuring Instruments Division > Research & Development Department > Telephone: 075-823-1441 Japan > Facsimile: 075-823-1365 Japan > E-mail: mshibata @ shimadzu.co.jp > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user > From shinsuke @ yahoo.co.jp Sat Nov 28 07:12:27 2009 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Sat, 28 Nov 2009 07:12:27 +0900 Subject: [fess-user 22] Re: =?iso-2022-jp?b?GyRCJVUlISUkJWslNyU5JUYlYCUvJW0hPCVrQF8bKEI=?= =?iso-2022-jp?b?GyRCRGokThsoQiBVUkwgGyRCSjg7ek5zGyhC?= In-Reply-To: <200911270522.AA11983@ea8055.shimadzu.co.jp> References: <200911270512.AA11982@ea8055.shimadzu.co.jp> <200911270522.AA11983@ea8055.shimadzu.co.jp> Message-ID: 菅谷です。 ありがとうございます。 デコードして、長くならないように修正しました。 1.1 系にも反映してあります。 shinsuke 2009年11月27日14:22 Masayuki Shibata : > おっと、リンクタイトル (添付ファイル参照) もでした... > バタバタしてスミマセン。 > >>柴田@亀岡市 です。 >> >>リンク先の文字列は UTF-8 にデコードされているのですね? >> >>ではダイジェスト (...というみたいですね) 下に緑色で表示される >>文字列はエンコードされたものですが、こちらはどうされますか? >> >>file:/ で始まるリンク先のはデコードしてしまってもよいような... >> >>正しい仕様の範囲ではあるのですが、当然のことながらデコード文 >>字列なのでかなり長いことが多いです。 >> >> >>>柴田@亀岡市 です。 >>> >>>さきほどテストしたところ、正常に動作していることを確認しました。 >>> >>>ありがとうございました。 >>> >>>>菅谷です。 >>>> >>>>1.1.2-SNAPSHOTで修正しておきました。 >>>> >>>>http://fess.sourceforge.jp/repository/snapshot/ >>>> >>>>パスの指定方法は java.io.File が扱う URI に >>>>従っています。以下のようになります。 >>>> >>>>/home/taro -> file:/home/taro >>>>c:\memo.txt -> file:/c:/memo.txt >>>>\\server\memo.txt -> file:////server/memo.txt >>>> >>>>shinsuke >>>> >>>>2009年11月25日21:55 Shinsuke Sugaya : >>>>> 菅谷です。 >>>>> >>>>> ご指摘いただきありがとうございます。 >>>>> >>>>> file:// 問題は #19684 のチケットで整理したいと思います。 >>>>> 仕様的には UTF-8 で URL エンコードした URI としています。 >>>>> 内部のライブラリで file:// が file:/ に置換される動きをして >>>>> いたため、独自っぽくなってしまいました。ファイルサーバーも >>>>> あるので、何とかしたいと思います。 >>>>> >>>>>> IE6 だとエンコードしたままではダメで、元の日本語文字列にデコー >>>>>> ドしてやらないといけなさそうな感じです。 >>>>> >>>>> IE6 はテストリソースもあるので、テストスコープから >>>>> 外していたりしますが、IE だと同じ感じかと思いますので、 >>>>> あとで、チケットあげて日本語に戻すように対応したいと >>>>> 思います。 >>>>> >>>>> shinsuke >>>>> >>>>> >>>>> 2009年11月25日18:34 Masayuki Shibata : >>>>>> 柴田です。追加です。 >>>>>> >>>>>> file:// のリンク文字列ですが、ファイルサーバー上のファイルです >>>>>> ので日本語のものやスペースを含むものがありえます。 >>>>>> >>>>>> 現状ではエンコードされてない文字列のままリンクが貼られています >>>>>> ので文字化けしてます。 >>>>>> >>>>>> 記事サマリの下に緑の文字でエンコードした URL が出るので、それを >>>>>> file:///// の記法に直すと FireFox ではファイルにたどり着けました。 >>>>>> >>>>>> IE6 だとエンコードしたままではダメで、元の日本語文字列にデコー >>>>>> ドしてやらないといけなさそうな感じです。 >>>>>> >>>>>> そこまでサポートするかどうかですが、ファイルサーバーのケースは >>>>>> イントラネットしかありませんので、file: で始まる URL は日本語に >>>>>> デコードして UTF-8 で戻してやる方が手堅いかも知れません。 >>>>>> >>>>>> 逆に必ず http:// にマッピングするという想定ならデコードした状態 >>>>>> がよいでしょう。 >>>>>> >>>>>> >>>>>>>柴田@亀岡市です。 >>>>>>> >>>>>>>http://fess.sourceforge.jp/ja/file-crawl-guide.html では、 >>>>>>> >>>>>>>file:/home/taro/ >>>>>>>file:/c:/Documents/taro/ >>>>>>> >>>>>>>...とあるのですが、URL だと >>>>>>> >>>>>>>file:///home/taro/ >>>>>>>file:///c:/Documents/taro/ >>>>>>> >>>>>>>...('/'*3) それがファイルサーバー \\server\Test Documents 上を指す >>>>>>>場合の URL は >>>>>>># *2 という説もあるようなのですが、いずれにせよ Fess の記法は独自? >>>>>>> >>>>>>>file://///server/Test%20Documents/ >>>>>>> >>>>>>>...('/'*5) らしいのですが、色々試行錯誤してみると Fess では >>>>>>> >>>>>>>file:////server/Test%20Documents/ >>>>>>> >>>>>>>...('/'*4) で所望のフォルダにクロールしに行くようです。 >>>>>>>#ローカルの場合 *3 と *2 に2つの説があるので、*4 のが正しい URL >>>>>>>#かも知れませんが、ここはそもそも Fess 独自記法のところ? >>>>>>> >>>>>>>その結果、Fess で検索をかけるとヒットした一覧が出るのですが、リンク >>>>>>>先情報は >>>>>>> >>>>>>>file://server/Test%20Documents/ >>>>>>> >>>>>>>...('/'*2) が返ってきており、これは正しい URL ではありませんのでリ >>>>>>>ンク先のファイルが開かないという状況になっているように思います。 >>>>>>>#ローカルのファイルなら *2 の説での正しい URL ですが、このケース >>>>>>>#ではファイルサーバー上ですので... >>>>>>> >>>>>>>ローカルのファイルの場合、そもそも http:// 形式でたどり着けるとこ >>>>>>>ろにファイルを公開していないといけませんので、その前提でマッピング >>>>>>>することはあるのですが、イントラ運用だとファイルサーバーにそもそも >>>>>>>たどり着けます (Windows サーバーで Web Service を立ち上げてないこ >>>>>>>とも多い) ので file:// 形式でマッピングなしのままリンクを辿りたい >>>>>>>という使い方になります。 >>>>>>> >>>>>>>...という想定で試しているのですが、上記の状態です。 >>>>>>> >>>>>>>何か当方の勘違いがあるかも知れませんが、何かお気づきの点がありまし >>>>>>>たらご教示いただけると助かります。 >>>>>> >>>>>> ---------- >>>>>> Shibata, Masayuki >>>>>> Manager, Software Development >>>>>> Shimadzu Corporation >>>>>> Analytical Measuring Instruments Division >>>>>> Research & Development Department >>>>>> Telephone: 075-823-1441 Japan >>>>>> Facsimile: 075-823-1365 Japan >>>>>> E-mail: mshibata @ shimadzu.co.jp >>>>>> >>>>>> _______________________________________________ >>>>>> Fess-user mailing list >>>>>> Fess-user @ lists.sourceforge.jp >>>>>> http://lists.sourceforge.jp/mailman/listinfo/fess-user >>>>>> >>>>> >>>> >>>>_______________________________________________ >>>>Fess-user mailing list >>>>Fess-user @ lists.sourceforge.jp >>>>http://lists.sourceforge.jp/mailman/listinfo/fess-user >>>> >>> >>>---------- >>>Shibata, Masayuki >>>Manager, Software Development >>>Shimadzu Corporation >>>Analytical Measuring Instruments Division >>>Research & Development Department >>>Telephone: 075-823-1441 Japan >>>Facsimile: 075-823-1365 Japan >>>E-mail: mshibata @ shimadzu.co.jp >>> >>>_______________________________________________ >>>Fess-user mailing list >>>Fess-user @ lists.sourceforge.jp >>>http://lists.sourceforge.jp/mailman/listinfo/fess-user >>> >> >>---------- >>Shibata, Masayuki >>Manager, Software Development >>Shimadzu Corporation >>Analytical Measuring Instruments Division >>Research & Development Department >>Telephone: 075-823-1441 Japan >>Facsimile: 075-823-1365 Japan >>E-mail: mshibata @ shimadzu.co.jp >> >>_______________________________________________ >>Fess-user mailing list >>Fess-user @ lists.sourceforge.jp >>http://lists.sourceforge.jp/mailman/listinfo/fess-user >> > > ---------- > Shibata, Masayuki > Manager, Software Development > Shimadzu Corporation > Analytical Measuring Instruments Division > Research & Development Department > Telephone: 075-823-1441 Japan > Facsimile: 075-823-1365 Japan > E-mail: mshibata @ shimadzu.co.jp > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user > > From mshibata @ shimadzu.co.jp Mon Nov 30 08:55:02 2009 From: mshibata @ shimadzu.co.jp (Masayuki Shibata) Date: Mon, 30 Nov 2009 08:55:02 +0900 Subject: [fess-user 23] Re: =?iso-2022-jp?b?GyRCOCE6dyQ1JGwkSiQkGyhCIFBERiAbJEIkLCQiGyhC?= =?iso-2022-jp?b?GyRCJGokXiQ5ISMbKEI=?= In-Reply-To: References: Message-ID: <200911292355.AA11992@ea8055.shimadzu.co.jp> 柴田@亀岡市です。 >あと、1.2系のスナップショットはまだ大胆に開発しているので >上記のようなことに遭遇する可能性はあるかと思います。一方 >1.1系のスナップショットは必要最小限の変更にしているので、 >安定していると思います。一応、今までいただいた情報の修正は >1.1系に反映してあると思います (2つあると修正が手間なので >早く1.2系にしたいところですが…) あ、スミマセン。 今度から 1.1系 と 1.2系を切り分けて報告するようにします。 バグは 1.1系、1.2系両方、追加でのお願いは 1.2系と思い込んで おりました。 From shinsuke @ yahoo.co.jp Mon Nov 30 09:14:05 2009 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Mon, 30 Nov 2009 09:14:05 +0900 Subject: [fess-user 24] Re: =?iso-2022-jp?b?GyRCOCE6dyQ1JGwkSiQkGyhCIFBERiAbJEIkLCQiGyhC?= =?iso-2022-jp?b?GyRCJGokXiQ5ISMbKEI=?= In-Reply-To: <200911292355.AA11992@ea8055.shimadzu.co.jp> References: <200911292355.AA11992@ea8055.shimadzu.co.jp> Message-ID: 菅谷です。 > バグは 1.1系、1.2系両方、追加でのお願いは 1.2系と思い込んで > おりました。 上記のような感じですが、使い勝手に影響がありそうなことは 1.1 にも入れています (ご指摘いただいているものは、たぶん 他の方も気になると思いますし)。バグでも影響がなさそうなもの (回避できるもの)は1.2 だけにしようと思っています。最終的に 良いものになれば良いかと思うので、できるだけ柔軟にいきたいと 考えています。 shinsuke 2009年11月30日8:55 Masayuki Shibata : > 柴田@亀岡市です。 > >>あと、1.2系のスナップショットはまだ大胆に開発しているので >>上記のようなことに遭遇する可能性はあるかと思います。一方 >>1.1系のスナップショットは必要最小限の変更にしているので、 >>安定していると思います。一応、今までいただいた情報の修正は >>1.1系に反映してあると思います (2つあると修正が手間なので >>早く1.2系にしたいところですが…) > > あ、スミマセン。 > 今度から 1.1系 と 1.2系を切り分けて報告するようにします。 > > バグは 1.1系、1.2系両方、追加でのお願いは 1.2系と思い込んで > おりました。 > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user > From mshibata @ shimadzu.co.jp Mon Nov 30 13:39:35 2009 From: mshibata @ shimadzu.co.jp (Masayuki Shibata) Date: Mon, 30 Nov 2009 13:39:35 +0900 Subject: [fess-user 25] Fess Message-ID: <200911300439.AA11996@ea8055.shimadzu.co.jp> 柴田@亀岡市です。 軽い提案です。 現在 Fess と固定で出しているタイトルですが、 検索文字列 - Fess または Fess - 検索文字列 ...としては如何でしょう? Google の物まねですが、ブラウザの履歴もこの文字列で出てくるので 次々検索したときに所望の時点に戻れます。 From shinsuke @ yahoo.co.jp Mon Nov 30 14:35:33 2009 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Mon, 30 Nov 2009 14:35:33 +0900 Subject: [fess-user 26] Re: Fess In-Reply-To: <200911300439.AA11996@ea8055.shimadzu.co.jp> References: <200911300439.AA11996@ea8055.shimadzu.co.jp> Message-ID: 菅谷です。 なるほど。ありがとうございます。 Google と Bing が > 検索文字列 - Fess または としているようなので、あとで Fess 1.2 に適用したいと 思います。 shinsuke 2009年11月30日13:39 Masayuki Shibata : > 柴田@亀岡市です。 > > 軽い提案です。 > > 現在 Fess と固定で出しているタイトルですが、 > 検索文字列 - Fess または > Fess - 検索文字列 ...としては如何でしょう? > > Google の物まねですが、ブラウザの履歴もこの文字列で出てくるので > 次々検索したときに所望の時点に戻れます。 > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user >