[fess-user 434] クロールの進捗を知る方法

Zurück zum Archiv-Index

Masayuki Shibata mshib****@shima*****
2011年 3月 15日 (火) 13:28:03 JST


柴田@亀岡市です。

うちの運用では、インデックスの作成されるドキュメント数が
約 16000 弱あります。

1000 ドキュメントごとにコミットする設定にしてありますので
クロールを開始してから3時間ほどで、システム設定画面の追
加されたドキュメントの数が順調に 14000 ドキュメントまで上
がります。

しかし残り 1000 前後となったところで上昇が止まり、最終的
に完了するのが、さらにそこから12時間ほど先になります。

つまり全クロールに15時間ほどかかるのですが、システム設
定の画面を見る限り、いつ頃完了するのか予想がつきません。

・全体のうちのどこまで進んだかを知る方法はありますか?

また、相変わらず fess_crawler.out が出力されません。

処理の前半3時間、後半12時間みたいな動きだとすると、こ
のログが見られれば見当が付くのかなと思ったのですが、まだ
見られずにおります。

クローラー関係のログを分離したものがこれだと言うことは、
それを分離する設定が効いてないのであれば、fess.out には、
ログが残っているのかも知れません。

・その場合、そのログを区別する目印は何でしょうか?

たくさん質問してスミマセン。

また、質問ではなくご報告 (上記調査中に判明したこと) です
が...

ログを見ると temp フォルダのファイルを消せなかったらしき
ワーニングがあり、確かにファイルが大量に残っています。

また、以下のエラーがログに相当数、残っています。
ERROR org.apache.pdfbox.pdmodel.font.PDFont - Error: Could not parse 
predefined CMAP file for 'Adobe-Japan1-UCS2'

Fess 4.0.0 + Windows Server 2003 環境です。 




Fess-user メーリングリストの案内
Zurück zum Archiv-Index