Masayuki Shibata
mshib****@shima*****
2011年 3月 15日 (火) 13:28:03 JST
柴田@亀岡市です。 うちの運用では、インデックスの作成されるドキュメント数が 約 16000 弱あります。 1000 ドキュメントごとにコミットする設定にしてありますので クロールを開始してから3時間ほどで、システム設定画面の追 加されたドキュメントの数が順調に 14000 ドキュメントまで上 がります。 しかし残り 1000 前後となったところで上昇が止まり、最終的 に完了するのが、さらにそこから12時間ほど先になります。 つまり全クロールに15時間ほどかかるのですが、システム設 定の画面を見る限り、いつ頃完了するのか予想がつきません。 ・全体のうちのどこまで進んだかを知る方法はありますか? また、相変わらず fess_crawler.out が出力されません。 処理の前半3時間、後半12時間みたいな動きだとすると、こ のログが見られれば見当が付くのかなと思ったのですが、まだ 見られずにおります。 クローラー関係のログを分離したものがこれだと言うことは、 それを分離する設定が効いてないのであれば、fess.out には、 ログが残っているのかも知れません。 ・その場合、そのログを区別する目印は何でしょうか? たくさん質問してスミマセン。 また、質問ではなくご報告 (上記調査中に判明したこと) です が... ログを見ると temp フォルダのファイルを消せなかったらしき ワーニングがあり、確かにファイルが大量に残っています。 また、以下のエラーがログに相当数、残っています。 ERROR org.apache.pdfbox.pdmodel.font.PDFont - Error: Could not parse predefined CMAP file for 'Adobe-Japan1-UCS2' Fess 4.0.0 + Windows Server 2003 環境です。