Shinsuke Sugaya
shins****@yahoo*****
2011年 7月 16日 (土) 21:00:23 JST
菅谷です. (ML に登録されていないアドレスからのメールは 捨てられてしまいますが,質問でしたので返信します) > https://www.~URL~/sitemap.xml これはオレオレ証明書などを利用しているサイトでしょうか? スタックトレースを見ると sitemap.xml から <urlset を 読み取れていないために GZIP と判断されていると 思われます. よろしくお願いいたします. shinsuke > ---------- 転送メッセージ ---------- > Date: Sat, 16 Jul 2011 19:13:21 +0900 > Subject: sitemap.xmlのクロール対象時にRobotSitemapsExceptionが発生する > FESSを利用させていただいている、中野と申します。 > > sitemap.xmlをウェブクロール対象に設定し、 > クロールを実行すると、例外が発生し、クロールの実行が出来ません。 > > sitemap.xmlは拡張子はXMLで、ファイルのデータ構造も > gzip圧縮はかけていません。 > > FESSのバージョンは4.0.0です。 > > 注意点、確認すべきポイント等がありましたら、 > ご教示いただけますでしょうか? > > > 【例外スタックトレース】 > 2011-07-16 18:52:11,052 [Robot-20110716185201-1-1] ERROR org.seasar.robot.helper. > impl.LogHelperImpl - Crawling Exception at https://www.~URL~/sitemap.xml > org.seasar.robot.RobotSitemapsException: Could not parse Sitemaps. > at org.seasar.robot.helper.SitemapsHelper.parse(SitemapsHelper.java:89) > at org.seasar.robot.helper.SitemapsHelper.parse(SitemapsHelper.java:54) > at > org.seasar.robot.processor.impl.SitemapsResponseProcessor.process(SitemapsRespons > eProcessor.java:47) > at org.seasar.robot.S2RobotThread.processResponse(S2RobotThread.java:341) > at org.seasar.robot.S2RobotThread.run(S2RobotThread.java:180) > at java.lang.Thread.run(Unknown Source) > Caused by: java.io.IOException: Not in GZIP format > at java.util.zip.GZIPInputStream.readHeader(Unknown Source) > at java.util.zip.GZIPInputStream.<init>(Unknown Source) > at java.util.zip.GZIPInputStream.<init>(Unknown Source) > at org.seasar.robot.helper.SitemapsHelper.parse(SitemapsHelper.java:84) > ... 5 more > > 【sitemap例】 > <?xml version="1.0" encoding="UTF-8"?> > <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> > <url> > <loc>https://www.~URL~/コンテンツアドレス</loc> > <lastmod>2010-06-24T04:03:42Z</lastmod> > </url> > </urlset> > > > 以上、よろしくお願いします。 > > //------------------------------------------------ > エスエムジー株式会社 > 〜心に響くSmile & Technology〜 > > プロセス&マネジメントディヴィジョン > 品質改善エキスパート > 中野健士(NAKANO Kenji) > mail : nakan****@smg***** > URL : http://www.smg.co.jp/ > TEL : 045-476-3171 > FAX : 045-476-4171 > ------------------------------------------------// > > >