[fess-user 40] Re: Subversion で Word/Excel 内をクロールできない。

Zurück zum Archiv-Index

Masayuki Shibata mshib****@shima*****
2009年 12月 14日 (月) 11:50:44 JST


柴田@亀岡市です。

英文字もダメです。

ディレクトリリスティングページにはたどり着いていて、テキストファイルなど
では、ファイル名、中身もヒットし、Word、Excel ファイルは中身だけでなくフ
ァイル名もアウトです。

Subversion 以外の Web サーバーページからのリンク先 Word、Excel やファイ
ルサーバー (file://) の Word、Excel は読めてますので、Subversion 特有の
現象です。

ブラウザでページのリンクを辿っている限りは、ごく普通に読めそうな気はしま
すし、手で辿って開く分には実際に読めますので、文字列抽出には支障ないよう
に思うのですが...

>菅谷です。
>
>> Office 2000 のものが多いと思います。
>
>ありがとうございます。手元の doc では通るので
>Subversion がらみなのかもしれないです。
>
>何度も申し訳ありませんが、そのファイルの
>ファイル名(拡張子なし部分)やそのファイルに
>含まれる英数字も検索できない感じでしょうか?
>検索できれば、文字化けして処理されている
>可能性が高いですし、できなければ文字列抽出に
>失敗していると思われます。
>
>よろしくお願いいたします。
>
>shinsuke
>
>2009年12月11日18:36 Masayuki Shibata <mshib****@shima*****>:
>> 柴田@亀岡市です。
>>
>>>> Word/Excel などの中身は拾っていないようです。
>>>
>>>対象の Word/Excel のバージョンは何になるでしょうか?
>>>一応、doc や docx などをサポートしている感じ
>>>なのですが…。
>>
>> Office 2000 のものが多いと思います。
>>
>> ディレクトリリスティングのページまでは拾ってきていて、そこから
>> リンクをたたいて表示できる Word ファイル中の文字列を再度 Fess
>> に指定して検索をかけるのですが、そいつがヒットしてこないです。
>>
>> ----------
>> Shibata, Masayuki
>> Manager, Software Development
>> Shimadzu Corporation
>> Analytical Measuring Instruments Division
>> Research & Development Department
>> Telephone:  075-823-1441 Japan
>> Facsimile:  075-823-1365 Japan
>> E-mail: mshib****@shima*****
>>
>> _______________________________________________
>> Fess-user mailing list
>> Fess-****@lists*****
>> http://lists.sourceforge.jp/mailman/listinfo/fess-user
>>
>
>_______________________________________________
>Fess-user mailing list
>Fess-****@lists*****
>http://lists.sourceforge.jp/mailman/listinfo/fess-user
>




Fess-user メーリングリストの案内
Zurück zum Archiv-Index