[fess-user 486] Re: ファイルシステムクロール時のPDF文字化けについて

Zurück zum Archiv-Index

Shinsuke Sugaya shins****@yahoo*****
2011年 5月 22日 (日) 07:41:43 JST


菅谷です.

遅くなってしまいましたが,pdfbox 1.5 で
以下のエンコーディングの pdf を確認してみました.

Identity-H → OK
90ms-RKSJ-H → OK
90pv-RKSJ-H → OK
83pv-RKSJ-H → NG

ですので,pdfbox 1.5 に差し替えていただければ
83pv-RKSJ-H 以外は処理できると思います.
83pv-RKSJ-H の良い対応方法が見いだせていませんが
pdftotext でも同じ状況なので,Fess としては
ひとまず対応を保留しようかと思います.
(83pv-RKSJ-H からテキスト抽出できるコマンドなど
ご存じの方がいらっしゃいましたらぜひ教えてください)

よろしくお願いいたします.

shinsuke


2011年5月10日19:23 小島拓也 <t-koj****@minor*****>:
> 以前pdf文字化けの投稿をした小島です。お世話になっています。
>
> Fess4.0.0内のpdfbox関連のファイルを新しいものに置き換えてみた
> ところ、以前文字化けしていた90ms-RKSJ-Hエンコードのファイルが
> 全て化けなくなりました。
>
> 具体的には、
> C:\fess-server-4.0.0\webapps\fess\WEB-INF\lib
> 内にある、以下の3つのファイルを新規にpdfboxの公式サイトから
> ダウンロードしたファイルに差し替えてみました。
> (他の操作は行っていません)
> ・pdfbox-1.5.0.jar
> ・fontbox-1.5.0.jar
> ・jempbox-1.5.0.jar
>
> javaを深く理解していないので、更新手順がまちがっているかも
> という不安が大きいですが・・・
>
> 菅谷さん、小高さん、情報有難うございます。
>
> _______________________________________________
> Fess-user mailing list
> Fess-****@lists*****
> http://lists.sourceforge.jp/mailman/listinfo/fess-user
>




Fess-user メーリングリストの案内
Zurück zum Archiv-Index