Shinsuke Sugaya
shins****@yahoo*****
2011年 5月 22日 (日) 07:41:43 JST
菅谷です. 遅くなってしまいましたが,pdfbox 1.5 で 以下のエンコーディングの pdf を確認してみました. Identity-H → OK 90ms-RKSJ-H → OK 90pv-RKSJ-H → OK 83pv-RKSJ-H → NG ですので,pdfbox 1.5 に差し替えていただければ 83pv-RKSJ-H 以外は処理できると思います. 83pv-RKSJ-H の良い対応方法が見いだせていませんが pdftotext でも同じ状況なので,Fess としては ひとまず対応を保留しようかと思います. (83pv-RKSJ-H からテキスト抽出できるコマンドなど ご存じの方がいらっしゃいましたらぜひ教えてください) よろしくお願いいたします. shinsuke 2011年5月10日19:23 小島拓也 <t-koj****@minor*****>: > 以前pdf文字化けの投稿をした小島です。お世話になっています。 > > Fess4.0.0内のpdfbox関連のファイルを新しいものに置き換えてみた > ところ、以前文字化けしていた90ms-RKSJ-Hエンコードのファイルが > 全て化けなくなりました。 > > 具体的には、 > C:\fess-server-4.0.0\webapps\fess\WEB-INF\lib > 内にある、以下の3つのファイルを新規にpdfboxの公式サイトから > ダウンロードしたファイルに差し替えてみました。 > (他の操作は行っていません) > ・pdfbox-1.5.0.jar > ・fontbox-1.5.0.jar > ・jempbox-1.5.0.jar > > javaを深く理解していないので、更新手順がまちがっているかも > という不安が大きいですが・・・ > > 菅谷さん、小高さん、情報有難うございます。 > > _______________________________________________ > Fess-user mailing list > Fess-****@lists***** > http://lists.sourceforge.jp/mailman/listinfo/fess-user >