文字コード(\xAD\xD1)が入ったメール処理時にエラーが発生する。
以下のような例外が発生する。
"\xAD\xD1" to UTF-8 in conversion from ISO-2022-JP to stateless-ISO-2022-JP to EUC-JP to UTF-8
本問題はM17N に関係し、Ruby 1.9 にのみ発生するもので Ruby 1.8 では発生しない。
以下のページによると "\xAD\xD1" は「㎝」という機種依存文字で UTF-8 には存在しない文字とわかった。
本システムな内部の文字コードを UTF-8 に全て統一しているため入力時に特別な対処が必要である。
mailutils ライブラリを拡張し、文字コードの変更をカスタマイズできるようにした。 また、文字コード変換に失敗した場合、例外を補足して変換不可能な文字を一律の文字に置換するようにした。
この対応は一時的な処置であり、他の文字への変換(例えば ㎝(全角1文字) => cm(半角2文字))を検討する。 本機構は #26971 の絵文字対応でも利用することになると考える。
以下のような例外が発生する。
"\xAD\xD1" to UTF-8 in conversion from ISO-2022-JP to stateless-ISO-2022-JP to EUC-JP to UTF-8
本問題はM17N に関係し、Ruby 1.9 にのみ発生するもので Ruby 1.8 では発生しない。
以下のページによると "\xAD\xD1" は「㎝」という機種依存文字で UTF-8 には存在しない文字とわかった。
本システムな内部の文字コードを UTF-8 に全て統一しているため入力時に特別な対処が必要である。