NARUSE, Yui
narus****@airem*****
2006年 1月 27日 (金) 22:12:22 JST
成瀬です。 さて、先日EUC-JPのマッピングで迷っていたわけですが、 ICUがglibcのeucJP-msマッピングをucm形式で公開しているのを見つけました。 http://dev.icu-project.org/cgi-bin/viewcvs.cgi/charset/data/ucm/ 調べてみたところ、以下の点で現在のnkfとマッピングが異なるようです。 nkf.c rev 1.90, utftbl.c rev 1.16 <U00A5> \xA1\xEF |1 <U203E> \xA1\xB1 |1 glibc-EUC_JP_MS-2.3.3.ucm <U00A5> \x5C |1 <U203E> \x7E |1 これについて、nkfのマッピングをglibcにあわせようと思っているのですが、 ご意見ありますでしょうか。 ASCII外の文字が文字コードの変換によってASCIIに飛び込んでくる件は、 CP932がどうしようもないことを考えると、 「仕様」とし、別途注意を喚起した方がいい気がしてきました。 #ちなみに、-eやeucJP-asciiにはそのような文字はありません なおこの件については、 -e(eucJP-nkf)及びeucJP-asciiのマッピングに変更はありません。 -- NARUSE, Yui <narus****@airem*****> DBDB A476 FDBD 9450 02CD 0EFC BCE3 C388 472E C1EA