Koichi Hyodo
sio-0****@rh*****
2006年 5月 24日 (水) 15:48:47 JST
兵藤です > From: Kazuhiro Kazama <kazam****@mac*****> > Date: Tue, 23 May 2006 05:44:01 +0900 > Subject: [LE-talk-ja 239] Re: 重複符号化文字 > 結局レガシーエンコーディングに関しては,バグ(問題)も仕様(泣) > なのかもしれないと思います.前向きな方法で問題を完全に解消できれ (その仕様が今となっては問題ですが ^^;) 重複符号化されているのはバグではなく仕様でしょう。 > ばいいのですが,結局過去の因縁を引きづりすぎていて,完全に解消で > きない.としたら,変えない方が,少なくとも問題をこれ以上増やさな > いことになるからです.問題を増やされるのは非常に困ります. 既存の動作を変えないこと、新たな混乱の種をつくらないようにすること に、私も同意します。その点でこのプロジェクトで既存のencodingの動作 を変更しないという方針はいいものだと思います。 新たな変換表を作ったり、変換器の外(変換器を使うアプリにとっては内部 だが明らかにそれは外 ^^;)に新たな符号化をもたらすようなアイデアは 極めて慎重に考えるべきだとも、思います。 OSを作るわけではないので、既存の変換が必要なアプリのために、既存の 変換器が使えるようになっていれば、変換器が置き換えられてしまうとい う危惧・反対の余地がなくなりますし :-) > 同じような,日本語関連のレガシーエンコーディングの「バッドノウハ > ウ」や「危険な文字」を,とりあえずフリー形式で蓄積していこうかな > というわけです.他の人は,どう思われるでしょうか?(あまり > 同意が得られなければ,個人的にやろうと思っていますが) 賛成です。 文字集合(扱うことのできる文字の範囲・選択)が違うのだということを 強調していただけると助かります。 JISでいうGLの部分が、ASCIIとして解釈されたり、JISローマ字 として解釈されたり、ベンダ独自の解釈をされたりすることも、 加えていただければ、なお助かります。 PS. 余談ですが (^^; いわゆる旧JISの呼出符号が間違っているのは、JIS規格票印刷時の レイアウトミス(バグ)だという話ですよね。その後も確認せず他書を 孫引きしたライターが相次いで既成事実になってしまったという…。