[LE-talk-ja 162] Re: LE-talk-ja での議論のまとめ

Zurück zum Archiv-Index

NARUSE, Yui narus****@airem*****
2006年 5月 19日 (金) 08:29:55 JST


成瀬です。

Tomoyuki Asakawa wrote:
> 制御コードと文字コードなので、別次元です。

printableじゃなくても文字だと思いますが・・・、
まぁ脇道ですし。

> 用途として、一緒の方が便利な場合もあるでしょうけども
> 明確に別次元と言えるものを、一緒にあつかうベキではないと思う。
> 組み合わせを増やすだけ。
> 
> 逆に、SJISとCP932なんか、わけるから、組み合わせが増 
> える。

SJISとCP932は、別物ですよ。
IANAに登録されている定義を引くと、
http://www.iana.org/assignments/character-sets


Name: Shift_JIS  (preferred MIME name)
MIBenum: 17
Source: This charset is an extension of csHalfWidthKatakana by
        adding graphic characters in JIS X 0208.  The CCS's are
        JIS X0201:1997 and JIS X0208:1997.  The
        complete definition is shown in Appendix 1 of JIS
        X0208:1997.
        This charset can be used for the top-level media type "text".
Alias: MS_Kanji
Alias: csShiftJIS


Name: Windows-31J
MIBenum: 2024
Source: Windows Japanese.  A further extension of Shift_JIS
        to include NEC special characters (Row 13), NEC
        selection of IBM extensions (Rows 89 to 92), and IBM
        extensions (Rows 115 to 119).  The CCS's are
        JIS X0201:1997, JIS X0208:1997, and these extensions.
        This charset can be used for the top-level media type "text",
        but it is of limited or specialized use (see RFC2278).
        PCL Symbol Set id: 19K
Alias: csWindows31J

ですので、
* NEC special characters (Row 13)
* NEC selection of IBM extensions (Rows 89 to 92)
* IBM extensions (Rows 115 to 119)
が差分になります。

これに加えて、SJISはUnicode変換表としての意味においては、
通常 SJIS(\x81\x60)を U+301C に割り当てますからさらに別物となります。

-- 
NARUSE, Yui  <narus****@airem*****>
DBDB A476 FDBD 9450 02CD 0EFC BCE3 C388 472E C1EA



Legacy-Encoding-talk-ja メーリングリストの案内
Zurück zum Archiv-Index