[2] 規格については ISO/IEC 8859 参照。
[3]
符号化の名前については iso-8859-*
も参照。
[29] EURO 追加の前後の変化 (Win95 (WindowsのNLSファイル (>>25)) と Win98 (WindowsのNLSファイル (>>26)) での調査結果)
-0x01 U+263A <- # WHITE SMILING FACE -0x02 U+263B <- # BLACK SMILING FACE -0x03 U+2665 <- # BLACK HEART SUIT -0x04 U+2666 <- # BLACK DIAMOND SUIT -0x05 U+2663 <- # BLACK CLUB SUIT -0x06 U+2660 <- # BLACK SPADE SUIT -0x08 U+25D8 <- # INVERSE BULLET -0x09 U+25CB <- # WHITE CIRCLE -0x0A U+25D9 <- # INVERSE WHITE CIRCLE -0x0B U+2642 <- # MALE SIGN -0x0C U+2640 <- # FEMALE SIGN -0x0D U+266A <- # EIGHTH NOTE -0x0E U+266B <- # BEAMED EIGHTH NOTES -0x10 U+25BA <- # BLACK RIGHT-POINTING POINTER -0x11 U+25C4 <- # BLACK LEFT-POINTING POINTER -0x12 U+2195 <- # UP DOWN ARROW -0x13 U+203C <- # DOUBLE EXCLAMATION MARK -0x16 U+25AC <- # BLACK RECTANGLE -0x17 U+21A8 <- # UP DOWN ARROW WITH BASE -0x18 U+2191 <- # UPWARDS ARROW -0x19 U+2193 <- # DOWNWARDS ARROW -0x1A U+2192 <- # RIGHTWARDS ARROW -0x1B U+2190 <- # LEFTWARDS ARROW -0x1C U+221F <- # RIGHT ANGLE -0x1D U+2194 <- # LEFT RIGHT ARROW -0x1E U+25B2 <- # BLACK UP-POINTING TRIANGLE -0x1F U+25BC <- # BLACK DOWN-POINTING TRIANGLE -0x5A U+017D <- # LATIN CAPITAL LETTER Z WITH CARON -0x7A U+017E <- # LATIN SMALL LETTER Z WITH CARON -0x80 U+0080 # <control> +0x80 U+20AC # EURO SIGN -0x8E U+008E # <control> +0x8E U+017D # LATIN CAPITAL LETTER Z WITH CARON -0x9E U+009E # <control> +0x9E U+017E # LATIN SMALL LETTER Z WITH CARON +0xA2 U+20A1 <- # COLON SIGN
[35]
Webにおける文字コードの US-ASCII
や ISO-8859-1
は
Windows-1252
です。
[16] IBM CP922 は、 ISO/IEC 8859-1 を一部改変したものです。
[1] ISO/IEC 8859-15 は実質的な ISO/IEC 8859-1 の改訂版で、非常によく似ていますが、 文字の入れ替えがあって互換性はありません。
[4]
ASCII は狭義にはASCII印字可能文字 ([ 0x20, 0x7E ])、
広義には制御文字含み ([ 0x00, 0x7F ])
ですが、いずれにせよ本来は7ビット符号です。
MIME charset 等の us-ascii
は ASCII を表しています。
[5]
ISO/IEC 8859-1 は ASCII に更に G1 = GR にラテン文字等を追加した8ビット符号です。
MIME charset 等の iso-8859-1
は ISO/IEC 8859-1 を表しています。
[6] Windows-1252 は ISO/IEC 8859-1 の CR に独自の図形文字を割り当てたものです。 ISO/IEC 8859 には適合しない Windows の独自の実装です。
[7]
Windows-1252 は ISO/IEC 8859-1 と厳密には異なり互換性がないものですが、
平成時代半ばごろの Web の実態に基づき Encoding Standard
は us-ascii
や iso-8859-1
などを Windows-1252 の別名とみなしています。
[9]
1対1対応部分についていえば
Windows-1252
と
ICU の ibm-5348_P100-1997
,
aix-IBM_1252-4.3.6
は同じです。
[10]
ICU の ibm-1252_P100-2000
は Windows-1252 の旧版で、ユーロ記号がないなど少し違いがあります。
[11]
ISO/IEC 8859-15 は ISO/IEC 8859-1 と共通部分が多いですが、
G1 の一部の図形文字が違っています。
Encoding Standard の ISO-8859-15、
Unicode Consortium の ISO/IEC 8859-15 変換表、
ICU の ibm-923_P100-1998
は1対1対応部分についていえば同じです。
[14]
CP922 は ISO/IEC 8859-1 を一部改変したものです。
改変部分は Windows-1257 / ISO/IEC 8859-13 と同じ形に変更されています。
改変のためにどちらとも互換性がありません。
ICU に ibm-922_P100-1999
があります。
[18]
CP902 は CP922 を一部改変したもので、ユーロ記号への差し替えがあります。
ICU に ibm-902_P100-1999
があります。
差し替えのためにいずれとも互換性がありません。
[19] ISO/IEC 8859-9 と Windows-1254 は、 ISO/IEC 8859-1 と Windows-1252 の一部を改変したものです。 改変のためにいずれとも互換性がありません。
[12] ISO/IEC 8859-2 は ISO/IEC 8859-1 と共通部分が多いですが、違いもちらほらあります。 互換性はありません。
[20] この他に ISO/IEC 8859-3, ISO/IEC 8859-4, ISO/IEC 8859-10, ISO/IEC 8859-13, ISO/IEC 8859-14, ISO/IEC 8859-16 がラテン文字用符号で ISO/IEC 8859-1 との類似性が意識されて設計されているようですが、 違いがかなり多いです。
[21] 同様に Windows-1250, Windows-1254, Windows-1257, Windows-1258, Windows-1270 はラテン文字用符号で Windows-1260 との類似性が意識されて設計されているようですが、 違いがかなり多いです。
[13]
Unicode の [ U+0000
, U+00FF
] は
ISO/IEC 8859-1 と同じです。
変換は容易ですが、 ISO/IEC 8859-1 が8ビット符号であるのに対し
Unicode の一般的な符号化方式のいずれもそうではないため、
符号化文字集合としての互換性はありません。