[1] 8‐Bit Single‐Byte Coded Graphic Character Sets (8ビットの1バイト符号化図形文字集合群)
部:版 | 出版日 | GR Ft | ECMA | GB | CNS | |
---|---|---|---|---|---|---|
1:1987 | Latin Alphabet No. 1 | 04/01 | 94:1986 | GB/T 15273.1‐1994 | CNS 13246 (X 5023)‐82 (1993) | |
1:1998 | 1998-04-15 | Latin Alphabet No. 1 | 04/01 | |||
2:1987 | Latin Alphabet No. 2 | 04/02 | 94:1986 | GB/T 15273.2‐1995 | CNS 13247 (X 5024)‐82 (1993) | |
2:1999 | 1999-01-15 | Latin Alphabet No. 2 | 04/02 | |||
3:1988 | Latin Alphabet No. 3 | 04/03 | 94:1986 | GB/T 15273.3‐1995 | CNS 13325 (X 5028)‐82 (1993) | |
3:1999 | 1999-01-15 | Latin Alphabet No. 3 | 04/03 | |||
4:1988 | Latin Alphabet No. 4 | 04/04 | 94:1986 | GB/T 15273.4‐1995 | CNS 13326 (X 5029)‐82 (1993) | |
4:1998 | 1998-07-01 | Latin Alphabet No. 4 | 04/04 | |||
5:1988 | Latin/Cyrillic Alphabet | 04/12 | 113:(2nd) | CNS 13327 (X 5030)‐82 (1993) | ||
5:1999 | 1999-01-15 | Latin/Cyrillic Alphabet | 04/12 | 113:1999 | ||
6:1987 | Latin/Arabic Alphabet | 04/07 | 114:1986 | CNS 13384 (X 5034)‐83 (1994) | ||
6:1999 | 1999-01-15 | Latin/Arabic Alphabet | 04/07 | |||
7:1987 | Latin/Greek Alphabet | 04/06 | 118:1986 | GB/T 15273.7‐1996 | CNS 13385 (X 5035)‐83 (1994) | |
7:2003 | 2003-10-15 | Latin/Greek alphabet | ||||
8:1988 | Latin/Hebrew Alphabet | 04/08 | 121:1987 | CNS 13386 (X 5036)‐83 (1994) | ||
8:1999 | 1999-01-15 | Latin/Hebrew Alphabet | 05/13 | |||
9:1989 | Latin Alphabet No. 5 | 04/13 | 128 | CNS 13328 (X 5031)‐82 (1993) | ||
9:1999 | 1999-01-15 | Latin Alphabet No. 5 | 04/13 | 128:1999 | ||
10:1992 | Latin Alphabet No. 6 | 144:1992 | ||||
10:1998 | 1998-07-15 | Latin Alphabet No. 6 | ||||
11:2001 | 2001-12-15 | Latin/Thai Alphabet | TIS620-2533 + NBSP | |||
13:1998 | 1998-10-15 | Latin Alphabet No. 7 (Baltic Rim) | ||||
14:1998 | 1998-11-15 | Latin Alphabet No. 8 (Celtic) | 05/15 | |||
15:1999 | 1999-03-15 | Latin Alphabet No. 9 | 06/02 | |||
16:2001 | 2001-07-15 | Latin Alphabet No. 10 | 06/06 | SR 14111:1998 |
[2] ISO/IEC 2022 の一応用であり、 ISO/IEC 4873 の実装水準1 に適合します。また、 EUC の一実装とも見なされます。
7ビットの範囲 0/0
〜7/15
(CL + GL) は、
ASCII = ISO/IEC 646:1991 IRV と同じです。
10/0
〜15/15
(GR) に96図形文字集合が指示・
呼出された状態です。指示・呼出・告知列などは使用しません。
文字 CR
や BS
を使った重ね打ちは禁止されています。
結合文字を使った文字合成を使用しません。
[3]
多くの部では 10/0
に NBSP
を、
10/13
に SHY
を割り当てています。
6 は Arabic で、語頭形などの変化が必要ですが、
文脈分析が必要だけどこの規格の適用範囲外なのねん
だそーな。
6 で 3/0
〜3/9
が Arabic script の digit
の代替字形が規定されてます (西洋のアラビア数字と、どちらでもよい)。
6 Arabic と 8 Hebrew は右横書きが混在します。
6 では 2/8
, 2/9
, 3/12
, 3/14
,
5/11
, 5/13
, 7/11
, 7/13
(括弧と不等号) は制御機能の先行無しに鏡像になります。
8 にはそんな話は出てきません。
右横書きをどう扱うかについての話は出てきません。
[19] SI 1311 (1989) は ISO/IEC 8859-8。
[7]
ECMA-94:1986 は ISO/IEC 8859‐1〜4 に相当するのですが
(文章・規定自体がどの程度一致しているのかはわかりません)、
ECMA-94 は符号化文字データ要素の適合性をほとんど規定していません。
適合性の条項にあるのは実装に対する適合性の規定だけです。
唯一、適用範囲の条項に、合成文字の符号化表現のために
BACKSPACE
や CARRIAGE RETURN
のような制御機能を使うことを禁止すると述べられています。
(名無しさん)
[8] >>7 あと、 Latin3 と Latin4 については空き領域は使用してはならない (shall not) という条項がありました。なので、 明記はされていませんが、符号化文字データ要素 (あるいは情報交換) の適合性は一応定義されているといえます。
[9] IANA charset では多くの部について ISO-8859-n
という名前が登録されています。
[10] XML の符号化名としては特に ISO-8859-n
が ISO/IEC 8859 の第n部を表すと定義されています。
[24]
ISO/IEC 8859-6 (アラビア文字)
と
ISO/IEC 8859-8 (ヘブライ文字)
は
bidi
の関係で事情が複雑になっています。
[16] かつてはHTTPヘッダーは ISO-8859-1 と定義されていました。
[17] かつては HTTP における text/*
charset
の既定値は
ISO-8859-1 とされていました。
[18] gzip のファイル名やコメントは ISO 8859-1 とされています。
[11] Final Text of DIS 8859-1, 8-bit single-byte coded graphic character sets -- Part 1: Latin alphabet No.1 ( 版) http://www.open-std.org/JTC1/SC2/WG3/docs/n411.pdf
[12] () ftp://std.dkuug.dk/JTC1/sc2/wg3/docs/n411.pdf
[23] RFC 1494 - Equivalences between 1988 X.400 and RFC-822 Message Bodies (, ) https://tools.ietf.org/html/rfc1494#section-7.2
[41] n436.pdf, , http://std.dkuug.dk/jtc1/sc2/wg3/docs/n436.pdf
[44] n442.pdf, , http://std.dkuug.dk/jtc1/sc2/wg3/docs/n442.pdf
[55] n467.pdf, , http://std.dkuug.dk/jtc1/sc2/wg3/docs/n467.pdf
[56] n466.pdf, , http://std.dkuug.dk/jtc1/sc2/wg3/docs/n466.pdf
[61] n505.pdf, , http://std.dkuug.dk/jtc1/sc2/wg3/docs/n505.pdf
[62] n510.pdf, , http://std.dkuug.dk/jtc1/sc2/wg3/docs/n510.pdf