[1] 8‐Bit Single‐Byte Coded Graphic Character Sets (8ビットの1バイト符号化図形文字集合群)
| 部:版 | 出版日 | GR Ft | ECMA | GB | CNS | |
|---|---|---|---|---|---|---|
| 1:1987 | Latin Alphabet No. 1 | 04/01 | 94:1986 | GB/T 15273.1‐1994 | CNS 13246 (X 5023)‐82 (1993) | |
| 1:1998 | 1998-04-15 | Latin Alphabet No. 1 | 04/01 | |||
| 2:1987 | Latin Alphabet No. 2 | 04/02 | 94:1986 | GB/T 15273.2‐1995 | CNS 13247 (X 5024)‐82 (1993) | |
| 2:1999 | 1999-01-15 | Latin Alphabet No. 2 | 04/02 | |||
| 3:1988 | Latin Alphabet No. 3 | 04/03 | 94:1986 | GB/T 15273.3‐1995 | CNS 13325 (X 5028)‐82 (1993) | |
| 3:1999 | 1999-01-15 | Latin Alphabet No. 3 | 04/03 | |||
| 4:1988 | Latin Alphabet No. 4 | 04/04 | 94:1986 | GB/T 15273.4‐1995 | CNS 13326 (X 5029)‐82 (1993) | |
| 4:1998 | 1998-07-01 | Latin Alphabet No. 4 | 04/04 | |||
| 5:1988 | Latin/Cyrillic Alphabet | 04/12 | 113:(2nd) | CNS 13327 (X 5030)‐82 (1993) | ||
| 5:1999 | 1999-01-15 | Latin/Cyrillic Alphabet | 04/12 | 113:1999 | ||
| 6:1987 | Latin/Arabic Alphabet | 04/07 | 114:1986 | CNS 13384 (X 5034)‐83 (1994) | ||
| 6:1999 | 1999-01-15 | Latin/Arabic Alphabet | 04/07 | |||
| 7:1987 | Latin/Greek Alphabet | 04/06 | 118:1986 | GB/T 15273.7‐1996 | CNS 13385 (X 5035)‐83 (1994) | |
| 7:2003 | 2003-10-15 | Latin/Greek alphabet | ||||
| 8:1988 | Latin/Hebrew Alphabet | 04/08 | 121:1987 | CNS 13386 (X 5036)‐83 (1994) | ||
| 8:1999 | 1999-01-15 | Latin/Hebrew Alphabet | 05/13 | |||
| 9:1989 | Latin Alphabet No. 5 | 04/13 | 128 | CNS 13328 (X 5031)‐82 (1993) | ||
| 9:1999 | 1999-01-15 | Latin Alphabet No. 5 | 04/13 | 128:1999 | ||
| 10:1992 | Latin Alphabet No. 6 | 144:1992 | ||||
| 10:1998 | 1998-07-15 | Latin Alphabet No. 6 | ||||
| 11:2001 | 2001-12-15 | Latin/Thai Alphabet | TIS620-2533 + NBSP | |||
| 13:1998 | 1998-10-15 | Latin Alphabet No. 7 (Baltic Rim) | ||||
| 14:1998 | 1998-11-15 | Latin Alphabet No. 8 (Celtic) | 05/15 | |||
| 15:1999 | 1999-03-15 | Latin Alphabet No. 9 | 06/02 | |||
| 16:2001 | 2001-07-15 | Latin Alphabet No. 10 | 06/06 | SR 14111:1998 |
[41] n436.pdf, , http://std.dkuug.dk/jtc1/sc2/wg3/docs/n436.pdf
[44] n442.pdf, , http://std.dkuug.dk/jtc1/sc2/wg3/docs/n442.pdf
[55] n467.pdf, , http://std.dkuug.dk/jtc1/sc2/wg3/docs/n467.pdf
[56] n466.pdf, , http://std.dkuug.dk/jtc1/sc2/wg3/docs/n466.pdf
[61] n505.pdf, , http://std.dkuug.dk/jtc1/sc2/wg3/docs/n505.pdf
[62] n510.pdf, , http://std.dkuug.dk/jtc1/sc2/wg3/docs/n510.pdf
[11] Final Text of DIS 8859-1, 8-bit single-byte coded graphic character sets -- Part 1: Latin alphabet No.1 ( 版) http://www.open-std.org/JTC1/SC2/WG3/docs/n411.pdf
[2] ISO/IEC 2022 の一応用であり、 ISO/IEC 4873 の実装水準1 に適合します。また、 EUC の一実装とも見なされます。
7ビットの範囲 0/0〜7/15 (CL + GL) は、
ASCII = ISO/IEC 646:1991 IRV と同じです。
10/0〜15/15 (GR) に96図形文字集合が指示・
呼出された状態です。指示・呼出・告知列などは使用しません。
文字 CR や BS を使った重ね打ちは禁止されています。
結合文字を使った文字合成を使用しません。
[3]
多くの部では 10/0 に NBSP を、
10/13 に SHY を割り当てています。
6 は Arabic で、語頭形などの変化が必要ですが、
文脈分析が必要だけどこの規格の適用範囲外なのねん
だそーな。
6 で 3/0〜3/9 が Arabic script の digit
の代替字形が規定されてます (西洋のアラビア数字と、どちらでもよい)。
6 Arabic と 8 Hebrew は右横書きが混在します。
6 では 2/8, 2/9, 3/12, 3/14,
5/11, 5/13, 7/11, 7/13
(括弧と不等号) は制御機能の先行無しに鏡像になります。
8 にはそんな話は出てきません。
右横書きをどう扱うかについての話は出てきません。
[19] SI 1311 (1989) は ISO/IEC 8859-8。
[7]
ECMA-94:1986 は ISO/IEC 8859‐1〜4 に相当するのですが
(文章・規定自体がどの程度一致しているのかはわかりません)、
ECMA-94 は符号化文字データ要素の適合性をほとんど規定していません。
適合性の条項にあるのは実装に対する適合性の規定だけです。
唯一、適用範囲の条項に、合成文字の符号化表現のために
BACKSPACE や CARRIAGE RETURN
のような制御機能を使うことを禁止すると述べられています。
(名無しさん)
[8] >>7 あと、 Latin3 と Latin4 については空き領域は使用してはならない (shall not) という条項がありました。なので、 明記はされていませんが、符号化文字データ要素 (あるいは情報交換) の適合性は一応定義されているといえます。
ISO-8859-* とその派生[65] MIME charset "ISO-8859-X" は、 ISO/IEC8859 の第X部の charset を表します >>63。 X は RFC 2046 の発行の時点で 1 ~ 10 が定義されていた >>63 そうですが、それは嘘です。 まあともかく、今では 16 くらいまであります。 See ISO/IEC8859 and [IANAREG]。
[67] ISO/IEC 8859 の新しい部が出来たら、 [IANAREG] に登録されなくても 使えるんですかね? ここで「定義」されてるから。わかりませんが。
[66] 左半分は US-ASCII と同じです >>63。 (ISO-8859-6 の左半分は 違うような気がしないでもないけど。)
[68] CR 領域の文字は、意味を割り当てられていません >>63。
[70] ISO-8859-6 と ISO-8859-8 は左右横書き混在ですが、その辺の話は RFC 1556 にあります >>63。
[71] シフト機能やエスケープ機能は使用しません。その意味は未定義です。 >>63
[23] RFC 1494 - Equivalences between 1988 X.400 and RFC-822 Message Bodies (, ) https://tools.ietf.org/html/rfc1494#section-7.2
[9] IANA charset では多くの部について ISO-8859-n
という名前が登録されています。
[10] XML の符号化名としては特に ISO-8859-n
が ISO/IEC 8859 の第n部を表すと定義されています。
<?xml version="1.0" encoding="iso-8859-1"?>
[72]
Web の iso-8859-1 は windows-1252 の別名の1つです。
[24]
ISO/IEC 8859-6 (アラビア文字)
と
ISO/IEC 8859-8 (ヘブライ文字)
は
bidi
の関係で事情が複雑になっています。
[16] かつてはHTTPヘッダーは ISO-8859-1 と定義されていました。
[17] かつては HTTP における text/* charset の既定値は
ISO-8859-1 とされていました。
[18] gzip のファイル名やコメントは ISO 8859-1 とされています。
[73] ISO 8859 Alphabet Soup, , http://czyborra.com/charsets/iso8859.html