ISO/IEC8859

ISO/IEC 8859

[1] 8‐Bit Single‐Byte Coded Graphic Character Sets ([8ビットの1バイト符号化図形文字集合群)

部:版出版日GR FtECMAGBCNS
1:1987Latin Alphabet No. 104/0194:1986GB/T 15273.1‐1994CNS 13246 (X 5023)‐82 (1993)
1:19981998-04-15Latin Alphabet No. 104/01
2:1987Latin Alphabet No. 204/0294:1986GB/T 15273.2‐1995CNS 13247 (X 5024)‐82 (1993)
2:19991999-01-15Latin Alphabet No. 204/02
3:1988Latin Alphabet No. 304/0394:1986GB/T 15273.3‐1995CNS 13325 (X 5028)‐82 (1993)
3:19991999-01-15Latin Alphabet No. 304/03
4:1988Latin Alphabet No. 404/0494:1986GB/T 15273.4‐1995CNS 13326 (X 5029)‐82 (1993)
4:19981998-07-01Latin Alphabet No. 404/04
5:1988Latin/Cyrillic Alphabet04/12113:(2nd)CNS 13327 (X 5030)‐82 (1993)
5:19991999-01-15Latin/Cyrillic Alphabet04/12113:1999
6:1987Latin/Arabic Alphabet04/07114:1986CNS 13384 (X 5034)‐83 (1994)
6:19991999-01-15Latin/Arabic Alphabet04/07
7:1987Latin/Greek Alphabet04/06118:1986GB/T 15273.7‐1996CNS 13385 (X 5035)‐83 (1994)
7:20032003-10-15Latin/Greek alphabet
8:1988Latin/Hebrew Alphabet04/08121:1987CNS 13386 (X 5036)‐83 (1994)
8:19991999-01-15Latin/Hebrew Alphabet05/13
9:1989Latin Alphabet No. 504/13128CNS 13328 (X 5031)‐82 (1993)
9:19991999-01-15Latin Alphabet No. 504/13128:1999
10:1992Latin Alphabet No. 6144:1992
10:19981998-07-15Latin Alphabet No. 6
11:20012001-12-15Latin/Thai AlphabetTIS620-2533 + NBSP
13:19981998-10-15Latin Alphabet No. 7 (Baltic Rim)
14:19981998-11-15Latin Alphabet No. 8 (Celtic)05/15
15:19991999-03-15Latin Alphabet No. 906/02
16:20012001-07-15Latin Alphabet No. 1006/06SR 14111:1998

[2] ISO/IEC 2022 の一応用であり、 ISO/IEC 4873 の実装水準1 に適合します。また、 EUC の一実装とも見なされます。

7ビットの範囲 0/07/15 (CL + GL) は、 ASCII = ISO/IEC 646:1991 IRV と同じです。

10/015/15 (GR) に96図形文字集合が指示呼出された状態です。指示・呼出・告知列などは使用しません。

文字 CRBS を使った重ね打ちは禁止されています。 結合文字を使った文字合成を使用しません。

[3] 多くの部では 10/0NBSP を、 10/13SHY を割り当てています。

6 は Arabic で、語頭形などの変化が必要ですが、 文脈分析が必要だけどこの規格の適用範囲外なのねんだそーな。

6 で 3/03/9 が Arabic script の digit の代替字形が規定されてます (西洋のアラビア数字と、どちらでもよい)。

6 Arabic と 8 Hebrew は右横書きが混在します。

6 では 2/8, 2/9, 3/12, 3/14, 5/11, 5/13, 7/11, 7/13 (括弧不等号) は制御機能の先行無しに鏡像になります。 8 にはそんな話は出てきません。

右横書きをどう扱うかについての話は出てきません。

8:1999 には LRMRLM が追加されました。

[7] ECMA-94:1986 は ISO/IEC 8859‐1〜4 に相当するのですが (文章・規定自体がどの程度一致しているのかはわかりません)、 ECMA-94符号化文字データ要素適合性をほとんど規定していません。 適合性条項にあるのは実装に対する適合性の規定だけです。 唯一、適用範囲条項に、合成文字符号化表現のために BACKSPACECARRIAGE RETURN のような制御機能を使うことを禁止すると述べられています。

(名無しさん)

[8] >>7 あと、 Latin3Latin4 については空き領域は使用してはならない (shall not) という条項がありました。なので、 明記はされていませんが、符号化文字データ要素 (あるいは情報交換) の適合性は一応定義されているといえます。

IANA charset

[9] IANA charset では多くの部について ISO-8859-n という名前が登録されています。

[10] XML符号化名としては特に ISO-8859-nISO/IEC 8859 の第n部を表すと定義されています。

詳しくはXMLにおける文字コードを参照。

文脈

[16] かつてはHTTPヘッダーISO-8859-1 と定義されていました。

[17] かつては HTTP における text/* charset の既定値は ISO-8859-1 とされていました。

[18] gzipファイル名やコメントは ISO 8859-1 とされています。

関連

[13] 同型符号化同型復号も参照。

メモ

[11] Final Text of DIS 8859-1, 8-bit single-byte coded graphic character sets -- Part 1: Latin alphabet No.1 ( 版) <http://www.open-std.org/JTC1/SC2/WG3/docs/n411.pdf>

[12] () <ftp://std.dkuug.dk/JTC1/sc2/wg3/docs/n411.pdf>

[14] () <https://upload.wikimedia.org/wikipedia/commons/3/3a/Bahia_Municip_Itapicuru.svg>

<?xml version="1.0" encoding="iso-8859-1"?>

[15] ただし先頭に BOM あり