部

部:版	出版日		GR `Ft`	ECMA	GB	CNS
1:1987		Latin Alphabet No. 1	04/01	94:1986	GB/T 15273.1‐1994	CNS 13246 (X 5023)‐82 (1993)
1:1998	1998-04-15	Latin Alphabet No. 1	04/01
2:1987		Latin Alphabet No. 2	04/02	94:1986	GB/T 15273.2‐1995	CNS 13247 (X 5024)‐82 (1993)
2:1999	1999-01-15	Latin Alphabet No. 2	04/02
3:1988		Latin Alphabet No. 3	04/03	94:1986	GB/T 15273.3‐1995	CNS 13325 (X 5028)‐82 (1993)
3:1999	1999-01-15	Latin Alphabet No. 3	04/03
4:1988		Latin Alphabet No. 4	04/04	94:1986	GB/T 15273.4‐1995	CNS 13326 (X 5029)‐82 (1993)
4:1998	1998-07-01	Latin Alphabet No. 4	04/04
5:1988		Latin/Cyrillic Alphabet	04/12	113:(2nd)		CNS 13327 (X 5030)‐82 (1993)
5:1999	1999-01-15	Latin/Cyrillic Alphabet	04/12	113:1999
6:1987		Latin/Arabic Alphabet	04/07	114:1986		CNS 13384 (X 5034)‐83 (1994)
6:1999	1999-01-15	Latin/Arabic Alphabet	04/07
7:1987		Latin/Greek Alphabet	04/06	118:1986	GB/T 15273.7‐1996	CNS 13385 (X 5035)‐83 (1994)
7:2003	2003-10-15	Latin/Greek alphabet
8:1988		Latin/Hebrew Alphabet	04/08	121:1987		CNS 13386 (X 5036)‐83 (1994)
8:1999	1999-01-15	Latin/Hebrew Alphabet	05/13
9:1989		Latin Alphabet No. 5	04/13	128		CNS 13328 (X 5031)‐82 (1993)
9:1999	1999-01-15	Latin Alphabet No. 5	04/13	128:1999
10:1992		Latin Alphabet No. 6		144:1992
10:1998	1998-07-15	Latin Alphabet No. 6
11:2001	2001-12-15	Latin/Thai Alphabet		TIS620-2533 + NBSP
13:1998	1998-10-15	Latin Alphabet No. 7 (Baltic Rim)
14:1998	1998-11-15	Latin Alphabet No. 8 (Celtic)	05/15
15:1999	1999-03-15	Latin Alphabet No. 9	06/02
16:2001	2001-07-15	Latin Alphabet No. 10	06/06	SR 14111:1998

[11] Final Text of DIS 8859-1, 8-bit single-byte coded graphic character sets -- Part 1: Latin alphabet No.1 (1998-12-16 18:11:34 +09:00 版) http://www.open-std.org/JTC1/SC2/WG3/docs/n411.pdf

[12] (2017-08-22 11:43:56 +09:00) ftp://std.dkuug.dk/JTC1/sc2/wg3/docs/n411.pdf

符号化文字集合

[2] ISO/IEC 2022 の一応用であり、 ISO/IEC 4873 の実装水準1 に適合します。また、 EUC の一実装とも見なされます。

7ビットの範囲 0/0〜7/15 (CL + GL) は、 ASCII = ISO/IEC 646:1991 IRV と同じです。

10/0〜15/15 (GR) に96図形文字集合が指示・呼出された状態です。指示・呼出・告知列などは使用しません。

文字 CR や BS を使った重ね打ちは禁止されています。結合文字を使った文字合成を使用しません。

[3] 多くの部では 10/0 に NBSP を、 10/13 に SHY を割り当てています。

6 は Arabic で、語頭形などの変化が必要ですが、文脈分析が必要だけどこの規格の適用範囲外なのねんだそーな。

6 で 3/0〜3/9 が Arabic script の digit の代替字形が規定されてます (西洋のアラビア数字と、どちらでもよい)。

6 Arabic と 8 Hebrew は右横書きが混在します。

6 では 2/8, 2/9, 3/12, 3/14, 5/11, 5/13, 7/11, 7/13 (括弧と不等号) は制御機能の先行無しに鏡像になります。 8 にはそんな話は出てきません。

右横書きをどう扱うかについての話は出てきません。

8:1999 には LRM と RLM が追加されました。

[19] SI 1311 (1989) は ISO/IEC 8859-8。

[7] ECMA-94:1986 は ISO/IEC 8859‐1〜4 に相当するのですが (文章・規定自体がどの程度一致しているのかはわかりません)、 ECMA-94 は符号化文字データ要素の適合性をほとんど規定していません。適合性の条項にあるのは実装に対する適合性の規定だけです。唯一、適用範囲の条項に、合成文字の符号化表現のために BACKSPACE や CARRIAGE RETURN のような制御機能を使うことを禁止すると述べられています。

(名無しさん)

[8] >>7 あと、 Latin3 と Latin4 については空き領域は使用してはならない (shall not) という条項がありました。なので、明記はされていませんが、符号化文字データ要素 (あるいは情報交換) の適合性は一応定義されているといえます。

MIME charset `ISO-8859-*` とその派生

MIME

[64] RFC 2046 4.1.2 >>63 の定義:

[65] MIME charset "ISO-8859-X" は、 ISO/IEC8859 の第X部の charset を表します >>63。 X は RFC 2046 の発行の時点で 1 ~ 10 が定義されていた >>63 そうですが、それは嘘です。まあともかく、今では 16 くらいまであります。 See ISO/IEC8859 and [IANAREG]。

[67] ISO/IEC 8859 の新しい部が出来たら、 [IANAREG] に登録されなくても使えるんですかね? ここで「定義」されてるから。わかりませんが。

[66] 左半分は US-ASCII と同じです >>63。 (ISO-8859-6 の左半分は違うような気がしないでもないけど。)

[68] CR 領域の文字は、意味を割り当てられていません >>63。

[69] 出現した場合どう解釈するべきなのかは不明です。

[70] ISO-8859-6 と ISO-8859-8 は左右横書き混在ですが、その辺の話は RFC 1556 にあります >>63。

[71] シフト機能やエスケープ機能は使用しません。その意味は未定義です。 >>63

[63] RFC 2046 - Multipurpose Internet Mail Extensions (MIME) Part Two: Media Types (2015-03-22 13:14:46 +09:00 版) http://tools.ietf.org/html/rfc2046#section-4.1.2

[23] RFC 1494 - Equivalences between 1988 X.400 and RFC-822 Message Bodies (2021-02-15T08:06:13.000Z, 2021-03-13T11:54:14.686Z) https://tools.ietf.org/html/rfc1494#section-7.2

IANA

[9] IANA charset では多くの部について ISO-8859-n という名前が登録されています。

XML

[10] XML の符号化名としては特に ISO-8859-n が ISO/IEC 8859 の第n部を表すと定義されています。詳しくはXMLにおける文字コードを参照。

[14] (2013-10-04 11:15:30 +09:00) https://upload.wikimedia.org/wikipedia/commons/3/3a/Bahia_Municip_Itapicuru.svg

<?xml version="1.0" encoding="iso-8859-1"?>

[15] ただし先頭に BOM あり

Web

Encoding Standard

[72] Web の iso-8859-1 は windows-1252 の別名の1つです。 windows-1252

BIDI

[24] ISO/IEC 8859-6 (アラビア文字) と ISO/IEC 8859-8 (ヘブライ文字) は bidi の関係で事情が複雑になっています。 ISO/IEC 8859-6

文脈

[16] かつてはHTTPヘッダーは ISO-8859-1 と定義されていました。

[17] かつては HTTP における text/* charset の既定値は ISO-8859-1 とされていました。

[18] gzip のファイル名やコメントは ISO 8859-1 とされています。

歴史

[74] Wayback Machine, 2025-11-06T07:57:57.000Z https://web.archive.org/web/20110607062301/http://anubis.dkuug.dk/jtc1/sc2/open/2n2933.pdf

メモ

[73] ISO 8859 Alphabet Soup, 1998-12-01T12:40:01.000Z, 2025-06-16T13:22:43.185Z http://czyborra.com/charsets/iso8859.html

ISO-8859-*

部

符号化文字集合

MIME charset ISO-8859-* とその派生

MIME

IANA

XML

Web

BIDI

文脈

歴史

関連

メモ

MIME charset `ISO-8859-*` とその派生