KS X 1006:2003

ISO/IEC 4873

[1] ISO/IEC 4873 8‐Bit Coded Character Set Structure and Rules (8ビット符号化文字集合の構造と規則) は、8ビット符号の構造を定めた国際規格です。

[10] 最新版は 1991年に発行されていました。

[2] ISO/IEC 4873規定する符号構造は、 ISO/IEC 2022 に基づきます。この構造に基づいた具体的な符号化文字集合の例として、 ISO/IEC 8859 があります。

仕様書

[11] ECMA 版 (IDT) は ECMA 43 です。

[12] 00000001.PDF - 179.pdf, , https://www.itscj.ipsj.or.jp/iso-ir/179.pdf

[29] GB/T 11383 は、 ISO/IEC 4873 に対応する中共国家規格です。

[30] GB 11383‐89 信息処理 信息交換用八位代碼結[木匂]和編碼規則 は ISO 4873:1986 に対応しており、 1989-06-12 に発布され、 1990-01-01 に実施されました。

[14] CNS 7656

[31] KS X 1006:2003MOD ISO 4873:1991 です。

[32] なぜ IDT でないのか明記されておらずぱっとみではわからない。

ISO/IEC 4873 の8ビット符号

[3] ISO/IEC 4873 に適合する符号は、次のような構造を持ちます ISO/IEC 4873:1991 6

名前符号位置明示的呼出メモ
C0 集合00/0000/13, 01/0001/15なし実装水準1以上
SPACE02/00なし実装水準1以上
G0 集合02/0107/14なし実装水準1以上
DELETE07/15なし実装水準1以上
C1 集合08/0009/15なし実装水準1以上, 実装水準2以上では空集合以外
G1 集合10/0015/15実装水準1以上, 実装水準2以上では空集合以外
G2 集合実装水準2以上
G3 集合実装水準2以上

C0 集合

[4] CL = C0 は、 2符号位置 00/1400/15 (普通 LS1LS0 に使われます。) の使用が禁止されており、 01/11 が制御文字 ESCAPE に固定されているほかは、割当は自由です。 ISO/IEC 4873:1991 7.1

[25] 初版では ISO/IEC 646C0 に固定されていました。

G0 集合

[5] GL = G0 は、 ISO/IEC 646 国際基準版 (IRV) と同じです ISO/IEC 4873:1991 7.4

[22] なぜか ISO/IEC 646 を参照せず、同等の内容が規定されています。

[21] ISO 4873-1985 では完全には規定されていませんでした。 ISO/IEC 646の版が使えることになっていました。

[23] なぜか ISO 646 を参照せず、同等の内容が規定されていました。

[24] ISO 4873 の初版では、 情報交換の当事者間の合意がない時の既定の版も定められており、 それは旧IRVと同等のものでした。

C1 集合

[6] CR = C1 は、 SS2SS3 を使う場合には、 それぞれ 08/1408/15 に割当てなければなりません。使わない場合は、 両符号位置は使用禁止となっています。他の符号位置は自由です。 ISO/IEC 4873:1991 7.6

G2, G3

[26] G2, G3 は第2版で追加されました。

図形文字の一意な符号化

[7] 図形文字の一意な符号化のため、 同じ名前図形文字は、 G 番号の一番小さな集合に属する符号位置を使います。 ISO/IEC 4873:1991 9.2

実装水準の識別

[8] 実装水準の識別には、 ISO/IEC 2022告知シーケンスを使います。 終端バイト04/1204/14 がそれぞれ実装水準 1 〜 3 に割当てられています。 ISO/IEC 4873:1991 10.2, ISO/IEC 2022 告知シーケンス

[9] 情報交換の途中で文字集合を替える場合や実装水準を変える場合には、 そこで実装水準の告知列と C / G 集合の指示列を入れる必要があります。 ISO/IEC 4873:1991 10.4, 10.5

[27] 実装水準は第2版で追加されました。

合成文字

[19] GCC を使うことが出来ます。

[18] 重ね打ちは使ってはなりません。 重ね打ち

[28] 以前の版では GCC の利用は定められておらず、 重ね打ちが使えるとされていました。

メモ

[20] RFC 1502 - X.400 Use of Extended Character Sets, , https://tools.ietf.org/html/rfc1502#page-9

NOTE: At the time of this writing, few applications that use ISO 4873 level 2 and level 3 encoding exist. It has been estimated that implementing them in an application that already uses a rich repertoire of characters is a matter of programmer-days, not programmer-months, but this has not been proven.