JIS X 0202

ISO/IEC 2022 符号拡張法 (文字コード)

[12] ISO/IEC 2022 Character Code Structure and Extension Techniques (文字符号の構造及び拡張法) (旧: Code Extension Techniques (情報交換用符号の拡張法) ) は、 符号拡張法、 すなわち ISO/IEC 646 で表現できない様々な符号化文字を使う手法を規定する ISO/IEC国際標準でした。

仕様書

[4] 最終改訂は1994年。改訂を経るごとに複雑になってきている。

標準化団体

[16] 標準化ISO/IEC JTC1/SC2/WG3 が担当していました。

固定符号化文字

[2] ISO/IEC 2022 の世界では、常に特定のビット組合せに結び付けられている符号化文字が3つあります。 (ISO/IEC 2022:1994 6.2 参照。)

略称名前符号表現
DELDELETE07/15
ESCESCAPE01/11
SPSPACE02/00

ただし、逆に、特定の文字が特定ビット組合せに結び付けられているのは、このうちの ESCAPE01/11 だけです。 (02/0007/15 は、 96集合 や96n 集合が GL に呼出されている時には図形文字 (の一部) になります。)

[19] 制御文字の利用については別に ISO/IEC 6429 で定められていました。 ISO/IEC 2022 では C0C1 にそれ以外の制御文字集合を使うことを認めていましたが、 符号拡張法で使う ESCAPE の用法が ISO/IEC 2022 で定められているなど、 ISO/IEC 2022ISO/IEC 6429 は密接に関係していました。

文字集合

[3] ISO/IEC 2022 の世界で扱う (指示する) ことのできる符号化文字集合は、その大きさと割当てる図形文字の種類で 6種類に分けられます。

この他に ISO/IEC 2022 の世界で扱うことのできる符号化文字としては単独制御文字があります。 また、 DOCS を使うと ISO/IEC 2022 の外の世界の符号化文字を間接的に扱うことができます。

プロファイル

[18] ISO/IEC 2022情報交換の当事者間の合意によって決定されるべきオプションを大量に含む (むしろ規定のほとんどがそうなのではないかと思われる) 「曖昧」な仕様でした。 完全な実装が存在したのか不明で、存在し得るのかも不明です。

[17] 元々完全実装を想定したものではなくて、環境によって 必要なだけ部分実装して使われるもので、実際に ISO/IEC 2022 の仕組みの一部を取り出した代表的な符号化方式に、 junetコード, EUC (拡張 Un*x 符号), X Window Systemctext, ISO/IEC 8859 系列などがある。

改訂によるおもな変更点

ISO 2022‐1973 (JIS C 6228‐1975)

  • [6] 最初の版

ISO 2022‐1982 (JIS C 6228‐1984 → JIS X 0202‐1984)

ISO 2022-1986 (JIS X 0202‐1991)

  • [10] G4MDZ が ESC 02/04 F から ESC 02/04 02/08 F に変更
  • [9] 96集合が導入される
  • [11] ESC 2/4 2/12 Fが削除される

ISO/IEC 2022:1994 (JIS X 0202:1998)

  • 規格本文が全面的に書き直された。 (C.1)
  • 符号識別機能名前と略号が与えられた。 (C.2)
  • 一意な符号化のための仕様が追加された。 (C.4)
  • 単独シフトの後のビット組合せ (単独シフト領域のビット組合せ) が GL でも GR でもいいことが明記された。 (C.5)
  • ISO/IEC4873 を基にした実装水準が規定された。 (C.6)
  • ASN.1 構文による表現が規定された。 (C.8)

(JIS X 0202:1998 附属書C)

対応国内規格

[13] JIS 版 (IDT) は JIS X 0202 (旧 JIS C 6228)。

JIS ISO/IECJIS 規格名称 JIS 発行
JIS C 6228-1975ISO 2022:(初版)情報交換用符号の拡張法1975-03
JIS C 6228-1984 (JIS X 0202-1984)情報交換用符号の拡張法1984-11
JIS X 0202-1991ISO 2022:1986情報交換用符号の拡張法
JIS X 0202:1998ISO/IEC 2022:1994情報技術—文字符号の構造及び拡張法

[14] ECMA 版は ECMA 35

[5] CNS 版は

  1. CNS 7654 (C 5123, X 5006) ‐1989 資訊處理 —— 七位元及八位元碼字元集 —— 延碼技術 制定。
  2. CNS 7654 (X 5006) 資訊技術 —— 字元碼結構及延伸技術 (Information technology —— Character code structure and extension techniques) 改訂。

メモ

[15] UTS #22: CharMapML () http://www.unicode.org/reports/tr22/tr22-8.html#ISO_2022