CCITT Chinese Set

ISO-IR 165

[1] CCITT Recommendation T.101 の定める Chinese Primary Set (ISO-IR-165, CCITT Chinese Set), 1992年7月13日登録, 1994年9月28日修正。

終端バイト

[2] ISO/IEC 2022 における終端バイト4/5 (E) です。

Annex C の符号化文字集合

[3] 次のような符号化文字集合が定義されているようです。

文字集合

[4] CJK.INF などによると GB 8565.2-88 に更に次の追加があるようです。

  • [5] 06-60〜06-81 に22文字の背景(影)模様を追加
  • [6] 半角ラテン文字 (「Half length graphic characters」) など132字の記号を追加
  • [7] 12区に漢字94文字を追加
  • [8] 13-51〜13-94に漢字44文字を追加
  • [9] 15-94に漢字1文字を追加

[10] 293字追加で合計8443文字となっています。

[11] 追加された漢字は標準電碼本 (修訂本) から52文字、現代漢語通用字表から85文字、 不明2文字とされています。

[12] GB 8565.2-88表A4 と比べて2文字が変更 (0x7C38 U+527A -> U+6F26、 0x7C5A U+6996 -> U+7A40) されているようです。

[13] 一説には GB 6345.1-86 の79区81点の変更が反映されていないとのことですが、 ISO-IR の PDF では反映されています。

[14] ISO-IR の PDF によると88区、89区の空き領域は「may be used to define the correspondence of one simplified form of Chinese characters with multiple forms of Chinese characters」とされており、 GB 12345 による追加分のことと思われます。

[16] GB 2312の拡張も参照。

MIME

[37] MIME charset CN-GB-ISOIR165 RFC 1922

メモ

[15] T.52