符号化図形文字集合

符号化図形文字集合

[22] 図形文字集合 (Graphic character set) (符号化図形文字集合 (coded graphic character set) ) とは、 (主として) 図形文字で構成される符号化文字集合です。

[7] 符号化図形文字集合の種類 JIS X 0202:1998 6.3.1:

[3] 符号化図形文字集合の要件:

ISO/IEC 2022 における符号化図形文字集合の要件

[23] ISO/IEC 2022 では、符号化図形文字集合は、 次のように規定されています。

[26] ISO/IEC 8859‐8:2001 とか、この要件を満たすのか怪しいもんですなあ。

[28] 00000001.PDF - 150.pdf, , https://itscj.ipsj.or.jp/ir/150.pdf

[29] >>28 使用してはならないが、受信したらこのような図形文字と解釈すること、 と定められたビット組合せがあります。

[30] 図形文字なのか怪しい LRM, RLM その他 bidi 系文字が割り当てられた96集合もあります。

[31] 図形文字なのか怪しいものの図形文字とされている NBSP, SHY が割り当てられた96集合は多数あります。 JIS X 0213 にもあります。

[32] ISO-IR外字が認められている例: KS X 1001, JIS X 0212, ISO-IR 165, KPS 9566

Gn

[19] ISO/IEC 2022 では符号化図形文字集合符号要素 Gn (G0, G1, G2, G3) のいずれかに指示され、更に GLGR呼び出しされることによって利用できる状態となります。

指示

[8] 符号要素としての図形文字集合指示について。

[9] 仕様書:

[10] 図形文字集合指示する機能ISO/IEC 2022 では14種類あります。 情報交換の開始時に G0G3 で使用する図形文字集合を識別する場合や 4つ以上の図形文字集合を使用する場合や G0G3 のいずれかに後から異なる図形文字集合指示する必要がある場合に使うことができます JIS X 0202:1998 14.3.1

[12] JIS X 0202:1998 表6

略号名前集合の型符号要素エスケープ・シーケンス出典
GZD4G0-DESIGNATE 94-SET94G0ESC 02/08 *I FISO/IEC 2022
G1D4G1-DESIGNATE 94-SET94G1ESC 02/09 *I FISO/IEC 2022
G2D4G2-DESIGNATE 94-SET94G2ESC 02/10 *I FISO/IEC 2022
G3D4G3-DESIGNATE 94-SET94G3ESC 02/11 *I FISO/IEC 2022
GZD6G0-DESIGNATE 96-SET96G0ESC 02/12 *I F
G1D6G1-DESIGNATE 96-SET96G1ESC 02/13 *I FISO/IEC 2022
G2D6G2-DESIGNATE 96-SET96G2ESC 02/14 *I FISO/IEC 2022
G3D6G3-DESIGNATE 96-SET96G3ESC 02/15 *I FISO/IEC 2022
GZDM4G0-DESIGNATE MULTIBYTE 94-SET94nG0ESC 02/04 02/08 *I F (>>13)ISO/IEC 2022
G1DM4G1-DESIGNATE MULTIBYTE 94-SET94nG1ESC 02/04 02/09 *I FISO/IEC 2022
G2DM4G2-DESIGNATE MULTIBYTE 94-SET94nG2ESC 02/04 02/10 *I FISO/IEC 2022
G3DM4G3-DESIGNATE MULTIBYTE 94-SET94nG3ESC 02/04 02/11 *I FISO/IEC 2022
GZDM6G0-DESIGNATE MULTIBYTE 96-SET96nG0ESC 02/04 02/12 *I F
G1DM6G1-DESIGNATE MULTIBYTE 96-SET96nG1ESC 02/04 02/13 *I FISO/IEC 2022
G2DM6G2-DESIGNATE MULTIBYTE 96-SET96nG2ESC 02/04 02/14 *I FISO/IEC 2022
G3DM6G3-DESIGNATE MULTIBYTE 96-SET96nG3ESC 02/04 02/15 *I FISO/IEC 2022

[13] 例外: ESC 02/04 02/08 04/00, ESC 02/04 02/08 04/01, ESC 02/04 02/08 04/02 ではなくESC 02/04 04/00, ESC 02/04 04/01, ESC 02/04 04/02 とします。 ISO/IEC 2022 の古い版で多バイト集合94n文字集合しかなく、 しかも G0 にしか指示できなかった時にこの 3つの終端バイトが登録されたことに起因します。 JIS X 0202:1998 表6

[14] 各機能は、該当する型の集合を指定された符号要素として指示します。 どの集合かは中間バイト終端バイト (*I F) で識別されます。 ある集合指示すると、 その符号要素指示されていた集合は置き換えられます。 JIS X 0202:1998 14.3.2

[11] これらの指示機能では、 SELECT-DRCS 指示子を使うことができます。 SELECT-DRCS 指示子を使った場合に限って DRCS指示できます。 JIS X 0202:1998 14.3.2

[15] 指示機能の直前に IDENTIFY REVISED REGISTRATION (IRR) を使うことができます。 JIS X 0202:1998 14.3.1

(JIS は誤植で IDENTIFY-RESERVED-REGISTRATION になっています。)

[16] 図形文字集合指示符号要素シフト状態と関係なく行えます。 指定された符号要素シフト状態にあれば、 指示された図形文字集合は直ちに呼出されます。そうでなければ、 次にシフト状態になった時に図形文字集合呼出されます。 JIS X 0202:1998 14.3.2

[17] GnDMm では終端バイトによって集合の型の n が決まります。 JIS X 0202:1998 14.3.3

終端バイト Fn
Fp (03/0003/15)2 以上
04/0005/152
06/0006/153
07/0007/144 以上

[18] >>1707/14 も 4 以上の範囲に入っています。 空集合は4バイトなのでしょうか・・・。

関連

[27] (符号化)図形文字集合に対して、制御文字の集合を、 (符号化)制御文字集合といいます。

メモ

[20] ETS 300 706 - Enhanced Teletext specification - ets_300706e01p.pdf, , https://www.etsi.org/deliver/etsi_i_ets/300700_300799/300706/01_60/ets_300706e01p.pdf#page=73

2/0 SPACE から 7/F までを G0 としていた。

[21] ETS 300 706 - Enhanced Teletext specification - ets_300706e01p.pdf, , https://www.etsi.org/deliver/etsi_i_ets/300700_300799/300706/01_60/ets_300706e01p.pdf#page=126

G1 の特定のビット組合せは、 G0指示されている図形文字集合の同じビット組合せ文字を表すらしい。