[1] EUC (拡張 UNIX 符号) は、 UNIX で ASCII と互換性を保ちつつ非ASCII文字を使うための枠組みとして考案された符号化方式です。
0x00
〜0x1F
0x20
SPACE
0x21
〜0x7E
0x7F
DELETE
0x80
〜0x9F
0x8E
は SS2
,
0x8F
は SS3
)1*(0xA0
〜0xFF
)
0x8E
1*(0xA0
〜0xFF
)
0x8F
1*(0xA0
〜0xFF
)
ただし、 G1, G2, G3 は任意の 94 または 96 の図形文字集合をそれぞれ高々1つずつ使用します。 図形文字集合は1バイトに限らず、2バイトでも3バイトでもそれ以上でも構いません。 (どんな図形文字集合の組合せを使うかによって、 具体的な符号化文字集合が確定します。)
[3] EUC の符号の構造は、 ASCII と互換であること (ASCII と同じオクテットは常に ASCII と同じ文字を表すこと) と ISO/IEC 2022 と互換であること (EUC のオクテット列は ISO/IEC 2022 のオクテット列でもあること) が大きな特徴となっています。この特徴から、 EUC の制定以前から使われていた UNIX のソフトウェアを修正せずとも EUC が使えます。
通称 | G1 | G2 | G3 |
---|---|---|---|
古い日本語EUC | JIS X 0208‐1983 (2バイト) | JIS X 0201 片仮名用図形文字集合 (1バイト) | 外字 (予約) |
EUC-JP | JIS X 0208‐1990 (2バイト) | JIS X 0201 片仮名用図形文字集合 (1バイト) | JIS X 0212‐1990 (2バイト) |
eucJP-open | JIS X 0208‐1990 (2バイト) | JIS X 0201 片仮名用図形文字集合 (1バイト) | JIS X 0212‐1990 および拡張文字 (2バイト) |
EUC-JISX0213 | JIS X 0213:2000 第1面 (2バイト) | (JIS X 0201 片仮名用図形文字集合 (1バイト)) | JIS X 0213:2000 第2面 (2バイト) |
EUC-JIS-2004 | JIS X 0213:2004 第1面 (2バイト) | (JIS X 0201 片仮名用図形文字集合 (1バイト)) | JIS X 0213:2004 第2面 (2バイト) |
EUC-CN | GB 2312‐80 (2バイト) | (使用しない) | (使用しない) |
EUC-KR | KS X 1001 (2バイト) | (使用しない) | (使用しない) |
EUC-TW | CNS 11643‐1992 第1面 (2バイト) | CNS 11643‐1992 第2面 (2バイト) | CNS 11643‐1992 の残りの面 (3バイト) |
EUC-CCCII-FT | |||
EUC-KP | |||
ISO/IEC 8859 各部 | ISO/IEC 8859 各部右半面 (1バイト) | (使用しない) | (使用しない) |
TIS 620 | TIS 620 右半面 (1バイト) | (使用しない) | (使用しない) |