[1] [DFN@en[EUC]] (拡張 UNIX 符号) は、 [[UNIX]]
で [[ASCII]] と互換性を保ちつつ[[非ASCII文字]]を使うための枠組みとして考案された符号化方式です。

* 符号化文字集合

[2]
EUC [[符号化文字集合]]は次のように構成されます。
:[CODE(char)[0x00]]〜[CODE(char)[0x1F]]:[[C0]]
:[CODE(char)[0x20]]:[CODE(charname)[[[SPACE]]]]
:[CODE(char)[0x21]]〜[CODE(char)[0x7E]]:[[ISO/IEC 646]] [[新IRV]]
[[図形文字集合]]
:[CODE(char)[0x7F]]:[CODE(charname)[[[DELETE]]]]
:[CODE(char)[0x80]]〜[CODE(char)[0x9F]]:[[C1]]
([CODE(char)[0x8E]] は [CODE(charname)[[[SS2]]]],
[CODE(char)[0x8F]] は [CODE(charname)[[[SS3]]]])
:[CODE(ABNF)[1*([CODE(char)[0xA0]]〜[CODE(char)[0xFF]])]]:
[[G1]] ([[図形文字集合]])
:[CODE(ABNF)[[CODE(char)[0x8E]] 1*([CODE(char)[0xA0]]〜[CODE(char)[0xFF]])]]:
[[G2]] ([[図形文字集合]])
:[CODE(ABNF)[[CODE(char)[0x8F]] 1*([CODE(char)[0xA0]]〜[CODE(char)[0xFF]])]]:
[[G3]] ([[図形文字集合]])

ただし、 [[G1]], [[G2]], [[G3]] は任意の [[94]] または [[96]]
の[[図形文字集合]]をそれぞれ高々1つずつ使用します。
図形文字集合は1バイトに限らず、2バイトでも3バイトでもそれ以上でも構いません。
(どんな[[図形文字集合]]の組合せを使うかによって、
具体的な[[符号化文字集合]]が確定します。)

[3] EUC の符号の構造は、 [[ASCII]] と互換であること
([[ASCII]] と同じ[[オクテット]]は常に [[ASCII]]
と同じ[[文字]]を表すこと) と [[ISO/IEC 2022]]
と互換であること ([[EUC]] の[[オクテット列]]は
[[ISO/IEC 2022]] の[[オクテット列]]でもあること) 
が大きな特徴となっています。この特徴から、
EUC の制定以前から使われていた [[UNIX]]
の[[ソフトウェア]]を修正せずとも EUC が使えます。

* EUC の実現値

[4]
,*通称	,*G1	,*G2	,*G3
,古い[[日本語EUC]]	,[[JIS X 0208]]‐1983 (2バイト)	,[[JIS X 0201]] [[片仮名用図形文字集合]] (1バイト)	,[[外字]] (予約)
,[[EUC-JP]]	,[[JIS X 0208]]‐1990 (2バイト)	,[[JIS X 0201]] [[片仮名用図形文字集合]] (1バイト)	,[[JIS X 0212]]‐1990 (2バイト)
,[[eucJP-open]]	,[[JIS X 0208]]‐1990 (2バイト)	,[[JIS X 0201]] [[片仮名用図形文字集合]] (1バイト)	,[[JIS X 0212]]‐1990 および拡張文字 (2バイト)
,[[EUC-JISX0213]]	,[[JIS X 0213]]:2000 第1面 (2バイト)	,([[JIS X 0201]] [[片仮名用図形文字集合]] (1バイト))	,[[JIS X 0213]]:2000 第2面 (2バイト)
,[[EUC-JIS-2004]]	,[[JIS X 0213]]:2004 第1面 (2バイト)	,([[JIS X 0201]] [[片仮名用図形文字集合]] (1バイト))	,[[JIS X 0213]]:2004 第2面 (2バイト)
,[[EUC-CN]]	,[[GB 2312]]‐80 (2バイト)	,(使用しない)	,(使用しない)
,[[EUC-KR]]	,[[KS X 1001]] (2バイト)	,(使用しない)	,(使用しない)
,[[EUC-TW]]	,[[CNS 11643]]‐1992 第1面 (2バイト)	,[[CNS 11643]]‐1992 第2面 (2バイト)	,[[CNS 11643]]‐1992 の残りの面 (3バイト)
,[[EUC-CCCII-FT]]
,[[EUC-KP]]
,[[ISO/IEC 8859]] 各部	,[[ISO/IEC 8859]] 各部右半面 (1バイト)	,(使用しない)	,(使用しない)
,[[TIS 620]]	,[[TIS 620]] 右半面 (1バイト)	,(使用しない)	,(使用しない)

* 拡張

[5] [[DECの文字コード]]各種は [[EUC]] に独自の構造を追加したものでした。

[6] [[GBK]], [[GB 18030]], [[UHC]] は [[EUC]] に独自の構造を追加したものでした。

* 関連

[SEE[ [[固定長EUC]] ]]

* メモ

[8] 
[CITE@ja-JP[UNIX system Ⅴ : 日本語アプリケーション・エンバイロメントリリース2.0機能説明書]], [[AT&Tユニックスパシフィック株式会社 訳]], [TIME[1987.9][1987]], [TIME[2025-07-30T10:21:15.000Z]], [TIME[2025-09-24T15:41:32.168Z]] <https://dl.ndl.go.jp/pid/12629125/1/9> (要登録)

[7] 
[CITE[LV Homepage (in Japanese)]], [TIME[2025-06-25T14:33:11.000Z]], [TIME[2001-01-19T05:49:58.812Z]] <https://web.archive.org/web/20010119052900/http://www.mt.cs.keio.ac.jp/person/narita/lv/index_ja.html>

>コード系に euc-* を選択した場合は euc-* と iso-2022-* が混っているファイルでも読むことが出来ます.
