<html xmlns="http://www.w3.org/1999/xhtml" a0:Name="SuikaWiki" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:Version="0.9"><head><a0:parameter name="page-icon"><a0:value>字β</a0:value></a0:parameter></head><body><p><a0:anchor-end a0:anchor="3">[3]</a0:anchor-end> 固定長の日本語 <a0:anchor>EUC</a0:anchor> の <a0:anchor>IANA</a0:anchor> の名前がこれ。可変長の日本語 EUC
(普通に言うところの日本語 EUC) も IANA 名は
<code class="charset">Extended_UNIX_Code_Packed_Format_for_Japanese</code> ですが、
<a0:anchor>EUC-JP</a0:anchor> というまともな別名があとからつけられました。
固定長の方はたぶん誰も使ってない (少なくても情報交換用には。)
ので放置されたままなんでしょう。</p><p>C なんかの wide char に使うことを意図してるんでしょうが、
今時使ってる処理系ってあるんでしょうか? (もちろん、考案当時は
それなりの数あったと思います。)</p><p>ていうか、どう考えても情報交換用符号化方式でないこれが
IANA 登録簿にあるんでしょうか。今ならともかく、登録当時
(いつか知らないけど、たぶん1990年代前半) の IETF の人達は
なに考えてたんでしょ?</p><section><h1>IANA 登録簿から</h1><pre> Name: Extended_UNIX_Code_Fixed_Width_for_Japanese
 MIBenum: 19
 Source: Used in Japan.  Each character is 2 octets.
                code set 0: US-ASCII (a single 7-bit byte set)
                              1st byte = 00
                              2nd byte = 20-7E
                code set 1: JIS X0208-1990 (a double 7-bit byte set)
                            restricted  to A0-FF in both bytes 
                code set 2: Half Width Katakana (a single 7-bit byte set)
                              1st byte = 00
                              2nd byte = A0-FF
                code set 3: JIS X0212-1990 (a double 7-bit byte set)
                            restricted to A0-FF in 
                            the first byte
                and 21-7E in the second byte
 Alias: csEUCFixWidJapanese</pre><p>この説明はあまり正確ではありません。まず、 <a0:anchor>CL</a0:anchor> の扱いが不明瞭です。
(制御文字の扱いまで頭が回らなかったのでしょうか。) 
左半分、つまり 0x00-0x7F はそのまま 0x00 0x00-0x7F になります。</p><p>それから、 CS1-CS3 の説明で 0xA0-0xFF ということになっていますが、
いずれも 94 文字集合ですから、 0xA0 と 0xFF は使いません。
0xA1-0xFE と書くのが正しいです。大体
CS3 の説明の第2オクテットが 0x21-0x7E になってて一貫性がありません。</p><p>CS2 は Half Width Katakana ですが、これは間違いで
JIS X 0201 Katakana です。 Extended_UNIX_Code_Packed_Format_for_Japanese
(<a0:anchor>EUC-JP</a0:anchor>) の説明も間違ってます。<ul><li><a0:anchor-end a0:anchor="1">[1]</a0:anchor-end> 名前が43文字もあるんですが、なに考えているんでしょう。</li><li><a0:anchor-end a0:anchor="2">[2]</a0:anchor-end> 字数的には <a0:anchor>encoded-word</a0:anchor> とかでの使用も問題はなさげだが (さすがに使う人はおらんだろうが)。</li><li><a0:anchor-end a0:anchor="4">[4]</a0:anchor-end> Aka <code>fixed-euc-jp</code>。</li></ul></p><p><a0:anchor-end a0:anchor="5">[5]</a0:anchor-end> IANA charset としては別のものになってしまうのでしょうけど、
<a0:anchor>JISX0213</a0:anchor> も加えている実装もあるみたいです。
(細かい点を無視すれば) <a0:anchor>JISX0208</a0:anchor> や <a0:anchor>JISX0212</a0:anchor> と安全に符号空間を共有できます。</p></section></body></html>