DECの文字コード

DECの文字コード

[1] DEC (後、買収により Compaq、その後 HP) の製品は、 いろいろな文字コードに対応していました。

端末

VT

印刷機

指示シーケンス, Fp, 制御シーケンス, DOCS, 告知シーケンス, ISO文字コードの書字方向

[40] Digital Ansi-Compliant Print Protocol Lev 2 Program. Ref. Man. - PPLV2PMB.PDF, , http://sup.xenya.si/sup/info/digital/MDS/jun99/Cd3/PRINTER/PPLV2PMB.PDF

[57] 日本語トランスレータリファレンス・マニュアル, , http://odl.sysworks.biz/disk$axpdocdec022/japanese/jdcpsv21/trans/jtran002.htm

[58] テキスト・トランスレータ, , http://odl.sysworks.biz/disk$vaxdocsep002/japanese/jdcpsv17/trans/jtrl0003.htm

[70] 日本語トランスレータリファレンス・マニュアル, , http://odl.sysworks.biz/disk$axpdocdec022/japanese/jdcpsv21/trans/jtran006.htm

[85] Microsoft Word - JAPANWRD_STEEL.doc - JAPANPRN.PDF, , http://www2.phys.canterbury.ac.nz/dept/docs/manuals/unix/DEC_5.0a_Docs/ACRO_SUP/JAPANPRN.PDF


[42] DEC漢字指示セットG3指示し、 GL または GR呼び出しできるとされます。>>41

[43] G3 限定なのは何か実装上の制約があるのでしょうか。

[44] 次の5種類の指示シーケンスがあり、いずれも同義とされます。 >>41, >>57

[54] DEC漢字の拡張用の終端バイトと、 JIS の標準の終端バイトがあって、 両者は区別されずどちらでも DEC漢字の拡張された文字集合と解釈されるようです。

[50] 最初の2つは JIS X 0208-1983 ベースと思われます。

[51] 最後の3つは JIS X 0208-1978 ベースと思われます。 ただし実際には「1983年版」になるとされます >>41

[52] 「旧コマンド」は後方互換性のためのもので、新規に利用するべきではないとされます。 >>41 ISO/IEC 2022 では (1バイトの) 94集合用の指示シーケンスに当たります。 ISO/IEC 2022 の現在の仕様になる前から使われていたものでしょうか。

[90] 2/2 3/0, 3/1, 3/3私用終端バイト Fp

[53] GL では 「DEC拡張漢字 領域」が利用できないとされます。 >>41 1バイト目が GR、2バイト目が GLISO/IEC 2022 にない拡張された領域を指していると思われます。 ISO/IEC 2022指示シーケンスGR と連動するようです。

[59] 拡張ANSI >>58

[71] ANSI >>70

[60] KANJI >>58, >>70

[72] LA_KANJI >>70

[61] 「漢字LN05」モードでは 「ユーザ指定文字セット(User Preference)」 は 「SET_UPでDECサプリメントとISOLATIN1 サプリメントの切り換え可能」。 KANJI では「常にDECサプリメント」。 >>58

[64] 「漢字 ReGIS トランスレータ」: 2/4 2/11 3/3 で 「DEC 漢字指示セット1983年版」 (終端バイト3/1, 4/0, 4/2 も可) >>62 (指示シーケンスに相当する独自の制御コマンド、 こちらでも漢字集合は G3 専用らしい、 DEC拡張漢字には未対応)

[69] 「漢字 ReGIS トランスレータ」 >>62

[65] 「VT284」 >>62

[63] 「TEK_KANAトランスレータ」 >>62

DEC 漢字

[27] DEC 版の日本語EUCの1種である DEC漢字コードセット (deckanji) は、 ASCII または JIS X 0201ラテン文字用図形文字集合 >>66, >>73JIS X 0208-1983 >>66 加えて、 0xA121-0xFE7E にDEC拡張漢字文字集合を追加したものでした。

[28] これは ISO/IEC 2022EUC に違反する拡張方法です。

[29] 拡張のうち、1〜31区 0xA1 - 0xBF User Area >>26, >>73 は利用者定義 (外字) とされました。 >>66

[2] うち、 1〜26区は DECシフトJISの 0xF040-0xFCFC に対応するとされていました。

[30] 拡張のうち、32〜94区はDEC確保領域 (DEC Reserved >>26, >>73) とされていました。

[55] DEC漢字1978年版DEC漢字1983年版があるようです。 >>41 JIS X 0208-1978JIS X 0208-1983 の違いを反映していると思われます。

[56] DEC拡張罫線文字 0xFE21 - 0xFE2BDEC漢字1978年版にあって、 DEC漢字1983年版にはないようです。 >>41 JIS X 0208-1983罫線素片が追加されたのが削除理由のようです >>57


[31] Super DEC 漢字コードセット (sdeckanji) は、 DEC漢字コードセットを更に拡張したもので、 EUC-JP と同様の JIS X 0201片仮名用図形文字集合JIS X 0212-1990 がありました。

[4] ただし JIS X 0212 自体は未実装でした。

[5] JIS X 0208 部分の85〜94区と JIS X 0212 部分の78〜94区は、 利用者定義 (外字) とされました。 >>73, >>26 user/vendor–defined area (UDA) といわれています。 >>26

[34] 拡張部分は1区から94区の全体が user-definable character set (UDCS) といわれています。 >>26

[91] EUC-HJ と同じ方式。

[32] DEC 漢字 2000 コードセット (deckanji2000) は、 EUC-JISX0213 を拡張したもので、 0xA121-0xFE7E が利用者定義 (外字) とされていました。

[3] ただし JIS X 0213 第2面は未実装でした。 >>68

[6] ASCII または JIS X 0201ラテン文字用図形文字集合が使われたとされます >>68

[7] JIS X 0208-1983 または JIS X 0213:2000 第1面が使われたとされます。 >>68


[8] 「○または○」というのがどういうことかわかりませんが、 フォントや動作オプションで区別できたということでしょうか。


[74] DEC漢字の他に日本語EUC eucJP にも対応していました。 >>73

[75] JIS X 0208 部分の85〜94区と JIS X 0212 部分の78〜94区は、 UDC とされました。 >>73

[76] Shift JIS (sjis) にも対応していました。 第1バイト [ 0xF0, 0xFC ] が UDC とされました。 >>73

[84] UDC の対応関係は次のように定められていました。 >>73

シフトJISDEC漢字, Super DEC漢字 eucJP
0xF040 - 0xF4FC0xA121 - 0xAA7E0xF5A1 - 0xFEFE
0xF540 - 0xF9FC0xAB21 - 0xB47E0x8FF5A1 - 0x8FFEFE
0xFA40 - 0xFCFC0xB521 - 0xBB7E0x8FEEA1 - 0x8FF3FE

[77] 7-Bit JIS Kanji Code >>73

[78] 8-Bit JIS Kanji Code jis8 >>73

[79] 8ビット、8ビット共通の入力で認識するが出力しないもの >>73

[80] ※は JIS X 0201 左側を表すべきエスケープシーケンス。 このエスケープシーケンスの後の右側JIS X 0201 カタカナと解釈されるということか?

[81] ISO-2022-JP >>73

[82] extended ISO-2022-JP (ISO-2022-JPext) >>73

[83] EBCDIC 系漢字コード EBDCIC

DEC Hanyu

[13] DEC HanyuCNS 11643 を使う EUC文字コードでした。

[14] 構造:

[15] [ 0xA1, 0xFE ] [ 0xA1, 0xFE ] (0xC2 0xCB を除く。)CNS 11643 第1字面 >>26, >>22, >>12, >>86 #page=24

[16] [ 0xA1, 0xFE ] [ 0x21, 0x7E ] は CNS 11643 第2字面 >>26, >>22, >>12, >>86 #page=24

[17] DTSCS: 0xC2 0xCB [ 0xA1, 0xFE ] [ 0xA1, 0xFE ] は EDPC Recommended Character Set >>22, >>86 #page=26 (CNS 11643 第3字面と拡張 >>12) DTSCS

[37] そのうち EDPC Recommended Characters は1区から68区まで。 69区から94区は Reserved。 >>26

[20] DTSCS: 0xC2 0xCB [ 0xA1, 0xFE ] [ 0x21, 0x7E ] は未定義 >>26, >>12

[36] DTSCS: 0xC2 0xCB [ 0x21, 0x7E ] [ 0x21, 0x7E ] は未定義 >>12 (>>26 にはこの領域なし)

[18] 第1字面のうち、 第1バイト [ 0xFD, 0xFE ] は外字>>22, >>12, >>86 #page=27

[23] 第1字面のうち、 第1バイト [ 0xAA, 0xC1 ] は外字>>22, >>86 #page=27

[19] 第2字面のうち、 第1バイト [ 0xF2, 0xFE ] は外字>>22, >>12, >>86 #page=27

[87] Big5 と対応関係が定義されています。 >>86 #page=38

Big5 DEC Hanyu
0xF321 - 0xFB410xFA40 - 0xFEFE
0xFB42 - 0xFEFE0x8E40 - 0x905C
0xAAA1 - 0xC1FE0x905D - 0x9EB8

[92] DOCS も参照。


[21] 他に標準の EUC-TW にも対応していました。

DEC Hanzi

[10] DEC Hanzi は、 EUC-CN外字領域を追加したものでした。 >>9, >>26, >>39

[35] GB 2312 の88区から94区は DEC Reserved とされました。 >>26

[11] [ 0xA1, 0xFE ] [ 0x21, 0x7E ] の領域のうち、 第1バイト [ 0xA1, 0xF7 ] (1区から87区) が外字領域 User-defined area (User Area >>26)、 第1バイト [ 0xF8, 0xFE ] (88区から94区) が外字(予約)領域 User-defined (reserved) area (DEC Area >>26) とされます。 >>24, >>9, >>38, >>86

[25] これらの領域は Extended GB と呼ばれていました。 2つの領域はどちらも UDC (user-defined characters) のためのものですが、 後者は 「users can define special and long-lasting user-defined characters」 とされていました。 >>24, >>38, >>86, >>86 #page=31

DEC Korean

[33] DEC Korean >>88, DEC Hangul >>26 は、 ASCIIKS C 5601-1987 を組合せたものでした。 >>26, >>88 EUC-KR と同じです。 EUC-KR

DEC MCS

[93] Wayback Machine, https://web.archive.org/web/20030411082837/http://library.ust.hk/scip98/papers/ho.pdf #page=21

メモ

[26] download, https://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.46.5358&rep=rep1&type=pdf

[89] Microsoft Word - THAIWRD.DOC - THAIPRN.PDF, , http://www2.phys.canterbury.ac.nz/dept/docs/manuals/unix/DEC_5.0a_Docs/ACRO_SUP/THAIPRN.PDF