TCS

DECの文字コード

[1] DEC (後、買収により Compaq、その後 HP) の製品は、 いろいろな文字コードに対応していました。

目次

  1. 端末
  2. 印刷機
  3. DEC 漢字
  4. DEC Hanyu
  5. DEC Hanzi
  6. DEC Korean
  7. DEC MCS
  8. DEC TCS
  9. メモ

端末#

VT

印刷機#

指示シーケンス, Fp, 制御シーケンス, DOCS, 告知シーケンス, ISO文字コードの書字方向

[40] Digital Ansi-Compliant Print Protocol Lev 2 Program. Ref. Man. - PPLV2PMB.PDF, , http://sup.xenya.si/sup/info/digital/MDS/jun99/Cd3/PRINTER/PPLV2PMB.PDF

[57] 日本語トランスレータリファレンス・マニュアル, , http://odl.sysworks.biz/disk$axpdocdec022/japanese/jdcpsv21/trans/jtran002.htm

[58] テキスト・トランスレータ, , http://odl.sysworks.biz/disk$vaxdocsep002/japanese/jdcpsv17/trans/jtrl0003.htm

[70] 日本語トランスレータリファレンス・マニュアル, , http://odl.sysworks.biz/disk$axpdocdec022/japanese/jdcpsv21/trans/jtran006.htm

[85] Microsoft Word - JAPANWRD_STEEL.doc - JAPANPRN.PDF, , http://www2.phys.canterbury.ac.nz/dept/docs/manuals/unix/DEC_5.0a_Docs/ACRO_SUP/JAPANPRN.PDF


[42] DEC漢字指示セットG3指示し、 GL または GR呼び出しできるとされます。>>41

[43] G3 限定なのは何か実装上の制約があるのでしょうか。

[44] 次の5種類の指示シーケンスがあり、いずれも同義とされます。 >>41, >>57

[54] DEC漢字の拡張用の終端バイトと、 JIS の標準の終端バイトがあって、 両者は区別されずどちらでも DEC漢字の拡張された文字集合と解釈されるようです。

[50] 最初の2つは JIS X 0208-1983 ベースと思われます。

[51] 最後の3つは JIS X 0208-1978 ベースと思われます。 ただし実際には「1983年版」になるとされます >>41

[52] 「旧コマンド」は後方互換性のためのもので、新規に利用するべきではないとされます。 >>41 ISO/IEC 2022 では (1バイトの) 94集合用の指示シーケンスに当たります。 ISO/IEC 2022 の現在の仕様になる前から使われていたものでしょうか。

[90] 2/2 3/0, 3/1, 3/3私用終端バイト Fp

[53] GL では 「DEC拡張漢字 領域」が利用できないとされます。 >>41 1バイト目が GR、2バイト目が GLISO/IEC 2022 にない拡張された領域を指していると思われます。 ISO/IEC 2022指示シーケンスGR と連動するようです。

[59] 拡張ANSI >>58

[71] ANSI >>70

[60] KANJI >>58, >>70

[72] LA_KANJI >>70

[61] 「漢字LN05」モードでは 「ユーザ指定文字セット(User Preference)」 は 「SET_UPでDECサプリメントとISOLATIN1 サプリメントの切り換え可能」。 KANJI では「常にDECサプリメント」。 >>58

[64] 「漢字 ReGIS トランスレータ」: 2/4 2/11 3/3 で 「DEC 漢字指示セット1983年版」 (終端バイト3/1, 4/0, 4/2 も可) >>62 (指示シーケンスに相当する独自の制御コマンド、 こちらでも漢字集合は G3 専用らしい、 DEC拡張漢字には未対応)

[69] 「漢字 ReGIS トランスレータ」 >>62

[65] 「VT284」 >>62

[63] 「TEK_KANAトランスレータ」 >>62

DEC 漢字#

[27] DEC 版の日本語EUCの1種である DEC漢字コードセット (deckanji) は、 ASCII または JIS X 0201ラテン文字用図形文字集合 >>66, >>73JIS X 0208-1983 >>66 加えて、 0xA121-0xFE7E にDEC拡張漢字文字集合を追加したものでした。

[28] これは ISO/IEC 2022EUC に違反する拡張方法です。

[29] 拡張のうち、1〜31区 0xA1 - 0xBF User Area >>26, >>73 は利用者定義 (外字) とされました。 >>66

[2] うち、 1〜26区は DECシフトJISの 0xF040-0xFCFC に対応するとされていました。

[30] 拡張のうち、32〜94区はDEC確保領域 (DEC Reserved >>26, >>73) とされていました。

[55] DEC漢字1978年版DEC漢字1983年版があるようです。 >>41 JIS X 0208-1978JIS X 0208-1983 の違いを反映していると思われます。

[56] DEC拡張罫線文字 0xFE21 - 0xFE2BDEC漢字1978年版にあって、 DEC漢字1983年版にはないようです。 >>41 JIS X 0208-1983罫線素片が追加されたのが削除理由のようです >>57


[31] Super DEC 漢字コードセット (sdeckanji) は、 DEC漢字コードセットを更に拡張したもので、 EUC-JP と同様の JIS X 0201片仮名用図形文字集合JIS X 0212-1990 がありました。

[4] ただし JIS X 0212 自体は未実装でした。

[5] JIS X 0208 部分の85〜94区と JIS X 0212 部分の78〜94区は、 利用者定義 (外字) とされました。 >>73, >>26 user/vendor–defined area (UDA) といわれています。 >>26

[34] 拡張部分は1区から94区の全体が user-definable character set (UDCS) といわれています。 >>26

[91] EUC-HJ と同じ方式。

[32] DEC 漢字 2000 コードセット (deckanji2000) は、 EUC-JISX0213 を拡張したもので、 0xA121-0xFE7E が利用者定義 (外字) とされていました。

[3] ただし JIS X 0213 第2面は未実装でした。 >>68

[6] ASCII または JIS X 0201ラテン文字用図形文字集合が使われたとされます >>68

[7] JIS X 0208-1983 または JIS X 0213:2000 第1面が使われたとされます。 >>68


[8] 「○または○」というのがどういうことかわかりませんが、 フォントや動作オプションで区別できたということでしょうか。


[74] DEC漢字の他に日本語EUC eucJP にも対応していました。 >>73

[75] JIS X 0208 部分の85〜94区と JIS X 0212 部分の78〜94区は、 UDC とされました。 >>73

[76] Shift JIS (sjis) にも対応していました。 第1バイト [ 0xF0, 0xFC ] が UDC とされました。 >>73

[84] UDC の対応関係は次のように定められていました。 >>73

シフトJISDEC漢字, Super DEC漢字 eucJP
0xF040 - 0xF4FC0xA121 - 0xAA7E0xF5A1 - 0xFEFE
0xF540 - 0xF9FC0xAB21 - 0xB47E0x8FF5A1 - 0x8FFEFE
0xFA40 - 0xFCFC0xB521 - 0xBB7E0x8FEEA1 - 0x8FF3FE

[77] 7-Bit JIS Kanji Code >>73

[78] 8-Bit JIS Kanji Code jis8 >>73

[79] 8ビット、8ビット共通の入力で認識するが出力しないもの >>73

[80] ※は JIS X 0201 左側を表すべきエスケープシーケンス。 このエスケープシーケンスの後の右側JIS X 0201 カタカナと解釈されるということか?

[81] ISO-2022-JP >>73

[82] extended ISO-2022-JP (ISO-2022-JPext) >>73

[83] EBCDIC 系漢字コード EBDCIC

DEC Hanyu#

[13] DEC HanyuCNS 11643 を使う EUC文字コードでした。

[14] 構造:

[15] [ 0xA1, 0xFE ] [ 0xA1, 0xFE ] (0xC2 0xCB を除く。)CNS 11643 第1字面 >>26, >>22, >>12, >>86 #page=24

[16] [ 0xA1, 0xFE ] [ 0x21, 0x7E ] は CNS 11643 第2字面 >>26, >>22, >>12, >>86 #page=24

[17] DTSCS: 0xC2 0xCB [ 0xA1, 0xFE ] [ 0xA1, 0xFE ] は EDPC Recommended Character Set >>22, >>86 #page=26 (CNS 11643 第3字面と拡張 >>12) DTSCS

[37] そのうち EDPC Recommended Characters は1区から68区まで。 69区から94区は Reserved。 >>26

[20] DTSCS: 0xC2 0xCB [ 0xA1, 0xFE ] [ 0x21, 0x7E ] は未定義 >>26, >>12

[36] DTSCS: 0xC2 0xCB [ 0x21, 0x7E ] [ 0x21, 0x7E ] は未定義 >>12 (>>26 にはこの領域なし)

[18] 第1字面のうち、 第1バイト [ 0xFD, 0xFE ] は外字>>22, >>12, >>86 #page=27

[23] 第1字面のうち、 第1バイト [ 0xAA, 0xC1 ] は外字>>22, >>86 #page=27

[19] 第2字面のうち、 第1バイト [ 0xF2, 0xFE ] は外字>>22, >>12, >>86 #page=27

[87] Big5 と対応関係が定義されています。 >>86 #page=38

Big5 DEC Hanyu
0xF321 - 0xFB410xFA40 - 0xFEFE
0xFB42 - 0xFEFE0x8E40 - 0x905C
0xAAA1 - 0xC1FE0x905D - 0x9EB8

[92] DOCS も参照。


[21] 他に標準の EUC-TW にも対応していました。

DEC Hanzi#

[10] DEC Hanzi は、 EUC-CN外字領域を追加したものでした。 >>9, >>26, >>39

[35] GB 2312 の88区から94区は DEC Reserved とされました。 >>26

[11] [ 0xA1, 0xFE ] [ 0x21, 0x7E ] の領域のうち、 第1バイト [ 0xA1, 0xF7 ] (1区から87区) が外字領域 User-defined area (User Area >>26)、 第1バイト [ 0xF8, 0xFE ] (88区から94区) が外字(予約)領域 User-defined (reserved) area (DEC Area >>26) とされます。 >>24, >>9, >>38, >>86

[25] これらの領域は Extended GB と呼ばれていました。 2つの領域はどちらも UDC (user-defined characters) のためのものですが、 後者は 「users can define special and long-lasting user-defined characters」 とされていました。 >>24, >>38, >>86, >>86 #page=31

DEC Korean#

[33] DEC Korean >>88, DEC Hangul >>26 は、 ASCIIKS C 5601-1987 を組合せたものでした。 >>26, >>88 EUC-KR と同じです。 EUC-KR

DEC MCS#

[93] Wayback Machine, https://web.archive.org/web/20030411082837/http://library.ust.hk/scip98/papers/ho.pdf #page=21

DEC TCS#

[94] DEC Technical Character Set, , https://vt100.net/charsets/technical.html

メモ#

[26] download, https://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.46.5358&rep=rep1&type=pdf

[89] Microsoft Word - THAIWRD.DOC - THAIPRN.PDF, , http://www2.phys.canterbury.ac.nz/dept/docs/manuals/unix/DEC_5.0a_Docs/ACRO_SUP/THAIPRN.PDF