[1] DEC (後、買収により Compaq、その後 HP) の製品は、 いろいろな文字コードに対応していました。
[40] Digital Ansi-Compliant Print Protocol Lev 2 Program. Ref. Man. - PPLV2PMB.PDF, , http://sup.xenya.si/sup/info/digital/MDS/jun99/Cd3/PRINTER/PPLV2PMB.PDF
[57] 日本語トランスレータリファレンス・マニュアル, , http://odl.sysworks.biz/disk$axpdocdec022/japanese/jdcpsv21/trans/jtran002.htm
[58] テキスト・トランスレータ, , http://odl.sysworks.biz/disk$vaxdocsep002/japanese/jdcpsv17/trans/jtrl0003.htm
[70] 日本語トランスレータリファレンス・マニュアル, , http://odl.sysworks.biz/disk$axpdocdec022/japanese/jdcpsv21/trans/jtran006.htm
[85] Microsoft Word - JAPANWRD_STEEL.doc - JAPANPRN.PDF, , http://www2.phys.canterbury.ac.nz/dept/docs/manuals/unix/DEC_5.0a_Docs/ACRO_SUP/JAPANPRN.PDF
[42] DEC漢字指示セットを G3 に指示し、 GL または GR に呼び出しできるとされます。>>41
[44] 次の5種類の指示シーケンスがあり、いずれも同義とされます。 >>41, >>57
ESC
2/4 2/11 3/3 :
「DEC漢字指示セット 1983年版」ESC
2/4 2/11 4/2 :
「JISX0208漢字指示セット 1983年版」ESC
2/4 2/11 3/1 :
「DEC漢字指示セット 1978年版(新コマンド)」ESC
2/4 2/11 4/0 :
「JISX0208漢字セット 1978年版」ESC
2/11 2/2 3/0 :
「DEC漢字指示セット 1978年版(旧コマンド)」[54] DEC漢字の拡張用の終端バイトと、 JIS の標準の終端バイトがあって、 両者は区別されずどちらでも DEC漢字の拡張された文字集合と解釈されるようです。
[50] 最初の2つは JIS X 0208-1983 ベースと思われます。
[51] 最後の3つは JIS X 0208-1978 ベースと思われます。 ただし実際には「1983年版」になるとされます >>41。
[52] 「旧コマンド」は後方互換性のためのもので、新規に利用するべきではないとされます。 >>41 ISO/IEC 2022 では (1バイトの) 94集合用の指示シーケンスに当たります。 ISO/IEC 2022 の現在の仕様になる前から使われていたものでしょうか。
[90] 2/2 3/0, 3/1, 3/3 は私用終端バイト。
[53] GL では 「DEC拡張漢字 領域」が利用できないとされます。 >>41 1バイト目が GR、2バイト目が GL の ISO/IEC 2022 にない拡張された領域を指していると思われます。 ISO/IEC 2022 の指示シーケンスで GR と連動するようです。
[61] 「漢字LN05」モードでは 「ユーザ指定文字セット(User Preference)」 は 「SET_UPでDECサプリメントとISOLATIN1 サプリメントの切り換え可能」。 KANJI では「常にDECサプリメント」。 >>58
[64] 「漢字 ReGIS トランスレータ」: 2/4 2/11 3/3 で 「DEC 漢字指示セット1983年版」 (終端バイトは 3/1, 4/0, 4/2 も可) >>62 (指示シーケンスに相当する独自の制御コマンド、 こちらでも漢字集合は G3 専用らしい、 DEC拡張漢字には未対応)
SO
JISカタカナ文字セットSI
JISローマ字セットESC
SO
JISカタカナ文字セットESC
SI
JISローマ字セット[27] DEC 版の日本語EUCの1種である DEC漢字コードセット (deckanji) は、 ASCII または JIS X 0201ラテン文字用図形文字集合 >>66, >>73、 JIS X 0208-1983 >>66 加えて、 0xA121-0xFE7E にDEC拡張漢字文字集合を追加したものでした。
[29] 拡張のうち、1〜31区 0xA1 - 0xBF User Area >>26, >>73 は利用者定義 (外字) とされました。 >>66
[2] うち、 1〜26区は DEC 版シフトJISの 0xF040-0xFCFC に対応するとされていました。
[30] 拡張のうち、32〜94区はDEC確保領域 (DEC Reserved >>26, >>73) とされていました。
[55] DEC漢字1978年版とDEC漢字1983年版があるようです。 >>41 JIS X 0208-1978 と JIS X 0208-1983 の違いを反映していると思われます。
[56] DEC拡張罫線文字 0xFE21 - 0xFE2B はDEC漢字1978年版にあって、 DEC漢字1983年版にはないようです。 >>41 JIS X 0208-1983 に罫線素片が追加されたのが削除理由のようです >>57。
[31] Super DEC 漢字コードセット (sdeckanji) は、 DEC漢字コードセットを更に拡張したもので、 EUC-JP と同様の JIS X 0201片仮名用図形文字集合と JIS X 0212-1990 がありました。
[4] ただし JIS X 0212 自体は未実装でした。
[5] JIS X 0208 部分の85〜94区と JIS X 0212 部分の78〜94区は、 利用者定義 (外字) とされました。 >>73, >>26 user/vendor–defined area (UDA) といわれています。 >>26
[34] 拡張部分は1区から94区の全体が user-definable character set (UDCS) といわれています。 >>26
[32] DEC 漢字 2000 コードセット (deckanji2000) は、 EUC-JISX0213 を拡張したもので、 0xA121-0xFE7E が利用者定義 (外字) とされていました。
[3] ただし JIS X 0213 第2面は未実装でした。 >>68
[6] ASCII または JIS X 0201ラテン文字用図形文字集合が使われたとされます >>68。
[7] JIS X 0208-1983 または JIS X 0213:2000 第1面が使われたとされます。 >>68。
[8] 「○または○」というのがどういうことかわかりませんが、 フォントや動作オプションで区別できたということでしょうか。
[74]
DEC漢字の他に日本語EUC eucJP
にも対応していました。
>>73
[75] JIS X 0208 部分の85〜94区と JIS X 0212 部分の78〜94区は、 UDC とされました。 >>73
[76]
Shift JIS (sjis
) にも対応していました。
第1バイト [ 0xF0, 0xFC ] が UDC とされました。
>>73
[84] UDC の対応関係は次のように定められていました。 >>73
シフトJIS | DEC漢字, Super DEC漢字 | eucJP |
---|---|---|
0xF040 - 0xF4FC | 0xA121 - 0xAA7E | 0xF5A1 - 0xFEFE |
0xF540 - 0xF9FC | 0xAB21 - 0xB47E | 0x8FF5A1 - 0x8FFEFE |
0xFA40 - 0xFCFC | 0xB521 - 0xBB7E | 0x8FEEA1 - 0x8FF3FE |
[77] 7-Bit JIS Kanji Code >>73
[78] 8-Bit JIS Kanji Code jis8 >>73
[79] 8ビット、8ビット共通の入力で認識するが出力しないもの >>73
[80] ※は JIS X 0201 左側を表すべきエスケープシーケンス。 このエスケープシーケンスの後の右側が JIS X 0201 カタカナと解釈されるということか?
[82] extended ISO-2022-JP (ISO-2022-JPext
) >>73
[13] DEC Hanyu は CNS 11643 を使う EUC 系文字コードでした。
[14] 構造:
SPACE
>>22, >>12DELETE
>>22, >>12[15] [ 0xA1, 0xFE ] [ 0xA1, 0xFE ] (0xC2 0xCB を除く。) は CNS 11643 第1字面 >>26, >>22, >>12, >>86 #page=24
[16] [ 0xA1, 0xFE ] [ 0x21, 0x7E ] は CNS 11643 第2字面 >>26, >>22, >>12, >>86 #page=24
[17] DTSCS:
0xC2 0xCB [ 0xA1, 0xFE ] [ 0xA1, 0xFE ] は
EDPC Recommended Character Set >>22, >>86 #page=26
(CNS 11643 第3字面と拡張 >>12)
[37] そのうち EDPC Recommended Characters は1区から68区まで。 69区から94区は Reserved。 >>26
[20] DTSCS: 0xC2 0xCB [ 0xA1, 0xFE ] [ 0x21, 0x7E ] は未定義 >>26, >>12
[36] DTSCS: 0xC2 0xCB [ 0x21, 0x7E ] [ 0x21, 0x7E ] は未定義 >>12 (>>26 にはこの領域なし)
[18] 第1字面のうち、 第1バイト [ 0xFD, 0xFE ] は外字。 >>22, >>12, >>86 #page=27
[23] 第1字面のうち、 第1バイト [ 0xAA, 0xC1 ] は外字。 >>22, >>86 #page=27
[19] 第2字面のうち、 第1バイト [ 0xF2, 0xFE ] は外字。 >>22, >>12, >>86 #page=27
[87] Big5 と対応関係が定義されています。 >>86 #page=38
Big5 | DEC Hanyu |
---|---|
0xF321 - 0xFB41 | 0xFA40 - 0xFEFE |
0xFB42 - 0xFEFE | 0x8E40 - 0x905C |
0xAAA1 - 0xC1FE | 0x905D - 0x9EB8 |
[10] DEC Hanzi は、 EUC-CN に外字領域を追加したものでした。 >>9, >>26, >>39
[35] GB 2312 の88区から94区は DEC Reserved とされました。 >>26
[11] [ 0xA1, 0xFE ] [ 0x21, 0x7E ] の領域のうち、 第1バイト [ 0xA1, 0xF7 ] (1区から87区) が外字領域 User-defined area (User Area >>26)、 第1バイト [ 0xF8, 0xFE ] (88区から94区) が外字(予約)領域 User-defined (reserved) area (DEC Area >>26) とされます。 >>24, >>9, >>38, >>86
[25] これらの領域は Extended GB と呼ばれていました。 2つの領域はどちらも UDC (user-defined characters) のためのものですが、 後者は 「users can define special and long-lasting user-defined characters」 とされていました。 >>24, >>38, >>86, >>86 #page=31
[33]
DEC Korean >>88,
DEC Hangul >>26
は、
ASCII
と
KS C 5601-1987
を組合せたものでした。
>>26, >>88
EUC-KR と同じです。
[93] Wayback Machine, https://web.archive.org/web/20030411082837/http://library.ust.hk/scip98/papers/ho.pdf #page=21
[26] download, https://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.46.5358&rep=rep1&type=pdf
[89] Microsoft Word - THAIWRD.DOC - THAIPRN.PDF, , http://www2.phys.canterbury.ac.nz/dept/docs/manuals/unix/DEC_5.0a_Docs/ACRO_SUP/THAIPRN.PDF