96n集合

複数バイト集合

[14] 94n文字集合96n文字集合 (n > 1) を合わせて複数バイト集合と呼びます JIS X 0202:1998 4.3.1

[15] 複数バイト集合は 02/0007/15 または 10/0015/15 の位置にある7ビットまたは 8ビットビット組合せの列で図形文字表現します。 (ただし 94n文字集合ではビット組合せ 02/0007/15 は使いません。) 8ビットの複数バイト表現では最上位ビット0 または 1 のいずれかです。 JIS X 0202:1998 4.3.1

本項は歴史的事項を説明しています。本項の内容の一部または全部は、現在の状況とは異なるかもしれません。

(なお本項の内容の一部または全部は、互換性または歴史的連続性のために現在も有効な場合もあります。しかし新たに利用することは避けるべきです。)

目次

  1. 指示シーケンス
  2. 94n文字集合
  3. 94n 文字集合
  4. 94文字集合との文字の配置の互換性
  5. 94文字集合との字種の互換性
  6. 96n文字集合
  7. 関連
  8. メモ

指示シーケンス#

[19] 4F 型エスケープシーケンスで指示できます。

[16] 指示シーケンスバイト数 n によって終端バイトが変わります。

指示シーケンス

94n文字集合#

[2] ISO/IEC 2022 でもっともよく使われる複数バイト符号化図形文字集合の大きさが、 942 です。 (というか公式に ISO-IR に登録されている複数バイト符号は全て 942 集合です。) それを含めて、94符合位置×n バイトで1文字を表現する (ISO/IEC 2022 の) 図形文字集合のことを、 94n 集合などと呼びます。

[3] なぜ 94 符号位置なのかというと、 ASCII図形文字が (SP を除くと) 94文字だからです。制御文字の領域を避けた結果 94n という大きさになりました。

94n 文字集合#

[5] ISO/IEC 2022 の環境で使える94n文字集合は、 ISO-IR に登録されているもの、いないもの、バリエーション含めかなりたくさんあります。

ISO-IR #終端バイト FIRR F文字集合IRG sourceサイズ参考
4204/00 (@) JIS X 0208-1978942
04/00 (@) JIS X 0208:1997 RFC 1468符号化表現 漢字集合入れ替えあり942
8704/02 (B) JIS X 0208-1983942
JIS X 9051 本体942
JIS X 9051 本体 + 参考942
JIS X 9052942
04/02 (B) JIS X 0208:1997 RFC 1468符号化表現 漢字集合942
04/02 (B) JIS X 0213:2000 ISO-2022-JP-3 漢字集合削除あり942
04/02 (B) JIS X 0213:2004 ISO-2022-JP-2004 漢字集合削除あり942
4/2iso-2022-jp-3-compatible ESC 2/4 4/2942
4/2iso-2022-jp-2004-compatible ESC 2/4 4/2942
4/2Videotex 漢字集合942
4/2ARIB STD-B5 漢字集合942
4/2ARIB STD-B24 漢字集合942
4/2CP932 漢字集合942
4/2MacJapanese 漢字集合942
16804/02 (B) 4/0 (@)JIS X 0208-1990J0942 平成明朝 JA
04/02 (B) 4/0 (@)JIS X 0208:1997942
04/02 (B) 4/0 (@)JIS X 0208:1997 ISO/IEC 646 IRV 併用時942
04/02 (B) 4/0 (@)JIS X 0208:1997 ISO/IEC 646 IRV 併用時代替名称942
04/02 (B) 4/0 (@)JIS X 0208:1997 JIS X 0201 ラテン文字用図形文字集合 併用時代替名称942
FpJIS X 0208:1997 + 外字942
22804/15 (O) JIS X 0213:2000 第1面J3942 平成明朝 JC
04/15 (O) JIS X 0213:2000 第1面 ISO/IEC 646 IRV 併用時942
04/15 (O) JIS X 0213:2000 第1面 ISO/IEC 646 IRV 併用時代替名称942
04/15 (O) JIS X 0213:2000 第1面 JIS X 0201 ラテン文字用図形文字集合 併用時942
04/15 (O) JIS X 0213:2000 第1面 JIS X 0201 ラテン文字用図形文字集合 併用時代替名称942
04/15 (O) JIS X 0213:2004 第1面 削除あり942
23305/01 (Q) JIS X 0213:2004 第1面J3, J3A, J13, J13A, JA3942
05/01 (Q) JIS X 0213:2004 第1面 ISO/IEC 646 IRV 併用時942
05/01 (Q) JIS X 0213:2004 第1面 ISO/IEC 646 IRV 併用時代替名称942
05/01 (Q) JIS X 0213:2004 第1面 JIS X 0201 ラテン文字用図形文字集合 併用時942
05/01 (Q) JIS X 0213:2004 第1面 JIS X 0201 ラテン文字用図形文字集合 併用時代替名称942
平成明朝 JE
平成明朝 JF
3/9ARIB STD-B24 JIS互換漢字1面942
3/11ARIB STD-B24 追加文字JARIB942
eucJP-open CS1942
5804/01 (A) GB 2312-80G0942
GB 5007.1-85942
GB 6345.1-86942
GB 6345.2-86942
GB 5199.1-85942
GB 5199-2001942
GB 6345-2001942
GB 5199-2010942
GB 6345.1-2010942
GB 8565.2-88G8942
GB 8565-89G8942
SJ/T 11239-2001942
16504/05 (E) ISO-IR-165:1992942
GB 2312 + GB/T 15564-1995942
(未定)GB 12345-90G1942
GB 12345-90 と追加文字G1942
GB 12345 + GB/T 15564-1995942
GB 5007.2-2001942
3/1KS X 1001-1987942
1494/3KS X 1001-1987, KS C 5601-1989, KS C 5601-1992K0942
4/3KS X 1001:1998942
4/3KS X 1001:2002, KS X 1001:2004K0942
15904/04 (D) JIS X 0212-1990J1942 平成明朝 JB
eucJP-open CS2942
22905/00 (P) JIS X 0213:2000 第2面J4942 平成明朝 JD
JIS X 0212-1990 + JIS X 0213:2000 第2面942
05/00 (P) JIS X 0213:2004 第2面J4, J14, JA4942
3/10ARIB STD-B24 JIS互換漢字2面942
3/15ISO-2022-JP-MS EUDC942
CP932 0xF040 - 0xFCFC942
sjis-docomo 0xF040 - 0xFCFC942
16904/06 (F) Blissymbol942
17104/07 (G) CNS 11643-1987 第1字面942
04/07 (G) CNS 11643-1992 第1字面T1942
CNS 11643 第1字面と追加文字T1942
3/0 (0)CNS 11643 第1字面942
17204/08 (H) CNS 11643-1987 第2字面942
04/08 (H) CNS 11643-1992 第2字面T2942
3/1 (1)CNS 11643 第2字面942
3/13 CNS 11643 第14字面 (旧)942
CNS 11643 第14字面と追加文字TE942
18304/09 (I) CNS 11643-1992 第3字面942
TCA-CNS 11643-1992 3rd plane with some additional charactersT3942
3/2 (2)CNS 11643 第3字面942
18404/10 (J) CNS 11643-1992 第4字面T4942
3/3 (3)CNS 11643 第4字面942
18504/11 (K) CNS 11643-1992 第5字面T5942
3/4 (4)CNS 11643 第5字面942
18604/12 (L) CNS 11643-1992 第6字面T6942
3/5 (5)CNS 11643 第6字面942
18704/13 (M) CNS 11643-1992 第7字面T7942
3/6 (6)CNS 11643 第7字面942
3/7 (7)CNS 11643-1992 第8字面942
3/7 (7)CNS 11643-2004 第8字面942
3/8 (8)CNS 11643-1992 第9字面942
3/8 (8)CNS 11643-2004 第9字面942
3/9 (9)CNS 11643-1992 第10字面942
3/9 (9)CNS 11643-2004 第10字面TA942
3/10 (:) 〜 3/14CNS 11643-1992 第11字面 〜 第15字面942
3/10 (:) 〜 3/14CNS 11643-2004 第11字面 〜 第15字面942
3/10 (:) 〜 3/14CNS 11643-2007 第11字面 〜 第15字面TBTF942
3/15 (?)CNS 11643-1992 第16字面942
3/15 (?)CNS 11643-2004 第16字面942
2/1 3/0CNS 11643 第17字面T11942
2/1 3/1CNS 11643 第18字面942
2/1 3/2CNS 11643 第19字面T13942
2/1 3/32/5 3/15CNS 11643 第20字面 〜 第80字面942
EUC-CCCII-FT CS1942
EUC-CCCII-FT CS3942
EUC-TW CS2 (CNS 11643 第2字面 〜 第16字面)943
EUC-TW CS2 (CNS 11643 第2字面 〜 第80字面)943
3/0Mule Big5-1942 Fp
3/1Mule Big5-2942 Fp
20204/14 (N) KPS 9577-97 (ISO-IR 202)KP0942
KPS 9577-2000942
KPS 9577-2003942
KPS 9577-2012942
(未定)GB 7589942
GB 13131G3942
(未定)GB 7590942
GB 13132G5942
(未定)GB 12052GK942
(未定)GB 13134942
General Purpose Hanzi List for Modern Chinese Language, and General List of Simplified HanziG7942
(未定)GB/T 16500-1998GE942
Singapore CharactersGS942
平成明朝 FT
Unified Japanese IT Vendors Contemporary Ideographs, 1993JA942 平成明朝 IA
平成明朝 IB
平成明朝 HG
4/5KS X 1002:1991 第1拡張集合K1942
4/5KS X 1002:2001 第1拡張集合K1942
4/6KS X 1002 第2拡張集合942
PKS C 5700-1 1994K2942
KS X 1027-1:2011K2942
PKS C 5700-2 1994K3942
KS X 1027-2:2011K3942
TCVN 5773:1993, TCVN 6056:1995V0, V1942
VHN 02:1998, V4V3, V4942
CCCII943
3/1EACC943
3/1DEC漢字 1978年版942
3/3DEC漢字 1983年版942
3/10Mule mojikyo-2022-1943 Fp
3/2Mule lc-ethio942 Fp
3/3Mule ethiopic942 Fp
3/5Mule indian-2-column942 Fp
3/6Mule indian-1-column942 Fp
3/7Mule tibetan942 Fp
3/8Mule tibetan-1-column942 Fp
3/15Mule thai-xtis942 Fp
GB 12050-89 附録A942
05/1205/15 (R〜_) (ISO-IR 未登録)942
06/0006/15 (`〜o) (ISO-IR 未登録)943
07/0007/13 (p〜}) (ISO-IR 未登録)94n (n4)
2/1 (!) 4/0 (@) 〜 2/3 (#) 5/15 (O)(ISO-IR 未登録 2周目 〜 4周目)942
2/1 (!) 6/0 (`) 〜 2/3 (#) 6/15 (o)(ISO-IR 未登録 2周目 〜 4周目)943
2/1 (!) 7/0 (p) 〜 2/3 (#) 7/14 (~)(ISO-IR 未登録 2周目 〜 4周目)94n (n4)
2/0 (SP) 4/0 (@) 〜 2/0 (SP) 5/15 (O)ISO/IEC 2022 DRCS 942
2/0 (SP) 6/0 (`) 〜 2/0 (SP) 6/15 (o)ISO/IEC 2022 DRCS 943
2/0 (SP) 7/0 (p) 〜 2/0 (SP) 7/14 (~)ISO/IEC 2022 DRCS 94n (n4)
2/0 4/0ARIB STD-B24 DRCS942
2/0 4/0Videotex DRCS II set 942
07/14 (~) 空集合94n (n ≧ 4?)
03/0003/15 (0〜?) 私用図形文字集合94n (n2)
2/1 (!) 3/0 (0) 〜 2/3 (#) 3/15 (?)私用図形文字集合 94n (n ≧ 2)
2/0 (SP) 3/0 (0) 〜 2/0 (SP) 3/15 (?)ISO/IEC 2022 DRCS 私用終端バイト94n (n ≧ 2)
3/0DEC漢字 UDC942
00/0002/15 (NUL〜/)(使用しない)
07/1515/15 (DEL〜y")(使用しない)
KanjiBase &CX942
KanjiBase &CY942

指示シーケンス, 私用終端バイト, IRR

[12] 4バイト以上の符号化文字集合は知られていません。

94文字集合との文字の配置の互換性#

[6] 2002-09-30 (Mon) 16:41:21 名無しさん : JISX0208:1997 の解説図3には、古い JISX0202 の解説図が引用されている。

94文字集合との字種の互換性#

[7] 942文字集合は当然94集合よりずっと多くの文字が入る。 だから、 ISO/IEC646 で unify されてた文字, 例えば 02/02 (") = 左二重引用符 / 右二重引用符 / ウムラウトとか、 (-) = ハイフン / 負符号とかが JISX0208 とかでは分離された。

これは正しい判断だった。当時としては。だけど、今は違う。 内部符号としての Unicode が生まれて、それと同時に名前による同定という規則が ISO/IEC で確立されてから、そういう一対多対応あるいは多対多対応は受け入れられなくなってしまった。 (もっとも実際それ以前でも、変換の時は一般には機械で自動的に意味で分離するのは無理だから、どれか選んで (あるいは選ばないで) 一対一対応に無理矢理してたんだけど。) だからもはや <"> は「“」とも「”」とも「¨」とも違う文字だ。

このちょっとおかしな事態は、たとえば JISX0213 の登場で誰の目にも明らかになった。 (ぼろ雑巾とまで言われた UCS は、まあ気にしないでおこう。) JIS X 0213 には ISO/IEC 646 との互換のために、 <"> (QUOTATION MARK) が追加された。もう既に「“」も「”」もあるのにだよ!

[8] ここに来てまた、あの一言が頭をよぎる。 JIS X 0208-1978 は、 ISO/IEC 646 の符号位置を変えてはいけなかった!

[9] 78JIS が間違っていたのか、それとも JIS X 0213:2000 が間違っていたのか。たぶん、どちらも間違ってはいなかった。 けれども間違った結果になってしまった。 時代の先を見通すことは難しい。

[10] >>9 では JIS X 0208-1978 が仮に <"> を収録していて、 「“」や「”」がなかったら、どうなっていただろう。 MicrosoftWindowsCodePage 125x でこれらを追加しているから、きっと同じ様に JIS 外字として 932 に入っていただろう。

JIS X 0213:2000 に <"> が入ってなかったら・・・ 別になにも変わらなかったかもしれんがね。 (その辺は歴史の深さの違いだ。)

96n文字集合#

[13] 96n文字集合は、 96複数符号空間を持つ符号化文字集合です。

[17] ISO/IEC 2022 で利用できる符号化文字集合の種類の一つでした。

[20] こちらは私用文字集合としてしか (まだ) 使われていません。

[22] Emacs私用図形文字集合として962集合を使っています。 私用図形文字集合

[18] 国家標準符号化文字集合でこれに該当するものは知られていません。 ISO-IR にもこの種別の符号化文字集合は1つも登録されていません。

[11] Videotex では sound-tone set として962集合が使われました。 音声について指定する96集合を2つ組合せた2バイト符号でした。

ISO-IR #終端バイト FIRR F文字集合IRG sourceサイズ参考
3/0Mule bitmap962 Fp
3/1mule-unicode-0100-24ff962 Fp
3/2mule-unicode-2500-33ff962 Fp
3/3mule-unicode-e000-ffff962 Fp
3/4Mule indian-glyph962 Fp
3/3Mule lc-arb3962 Fp
3/4Mule lc-arb4962 Fp
3/4Mule cgreek962 Fp
3/14mule-ucs-unicode-multichar962 Fp
Videotex sound-tone set962
4/005/15 (@〜_) (ISO-IR 未登録)962
06/0006/15 (`〜o) (ISO-IR 未登録)963
07/0007/13 (p〜}) (ISO-IR 未登録)96n (n4)
2/1 (!) 4/0 (@) 〜 2/3 (#) 5/15 (O)(ISO-IR 未登録 2周目 〜 4周目)962
2/1 (!) 6/0 (`) 〜 2/3 (#) 6/15 (o)(ISO-IR 未登録 2周目 〜 4周目)963
2/1 (!) 7/0 (p) 〜 2/3 (#) 7/14 (~)(ISO-IR 未登録 2周目 〜 4周目)96n (n4)
2/0 (SP) 4/0 (@) 〜 2/0 (SP) 5/15 (O)ISO/IEC 2022 DRCS 962
2/0 (SP) 6/0 (`) 〜 2/0 (SP) 6/15 (o)ISO/IEC 2022 DRCS 963
2/0 (SP) 7/0 (p) 〜 2/0 (SP) 7/14 (~)ISO/IEC 2022 DRCS 96n (n4)
07/14 (~) 空集合96n (n ≧ 4?)
03/0003/15 (0〜?) 私用図形文字集合96n (n2)
2/1 (!) 3/0 (0) 〜 2/3 (#) 3/15 (?)私用図形文字集合 96n (n ≧ 2)
2/0 (SP) 3/0 (0) 〜 2/0 (SP) 3/15 (?)ISO/IEC 2022 DRCS 私用終端バイト96n (n ≧ 2)
00/0002/15 (NUL〜/)(使用しない)
07/1515/15 (DEL〜y")(使用しない)

関連#

94文字集合

メモ#

[21] ISO-IR は最初の頃から登録簿に G0, G1, 多バイト集合のエスケープシーケンス欄があって、 当初から 942集合の登録は想定されていたようです。 しかし実際登録されたのは G0, G1, G2, G3 欄に改められた (ISO 2022 の改訂があった) 後からのようです。