[1] JIS X 0208-1990 情報交換用漢字符号―補助漢字は、 に制定、 に官報公示された JIS漢字の規格でした。
[3] 942図形文字集合でした。 JIS X 0208 との併用が想定され、 JIS X 0208 に含まれない図形文字が収録されています。
[45] 合計6067個の区点位置に文字が割り当てられていました。
[4] 非漢字は、 266字ありました。
アルファベットや関連する記号類などがありました。
JIS X 0212-1990 3.1
[5] 漢字は、5801字あり、補助漢字と呼ばれていました。
[151] 非漢字の領域には空き区点位置がたくさんあります。 また、漢字の領域の後は空き区点位置となっています。
[12] JIS X 0212-1990 4.6 は、 1区から84区の空きは将来の標準化のため利用禁止とし、 85区から94区の空きは情報交換の当事者間の協定により利用できる自由領域としていました。 ISO-IR にもそのように書かれています >>18。
[10] Super DEC 漢字は 78区から94区を UDC としていました。
[11]
eucJP-open
では
78-94区が共通自由領域、
うち83区と84区に
IBM の拡張が割り当てられていました。
[17] JIS X 0213:2000 の第2面は JIS X 0212-1990 の空き領域に文字が割り当てられていて、 (技術的には) 同時実装できるように配慮されているようです。 ただし、 空き領域の利用法の規定や同じ文字の存在のため、 両方の規格に同時に適合することはできません (規定に違反した状態になります)。
[58] JIS X 0212 の非漢字の区点位置はなぜか飛び飛びで、 どうやら JIS X 0208 の非漢字の区点位置と重ならないようです。 偶然とは思えませんが、 JIS X 0212 にはそれを活用した符号化方式の定めはありません。 また、漢字の区点位置は完全に重なっていますから、 そのまま同時実装できるわけでもありません。
[59] JIS X 0213 の非漢字もこれを完全に無視しています。
[57]
規格票の例示字体として平成明朝が新規制作されました。
[23] 40区53点の右下の「又」の字形
[32] 払っている ISO-IR 字形はよく見るとはつがしら右上にある右下への斜線の起筆も少し下に下がっている気がします (CID+13982 はそうでもありません)。 (JIS X 0208:1978 ISO-IR 字形は止めていますが、はつがしらの斜線の起筆は少し下がっています。)
[36] 66区87点でも同じような現象が起こっています。ただしはつがしらは下がっていません。
[132] 他にも ISO-IR と規格票で字形が違って見えるものがいくつかあります。
[146] バランス違いのみ: 46-94
[134] ISO-IR PDF 字形不鮮明で変わっているか同じか怪しい: 21-12, 22-21, 28-69, 28-79, 29-87, 34-81, 38-53, 41-27, 41-89, 58-88, 70-13, 73-46, 32-36 (変わっていそうだけどバランス違いだけ), 35-41, 18-70 (バランス違い), 48-70, 70-85, 52-75, 20-3
[109]
規格票と ISO-IR の字形差のリストは、
AJ1 と JIS X 0212 の字形差のリスト (
[14] JIS X 0212 は独立した符号化文字集合は規定していません。
[13] JIS X 0212-1990 は ISO/IEC 2022 94n集合用エスケープシーケンス 4/4 を使って指示できると定めていました。 ISO-IR でこの終端バイトが登録されています。
[15] 実際に ISO/IEC 2022 環境で JIS X 0212 を利用した符号として、 EUC-JP, ISO-2022-JP-1, ISO-2022-JP-2, ISO-2022-INT があります。
[6] EUC-JP は元々 JIS X 0208 などで構成されていましたが、
G3 に JIS X 0212 を使うように拡張されました。
[150] ISO-2022-JP は元々 JIS X 0208 などで構成されていましたが、
JIS X 0212 などを使えるように拡張されて ISO-2022-JP-2 となりました。
[37] 平成時代中期頃には Windows が標準フォント (MS明朝, MSゴシックなど) に従来のマイクロソフト標準キャラクタセットの文字に加えて JIS X 0212 相当の文字を実装し、 Unicode 化されたアプリケーションから利用可能としていました。 これを 「JIS X 0212 対応」 ということがありました。
[38] JIS X 0212 にはこのような利用方法の規定はありません。 一応 JIS X 0221 には JIS X 0212 との対応関係が定められていますから、 広い意味でこれも JIS X 0212 の一種と強弁できないこともないのかもしれませんが、 かなり怪しい表現です。
[60] に JIS X 0208:1990 と JIS X 0212:1990 が同時制定された時点では、 JIS X 0212 は JIS X 0208 と併用される前提で作られたようですから、 「JIS X 0208:1990 のすべての文字と JIS X 0212:1990 のすべての文字は異なる」 というのが JISC の当時の公式見解だったと考えられます。
[62] に JIS X 0213:2000 が制定されましたが、 JIS X 0213 は面区点位置と JIS X 0212 の区点位置の関係を示し、 同時利用も拒まないまでも、積極的に同時利用は想定しませんでした。 JIS X 0213 は JIS X 0212 の文字の一部は含み、それ以外は含んでいません。
[78] JIS X 0213 は一部の JIS X 0212 の文字が JIS X 0208 の区点位置に対応すると判断しています (>>310)。 つまり JIS X 0212 の判断が JIS X 0213:2000 で一部覆されたことになります。
[79] ややこしいことに、そのうちの更に一部は JIS X 0213:2004 で再度覆されました (>>76)。
[80] JIS X 0212:1990 が併用されるべき JIS X 0208:1990 は改正により既に消滅して久しく、 現在の JIS X 0208 も JIS X 0213 も JIS X 0212:1990 とはこのように整合していないと思われるのですが、 なぜか JISC は JIS X 0212:1990 を改正も廃止もしていません。法令に基づき確認は続けているので、 JISC は現行 JIS X 0212:1990 の内容が適当と判断しているようなのですが、 理解に苦しみます。
[81] JIS X 0212 と JIS X 0213 の関係には諸説あります。 数え方が違うので直接比較できず、互いに矛盾しているのかどうかもよくわかりません。
[82]
JIS X 0208:1983 改正の強引な字形変更 (
[137] ISO/IEC 10646:2017 #page=2632
A.4.5 374 JAPANESE JIS X 0213:2004 IDEOGRAPHS FROM PREVIOUS JIS STANDARDS
The fixed collection 374 JAPANESE JIS X 0213:2004 IDEOGRAPHS FROM PREVIOUS JIS STANDARDS consists of 2828 characters, of which 2743 were part of JIS X 0212-1990 (referred as J1 sources in the previous version of this International Standard) and 85 were part of the ‘Unified Japanese IT Vendors Contemporary Ideographs, 1993’ (referred as JA in the previous version of this International Standard). Among these 2828 characters, 205 had their glyph representation slightly modified. These 2828 characters use the ‘J13, J13A, J14, JA3, and JA4’ notations in their prefix four source identification as described in sub-clause 23.1.
NOTE 1 – Given its large size and the large number of sparse ranges, the collection is not specified by code point ranges in this document but instead by a linked content.
The fixed collection 374 is defined by a machine-readable format that is accessible as a link:
http://standards.iso.org/iso-iec/10646/ed-5/JIS-X-0213-FromPrevious.txt.
[310] この出典・字形変更の初出は ISO/IEC 10646:2014/Amd.2:2016。
[133] この他に JIS X 0208 部分の変更があります。
[9] Unicode の CJK統合漢字 (URO) は、 JIS X 0212-1990 を出典 J1 として用いました。このため BMP の CJK統合漢字本体にすべての補助漢字が含まれています。
[51] 現在は JIS X 0213 に置き換えられたため、 JIS X 0213 にないUnicode符号点の出典としてだけ残っています。
[21] 古い JIS X 0221 は日本版のみの附属書で JIS X 0212 と JIS X 0221 の関係を定めていました。 今の JIS X 0221 ではなぜか消滅しています。
[22] Unihan に CJK統合漢字と JIS X 0212 の関係が入っています。 漢字部分だけですが、かつての JIS X 0221 の規定と同等です。
[136]
2区23点 (TILDE
) は、
そのままの実装と
FULLWIDTH TILDE
とする実装があります。
>>135
[83] 表外漢字字体表, 常用漢字表, 人名用漢字改正などとの関係は、 規格上明確にされていません。
[84]
日本政府はこれらの改正の際に JIS X 0212
との関係を整理させたことはありますが、
その結果何もせずに放置されています。
[39] 文字情報基盤の一覧表には MJ文字図形と JIS X 0212 の漢字の関係が記述されています。
[40] 非漢字の対応表はなく、 IPAmj明朝が JIS X 0212 をカバーしているかは不明です。
[41] Adobe-Japan2 は JIS X 0212-1990 に相当するものとして制定されました。 例示字形にも平成明朝が使われていました。 JIS X 0212 で規定された文字と完全に対応関係にあります。 対応は CMap ファイルで知ることが出来ます。
[42] しかし Adobe-Japan2 は Adobe-Japan1-6 制定により非推奨とされています AJ2 CMap。 AJ1, AJ2, JIS X 0212 の対応表も提供されています >>44, >>43。 (漢字と AJ1 の対応表は AJ1 のデータファイルにも含まれています。)
[46]
AJ2 CID+0 は表にありませんが、 .notdef
グリフであり、
AJ1 CID+0 に対応すると考えられます。
[47] それ以外のすべての AJ2 CID は AJ1 CID との対応が表にあります。 >>44 は JIS X 0213:2000 相当、 >>43 は JIS X 0213:2004 相当の AJ1 CID との関係が示されていて、 JIS X 0212 相当の AJ1 CID が他にあるときは丸括弧付きで示されています。 >>44 と >>43 で5箇所が違います。 つまり AJ2 から AJ1 に変換したいなら、丸括弧付きがあればそれ、 なければ括弧外の CID を使えばよく、 その場合 >>44 と >>43 のどちらに従っても同じです。
[54] 公式には機械可読なデータファイルは提供されていません。 そのため実装は困難とは言わないまでも、負担が大きいです。
[55] 半公式的なもの:
[8] JIS X 0213 は、 JIS X 0212 の選定基準は不適切だったとして、 JIS X 0212 とまったく互換性のない符号化文字集合を規定しました。 ただし EUC で JIS X 0212 と JIS X 0213 第2面を同時に実装できるよう、 重ならないように配置しています。
[152] 補助漢字の思い出 - 未来のいつか/hyoshiokの日記, https://hyoshiok.hatenablog.com/entry/20060518/p1
[153] そろそろUnicodeについて一言いっておくか - 未来のいつか/hyoshiokの日記, https://hyoshiok.hatenablog.com/entry/20090419/p2
[19] fid94-ma.pdf, , https://joao-roiz.jp/mtoyo/TEI/fid94-ma.pdf#page=8
The most widely used coded character sets for the contemporary Japanese are those by the Japan Industrial Standard (JIS)
1.
X0208-1990
Code of the Japanese graphic character set for information interchange2.
X0212-1990
Code of the supplementary Japanese graphic character set for information interchangeboth of which the revisions are planned to be published in 1995.
[20] >>19 この執筆当時 () は JIS X 0212 も改正する予定だったらしい。