X0212

JIS X 0212

[1] JIS X 0208-1990 情報交換用漢字符号―補助漢字は、 制定官報公示された JIS漢字規格でした。

仕様書

[52] 規格票は以前は JISC のウェブサイトで画像 PDF として閲覧できました。

[53] ISO-IR : >>18

文字集合

[3] 942図形文字集合でした。 JIS X 0208 との併用が想定され、 JIS X 0208 に含まれない図形文字が収録されています。

[45] 合計6067個の区点位置文字が割り当てられていました。

[4] 非漢字は、 266字ありました。 アルファベットや関連する記号類などがありました。 JIS X 0212-1990 3.1 図形文字の種類 によると:

[122] 非漢字のほとんどは欧州で使われる文字です。 仏語用文字など日本でも店名などでしばしば使われるものが含まれるとはいえ、 ほとんどはその言語や国の関係の分野でしか使われなさそうなものばかりです。 一方で仮名東アジア系の記号類などはまったく含まれていません。 日本文字集合として酷くアンバランスな印象が拭えません。 JIS X 0212非漢字JIS X 0213非漢字があまり重ならないのもその辺の理由なのでしょう。

[5] 漢字は、5801字あり、補助漢字と呼ばれていました。

[61] JIS X 0212 全体を補助漢字ということもあります。

空き領域

[151] 非漢字の領域には空き区点位置がたくさんあります。 また、漢字の領域の後は空き区点位置となっています。

外字割当

[12] JIS X 0212-1990 4.6 は、 1区から84区の空きは将来の標準化のため利用禁止とし、 85区から94区の空きは情報交換の当事者間の協定により利用できる自由領域としていました。 ISO-IR にもそのように書かれています >>18

[10] Super DEC 漢字は 78区から94区を UDC としていました。

[11] eucJP-open では 78-94区が共通自由領域、 うち83区と84区に IBM の拡張が割り当てられていました。

JIS X 0208 との関係

[17] JIS X 0213:2000 の第2面は JIS X 0212-1990空き領域文字が割り当てられていて、 (技術的には) 同時実装できるように配慮されているようです。 ただし、 空き領域の利用法の規定や同じ文字の存在のため、 両方の規格に同時に適合することはできません (規定に違反した状態になります)。

[58] JIS X 0212非漢字区点位置はなぜか飛び飛びで、 どうやら JIS X 0208非漢字区点位置と重ならないようです。 偶然とは思えませんが、 JIS X 0212 にはそれを活用した符号化方式の定めはありません。 また、漢字区点位置は完全に重なっていますから、 そのまま同時実装できるわけでもありません。

[59] JIS X 0213非漢字もこれを完全に無視しています。

字形

[57] 規格票例示字体として平成明朝が新規制作されました。 平成明朝

[23] 40区53点の右下の「又」の字形

[32] 払っている ISO-IR 字形はよく見るとはつがしら右上にある右下への斜線の起筆も少し下に下がっている気がします (CID+13982 はそうでもありません)。 (JIS X 0208:1978 ISO-IR 字形は止めていますが、はつがしらの斜線の起筆は少し下がっています。)

[36] 66区87点でも同じような現象が起こっています。ただしはつがしらは下がっていません。

[132] 他にも ISO-IR と規格票で字形が違って見えるものがいくつかあります。

[146] バランス違いのみ: 46-94

[134] ISO-IR PDF 字形不鮮明で変わっているか同じか怪しい: 21-12, 22-21, 28-69, 28-79, 29-87, 34-81, 38-53, 41-27, 41-89, 58-88, 70-13, 73-46, 32-36 (変わっていそうだけどバランス違いだけ), 35-41, 18-70 (バランス違い), 48-70, 70-85, 52-75, 20-3, 46-63

[109] 規格票ISO-IR の字形差のリストは、 AJ1JIS X 0212 の字形差のリスト ( AJ1 ) とも一部重なります。

符号化

[14] JIS X 0212 は独立した符号化文字集合は規定していません。


[13] JIS X 0212-1990ISO/IEC 2022 94n集合エスケープシーケンス 4/4 を使って指示できると定めていました。 ISO-IR でこの終端バイトが登録されています。

[15] 実際に ISO/IEC 2022 環境で JIS X 0212 を利用した符号として、 EUC-JP, ISO-2022-JP-1, ISO-2022-JP-2, ISO-2022-INT があります。

[6] EUC-JP は元々 JIS X 0208 などで構成されていましたが、 G3JIS X 0212 を使うように拡張されました。 EUC-JP

[150] ISO-2022-JP は元々 JIS X 0208 などで構成されていましたが、 JIS X 0212 などを使えるように拡張されて ISO-2022-JP-2 となりました。 ISO-2022-JP-2


[37] 平成時代中期頃には Windows が標準フォント (MS明朝, MSゴシックなど) に従来のマイクロソフト標準キャラクタセット文字に加えて JIS X 0212 相当の文字を実装し、 Unicode 化されたアプリケーションから利用可能としていました。 これを 「JIS X 0212 対応」 ということがありました。

[7] MicrosoftシフトJISを拡張しませんでした。

[38] JIS X 0212 にはこのような利用方法の規定はありません。 一応 JIS X 0221 には JIS X 0212 との対応関係が定められていますから、 広い意味でこれも JIS X 0212 の一種と強弁できないこともないのかもしれませんが、 かなり怪しい表現です。

JIS X 0208、JIS X 0213 との関係

[60] JIS X 0208:1990JIS X 0212:1990 が同時制定された時点では、 JIS X 0212JIS X 0208 と併用される前提で作られたようですから、 「JIS X 0208:1990 のすべての文字と JIS X 0212:1990 のすべての文字は異なる」 というのが JISC の当時の公式見解だったと考えられます。

[154] JIS X 0208:1997 が制定された時、 区点位置の解釈が全面的に見直されました。 第1次規格からその後の改正の経緯を踏まえての明文化ということにはなっていますが、 それまでの版にはない規定が多く追加されました。 そしてそれには JIS X 0212:1990 はほとんど考慮されていません。

[62] JIS X 0208:1997 の追加・一部改変という形の JIS X 0213:2000 が制定されましたが、 JIS X 0213面区点位置JIS X 0212区点位置の関係を示し、 同時利用も拒まないまでも、積極的に同時利用は想定しませんでした。 JIS X 0213JIS X 0212文字の一部は含み、それ以外は含んでいません。

[78] JIS X 0213 は一部の JIS X 0212文字JIS X 0208区点位置に対応すると判断しています (>>310)。 つまり JIS X 0212 の判断が JIS X 0213:2000 で一部覆されたことになります。

[155] JIS X 0208:1997JIS X 0213:2000JIS X 0212 をほとんど黒歴史扱いしています。

[156] JIS X 0208 の 19-33 () と別に JIS X 0212 は 35-3 () を追加しました。

[157] ところが JIS X 0208:1997が歴史的に混同されてきて明確に区別されていないことを理由に、 両者を同じ区点位置 19-33 に包摂すると判断しました。 JIS X 0213:2000 もこの判断を踏襲してを別途追加しませんでした。

[161] つまり JIS X 0208:1990 + JIS X 0212:1990 から JIS X 0208:1997 + JIS X 0213:2000 の間で一種の非互換変更が行われたことになります。

[159] ちなみにその後平成12年の表外漢字字体表ではのみが示され、 平成22年の常用漢字表でものみが示されました。

[160] 平成28年の常用漢字の字形に関する指針では、 は 「同じ字体の別字種」 という扱いで Q & A に登場し、 JISUnicode の関係が云々とわかるようなわからないような解説がされています。 >>158

[79] ややこしいことに、そ (>>78) のうちの更に一部は JIS X 0213:2004 で再度覆されました (>>76)。

[80] JIS X 0212:1990 が併用されるべき JIS X 0208:1990 は改正により既に消滅して久しく、 現在の JIS X 0208JIS X 0213JIS X 0212:1990 とはこのように整合していないと思われるのですが、 なぜか JISCJIS X 0212:1990改正廃止もしていません。法令に基づき確認は続けているので、 JISC は現行 JIS X 0212:1990 の内容が適当と判断しているようなのですが、 理解に苦しみます。

[81] JIS X 0212JIS X 0213 の関係には諸説あります。 数え方が違うので直接比較できず、互いに矛盾しているのかどうかもよくわかりません。

[82] JIS X 0208:1983 改正の強引な字形変更 ( JIS X 0208 ) の影響は巡り巡って JIS X 0208, JIS X 0212, JIS X 0213, JIS X 0221 におかしな事態を引き起こしています。

[530] 文字関係
key
jis:2000:moved
desc
JIS X 0212:1990 から JIS X 0213:2000 のほぼ同じ例示字体面区点位置へ。 または JIS X 9051 または JIS X 9052 から JIS X 0213:2000 の似た例示字体面区点位置へ。
[531] 文字関係
key
jis:2000:movechanged
desc
JIS X 0212:1990 から JIS X 0213:2000例示字体の異なるものの対応関係にある新規追加面区点位置へ。
[140] 文字関係
key
jis:2000:merged
desc
JIS X 0212:1990 から JIS X 0213:2000面区点位置へ。 当該面区点位置に最も近い JIS X 0208:1990 および JIS X 0212:1990区点位置が他にある場合。
datanote
JIS X 0213:2000 索引による。
[141] 文字関係
key
jis:2000:variantadded
desc
JIS X 0212:1990 から JIS X 0213:2000面区点位置へ。 JIS X 0213:2000 では対応関係があるとはされず、 文字情報基盤では MJ文字図形を介して対応関係にあるもの。
[138] 文字関係
key
jis:2004:moved
desc
JIS X 0212:1990 から JIS X 0213:2004 のほぼ同じ例示字体面区点位置へ。
[139] 文字関係
key
jis:2004:movechanged
desc
JIS X 0212:1990 から JIS X 0213:2004例示字体の異なるものの対応関係にある新規追加面区点位置へ。
[142] 文字関係
key
jis:1990:forkedjis1978
desc
JIS X 0208:1978 からほぼ同じ例示字体JIS X 0212:1990区点位置へ。
[143] 文字関係
key
jis:2000:forkedjis1978
desc
JIS X 0208:1978 からほぼ同じ例示字体JIS X 0213:2000 の新規追加面区点位置へ。
[144] 文字関係
key
jis:2004:forkedjis1978
desc
JIS X 0208:1978 からほぼ同じ例示字体JIS X 0213:2004 の新規追加面区点位置へ。
[147] 文字関係
key
jis:1990:forkedjis1978w
desc
JIS X 0208:1978 正誤票訂正前の誤字形からほぼ同じ例示字体JIS X 0212:1990区点位置へ。
[148] 文字関係
key
jis:2000:forkedjis1978w
desc
JIS X 0208:1978 正誤票訂正前の誤字形からほぼ同じ例示字体JIS X 0213:2000 の新規追加面区点位置へ。

[137] ISO/IEC 10646:2017 #page=2632

A.4.5 374 JAPANESE JIS X 0213:2004 IDEOGRAPHS FROM PREVIOUS JIS STANDARDS

The fixed collection 374 JAPANESE JIS X 0213:2004 IDEOGRAPHS FROM PREVIOUS JIS STANDARDS consists of 2828 characters, of which 2743 were part of JIS X 0212-1990 (referred as J1 sources in the previous version of this International Standard) and 85 were part of the ‘Unified Japanese IT Vendors Contemporary Ideographs, 1993’ (referred as JA in the previous version of this International Standard). Among these 2828 characters, 205 had their glyph representation slightly modified. These 2828 characters use the ‘J13, J13A, J14, JA3, and JA4’ notations in their prefix four source identification as described in sub-clause 23.1.

NOTE 1 – Given its large size and the large number of sparse ranges, the collection is not specified by code point ranges in this document but instead by a linked content.

The fixed collection 374 is defined by a machine-readable format that is accessible as a link: http://standards.iso.org/iso-iec/10646/ed-5/JIS-X-0213-FromPrevious.txt.

[310] この出典・字形変更の初出は ISO/IEC 10646:2014/Amd.2:2016。

[133] この他に JIS X 0208 部分の変更があります。 JIS X 0213

JIS X 9051、 JIS X 9052 との関係

JIS X 9051

Unicode との関係

[9] UnicodeCJK統合漢字 (URO) は、 JIS X 0212-1990 を出典 J1 として用いました。このため BMPCJK統合漢字本体にすべての補助漢字が含まれています。

[51] 現在は JIS X 0213 に置き換えられたため、 JIS X 0213 にないUnicode符号点の出典としてだけ残っています。


[21] 古い JIS X 0221 は日本版のみの附属書で JIS X 0212JIS X 0221 の関係を定めていました。 今の JIS X 0221 ではなぜか消滅しています。

[22] UnihanCJK統合漢字JIS X 0212 の関係が入っています。 漢字部分だけですが、かつての JIS X 0221 の規定と同等です。

[145] 文字関係
key
jisx0212:ucs
desc
JIS X 0212:1990 から Unicode へ。
datanote
非漢字のみ。

[136] 2区23点 (TILDE) は、 そのままの実装と FULLWIDTH TILDE とする実装があります。 >>135

常用漢字表等との関係

[83] 表外漢字字体表, 常用漢字表, 人名用漢字改正などとの関係は、 規格上明確にされていません。

[84] 日本政府はこれらの改正の際に JIS X 0212 との関係を整理させたことはありますが、 その結果何もせずに放置されています。 JIS X 0208, JIS X 0213, 常用漢字表, 人名用漢字, 表外漢字字体表

[85] ただしそれらの報告書や文字情報基盤により常用漢字表人名用漢字との対応関係は一応公表されています。

文字情報基盤との関係

[39] 文字情報基盤の一覧表には MJ文字図形JIS X 0212漢字の関係が記述されています。

[40] 非漢字の対応表はなく、 IPAmj明朝JIS X 0212 をカバーしているかは不明です。

Adobe-Japan との関係

[41] Adobe-Japan2JIS X 0212-1990 に相当するものとして制定されました。 例示字形にも平成明朝が使われていました。 JIS X 0212 で規定された文字と完全に対応関係にあります。 対応は CMap ファイルで知ることが出来ます。

[42] しかし Adobe-Japan2Adobe-Japan1-6 制定により非推奨 (deprecated) とされています AJ2 CMapAJ1, AJ2, JIS X 0212 の対応表も提供されています >>44, >>43。 (漢字AJ1 の対応表は AJ1 のデータファイルにも含まれています。)

[46] AJ2 CID+0 は表にありませんが、 .notdef グリフであり、 AJ1 CID+0 に対応すると考えられます。

[47] それ以外のすべての AJ2 CIDAJ1 CID との対応が表にあります。 >>44JIS X 0213:2000 相当、 >>43JIS X 0213:2004 相当の AJ1 CID との関係が示されていて、 JIS X 0212 相当の AJ1 CID が他にあるときは丸括弧付きで示されています。 >>44>>43 で5箇所が違います。 つまり AJ2 から AJ1 に変換したいなら、丸括弧付きがあればそれ、 なければ括弧外の CID を使えばよく、 その場合 >>44>>43 のどちらに従っても同じです。

[50] AJ1例示字形小塚明朝AJ2例示字形平成明朝です。 表で示された両者がどの程度一致しているのかは定かではありません。

データ

[54] 公式には機械可読なデータファイルは提供されていません。 そのため実装は困難とは言わないまでも、負担が大きいです。

[55] 半公式的なもの:

[56] フォント例示字体と同じ平成書体がありますが、 自由には使えません。

歴史

[2] 確認

[8] JIS X 0213 は、 JIS X 0212 の選定基準は不適切だったとして、 JIS X 0212 とまったく互換性のない符号化文字集合を規定しました。 ただし EUCJIS X 0212JIS X 0213 第2面を同時に実装できるよう、 重ならないように配置しています。

[152] 補助漢字の思い出 - 未来のいつか/hyoshiokの日記, https://hyoshiok.hatenablog.com/entry/20060518/p1

[153] そろそろUnicodeについて一言いっておくか - 未来のいつか/hyoshiokの日記, https://hyoshiok.hatenablog.com/entry/20090419/p2

[19] fid94-ma.pdf, , https://joao-roiz.jp/mtoyo/TEI/fid94-ma.pdf#page=8

The most widely used coded character sets for the contemporary Japanese are those by the Japan Industrial Standard (JIS)

1. X0208-1990 Code of the Japanese graphic character set for information interchange

2. X0212-1990 Code of the supplementary Japanese graphic character set for information interchange

both of which the revisions are planned to be published in 1995.

[20] >>19 この執筆当時 () は JIS X 0212 も改正する予定だったらしい。