[3] 
[DFN[CJK統合漢字]]は、
[[Unicode]]
の[[漢字集合]]です。

* 呼称

[71] 
「CJK統合」とは[[中国]], [[日本]], [[韓国]]の[[漢字]]を[[統合][包摂規準]]したことを意味しています。

[72] 
当初は [[CJK]] 3種4欄 ([[中華人民共和国]], [[TCA]]
[WEAK[([[台湾]]、[[政治的理由]]。)]], [[日本]], [[韓国]])
でしたが、後に[[越南]]が加わり [[CJKV]] とも呼ばれます 
(が用語としては [[CJK]] のまま)。
更に[[香港]], [[澳門]], [[シンガポール]], [[朝鮮民主主義人民共和国]]等も出典に加わっています。

* Unihan データベース

[10] 
[[UCD]] の [DFN[Unihan]] データベースには
[[Unicode]]
[[CJK統合漢字]]の情報が入っています。

[29] [CITE@en-us[UAX #38: Unicode Han Database (Unihan)]], [TIME[2022-09-12T17:16:37.000Z]], [TIME[2022-10-02T02:10:17.537Z]] <https://www.unicode.org/reports/tr38/>


[2] [CITE@en-us[UAX #44: Unicode Character Database]], [TIME[2020-03-06T22:23:11.000Z]], [TIME[2020-10-20T12:12:27.278Z]] <http://www.unicode.org/reports/tr44/#Unihan>


[FIG(short list)[ [8] [[Unihan]]
- [CODE[kCCCII]]
- [CODE[kCNS1986]]
- [CODE[kCNS1992]]
- [CODE[kEACC]]
- [CODE[kGB7]]
- [CODE[kGB8]]
- [CODE[kRSAdobe_Japan1_6]]
- [CODE[kHKGlyph]]
- [CODE[kIRG_HSource]]
- [CODE[kIRG_JSource]]
- [CODE[kIRG_KPSource]]
- [CODE[kIRG_VSource]]
- [CODE[kJinmeiyoKanji]]
- [CODE[kJoyoKanji]]
- [CODE[kKoreanName]]
]FIG]

[FIG(short list)[ [88] [[CJK統合漢字]]と[[CJK互換漢字]]の[[出典]]

- [[出典G]]
- [[出典T]]
- [[出典J]]
- [[出典K]]
- [[出典KP]]
- [[出典V]]
- [[出典M]]
- [[出典S]]
- [[出典U]]
- [[出典UK]]
- [[出典S]]
- [[出典Z]]

]FIG]

[101] 
[CITE@en[GitHub - unicode-org/unihan-database: For review of draft Unihan database changes, removals, and additions by experts.]], [TIME[2023-09-23T15:30:28.000Z]] <https://github.com/unicode-org/unihan-database>


** Unihan の歴史

[11] [CITE[The Unicode Han Character Cross-Reference]], 
[TIME[2009-12-14T22:08:35.000Z]], [TIME[2022-10-02T01:50:07.995Z]] <https://www.unicode.org/Public/1.1-Update/CJKXREF.TXT>

[12] [[Unicode 1.1]] 時代の [[Unihan]] に相当するファイル (今とファイル形式が違う)。
[TIME[1994-03-14]]

- [13] [[GB]]
-- 0 : [[GB 2312-80]]
-- 1 : [[GB 12345-90]]
-- 3 : [[GB 7589-87]]
-- 5 : [[GB 7590-87]]
-- 7 : [[General Purpose Han Characters for Modern Chinese]]
-- 8 : [[GB 8565-89]]
- [14] [[Big 5]]
- [15] [[CNS 11643-1986]]
-- 1 : Primary
-- 2 : Less frequent characters
-- E : User characters
- [16] [[JIS]]
-- 0 : [[JIS X 0208-1990]]
-- 1 : [[JIS X 0212-1990]]
-- I : IBM extensions
- [17] KSC
-- 0 : [[KS C 5601-1987]]
-- 1 : [[KS C 5657-1991]]
-- 2 : IBM extensions
- [[ANSI Z39.64-1989]] ([[EACC]])
- [[CCCII]], level 1
- [[Xerox]]

[18] これより古い[TIME[1994-10-14]]版の前まで Fujitsu corporate character set
があったらしい。低品質のため削除されたとのこと。 [SRC[>>11]]

-*-*-

[19] 
[CITE[Unihan database]], 
[TIME[2001-02-27T08:42:03.000Z]], [TIME[2022-10-02T01:56:34.077Z]] <https://www.unicode.org/Public/2.0-Update/Unihan-1.txt>

[20] [[Unicode 2.0]]。 [[Unihan]] という名前のファイルの始まり?

kBigFive, kCNS1986, kGB0, kGB1, kGB3, kGB5, kGB7, kGB8, kJis0, kJis1, 
kKSC0, kKSC1, kPseudoGB1,
kCCCII, kCNS1992,
kEACC, kIBMJapan

[21] [CITE[Unihan database]], 
[TIME[2001-02-27T08:57:50.000Z]], [TIME[2022-10-02T01:59:50.804Z]] <https://www.unicode.org/Public/2.1-Update/Unihan-2.txt>

[22] [CITE[Unihan database]], 
[TIME[2001-02-27T09:25:50.000Z]], [TIME[2022-10-02T02:00:32.730Z]] <https://www.unicode.org/Public/3.0-Update/Unihan-3.txt>

kBigFive, kCNS1986, kGB0, kGB1, kGB3, kGB5, kGB7, kGB8, kJis0, kJis1, 
kKSC0, kKSC1, kPseudoGB1,
kCCCII, kCNS1992,
kEACC, kIBMJapan

- [23] [CODE[kIRG_GSource]]
-- G0 : [[GB 2312-80]]
-- G1 : [[GB 12345-90]] with 58 Hong Kong and 92 Korean "Idu" characters
-- G3 : [[GB 7589-87]] unsimplified forms
-- G5 : [[GB 7590-87]] unsimplified forms
-- G7 : [[General Purpose Hanzi List for Modern Chinese Language, and General List of Simplified Hanzi]]
-- GS : [[Singapore characters]]
-- G8 : [[GB 8685-88]]
-- GE : [[GB 16500-95]]
- [24] [CODE[kIRG_JSource]]
-- J0 : [[JIS X 0208-1990]]
-- J1 : [[JIS X 0212-1990]]
-- JA : [[Unified Japanese IT Vendors Contemporary Ideographs, 1993]]
- [25] [CODE[kIRG_KSource]]
-- K0 : [[KS C 5601-1987]]
-- K1 : [[KS C 5657-1991]]
-- K2 : [[PKS C 5700-1 1994]]
-- K3 : [[PKS C 5700-2 1994]]
- [26] [CODE[kIRG_TSource]]
-- T1 : [[CNS 11643-1992]], plane 1
-- T2 : [[CNS 11643-1992]], plane 2
-- T3 : [[CNS 11643-1992]], plane 3 (with some additional characters)
-- T4 : [[CNS 11643-1992]], plane 4
-- T5 : [[CNS 11643-1992]], plane 5
-- T6 : [[CNS 11643-1992]], plane 6
-- T7 : [[CNS 11643-1992]], plane 7
-- TF : [[CNS 11643-1992]], plane 15
- [27] [CODE[kIRG_VSource]]
-- V1 : [[TCVN 5773:1993]]
-- V2 : [[TCVN 6056:1995]]

[28] [CITE[[[UTR #38]]: A User’s Guide to the Unihan Database]], [TIME[2006-05-19T17:06:33.000Z]], [TIME[2022-10-02T02:07:44.980Z]] <https://www.unicode.org/reports/tr38/tr38-3.html>

[DFN[UTR #38]] の最古の公開案。

* 符号

[SEE[ [[漢字の符号]] ]]

* 符号表と例示字形

[74] 
[[Unicode]] は[[符号点]]ごとに[[代表字形]]を1つ示していますが、
[[CJK統合漢字]]は特例で出典ごとの[[字形]]が示されています。

[89] 
[[符号表]]の相互参照で使う場合 (例えば[[CJK互換漢字]]の[[符号表]]にある
[[CJK統合漢字]]への参照) には1つ[[字形]]が選ばれて表示されています。
その唯一の[[字形]]がどのように決められているのかは謎です。


[41] [CITE@zh[CJKUI修正笔记(一):WG2 N5006R(未竟) - 知乎]], [TIME[2022-11-07T13:26:27.000Z]] <https://zhuanlan.zhihu.com/p/44819911>

変更事例集

[42] [CITE@zh[[[CJKUI]]落地中待解决的问题搜集(未竟) - 知乎]], [TIME[2022-11-07T13:56:29.000Z]] <https://zhuanlan.zhihu.com/p/57501943>

[45] [CITE@zh[CJK统一汉字区块认同问题存疑处收集(未竟) - 知乎]], [TIME[2022-11-07T14:34:35.000Z]] <https://zhuanlan.zhihu.com/p/27005748>

[46] 多すぎて草も生えない

- [67] [CITE[IRG Document Index - IRGN901- IRGN1000]], [TIME[2022-11-11T03:16:43.000Z]] <https://appsrv.cse.cuhk.edu.hk/~irg/n0901-1000.html>
-- [68] N904

[69] >>68 [CODE[U+236AD]] が 
[[ISO/IEC 10646-2:2001]]
で誤字形だったらしい。

[[CNS 14649-2]], X 5066-2 (中華民国92年版) #page=144 は誤字形。

>>64 #page=66 [[Unicode 3.1]] は正しい。

>>56 #page=110 [[ISO/IEC 10646:2003]] は正しい.

[73] 
[CITE[22287-irgn2585-wg2n5186-hanja.pdf]], [TIME[2022-11-30T15:29:27.000Z]], [TIME[2022-12-05T03:05:25.533Z]] <https://www.unicode.org/L2/L2022/22287-irgn2585-wg2n5186-hanja.pdf>


-*-*-

[98] 
[[Unicode]] 15.1
で
[[KP1]]
字形が追加されました。

[99] 
[[CJK統合漢字]]拡張Bは以前から2欄幅 × 4で1ページで、3つ[[以上]]の字形があるときは次の行に続けていました。
[[KP1]] 追加でこの行折返しが新規に非常に多く発生しています。

[100] 
[CODE[U+29520]] には [[KP1]] の字形と出典が追加されたのに加えて、
[[出典U]]の出典のみ (UTC-00035, 字形空白) が追加されています。
この
UTC-00035 
は元々
[CODE[U+9855]]
に対応付けられていた (出典ではない) ものでした。

-*-*-

[117] 
[TIME[2023-09-29T12:23:50.000Z]]
<https://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=71855&item_no=1&attribute_id=1&file_no=1>

第3版の[[符号表]]開発について

[33] [CITE@ja[ここまでのまとめ:10646次版ドラフトの字体チェック - しろもじメモランダム]], [TIME[2023-10-27T14:11:58.000Z]] <https://shiromoji.hatenablog.jp/entry/20090612/1244830975>

[34] >>33 [[Unicode]] 5.2 の頃の時代の新符号表の不審な字形差のリスト

[35] 
[[Unicode]] 5.2 で新[[符号表]]に置き換えられた時に各国の字形がそれまでと変わっていることが多く、
誤りとしてその後変更されているものも多い。特に拡張Bはこの時初めて多欄符号表が作られて、
仕様の不具合 (統合ミス) は明るみに出たのがこの時ということが多いらしい。

[36] 
各国字形の変更の情報は断片的なものがあちこちに転がってはいるものの、
全体像がさっぱりつかめない。


[292] 
[CC[U+7361]] (& [CC[U+2486F]]) はあまり言われないけど最悪級に酷い失敗事案なのでは...
国ごとに字形が違う上に同じ国の字形が版ごとに何度も変わりまくっていてしかも[[重複符号化]]。


** 歴代符号表

- [308] 
[[ISO/IEC DIS 10646-1.2:1992]]
-- [311] 
[CITE@ja[n0783-2.pdf]], [TIME[2017-06-12T20:03:19.000Z]], [TIME[2025-01-03T08:31:29.612Z]] <https://www.unicode.org/L2/Historical/n0783-2.pdf>
--- [312] [[URO]]
--- [313] 現行版とは違いが多い、
ずれがある場所は例えば 5655, 5A72, 5E50, 6558, 6723, 6CF4 など
--- [333] 多欄
-- [309] 
[CITE@ja[n0783-1.pdf]], [TIME[2017-06-12T20:02:54.000Z]], [TIME[2025-01-03T08:30:14.663Z]] <https://www.unicode.org/L2/Historical/n0783-1.pdf#page=228>
--- [310] #page=228 [[CJK互換漢字]]
--- [334] 単欄
- [131] [[ISO/IEC 10646-1:1993]]
-- [132] [[URO]]
- [136] [CITE[GB 13000.1-1993: Information technology—Universal Multiple-Octet Coded Character Set (UCS)—Part 1: Architecture and Basic Multilingual Plane - GB 13000.1-1993 信息技术 通用多八位编码字符集(UCS) 第一部分:体系结构与基本多文种平面_text.pdf]], [TIME[2016-09-25T11:24:12.000Z]], [TIME[2023-10-04T13:47:53.896Z]] <https://ia801201.us.archive.org/13/items/GB13000-11993/GB%2013000.1-1993%20%E4%BF%A1%E6%81%AF%E6%8A%80%E6%9C%AF%20%E9%80%9A%E7%94%A8%E5%A4%9A%E5%85%AB%E4%BD%8D%E7%BC%96%E7%A0%81%E5%AD%97%E7%AC%A6%E9%9B%86%28UCS%29%20%E7%AC%AC%E4%B8%80%E9%83%A8%E5%88%86%EF%BC%9A%E4%BD%93%E7%B3%BB%E7%BB%93%E6%9E%84%E4%B8%8E%E5%9F%BA%E6%9C%AC%E5%A4%9A%E6%96%87%E7%A7%8D%E5%B9%B3%E9%9D%A2_text.pdf>
-- [134] #page=238 - #page=243 [[CJK互換漢字]]
-- [135] #page=266 - #page=702 [[URO]]
- [298] 
[[Unicode 2.0]]
-- [299] 
[CITE@ja[The Unicode Standard Version 2.0 - CodeCharts2.pdf]], [TIME[2011-03-01T21:10:56.000Z]], [TIME[2025-01-03T06:35:31.950Z]] <https://www.unicode.org/versions/Unicode2.0.0/CodeCharts2.pdf>
--- [300] 紙の[[符号表]]
--- [307] [[URO]] 単欄
--- [301] なぜか [ [CC[U+9100]], [CC[U+91FF]] ] が欠落
- [49] [CITE[[[IRG]] Document Index - IRGN601- IRGN700]], [TIME[2022-11-09T03:13:37.000Z]] <https://appsrv.cse.cuhk.edu.hk/~irg/n0601-0700.html>
-- [50] [[ISO/IEC 10646-1:2000]](E) [[URO]], 拡張A
-- [51] [[ISO/IEC 10646-2]]:2000/CD:1999(E) 拡張B
--- [52] 最終版とは違いが多いらしい?
- [54] [CITE[[[IRG]] Document Index - IRGN801- IRGN900]], [TIME[2022-11-09T03:20:48.000Z]] <https://appsrv.cse.cuhk.edu.hk/~irg/n0801-0900.html>
-- [55] N801 拡張B 最終字形変更
- [53] [CITE@en-us[UAX #27: [[Unicode 3.1]]]], [TIME[2002-07-24T21:19:39.000Z]], [TIME[2022-11-11T03:13:34.845Z]] <https://www.unicode.org/reports/tr27/tr27-4.html>
-- [65] 拡張Bが [[Unicode]] に初追加
-- [63] 拡張Bはフォントがなくて字形の欠けたるありと書かれている。
-- [64] [TIME[2022-11-11T03:14:18.000Z]] <https://web.archive.org/web/20030409041358/http://www.unicode.org/charts/PDF/U20000.pdf>
--- [294] 
[CITE@ja[U20000.pdf]], [TIME[2025-01-03T06:18:02.000Z]] <https://web.archive.org/web/20030409041358if_/http://www.unicode.org:80/charts/PDF/U20000.pdf>
-- [295] 
[CITE@ja[U31-2F800.pdf]], [TIME[2001-04-01T23:48:29.000Z]], [TIME[2025-01-03T06:21:22.316Z]] <https://www.unicode.org/charts/PDF/Unicode-3.1/U31-2F800.pdf>
- [296] 
[[Unicode 3.2]]
-- [297] 
[CITE@ja[U32-F900.pdf]], [TIME[2002-03-27T23:54:29.000Z]], [TIME[2025-01-03T06:21:50.909Z]] <https://www.unicode.org/charts/PDF/Unicode-3.2/U32-F900.pdf>
- [183] 
[CITE[03024-02n3673.pdf]], [TIME[2003-01-29T19:02:40.000Z]], [TIME[2023-10-10T11:15:21.781Z]] <http://www.unicode.org/L2/L2003/03024-02n3673.pdf#page=3>
--
[184] 
[[ISO/IEC 10646-2:2001]]/Amd.1:2003 FDAM
--
[185] 
拡張B 字形変更 8文字
- [59] [CITE@ZH-TW[IRG21]], [[khlee]], [TIME[2022-11-09T03:31:11.000Z]] <https://appsrv.cse.cuhk.edu.hk/~irg/irg/CJK/CJK.htm>
-- [60] [TIME[2003-09-29]] ISO/IEC 10646: 2003 (E) [[URO]]
-- [61] [TIME[2003-09-29]] ISO/IEC 10646: 2003 (E) 拡張A
-- [56] [CITE[ISO-2003-charts-ExtB.pdf]], [TIME[2003-09-25T10:38:24.000Z]], [TIME[2022-11-09T03:29:44.978Z]] <https://appsrv.cse.cuhk.edu.hk/~irg/irg/CJK/ISO-2003-charts-ExtB.pdf>
--- [57] ISO/IEC 10646: 2003 (E) 拡張B
--- [58] 一覧には Unicode 版と書いてある。1欄。
-
[75] [CITE[CJK Unified Ideographs Extension B - UCS2003.pdf]], [TIME[2022-11-07T18:34:10.000Z]], [TIME[2023-03-24T08:15:01.892Z]] <https://www.unicode.org/Public/13.0.0/charts/UCS2003.pdf>
-- [133] 
拡張B 後になって作り直されたもの
- [302] 
[[Unicode 4.0]]
-- [303] 
[CITE@ja[The Unicode Standard 4.0 - CodeCharts.pdf]], [TIME[2010-12-04T00:45:56.000Z]], [TIME[2025-01-03T08:11:12.444Z]] <https://www.unicode.org/versions/Unicode4.0.0/CodeCharts.pdf#page=292>
--- [304] #page=292 拡張A (単欄)
--- [305] #page=322 URO (単欄)
--- [306] #page=466 互換漢字 (単欄、名前表あり)
- [180] 
[CITE@en-us[Errata fixed in Unicode 4.1.0]], [TIME[2016-04-08T23:45:57.000Z]], [TIME[2023-10-08T08:44:21.042Z]] <http://www.unicode.org/versions/Unicode4.1.0/erratafixed.html>
-- [181] 拡張B 4+7文字訂正
- [123] [[ISO/IEC 10646:2003]]/Amd.5:2008
-- [126] #page=7 説明
-- [127] #page=9 [[CJK統合漢字]] [ [CODE[U+9FC4]], [CODE[U+9FC6]] ] の[[符号表]]
-- [128] #page=9 拡張Cの出典KPの8字の字形
-- [129] #page=38 [[CJK互換漢字]] [ [CODE[U+FA6B]], [CODE[U+FA6D]] ] の[[符号表]]
-- [130] #page=65 [[CJK統合漢字]]拡張C
--- [124] 拡張Cの初出
--- [125] 当時の符号表は多欄、国ごとの列が確保されているのでスカスカ
- [188] 
[CITE[_ISO/IEC International Standard 10646-1 - n3658.pdf]], [TIME[2009-05-21T04:18:44.000Z]], [TIME[2023-11-06T12:58:38.949Z]] <http://std.dkuug.dk/jtc1/sc2/wg2/docs/n3658.pdf#page=87>
-- [189] ISO/IEC 10646:2003/Amd.8:2009 [[PDAM]]
-- [190] [TIME[西暦2009年 (平成21年)][2009]]
-- [191] 拡張D 多欄符号表
-- [192] この後の改訂で非互換変更が入っている
- [193] [CITE[Unibook Document - n3838.pdf]], [TIME[2010-04-23T20:06:52.000Z]], [TIME[2023-11-06T13:09:45.604Z]] <http://std.dkuug.dk/JTC1/SC2/WG2/docs/n3838.pdf#page=62>
-- [194] ISO/IEC 10646:2003/Amd.8:2010 FDAM [[符号表]]
-- [195] [TIME[2010-04-22]]
-- [196] 拡張D 多欄符号表
- [102] [CITE@EN-GB[IRG33]], [[khlee]], [TIME[2023-09-29T10:20:37.000Z]] <https://appsrv.cse.cuhk.edu.hk/~irg/irg/irg33/IRG33.htm>
-- [105] 西暦2010年 (平成22年)
-- [103] N1656 URO と拡張Aの新しい[[符号表]]案
-- [104] N1617 Japan 拡張C ([[JMK]]) の44個の字形を Amd.5 から変更
- [106] [CITE@EN-GB[IRG34]], [[khlee]], [TIME[2023-09-29T10:36:23.000Z]] <https://appsrv.cse.cuhk.edu.hk/~irg/irg/irg34/IRG34.htm>
-- [107] 西暦2010年 (平成22年)
-- [108] URO と拡張Aの多欄符号表案 (10646)
-- [109] 拡張Bの1欄符号表案 (Unicode)
- [137] [CITE[Index of /jtc1/sc2/wg2/docs/n3911.zip]], [TIME[2023-10-04T14:29:25.000Z]] <http://std.dkuug.dk/jtc1/sc2/wg2/docs/n3911.zip/>
-- [138] [TIME[2010-10-03]] FDIS ISO/IEC 10646:2011
-- [139] URO, 拡張A, 拡張C, 拡張D (多欄)
-- [140] 拡張B, [[CJK互換漢字]], [[CJK互換漢字]]補遺 (1欄)
- [110] [CITE[Wayback Machine]], [TIME[2023-09-29T12:00:44.000Z]] <https://web.archive.org/web/20150104015021/http://www.unicode.org/~suignard/IRG-N1748.pdf>
-- [113] 平成22年11月
-- [111] 拡張Bの多欄符号表案
- [118] [CITE[Index of /jtc1/sc2/wg2/docs/n3967.zip]], [TIME[2023-09-29T12:27:01.000Z]] <http://std.dkuug.dk/jtc1/sc2/wg2/docs/n3967.zip/>
-- [119] 2010-12 FCD ISO/IEC 10646:2012
-- [120] URO、拡張A、拡張B、拡張C (多欄)
- [114] [CITE[Wayback Machine]], [TIME[2023-09-29T12:05:21.000Z]] <https://web.archive.org/web/20150104014532/http://www.unicode.org/~suignard/CJK%20Unified%20Ideographs%20Extension%20B.pdf>
-- [116] 平成23年7月
-- [115] 拡張Bの多欄符号表案
-- [112] [[ISO/IEC 10646]] の拡張Bはこの後の第3版から多欄 (それまで1欄)


-*-*-


- [90] [[Unicode 4.0]], [TIME[2023-09-13T05:02:24.000Z]] <https://web.archive.org/web/20030916074204/http://www.unicode.org/charts/PDF/U4E00.pdf>
- [92] [[Unicode 4.1]], [TIME[2023-09-13T05:03:16.000Z]] <https://web.archive.org/web/20050504192138/http://www.unicode.org/charts/PDF/U4E00.pdf>
- [93] [[Unicode 5.0]], [TIME[2023-09-13T05:04:09.000Z]] <https://web.archive.org/web/20070628195838/http://www.unicode.org/charts/PDF/U4E00.pdf>
- [94] [[Unicode 5.1]], [TIME[2023-09-13T05:04:42.000Z]] <https://web.archive.org/web/20080912131017/http://www.unicode.org/charts/PDF/U4E00.pdf>


[91] >>90 >>92 >>93
この時代は [[URO]] も1欄だけの[[符号表]]。

- [95] [[Unicode 5.2]], [TIME[2023-09-13T05:06:07.000Z]] <https://web.archive.org/web/20100627104527/http://www.unicode.org/charts/PDF/U4E00.pdf>
-- [150] [[URO]]
--
[96] >>95 [[Unicode 5.2]] で6欄併記に。この頃は [[KP]] も (字形空欄で) 1欄あった。
-
[151] 
[CITE[The Unicode Standard 5.2 Code Charts - CodeCharts-MulticolHan.pdf]], [TIME[2009-09-24T00:37:49.000Z]], [TIME[2023-10-05T14:54:11.084Z]] <https://www.unicode.org/Public/5.2.0/charts/CodeCharts-MulticolHan.pdf>
-- [152] 
[[URO]], 拡張A, 拡張B, 拡張C (多欄)
--
[149] 
[[Unicode 5.2]] ([TIME[2009-10-01]])
は
[[ISO/IEC 10646:2003]]/Amd.5:2008 ([TIME[2008-12-01]]) +
[[ISO/IEC 10646:2003]]/Amd.6:2009 ([TIME[2009-10-13]])
相当とされるが、
[[CJK統合漢字]]の[[符号表]]は
[[ISO/IEC 10646:2011]] ([TIME[2011-05-02]])
より先に新しくなっていたらしい。
-- [165] 
拡張Bの UCS2003 はまだない

[141] [[ISO/IEC 10646:2011]] は [[Unicode 6.0]] 相当、
[[ISO/IEC 10646:2012]] は [[Unicode 6.2]] 相当。

- [175] [CITE[Wayback Machine]], [TIME[2023-10-07T08:26:51.000Z]] <https://web.archive.org/web/20120129135150/http://www.unicode.org/charts/PDF/UF900.pdf>
-- [176] [[Unicode]] 6.0 互換漢字
- [177] 
[CITE[Wayback Machine]], [TIME[2023-10-07T08:28:35.000Z]] <https://web.archive.org/web/20120803014848/http://www.unicode.org/charts/PDF/UF900.pdf>
-- [178] [[Unicode]] 6.1 互換漢字
- [173] [CITE[Wayback Machine]], [TIME[2023-10-07T08:25:31.000Z]] <https://web.archive.org/web/20121224062750/http://www.unicode.org/charts/PDF/UF900.pdf>
-- [174] [[Unicode 6.2]] 互換漢字
--- [179] 字形変更あり [SEE[ [[JIS X 0213]] ]]
- [158] [CITE[Wayback Machine]], [TIME[2023-10-06T06:02:02.000Z]] <https://web.archive.org/web/20150102034408/http://www.unicode.org/charts/PDF/U20000.pdf>
-- [159] [[Unicode]] 7.0 拡張B
- [171] [CITE[Wayback Machine]], [TIME[2023-10-07T08:24:24.000Z]] <https://web.archive.org/web/20151204125454/http://www.unicode.org/charts/PDF/UF900.pdf>
-- [172] [[Unicode]] 8.0 互換漢字

[143] [[ISO/IEC 10646:2014]]/Amd.2:2016 
で[[出典J]] 
が
[[JIS X 0213:2004]]
版に置き換わる。

- [166] 
[CITE[Wayback Machine]], [TIME[2023-10-06T06:10:20.000Z]] <https://web.archive.org/web/20210113012659/http://www.unicode.org/charts/PDF/U20000.pdf>
-- [167] [[Unicode]] 13.0 拡張B
--- [168] まだ [[UCS2003]] がある
- [163] [CITE[Wayback Machine]], [TIME[2023-10-06T06:07:41.000Z]] <https://web.archive.org/web/20211215122913/https://unicode.org/charts/PDF/U20000.pdf>
-- [164] [[Unicode]] 14.0 拡張B
--- [162] [[UCS2003]] 削除済
- [160] [CITE[Wayback Machine]], [TIME[2023-10-06T06:04:43.000Z]] <https://web.archive.org/web/20221226083429/https://www.unicode.org/charts/PDF/U20000.pdf>
-- [161] [[Unicode]] 15.0 拡張B

- [146] [[ISO/IEC 10646:2020]]/Amd.1:2023
-- [147] 拡張H新規追加
-- [148] その他も出典・字形変更多数
- [142] [CITE[ISO/IEC 10646:2020 6th edition, DRAFT Amd 2 Code charts - iso10646-6th-Amd2-CodeCharts.pdf]], [TIME[2023-08-10T03:54:28.000Z]], [TIME[2023-10-04T16:04:43.204Z]] <https://www.unicode.org/wg2/iso10646/edition6/charts/Amd2/iso10646-6th-Amd2-CodeCharts.pdf>
-- [144] [[符号表]]全体
-- [145] [[文字情報基盤]]の[[水平拡張]]
-- #page=323 部首
-- #page=351 筆画
-- #page=367 拡張A
-- - #page=1113 URO
-- #page=1224 - #page=1237 互換漢字
--- [170] [[J字形]]の字形変更 [SEE[ [[JIS X 0213]] ]]
-- #page=1871 - #page=3068 拡張B - 拡張I, 互換漢字補遺

** UCS2003

[273] IRG N1098

-*-*-

[154] 
[[Unicode]] 6.1 で導入されました。 [SRC[>>153]]

- [155] [CITE[IRG N2296 (Proposal to remove the UCS2003 representative glyphs from the Extension B code charts; L2/18-063) - 18063-remove-ucs2003-ext-b.pdf]], [TIME[2018-02-22T16:56:40.000Z]], [TIME[2023-10-06T05:39:26.859Z]] <https://www.unicode.org/L2/L2018/18063-remove-ucs2003-ext-b.pdf>
- [153] [CITE[L2/20-080 (Proposal to remove the UCS2003 representative glyphs from the Extension B code charts—Redux - 20080-remove-ucs2003-ext-b.pdf]], [TIME[2020-03-16T18:57:38.000Z]], [TIME[2023-10-06T05:35:56.648Z]] <https://www.unicode.org/L2/L2020/20080-remove-ucs2003-ext-b.pdf>

-*-*-

[157] 
U+28F99 は少しややこしいケース。
GKX と T6 で少し字形が違う。 UCS2003 はどちらとも違う。
[[UCS2003]] が削除されたかわりに近年「復活」した [[KP1]] は UCS2003 に近い。
最近[[水平拡張]]された [[JMJ]] も [[UCS2003]] に近い。


- [156] [CITE@en[UCS2003 glyph for 𨾙 (U+28F99) is misdesigned · Issue #157 · hfhchan/irg · GitHub]], [TIME[2023-10-06T05:50:28.000Z]] <https://github.com/hfhchan/irg/issues/157>


[32] [CITE@en-us[UTN #53: CJK Unified Ideographs Extension B, UCS2003 Reference Glyphs]], [TIME[2023-10-19T21:32:59.000Z]], [TIME[2023-10-23T13:14:25.709Z]] <https://www.unicode.org/notes/tn53/>

** 応用の規定

[70] 
[[RFC 1815]] の [CODE[ISO-10646-J-1]]
は、
[[CJK統合漢字]]の[[J欄][出典J]]字形による[RUBYB[べき][should]]と規定していました。

[169] 
[[SPREAD]]
は
[[SGML実体参照]]の形で[[国]]別の文字を参照できるとしていました。

[122] 
[[Pan-CJKV]]

[265] 
[[代用表記 (新・新しい日本語を作る会)]]


[211] 
[[LeXML]] には国別字形の選択のための
[CODE[cn]],
[CODE[tw]],
[CODE[jp]],
[CODE[kr]]
[[要素]]があります。

[281] 
[[CJK言語タグサンドイッチ列]]


* レンダリング

[213] 
[[CJK統合漢字]]の適切な[[レンダリング]]には、
[[言語情報によるフォント選択]]、
[[言語情報によるグリフ選択]]が必要となります。

[214] 
[[言語情報]]等により次の各ケースに対応が必要です。

: [215] [[日本語]] :
[BOX[
[219] 
[[日本語言語タグ]] (他に該当しないもの) が指定された場合は、
[[日本語]]用の[[字形]]を使うべきです。

[220] 
[[アイヌ語言語タグ]] (他に該当しないもの) が指定された場合は、
[[日本語]]用の[[字形]]を使うべきです。

[EG[
[217] 例えば[[言語タグ]] [CODE[ja]] や [CODE[ain]] が指定されたら、
[[日本語]]字形となるべきです。
]EG]

]BOX]
: [216] [[台湾華語]] :
[BOX[
[221] 
[[中文言語タグ]]のうち[[台湾華語]]系のものが指定された場合は、
[[台湾華語]]用の[[字形]]を使うべきです。

[231] 
[[台湾原住民]]の[[言語]]が指定された場合は、
[[台湾華語]]用の[[字形]]を使うべきです。

[EG[
[218] 例えば[[言語タグ]] [CODE[zh-TW]] や [CODE[zh-Hant-TW]] が指定されたら、
[[台湾華語]]字形となるべきです。
]EG]

]BOX]
: [222] [[中華人民共和国]], [[シンガポール]], [[マレーシア]]の[[中文]] :
[BOX[
[223] 
[[中文言語タグ]]のうち[[中華人民共和国]], [[シンガポール]], [[マレーシア]]系のもの
(他に該当しないもの)
が指定された場合は、
[[中華人民共和国]]用の[[新字形]]を使うべきです。

[250] 
[[朝鮮語言語タグ]]のうち[[中華人民共和国]]や[[朝鮮民主主義人民共和国]]を表すものが指定された場合は、
[[中華人民共和国]]用の[[新字形]]を使うべきです。


[232] 
[[中華人民共和国]]統治地域の少数民族の[[言語]]が指定された場合は、
[[中華人民共和国]]用の[[新字形]]を使うべきです。


[EG[
[224] 例えば[[言語タグ]] [CODE[zh-CN]] や [CODE[zh-Hans]] が指定されたら、
[[簡体字]]となるべきです。
]EG]

]BOX]
: [225] [[中華人民共和国香港特別行政区]]の[[中文]] :
[BOX[
[226] 
[[中文言語タグ]]のうち[[中華人民共和国香港特別行政区]]系のものが指定された場合は、
[[中華人民共和国香港特別行政区]]用の[[繁体字]]を使うべきです。

[227] 
利用できる[[フォント]]がない場合は、
[[台湾華語]]の場合に[[フォールバック]]するべきです。

[233] 
[[英語]]のうち[[中華人民共和国香港特別行政区]]系のものが指定された場合も、
これに準じるべきです。

]BOX]
: [228] [[中華人民共和国澳門特別行政区]]の[[中文]] :
[BOX[
[229] 
[[中文言語タグ]]のうち[[中華人民共和国澳門特別行政区]]系のものが指定された場合は、
[[中華人民共和国澳門特別行政区]]用の[[繁体字]]を使うべきです。

[230] 
利用できる[[フォント]]がない場合は、
[[中華人民共和国香港特別行政区]]の場合に[[フォールバック]]するべきです。

[234] 
[[ポルトガル語]]のうち[[中華人民共和国澳門特別行政区]]系のものが指定された場合も、
これに準じるべきです。

]BOX]
: [235] [[日本語]]の[[旧字体]] :
[BOX[

[236] [[日本語言語タグ]]のうち[[旧字体]]表記を意味するもの、
近代を意味するものが指定された場合は、
[[旧字体]]を使うべきです。

[249] [[アイヌ語言語タグ]]のうち[[旧字体]]表記を意味するもの、
近代を意味するものが指定された場合は、
[[旧字体]]を使うべきです。

[245] [[朝鮮語言語タグ]]のうち近代を意味するものが指定された場合は、
[[旧字体]]を使うべきです。

[237] 利用できる[[フォント]]がない場合は、
[[傳承字形]]に[[フォールバック]]するべきです。

[244] それもない場合は、
[[日本語]] (の[[新字体]]) の場合に[[フォールバック]]するべきです。

]BOX]
: [238] [[中文]]の[[傳承字形]] :
[BOX[

[239] [[中文言語タグ]]のうち[[傳承字形]]表記や[[康熙字典体]]表記を意味するものが指定された場合は、
[[傳承字形]]を使うべきです。

[240] 利用できる[[フォント]]がない場合は、
[[台湾華語]], 
[[中華人民共和国香港特別行政区]]の[[中文]], 
[[中華人民共和国澳門特別行政区]]の[[中文]]の場合のいずれかに[[フォールバック]]するべきです。

]BOX]
: [241] [[朝鮮語]] :
[BOX[

[242] [[朝鮮語言語タグ]]
(他に該当しないもの)
が指定された場合は、
[[大韓民国]]の[[漢字]]の[[字形]]を使うべきです。

[243] 利用できる[[フォント]]がない場合は、
[[中文]]の[[傳承字形]], 
[[日本語]]の[[旧字体]]の場合のいずれかに[[フォールバック]]するべきです。

]BOX]
: [246] [[越南語]] :
[BOX[

[247] [[越南語言語タグ]]が指定された場合は、
[[越南]]の[[漢字]]の[[字形]]を使うべきです。

[248] 利用できる[[フォント]]がない場合は、
[[中文]]の[[傳承字形]], 
[[日本語]]の[[旧字体]],
[[朝鮮語]]の場合のいずれかに[[フォールバック]]するべきです。


]BOX]


[4] [[中華フォント問題]]

** OpenType フォントによる実装

[276] [CODE[cmap]] の [[UVS]] 用機能を使って [[IVS]] や
[[CJK互換漢字SVS]]の[[グリフ]]を指定する必要があります。
[SEE[ [CODE[cmap]], [[IVS]] ]]

[277] [[国]]と[[言語]]による[[字形]]の違いは [CODE[GSUB]] の [CODE[locl]]
[[機能]]で適切な[[グリフ]]を指定する必要があります。
[SEE[ [CODE[GSUB]], [CODE[locl]] ]]

[288] 
[[日本語]]用フォントでは [CODE[GSUB]] の [CODE[jp78]] 等の[[機能]]で適切な[[グリフ]]を指定できます。
これを使う場合は [[AJ1]] によるべきです。
なお、その場合 [[UVS]] との相互作用に留意が必要です。
[SEE[ [CODE[jp78]] ]]

[289] 
[[中文]]用フォントでは [CODE[GSUB]] の [CODE[trad]] と [CODE[simp]] で適切な[[グリフ]]を指定できます。
ただ明確な仕様がないため利用には注意が必要です。

[278] 
[[Vietnamese alternate reading mark]] は[[漢字]]と[[結合文字]]の組み合わせで記述されるため、
[CODE[GSUB]] で適切な[[グリフ]]を指定する必要があります。
[CODE[ccmp]] が適切でしょう。
[SEE[ [CODE[GSUB]], [[Vietnamese alternate reading mark]] ]]

[279] 
[[濁点]]付き[[漢字]]は[[漢字]]と[[結合文字]]の組み合わせで記述されるため、
[CODE[GSUB]] で適切な[[グリフ]]を指定する必要があります。
[CODE[ccmp]] が適切でしょう。
[SEE[ [CODE[GSUB]], [[濁点と半濁点の文字]] ]]

[285] 
その他の[[合字]]を [CODE[GSUB]] で[[グリフ]]を指定することも考えられます:
>>284

[280] 
[[くずし字]]や[[手書き]]系の[[フォント]]では、
[CODE[GSUB]] で[[合字]]化したり、 [CODE[GPOS]] で[[字間]]を調整したりする必要がありそうです。

* 出典

[30] 
[[U-Source Ideographs]],
[[UK-Source Ideographs]],
[[SAT外字]],
[[文字情報基盤]]

** 出典の変更

[121] 
[[UCS符号位置]]とその出典の関係や、
出典の字形は、頻繁に変更されています。
[SEE[ [[出典G]], [[出典J]], [[出典T]], [[出典V]] ]]


** 水平拡張

[81] [CITE[IRGN2275PnP10.pdf]], [TIME[2017-11-01T02:16:09.000Z]], [TIME[2023-07-13T06:31:41.006Z]] <https://appsrv.cse.cuhk.edu.hk/~irg/irg/irg49/IRGN2275PnP10.pdf#page=7>

[79] 関連:
[[出典V]],
[[MJ]],
[[Pan-CJK]],
[[文字情報基盤]]

[80] [CITE[IRG N1964 (Continued National Standards Development & Horizontal Extensions) for IRG41 - 13192-irgn1964.pdf]], [TIME[2013-10-28T19:30:03.000Z]], [TIME[2023-07-13T06:29:59.034Z]] <https://www.unicode.org/L2/L2013/13192-irgn1964.pdf>

* 漢字統合

[319] 
[CITE[JTC1/SC2/WG2/IRG N253 1995.9.5]], [TIME[2025-06-16T10:55:23.000Z]], [TIME[1997-01-05T22:09:38.734Z]] <https://web.archive.org/web/19970105220817/http://stonehand.com/unicode/faq/cjk/annex/annex.html>


** UCV / NUCV

[62] [CITE[IRG Working Document Series]], [TIME[2022-11-09T03:47:00.000Z]] <https://appsrv.cse.cuhk.edu.hk/~irg/irgwds.html>

[77] [CITE@en[GitHub - kawabata/iwds: IRG Working Document Standards]], [TIME[2023-06-24T02:09:45.000Z]] <https://github.com/kawabata/iwds>

[78] [CITE@en[GitHub - yi-bai/iwds: IRG Working Document Standards]], [TIME[2023-06-24T02:09:56.000Z]] <https://github.com/yi-bai/iwds>

[201] [CITE[IWDS (New)]], [TIME[2025-03-25T09:24:48.000Z]] <https://hc.jsecs.org/irg/iwds/ucv.php>


[76] 関連: [[CHISE]],
[[IVS]]

** 統合分離

[203] [CITE[IRGN2338Disunify7Ideographs.pdf]], [TIME[2018-10-09T12:47:56.000Z]], [TIME[2023-12-07T07:46:05.082Z]] <https://appsrv.cse.cuhk.edu.hk/~irg/irg/irg51/IRGN2338Disunify7Ideographs.pdf>

[204] [CITE[IRGN2329MiscEditorialReport.pdf]], [TIME[2018-10-25T08:58:05.000Z]], [TIME[2023-12-07T08:07:33.584Z]] <https://appsrv.cse.cuhk.edu.hk/~irg/irg/irg51/IRGN2329MiscEditorialReport.pdf>

[48] [CITE[Universal Multiple-Octet Coded Character Set - IRGN2517DisunifiedIRGcharacters.pdf]], [TIME[2022-03-16T07:43:32.000Z]], [TIME[2022-11-09T03:01:00.224Z]] <https://appsrv.cse.cuhk.edu.hk/~irg/irg/irg58/IRGN2517DisunifiedIRGcharacters.pdf>

[275] 
[CITE@ja[Universal Multiple-Octet Coded Character Set - n2710-Disunified.pdf]], [TIME[2024-10-12T13:07:44.000Z]], [TIME[2024-11-05T02:51:58.683Z]] <https://www.unicode.org/irg/docs/n2710-Disunified.pdf>

[FIG(data)[ [186] [[文字関係]]

:key: [DFN[[CODE[iso10646:annexp:withoutposition]]]]
:desc:
[[ISO/IEC 10646]] Annex P で
specific position of a full ideograph
を表す
[[CJK統合漢字]]とされる[[符号位置]]から、
same structure without a preferred positional preference
の
[[CJK統合漢字]]の[[符号位置]]へ。

]FIG]


* 合字

[282] 
[[Unicode]] の現行機能の組み合わせにより、または新機能の追加により、
既存の[[CJK統合漢字]]を組み合わせて1文字を表す方式を、
特定の文字に対して利用するべきという提案があります。
そうした提案を前提に単独文字の追加提案が取り下げられた事例もあります。


[283] 
今のところ [[Unicode]] の仕様として明確に承認され文書化されたものではないようで
(その見通しも特になさそうで)、[[相互運用性]]には問題があります。

[284] 
その一方で、単独文字としての追加の見込みが今後もないとすると、
これ以外の方法 (例えば画像の貼り込み) よりはまだいくらかマシな、
「やむなく使えないこともない」手法として活用できるという考え方もあるでしょう。


[286] 
[CITE[Source Han]] が一部の [[IDS]] を単独の文字として表示させていたことがありました。
[SEE[ [[IDS]] ]]

;; [287] このような使い方は [[IDS]] の仕様上一応認められてはいるのですが、
漢字の構造の記述のために便利に使われている現状があるので、
1文字としてレンダリングするとかえって混乱のもとであり、
避けるべきでしょう。



[82] [CITE[03670 | ⿱蟲鳥 | WS2021v5.0]], [TIME[2023-07-13T07:42:58.000Z]] <https://hc.jsecs.org/irg/ws2021/app/?id=03670>

[43] 
>>82 誤字だからフォントの合字にするべき派 vs 誤字だとしても実用されたから符号化するべき派

[83] [CITE@zh-CN[CJK ligature: This is a project for handling the CJK ligature.]], [TIME[2023-07-13T07:43:25.000Z]] <https://gitee.com/eisoch/cjkliga>

[40] >>83 は >>82 を実装したデモ。
[CODE[ccmp]]
で
U+87F2 U+200D U+9CE5
を、
[CODE[liga]]
で
U+87F2 U+9CE5
を合字グリフにしています。


[84] [CITE[23073-irgn2581-fdbk.pdf]], [TIME[2023-03-23T16:06:03.000Z]], [TIME[2023-07-13T07:46:42.127Z]] <https://www.unicode.org/L2/L2023/23073-irgn2581-fdbk.pdf>

[85] 
>>84
合字記述用の新しい[[Unicode文字]]を追加するべきとの提案。
>>82 の例の他に、
⿰阿迎、
⿰哈雜、
⿰鴉尼
などを[[CJK統合漢字]]でなくこの新手法で記述するべきと主張している。

[86] [CITE[UTC-03224 | WS2021v5.0]], [TIME[2023-11-03T05:44:31.000Z]] <https://hc.jsecs.org/irg/ws2021/app/index.php?find=UTC-03224>

[87] >>86 
⿱敕令
も合字で表すべきで提案を取り下げると。

[182] [CITE[UK-20508 | WS2021v5.0]], [TIME[2023-11-03T05:46:07.000Z]] <https://hc.jsecs.org/irg/ws2021/app/index.php?find=UK-20508>

[187] >>182
⿱即哩
も合字で表すべきだとして提案を取り下げ。


[37] [CITE@en[BabelStone Fonts : BabelStone Han Ligatures]], [TIME[2023-11-03T05:34:03.000Z]] <https://www.babelstone.co.uk/Fonts/BSH_ZWJ.html>

[38] [CITE[BabelStone Han]] は 
[CODE(charname)@en[ZWJ]] 入、
[CODE[liga]] で4組実装しています。
[SRC[>>37]]
(>>82 >>86 >>182 と「二合」)
[TIME[2023-11-03T05:34:29.300Z]]

[39] [CODE[GSUB]] の仕様上、同じ[[グリフ]]を共有する他の[[Unicode符号位置]]でも有効なので、
合計7通りの表現ができます。

-U+2F06 U+200D U+5408
-U+4E8C U+200D U+5408 
-U+5373 U+200D U+54E9 
-U+6555 U+200D U+F9A8 
-U+6555 U+200D U+4EE4 
-U+87F2 U+200D U+2FC3 
-U+87F2 U+200D U+9CE5 

[317] 
この方法は[[横書き]]では表示できるのに[[縦書き]]では表示できないことがあるという致命的な欠陥があります。
この問題が解決しない限りは実用化は無理でしょう。
[TIME[2025-03-08T07:52:52.000Z]]
[SEE[ [[ZWJ]] ]]



[197] [CITE[Microsoft Word - IRGN2622IRG61MiscEditorialReport - 23249-irgn2622-irg61-ed-rept.pdf]], [TIME[2023-10-19T15:47:27.000Z]], [TIME[2023-11-10T11:43:19.740Z]] <https://www.unicode.org/L2/L2023/23249-irgn2622-irg61-ed-rept.pdf#page=3>


- [251] [CITE[00014 | ⿰⿳一巛⿸厂二少 | WS2021v6.0]], [TIME[2024-05-29T09:45:30.000Z]] <https://hc.jsecs.org/irg/ws2021/app/index.php?id=00014>
- [252] [CITE[00777 | ⿴□⿳一巛⿸厂六 | WS2021v6.0]], [TIME[2024-05-29T09:45:42.000Z]] <https://hc.jsecs.org/irg/ws2021/app/?id=00777>

[199] 関連: [[ZWJ]]

* 歴史

[260] [CITE@ja[n360-Resolutions.pdf]], [TIME[2024-07-21T17:19:59.000Z]], [TIME[2024-08-06T01:55:21.572Z]] <https://www.unicode.org/irg/docs/n360-Resolutions.pdf#page=2>

[261] >>260 [[Unicode Consortium]] (だけ)、 拡張Aの [[BMP]] への追加に反対していた

[262] 
[[1990年代]]の[[Unicode Consortium]] はほんとクソだなあ


[FIG(quote)[
[FIGCAPTION[
[1] [CITE[コンピューターで全漢字使用可に 6万字コード化 | [[NHKニュース]]]]
([[日本放送協会]]著, [TIME[2017-12-24 19:27:13 +09:00]])
<https://www3.nhk.or.jp/news/html/20171224/k10011270111000.html?utm_int=all_side_ranking-access_004>
]FIGCAPTION]

> 日本語の漢字は、戸籍などに使われているものも含めると6万字あるのに対し、コンピューターは、実は1万字しか扱うことができません。これに対し、このほど15年越しの作業の末、6万字すべてが統一の規格にまとめられて、コンピューターがすべての漢字を扱えるようになり、ビッグデータの活用をはじめさまざまな効果が期待されています。

]FIG]





[5] [CITE[NS39012siba]], [TIME[2021-01-09T06:13:03.000Z]], [TIME[2000-09-03T22:05:47.352Z]] <http://web.archive.org/web/20000903220115/http://www.itscj.ipsj.or.jp/jp/ns39012.html>

[6] [TIME[2020-02-28T17:39:56.000Z]], [TIME[2021-01-11T03:48:26.090Z]] <https://standards.iso.org/iso-iec/10646/ed-6/en/CJKSrc.txt>

[7] [CITE@ja[情報学広場:情報処理学会電子図書館]], [[<情報処理学会>]], [TIME[2022-07-11T06:45:31.000Z]] <https://ipsj.ixsq.nii.ac.jp/ej/?action=pages_view_main&active_action=repository_view_main_item_detail&item_id=62547&item_no=1&page_id=13&block_id=8>




[9] [CITE@ja[[[漢字]]の国際提案の歴史を図にしてみた - 帰ってきた💫Unicode刑事〔デカ〕リターンズ]], [TIME[2022-09-30T01:28:34.000Z]] <https://moji-memo.hatenablog.jp/entry/20130808/1375949975>

[31] [[IICore]]


[44] [CITE@en[GitHub - Kushim-Jiang/Zhuanlan-Zhihu: 知乎专栏内容存档。]], [TIME[2022-11-07T14:27:01.000Z]] <https://github.com/Kushim-Jiang/Zhuanlan-Zhihu>

[47] [CITE@en[Possible unification · Issue #28 · eisoch/irg · GitHub]], [TIME[2022-11-07T14:42:24.000Z]] <https://github.com/eisoch/irg/issues/28>

- [66] [CITE[The Unicode Standard, Version 15.0 - U20000.pdf]], [TIME[2022-09-09T19:17:30.000Z]], [TIME[2022-11-11T03:15:22.346Z]] <http://www.unicode.org/charts/PDF/U20000.pdf>

[97] [CITE@ja[漢字の国際提案の歴史を図にしてみた - 帰ってきた💫Unicode刑事〔デカ〕リターンズ]], [TIME[2023-09-17T07:42:54.000Z]] <https://moji-memo.hatenablog.jp/entry/20130808/1375949975>



[205] 
[CITE@ja[Activity Report from TCA - IRGN2597_TCA_ActivityReport.pdf]], [TIME[2023-03-17T11:23:28.000Z]], [TIME[2024-03-07T07:17:54.462Z]] <https://appsrv.cse.cuhk.edu.hk/~irg/irg/irg60/IRGN2597_TCA_ActivityReport.pdf#page=1>

[206] 
>>205 なぜか[[台湾]]の人名漢字追加提案だけエビデンスがないとしつこく拒絶される(他の国は通っているのに)と激おこ案件


[207] 
[CITE[03433 | 〾⿱蒜心 | WS2021v6.0]], [TIME[2024-03-11T07:46:48.000Z]] <https://hc.jsecs.org/irg/ws2021/app/index.php?id=03433>

[208] >>207 [[台湾]]が提出した代表字形が[[台湾]]の基準(どこにも明示されてない)に反していると主張する海外勢という地獄絵図。
[[台湾]]は人名用字なので原字形を替えるわけにはいかないといっている(つまり海外勢が主張する[[台湾]]基準の字形とやらは[[台湾]]には存在していない)。


[209] 
[[Unicode]] の規定上は、各国の例示字形がどうであれ結局統合基準の範囲内のものは[[統合]]されるのだから問題にならないはずなのに、
なぜ各国が自国の判断で決めている字形差に頑なに口出しするのかが謎だ。
どうしてもというなら[[U字形]]にすればいいのに。


[210] 
なんかどうしても[[中華人民共和国]]には甘くて[[中華民国]]には厳しく見えちゃうのよねえ。



[212] 
[CITE@ja[24125-cjk-abbrev-block.pdf]], [TIME[2024-04-24T14:59:58.000Z]], [TIME[2024-04-25T04:33:58.534Z]] <https://www.unicode.org/L2/L2024/24125-cjk-abbrev-block.pdf>


[253] 
[CITE@ja[Xユーザーの拾萬字鏡🐦さん: 「例のユニコードに申請された日本の略字、ネット記事になったので反応見てみたが否定意見を読むとゲバ文字を残したい左翼による劣った起案だとか、職の略字や曜日の曜の略字を入れたほうがマシ(実はすでにユニコードに入ってる)とかコメントされていてやはり漢字やユニコードに無知な人だらけだけだった」 / X]], [TIME[午前0:40 · 2024年6月6日][2024-06-05T15:40:05.000Z]], [TIME[2024-06-06T03:15:37.000Z]] <https://x.com/JUMANJIKYO/status/1798379273038057568>


[254] [CITE@ja[24135-response-to-l2-24-126.pdf]], [TIME[2024-06-03T17:38:09.000Z]], [TIME[2024-06-06T04:24:35.307Z]] <https://www.unicode.org/L2/L2024/24135-response-to-l2-24-126.pdf>


[255] 
>>254 善意の提案者が「これは左派プロパガンダ目的の提案ではない」と至極当然の釈明を迫られている。実に馬鹿馬鹿しい事態。




[256] [CITE@ja[Microsoft Word - IRGN2678WS2021ProposalToWG2.doc - n5257R-IRGN2678Proposal.pdf]], [TIME[2024-06-13T13:59:49.000Z]], [TIME[2024-06-19T04:05:18.799Z]] <https://www.unicode.org/wg2/docs/n5257R-IRGN2678Proposal.pdf>

[257] [CITE@ja[L2/24-165 (CJK & Unihan Working Group Recommendations for UTC #180 Meeting) - 24165-cjk-unihan-wg-utc180.pdf]], [TIME[2024-07-11T13:54:04.000Z]], [TIME[2024-07-12T06:29:37.273Z]] <https://www.unicode.org/L2/L2024/24165-cjk-unihan-wg-utc180.pdf#page=13>

- [258] [CITE@ja[CJK Unified Ideographs Extension J - n2707-ExtensionJ.pdf]], [TIME[2024-07-14T13:03:45.000Z]], [TIME[2024-07-22T02:19:30.470Z]] <https://www.unicode.org/irg/docs/n2707-ExtensionJ.pdf>
-- [259] [L[[I[Provisionally Accepted Repertoire (post Unicode 16.0)]]]]

[263] 
[CITE@ja[24201-script-hybrid-cjk-block.pdf]], [TIME[2024-08-06T20:19:21.000Z]], [TIME[2024-08-07T03:59:12.355Z]] <https://www.unicode.org/L2/L2024/24201-script-hybrid-cjk-block.pdf>


[264] [CITE@ja[IRG N2717: Proposal to accept script-hybrid Han ideographs in IRG working set submissions - n2717-HybridAbbreviations.pdf]], [TIME[2024-09-01T15:47:37.000Z]], [TIME[2024-09-03T01:49:57.069Z]] <https://www.unicode.org/irg/docs/n2717-HybridAbbreviations.pdf>

[266] [CITE@ja[n2741-IRGN2717-N2731-N2738-N2742Feedback.pdf]], [TIME[2024-10-16T03:02:05.000Z]], [TIME[2024-10-17T04:04:41.379Z]] <https://www.unicode.org/irg/docs/n2741-IRGN2717-N2731-N2738-N2742Feedback.pdf>

[268] [CITE@ja[n2742-IRGN2717-N2731-N2738Feedback.pdf]], [TIME[2024-10-14T17:31:53.000Z]], [TIME[2024-10-29T05:19:46.069Z]] <https://www.unicode.org/irg/docs/n2742-IRGN2717-N2731-N2738Feedback.pdf>

[269] [CITE@ja[n2744-IRGN2741Response.pdf]], [TIME[2024-10-19T19:12:28.000Z]], [TIME[2024-10-29T05:23:50.119Z]] <https://www.unicode.org/irg/docs/n2744-IRGN2741Response.pdf>

[274] 
[CITE@ja[L2/24-227 (CJK & Unihan Working Group Recommendations for UTC #181 Meeting) - 24227-cjk-unihan-wg-utc181.pdf]], [TIME[2024-10-28T15:30:18.000Z]], [TIME[2024-10-31T02:50:47.563Z]] <https://www.unicode.org/L2/L2024/24227-cjk-unihan-wg-utc181.pdf#page=25>




[267] 
[CITE[02305 | ⿹⺄⿻𠃊丄 | WS2021v7.0]], [TIME[2024-10-17T04:12:01.000Z]] <https://hc.jsecs.org/irg/ws2021/app/?id=02305>

[FIG(short list data)[ [[文字]]
:[F[文字]]:[CH[𣥬]]
:関連:[CH[𘜶]]
]FIG]
[FIG(short list data)[ [[文字]]
:[F[文字]]:[CH[𤔞]]
:関連:[CH[𗵐]]
]FIG]
[FIG(short list data)[ [[文字]]
:[F[文字]]:[CH[𧳤]]
:関連:[CH[𘏨]]
]FIG]
[FIG(short list data)[ [[文字]]
:[F[文字]]:[CH[𠐂]]
:関連:[CH[𘔭]]
]FIG]
[FIG(short list data)[ [[文字]]
:[F[文字]]:[CH[𰏃]]
]FIG]
[FIG(short list data)[ [[文字]]
:[F[文字]]:[CH[𬼁]]
:関連:[CH[ʒ]]
]FIG]
[FIG(short list data)[ [[文字]]
:[F[文字]]:[CH[𬼄]]
:関連:[CH[℥]]
]FIG]
[FIG(short list data)[ [[文字]]
:[F[文字]]:[CODE[:UTC-03225]]
:関連:[CH[℔]]
]FIG]
[FIG(short list data)[ [[文字]]
:[F[文字]]:[CODE[:UK-20572]]
]FIG]
[FIG(short list data)[ [[文字]]
:[F[文字]]:[CODE[:irg2021-2305]]
]FIG]





[318] 
[CITE@ja[n2637-HybridIdeographs.pdf]], [TIME[2024-07-17T15:23:34.000Z]], [TIME[2025-05-15T03:26:42.831Z]] <https://www.unicode.org/irg/docs/n2637-HybridIdeographs.pdf>


[270] [CITE[00002 | ? | WS2021v7.0]], [TIME[2024-10-29T05:41:46.000Z]] <https://hc.jsecs.org/irg/ws2021/app/?id=00002>

[271] [CITE@ja[n5166-SAT_buddhist_symbols_proposal.pdf]], [TIME[2021-09-25T10:45:53.000Z]], [TIME[2024-10-29T05:42:03.828Z]] <https://www.unicode.org/wg2/docs/n5166-SAT_buddhist_symbols_proposal.pdf>

[272] [CITE@ja[イン (仏字) - Wikipedia]], [TIME[2024-10-15T05:40:37.000Z]], [TIME[2024-10-29T05:42:11.045Z]] <https://ja.wikipedia.org/wiki/%E3%82%A4%E3%83%B3_(%E4%BB%8F%E5%AD%97)>

[290] 
[CITE@ja[ISO/IEC JTC 1/SC 2/WG 2 - 24266-abbrev-japanese-ideo-uax45.pdf]], [TIME[2024-11-12T17:32:59.000Z]], [TIME[2024-11-14T07:35:54.819Z]] <https://www.unicode.org/L2/L2024/24266-abbrev-japanese-ideo-uax45.pdf>

[291] 
[CITE@ja[n2738r-IRGN2731-N2742Feedback.pdf]], [TIME[2024-10-15T12:00:18.000Z]], [TIME[2024-11-18T04:27:40.500Z]] <https://www.unicode.org/irg/docs/n2738r-IRGN2731-N2742Feedback.pdf>

[293] 
[CITE@ja[n5289-ProposalToRemove2CharactersFromCJKExtensionJ.pdf]], [TIME[2024-11-23T03:54:06.000Z]], [TIME[2024-12-16T03:40:28.487Z]] <https://www.unicode.org/wg2/docs/n5289-ProposalToRemove2CharactersFromCJKExtensionJ.pdf>

[314] [CITE@ja[IRG N2789 (US/Unicode Urgently Needed Character Proposal for Two Ideographs; L2/25-058) - n2789-UNC-UTC.pdf]], [TIME[2025-02-28T14:51:54.000Z]], [TIME[2025-03-04T02:23:17.251Z]] <https://www.unicode.org/irg/docs/n2789-UNC-UTC.pdf>


[315] [CITE@ja[n2792-ScriptHybridPosition.pdf]], [TIME[2025-02-28T13:26:41.000Z]], [TIME[2025-03-04T02:48:08.915Z]] <https://www.unicode.org/irg/docs/n2792-ScriptHybridPosition.pdf>


-[316] [CITE@ja[n2793-ScriptHybridFeedback.pdf]], [TIME[2025-02-28T13:26:36.000Z]], [TIME[2025-03-04T02:54:40.475Z]] <https://www.unicode.org/irg/docs/n2793-ScriptHybridFeedback.pdf>
-[198] [CITE@ja[n2793r-ScriptHybridFeedback.pdf]], [TIME[2025-03-18T02:06:22.000Z]], [TIME[2025-03-21T03:42:10.170Z]] <https://www.unicode.org/irg/docs/n2793r-ScriptHybridFeedback.pdf>


[200] [CITE@ja[n2767-MiscEditorialReport.pdf]], [TIME[2025-03-21T04:44:36.000Z]], [TIME[2025-03-25T03:51:22.744Z]] <https://www.unicode.org/irg/docs/n2767-MiscEditorialReport.pdf#page=6>


[202] 
[CITE@zh-Hant-TW[CJK Components Review Tool - 中日韓部件校閱工具]], [[CMEX中文數位化技術推廣基金會]], [TIME[2025-03-28T03:30:07.000Z]] <https://comp.cmex.org.tw/>


[320] [CITE@ja[Xユーザーの白玉庵さん: 「敦煌漢文文献に人名としてたびたび「⿰歹勺」と釈される字が含まれるものがあるが、これはチベット文字を漢字化したものではないかという話がある(傅及斯2021)。 異国の文字の形を変形させて「漢字の郷に従わせる」例は、最近だとゲレインなんかが思い浮かぶ。 https://t.co/0NOgZNsJxc」 / X]], [TIME[午後1:14 · 2025年6月21日][2025-06-21T04:14:00.000Z]], [TIME[2025-06-21T14:46:20.000Z]] <https://x.com/Hakugyokuan/status/1936276388954399142>



[321] 
[CITE[Unified Ideograph Ordering]], [TIME[2025-06-30T04:32:43.000Z]], [TIME[1997-01-05T19:43:07.668Z]] <https://web.archive.org/web/19970105193429/http://stonehand.com:80/unicode/faq/cjk/ordering.html>

[322] 
[CITE[Han Unification]], [TIME[2025-06-30T04:40:05.000Z]], [TIME[1997-01-05T19:40:48.903Z]] <https://web.archive.org/web/19970105193416/http://stonehand.com/unicode/faq/cjk/unification.html>


-[323] [CITE@ja[n2866-ScriptHybridFeedback.pdf]], [TIME[2025-09-27T12:28:06.000Z]], [TIME[2025-09-29T03:44:08.839Z]] <https://www.unicode.org/irg/docs/n2866-ScriptHybridFeedback.pdf>
-- [326] 
[CITE@ja[n2866r-ScriptHybridFeedback.pdf]], [TIME[2025-09-29T12:05:37.000Z]], [TIME[2025-09-30T01:06:29.056Z]] <https://www.unicode.org/irg/docs/n2866r-ScriptHybridFeedback.pdf>
-- [332] 
[CITE@ja[n2866r2-ScriptHybridFeedback.pdf]], [TIME[2025-10-14T19:49:57.000Z]], [TIME[2025-10-22T03:19:47.062Z]] <https://www.unicode.org/irg/docs/n2866r2-ScriptHybridFeedback.pdf>
-- [325] [CITE@ja[n2867-MultiSyllabicCharacters.pdf]], [TIME[2025-09-27T12:28:06.000Z]], [TIME[2025-09-29T04:10:22.653Z]] <https://www.unicode.org/irg/docs/n2867-MultiSyllabicCharacters.pdf>
-- [331] [CITE@ja[n2867r-MultiSyllabicCharacters.pdf]], [TIME[2025-10-16T08:15:39.000Z]], [TIME[2025-10-22T03:19:17.935Z]] <https://www.unicode.org/irg/docs/n2867r-MultiSyllabicCharacters.pdf>


[324] 
>>323 [[GB 18030]] は追随しないぞ!って脅してきてるけどそれ脅しになってる?
10面事件と違って知らんがなwではない?

[327] [CITE@ja[n2885-IRGN2866RFeedback.pdf]], [TIME[2025-10-09T23:15:25.000Z]], [TIME[2025-10-10T05:15:52.580Z]] <https://www.unicode.org/irg/docs/n2885-IRGN2866RFeedback.pdf>


[328] [CITE@ja[n2885r-IRGN2866RFeedback.pdf]], [TIME[2025-10-11T00:21:58.000Z]], [TIME[2025-10-14T04:26:07.068Z]] <https://www.unicode.org/irg/docs/n2885r-IRGN2866RFeedback.pdf>

[329] [CITE@ja[n2893-CJKHybridCharacters.pdf]], [TIME[2025-10-15T04:46:56.000Z]], [TIME[2025-10-15T05:27:30.569Z]] <https://www.unicode.org/irg/docs/n2893-CJKHybridCharacters.pdf>

[330] [CITE@ja[IRG N2826: IRG Meeting #65 Recommendations and Action Items (WG 2 N5345 & SC 2 N5004) - n2826-Recommendations.pdf]], [TIME[2025-10-16T08:15:14.000Z]], [TIME[2025-10-17T03:08:22.982Z]] <https://www.unicode.org/irg/docs/n2826-Recommendations.pdf#page=7>

