key: iso10646:annexp:withoutposition
desc: ISO/IEC 10646 Annex P で specific position of a full ideograph を表す CJK統合漢字とされる符号位置から、 same structure without a preferred positional preference の CJK統合漢字の符号位置へ。

[335] IRG Disunified Ideographs, 2026-02-16T13:07:41.000Z, 2026-05-26T05:12:19.294Z https://www.unicode.org/irg/disunified.html

合字

[282] Unicode の現行機能の組み合わせにより、または新機能の追加により、既存のCJK統合漢字を組み合わせて1文字を表す方式を、特定の文字に対して利用するべきという提案があります。そうした提案を前提に単独文字の追加提案が取り下げられた事例もあります。

[283] 今のところ Unicode の仕様として明確に承認され文書化されたものではないようで (その見通しも特になさそうで)、相互運用性には問題があります。

[284] その一方で、単独文字としての追加の見込みが今後もないとすると、これ以外の方法 (例えば画像の貼り込み) よりはまだいくらかマシな、「やむなく使えないこともない」手法として活用できるという考え方もあるでしょう。

[286] Source Han が一部の IDS を単独の文字として表示させていたことがありました。 IDS

[287] このような使い方は IDS の仕様上一応認められてはいるのですが、漢字の構造の記述のために便利に使われている現状があるので、 1文字としてレンダリングするとかえって混乱のもとであり、避けるべきでしょう。

[82] 03670 | ⿱蟲鳥 | WS2021v5.0, 2023-07-13T07:42:58.000Z https://hc.jsecs.org/irg/ws2021/app/?id=03670

[43] >>82 誤字だからフォントの合字にするべき派 vs 誤字だとしても実用されたから符号化するべき派

[83] CJK ligature: This is a project for handling the CJK ligature., 2023-07-13T07:43:25.000Z https://gitee.com/eisoch/cjkliga

[40] >>83 は >>82 を実装したデモ。 ccmp で U+87F2 U+200D U+9CE5 を、 liga で U+87F2 U+9CE5 を合字グリフにしています。

[84] 23073-irgn2581-fdbk.pdf, 2023-03-23T16:06:03.000Z, 2023-07-13T07:46:42.127Z https://www.unicode.org/L2/L2023/23073-irgn2581-fdbk.pdf

[85] >>84 合字記述用の新しいUnicode文字を追加するべきとの提案。 >>82 の例の他に、 ⿰阿迎、 ⿰哈雜、 ⿰鴉尼などをCJK統合漢字でなくこの新手法で記述するべきと主張している。

[86] UTC-03224 | WS2021v5.0, 2023-11-03T05:44:31.000Z https://hc.jsecs.org/irg/ws2021/app/index.php?find=UTC-03224

[87] >>86 ⿱敕令も合字で表すべきで提案を取り下げると。

[182] UK-20508 | WS2021v5.0, 2023-11-03T05:46:07.000Z https://hc.jsecs.org/irg/ws2021/app/index.php?find=UK-20508

[187] >>182 ⿱即哩も合字で表すべきだとして提案を取り下げ。

[37] BabelStone Fonts : BabelStone Han Ligatures, 2023-11-03T05:34:03.000Z https://www.babelstone.co.uk/Fonts/BSH_ZWJ.html

[38] BabelStone Han は ZWJ 入、 liga で4組実装しています。 >>37 (>>82 >>86 >>182 と「二合」) 2023-11-03T05:34:29.300Z

[39] GSUB の仕様上、同じグリフを共有する他のUnicode符号位置でも有効なので、合計7通りの表現ができます。

U+2F06 U+200D U+5408
U+4E8C U+200D U+5408
U+5373 U+200D U+54E9
U+6555 U+200D U+F9A8
U+6555 U+200D U+4EE4
U+87F2 U+200D U+2FC3
U+87F2 U+200D U+9CE5

[317] この方法は横書きでは表示できるのに縦書きでは表示できないことがあるという致命的な欠陥があります。この問題が解決しない限りは実用化は無理でしょう。 2025-03-08T07:52:52.000Z ZWJ

[197] Microsoft Word - IRGN2622IRG61MiscEditorialReport - 23249-irgn2622-irg61-ed-rept.pdf, 2023-10-19T15:47:27.000Z, 2023-11-10T11:43:19.740Z https://www.unicode.org/L2/L2023/23249-irgn2622-irg61-ed-rept.pdf#page=3

[199] 関連: ZWJ

歴史

[260] n360-Resolutions.pdf, 2024-07-21T17:19:59.000Z, 2024-08-06T01:55:21.572Z https://www.unicode.org/irg/docs/n360-Resolutions.pdf#page=2

[261] >>260 Unicode Consortium (だけ)、拡張Aの BMP への追加に反対していた

[262] 1990年代のUnicode Consortium はほんとクソだなあ

[1] コンピューターで全漢字使用可に 6万字コード化 | NHKニュース (日本放送協会著, 2017-12-24 19:27:13 +09:00) https://www3.nhk.or.jp/news/html/20171224/k10011270111000.html?utm_int=all_side_ranking-access_004

日本語の漢字は、戸籍などに使われているものも含めると6万字あるのに対し、コンピューターは、実は1万字しか扱うことができません。これに対し、このほど15年越しの作業の末、6万字すべてが統一の規格にまとめられて、コンピューターがすべての漢字を扱えるようになり、ビッグデータの活用をはじめさまざまな効果が期待されています。

[5] NS39012siba, 2021-01-09T06:13:03.000Z, 2000-09-03T22:05:47.352Z http://web.archive.org/web/20000903220115/http://www.itscj.ipsj.or.jp/jp/ns39012.html

[6] 2020-02-28T17:39:56.000Z, 2021-01-11T03:48:26.090Z https://standards.iso.org/iso-iec/10646/ed-6/en/CJKSrc.txt

[7] 情報学広場:情報処理学会電子図書館, <情報処理学会>, 2022-07-11T06:45:31.000Z https://ipsj.ixsq.nii.ac.jp/ej/?action=pages_view_main&active_action=repository_view_main_item_detail&item_id=62547&item_no=1&page_id=13&block_id=8

[9] 漢字の国際提案の歴史を図にしてみた - 帰ってきた💫Unicode刑事〔デカ〕リターンズ, 2022-09-30T01:28:34.000Z https://moji-memo.hatenablog.jp/entry/20130808/1375949975

[31] IICore

[44] GitHub - Kushim-Jiang/Zhuanlan-Zhihu: 知乎专栏内容存档。, 2022-11-07T14:27:01.000Z https://github.com/Kushim-Jiang/Zhuanlan-Zhihu

[47] Possible unification · Issue #28 · eisoch/irg · GitHub, 2022-11-07T14:42:24.000Z https://github.com/eisoch/irg/issues/28

[66] The Unicode Standard, Version 15.0 - U20000.pdf, 2022-09-09T19:17:30.000Z, 2022-11-11T03:15:22.346Z http://www.unicode.org/charts/PDF/U20000.pdf

[97] 漢字の国際提案の歴史を図にしてみた - 帰ってきた💫Unicode刑事〔デカ〕リターンズ, 2023-09-17T07:42:54.000Z https://moji-memo.hatenablog.jp/entry/20130808/1375949975

[205] Activity Report from TCA - IRGN2597_TCA_ActivityReport.pdf, 2023-03-17T11:23:28.000Z, 2024-03-07T07:17:54.462Z https://appsrv.cse.cuhk.edu.hk/~irg/irg/irg60/IRGN2597_TCA_ActivityReport.pdf#page=1

[206] >>205 なぜか台湾の人名漢字追加提案だけエビデンスがないとしつこく拒絶される(他の国は通っているのに)と激おこ案件

[207] 03433 | 〾⿱蒜心 | WS2021v6.0, 2024-03-11T07:46:48.000Z https://hc.jsecs.org/irg/ws2021/app/index.php?id=03433

[208] >>207 台湾が提出した代表字形が台湾の基準(どこにも明示されてない)に反していると主張する海外勢という地獄絵図。台湾は人名用字なので原字形を替えるわけにはいかないといっている(つまり海外勢が主張する台湾基準の字形とやらは台湾には存在していない)。

[209] Unicode の規定上は、各国の例示字形がどうであれ結局統合基準の範囲内のものは統合されるのだから問題にならないはずなのに、なぜ各国が自国の判断で決めている字形差に頑なに口出しするのかが謎だ。どうしてもというならU字形にすればいいのに。

[210] なんかどうしても中華人民共和国には甘くて中華民国には厳しく見えちゃうのよねえ。

[212] 24125-cjk-abbrev-block.pdf, 2024-04-24T14:59:58.000Z, 2024-04-25T04:33:58.534Z https://www.unicode.org/L2/L2024/24125-cjk-abbrev-block.pdf

[253] Xユーザーの拾萬字鏡🐦さん: 「例のユニコードに申請された日本の略字、ネット記事になったので反応見てみたが否定意見を読むとゲバ文字を残したい左翼による劣った起案だとか、職の略字や曜日の曜の略字を入れたほうがマシ(実はすでにユニコードに入ってる)とかコメントされていてやはり漢字やユニコードに無知な人だらけだけだった」 / X, 午前0:40 · 2024年6月6日, 2024-06-06T03:15:37.000Z https://x.com/JUMANJIKYO/status/1798379273038057568

[254] 24135-response-to-l2-24-126.pdf, 2024-06-03T17:38:09.000Z, 2024-06-06T04:24:35.307Z https://www.unicode.org/L2/L2024/24135-response-to-l2-24-126.pdf

[255] >>254 善意の提案者が「これは左派プロパガンダ目的の提案ではない」と至極当然の釈明を迫られている。実に馬鹿馬鹿しい事態。

[256] Microsoft Word - IRGN2678WS2021ProposalToWG2.doc - n5257R-IRGN2678Proposal.pdf, 2024-06-13T13:59:49.000Z, 2024-06-19T04:05:18.799Z https://www.unicode.org/wg2/docs/n5257R-IRGN2678Proposal.pdf

[257] L2/24-165 (CJK & Unihan Working Group Recommendations for UTC #180 Meeting) - 24165-cjk-unihan-wg-utc180.pdf, 2024-07-11T13:54:04.000Z, 2024-07-12T06:29:37.273Z https://www.unicode.org/L2/L2024/24165-cjk-unihan-wg-utc180.pdf#page=13

[258] CJK Unified Ideographs Extension J - n2707-ExtensionJ.pdf, 2024-07-14T13:03:45.000Z, 2024-07-22T02:19:30.470Z https://www.unicode.org/irg/docs/n2707-ExtensionJ.pdf
- [259] Provisionally Accepted Repertoire (post Unicode 16.0)

[263] 24201-script-hybrid-cjk-block.pdf, 2024-08-06T20:19:21.000Z, 2024-08-07T03:59:12.355Z https://www.unicode.org/L2/L2024/24201-script-hybrid-cjk-block.pdf

[264] IRG N2717: Proposal to accept script-hybrid Han ideographs in IRG working set submissions - n2717-HybridAbbreviations.pdf, 2024-09-01T15:47:37.000Z, 2024-09-03T01:49:57.069Z https://www.unicode.org/irg/docs/n2717-HybridAbbreviations.pdf

[266] n2741-IRGN2717-N2731-N2738-N2742Feedback.pdf, 2024-10-16T03:02:05.000Z, 2024-10-17T04:04:41.379Z https://www.unicode.org/irg/docs/n2741-IRGN2717-N2731-N2738-N2742Feedback.pdf

[268] n2742-IRGN2717-N2731-N2738Feedback.pdf, 2024-10-14T17:31:53.000Z, 2024-10-29T05:19:46.069Z https://www.unicode.org/irg/docs/n2742-IRGN2717-N2731-N2738Feedback.pdf

[269] n2744-IRGN2741Response.pdf, 2024-10-19T19:12:28.000Z, 2024-10-29T05:23:50.119Z https://www.unicode.org/irg/docs/n2744-IRGN2741Response.pdf

[274] L2/24-227 (CJK & Unihan Working Group Recommendations for UTC #181 Meeting) - 24227-cjk-unihan-wg-utc181.pdf, 2024-10-28T15:30:18.000Z, 2024-10-31T02:50:47.563Z https://www.unicode.org/L2/L2024/24227-cjk-unihan-wg-utc181.pdf#page=25

[267] 02305 | ⿹⺄⿻𠃊丄 | WS2021v7.0, 2024-10-17T04:12:01.000Z https://hc.jsecs.org/irg/ws2021/app/?id=02305

文字

文字: 𣥬
関連: 𘜶

文字

文字: 𤔞
関連: 𗵐

文字

文字: 𧳤
関連: 𘏨

文字

文字: 𠐂
関連: 𘔭

文字

文字: 𰏃

文字

文字: 𬼁
関連: ʒ

文字

文字: 𬼄
関連: ℥

文字

文字: :UTC-03225
関連: ℔

文字

文字: :UK-20572

文字

文字: :irg2021-2305

[318] n2637-HybridIdeographs.pdf, 2024-07-17T15:23:34.000Z, 2025-05-15T03:26:42.831Z https://www.unicode.org/irg/docs/n2637-HybridIdeographs.pdf

[270] 00002 | ? | WS2021v7.0, 2024-10-29T05:41:46.000Z https://hc.jsecs.org/irg/ws2021/app/?id=00002

[271] n5166-SAT_buddhist_symbols_proposal.pdf, 2021-09-25T10:45:53.000Z, 2024-10-29T05:42:03.828Z https://www.unicode.org/wg2/docs/n5166-SAT_buddhist_symbols_proposal.pdf

[272] イン (仏字) - Wikipedia, 2024-10-15T05:40:37.000Z, 2024-10-29T05:42:11.045Z https://ja.wikipedia.org/wiki/%E3%82%A4%E3%83%B3_(%E4%BB%8F%E5%AD%97)

[290] ISO/IEC JTC 1/SC 2/WG 2 - 24266-abbrev-japanese-ideo-uax45.pdf, 2024-11-12T17:32:59.000Z, 2024-11-14T07:35:54.819Z https://www.unicode.org/L2/L2024/24266-abbrev-japanese-ideo-uax45.pdf

[291] n2738r-IRGN2731-N2742Feedback.pdf, 2024-10-15T12:00:18.000Z, 2024-11-18T04:27:40.500Z https://www.unicode.org/irg/docs/n2738r-IRGN2731-N2742Feedback.pdf

[293] n5289-ProposalToRemove2CharactersFromCJKExtensionJ.pdf, 2024-11-23T03:54:06.000Z, 2024-12-16T03:40:28.487Z https://www.unicode.org/wg2/docs/n5289-ProposalToRemove2CharactersFromCJKExtensionJ.pdf

[314] IRG N2789 (US/Unicode Urgently Needed Character Proposal for Two Ideographs; L2/25-058) - n2789-UNC-UTC.pdf, 2025-02-28T14:51:54.000Z, 2025-03-04T02:23:17.251Z https://www.unicode.org/irg/docs/n2789-UNC-UTC.pdf

[315] n2792-ScriptHybridPosition.pdf, 2025-02-28T13:26:41.000Z, 2025-03-04T02:48:08.915Z https://www.unicode.org/irg/docs/n2792-ScriptHybridPosition.pdf

[200] n2767-MiscEditorialReport.pdf, 2025-03-21T04:44:36.000Z, 2025-03-25T03:51:22.744Z https://www.unicode.org/irg/docs/n2767-MiscEditorialReport.pdf#page=6

[202] CJK Components Review Tool - 中日韓部件校閱工具, CMEX中文數位化技術推廣基金會, 2025-03-28T03:30:07.000Z https://comp.cmex.org.tw/

[320] Xユーザーの白玉庵さん: 「敦煌漢文文献に人名としてたびたび「⿰歹勺」と釈される字が含まれるものがあるが、これはチベット文字を漢字化したものではないかという話がある(傅及斯2021)。異国の文字の形を変形させて「漢字の郷に従わせる」例は、最近だとゲレインなんかが思い浮かぶ。 https://t.co/0NOgZNsJxc」 / X, 午後1:14 · 2025年6月21日, 2025-06-21T14:46:20.000Z https://x.com/Hakugyokuan/status/1936276388954399142

[321] Unified Ideograph Ordering, 2025-06-30T04:32:43.000Z, 1997-01-05T19:43:07.668Z https://web.archive.org/web/19970105193429/http://stonehand.com:80/unicode/faq/cjk/ordering.html

[322] Han Unification, 2025-06-30T04:40:05.000Z, 1997-01-05T19:40:48.903Z https://web.archive.org/web/19970105193416/http://stonehand.com/unicode/faq/cjk/unification.html

[323] n2866-ScriptHybridFeedback.pdf, 2025-09-27T12:28:06.000Z, 2025-09-29T03:44:08.839Z https://www.unicode.org/irg/docs/n2866-ScriptHybridFeedback.pdf

[324] >>323 GB 18030 は追随しないぞ!って脅してきてるけどそれ脅しになってる? 10面事件と違って知らんがなwではない?

[327] n2885-IRGN2866RFeedback.pdf, 2025-10-09T23:15:25.000Z, 2025-10-10T05:15:52.580Z https://www.unicode.org/irg/docs/n2885-IRGN2866RFeedback.pdf

[328] n2885r-IRGN2866RFeedback.pdf, 2025-10-11T00:21:58.000Z, 2025-10-14T04:26:07.068Z https://www.unicode.org/irg/docs/n2885r-IRGN2866RFeedback.pdf

[329] n2893-CJKHybridCharacters.pdf, 2025-10-15T04:46:56.000Z, 2025-10-15T05:27:30.569Z https://www.unicode.org/irg/docs/n2893-CJKHybridCharacters.pdf

[330] IRG N2826: IRG Meeting #65 Recommendations and Action Items (WG 2 N5345 & SC 2 N5004) - n2826-Recommendations.pdf, 2025-10-16T08:15:14.000Z, 2025-10-17T03:08:22.982Z https://www.unicode.org/irg/docs/n2826-Recommendations.pdf#page=7

[336] もし漢字統合がなかったら (DIS 10646 的世界) というのは難しいが、一部の人がいうようなユートピアでも、一部の人が言うような地獄でもないだろう。現状でも簡体字と繁体字と新字体で符号位置が違う文字はあるが、必要に応じて変換されたり同一視されたりできているのだから、それが全漢字に拡大されても同じ事。今もCJK統合漢字とCJK互換漢字や部首の大規模な重複符号化はあって、多少の問題を引き起こしてはいるが、大混乱ほどではない。これが全漢字となっても被害規模はそう変わらないだろう。それらと引き換え中華フォント問題が解消されるなら、差し引きしてあまり悪くないところに着地しそう。

[337] むしろ問題となるのは、その世界での日本のやる気。ご承知の通り史実の日本政府は行政用漢字のうち最低限の部分だけ符号化して、あとは放置。学術や民間の漢字需要は無視、行政上必要な漢字も取りこぼしがある。それらは他国典拠や熱心な英国の研究者や日本人好事家から Unicode Consortium 経由の裏口的に符号化されたおかげで使えているのが実情。国ごとに分離されて国際規格化されている世界だと、自国領域は JIS などで史実よりもっと積極的に標準化作業がなされていると期待したいが、そこから漏れるとたぶん救済ルートがなく、日本語漢字列の中で少数だけ仕方なく臺灣漢字を使う、そこにも無ければ諦めるしかない、のような状況が多発することになっているだろう。

[338] >>337 たしかに漢字統合の必要性がIRGという枠組みを生んだことで各国が競争的に漢字を収集する機運が高まったので、それがない世界だと各国の一定の国内需要を満たしたところで積極的符号化は止まっていた可能性があるね。その場合でも各国行政システムの人名処理は問題になっているだろうから、各国それぞれの統合行政漢字集合が国際規格の枠組みの各国領域に組み込まれていた可能性はあるし、中華人民共和国あたりは国威をかけて学術漢字集合を作って組み込む可能性はあるけれども、規模も品質も史実とはかなり違ったものになっていそう。史実よりよいものになったか悪いものになったか、予想はとても難しい。

[339] ただし中国が巨大な学術漢字集合を作り、それを他国も借りる世界なら、史実とは別方向に「中国典拠への依存」が強まって、結局それが事実上の統合基盤になったかもしれません。

[340] 事実として最大の漢字用例を抱えるのは中国大陸であることに疑いないので、各国それぞれの常用漢字集合 + 中国大陸の学術漢字集合、という構成は案外悪くない結末かもしれませんね。

[341] >>336 の世界だと CJK互換漢字は生まれなかったろうから、 JIS X 0213 や CNS 11643 が割を食らうはめにもなっていないだろう。旧字体が文字化けする史実の惨状は起きない。

[342] しかしこの世界では VS が、少なくとも IVS が実用化される見込みが史実よりかなり低い。理論はつくられている可能性はあるけど、こんな面倒なものを実装しようという話にはなっていないだろうね。

[343] すると JIS X 0213:2004 を IVS で互換性を保ちながら実装するという意味不明な抜け道が使えない。しかし日本の国内情勢が史実と同じなら JIS 例示字体の改正は行われ、通産省から各メーカーにフォント改訂圧力はあるはず。どう対処するかは史実より揉めるはずだ。たぶん jp90 と jp04 は存在するから、 DTP ではそれを使うが、それ以外の一般用途では情報交換不能、ってことになるだろう。それが史実よりも混乱を招くかは微妙で、史実でも混乱はあった(今も後遺症はある)けど押し切れた、そこに IVS の有無はあんまり寄与していない。

[344] ただし >>343 が史実通りに動くかどうかは少し疑問もある。国語審議会の政策の駆動力は主に JIS X 0208 の例示字体、その背景には出版系の康煕字典体主義があるのは変わらないけど、 CJK統合漢字を背景にした言語危機が煽られた、その影響力をどう計算するかによるだろう。

[345] IVS 不存在のもう1つの影響は文字情報基盤。行政処理で必要だけどCJK統合漢字の基準では統合されるべき字形差を史実では IVS に落とし込むことで標準化している。 IVS がなく日本領域がある世界でも、日本領域には JIS X 0213 相当の漢字集合が入っていて、そこには JIS X 0213 の包摂規準が適用されていると推測するのが順当。ここにどう文字情報基盤を統合するか。 CJK互換漢字方式で日本領域の中に区分して配置されることになるのが、行政系システム事業者の技術力等々を勘案するとあり得そうか?