key: iso10646:annexp:withoutposition
desc: ISO/IEC 10646 Annex P で specific position of a full ideograph を表す CJK統合漢字とされる符号位置から、 same structure without a preferred positional preference の CJK統合漢字の符号位置へ。

[335] IRG Disunified Ideographs, 2026-02-16T13:07:41.000Z, 2026-05-26T05:12:19.294Z https://www.unicode.org/irg/disunified.html

合字

[282] Unicode の現行機能の組み合わせにより、または新機能の追加により、既存のCJK統合漢字を組み合わせて1文字を表す方式を、特定の文字に対して利用するべきという提案があります。そうした提案を前提に単独文字の追加提案が取り下げられた事例もあります。

[283] 今のところ Unicode の仕様として明確に承認され文書化されたものではないようで (その見通しも特になさそうで)、相互運用性には問題があります。

[284] その一方で、単独文字としての追加の見込みが今後もないとすると、これ以外の方法 (例えば画像の貼り込み) よりはまだいくらかマシな、「やむなく使えないこともない」手法として活用できるという考え方もあるでしょう。

[286] Source Han が一部の IDS を単独の文字として表示させていたことがありました。 IDS

[287] このような使い方は IDS の仕様上一応認められてはいるのですが、漢字の構造の記述のために便利に使われている現状があるので、 1文字としてレンダリングするとかえって混乱のもとであり、避けるべきでしょう。

[82] 03670 | ⿱蟲鳥 | WS2021v5.0, 2023-07-13T07:42:58.000Z https://hc.jsecs.org/irg/ws2021/app/?id=03670

[43] >>82 誤字だからフォントの合字にするべき派 vs 誤字だとしても実用されたから符号化するべき派

[83] CJK ligature: This is a project for handling the CJK ligature., 2023-07-13T07:43:25.000Z https://gitee.com/eisoch/cjkliga

[40] >>83 は >>82 を実装したデモ。 ccmp で U+87F2 U+200D U+9CE5 を、 liga で U+87F2 U+9CE5 を合字グリフにしています。

[84] 23073-irgn2581-fdbk.pdf, 2023-03-23T16:06:03.000Z, 2023-07-13T07:46:42.127Z https://www.unicode.org/L2/L2023/23073-irgn2581-fdbk.pdf

[85] >>84 合字記述用の新しいUnicode文字を追加するべきとの提案。 >>82 の例の他に、 ⿰阿迎、 ⿰哈雜、 ⿰鴉尼などをCJK統合漢字でなくこの新手法で記述するべきと主張している。

[86] UTC-03224 | WS2021v5.0, 2023-11-03T05:44:31.000Z https://hc.jsecs.org/irg/ws2021/app/index.php?find=UTC-03224

[87] >>86 ⿱敕令も合字で表すべきで提案を取り下げると。

[182] UK-20508 | WS2021v5.0, 2023-11-03T05:46:07.000Z https://hc.jsecs.org/irg/ws2021/app/index.php?find=UK-20508

[187] >>182 ⿱即哩も合字で表すべきだとして提案を取り下げ。

[37] BabelStone Fonts : BabelStone Han Ligatures, 2023-11-03T05:34:03.000Z https://www.babelstone.co.uk/Fonts/BSH_ZWJ.html

[38] BabelStone Han は ZWJ 入、 liga で4組実装しています。 >>37 (>>82 >>86 >>182 と「二合」) 2023-11-03T05:34:29.300Z

[39] GSUB の仕様上、同じグリフを共有する他のUnicode符号位置でも有効なので、合計7通りの表現ができます。

U+2F06 U+200D U+5408
U+4E8C U+200D U+5408
U+5373 U+200D U+54E9
U+6555 U+200D U+F9A8
U+6555 U+200D U+4EE4
U+87F2 U+200D U+2FC3
U+87F2 U+200D U+9CE5

[317] この方法は横書きでは表示できるのに縦書きでは表示できないことがあるという致命的な欠陥があります。この問題が解決しない限りは実用化は無理でしょう。 2025-03-08T07:52:52.000Z ZWJ

[197] Microsoft Word - IRGN2622IRG61MiscEditorialReport - 23249-irgn2622-irg61-ed-rept.pdf, 2023-10-19T15:47:27.000Z, 2023-11-10T11:43:19.740Z https://www.unicode.org/L2/L2023/23249-irgn2622-irg61-ed-rept.pdf#page=3

[199] 関連: ZWJ

歴史

[260] n360-Resolutions.pdf, 2024-07-21T17:19:59.000Z, 2024-08-06T01:55:21.572Z https://www.unicode.org/irg/docs/n360-Resolutions.pdf#page=2

[261] >>260 Unicode Consortium (だけ)、拡張Aの BMP への追加に反対していた

[262] 1990年代のUnicode Consortium はほんとクソだなあ

[1] コンピューターで全漢字使用可に 6万字コード化 | NHKニュース (日本放送協会著, 2017-12-24 19:27:13 +09:00) https://www3.nhk.or.jp/news/html/20171224/k10011270111000.html?utm_int=all_side_ranking-access_004

日本語の漢字は、戸籍などに使われているものも含めると6万字あるのに対し、コンピューターは、実は1万字しか扱うことができません。これに対し、このほど15年越しの作業の末、6万字すべてが統一の規格にまとめられて、コンピューターがすべての漢字を扱えるようになり、ビッグデータの活用をはじめさまざまな効果が期待されています。

[5] NS39012siba, 2021-01-09T06:13:03.000Z, 2000-09-03T22:05:47.352Z http://web.archive.org/web/20000903220115/http://www.itscj.ipsj.or.jp/jp/ns39012.html

[6] 2020-02-28T17:39:56.000Z, 2021-01-11T03:48:26.090Z https://standards.iso.org/iso-iec/10646/ed-6/en/CJKSrc.txt

[7] 情報学広場:情報処理学会電子図書館, <情報処理学会>, 2022-07-11T06:45:31.000Z https://ipsj.ixsq.nii.ac.jp/ej/?action=pages_view_main&active_action=repository_view_main_item_detail&item_id=62547&item_no=1&page_id=13&block_id=8

[9] 漢字の国際提案の歴史を図にしてみた - 帰ってきた💫Unicode刑事〔デカ〕リターンズ, 2022-09-30T01:28:34.000Z https://moji-memo.hatenablog.jp/entry/20130808/1375949975

[31] IICore

[44] GitHub - Kushim-Jiang/Zhuanlan-Zhihu: 知乎专栏内容存档。, 2022-11-07T14:27:01.000Z https://github.com/Kushim-Jiang/Zhuanlan-Zhihu

[47] Possible unification · Issue #28 · eisoch/irg · GitHub, 2022-11-07T14:42:24.000Z https://github.com/eisoch/irg/issues/28