DTSCS

CNS 11643

[1] CNS 11643 は、 中華民国 (台湾) の符号化文字集合国家規格 (CNS) です。

目次

  1. 仕様書
  2. 呼称
  3. 文字集合
    1. 第1字面、第2字面
    2. 旧第14字面、第3字面、第4字面
    3. 第5字面から第7字面
    4. 第8字面から第11字面
    5. 第12字面、第13字面、新第14字面、第15字面、第16字面
    6. 第17字面から第80字面
    7. その他
    8. 例示字形
  4. 符号化表現
    1. 指示シーケンス
    2. 内部コード
  5. Unicode との関係
  6. データ
  7. フォント
  8. 歴史

仕様書#

[2] 最初の正式版は CNS 11643‐1986 (CNS C 5209‐1986) 通用漢字標準交換碼 (tōngyòng hànzì biāozhǔn jiāohuànmǎ) (Standard Interchange Code for Generally Used Chinese Characters) で、 民国75年8月4日 (に制定されました。

第2版は CNS 11643‐1992 (CNS X 5012‐1992) 中文標準交換碼 (zhōngwén biāozhǔn jiāohuànmǎ) (Chinese Standard Interchange Code) で、 1992年5月21日に制定されました。

第3版は 2004年中に制定予定です。

[53] 21世紀初頭から CNS 11643 の公式サイト >>10 で情報が公開されています。 いわゆる Living Standard モデルの先駆けのようなもので、 随時文字が追加され、その最新のフォントとデータが入手可能です。


[189] CNS 11643:2007 は 民国96年8月9日 () 制定です。

[190] https://www.cnsonline.com.tw/ で閲覧できます。 「11643」 で検索して表示される 中文標準交換碼(補充增修1) のうち、 44ページ目からがこの版です。

[187] 民国112年3月6日に確認されました。


[188] CNS 11643:2007/Amd.1:2023 中文標準交換碼(補充增修1) (Chinese standard interchange code (Amendment 1)) は 民国112年4月20日 () に制定されました。

[191] https://www.cnsonline.com.tw/ で閲覧できます。 「11643」 で検索して表示される 中文標準交換碼(補充增修1) のうち、 1ページ目から43ページ目までがこの版です。


[216] n2696-TCAActivityReport.pdf, , https://www.unicode.org/irg/docs/n2696-TCAActivityReport.pdf

2. CNS 11643 codebook revision has been revised to plane 7 and BSMI is scheduled to announce it by the second quarter of next year (2025).TCA will submit the altered glyphs to IRG and WG2.

[223] 字形新增異動公告 - 全字庫 CNS11643 (2024), CMEX中文數位化技術推廣基金會, https://www.cns11643.gov.tw/newsList.jsp?ID=1&ID2=239

[224] >>223 付で比較的大きな変更が行われました。 字形変更や Unicode 対応関係の変更・入れ替え、 重複符号位置の削除などが行われています。

呼称#

[36] 一般には、 國標碼, CNS, CNS コードなどと呼ばれています。

文字集合#

[48] 80個の942集合 (字面) で構成されます。それぞれを第1字面から第80字面と呼んでいます。

[78] 第12字面から第16字面まで私用でした。 >>77

[96] あと、新規の漢字の追加は国家機関各種の手続きを経て (規格の改訂を待たず) どんどん行われていくみたいです。追加が確定したら新字庫に登録されていくようで。 今のところ、追加順に字面の最後に足していっているようです。

[87] GlyphWiki:井戸端-保存2016年まで - GlyphWiki, https://glyphwiki.org/wiki/GlyphWiki:%e4%ba%95%e6%88%b8%e7%ab%af-%e4%bf%9d%e5%ad%982016%e5%b9%b4%e3%81%be%e3%81%a7#i0

第1字面、第2字面#

[47] 第1字面と第2字面は、 Big5 とほぼ共通していますが、微妙に違っています。

[73] DEC Hanyu は空き領域を UDC に使っていました。

[179] GB 13000.1-1993 (ISO/IEC 10646-1:1993 時代) の CJK統合漢字出典Tには第1字面に追加文字がありました。

[184] 2-44-65 は Unicode との関係がなんだかややこしいことになっています。 Unicode 5.2 とその前後の版で字形が違います。

[185] Microsoft Word - IRGN2586_21TglyphsUpdatedand4HorizontalExtension.docx - IRGN2586_21TglyphsUpdatedand4HorizontalExtension.pdf, , https://appsrv.cse.cuhk.edu.hk/~irg/irg/irg59/IRGN2586_21TglyphsUpdatedand4HorizontalExtension.pdf

[186] >>185 1面、2面の字形変更、2面、10面、11面の水平拡張

[192] 民国112年の規格改正(追補)で、1面への非漢字 (注音符号等) の追加、 1面と2面の漢字字形変更がありました。

[210] 最新消息 - 字形新增異動公告 - CNS11643 中文全字庫, CMEX中文數位化推廣基金會, https://www.cns11643.gov.tw/newsList.jsp?ID=1&ID2=229

[222] Activity Report from TCA - n2628-TCAActivityReport.pdf, , https://www.unicode.org/irg/docs/n2628-TCAActivityReport.pdf

旧第14字面、第3字面、第4字面#

[49] 第3字面は民国81年版規格で文字が新規追加されました。 旧第14字面の前半がそのまま正式な第3字面になりました。

[50] 第4字面は民国81年版規格で文字が新規追加されました。 その中には旧第14字面の後半の文字もすべて含まれますが、 位置は変化しています。


[64] 旧第14字面は元は外字領域で、政府機関用に漢字が定義されました。

[25] 通用漢字標準交換碼-使用者加字區交換碼, 行政院主計處電子處理資料中心編, 1988年6月公布。6148字。

[26] 使用者加字區交換碼(増編), 1989年6月公布。171字。

[27] 「金融加字字集」「DIGITAL Taiwan Supplemental Character Set (DTSCS)」「EDPC Recommended Character Set」などとも。

  • [28] 0x2121~0x6246 漢字 (第一部分) 6148 文字。後にそのまま CNS 11643-1992 の第三字面に。
    • [153] 1区1点から66区38点
  • [29] 0x6247~0x6435 漢字 (第二部分) 171 文字。後に CNS 11643-1992 の第四字面に全て収録される。
    • [154] 66区39点から68区17点
  • [30] 0x6436~ ISO/IEC 10646-1993 の出典 TE で「some additional character」が割り当てられた部分。

[41] CNS 11643 民国81(1992)年版 p.317 に第2部分171文字の旧第14字面から第4字面への対照表がある。

[56] 「CNS 11643-1986 第14字面」のような呼ばれ方をすることがあるが、 適切ではない。

[62] DECの文字コードの1つ DEC HanyuDTSCS (Digital Taiwan Supplemental Character Set) を実装しています。 >>61

[68] DTSCS に含まれていた EDPC Recommended Character Set は、 Part I の 6148 文字 (後に CNS 11643 第3字面) と Part II の171文字 (後に CNS 11643 第4字面) でした。 >>69, >>67

[71] DTSCS のうち EDPC 文字は1区から68区に合計6319文字割り当てられていました。 >>69, >>72 69区から94区は Reserved でした。 >>72

[80] EDPC Recommended Character Set は Electronic Data Processing Center of Executive Yuen によりに出版されました。 >>77 #page=18

[70] 厳密には DTSCS の一部が EDPC 集合です >>69 が、 EDPC 集合以外の DTSCS の領域は未割当のようです。 DEC Hanyu

[63] DTSCS は、 CNS 11643 第3字面の空き領域に漢字を2253文字追加したもの >>61 とする説もあります。

[81] computer vendors が第14面に EDPC Recommended Character Set を実装していたとされ >>77DEC 以外の実装もあったようです。

[88] UnihankCNS1986 では E (14) が旧第14字面を表しています。 UnihankCNS1992 では E がなくなり、 それに相当する部分は 34 になっています。 また現在の CJK統合漢字出典TTE は新第14字面に切り替わっています。

[156] 「some additional character」はそのまま TE から T3 に移動したようです (すべてかは不明)。

[150] East Asian Character Sets Overview: Chinese, , https://web.archive.org/web/20090106155444/http://www.massangeana.com/mas/charsets/cjk-c.htm

[151] >>150 90年代WindowsフォントTE漢字を実装していたとのこと。 (当時の日本語WindowsフォントJIS補助漢字を実装していたのと同じような位置付けかと。) ただし >>150 によると4197字で、旧第14字面とも第3字面とも字数が全然違う。

[138] 还在路上的CNS 11643(未竟) - 知乎, https://zhuanlan.zhihu.com/p/51302195

[152] 文字関係
key
cns11643:moved
desc
旧第14字面から第3字面への移動。

第5字面から第7字面#

[51] 民国81年版規格で文字が新規追加されました。

[180] Unicode 5.2 と Unicode 13.0 で U+21636 (T6-3E44) の字形が明確に違います。 U+2163C (T6-3E3F) も少し違います。

U+2163A (T6-3E40) は微妙に字形が違います。

おそらく他にも多数違っていそうです。

[183] U+253F0 T5-4770 が Unicode 5.2 と Unicode 13 の間に変わっています。 しかし CNS 11643 は楷書、明朝体ともに Unicode 5.2 字形です >>182

[197] U+20099 (T6-222F) が T字形と全字庫フォントでずいぶんと字形が違う...

[199] U+2F8A7 (T6-526C) も微妙に違う。

[200] U+2F8AC (T7-2D69) も違う。

[201] U+2F8AE (T7-227B)

[202] U+2F8B0 (T4-5B2C)

[203] U+2F8BC (T6-402B)

[206] U+20D51 (T5-3138) は Unicode の版によって字形が違い、 CNS 11643 もフォントによって字形が違います。 >>220

[221] L2/24-227 (CJK & Unihan Working Group Recommendations for UTC #181 Meeting) - 24227-cjk-unihan-wg-utc181.pdf, , https://www.unicode.org/L2/L2024/24227-cjk-unihan-wg-utc181.pdf#page=9

第8字面から第11字面#

[94] 第8字面、第9字面には ISO/IEC 10646 BMP非漢字が追加されました。

[95] 第8字面には [ U+0020, U+007E ] の ASCII文字も含まれています。 第1字面に元からあった方は全角文字扱いになっています。

[157] [ U+0000, U+001F ], [ U+007F, U+009F ] は CNS 11643 内にはありません。

[21] 11643-2004 で第8字面と第9字面に 10646 が入ったのですが、既に (Big5 同様の変換表で) 11643 に対応するものがない字のうち、 10646:2003 + α? 程度の時点での10646 0面にあるものを順番に詰めていってる模様です。 (つまり相互変換には対応表が必要で、 10646 の新規追加には対処不能。) 組合型ハングル、漢字、1面以降は入ってません。漢字はおそらく他の字面で CJK B まで全部詰め込まれている上にまだ 10646 にない (CJK C1 に入るかも?) ものが沢山。

[164] 割当当時の未割当符号点は除外されています。

[102] 第8字面には非漢字扱いの「々」や「〆」や部首が入っています。 (「〇」は非漢字扱いで第1字面)

[160] U+A4C6 が第9字面11区33点。 そこから一気に飛んで U+FB00 が第9字面11区34点。

[163] サロゲート, PUA は除外されています。 CJK互換漢字も第9字面にはなく、他の面と対応付けられたものもありますが、 どこにもないもの (完全な重複漢字) もあります。 U+FDD0 からの非文字も除外されています。

[161] U+FE00 VS1 が第9字面18区29点。 U+FEFF ZWNBSP が第9字面20区9点。 このように特殊な文字も入っています。

[166] U+E0100 からの IVSVS は入っていません。
[162] CNS 11643BOM が使えるという規定は・・・ないはず。

[158] U+FFFD が最後で、第9字面21区55点にあります。

[159] U+FFFE, U+FFFF はありません。 [165] 第9字面21区56点はなぜか U+C28C (ハングル音節) で、その後しばらく空き領域です。

[106] 第9字面の後半は独自の新規追加漢字。 第9字面84区53点以後、 PUP との対応付けがあります。


[58] 第10字面、第11字面には ISO/IEC 10646漢字が追加されました。

[103] 第11字面の後半は独自の新規追加漢字。

第12字面、第13字面、新第14字面、第15字面、第16字面#

[31] 第15字面は戸政系統用字6831文字とされています。

[90] 行政院主計處電子處理資料中心が戸籍より7169文字を 0x2121-0x6D39 に追加して暫定的に使用することとしました。 のことでした >>89

[91] 後に内部重複1組2文字、 CNS 11643-1992 との重複336文字が見つかり、削除されました。 (削除された符号位置は保留。)

[57] 「CNS 11643-1992 第15字面」のような呼ばれ方をすることがあるが、 適切ではない。

[92] 重複以外は CJK統合漢字の出典として採用されました。 後に CNS 11643 にそのまま正式に組み込まれました >>89

[105] 古い ICU は第15字面を 「1992 plane 9」と呼んでいたとされます。 >>104


[32] この他第14字面(新)、第16字面も戸政系統用字(整理中)とされていました。

[24] 第十二字面 電信局SOPS碼造字區 6673字 第十三字面 電信局SOPS碼造字區 (整理中)

SOPS とは Service Order Processing System の略のようです。

[33] 現在 CNS 11643 全字庫の検索頁に次のような注記がされています。

第12-14字面 為新・字 (即戸役政作業使用之12-14字面18,000個姓名用字), 目前僅供査詢, 不能下載使用。因内政部提供之24*24字形・中, 尚有許多重複及疑義字待確認, 因此擬予公告六個月, 若知道該字讀音, 請提供給我們。

[93] 後に CNS 11643 に正式に組み込まれました。

[117] 民国96年版規格の第12字面から新第14字面の符号表はスカスカです。 穴が開いているというよりも文字の方が少ないくらいです。 既存の外字から重複等を除いてそのまま標準化したためなのでしょう。

[178] >>176 >>177 TC, TD, TE のうち CJK統合漢字への提案取り下げリスト。

[181] ISO/IEC 10646-1:2000 から Unicode 5.2 までと DAM2:2023 とで U+9F99 TF-2159 の字形が変わっている...

[198] U+2F89B (TF-2F3E) の T字形と全字庫フォントの字形が違うなあ...

[204] U+2AAC9 (TD-5B55) の T字形は ⿰⿳日亠早彡 ですが、 Unicode 5.2 では ⿰彦彡 でした。 前後の版は ⿰⿳日亠早彡 です。 現在でもシステムにインストールされているフォントが ⿰彦彡 だったりします。

[205] U+2AD12 (TE-353F) も Unicode 5.2 字形と前後の版および CNS 11643 とに違いがあって、 システムにインストールされているフォントが Unicode 5.2 字形だったりします。 Unicode 5.2 字形は UCI-00938 ですが、 これを出典とする文字はありません。

[213] >>212 このような冊子があるようで、 IRG へのTCAからの提案に、 提案に関係する部分を撮影した画像データが入っています。

[215] >>214 このような冊子もあるようです。おそらく >>212 よりも新しいもので、 書名からすると実務ではこちらが使われているのでしょうか。 こちらも IRG への TCA からの提案に、 提案に関係する部分を撮影した画像データが入っています。


[118] 民国96年版規格は第16字面を専用字區 (PUA) としています p.498

[120] CNS 11643 公式サイトのファイルでは第16字面への標準の文字の割当は確認できません。

第17字面から第80字面#

[52] 民国96(西暦2004)年版規格で字面が新設されました。 将来の拡張のために保留とあります p.498

[119] CNS 11643 公式サイトのファイルによると、 第17字面、 第19字面、 第24字面に文字が割り当てられています。


[147] IRGN2577 Request to update glyph for U+31D5A - IRGN2577.pdf, , https://appsrv.cse.cuhk.edu.hk/~irg/irg/irg59/IRGN2577.pdf

[146] IRGN2577 Request to update glyph for U+31D5A - 23085-irgn2577-exth-t-glyph-change.pdf, , https://www.unicode.org/L2/L2023/23085-irgn2577-exth-t-glyph-change.pdf

[148] [󼱢] 13-396B - 字形資訊 - CNS11643 中文全字庫, CMEX中文數位化推廣基金會, https://www.cns11643.gov.tw/wordView.jsp?ID=866667

[149] そもそも CNS 11643Unicode で T13 が全然違うんだが...

[172] CNS 11643 の 13 というのは第13字面のことで、 Unicode の T13 は 0x13 = 第19字面のことらしい。

[173] この辺の面の漢字は CNS 11643 サイトおよび変換表およびフォントでは PUP に割り当てられている一方、 Unicode では新しく出来た第3面の領域に(比較的最近)割り当てられている。 今後 CNS 11643 がどうなるのかはわからない(ずっとそのままということもないと思うけど)。

[174] CJK統合漢字拡張Hは T12 (18面)、 T13 (19面) あたりの文字が多いですが、 CNS 11643 の公式サイトの検索や変換表やフォントに入っていない謎のものが多いみたいです。

[175] Unihan にあって CNS 11643 の変換表にない (面区点位置が他の Unicode符号位置に対応付けられてもいない) 面区点位置

[211] Universal Multiple-Octet Coded Character Set - n2685-T_2024_sub_1000.pdf, , https://www.unicode.org/irg/docs/n2685-T_2024_sub_1000.pdf#page=2

その他#

[66] CMEX から提供された表に基づく SolarisJavaEUC-TW の実装には、2178文字の追加がありました。 >>65 (どの字面のどの範囲か不明)


[108] CNS 11643 公式サイトの検索や配布ファイルでは、漢字が連続した領域中の欠落が多く存在しています。

[109] 欠落した符号を検索すると、他の符号と重複です (どれとかはわからない) と表示されたり、 他のこれこれの符号と重複ですと表示されたりします。

[110] 配布ファイル中の Unicode との対応表には含まれておらず、 画像フォントも抜けています。

[111] 重複符号一覧のようなファイルは配布されていないようです。

[112] 配布ファイル中の各システムとの対照表には欠落した符号も大量に混じっています。 それが指しているのがどんな文字なのか知る方法がないのは困ったものです。

[113] 驚くべきことに、 T3-652E のように第3字面 (旧第14字面) にすら穴が空いています。 T3-652E を検索すると 15-3B6A と重複と出てきます。

[114] 配布ファイルによると 15-3B6A は U+692C に対応しています。 ところが Unihan によると U+692CkIRG_TSource は T3-652E のまま変わっていません。この字の場合は旧第14字面時代から出典 T だったのですが。

[115] どうやらこの領域は >>30 の通り旧第14字面の中でも新しくて優先度が低いところらしいです。 民国96年版規格票の時点でこのエリアはスカスカです。

[116] 民国81年版規格で正式に存在していた文字から消えたものはなさげ?

[128] 中文編碼網頁 → 台灣 CNS11643(中文標準交換碼)漢字標準, , http://code.web.idv.hk/cns11643/cns11643.php

[129] >>128 出典Tと公式サイト配布ファイルで Unicode との対応が違うもの

[193] 重碼字形關閉清單_公告版1111103.xlsx - 重碼字形關閉清單_公告版1111103.pdf, , https://cns11643.gov.tw/files/files/%E9%87%8D%E7%A2%BC%E5%AD%97%E5%BD%A2%E9%97%9C%E9%96%89%E6%B8%85%E5%96%AE_%E5%85%AC%E5%91%8A%E7%89%881111103.pdf

[194] >>193 重複文字情報。


[167] U+2F81F の出典は TF-2337 >>168 なのに、 CNS 11643 公式サイトの検索だと CNS 11643 でも Unicode でも出てこないし、 配布フォントにも入っていないの、 どういうことなんでしょ...?

[169] U+2F807 = T6-2E61, U+2F906 もない...

[171] U+2F9BE, U+2F9CBCNS 11643 の変換表にないが、 フォントにはある。

[170] U+2F840, U+2F894, U+2F8CD, U+2F994, U+2F9D4CNS 11643 用互換漢字ブロックなのになぜ出典Hしかないの?

例示字形#

[127] 民国96年版規格 p.2 によると第1字面から第7字面は規格票の例示字形に規範性があります。 第8字面から第15字面は例示字形を標準としつつも、 利用機関で別途規定があればそれに従うこととされています。


[124] 民国96年版規格 p.501 に旧規格との例示字形の変更一覧があります。

[126] 第1字面から第7字面まで全体にわたっています。

[125] CNS 11643 はわりかし細かい違いを分離しているイメージですが、 それを踏まえると結構大胆に変更している文字もあるような。


[139] Possible unification · Issue #28 · eisoch/irg · GitHub, https://github.com/eisoch/irg/issues/28

改定による誤り

[140] 利用者-会話:daekyo - GlyphWiki, https://glyphwiki.org/wiki/User-talk:daekyo@23


[217] Unicode 2面の CJK互換漢字T字形と今の CNS 11643 公式フォントは字形が違うものが多いような気がします。 どこかのタイミングで字形が変更された(のが Unicode には反映されていない) のでしょうか。

[218] n2730-Disunify2.pdf, , https://www.unicode.org/irg/docs/n2730-Disunify2.pdf#page=2

[219] >>218 これは6面の文字の字形変更

符号化表現#

[54] CNS 11643ISO/IEC 2022 環境で利用できます。

[55] ISO/IEC 2022 ベースの具体的な符号化文字集合としては、 ISO-2022-CN, ISO-2022-CN-EXT, EUC-TW などがあります。

[60] DEC の独自の DEC HANYU があります。

指示シーケンス#

指示シーケンス

[4] ISO/IEC 2022 環境で使うには、「公式」には ISO-IR に登録する必要がありますが、 台湾の規格であるがために (政治的に) それが出来ませんでした。 そのため私用終端バイト Fp ∈ [ 3/0, 3/15 ] を使うことが当初から想定されており、 私用終端バイトの数が字面の数 16 になりました。

[7] 第一字面〜第七字面は、 ECMA (当時の ISO-IR 事務局) が sponsor になる形で ISO-IR に登録され、公式終端バイトを得ました。 類似事案は中華台北

[42] CNS 11643 版の 5.9 によれば、 第一字面から第十六字面は終端バイト [ 3/0, 3/15 ] でそれぞれ表されます。

[43] CNS 11643 中華民国96年版の 6. によれば、 「正式」な終端バイトと「專用」の終端バイトの2系統があります。

内部コード#

[23] 1986年版の付録で2バイト内部処理用コードが規定されています。

6.2 本交換碼若有需要時得依下列方式転換為内碼。

  • (1) 第一字面的内碼=標準交換碼+8080(十六進位)
  • (2) 第二字面的内碼=標準交換碼+8000(十六進位)

[82] DEC Hanyu はこれに着想を得て作られたとされています。

Unicode との関係#

[97] CNS 11643ISO/IEC 10646 の対応関係は公式な表が提供されています。 >>38

[98] Unicode にない文字は PUP に割り当てられています。

[99] U+F9hhh の一部に第1字面のラテン文字

[100] U+F6hhh, U+F8hhh の一部に第1字面の漢字構成要素。

[101] その他の領域に第3字面から第7字面、第9字面からの Unicode にない漢字

[130] CNS 11643 を出典に新たにCJK統合漢字に含まれた漢字は、まだ PUP のままになっています。 今後正規の符号点に切り替えられるのか、そのとき PUP 符号点はどうなるのか (フォントや変換表はどうなるのか) 要注目です。

[107] 中文編碼網頁 → CNS 11643 與 Unicode 對照表, , http://code.web.idv.hk/cns11643/csic2004.php

1-4244	F91D1	<SMALL LETTER M WITH CIRCUMFLEX, U+006D_U+0302 m̂>
1-4245	F91D2	<SMALL LETTER N WITH CIRCUMFLEX, U+006E_U+0302 n̂>
1-4246	F91D3	<SMALL LETTER M WITH CARON, U+006D_U+030C m̌>
1-4247	F91D4	<SMALL LETTER M WITH MACRON, U+006D_U+0304 m̄>
1-4248	F91D5	<SMALL LETTER N WITH MACRON, U+006E_U+0304 n̄>
1-4249	F91D6	<SMALL LETTER M WITH VERTICAL LINE ABOVE, U+006D_U+030D m̍>
1-424A	F91D7	<SMALL LETTER N WITH VERTICAL LINE ABOVE, U+006E_U+030D n̍>
1-424B	F91D8	<SMALL LETTER A WITH VERTICAL LINE ABOVE, U+0061_U+030D a̍>
1-424C	F91D9	<SMALL LETTER I WITH VERTICAL LINE ABOVE, U+0069_U+030D i̍>
1-424D	F91DA	<SMALL LETTER U WITH VERTICAL LINE ABOVE, U+0075_U+030D u̍>
1-424E	F91DB	<SMALL LETTER E WITH VERTICAL LINE ABOVE, U+0065_U+030D e̍>
1-424F	F91DC	<SMALL LETTER O WITH VERTICAL LINE ABOVE, U+006F_U+030D o̍>
1-4250	F91DD	<SMALL LETTER M WITH DOUBLE ACUTE ACCENT, U+006D_U+030B m̋>
1-4251	F91DE	<SMALL LETTER N WITH DOUBLE ACUTE ACCENT, U+006E_U+030B n̋>
1-4252	F91DF	<SMALL LETTER A WITH DOUBLE ACUTE ACCENT, U+0061_U+030B a̋>
1-4253	F91E0	<SMALL LETTER I WITH DOUBLE ACUTE ACCENT, U+0069_U+030B i̋>
1-4254	F91F7	<SMALL LETTER E WITH DOUBLE ACUTE ACCENT, U+0065_U+030B e̋>

データ#

[38] CNS11643中文標準交換碼全字庫(簡稱全字庫) | 政府資料開放平臺 () https://data.gov.tw/dataset/5961

[39] 写像その他各種データ & フォント

[40] 政府資料開放授權條款-第1版

[86] いつの間にか 「開源字型授權1.1版(OFL 1.1)」 との dual license になりました。


[142] 公式は最新版しかありませんが、過去に公式から取得した古い版のコピーがいくつか公開されています。

フォント#

[83] >>38 で公式フォントが配布されています。 文字追加があるたびに更新されています。

[84] 正楷體正宋體

[85] 香港人による自由香港楷書はこれの派生。

歴史#

[17] 1983(民国72)年10月に、通用漢字標準交換碼 試用版が行政院國家科學委員會, 教育部, 經濟部中央標準局, 行政院主計處電子處理資料中心合編として発行されました。 第1字面と第2字面に文字が定義され、漢字非漢字をあわせて 13053 文字含んでいました。 この版は Big5 の元になったとされています。

[18] 1986(民国75)年8月4日には正式な CNS 11643‐1986 通用漢字標準交換碼が行政院國家科學委員會, 教育部, 經濟部中央標準局, 行政院主計處電子處理資料中心合編で公布されました。 試用版に更に数百文字追加し、順序や重複の修正などを行って総計 13735 文字となっています。

[79] Bureau of National Standard は改定作業を開始しました。 >>77 #page=17

[19] 1992(民国81)年5月21日には CNS 11643‐1992 中文標準交換碼が經濟部中央標準局より修訂公布されました。 第14字面の全部や ISO/IEC 10646 原案の一部の文字集合を取り込むと共に、 戸籍用などの大量の漢字を追加しています。第1字面と第2字面は変更されていませんが、 更に第7字面まで割当てが増えています。

[20] 2003年には中文全字庫のサイト (>>10) で2004年に新版を予定していることが発表されています。 また、 Big5ISO/IEC 10646 との対応も明らかにされています。

[22] 中 Traditional Chinese — coq.no ( ( 版)) http://coq.no/character-tables/chinese-traditional/en

[34] 蘇州号碼 - Wikipedia () https://ja.wikipedia.org/wiki/%E8%98%87%E5%B7%9E%E5%8F%B7%E7%A2%BC

最初の版である CNS 11643-1986 では、10・20・30も収録されていたが、いずれものちに漢数字に統合された。蘇州号碼の10と30だった符号位置には現在は文字が割り当てられていない。蘇州号碼の20だった符号位置には、漢数字の20「卄」が割り当てられている。(Big5も版は未詳だが同様)

[35] CNS 11643-1, CNS 11643-2, CNS 11643-3 は第1字面、第2字面、... の意味で使われることもありますが、 実は別規格の名前です。 1 は廃止済みです。

[37] 最新消息 - 字形新增異動公告 - CNS11643 中文全字庫 (CMEX中文數位化推廣基金會, ) https://www.cns11643.gov.tw/newsList.jsp?ID=1

[59] CNS 11643 ‐ 通信用語の基礎知識, https://www.wdic.org/w/WDIC/CNS%2011643

[121] 中文資訊及資通術語標準網站, , https://web.archive.org/web/20100326160821/http://www.cnscode.org.tw/cnscode/index.jsp

[122] >>121 民国96年版規格から参照されている Big5, Unicode 変換表のあるサイト。残念ながら変換表は現存しない。 (現在の CNS 11643 公式サイトの配布ファイルの祖先か?)

[123] Big5-2003 と呼ばれる Big5 と同じものかな?

[141] Microsoft Word - IRGN2554R_TSourceEvidenceForPersonalName.docx - IRGN2554RTSourceEvidenceForPersonalName.pdf, , https://appsrv.cse.cuhk.edu.hk/~irg/irg/irg59/IRGN2554RTSourceEvidenceForPersonalName.pdf

[195] CNS11643中文標準交換碼全字庫(簡稱全字庫) | 政府資料開放平臺, https://data.gov.tw/dataset/5961

[196] >>195 データダウンロードページですが、公式サポートフォーラム化してます。