HB1

Big5

[1] 香港増補字符集 (Hong Kong Supplementary Character Set) (略称 HKSCS) は、香港特別行政府政府 (HKSAR) による符号化文字集合です。 Big5私用域に独自に文字を割り当てるものとなっています。

[25] 本項は HKSCS の拡張部分に関するものです。全容については、 Big5 を参照。

仕様書

符号化文字集合

次の表は 2001年版時点でのものです。

[3]

符号位置名前内容
0x81400x8DFEUDA31999年版で 641 文字。2001年版で 757 文字。
(0x81400x84FE)UDA3628符号位置。 HKSCS は使用しない (外字用)。
(0x8C400x8CDC)UDA32001年に116文字を追加。
0x8E400xA0FEUDA2漢字 2898 文字。GCCS から 84 文字削除し、701 文字追加。(追加の内 100 字程は以前より GCCS の拡張として使用されていたもの。)
0xA1400xA3FEBig-5 Symbols and Control Codes
0xA4400xC67EBig-5 Primary Character Set
0xC6A10xC8FEVDA359 文字。倚天から部首 6 文字を削除したもの。
0xC9400xF9D5Big-5 Secondary Character Set
0xF9D60xF9FEVDA41 文字。倚天から。
0xFA400xFEFEUDA1漢字 763 文字。GCCS から 22 文字削除し、17 文字追加。

HKSCS は追加部分だけで、 Big5 本体部分は規定していませんが、 多くの実装は 1984年版 Big5 に加えて EURO SIGN を実装しているようです。

Unicode

[33] 前の版で Unicode PUA に対応付けられていたのが Unicode の新しい文字に置き換えるケースがかなり多いです。 たまに Unicode の既存の文字から他の新しい文字に置き換えられるケースもあります。


[31] HKSCS-2016 では Big5 への新規追加ではない、 CJK統合漢字の出典 H としての漢字の追加が行われています。

[32] HKSCS-2016 の JSON ファイルには Unicode符号点と、 出典 H としての Big5 の符号が書いてあります。 UnicodePUA は含まれていません。 Big5ETen 由来部分 (非漢字含む。) も含まれていますが、 元祖由来部分は含まれていません。 GCSS 重複符号も入っていません。

[34] 0x8862 のような Unicode 1文字で表せない旧 HKSCS の文字が HKSCS-2016JSON ファイルには入っていません。

[35] HKSCS-2016JSON ファイルと Unihan の出典 HBig5 を比較すると、パッと見た感じ漢字部分は等しいようです。 がよく見ると稀に違う (変更されている) ことがあります。 (非漢字Unihan に入っていません。)

[36] どちらも一般的な実装が採用している旧版の UnicodeBig5 の対応関係と違っているところがあるので要注意です。

[37] 以上の理由より、 HKSCS を実装するなら、 HKSCS-2016 ではなく旧版に従うのが妥当でしょう。 HKSCS-2016 はもはや Big5 の一種ではなく Unicode の香港用部分集合と考えるべきものです。 Big5

[50] 昭源字體的新造字元 | 昭源字體, , https://chiron-fonts.github.io/technical-details/codepoint-additions/#%E9%A6%99%E6%B8%AF%E5%A2%9E%E8%A3%9C%E5%AD%97%E7%AC%A6%E9%9B%86%E8%A3%9C%E7%B7%A8%E6%96%B0%E6%94%B6%E5%AD%97%E5%85%83

[51] CJKUI修正笔记(一):WG2 N5006R(未竟) - 知乎, https://zhuanlan.zhihu.com/p/44819911

CJK統合漢字の出典HBが後から変更された事例

[54] グループ:prefix-h - GlyphWiki, https://glyphwiki.org/wiki/Group:prefix-h

[56] GlyphWiki:VillagePump - GlyphWiki, https://glyphwiki.org/wiki/GlyphWiki:VillagePump#i3


[41] Adobe-CNS1UnicodeHKSCS のものです。 Adobe-CNS1

[39] Appendix:Unicode/Private Use Area/HKSCS - Wiktionary, , https://en.wiktionary.org/wiki/Appendix:Unicode/Private_Use_Area/HKSCS

[52] 03411-gbhkscs.pdf, , https://www.unicode.org/L2/L2003/03411-gbhkscs.pdf

出典H

[57] CJK統合漢字CJK互換漢字IVC (未成) の出典H

[61] CJK互換漢字Big5 重複漢字2字にも出典 HB が付いています。

[83] 文字関係
key
unihan:kIRG_HSource
desc
Unihan kIRG_HSource

[62] 字形Unicode 5.2 時点と現在とで変わっているものがあります。 例えば: U+20046 (H-9376)

字形

[8] 字形には常用字字形表 (二零零零年修訂本) (香港教育學院, 2000, urn:isbn:962-949-040-4) のものを採用しているそうです。 (この表の字形は香港の教育課程で使われているそうです。)

実装戦略

Big5

HKSCS IDS

IDS

IVC

[43] 中華人民共和国香港特別行政区当局のウェブサイトには HKSARG Collection と称する IVC の登録提案が掲載されています。 >>42 しかし現在に至るまで IVD 登録に至っていません。

[44] 本提案は HB-hhhh 形式のグリフ部分集合IVS を登録するものでした。 >>42 HBBig5 (本体) を表しており、 PDF の字形一覧には台湾側の字形と対照して、 香港用の字形が示されています。 >>45

[47] 本提案のファイルの日付はで、その後に HKSCS-2016 が出版されました。 HKSARG Collection が頓挫した理由は不明ですが、 IVS を使わないことにしたのでしょうか。

[49] 中華人民共和国澳門特別行政区当局は同時期に MSARGIVD に登録しました。

[55] Wayback Machine, https://web.archive.org/web/20150910055607/http://appsrv.cse.cuhk.edu.hk/%7Eirg/irg/irg43/IRGN2038LQ_Unicode%2038.pdf

関連

[29] MSCS, Adobe-CNS1

歴史

[17] 1998年に Big5 の拡張として GCCS (Government Common Character Set) が規定されました。

[28] 中文編碼網頁 → Windows NT 4.0 Workstation 國際中文版香港字集, , http://code.web.idv.hk/charset/pcntw.php

[39] グループ-ノート:Big5-GCCS外字 - GlyphWiki, https://glyphwiki.org/wiki/Group-talk:Big5-GCCS%e5%a4%96%e5%ad%97

[40] Unicode mappings for GCCS "not verifiable" characters · GitHub, https://gist.github.com/Artoria2e5/63fa5747c7093238ddcc1458a7582aca

[2] 1999年9月28日版 (HKSCS-1999) は、 GCCS から一部重複 (真の重複・包摂規準を考慮した重複) を削除 (その符号位置は保留) し、新たな文字を大幅に追加したものでした。 1984年版 Big5 に対して 4702 文字の追加漢字非漢字が含まれています。

[9] 2001年12月版 (HKSCS-2001) は、 HKSCS-1999 に更に116文字 >>16 を追加すると共に、ISO/IEC 10646‐2:2001 にあわせて変換表を修正しています >>16。 Big5 に対して 4818 文字の追加となっています。

[10] 更に、 2001年以降に承認された123文字の追加 >>16ISO/IEC 10646:2003/Amd.1 に対応した変換表を含む HKSCS‐2004 が制定されました (2005年5月)。 これによって文字数は4941文字になっています。

[11] HKSAR は文字登録の申請・審査手続き >>19 を定めているので、 規格自体の改訂を待たずに随時文字が追加されています。

[18] 2009年12月には更に68文字を追加 >>16 した HKSCS-2008 が出版されています。 ISO/IEC 10646:2003/Amd.6:2009 に対応しています >>16

実装

[4] HKSAR は Windows 用の EUDC フォントを提供しています。 このフォントは GCCS にあって HKSCS で削除した文字にも字形を用意しています。

[5] Windows や多くの GNU/Linux の配布も含めて、 中文対応のほとんどのシステムで HKSCS が実装されているようです。

[12] Microsoft Character Code Conversion Routines for HKSCS-2004 http://www.microsoft.com/globaldev/outreach/dnloads/MSCCCR_HKSCS_2004.mspx (名無しさん 2006-01-11 11:05:54 +00:00)

[13] I'm not a Klingon : How do I get HKSCS 2004 characters from Big-5 in .Net? ( 版) http://blogs.msdn.com/shawnste/archive/2007/05/03/how-do-i-get-hkscs-2004-characters-from-big-5-in-net.aspx (名無しさん 2007-05-05 02:10:56 +00:00)

識別子

[6] MIME などで使用される IETF (IANA) の charset 名としては、 Big5-HKSCS が登録されています。 この名前は HKSCS-1999 に対応します。

[20] Web で使用される Encoding Standard符号化ラベルとしての Big5-HKSCS文字符号化 big5 を表しています。 big5符号化器が素の Big5 相当となっており、 復号器HKSCS 相当となっています。

歴史

[14] GovHK: Hong Kong Supplementary Character Set (HKSCS) ( 版) http://www.gov.hk/en/about/helpdesk/softwarerequirement/hkscs.htm

[15] OGCIO : Hong Kong Supplementary Character Set (HKSCS) ( 版) http://www.ogcio.gov.hk/en/business/tech_promotion/ccli/hkscs/

[16] OGCIO:Development of the HKSCS ( 版) http://www.ogcio.gov.hk/en/business/tech_promotion/ccli/hkscs/development.htm

[19] OGCIO:Inclusion of New Characters in the HKSCS ( 版) http://www.ogcio.gov.hk/en/business/tech_promotion/ccli/hkscs/new_characters_inclusion.htm

[21] 912470 – Merge big5-hkscs and big5 as per the Encoding Standard ( 版) https://bugzilla.mozilla.org/show_bug.cgi?id=912470

[22] Opera: Opera 11.00 for Windows changelog ( (Frank M. Palinkas, Technical Writer, Opera Software ASA 著, 版)) http://www.opera.com/docs/changelogs/windows/1100/

[27] char2015-06 - char2015-06.pdf, , https://www.ogcio.gov.hk/tc/our_work/business/tech_promotion/ccli/cliac/doc/char2015-06.pdf

[30] 36329 - Hong Kong Special Character Set display problem - chromium, https://bugs.chromium.org/p/chromium/issues/detail?id=36329

[38] 中文編碼網頁 → 香港增補字符集(HKSCS), , http://code.web.idv.hk/hkscs/hkscs.php

[53] Main Page - FreeFonts, , https://web.archive.org/web/20050216095932/http://freefonts.oaka.org/en/index.php/Main_Page

[63] Microsoft Word - IRGN2694-HKSAR-ActivityReport-20241002.doc - n2694-HKSARActivityReport.pdf, , https://www.unicode.org/irg/docs/n2694-HKSARActivityReport.pdf

[64] >>63 新規文字申請を審査したところ、新規追加は不要と判断された、と。どこかの国と違って新規追加プロセスがちゃんと機能しているんだなw