[1] 『信息交換用漢字編碼字符集 基本集 (Code of Chinese graphic character set for information interchange--Primary set)』。
[2] 中国大陸で使われている基本的な漢字 (簡体字) を集めた94^2図形文字集合。 通称 GB, GB 漢字, GB0, GB コード。
[4] 主要変換表間の差異 :
GB 2312 (GL) | Unicode (UTC) | GBK (MS 936) | MacChineseSimp |
0-2124 | U+30FB (KATAKANA MIDDLE DOT) | U+00B7 MIDDLE DOT() | |
0-212A | U+2015 (HORIZONTAL BAR) | U+2014 (EM DASH) | |
0-212B | U+FF5E (FULLWIDTH TILDE) | U+301C (WAVE DASH) | |
0-212D | U+2026 (HORIZONTAL ELLIPSIS) | U+22EF (MIDLINE HORIZONTAL ELLIPSIS) | |
0-2169 | U+FFE0 (FULLWIDTH CENT SIGN) | U+00A2 (CENT SIGN) | |
0-216A | U+FFE1 (FULLWIDTH POUND SIGN) | U+00A3 (POUND SIGN) | |
0-2324 | U+FFE5 (FULLWIDTH YEN SIGN) | U+00A5 (YEN SIGN) | |
0-237E | U+FFE3 (FULLWIDTH MACRON) | U+203E (OVERLINE) |
[5] GB は JIS とは違って、 変換表間の差異がさして大問題になってはいません。 MS CodePage 936 の拡張が GBK 1.0 として半公認、 GB 18030 として正式に国家規格化してしまったからでしょう。
本来の定義を尊重した対応を正式なものとしたけど誰にも相手にされない JIS と、どっちがよかったのだろう。 どっちもよくないわな。
[17] GB2312-80 Character Names, , https://web.archive.org/web/20071021110302/http://www.massangeana.com/mas/charsets/gbfuhao.htm
[10]
一般に gb2312
, EUC-CN,
MIME charset CN-GB
RFC 1922
と呼ばれるのは
EUC 方式で GB 2312 を使ったものです。
SP
DELETE
[9]
Encoding Standard の gb2312
はこれを現実の実装に合わせて調整したものです。
[11] DEC 製品は外字を追加した DEC HANZI を実装していました。
[12] GBK, GB 18030 は EUC-CN を拡張したものです。
[14] cWnn は EUC-CN に CS2 に omron_udc_zh を追加したものを使っていました。 >>13