ハングルの大移動

ハングルの大移動

[1] Korean mess (ハングルの大移動, 直訳 韓語混乱) で、 ハングルU+3400U+4DFF から U+AC00U+D7A3 にぶっとびますた。

[26] この改正は、

によって行われました。 >>25

[25] PDF 千夜一夜: PDFと文字(26) – ハングルの扱い, , https://blog.antenna.co.jp/PDFTool/archives/2006/01/pdf26_unicode.html

[8] ハングル跡地には、「BMP にはこれで漢字は最後。」という約束でCJK統合漢字拡張Aが入りました。

[14] ですから単に文字が移動しただけではなく、更に 83JIS のように「同じ文字概念」の場所を入れ替えたのでもなく、全く違うハングルが全く違う漢字に変わってしまったのです。

[15] JTC1/SC2/WG2UTC は「この過ちを2度と繰り返さない」とその後決定したそうです。その舌の根も乾かないうちに、 BMP の全符号位置の数千倍の私用符號位置がばっさり削除されました (PrivateMess)。

[16] また、目立たぬようにこっそりと2種類の「φ」の入れ替えが敢行されました。

[17] Cannot Display Korean Windows NT 3.5 Programs Under Windows 3.51 ( 版) http://support.microsoft.com/default.aspx?scid=kb;en;157447

[7] 韓国の圧力により、 ISO/IEC10646-1:1993 Ammendment 6 において、 ISO/IEC 10646-1:1993 で規定されていたハングル がばっさり削除され、代わりに全ての現代ハングルの完成形が 別の場所に登場したこと。 (See also 組合型) (元のハングルは使用頻度が高いものだけ規定されていた。)

ちなみに、元のハングルの場所には後に追加漢字 (CJK UNIFIED IDOGRAPHS EXTENSION A) が割り当てられた。

Unicode で言えば 1.1 → 2.0 にあたる。

[2] 一歩間違えば 83JIS の混乱のような事態になったでしょうが、 当時 UCS でハングルを使ってた人なんてそんないなかったらしいので、 コップの中の嵐で終わったみたいです。 (当時から UCS を使ってた忠実な Unicoder (など) が被害を被ったわけです。)

[18] 極めて稀にですけど、当時作られた文書に一部不審な漢字が混じっていて、 ハングルCJK統合漢字拡張A文字化けしていたのだとわかるケースがあります。

[3] これを教訓に SC2UTC は二度とこのようなことを しないと決意した・・・と書いてある文書が幾つもあるんですが、 懲りずに 2.0 → 3.2 でギリシャ文字φの入れ替えを行ってみたり (PhiMess)、 私用面・私用群をばっさり消したり (ISO/IEC 10646-1:2000 Ammendment 1) してます (PrivateMess)。

[19] ISO/IEC 10646Unicode の枠内の仕組みでハングルの大移動前のデータか、 後のデータかを区別する方法はありません。頻度分析など発見的な方法で推測するか、 文字化け人間に検査させるしかありません。

[20] BOMDOCS のような文字コード判別の役に立ちそうな ISO/IEC 10646UnicodeISO/IEC 2022 に備わった仕組みは、 こういう肝心なときには使えません。 (非互換変更がなされているにも関わらず、 旧規格と新規格で同じ識別子のままになっています。 この点は 83JIS の方がマシだったといえます。目糞鼻糞とはいえw)

[21] MIME charsetUTF-8UTF-7Unicode 1.1 (旧規格) の名称が登録されているので、新旧規格を区別できます。 ただし、版指定がない方の名前 (昔からあって今も普段遣いされている方の名前) が新規格を表していて、版指定があるのは旧規格の方だけです。 つまりわざわざ旧規格用の MIME charset 名に付け直したときだけ、 正しく判別できる、という微妙な扱いです。 (メールなどで使われていた場合、 過去に遡って修正などできるわけがなく、 旧規格なのに版指定なしの MIME charset 名になっていたりするので、 送受信の日付からどちらか推測するしかありません。) そして旧規格用の MIME charset 名にはあまり対応されていないようです。

[5] 関連: ISO/IEC 10646におけるエスケープシーケンス, Unicode 1.1

[22] Japanese Windows and hangul, , https://ha1.seikyou.ne.jp/home/akairingosaita/hangul/hangul03.htm

完成型ユニコードは古いバージョンのものです。

[23] 17080-three-hangul-syl.pdf, , https://unicode.org/L2/L2017/17080-three-hangul-syl.pdf

[24] Notes for HANGUL.TXT, , https://www.unicode.org/Public/MAPPINGS/OBSOLETE/EASTASIA/KSC/HangulReadMe.html