[1] EUC-KR は、 CS1 に KR X 1001 を割り当てた EUC です。
[11] DEC Hangul は EUC-KR と同一です。
[13] CS0 が ASCII vs KS X 1003 問題があって、 KS X 2901:2019 の解説にも関係する記述がある。
[16] UHC (Unified Hangul Code, 統合型ハングルコード, 拡張完成型コード, Microsoft Code Page 949, CP949, Extended Wansung) は、 EUC-KR にハングルなどを追加し、現代ハングルの全 11172通りを収録した韓国語向け符号化文字集合です。
[17] Windows 95 の韓国版で初めて採用されたそうです。
[3] 第1バイトが 0x81
〜0xFE
、
第2バイトが 0x41
〜0x5A
,
0x61
〜0x7A
,
0x81
〜0xFE
の領域
(全22428符号位置) に17046文字定義しています。
[15]
EUC-KR や CP949 や CP1363 の実装の中には、 0x5C を U+005C
に対応付けるものと、 U+20A9
に対応付けるものがあります。
[2]
IBM 系の CP949 の実装は、 0x80 からの5文字に独自に割り当てています。
0x82 に U+005C
が、
0x83 に U+203E
が割り当てられています。
CP1363 (UHC) にはありません。
[18]
ICU
の
windows-949-2000
は、
0xFF
を
U+F8F7
としています。
[3] Bug 562091 – Make Unicode => EUC-KR converter identical to Unicode => UHC / Windows-949 ( ( 版)) https://bugzilla.mozilla.org/show_bug.cgi?id=562091
[4] Korean Page in EUC-KR with 8byte seq. representation ( ( 版)) http://www.i18nl10n.com/korean/euckr2.html
[5] >>3, >>4 Firefox は8バイトの列を1つの Unicode ハングル音節と解釈しますが、 Chrome は4つのハングル字母の列と解釈します。
[6] Fix euc-kr https://www.w3.org/Bugs/Public/show_bug.cgi?id=16691 · 4b20cf6 · whatwg/encoding ( ( 版)) https://github.com/whatwg/encoding/commit/4b20cf61260ed00357663755886d9f7617d60b35
[8] gb18030, shift_is, euc-kr: put byte back if code point is null (not p… · whatwg/encoding@640bf69 ( 版) https://github.com/whatwg/encoding/commit/640bf69847a17fd98df027fd6cd5ae384ac82dab
[9] 27868 – EUC-KR and encoding-only mapping (fromUnicode) ( 版) https://www.w3.org/Bugs/Public/show_bug.cgi?id=27868
[7] Editorial: check non-null before null (annevk著, ) https://github.com/whatwg/encoding/commit/4e53e160b9e0ade6e33a25d21580106a0db2c47f
[10] Henri Sivonenさんのツイート: "TIL: Firefox converts compatibility jamo in EUC-KR into syllables when decoding. Other browsers don't. I take it the Web doesn't need this." () https://twitter.com/hsivonen/status/862622797356560385
[14] 16691 – Fix euc-kr, , https://www.w3.org/Bugs/Public/show_bug.cgi?id=16691