N‐バイト・ハングル符号化文字集合

[10] KS X 1001 >>55 の附属書4は N‐Byte ハングルと呼ばれる符号化文字集合を規定しています。

[1] KS C 5601 (現在の KS X 1001) の初版である西紀1974年版 KS C 5601‐1974 >>55 と第2版である西紀1982年版 KS C 5601‐1982 ではこの符号化文字集合だけが規格本体で規定されていました。第3版以後附属書に移動しています。

[2] 規格については KS X 1001 参照。

[11] 7ビット及び8ビットの符号化文字集合であり、 51文字の基本的なハングル字母が含まれています CJK.INF。

[27] KS X 1001:2004 附属書4は7ビット符号であるとしています。

[29] ラテン文字と併用するときは、 KS X 1003 SI の後にラテン文字集合、 KS X 1003 SO の後にハングル集合。

[30] (併用するときは、とあるのでしないで単体での利用も想定されているらしい。)

[31] ラテン文字用の集合が何か明記されていないが、 KS X 1003 か。 C0制御文字も明記されていないが、 SI, SO が KS X 1003 と明記されているので、C0制御文字も KS X 1003 のもの (≒ ISO 646) か。明記されていないが SP, DEL もあるのか。

[34] この94集合は ISO-IR に登録されていません。 KS X 1001:2004 解説3によれば以前の改正時にこれが課題となりましたが、未解決のまま現在に至っています。

CP891

[54] KS X 1026-1:2007 4.3 によると、 KS X 1001 附属書4 7ビットハングル符号との互換性のためにある。

[5] Adobe-KR は Unicode に半角文字として収録されたのは誤りだったとし、 CMap では全角文字と同じ字形に対応させている。 >>56

[12] KS X 1001 附属書4は7ビット符号であり、 GL でも GR でも使えます。

[14] ICU の ibm-944_P100-1995, ibm-944_X100-1995, ibm-1040_P100-1995 は、 >>13 に更にいくつかの記号を追加しています。なお追加分には、 ASCII と KS X 1003 の差分である \ や ~ も含まれます。

[15] CP1041 の追加記号と似ています。

[17] ASCII との差分2字については KS X 1003 も参照。

[16] glibc-IBM891-2.1.2 はこれらとは全く違い、 ASCII と同等です。