N‐バイト・ハングル符号化文字集合

N‐バイトハングルと半角ハングル

N‐バイト・ハングル符号化文字集合

[10] KS X 1001 >>55附属書4N‐Byte ハングルと呼ばれる符号化文字集合を規定しています。

[1] KS C 5601 (現在の KS X 1001) の初版であるKS C 5601‐1974 >>55 と第2版であるKS C 5601‐1982 ではこの符号化文字集合だけが規格本体で規定されていました。 第3版以後附属書に移動しています。

[2] 規格については KS X 1001 参照。

[11] 7ビット及び8ビットの符号化文字集合であり、 51文字の基本的なハングル字母が含まれています CJK.INF

[27] KS X 1001:2004 附属書4は7ビット符号であるとしています。

[28] 94文字集合

[29] ラテン文字と併用するときは、 KS X 1003 SI の後にラテン文字集合、 KS X 1003 SO の後にハングル集合。

[30] (併用するときは、とあるのでしないで単体での利用も想定されているらしい。)

[31] ラテン文字用の集合が何か明記されていないが、 KS X 1003 か。 C0制御文字も明記されていないが、 SI, SOKS X 1003 と明記されているので、C0制御文字KS X 1003 のもの (≒ ISO 646) か。 明記されていないが SP, DEL もあるのか。

[34] この94集合ISO-IR に登録されていません。 KS X 1001:2004 解説3によれば以前の改正時にこれが課題となりましたが、 未解決のまま現在に至っています。

CP891

CP1040

Unicode 半角ハングル

[54] KS X 1026-1:2007 4.3 によると、 KS X 1001 附属書4 7ビットハングル符号との互換性のためにある。

[5] Adobe-KRUnicode半角文字として収録されたのは誤りだったとし、 CMap では全角文字と同じ字形に対応させている。 >>56

比較

[12] KS X 1001 附属書4は7ビット符号であり、 GL でも GR でも使えます。

[13] ICUibm-891_P100-1995 は、 GLKS X 1003GRNバイトハングルを割り当てています。

[14] ICUibm-944_P100-1995, ibm-944_X100-1995, ibm-1040_P100-1995 は、 >>13 に更にいくつかの記号を追加しています。 なお追加分には、 ASCIIKS X 1003 の差分である \~ も含まれます。

[15] CP1041 の追加記号と似ています。

[17] ASCII との差分2字については KS X 1003 も参照。

[16] glibc-IBM891-2.1.2 はこれらとは全く違い、 ASCII と同等です。

メモ