* N‐バイト・ハングル符号化文字集合



[10] [[KS X 1001]] [SRC[>>55]] の[DFN[附属書4][KS X 1001 附属書4]]は 
[DFN[N‐Byte ハングル]]と呼ばれる[[符号化文字集合]]を規定しています。

[1] 
[[KS C 5601]] (現在の [[KS X 1001]]) 
の初版である[TIME[西紀1974年][1974]]版
[[KS C 5601‐1974]] [SRC[>>55]]
と第2版である[TIME[西紀1982年][1982]]版
[[KS C 5601‐1982]]
ではこの[[符号化文字集合]]だけが規格本体で規定されていました。
第3版以後附属書に移動しています。

;; [2] 規格については [[KS X 1001]] 参照。

[REFS[

- [55] 
[CITE@ko[국가표준 상세 | e나라 표준인증]], [TIME[2024-11-15T05:27:03.000Z]] <https://standard.go.kr/KSCI/standardIntro/getStandardSearchView.do?ksNo=KSX1001>
- [3] [CITE[Wayback Machine]], [TIME[2025-06-17T14:42:54.000Z]] <https://web.archive.org/web/20190301013402/http://125.60.48.13/home4/dl_files/edu/001/IM1199204807.pdf#page=78>
-- [4] [TIME[西紀1987年][1987]]規格原案

]REFS]


-*-*-

[11] 7ビット及び8ビットの符号化文字集合であり、
51文字の基本的な[[ハングル字母]]が含まれています [SRC[[[CJK.INF]]]]。

[27] 
[[KS X 1001:2004]] 附属書4は[[7ビット符号]]であるとしています。

[28] 
[[94文字集合]]。

[29] 
[[ラテン文字]]と併用するときは、
[[KS X 1003]] [CODE(charname)@en[SI]] の後に[[ラテン文字]]集合、
[[KS X 1003]] [CODE(charname)@en[SO]] の後に[[ハングル]]集合。

[30] (併用するときは、とあるのでしないで単体での利用も想定されているらしい。)

[31] 
[[ラテン文字]]用の集合が何か明記されていないが、
[[KS X 1003]] か。
[[C0制御文字]]も明記されていないが、
[CODE(charname)@en[SI]], [CODE(charname)@en[SO]]
が 
[[KS X 1003]]
と明記されているので、[[C0制御文字]]も 
[[KS X 1003]] のもの (≒ [[ISO 646]]) か。
明記されていないが [CODE(charname)@en[SP]],
[CODE(charname)@en[DEL]]
もあるのか。


[34] 
この[[94集合]]は [[ISO-IR]] に登録されていません。
[[KS X 1001:2004]] 解説3によれば以前の改正時にこれが課題となりましたが、
未解決のまま現在に至っています。

* CP891

- [6] [CITE@ja[CP00891X - CP00891.pdf]], [TIME[2005-12-09T15:49:24.000Z]], [TIME[2025-06-17T14:43:55.616Z]] <https://public.dhe.ibm.com/software/globalization/gcoc/attachments/CP00891.pdf>

* CP1040

- [7] [CITE@ja[CP01040X - CP01040.pdf]], [TIME[2005-12-09T16:15:57.000Z]], [TIME[2025-06-17T14:44:22.750Z]] <https://public.dhe.ibm.com/software/globalization/gcoc/attachments/CP01040.pdf>
- [8] [CITE@en[KS X 1001 - Wikipedia]], [TIME[2025-06-17T06:01:36.000Z]], [TIME[2025-06-17T14:44:42.861Z]] <https://en.wikipedia.org/wiki/KS_X_1001#1974>
- [9] [CITE@en[Code page 1040 - Wikipedia]], [TIME[2025-06-17T06:01:37.000Z]], [TIME[2025-06-17T14:45:07.583Z]] <https://en.wikipedia.org/wiki/Code_page_1040>

* Unicode 半角ハングル




[54] [[KS X 1026-1:2007]] 4.3 によると、 [[KS X 1001]]
附属書4 [[7ビットハングル符号]]との互換性のためにある。

[5] 
[[Adobe-KR]] は [[Unicode]] に[[半角文字]]として収録されたのは誤りだったとし、
[[CMap]] では[[全角文字]]と同じ[[字形]]に対応させている。
[SRC[>>56]]

[REFS[
- [56] [CITE@en[question about code mapping in [[Adobe-KR-9]]. · Issue #6 · adobe-type-tools/cmap-resources · GitHub]], [TIME[2022-09-30T07:44:10.000Z]] <https://github.com/adobe-type-tools/cmap-resources/issues/6>
]REFS]

* 比較

[12] 
[[KS X 1001]] 附属書4は[[7ビット符号]]であり、 [[GL]] でも [[GR]] でも使えます。

[13] 
[CITE[ICU]]
の
[DFN[[CODE[ibm-891_P100-1995]]]]
は、
[[GL]] に [[KS X 1003]]、 [[GR]] に[[Nバイトハングル]]を割り当てています。


[14] 
[CITE[ICU]]
の
[DFN[[CODE[ibm-944_P100-1995]]]],
[DFN[[CODE[ibm-944_X100-1995]]]],
[DFN[[CODE[ibm-1040_P100-1995]]]]
は、
>>13
に更にいくつかの記号を追加しています。
なお追加分には、
[[ASCII]] と [[KS X 1003]] の差分である [CH[\]] や [CH[~]] も含まれます。

;; [15] [[CP1041]] の追加記号と似ています。

[17] [[ASCII]] との差分2字については [[KS X 1003]] も参照。

[16] 
[DFN[[CODE[glibc-IBM891-2.1.2]]]]
はこれらとは全く違い、 [[ASCII]] と同等です。




* メモ