KS X 1002:2001

KS X 1002:2001

[1] KS X 1001 (旧 KS C 5657) は KS X 1001 に含まれない文字を補った942JIS X 0208符号化図形文字集合の規格です。

規格の版

  1. [19] KS C 5657‐1991
  2. [26] KS X 1002:2001

符号化文字集合

[3] 符号化文字集合:

  1. 1区〜7区 発音区別符付きラテン文字 (613文字)
  2. 8区〜10区 発音区別符付きギリシャ文字 (273文字)
  3. 11区〜13区 記号 (275文字)
  4. 14区 合成ハングル字母 (27文字)
  5. 16区1点〜36区50点 ハングル音節 (1930文字)
  6. 37区1点〜54区77点 ハングル音節 (1675文字)
  7. 55区1点〜85区36点 漢字 (2856文字)

[4] 漢字KS X 1001 とは異なり、発音に関わらず 1文字当たり1符号位置となっています。

[5] 1区〜7区は規格票では615文字とされており、 19頁で存在することになっている2文字は実は KS X 1001 に含まれているものだそうです CJK.INF

KS X 1002 (GL)文字KS X 1001 (GL)
0x2137X0x2358
0x217ATM0x2262

[6] 37区〜54区は規格票では1677文字とされているものの実際にはやはり 2文字少ないそうです CJK.INF

[7] 16区〜36区はそのまま ISO/IEC 10646‐1:1993 でも使われていましたが、ハングルの大移動でばらばらになりました。

文字の名前

[11] 非漢字ハングルには ISO/IEC 10646 方式の文字の名前が与えられています。

[12] 不思議なことにこれより後の KS X 1001 の改正では KS X 1001 の方の非漢字ハングル韓国語の名前を与えて、 ISO/IEC 10646 方式の文字の名前は与えていません。

字形

[2] 規格票の漢字の部分は手書きだそうです CJK.INF, >>18

[32] 字形は印刷文字らしきもの、 印刷文字に手書きで足したらしきもの、 何かを切り貼りしたらしいもの、 手書きらしきものが混じっています。 ウェブで公開されている版の解像度ではどの方法なのか断定しがたいものもありますが。 漢字はすべて明らかに手書きです。

[34] 漢字はもう少し上手い人に丁寧に清書してもらった方が良かったのではないですかね... 一応楷書ではあるのですが、あまり整った字形ではありません。 ウェブで公開されているものは解像度のせいもあって細かい部分が読み取れないものもあります。

[35] 符号表の字形とその他の部分に掲出された字形は必ずしも同じではないように思われます。 フォントがあるわけではないので再現性がないのでしょう。 手作業で切り貼りで作ったらしく周りの行に揃っていなかったり傾いていたりする箇所もあります。

[36] ラテン文字半角の印刷文字の字形ダイアクリティカルマークを付け足したものが多いように見えます。 ハングル漢字全角字形が示されていますが (といっても漢字手書きなのではっきりした大きさが決まっているわけではありませんが)、 非漢字類は大きさがバラバラです。

[37] 1991年版と2001年版は字形は変更せずに同じ表を使っているように見えますが、 要検証です。

Unicode との関係

[40] 漢字は出典 K1 として CJK統合漢字 (URO) にすべて収録されています。

[41] ハングルの前半は Unicode にすべて収録されています。

[44] ハングルの後半は Unicode に独立した文字として収録されていませんが、 ハングル字母の組み合わせとして表現できます。

[46] その他の文字は Unicode に収録されているもの、 複数の Unicode文字の列で表せるもの、 があります。

[48] ただ >>47 の対応付けが適切なのかは定かではありません。また、 3区76点は >>47 で不明とされています。 規格票には説明がなくその字形が何であるのかは不明です。

終端バイト

[8] KS X 1002:2001 は第1拡張集合の終端バイト4/5、 第2拡張集合の終端バイト4/6 と定めていました。

[9] 第1拡張集合が通常 KS X 1002図形文字集合といわれているものを指すようです。 第2拡張集合は終端バイトの説明以外では出てきません。すべて未割当ということでしょうか。

[10] 終端バイトはどちらも ISO-IR では無関係の図形文字集合に割り当てられています。 正式登録前に先走って勝手に使い始めたパターンでしょうか。 その後他の終端バイトで正式登録もされていないのは、 面倒で諦めたのでしょうか?

[38] KS X 1002:1992 に同じ規定が既にあります。

[39] KS X 1002:1992, KS X 1002:2001 とも解説にも 4/5 の使い方が明記されています。

関連

[13] 関連: Adobe-KR

メモ

[16] KS X 1002/한자 음 정보 | 문자 집합 위키 | Fandom, , https://charset.fandom.com/ko/wiki/KS_X_1002/%ED%95%9C%EC%9E%90_%EC%9D%8C_%EC%A0%95%EB%B3%B4

[17] KS X 1002 - Wikipedia (, ) https://en.wikipedia.org/wiki/KS_X_1002

[18] グループ:KSX1002 - GlyphWiki, https://glyphwiki.org/wiki/Group:KSX1002

[49] KS X 1002 - 나무위키, https://namu.wiki/w/KS%20X%201002