ハングル音節 := 完全な音節 / 不完全な音節
完全な音節 := 初声 中声 [ 終声 ]
不完全な音節 := 初声埋め文字 (中声 [終声] / 終声) / 初声 中声埋め文字
初声埋め文字 := U+115F ;; CHOSEONG FILLER
中声埋め文字 := U+1160 ;; JUNGSEONG FILLER
ハングル字母 := 初声 / 中声 / 終声
結合文字付きハングル音節 := ハングル音節 *結合文字
(JIS X 0221‐1:2001 25.1 ハングル音節の合成方法参照)
[2] ハングル字母は結合文字ではないそうです。
ハングル字母は実装水準の 1 と 2 では使えません。
[3] この UCS の組合型ハングル使うと、完成型で 1文字で済んでいたところが3文字になってしまいます。 UTF-8 でも3×1バイトから2×3バイトでやっぱり2倍。
一応現代ハングルとして可能な組合せはハングルの大移動ですべて完成型で用意したので、 普通の用途なら完成型だけで足りますが、もし少しだけ足りないのが欲しいとなると完成型と組合型を併用することになって美しくない。 かといって組合型に統一するとデータ量が2倍に・・・。 (しかも見た目的な1文字が文字コード的1文字と対応していないから色々と問題が・・・。) Unicoder の中には全部組合型にしちまえと言ってる人もいるみたいですが・・・ (多分そういう人は日常的にハングルなんて使ってないんだろうな)。 (名無しさん [sage])