Canonical_Combining_Class

結合クラス

仕様書

結合クラス

[2] Unicode符号点は、 結合 (けつごう) クラス (combining class) (特性 Canonical_Combining_Class, ccc) を持ちます。 結合クラスは、 正準順序付けアルゴリズム結合マーク正準等価性の決定に使う [ 0, 254 ] の数値です。 >>1 D104

[3] Canonical_Combining_Class は、 UCDUnicodeData.txt で定義されます。 DerivedCombiningClass.txt にも収録されています。 >>1 D104

[4] データファイルに明記されていないときの既定値は、 0 です。 >>1 D104


[11] 固定位置 (こていいち) クラス (fixed position class) は、 結合クラス部分集合で、 範囲 [ 10, 199 ] の数値です。 >>1 D105

[12] 固定位置クラスは、 ヘブライ文字アラビア文字シリア文字テルグ文字タイ文字ラオス文字チベット文字の少数の結合マークのみに適用され、 grapheme base に対して固定された位置に出現するものを表しています。 適用対象となる結合文字には Arabic vowel pointIndic matras のような母音記号の一部が含まれますが、 すべてではありません。 >>1 D105

[13] 固定位置クラスは、 正規化形の正式な標準化に先立つ開発の初期段階に由来する歴史的遺物とされます。 >>1 D105


[15] ccc は、元々、 typograph的相互作用を持つ nonspacing mark を同じ値でグループ化すべく定められました。 ccc を使って行われる canonical ordering は、 通常は、

... となります。 ところが固定位置クラス結合文字など、 一部には ccc が違うのにtypograph的相互作用するケースもあります。 >>1

[18] それ故に ccc規定として使われるのは正準順序付けアルゴリズムだけです。 >>1

[19] ccc は、 結合文字typograph的相互作用については指針としてのみ扱うべき (should) です。 >>1

メモ