[2] 互換性等価性は、 正準等価性に加え、全角・半角、上付き、書体などの差異も無視した文字の等価性です。 互換等価性を保ちつつできるだけ基本的な基底文字と結合文字の列に分解する操作を互換分解といいます。
HasCompat
(PRECIS)[8]
PRECIS
の文字カテゴリー
HasCompat
は、
互換性等価性を持つ文字を表します。
>>7
[9]
HasCompat
は、
toNFKC
を適用すると異なる値となる符号位置と定義されています。
>>7
[4] 正準等価性に対しては正準分解と正準結合がありますが、 互換性等価性に対しては互換分解しかありません。互換分解によって失われる情報は後から復元できないからです。
[1]
HIRAGANA DIGRAPH YORI
を より
にするような分解はやりすぎではないか?
麿
を麻呂
に分解するのと何が違う?
[6]
Vertical_Orientation
が半角文字と全角文字で全然違っています。
そのため互換分解すると縦書きでの表示方法の情報も失われてしまいます。