compatibility decomposition

compatibility decomposition

[2] 互換性等価性 (compatibility equivalence) は、 正準等価性に加え、全角半角上付き書体などの差異も無視した文字等価性です。 互換等価性を保ちつつできるだけ基本的な基底文字結合文字の列に分解する操作を互換分解 (compatibility decomposition) といいます。

仕様書

文字カテゴリー HasCompat (PRECIS)

[8] PRECIS文字カテゴリー HasCompat は、 互換性等価性を持つ文字を表します。 >>7

[9] HasCompat は、 toNFKC を適用すると異なる値となる符号位置と定義されています。 >>7

[10] IDNA2008Unstablecase folding と組み合わせた定義を使っています。

関連

[3] 互換分解NFKCNFKD で使われています。

メモ

[4] 正準等価性に対しては正準分解正準結合がありますが、 互換性等価性に対しては互換分解しかありません。互換分解によって失われる情報は後から復元できないからです。

[1] HIRAGANA DIGRAPH YORIより にするような分解はやりすぎではないか? 麿麻呂に分解するのと何が違う?

[6] Vertical_Orientation半角文字全角文字で全然違っています。 そのため互換分解すると縦書きでの表示方法の情報も失われてしまいます。