[2] i;unicode-casemap
は、titlecase 化正準化 UTF-8
について i;octet
と同じように等価性、順序、部分文字列の各演算を定義するものです >>1。
[3] titlecase 化正準化 UTF-8 とは、 入力が既知の charset で UTF-8 に変換できるなら UTF-8 に変換した上で次の操作を行い、 そうでないなら元のままとしたものです >>1。 UTF-8 に変換できた文字列については、 UnicodeData.txt に基づき次のように処理します。
[7] 意図的かどうかは不明ですが、 Unicode の case folding や NFKC の定義を参照せずに、 UnicodeData.txt の値を直接参照しています。そのため、 SpecialCasing.txt で定義されるような複雑な大文字と小文字の関係は無視されますし、 ハングル音節の分解は行われません。