[5] Unicode の General_Category は、 符号位置の一般的な分類です。 すべての符号位置が letter、記号などに分類されています。
[3] General_Category は UnicodeData.txt で定義されています。また DerivedGeneralCategory.txt にも収録されています (こちらの方が使いやすいかもしれません)。
[15]
私用文字については、
私的な同意に基づき独自の値と解することが出来ます。
General_Category
から導出される特性も同様です。
[10] 値の集合 (分類の種類) は変更されることはありませんが、符号位置に対する値 (分類) は変更される可能性があります >>9。
[18] 1文字目、全体、特別な値として Any
, Assigned
, ASCII
>>16
[19] perlunicode - Unicode support in Perl - Perldoc Browser, https://perldoc.perl.org/perlunicode#General_Category
[8] General_Category は JavaScript、IDNA、XML など色々な仕様で構文上使える文字の集合を決定する際の基礎として使われています。