一般カテゴリー

General_Category (Unicode)

[5] UnicodeGeneral_Category は、 符号位置の一般的な分類です。 すべての符号位置letter記号などに分類されています。

仕様書

[7] 分類の意味は >>1 を、実際の分類は >>4 を見ると良いです。

定義

[3] General_CategoryUnicodeData.txt で定義されています。また DerivedGeneralCategory.txt にも収録されています (こちらの方が使いやすいかもしれません)。

[13] ファイルに記述されていないときの既定値は、 Cn です。

[21] 特性値の別名 >>20

私用文字

[15] 私用文字については、 私的な同意に基づき独自の値と解することが出来ます。 General_Category から導出される特性も同様です。 私用文字

安定性

[10] 値の集合 (分類の種類) は変更されることはありませんが、符号位置に対する値 (分類) は変更される可能性があります >>9

正規表現

[17] \p >>16

[18] 1文字目、全体、特別な値として Any, Assigned, ASCII >>16

[19] perlunicode - Unicode support in Perl - Perldoc Browser, https://perldoc.perl.org/perlunicode#General_Category

UCD別名に加えて L&

関連

[8] General_CategoryJavaScriptIDNAXML など色々な仕様で構文上使える文字の集合を決定する際の基礎として使われています。

メモ