UNASSIGNED

UNASSIGNED

UNASSIGNED (導出特性値)

[1] UNASSIGNED は、その符号位置Unicode未割り当てであることを表す導出特性値です。 >>2

仕様書

定義

[8] Unassigned カテゴリーの符号位置導出特性値UNASSIGNED です。

安定性

[9] UNASSIGNED だった符号位置文字が割り当てられると、他の PVALIDCONTEXTDISALLOWED導出特性値が変わります。

[10] 既存の符号位置から文字が削除されることは無いとされていますが、もしされた場合は RFC 5894 によれば DISALLOWED となるようです。

処理モデル

[11] 登録lookup も、 UNASSIGNED符号位置が含まれていれば失敗します。 これは、もし lookup だけでも認めてしまうと、将来文字が割り当てられて CONTEXT になったとき、条件によっては使用が認められないため、あるいは DISALLOWED になったとき、使用が認められないため、将来の版に対応した実装では lookup できないラベルを古い版に対応した実装では lookup できてしまい、都合が悪いからです。 >>7>>15

関連

[12] IDNA2003 では AllowUnassigned フラグがありました。通常 lookup ではこのフラグは未設定であり、 UNASSIGNED符号位置を含んでいても失敗にはなりませんでした。

メモ

[16] 既に主要な用字系Unicode に含められているので、今後追加される文字は古代文字などであって >>11 のような問題は無視できるため、未割当であっても lookup できるようにするべきという主張もあります。 しかし実際には「主要な用字系は既に含まれている」と言われ続けていますし、 現実に漢字はどんどん追加されており、その主張は成り立たないとされています。 >>15

Unassigned (カテゴリー)

[3] Unassigned は、 Unicode文字が (まだ) 割り当てられていない符号位置を含むカテゴリーです。 >>4

仕様書

定義

[5] General_CategoryCn であり、かつ Noncharacter_Code_Point に含まれない符号位置が、 Unassigned に含まれます。 >>4