[23]
書式は、
符号点型の1つです。
>>22 D10a
そのような符号点の
General Category
は、
Cf
,
Zl
,
Zp
のいずれかです (それらの
General Category の符号点は、すべてこの符号点型に属します)。
>>44
[6] paired stateful controls は、 最初の文字(列)と最後の文字とで組にして使います。 >>5
[12] いくつかのものは、 非推奨であり、避けるべきです。 >>5
[7] テキストのコピペや削除の操作で、 組が崩れてしまうことがあります。 理想的には元のテキストも複写した方のテキストも組が維持される形となるべきですが、 複雑な処理になることもあり、 それが行われないことや、 間違った形で行われることがあります。 >>5 相互運用性やセキュリティーの観点からも、 実装は受信データ中で組になっていない場合であってもそれなりの扱いができる必要があります。
[9] 推奨されるもののうち、 bidi 系と annotation characters は、 段落境界までで効果が終わるため、 そこそこ頑強とされます。 >>5
[10] beams and slurs in music は、 特化した音楽レイアウトソフトウェアのみに推奨されるもので、 適用範囲も限られているものです。 >>5
[13] 非推奨書式文字は、 非推奨であり、避けるべきです。 >>5
[28]
Prepended_Concatenation_Mark
:
prepended concatenation marks
(prefixed format control characters, subtending marks)
[26]
アラビア文字のうち
[ U+0600
, U+0605
],
U+06DD
,
[ U+0890
, U+0891
]
は、
おそらく後続の数字列に作用してそれらの上下にまたがってレンダリングされる性質があるために、
Cf
に分類されています。
[27]
Cf
に含まれる中でも他の状態を持つ文字や状態を変化される文字や不可視の文字とは違って、
これらは結合文字と似たような性質で、危険性は比較的低いと思われます。
[35] 関連: 二重ダイアクリティカルマーク
[34] unicode-xml に関係する記述がいくらかありますが (