format character

書式制御文字

仕様書

書式

[23] 書式 (しょしき) (Format) は、 符号点型の1つです。 >>22 D10a そのような符号点General Category は、 Cf, Zl, Zp のいずれかです (それらの General Category符号点は、すべてこの符号点型に属します)。 >>44

書式制御文字

[1] 書式制御文字 (format control character) は、 Unicode文字の種類の1つです。

[3] 書式制御文字

paired stateful controls

[6] paired stateful controls は、 最初 (initiating) の文字(列)と最後 (terminating) の文字とで組にして使います。 >>5

[8] 推奨 (recommended) されるもの >>5

[12] いくつかのものは、 非推奨 (deprecated) であり、避けるべき (should) です。 >>5

[11] 非推奨 (deprecated) のもの >>5

[7] テキストコピペ削除の操作で、 組が崩れてしまうことがあります。 理想的には元のテキストも複写した方のテキストも組が維持される形となるべきですが、 複雑な処理になることもあり、 それが行われないことや、 間違った形で行われることがあります。 >>5 相互運用性セキュリティーの観点からも、 実装は受信データ中で組になっていない場合であってもそれなりの扱いができる必要があります。

[9] 推奨されるもののうち、 bidi 系と annotation characters は、 段落境界までで効果が終わるため、 そこそこ頑強とされます。 >>5

[10] beams and slurs in music は、 特化した音楽レイアウトソフトウェアのみに推奨されるもので、 適用範囲も限られているものです。 >>5

[14] タグ文字テキストの移動操作で壊れやすいです。 >>5

非推奨書式文字

[13] 非推奨書式文字 (deprecated format character) は、 非推奨 (deprecated) であり、避けるべき (should) です。 >>5

[16] 非推奨書式文字

Arabic subtending or supertending marks

[28] Prepended_Concatenation_Mark: prepended concatenation marks (prefixed format control characters, subtending marks)

[26] アラビア文字のうち [ U+0600, U+0605 ], U+06DD, [ U+0890, U+0891 ] は、 おそらく後続の数字列に作用してそれらの上下にまたがってレンダリングされる性質があるために、 Cf に分類されています。

[27] Cf に含まれる中でも他の状態を持つ文字や状態を変化される文字や不可視の文字とは違って、 これらは結合文字と似たような性質で、危険性は比較的低いと思われます。

[33] アラビア文字の他にもいくつかあります。 >>32

[35] 関連: 二重ダイアクリティカルマーク

セキュリティー

文字のセキュリティー

関連

[2] 制御文字とは異なります。

[4] CGJ書式制御文字ではありません。

[34] unicode-xml に関係する記述がいくらかありますが ( XMLにおける文字 )、 情報が古くて不完全です。あまり役に立ちません。

メモ