block

ブロック (Unicode)

[3] Unicode におけるブロック (block) は、文字 (符号位置) が所属する符号表上の位置に基づく部分集合です。特定のブロックにはおおむね同じ用字系文字がまとめられていますが、 歴史的経緯、複数の用字系に属する句読点記号、1つのブロックに収まり切らない場合など諸々の事情によって極めて多くの例外が存在します。

仕様書

ブロック

[11] ブロック (block) は、 文字の割当を組織化するために使う符号点の名前付き範囲です。 >>35 D10b

[14] ブロックは、1つの連続した符号点範囲です。 >>35 D10b

[15] ブロックは、16進数下1桁が 0x0符号点から始まり、 0xF符号点で終わります。 >>35 D10b

[13] ブロックは互いに重なりません。すなわち、 ある符号点が複数のブロックに含まれることはありません。 >>35 D10b

ブロック名

[19] ブロック名は、固有の名前空間を持ち、 LM3 規則に従います。 >>35 D10b

[5] ブロックの名前の大文字小文字の違いは規定の一部ではなく >>2、どちらでも構わないようです。 更に比較においては空白ハイフン下線の有無も無視する >>2 とされています。

[20] Block 特性値別名もあります。 >>35 D10b

[8] Unicode の版によって大文字小文字が変わっている例もあります。

ブロックの割当

[12] ブロックの一覧は、 UCDBlocks.txt >>2 にあります。 >>35 D10b

[4] 符号位置は、特性 Blockブロックに属します。 Block規定catalog property>>35 D10b、 値は Blcoks.txt により決まります。

[16] すべての割当済文字は、何れかの定義済みのブロックに属します。 >>35 D10b

[18] 指示済符号点は、ブロックに属するものと、 そうでないものがあります。 (非文字ブロックに属さないものがあります。) >>35 D10b

[17] ブロックは、 予約済符号点を含むことがあります。 予約済符号点のみで構成されるブロックはありません。 >>35 D10b

[6] Blocks.txtブロックが明記されていない場合の既定値は No_Block です >>2, >>35 D10b

[10] Unicodeブロック

歴史

[1]

ブロック (block)
共通の特性をもつ文字の集合 (例えば、用字) が割り当てられた符号位置の連続する範囲。 ブロック同士は、重なり合わない。ブロック中には、 文字が割り当てられていない符号位置が一つ以上あってもよい。 (JIS X 0221‐1:2001 4.2)

関連

[7] ブロック符号位置の範囲によって決まるものなので、 用字系とは必ずしも一致していません。用字系を識別したい場合には、 Unicode用字系特性値用字系符号がより適切です。