[3] Unicode におけるブロックは、文字 (符号位置) が所属する符号表上の位置に基づく部分集合です。特定のブロックにはおおむね同じ用字系の文字がまとめられていますが、 歴史的経緯、複数の用字系に属する句読点や記号、1つのブロックに収まり切らない場合など諸々の事情によって極めて多くの例外が存在します。
[11] ブロックは、 文字の割当を組織化するために使う符号点の名前付き範囲です。 >>35 D10b
[14] ブロックは、1つの連続した符号点の範囲です。 >>35 D10b
[15] ブロックは、16進数下1桁が 0x0 の符号点から始まり、 0xF の符号点で終わります。 >>35 D10b
[13] ブロックは互いに重なりません。すなわち、 ある符号点が複数のブロックに含まれることはありません。 >>35 D10b
[19] ブロック名は、固有の名前空間を持ち、 LM3 規則に従います。 >>35 D10b
[5] ブロックの名前の大文字と小文字の違いは規定の一部ではなく >>2、どちらでも構わないようです。 更に比較においては空白、ハイフン、下線の有無も無視する >>2 とされています。
[12] ブロックの一覧は、
UCD の
Blocks.txt
>>2
にあります。
>>35 D10b
[4] 符号位置は、特性 Block
のブロックに属します。
Block
は規定の
catalog property
で >>35 D10b、
値は Blcoks.txt
により決まります。
[16] すべての割当済文字は、何れかの定義済みのブロックに属します。 >>35 D10b
[18] 指示済符号点は、ブロックに属するものと、 そうでないものがあります。 (非文字にブロックに属さないものがあります。) >>35 D10b
[17] ブロックは、 予約済符号点を含むことがあります。 予約済符号点のみで構成されるブロックはありません。 >>35 D10b
[6]
Blocks.txt
にブロックが明記されていない場合の既定値は
No_Block
です >>2, >>35 D10b。
- ブロック (block)
- 共通の特性をもつ文字の集合 (例えば、用字) が割り当てられた符号位置の連続する範囲。 ブロック同士は、重なり合わない。ブロック中には、 文字が割り当てられていない符号位置が一つ以上あってもよい。 (JIS X 0221‐1:2001 4.2)
[7] ブロックは符号位置の範囲によって決まるものなので、 用字系とは必ずしも一致していません。用字系を識別したい場合には、 Unicode用字系特性値や用字系符号がより適切です。