[3] [[Unicode]] における[DFN[[RUBYB[[[ブロック]]]@en[block]]]]は、[[文字]] ([[符号位置]])
が所属する[[符号表]]上の位置に基づく部分集合です。特定の[[ブロック]]にはおおむね同じ[[用字系]]の[[文字]]がまとめられていますが、
歴史的経緯、複数の[[用字系]]に属する[[句読点]]や[[記号]]、1つの[[ブロック]]に収まり切らない場合など諸々の事情によって極めて多くの例外が存在します。

* 仕様書

[REFS[
- [35] [CITE[[[The Unicode Standard]], Version 13.0 - ch03.pdf]], [TIME[2020-03-09T17:53:34.000Z]], [TIME[2020-12-20T02:08:18.239Z]] <https://www.unicode.org/versions/latest/ch03.pdf#G2212>
- [2] <http://unicode.org/Public/UCD/latest/ucd/Blocks.txt>
- [9] [CITE@en-us[UAX #44: Unicode Character Database]], [TIME[2020-03-06T22:23:11.000Z]], [TIME[2020-10-21T06:24:49.510Z]] <https://www.unicode.org/reports/tr44/#Default_Values_Table>
]REFS]

* ブロック

[11] 
[DFN[[RUBYB[ブロック][block]]]]は、
[[文字]]の割当を組織化するために使う[[符号点]]の名前付き[[範囲]]です。
[SRC[>>35 D10b]]

[14] 
[[ブロック]]は、1つの連続した[[符号点]]の[[範囲]]です。
[SRC[>>35 D10b]]

[15] 
[[ブロック]]は、16進数下1桁が [N[0x0]] の[[符号点]]から始まり、
[N[0xF]] の[[符号点]]で終わります。
[SRC[>>35 D10b]]


[13] 
[[ブロック]]は互いに重なりません。すなわち、
ある[[符号点]]が複数の[[ブロック]]に含まれることはありません。
[SRC[>>35 D10b]]

* ブロック名

[19] 
[[ブロック]]名は、固有の[[名前空間]]を持ち、
[[LM3]]
規則に従います。
[SRC[>>35 D10b]]


[5] [[ブロック]]の名前の[[大文字]]と[[小文字]]の違いは[[規定]]の一部ではなく [SRC[>>2]]、どちらでも構わないようです。
更に[[比較]]においては[[空白]]、[[ハイフン]]、[[下線]]の有無も無視する [SRC[>>2]] とされています。

[20] [CODE[Block]] [[特性値][文字特性]]の[[別名]]もあります。
[SRC[>>35 D10b]]

[8] [[Unicode]] の版によって[[大文字]]と[[小文字]]が変わっている例もあります。

* ブロックの割当

[12] [[ブロック]]の一覧は、
[[UCD]] の 
[CODE[Blocks.txt]] [SRC[>>2]]
にあります。
[SRC[>>35 D10b]]

[4] [[符号位置]]は、[[特性][文字特性]] [DFN[[CODE[Block]]]]
の[[ブロック]]に属します。
[CODE[Block]]
は[[規定]]の
[[catalog property]]
で [SRC[>>35 D10b]]、
値は [CODE[Blcoks.txt]] により決まります。


[16] 
すべての[[割当済文字]]は、何れかの定義済みの[[ブロック]]に属します。
[SRC[>>35 D10b]]

[18] 
[[指示済符号点]]は、[[ブロック]]に属するものと、
そうでないものがあります。
([[非文字]]に[[ブロック]]に属さないものがあります。)
[SRC[>>35 D10b]]


[17] 
[[ブロック]]は、
[[予約済符号点]]を含むことがあります。
[[予約済符号点]]のみで構成される[[ブロック]]はありません。
[SRC[>>35 D10b]]


[6] 
[CODE[Blocks.txt]]
に[[ブロック]]が明記されていない場合の既定値は
[DFN[[CODE[[[No_Block]]]]]]
です [SRC[>>2, >>35 D10b]]。


[FIG(short list)[ [10] [[Unicode]] の[[ブロック]]
- [[High Surrogates]]
- [[High Private Use Surrogates]]
- [[Low Surrogates]]
- [[Specials]]
]FIG]

* 歴史

> 
[1]
: ブロック (block) :
共通の[[特性]]をもつ[[文字]]の集合 (例えば、[[用字]])
が割り当てられた[[符号位置]]の連続する範囲。
ブロック同士は、重なり合わない。ブロック中には、
文字が割り当てられていない符号位置が一つ以上あってもよい。
([[JIS X 0221]]‐1:2001 4.2)

* 関連

[7] [[ブロック]]は[[符号位置]]の範囲によって決まるものなので、
[[用字系]]とは必ずしも一致していません。[[用字系]]を識別したい場合には、
[[Unicode用字系特性値]]や[[用字系符号]]がより適切です。
