Unicode scalar value

Unicode スカラー値

[1] Unicode スカラー値 (scalar value) は、Unicode文字を表す整数値です。

[10] Unicode では UTF-16サロゲート・ペアの導入により16ビット符号単位の値の列と文字の値の列が一致しなくなっています。 「スカラー値」は UTF-16 ではなく文字についての値を意味しています。 文字がまだ割り当てられていない符号位置非文字も含まれます。

仕様書

意味

[14] Unicodeスカラー () (scalar value) は、 高サロゲート符号点低サロゲート符号点を除く Unicode符号点です。 すなわち、 [ 0, 0xD7FF ] | [ 0xE000, 0x10FFFF ] です。 >>13 D76

プロトコル

[2]

歴史

ES3 における用法

[4] ES3 仕様書では Unicode文字に対応する値の意味で「Unicode スカラー値」の語を使っています。 Unicodeスカラー値は (UTF-16 で) 複数の符号位置により表されることがあります。

[6]

The phrase "Unicode character" will be used to refer to the abstract linguistic or typographical unit represented by a single Unicode scalar value (which may be longer than 16 bits and thus may be represented by more than one code point). This only refers to entities represented by single Unicode scalar values: the components of a combining character sequence are still individual "Unicode characters," even though a user might think of the whole sequence as a single character.

HTML における用法

[9] HTML 仕様書では Unicodeスカラー値Unicode文字と同義とされています。 Unicodeスカラー値Unicode文字は、サロゲートを除く Unicode 符号位置です。

[7]

The term Unicode character is used to mean a Unicode scalar value (i.e. any Unicode code point that is not a surrogate code point). [UNICODE]

[3] Editorial: start using the Infra Standard (annevk著, ) https://github.com/whatwg/encoding/commit/a26f76889bf393999e9caad84a3647ab09c39e09

[11] Define JavaScript string and scalar value string (annevk著, ) https://github.com/whatwg/infra/commit/f1be763cfba23d2fc780b35403074c599e69616e

[12] Editorial: let code point and friends be defined by Infra (annevk著, ) https://github.com/whatwg/html/commit/59595d9c2ccadb9332c15048be5d30174532ee70