符号単位

16ビット符号単位

[1] UTF-16 における一つの単位 (16ビット分のビット列) のことを16ビット符号単位 (16-bit code unit) といいます。

[2] 16ビット符号単位は、

関連

[6]16ビット符号単位」は、 UTF-16 において意味を持つ最短のビット列であり、 理論上は16ビットで一つの「バイト」であると主張することも可能です。しかし実際には「バイト」 は8ビットであると考えられること、8ビットとして実装されることが多く、 従って UTF-16BEUTF-16LE の違いが存在してしまっています。

[7]16ビット符号単位」はしばしば「文字」、「符号位置」、「Unicodeスカラー値」 といった類義語と混用されます。

歴史

[8] Web Applications 1.0 r6649 Define 'code unit'. ( ( 版)) <http://html5.org/tools/web-apps-tracker?from=6648&to=6649>

[9] Character Model for the World Wide Web 1.0: Fundamentals ( ( 版)) <http://www.w3.org/TR/charmod/#def-CEF>

[10] JavaScript, aka. Web ECMAScript ( 版) <https://javascript.spec.whatwg.org/>

When this specification uses the term ECMAScript character, it means a 16-bit unsigned value used to represent a single 16-bit unit of text. [ECMASCRIPT]

[11] Define JavaScript string and scalar value string (annevk著, ) <https://github.com/whatwg/infra/commit/f1be763cfba23d2fc780b35403074c599e69616e>

[12] Editorial: let code point and friends be defined by Infra (annevk著, ) <https://github.com/whatwg/html/commit/59595d9c2ccadb9332c15048be5d30174532ee70>