2オクテット符号化表現

UCS-2

[3] UCS-2 は、 ISO/IEC 10646 BMP符号位置を16ビット = 2バイトを単位とするバイト列として表現する文字コードでした。

[4] 当初 ISO/IEC 10646Unicode と同じものである UCS-2 と、 4バイトの UCS-4 の2つの符号化方式 (と UTF) を規定していました。

[5] しかし16ビット平面にすべての文字符号化することは不可能だったため、 Unicode / UCS-2サロゲートペアが追加され、 UTF-16 となりました。

[6] 現在となっては UCS-2 は不適切な過去の文字コードと考えられています。

[1]

正規形式のほかに、2オクテット BMP 形式を規定する。これによって、基本多言語面は、 UCS-2 と呼ぶ2オクテットの符号化文字集合として使うことができる。 (JIS X 0221‐1:2001 5. より)

2オクテット BMP 形式
この符号化表現の形式は、基本多言語面の文字をそれぞれ 2オクテットで表現して使用できるようにする。

2オクテット BMP 形式に適合した CCデータ要素中では、 基本多言語面にある文字は、 6.2 の規定に従って、 オクテット及びオクテットからなる 2オクテット (すなわち、その区点要素) で表現しなければならない。

備考 2オクテット BMP 形式を使った符号化図形文字は、 処理用として16ビットの整数型で実装してもよい。 (JIS X 0221‐1:2001 13.1)

[2] RFC 3650 - Handle System Overview () <https://tools.ietf.org/html/rfc3650>

Handles may consist of any printable characters from the Universal

Character Set (UCS-2) of ISO/IEC 10646, which is the exact character

set defined by Unicode v3.0 [17]. The UCS-2 character set

encompasses most characters used in every major language written

today. To allow compatibility with most of the existing systems and

to prevent ambiguity among different encodings, the Handle System

protocol mandates UTF-8 to be the only encoding used for handles.