本項は歴史的事項を説明しています。本項の内容の一部または全部は、現在の状況とは異なるかもしれません。
(なお本項の内容の一部または全部は、互換性または歴史的連続性のために現在も有効な場合もあります。しかし新たに利用することは避けるべきです。)
[3] UCS-2 は、 ISO/IEC 10646 BMPの符号位置を16ビット = 2バイトを単位とするバイト列として表現する文字コードでした。
[4] 当初 ISO/IEC 10646 は Unicode と同じものである UCS-2 と、 4バイトの UCS-4 の2つの符号化方式 (と UTF) を規定していました。
[5] しかし16ビット平面にすべての文字を符号化することは不可能だったため、 Unicode / UCS-2 にサロゲートペアが追加され、 UTF-16 となりました。
[6] 現在となっては UCS-2 は不適切な過去の文字コードと考えられています。
正規形式のほかに、2オクテット BMP 形式を規定する。これによって、基本多言語面は、 UCS-2 と呼ぶ2オクテットの符号化文字集合として使うことができる。 (JIS X 0221‐1:2001 5. より)
2オクテット BMP 形式に適合した CCデータ要素中では、 基本多言語面にある文字は、 6.2 の規定に従って、 区オクテット及び点オクテットからなる 2オクテット (すなわち、その区点要素) で表現しなければならない。
備考 2オクテット BMP 形式を使った符号化図形文字は、 処理用として16ビットの整数型で実装してもよい。 (JIS X 0221‐1:2001 13.1)
Handles may consist of any printable characters from the Universal
Character Set (UCS-2) of ISO/IEC 10646, which is the exact character
set defined by Unicode v3.0 [17]. The UCS-2 character set
encompasses most characters used in every major language written
today. To allow compatibility with most of the existing systems and
to prevent ambiguity among different encodings, the Handle System
protocol mandates UTF-8 to be the only encoding used for handles.