[3] UCS-2 は、 ISO/IEC 10646 BMPの符号位置を16ビット =
2バイトを単位とするバイト列として表現する文字コードでした。
[4] 当初 ISO/IEC 10646 は Unicode と同じものである UCS-2 と、
4バイトの UCS-4 の2つの符号化方式 (と UTF) を規定していました。
[5] しかし16ビット平面にすべての文字を符号化することは不可能だったため、
Unicode / UCS-2 にサロゲートペアが追加され、 UTF-16 となりました。
[6] 現在となっては UCS-2 は不適切な過去の文字コードと考えられています。
[1]
正規形式のほかに、2オクテット BMP
形式を規定する。これによって、基本多言語面は、
UCS-2 と呼ぶ2オクテットの符号化文字集合として使うことができる。
(JIS X 0221‐1:2001 5. より)
- 2オクテット BMP 形式
-
この符号化表現の形式は、基本多言語面の文字をそれぞれ
2オクテットで表現して使用できるようにする。
2オクテット BMP 形式に適合した CCデータ要素中では、
基本多言語面にある文字は、 6.2 の規定に従って、
区オクテット及び点オクテットからなる
2オクテット (すなわち、その区点要素)
で表現しなければならない。
備考 2オクテット BMP 形式を使った符号化図形文字は、
処理用として16ビットの整数型で実装してもよい。
(JIS X 0221‐1:2001 13.1)