<html xmlns="http://www.w3.org/1999/xhtml"><head></head><body><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="3" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[3]</anchor-end> <dfn>UCS-2</dfn> は、 <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">ISO/IEC 10646</anchor> <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">BMP<title xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:10:">基本多言語面</title></anchor>の<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">符号位置</anchor>を16ビット =
2バイトを単位とする<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">バイト列</anchor>として表現する<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">文字コード</anchor>でした。</p><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="4" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[4]</anchor-end> 当初 <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">ISO/IEC 10646</anchor> は <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">Unicode</anchor> と同じものである <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">UCS-2</anchor> と、
4バイトの <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">UCS-4</anchor> の2つの<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">符号化方式</anchor> (と <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">UTF</anchor>) を規定していました。</p><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="5" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[5]</anchor-end> しかし16ビット平面にすべての<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">文字</anchor>を<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">符号化</anchor>することは不可能だったため、
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">Unicode</anchor> / <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">UCS-2</anchor> に<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">サロゲートペア</anchor>が追加され、 <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">UTF-16</anchor> となりました。</p><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="6" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[6]</anchor-end> 現在となっては <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">UCS-2</anchor> は不適切な過去の<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">文字コード</anchor>と考えられています。</p><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="1" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[1]</anchor-end> </p><blockquote><p><anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">正規形式</anchor>のほかに、2オクテット <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">BMP</anchor>
形式を規定する。これによって、<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">基本多言語面</anchor>は、
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">UCS-2</anchor> と呼ぶ2オクテットの<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">符号化文字集合</anchor>として使うことができる。
(<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">JIS X 0221</anchor>‐1:2001 5. より)</p></blockquote><blockquote><dl><dt>2オクテット BMP 形式</dt><dd>
この<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">符号化表現</anchor>の形式は、基本多言語面の<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">文字</anchor>をそれぞれ
2オクテットで表現して使用できるようにする。</dd></dl><p>2オクテット BMP 形式に適合した <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">CCデータ要素</anchor>中では、
基本多言語面にある文字は、 6.2 の規定に従って、
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">区</anchor>オクテット及び<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">点</anchor>オクテットからなる
2オクテット (すなわち、その<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">区点要素</anchor>)
で表現しなければならない。</p><p>備考 2オクテット BMP 形式を使った<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">符号化図形文字</anchor>は、
処理用として16ビットの<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">整数型</anchor>で実装してもよい。
(JIS X 0221‐1:2001 13.1)</p></blockquote><figure class="quote"><figcaption><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="2" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[2]</anchor-end> <cite xml:lang="en">RFC 3650 - Handle System Overview</cite>
(<time>2016-11-06 20:54:06 +09:00</time>)
<anchor-external xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:resScheme="URI" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:resParameter="https://tools.ietf.org/html/rfc3650">https://tools.ietf.org/html/rfc3650</anchor-external></figcaption><blockquote><p>Handles may consist of any printable characters from the Universal</p><p>Character Set (UCS-2) of ISO/IEC 10646, which is the exact character</p><p>set defined by Unicode v3.0 <strong>[</strong>17<strong>]</strong>.  The UCS-2 character set</p><p>encompasses most characters used in every major language written</p><p>today.  To allow compatibility with most of the existing systems and</p><p>to prevent ambiguity among different encodings, the Handle System</p><p>protocol mandates UTF-8 to be the only encoding used for handles.</p></blockquote></figure></body></html>