符号短縮法

符号短縮法

[1] DIS10646 において、実際に使用する文字レパートリに応じて短縮した表現を用いる符号化方式を、符号短縮法 (Compaction Method) という。

[2] DIS 10646:1990 には、正規形も含めて次の形式が定義されていた。

今の UCS で言えば、4オクテット正規形が UCS-4, 2オクテット縮小形が UCS-2, 動的縮小形が SCSU 辺りに相当すると思われ。 但し、縮小形は UCS-2 とは異なり、 BMP 以外の任意の面も選択可能。

[3] 例えば、日本で使うには、 G=032, P-064 (BMP の A-nn (非漢字) と、 JIS 漢字。) の2オクテット短縮形がよい。この短縮形に移行する ISO/IEC2022エスケープ・シーケンスは、

ESC 02/05 02/15 F2 HOP HOP 032 064 (但し、 HOP = 08/01, F2 は未定の終端バイト。)

とする。

DOCS

[6] 符号短縮法を使っていても, SGCI によって他の文字呼び出しできました。