CESU-8

CESU-8

[4] CESU-8 は、 UTF-16UTF-8 風に符号化したものです。 本来の UTF-8 とは、サロゲートペアの扱いが異なります。

[1] 最近の Windoze のメモ帳では UTF-8 と称したもので CESU‐8 も読めるらしいです。

[2] Gecko も、 Netscape 7.1 くらいでは (生ではなく) 数値文字参照で CESU‐8 風解釈をしてしまう不具合があるらしいです。

[3] CESU‐8 と同じものが UTF‐8S と呼ばれたこともあったようです。 (ちなみに、 UTF-32 に対応する UTF‐32S というものも。)