CESU-8

本項は歴史的事項を説明しています。本項の内容の一部または全部は、現在の状況とは異なるかもしれません。

(なお本項の内容の一部または全部は、互換性または歴史的連続性のために現在も有効な場合もあります。しかし新たに利用することは避けるべきです。)

CESU-8

[4] CESU-8 は、 UTF-16UTF-8 風に符号化したものです。 本来の UTF-8 とは、サロゲートペアの扱いが異なります。

[1] 最近の Windoze のメモ帳では UTF-8 と称したもので CESU‐8 も読めるらしいです。

[2] Gecko も、 Netscape 7.1 くらいでは (生ではなく) 数値文字参照で CESU‐8 風解釈をしてしまう不具合があるらしいです。

[3] CESU‐8 と同じものが UTF‐8S と呼ばれたこともあったようです。 (ちなみに、 UTF-32 に対応する UTF‐32S というものも。)