[4] CESU-8 は、 UTF-16 を UTF-8 風に符号化したものです。
本来の UTF-8 とは、サロゲートペアの扱いが異なります。
[1] 最近の Windoze のメモ帳では UTF-8 と称したもので CESU‐8
も読めるらしいです。
[2] Gecko も、 Netscape 7.1 くらいでは (生ではなく) 数値文字参照で
CESU‐8 風解釈をしてしまう不具合があるらしいです。
[3] CESU‐8 と同じものが UTF‐8S と呼ばれたこともあったようです。
(ちなみに、 UTF-32 に対応する UTF‐32S というものも。)