UTF-8b

UTF-8b

[1] Substituting malformed UTF-8 sequences in a decoder, , https://web.archive.org/web/20090830064219/http://mail.nl.linux.org/linux-utf8/2000-07/msg00040.html

[2] PEP 383 – Non-decodable Bytes in System Character Interfaces | peps.python.org, , https://peps.python.org/pep-0383/

[3] Tanaka AkiraさんはTwitterを使っています: 「Python ではこれを surrogateescape というもので解決している。これは解釈できないバイトを Low Surrogate の一部 (DC80..DCFF) で表現する。正しい Unicode 文字列では、Low Surrogate が文字として現れることはないので、正しい文字と衝突しないし、UTF-8, UTF-16 などの表現も自然に拡張できる。」 / Twitter, , https://twitter.com/tanaka_akr/status/1660970879344599040