ASCII互換文字符号化

ASCII互換文字符号化

[2] ASCII 互換文字符号化 (ASCII-compatible character encoding) とは、ある程度 ASCII と互換性のある文字符号化方式を表す HTML 仕様上の用語です。

仕様書

定義

[3] 単一バイトまたは可変長の符号化であって、 0x09, 0x0A, 0x0C, 0x0D, 0x20 - 0x22, 0x26, 0x27, 0x2C - 0x3F, 0x41 - 0x5A, 0x61 - 0x7A の範囲の第1バイトがすべて Windows-1252 と同じ Unicode文字を表すものをASCII互換文字符号化といいます。 >>1

[4] この定義だと ISO-2022-JPHZ-GB-2312 は ASCII 非互換のように思えますが、注釈によってこれらは ASCII 互換に含まれるとされています。

[5] 同じく注釈によると UTF-16UTF-7GSM03.38EBCDIC は非互換とされています。

[6] >>4 が含まれるなら UTF-7 も ASCII 互換に含まれていいようなものですが、 + などが条件に合致しないのでしょう。

[7] Encoding Standard の範囲では、 UTF-16 (utf-16beutf-16) と replacement 以外はすべて ASCII互換文字符号化です。

関連

[8] ACE とは無関係です。

[10] RFC 7617 は、基本認証における「US-ASCIIと互換」を、 US-ASCII文字US-ASCII文字コードと同じ1バイトに写像されるもの >>9 と定義しています。 ASCII互換文字符号化より厳しい制約です。

[11] こちらの定義でも ISO-2022-JPEUC-JPEncoding Standardshift_jisASCII互換です。 HZ-GB-2312UTF-7ASCII互換ではありません。

[12] Remove allow non-ASCII-compatible encodings flag · whatwg/html@c485b70 ( 版) <https://github.com/whatwg/html/commit/c485b70bfe41ed1302c451bc62b58df80cffd325>