単一バイト符号化

単一バイト符号化

[2] 単一バイト符号化 (single-byte encoding) は、 すべての文字1バイトで表される文字コードです。

[3] かつて欧米を中心によく用いられていました。

仕様書

Web における単一バイト符号化

[18] Encoding Standard の規定する符号化の多数は、 単一バイト符号化 (single-byte encoding) です。単一バイト符号化においては、 ASCIIバイトASCII文字に対応関係があり、 非ASCIIバイト非ASCII文字が割り当てられています。

[22] 非ASCIIバイト非ASCII文字の対応関係は、 Encoding Standard で変換表が定義されています。

[19] 非ASCIIバイトのいくつかにはどのUnicode符号位置も割り当てられていない場合があります。 そのようなバイトが現れたら、複合器誤りモードに従い U+FFFD と解釈するか、誤りを返します。

[20] 当然ながら、 Unicode符号位置の大多数は単一バイト符号化で表現できません。 そのような符号位置が現れたら、符号位置誤りモードに従い文字参照を出力するか、 誤りを返します。文字参照はすべてASCII文字で表せます。

[23] ISO-8859-8-IISO-8859-8 は同じものですが、 レンダリングで違って処理されることになっています。 Encoding Standard では ISO-8859-8-I 専用の変換表がなく、 ISO-8859-8 のものを使うことになっています。

[21] x-user-defined は、構造上は単一バイト符号化ですが、 Encoding Standard では変換表ではなくアルゴリズム的に変換する別種の符号化として扱っています。

[24] 単一バイト符号化の一覧

[4] かつてはその他の単一バイト符号化も用いられていましたが、 現在では禁止されています。 Encoding Standard