単一バイト符号化

[2] 単一バイト符号化 (single-byte encoding) は、すべての文字が1バイトで表される文字コードです。

[3] かつて欧米を中心によく用いられていました。

仕様書

[18] Encoding Standard の規定する符号化の多数は、単一バイト符号化 (single-byte encoding) です。単一バイト符号化においては、 ASCIIバイトとASCII文字に対応関係があり、非ASCIIバイトに非ASCII文字が割り当てられています。

[22] 非ASCIIバイトと非ASCII文字の対応関係は、 Encoding Standard で変換表が定義されています。

[19] 非ASCIIバイトのいくつかにはどのUnicode符号位置も割り当てられていない場合があります。そのようなバイトが現れたら、複合器は誤りモードに従い U+FFFD と解釈するか、誤りを返します。

[20] 当然ながら、 Unicode符号位置の大多数は単一バイト符号化で表現できません。そのような符号位置が現れたら、符号位置は誤りモードに従い文字参照を出力するか、誤りを返します。文字参照はすべてASCII文字で表せます。

[23] ISO-8859-8-I と ISO-8859-8 は同じものですが、レンダリングで違って処理されることになっています。 Encoding Standard では ISO-8859-8-I 専用の変換表がなく、 ISO-8859-8 のものを使うことになっています。

[21] x-user-defined は、構造上は単一バイト符号化ですが、 Encoding Standard では変換表ではなくアルゴリズム的に変換する別種の符号化として扱っています。

[4] かつてはその他の単一バイト符号化も用いられていましたが、現在では禁止されています。 Encoding Standard