[22] ASCII は、かつて米国で広く用いられた符号化文字集合でした。
[3] RFC 20 は、 USAS X3, 4-1968 を添付しています。
[5] RFC 20 自体は、 ASCII は7ビット符号ですが、最上位ビットを常に0とした8ビット符号として使用することを提案しています。
[18] IETF 等には、無料で入手できない本来の US-ASCII ではなく RFC 20 を参照するのが望ましいと強硬に主張する人がいます。
[40]
JOSE
は
ASCII(STRING)
という関数風の記法で仕様を記述しています。
>>30, >>39, >>41, >>29
[43] Correct classification of RFC 20 (ASCII format) to Internet Standard, https://datatracker.ietf.org/doc/status-change-rfc20-ascii-format-to-standard/
[6] Rich Salz on Twitter: "Better late than never: IESG is going to declare RFC 20 standards-track. http://t.co/fn0SiyMx0m Yes, 20. 7-bit ASCII." ( ( 版)) https://twitter.com/RichSalz/status/542040814093086721
[7] Mail Archive Sign in STD 80, RFC 20 on ASCII format for network interchange ( 版) https://mailarchive.ietf.org/arch/msg/ietf-announce/rlIsY8yvvKhbkbkuk2mcQ-ylSNw
ISO/IEC 646の版や ISO/IEC 2022
の符号拡張法を使う場合は、
適切な札付けする必要があります。 (ということなので、つまり
US-ASCII
で符号拡張法は使えません。)
[12] US-ASCII が表すものには歴史的に混乱と曖昧性がありましたが、
MIME の US-ASCII
は任意の7ビット文字コードではなく、
ANSI X4.3-1986 US-ASCII 符号化文字集合を指しています。
IRV 以外のISO/IEC 646の版や符号拡張法、右半面や多バイトを使うものは、
US-ASCII
ではありません。 >>11
[13] charset 名 ASCII
は予約されており、いかなる目的でも使ってはなりません
>>11。
[15] MIME で定義されていたり de facto の意味を持つとされている制御文字は、 CRLF
, FF
,
TAB
(HT
) だけです。
他の CL の制御文字と DEL
は、
text/plain
以外の媒体型でその用法を規定している場合及び情報交換の当事者間の合意がある場合に限って意味を持ちます。
>>11
[2] MIME の規定によれば、 text/*
媒体型の charset
引数が省略された時の既定値は
US-ASCII
です。
これは、 MIME を作った時に、米国のインターネットで普通に利用されていたものをそのまま既定値にしただけです。
(そしてそれは RFC 822 の規定に整合していますが、
当時の慣習には必ずしも一致しません。欧州や亜細亜では
8ビット化や ESC
による符号拡張を使う、
RFC 822 の拡張版 (厳密に言うと、 RFC 822 は ESC
による符号拡張を使うとも使わないとも言っていないので拡張とは呼ばないかもしれません。) が使われていました。)
[16] 「ASCII」というとき、本来の符号化文字集合としての ASCII ではなく、 ASCII で規定された94文字ないし128文字の文字集合を指していることもあります。
[17] 例えば、 Unicode の U+0000
-U+007F
、
あるいは U+0020
-U+007E
のことを、
ASCII文字と言うことがあります。
[23] ASCIIアート (AA) のように、 ASCII が本来の意味を離れて文字一般を表していることすらあります。
[19] 符号化ラベル ascii
や us-ascii
は、
(その超集合である) windows-1252
の別名として解釈されます。
[20] そもそも7ビット符号である US-ASCII が8ビット符号として使われた時、 右半面は (著者は使ってはいけないのですが、受信した実装が) どう解釈するべきか明確でありませんでした。そのため実装は様々で、 中には最上位ビットを無視する (セキュリティー的に問題ある) ものもありました。
[28] ASCII符号化とASCII復号は、仕様書上のアルゴリズムとして定義されています。 単独の文字コードとしての利用はできません。
[8] ( 版) http://www.ecma-international.org/publications/files/ECMA-ST-WITHDRAWN/Ecma%20philosophy%20on%20codes.pdf
[9] ( 版) http://www.ecma-international.org/publications/files/ECMA-ST-WITHDRAWN/ECMA-7,%201st%20Edition,%20April%201965.pdf
[10] ( 版) http://trafficways.org/ascii/ascii.pdf
[26] Improve representation guidelines for bytes and code points (annevk著, ) https://github.com/whatwg/infra/commit/543b2c48b6e1babb50d77e5a3ba5b86be8b56eb9
[36] Federal Information Processing Standards Publication: code for information interchange - fipspub1-2-1977.pdf, , https://nvlpubs.nist.gov/nistpubs/Legacy/FIPS/fipspub1-2-1977.pdf
[37] Federal Information Processing Standards Publication: for bit sequencing of the American national standard code for information interchange in serial-by-bit data transmission - fipspub16-1.pdf, , https://nvlpubs.nist.gov/nistpubs/Legacy/FIPS/fipspub16-1.pdf
[38] Federal Information Processing Standards Publication: subsets of the standard code for information interchange - fipspub15.pdf, , https://nvlpubs.nist.gov/nistpubs/Legacy/FIPS/fipspub15.pdf
US-ASCII
の別名となっているわけですが。。。