ASCII

ASCII (文字コード)

[22] ASCII は、かつて米国で広く用いられた符号化文字集合でした。

仕様書

RFC 20

[3] RFC 20 は、 USAS X3, 4-1968 を添付しています。

[5] RFC 20 自体は、 ASCII7ビット符号ですが、最上位ビットを常に0とした8ビット符号として使用することを提案しています。

[18] IETF 等には、無料で入手できない本来の US-ASCII ではなく RFC 20 を参照するのが望ましいと強硬に主張する人がいます。

TELNET ASCII

[24]

US-ASCII (IANA charset)

RFC 2046 (MIME) 4.1.2 の定義

[1]

ISO/IEC 646の版ISO/IEC 2022符号拡張法を使う場合は、 適切な札付けする必要があります。 (ということなので、つまり US-ASCII で符号拡張法は使えません。)

[12] US-ASCII が表すものには歴史的に混乱と曖昧性がありましたが、 MIMEUS-ASCII は任意の7ビット文字コードではなく、 ANSI X4.3-1986 US-ASCII 符号化文字集合を指しています。 IRV 以外のISO/IEC 646の版符号拡張法右半面多バイトを使うものは、 US-ASCII ではありません。 >>11

[13] charsetASCII は予約されており、いかなる目的でも使ってはなりません >>11

[14] しかし IANA登録簿では US-ASCII の別名となっているわけですが。。。

[15] MIME で定義されていたり de facto の意味を持つとされている制御文字は、 CRLF, FF, TAB (HT) だけです。 他の CL の制御文字と DEL は、 text/plain 以外の媒体型でその用法を規定している場合及び情報交換の当事者間の合意がある場合に限って意味を持ちます。 >>11

text/* の charset の既定値

[2] MIME の規定によれば、 text/* 媒体型の charset 引数が省略された時の既定値は US-ASCII です。

これは、 MIME を作った時に、米国のインターネットで普通に利用されていたものをそのまま既定値にしただけです。

(そしてそれは RFC 822 の規定に整合していますが、 当時の慣習には必ずしも一致しません。欧州や亜細亜では 8ビット化や ESC による符号拡張を使う、 RFC 822 の拡張版 (厳密に言うと、 RFC 822 は ESC による符号拡張を使うとも使わないとも言っていないので拡張とは呼ばないかもしれません。) が使われていました。)

文字集合としての ASCII

[16]ASCII」というとき、本来の符号化文字集合としての ASCII ではなく、 ASCII で規定された94文字ないし128文字の文字集合を指していることもあります。

[17] 例えば、 UnicodeU+0000-U+007F、 あるいは U+0020-U+007E のことを、 ASCII文字と言うことがあります。

[25] この意味での ASCII については、 ASCII文字を参照。

[23] ASCIIアート (AA) のように、 ASCII が本来の意味を離れて文字一般を表していることすらあります。

Web における ASCII

[19] 符号化ラベル asciius-ascii は、 (その超集合である) windows-1252 の別名として解釈されます。

[20] そもそも7ビット符号である US-ASCII8ビット符号として使われた時、 右半面は (著者は使ってはいけないのですが、受信した実装が) どう解釈するべきか明確でありませんでした。そのため実装は様々で、 中には最上位ビットを無視する (セキュリティー的に問題ある) ものもありました。

メモ

[6] Rich Salz on Twitter: "Better late than never: IESG is going to declare RFC 20 standards-track. http://t.co/fn0SiyMx0m Yes, 20. 7-bit ASCII." ( ( 版)) <https://twitter.com/RichSalz/status/542040814093086721>

[7] Mail Archive Sign in STD 80, RFC 20 on ASCII format for network interchange ( 版) <https://mailarchive.ietf.org/arch/msg/ietf-announce/rlIsY8yvvKhbkbkuk2mcQ-ylSNw>

[8] ( 版) <http://www.ecma-international.org/publications/files/ECMA-ST-WITHDRAWN/Ecma%20philosophy%20on%20codes.pdf>

[9] ( 版) <http://www.ecma-international.org/publications/files/ECMA-ST-WITHDRAWN/ECMA-7,%201st%20Edition,%20April%201965.pdf>

[10] ( 版) <http://trafficways.org/ascii/ascii.pdf>

[21] RFC 959 - File Transfer Protocol ( ()) <https://tools.ietf.org/html/rfc959#page-3>

ASCII

The ASCII character set is as defined in the ARPA-Internet

Protocol Handbook. In FTP, ASCII characters are defined to be

the lower half of an eight-bit code set (i.e., the most

significant bit is zero).

[26] Improve representation guidelines for bytes and code points (annevk著, ) <https://github.com/whatwg/infra/commit/543b2c48b6e1babb50d77e5a3ba5b86be8b56eb9>

[27] KADOKAWA アスキー事業の移管について|株式会社KADOKAWAのプレスリリース () <https://prtimes.jp/main/html/rd/p/000004239.000007006.html>