[3] 現在のWebブラウザーが対応していない文字コード規格も過去には各種いろいろ使われていました。
[4] 今でも、古くから残っているウェブサイトや Internet Archive でたまに見かけるのですが、残念ながら通常の Webブラウザーでは文字化けにしか見えません。
[11] 20世紀末から21世紀初頭に作られた膨大な人類の遺産が切り捨てられている現状は実に嘆かわしいものです。
[12] Internet Archive にしか残っていないようなものはさすがに仕方がないとしても、 まだ現役の普通のウェブサイトにあるページすら読めないものが出てきているのは、 本当に困ったものです。
[10] 関連: 読めなくなったファイル
[17]
Dan Connolly の過去ファイルアーカイブ (MarkUp.html,v
によるとかつて info.cern.ch
にあった HTMLの仕様書には時点で
<H2>For developers</H2> <DL> <DT><A NAME="z40" HREF="http://www.ntt.jp/japan/note-on-JP/encoding.html">Japanese encoding</A> <DD> How Japanese characters have been encoded within HTML
と NTT ウェブサイトへの参照があったようです。
[19] このリンクがいつまで残っていたのかわかりません。
[20] JPドメインの再編で URL が変わってからもしばらくは参照先の頁は残っていたようで、 >>18 に時点の参照が、 >>14 に時点の複製があります。
[21] Re: proposed registration of type 'text/html' for MIME, , https://lists.w3.org/Archives/Public/www-talk/1992NovDec/0035.html
[22] >>21 この時点で TimBL は HTML は7ビットデータにしたがっていた。
[28] Internationalized HTTP?, https://groups.google.com/g/comp.infosystems.www/c/htw5XLv4Hj0/m/wPr5IAol_EIJ
[23] What is standard for cyrllic HTML ? Hebrew ? Arabic ?, https://groups.google.com/g/comp.infosystems.www.providers/c/lBJKtyujAk4/m/yRxsWMDGpZUJ
[27] WWW and cyrillic, https://groups.google.com/g/relcom.tcpip/c/dUBIIAE-MnM/m/i_YJic8dqjUJ
[8] >>7 JavaScript MIME型の文字コード処理 (実装された例があるかは疑わしい)
[30] 詳しい条件は不明ながら、 Chrome はメモリー不足だと文書中から読み込むファイル (CSS など) の文字コード判定に失敗して Windows-1252 として読み込んじゃう(ことがある)っぽいなあ。