Webの文字コード

Webにおける文字コード

[2] Web ではいろいろな文字コードが使われています。

Web と文字コードの現在

[1] Web文字コード
[6] Web文字コードの関連記事

なかったことにされている Web 草創期の文字コード

[3] 現在のWebブラウザーが対応していない文字コード規格も過去には各種いろいろ使われていました。

[4] 今でも、古くから残っているウェブサイトInternet Archive でたまに見かけるのですが、残念ながら通常の Webブラウザーでは文字化けにしか見えません。

[5] Encoding Standard にないWeb文字コード

[11] 20世紀末から21世紀初頭に作られた膨大な人類の遺産が切り捨てられている現状は実に嘆かわしいものです。

[12] Internet Archive にしか残っていないようなものはさすがに仕方がないとしても、 まだ現役の普通のウェブサイトにあるページすら読めないものが出てきているのは、 本当に困ったものです。

[10] 関連: 読めなくなったファイル

Web の日本語化

[17] Dan Connolly の過去ファイルアーカイブ ( HTMLの仕様書 ) にある MarkUp.html,v によるとかつて info.cern.ch にあった HTMLの仕様書には時点で

<H2>For developers</H2>
<DL>

<DT><A
NAME="z40" HREF="http://www.ntt.jp/japan/note-on-JP/encoding.html">Japanese encoding</A>
<DD> How Japanese characters
have been encoded within HTML

NTT ウェブサイトへの参照があったようです。

[19] このリンクがいつまで残っていたのかわかりません。

[20] JPドメインの再編で URL が変わってからもしばらくは参照先の頁は残っていたようで、 >>18時点の参照が、 >>14時点の複製があります。

メモ

[21] Re: proposed registration of type 'text/html' for MIME, , https://lists.w3.org/Archives/Public/www-talk/1992NovDec/0035.html

[22] >>21 この時点で TimBLHTML は7ビットデータにしたがっていた。

[26] >>24 >>25 リンク先は残念ながら未所蔵。

[28] Internationalized HTTP?, https://groups.google.com/g/comp.infosystems.www/c/htw5XLv4Hj0/m/wPr5IAol_EIJ

[23] What is standard for cyrllic HTML ? Hebrew ? Arabic ?, https://groups.google.com/g/comp.infosystems.www.providers/c/lBJKtyujAk4/m/yRxsWMDGpZUJ

[27] WWW and cyrillic, https://groups.google.com/g/relcom.tcpip/c/dUBIIAE-MnM/m/i_YJic8dqjUJ

[8] >>7 JavaScript MIME型文字コード処理 (実装された例があるかは疑わしい)

[30] 詳しい条件は不明ながら、 Chrome はメモリー不足だと文書中から読み込むファイル (CSS など) の文字コード判定に失敗して Windows-1252 として読み込んじゃう(ことがある)っぽいなあ。