document's character encoding

document.charset 属性 (DOM)

[21] Document インターフェイスcharset IDL属性characterSet IDL属性inputEncoding IDL属性は、 文書文字コードを表します。

目次

  1. 仕様書
  2. 文書の文字符号化
  3. 取得器
  4. 利用者インターフェイス
  5. 歴史

仕様書#

文書の文字符号化#

[18] 文書は、符号化 (encoding) を持ちます >>17。値は符号化です >>17

[19] 既定値は UTF-8 です >>17navigate などを通じてバイト列から文書が作られた時、 バイト列から文字列復号するために使われた符号化に設定されます。

[20] かつては文書の文字符号化と呼ばれていました。

取得器#

[15] document.characterSet, document.charset, document.inputEncoding取得器は、次のようにしなければなりません >>14

  1. [16] 文脈オブジェクト符号化名前を返します。

利用者インターフェイス#

文字コード指定メニュー

歴史#

[9] DOM水準3中核仕様書には inputEncoding の定義がありましたが、値域が明記されていませんでした。

[5] document.characterSet 特性を GeckoWebKitOpera は実装していますが、 WinIE8 は実装していません。

[6] GeckoWebKit には setter がありませんが、 Opera にはあります。

[1] Bug 380383 – [FIX]about:blank encoding is not consistent ( 版) https://bugzilla.mozilla.org/show_bug.cgi?query_format=specific&order=relevance+desc&bug_status=__open__&id=380383

[3] document.charset 特性を WinIEOperaWebKit は実装していますが、 Gecko は実装していません。

[4] WinIE8setter を実装していません。

[23] 74819 – Remove document.charset and document.defaultCharset, https://bugs.webkit.org/show_bug.cgi?id=74819

[28] 647621 - Implement document.charset, https://bugzilla.mozilla.org/show_bug.cgi?id=647621

[29] 27436 – Document.charset, , https://www.w3.org/Bugs/Public/show_bug.cgi?id=27436

[30] >>28 などによると IEaccept-charset="" を実装しておらず、 document.charset setter がその役割で使われていたそうです。

[31] i-DNS.net Main Page, , https://web.archive.org/web/20010201060300/http://i-dns.net/

[32] >>31Big5, GB 2312, Shift_JIS, EUC-KR, Windows-1256 が混在した文書です(!)。 検索フォームの select にそれらが混じっており、 onchange で選択に応じて document.charset が変更されていました。

[33] さて >>32 はどう理解するべきでしょう。あくまで検索フォームの提出用の文字コードを指定するために document.charset が使われたのでしょうか。 それとも document.charset setter によって HTML バイト列の解釈に使われる文字コードが変更され文字化けが解消されたりしていたのでしょうか。

[2] Index of /~wakaba/-temp/test/dom/document/meta ( 版) http://suika.suikawiki.org/~wakaba/-temp/test/dom/document/meta/

[7] IRC logs: freenode / #whatwg / 20130822 ( ( 版)) http://krijnhoetmer.nl/irc-logs/whatwg/20130822

[8] IRC logs: freenode / #whatwg / 20130828 ( ( 版)) http://krijnhoetmer.nl/irc-logs/whatwg/20130828#l-102

[10] Define compatibility names for encodings and document.inputEncoding · 03e1703 · whatwg/dom ( 版) https://github.com/whatwg/dom/commit/03e170351f095e4fe749e0259a3aafc0cbb49c91

[11] Add Document.prototype.charset as legacy alias of characterSet · whatwg/dom@6941936 ( 版) https://github.com/whatwg/dom/commit/6941936bd06438f84ad91d131e2e89ab0f1f7a45

[12] Fix #32: use the encoding name exposed by DOM and HTML <form> · whatwg/encoding@18bf4fa ( 版) https://github.com/whatwg/encoding/commit/18bf4fa6f005a899696800a8f6b0d20f3a4c1c0e

[13] Let the Encoding Standard deal with the canonical name · whatwg/dom@2bf4e62 ( 版) https://github.com/whatwg/dom/commit/2bf4e6273af4da39113dc27fa23dbd447329ec31

[22] Require UTF-8 (sideshowbarker著, ) https://github.com/whatwg/html/commit/fae77e3c558b9f083dfb9086752863a4789268f5

[24] Make document.open() not reset the encoding to UTF-8 (annevk著, ) https://github.com/whatwg/html/commit/fdbeb95b40d8d355549bb7f9b28647ed560a67d3