[21] Document
インターフェイスの
charset
IDL属性、
characterSet
IDL属性、
inputEncoding
IDL属性は、
文書の文字コードを表します。
[18] 文書は、符号化を持ちます >>17。値は符号化です >>17。
[19] 既定値は UTF-8 です >>17。 navigate などを通じてバイト列から文書が作られた時、 バイト列から文字列に復号するために使われた符号化に設定されます。
[15] document.characterSet
,
document.charset
,
document.inputEncoding
の取得器は、次のようにしなければなりません >>14。
[9] DOM水準3中核仕様書には inputEncoding
の定義がありましたが、値域が明記されていませんでした。
[5] document.characterSet
特性を
Gecko、WebKit、Opera は実装していますが、 WinIE8 は実装していません。
[6] Gecko と WebKit には setter がありませんが、 Opera にはあります。
[1] Bug 380383 – [FIX]about:blank encoding is not consistent ( 版) https://bugzilla.mozilla.org/show_bug.cgi?query_format=specific&order=relevance+desc&bug_status=__open__&id=380383
[3]
document.charset
特性を
WinIE、Opera、WebKit は実装していますが、 Gecko は実装していません。
[4] WinIE8 は setter を実装していません。
[23] 74819 – Remove document.charset and document.defaultCharset, https://bugs.webkit.org/show_bug.cgi?id=74819
[28] 647621 - Implement document.charset, https://bugzilla.mozilla.org/show_bug.cgi?id=647621
[29] 27436 – Document.charset, , https://www.w3.org/Bugs/Public/show_bug.cgi?id=27436
[30]
>>28 などによると IE は accept-charset=""
を実装しておらず、
document.charset
setter がその役割で使われていたそうです。
[31] i-DNS.net Main Page, , https://web.archive.org/web/20010201060300/http://i-dns.net/
[32] >>31 は Big5, GB 2312, Shift_JIS, EUC-KR, Windows-1256
が混在した文書です(!)。 検索フォームの select
にそれらが混じっており、
onchange
で選択に応じて document.charset
が変更されていました。
[33] さて >>32 はどう理解するべきでしょう。あくまで検索フォームの提出用の文字コードを指定するために
document.charset
が使われたのでしょうか。
それとも document.charset
setter によって HTML バイト列の解釈に使われる文字コードが変更され文字化けが解消されたりしていたのでしょうか。
[2] Index of /~wakaba/-temp/test/dom/document/meta ( 版) http://suika.suikawiki.org/~wakaba/-temp/test/dom/document/meta/
[7] IRC logs: freenode / #whatwg / 20130822 ( ( 版)) http://krijnhoetmer.nl/irc-logs/whatwg/20130822
[8] IRC logs: freenode / #whatwg / 20130828 ( ( 版)) http://krijnhoetmer.nl/irc-logs/whatwg/20130828#l-102
[10] Define compatibility names for encodings and document.inputEncoding · 03e1703 · whatwg/dom ( 版) https://github.com/whatwg/dom/commit/03e170351f095e4fe749e0259a3aafc0cbb49c91
[11] Add Document.prototype.charset as legacy alias of characterSet · whatwg/dom@6941936 ( 版) https://github.com/whatwg/dom/commit/6941936bd06438f84ad91d131e2e89ab0f1f7a45
[12] Fix #32: use the encoding name exposed by DOM and HTML <form> · whatwg/encoding@18bf4fa ( 版) https://github.com/whatwg/encoding/commit/18bf4fa6f005a899696800a8f6b0d20f3a4c1c0e
[13] Let the Encoding Standard deal with the canonical name · whatwg/dom@2bf4e62 ( 版) https://github.com/whatwg/dom/commit/2bf4e6273af4da39113dc27fa23dbd447329ec31
[22] Require UTF-8 (sideshowbarker著, ) https://github.com/whatwg/html/commit/fae77e3c558b9f083dfb9086752863a4789268f5
[24] Make document.open() not reset the encoding to UTF-8 (annevk著, ) https://github.com/whatwg/html/commit/fdbeb95b40d8d355549bb7f9b28647ed560a67d3