[55] charset は、文字コードを表す短い識別子 (によって表される文字コード) です。
A charset is a method of mapping a sequence of octets to a sequence of abstract characters. A charset is, in effect, a combination of one or more CCSs with a CES. Charset names are registered by the IANA according to procedures documented in [RFC2278]. <NONE>
Many protocol definitions use the term "character set" in their descriptions. The terms "charset" or "character encoding scheme" are strongly preferred over the term "character set" because "character set" has other definitions in other contexts and this can be confusing.
[916] HTTP においては、 charset名は字句で、大文字・小文字不区別とされています >>846。
[116] MIME/HTTP で使われる媒体型の charset
引数の指定方法では、引数値は他の引数同様に
value
です。つまり、 token
または quoted-string
を1つ使って指定できます。
例:
(すべて等価)
[117] WinIE6 は引用符があるものに対応していないみたいです。
簡単な傍証:
charset=iso-8859-1
の実体を表示charset=iso-2022-jp
の実体を表示charset="iso-2022-jp"
の実体を表示引用符をつけていると見事に化けます。
もちろんこのような杜撰な実装は規格不適合です。
[75] MIME では、 RFC 2231 で拡張された引数の値の構文で登録された IANA charset 名を使うことができるとされています。
char は文字 character の略として業界(どこ)では頻用される語句です。 set はその通りセットですが、数学の set と同じ(ような)意味で、 正統的(謎)には集合と訳します。
ですから、そのまま解釈すると文字集合ということになります。
しかし、この辺の用語の混乱は激しくて、大抵は単なる文字の集合 のことだけではなくて、その文字の集合に数字を割り振ったものとか、 その数字と計算機上の表現の対応の定義とか、そういう (文字を計算機で扱うのに必要な) 余計な色々までひっくるめて、 charset と呼びます。
MIME が定義する charset が、一番有名でしょう。
RFC 2045 〜 2049 には charset という語の定義は出てきませんが、 "charset" parameter は文字集合 character set を示すパラメーター らしいので、 character set = charset と考えて良いと思われます、
The term "character set" is used in MIME to refer to a method of converting a sequence of octets into a sequence of characters. Note that unconditional and unambiguous conversion in the other direction is not required, in that not all characters may be representable by a given character set and a character set may provide more than one sequence of octets to represent a particular sequence of characters.
用語「character set」 「文字集合」 は MIME ではオクテット列を 文字列に変換する方法を表します。なお、逆方向への無条件かつ曖昧でない 変換は必須ではありません。全ての文字が当該文字集合で表現可能でない かもしれませんし、その文字集合で特定の文字列を表現するのに 複数のオクテット列が使えても構いません。
This definition is intended to allow various kinds of character encodings, from simple single-table mappings such as US-ASCII to complex table switching methods such as those that use ISO 2022's techniques, to be used as character sets. However, the definition associated with a MIME character set name must fully specify the mapping to be performed. In particular, use of external profiling information to determine the exact mapping is not permitted.
この定義は、 US-ASCII のように簡単な単一表対応付けから ISO 2022 技術を使うものまで、様々な種類の文字符号化を文字集合として 使うことを認めるものです。しかし、 MIME 文字集合名に関連付けられる定義は 使われる対応付けを完全に規定するものでなければなりません。 特に、正確な対応付けに外部プロファイル情報を使うのは認められません。
NOTE: The term "character set" was originally to describe such straightforward schemes as US-ASCII and ISO-8859-1 which have a simple one-to-one mapping from single octets to single characters. Multi-octet coded character sets and switching techniques make the situation more complex. For example, some communities use the term "character encoding" for what MIME calls a "character set", while using the phrase "coded character set" to denote an abstract mapping from integers (not octets) to characters.
参考: 用語「character set」「文字集合」は元々は US-ASCII や ISO-8859-1 のように単一オクテットと単一文字の一対一の単純な対応付けを持つ 分かりやすい方式を指していました。多オクテット符号化文字集合や 切り替え技術のおかげで状況が複雑になりました。例えば、 用語「文字符号化 character encoding」を MIME で言うところの 「文字集合 character set」に使い、語句「符号化文字集合 coded character set」 で整数 (オクテットで無しに) から文字への抽象的な対応付けを示す 世間もあります。 (訳注: CES/CCS 論のことらしい。 Ned じーさんは、 CCS/CES 論は charset の1種ではあるが charset はそれに限定されない とおっしゃってます。)
[66]
Re: Media types for RDF languages N3 and Turtle (Sean B. Palmer 著, 2007-12-17 15:51:29 +09:00
版) http://permalink.gmane.org/gmane.ietf.types/953
[103] IANA 文字符号化登録簿は、文字符号化 (charset) の名前に関する IANA による IETF の登録簿 (IANAREG) です。
text/*
の charset
引数[885] MIME型 text/*
の charset
引数については、
text/*
を参照してください。
[127] text/plain
の charset
引数は、文字集合を指定するものです >>265。
[129] 他の text/*
MIME型も、この
charset
引数を使うと規定できます >>265。
その意味は、 text/plain
の場合と同じとするべきです >>265。
[134] その他の MIME型も、この charset
引数を使うと規定できます >>265。テキスト情報が主に想定されていますが、
それ以外でも使うことができます >>265。
[133] RFC 2046 で規定された値の他、 IANA登録簿にも値を登録できます >>265。
[58] IANA登録簿に登録される text/*
MIME型の
charset
引数は、値として RFC 2978
charset
を指定するものでなければなりません >>57。
[143] インターネットメールでは、 RFC 2046 で規定された値、
IANA登録簿の値、
x-
で始まる値しか使うことはできません >>265。
[130] text/plain
以外の text/*
MIME型では、
値を制限することもできます >>265。
[128] 値は、大文字・小文字不区別です >>265。
text/html
や text/css
の charset
引数は IANA charset ではなく Encoding Standard の符号化ラベルとして解釈されます。[142] 文字コードが US-ASCII
以外なら、
常に明示的に指定しなければなりません >>265。
[60] charset
引数は、 charset 情報が payload
内部に含まれる場合は、指定するべきではありません >>57。
[152] multipart/form-data
の本体部分の
text/plain
では、
使っても構いませんが、一般的な実装は使いません >>153。
[137] charset
引数は明示することが強く推奨されています >>265。
[63] charset
引数を規定する時は、必須の引数として規定するべきです。必須としない強い理由がある時は既定値を規定しても構いませんし、
既定値がないと規定しても構いません。既定値は UTF-8
とするべきです。 >>57
[65] いずれにせよ text/*
を IANA登録簿に登録する際は
charset の決定方法を明確に規定しなければなりません >>57。
[264] RFC 2046 (およびそれ以前の MIME RFC) によれば text/*
の charset
引数の既定値は US-ASCII
でした >>265。
[267] RFC 2616 (およびそれ以前の HTTP RFC) はこの既定値を (HTTP においては)
ISO-8859-1
に変更しました >>266。
[268] RFC 6657 は、そのどちらも現状に合っていないとして、 RFC 2046 を更新して次のように規定しています >>262, >>57。
[215] その後出版された RFC 7231 は >>267 の既定値を削除しています >>214。
[154] multipart/form-data
の本体部分の
text/plain
では、フォームの提出の文字コードを使って構わない
>>151 ことになっている一方、 charset
引数は強制されていません
>>153。
[145] 一般に MIME の生成ソフトウェアは、可能な限り「最小公倍数」 たる文字集合を使うべきです >>265。
[102] MIME では未知の text/*
MIME型は
text/plain
として扱うことになっています。
charset
引数がこの際どう扱われるかは不明です。
charset
引数[101] XML MIME型でも charset
引数があります。
詳細は規定されていませんが (ひどい)、MIME charset を指定するもので、
XML encoding
疑似属性より優先されるものと解されています。
[923] 詳しくはXMLにおける文字コードを参照してください。
charset は省略形のように見えます。元々はそうなのでしょうが、 今となっては charset は charset であって charset でしかない、 と考えるのが適当かもしれません。訳にあたっても、 訳して原文のニュアンスが失われるとアレなので (ニュアンスなんて そもそも残らないかもしれませんけど。) そのまま charset とするのが良いのではないでしょうか。
正規形のように見える character set は、文字集合と訳すのが 定着してます。こちらの語は、 (やはり charset と同様の混乱はあるものの) より本来の意味 (文字の集合) で使われていると思われます。
charset
名に none
があります。 Apache の設定ファイルで AddDefaultCharset
指令を使って AddDefaultCharset none
と書くべきであるという不思議な知識が蔓延しているからです。 (たぶん AddDefaultCharset off
と書きたかったのでしょう。もっとも、 Apache 付属の説明文すら読めない人が AddDefaultCharset off
を正しく使えるとは思えませんが。 AddDefaultCharset
指令は初心者が使う機能ではありませんよ。)Content-Type
欄での媒体型指定において使います。[180] HTTP::Message - search.cpan.org () http://search.cpan.org/~oalders/HTTP-Message-6.13/lib/HTTP/Message.pm
は charset
の値 none
を無変換として解釈します。
charset
引数[861] CGI のメタ変数 CONTENT_TYPE
においては、
既定値が次の優先度で定義されています。
text/*
については RFC 2616 に従い ISO-8859-1
です。US-ASCII
です。[863] HTTP との実質的な違いは第1位のシステム定義の既定値が認められていることです。 CGI はシステムの慣習によって鯖からCGIスクリプトに値を引き渡す前に諸々の変換を施すことが認められているので、 charset についても同様の取り扱いを行えるように、との配慮なのでしょうか。
[864] 特にシステム定義がなければ、クライアントによって text/*
の既定の charset が HTTP なら ISO-8859-1
、そうでなければ
US-ASCII
とみなされます。そのためCGIスクリプトは
charset
引数を含めるべきです。 >>865
[866] 明記されていませんが、システム定義があれば実装は charset の変換を適宜行うことになるでしょうし、
charset
が指定されていなかったり不適切だったりすると適宜書き換えるものと思われます。
[868] EBCDIC を使う POSIX 環境では、既定の charset は IBM1047
です。これは text/*
とその他実装定義の MIME型に適用されます。
>>867
meta
要素 charset
属性 (HTML)[89] meta
要素の charset
属性は、文書の文字符号化を指定する文字符号化宣言です >>88。
[92] <meta charset>
要素は、メタデータ内容として使えます。
[93] <meta charset>
要素は、文書中に複数あってはなりません
>>88。
[184] 歴史的には HTTPヘッダー Content-Type:
の charset
引数に文字コードを指定するのが正統と考えられていたことから、現在に至るまで
charset
引数が指定される場合には、 <meta charset>
を指定する必要はないとされています。
@charset
規則 (CSS)charset
属性[78] 異体説明では charset
異体属性は
Content-Type:
ヘッダーの charset
引数に相当します >>77。
charset
(SDP)[210]
<greeting localize>
も参照。
[918] HTTP の Accept-Charset:
ヘッダーや HTML
の accept-charset
属性では、 charset
のリストを指定することができます。更に HTTP のヘッダーでは、
優先順位を指定したり、その他を表す「*
」を指定したりできます。
[138] MIME は、インターネットメールで使う単一の文字集合があるのが好ましいながら、 近い将来のうちに統一は望めないとして、少数だけ標準の文字集合を定義する >>265 としていました。
[140] MIME は次のものを規定しています >>265。
[144] 実装者は、どうしても必要な場合を除き、新しい文字集合を定義するべきではありません >>265。
[150] 次のような値がありました。
[212] Character Set Recognition, InetSDK, , https://web.archive.org/web/20001202085600/http://msdn.microsoft.com/workshop/Author/dhtml/reference/charsets/charset4.asp
charset
引数が使われている MIME 型とその定義のバリエーションcharset
引数と互換な定義text/plain
(平文)text/html
(HTML)text/csv
(CSV)application/sgml-open-catalog
(SGML型録)text/troff
text/owl-functional
、text/owl-manchester
application/owl+xml
application/news-groupinfo
application/news-checkgroups
application/index.response
text/markdown
charset
引数の部分集合な定義application/shf+xml
(SHF)text/provenance-notation
text/n3
, text/rdf+n3
,
application/n3
text/owl-manchester
text/ping
utf-8
のみ。text/event-stream
text/cache-manifest
utf-8
のみ。text/turtle
, application/x-turtle
UTF-8
のみ。text/*
で charset
引数なしで
UTF-8 が使えるようになるまでは、 charset
引数を明示することを推奨。[874] R2RML である Turtle について: charset
引数を使うべきです
>>873。
charset
と同じ定義application/rif+xml
application/xml
と同じ定義application/cdl+xml
application/ccxml+xml
application/voicexml+xml
application/srgs+xml
application/ssml+xml
application/pls+xml
application/atom+xml
application/atomcat+xml
application/atomsvc+xml
application/atomdeleted+xml
application/sparql-result+xml
application/xv+xml
application/xhtml-voice+xml
application/smil+xml
,
application/smil
application/simple-filter+xml
application/vnd.sun.wadl+xml
application/mediaservercontrol+xml
application/docbook+xml
application/xslt+xml
application/xquery+xml
application/cpl+xml
application/resource-lists+xml
appliaction/rls-services+xml
application/wsdl+xml
application/wspolicy+xml
application/sparql-result+xml
application/patch-ops-error+xml
application/xproc+xml
application/emma+xml
application/xquery+xml
application/tei+xml
application/xhtml+xml
application/metalink4+xml
application/inkml+xml
application/evd+xml
application/xenc+xml
application/provenance+xml
application/xop+xml
message/imdn+xml
application/mathml+xml
, application/mathml-presentation+xml
, application/mathml-content+xml
application/xacml+xml
application/emotionml+xml
application/its+xml
application/alps+xml
(ALPS)application/metalink4+xml
(Metalink)application/cmisquery+xml
,
application/cmisallowableactions+xml
,
application/cmistree+xml
,
application/cmisatom+xml
,
application/cmisacl+xml
application/scxml+xml
application/davmount+xml
application/xml
の charset
引数と同じ定義application/rfc+xml
application/gml+xml
application/xml
の charset
引数の部分集合な定義text/xml
の charset
と同じ定義[172] application/ttml+xml
には charset
引数があります。省略可能です >>170。
[171] XML の符号化宣言と同じ、または符号化宣言が無い場合には実際の符号化 >>170 とされています。符号化宣言と同じなら実際の符号化と異なっていても良いのか、 と思ってしまいますが、 TTML の符号化は UTF-8 と UTF-16 に制限されているようですから、そちらに違反してしまいます。なお、「実際の符号化」 は、どう指定するのか明記されていません。自明だと思ったのかもしれませんが、 大文字と小文字が区別されるのかどうか、 UTF-16BE のような指定も認められるのか、など不明です。
[173] TTML の処理で本引数をどのように用いるべきなのかは規定がありません。 符号化に関して RFC 3023 も参照されているので、エスパーするなら、 XML MIME型と同じ方法と推測するべきでしょうか。 UTF-8 と UTF-16 に限定されている上 XML の符号化宣言があるので、 本質的には本引数は不要です。
UTF-8
のみ指定できるものcharset
を定義しないと明記しているもの[906] application/json
(>>305) では charset
引数がしばしば用いられていますが、
RFC 7159 は charset
引数がないと明記しています。
application/json
を参照。[124] 後の IANA charset の元となったものを定義していたのが RFC 1345 でした。
[125] charset に関する議論は ietf-charset メーリングリストで行われています。
[106] RFC 1922 は charset
引数と併用するものとして
charset-edition
引数と
charset-extension
引数を定義していました。
[192]
charset-edition
の値は4桁西暦年と定義されていました。
[193]
CN-GB
(GB 2312、中華人民共和国向け)
や
CN-Big5
(Big5、中華民国台湾向け)
との併用が想定されていました。
中華人民共和国の紀年法は公元ですが、
中華民国の紀年法は中華民国です。
しかしその違いは配慮されず、西暦年のみが許されていました。
[108] charset-edition の定義は 4DIGIT ですが、10000年問題 を考慮して、4*DIGIT とするのがよさげ。2000年問題対策 と称して 2DIGIT に1900足したりする必要はないと思います。 そういうのを受け取っても、 西暦1世紀に制定された charset だということにしてはどーですか?
[109] charset-extension の登録簿は IANA には無いみたい。
[195] RFC 2278 - IANA Charset Registration Procedures, , https://tools.ietf.org/html/rfc2278
[196] RFC 2978 - IANA Charset Registration Procedures, , https://tools.ietf.org/html/rfc2978
[197] RFC Errata Report » RFC Editor, https://www.rfc-editor.org/errata_search.php?rfc=2978
[118] RFC3023 は、 XML 系の媒体型のための charset
引数を規定しています。
[119] >>118 text/xml
などは、省略時の既定値が MIME でも HTTP でも us-ascii
です。また、 application/xml
などは、省略時には既定値なしで、 xml宣言などを参照します。
[120] >>118-119 他の +xml
系媒体型がよく定義にこの RFC を参照していますから、影響力は大きいです。
[122] Bug 1697 - multipart/form-data 送出時に Content-Type が送られない http://bugzilla.mozilla.gr.jp/show_bug.cgi?id=1697, Bug 116346 - Content-Type should be supplied for form data of 'enctype="multipart/form-data"'[from sub] http://bugzilla.mozilla.org/show_bug.cgi?id=116346 : multipart/form-data
を送るときに Mozilla が charset
引数をつけなかったという問題。だけどこれは特定の媒体型や特定の実装に固有じゃない、実は大きな問題をはらんでいます。「ファイル添付」のような、 MIME 実体を生成する応用を単に通過するだけのデータのメタ情報をどうやって得るのかとか、多文字化された実装で charset 情報とどう向き合うのかとか。 MIME は10年も前の規格で、こんなことなんて考えてもいなかったわけですけど、この先どうなるでしょう。やっぱりこれまで通り騙し騙し無理しながら現状維持し続けるしか方法はないのかな。
[121] charset=136
ってのみかけたけど、中身は Big5
だった。どうしてこんな値になったんだ?
[25] Charset parameter of +xml media types from Bjoern Hoehrmann on 2006-09-05 (www-archive@w3.org from September 2006) http://lists.w3.org/Archives/Public/www-archive/2006Sep/0003 (名無しさん 2006-09-07 23:19:07 +00:00)
[30] I'm not a Klingon : Expected names of Microsoft Windows "ANSI" Code Pages (Encodings) http://blogs.msdn.com/shawnste/archive/2006/11/06/expected-names-of-microsoft-windows-ansi-code-pages-encodings.aspx (名無しさん [sage])
[34]
Re: Unicode distribution? from Erik van der Poel on 2007-01-05 (www-international@w3.org from January to March 2007) (Erik van der Poel (erikv@google.com) 著, 2007-01-07 23:27:03 +09:00
版) http://lists.w3.org/Archives/Public/www-international/2007JanMar/0004
(名無しさん 2007-01-12 21:09:39 +00:00)
[43]
ハーブティー、アロマオイル、アロマランプを種類豊富に販売ユーン 卸販売 (2007-06-11 01:15:22 +09:00
版) http://www.yuwn.com/
この鯖は全部設定がおかしいみたい。
charset=0
になってる。
(名無しさん 2007-06-10 16:18:27 +00:00)
[48]
openssl-engine-0.9.6a/test/CAss.cnf - Google Code Search (2007-09-19 10:28:09 +09:00
版) http://www.google.com/codesearch?hl=en&q=show:gp2a770O6xs:Oe1g97XTGPk:6T5s7D-EE9I&sa=N&ct=rd&cs_p=http://www.openssl.org/source/openssl-engine-0.9.6a.tar.gz&cs_f=openssl-engine-0.9.6a/test/CAss.cnf&start=1
Content-Type: text/html; charset=UTF-8; charset=UTF-8
(名無しさん)
[49]
>>48 User-Agent:
か何かによっては後者が
ISO-8859-1
になることもある模様。
(名無しさん 2007-09-19 01:33:01 +00:00)
[38]
TMX Specification (2007-02-24 17:51:20 +09:00
版) http://www.lisa.org/standards/tmx/tmx.html#base
(名無しさん [sage])
[39]
TMX Specification (2007-02-24 17:51:20 +09:00
版) http://www.lisa.org/standards/tmx/tmx.html#oencoding
(名無しさん [sage])
[42]
Kazuho@Cybozu Labs: Re: PoCo::Client::HTTP が勝手に文字コードを変えてしまう件 (2007-04-24 06:52:47 +09:00
版) http://labs.cybozu.co.jp/blog/kazuho/archives/2007/04/poco_patch.php
charset=iso-8859-1 default Breaks the Web. (名無しさん 2007-04-23 21:54:55 +00:00)
[47]
hoshikuzu | star_dust の書斎 (2007-08-10 22:40:44 +09:00
版) http://d.hatena.ne.jp/hoshikuzu/20070807#p1
(名無しさん)
[51]
feel部屋:皆様に幸と笑いあれ♪ - 轟轟戦隊 (2007-09-24 14:10:56 +09:00
版) http://feel.g.hatena.ne.jp/keyword/%e8%bd%9f%e8%bd%9f%e6%88%a6%e9%9a%8a
<link rel="stylesheet" href="/diary_css/base.css" type="text/css" media="all" charset="euc-jp"> <link rel="stylesheet" href="/theme/hazakura/hazakura.css" type="text/css" media="all" charset="euc-jp">
リンク先の CSS スタイル・シートは、
@charset
の指定はあるものの HTTP
Content-Type:
charset
は指定なし。
(名無しさん)
[52]
メモ - 葉っぱ日記 (2007-11-28 12:10:50 +09:00
版) http://d.hatena.ne.jp/hasegawayosuke/20071120/p1
[68]
Re: Unsupported transport-layer encodings (Alexey Proskuryakov 著, 2008-07-22 20:55:40 +09:00
版) http://lists.w3.org/Archives/Public/public-html/2008Jul/0279.html
(名無しさん)
[69]
Charset usage data (Philip Taylor 著, 2008-03-06 02:52:53 +09:00
版) http://lists.w3.org/Archives/Public/public-html/2008Mar/0029.html
(名無しさん)
[71] HTML5のFPWDとmeta要素のcharset属性 - vantguarde - web:g ( 版) http://web.g.hatena.ne.jp/vantguarde/20080123/1201089589
[74] TAG Finding: Internet Media Type registration, consistency of use ( 版) http://www.w3.org/2001/tag/2002/0129-mime#char-encoding
[825] MAMA: Document Encodings - Opera Developer Community ( 版) http://dev.opera.com/articles/view/mama-document-encodings/
[826] Firefox 3 は script
charset
が指定されていないとスクリプトの Content-Type
charset
に従いますが (たぶん ― 自動判別かどうかは未調査)、
WinIE 7 はそうじゃないみたいです (たぶん HTML charcterSet
と同じとみなす)。
[828] The WHATWG Blog » Blog Archive » The Road to HTML 5: character encoding ( 版) http://blog.whatwg.org/the-road-to-html-5-character-encoding
[829] (X)HTML5 Tracking ( 版) http://html5.org/tools/web-apps-tracker?from=4125&to=4126
[832] RFC 5537 - Netnews Architecture and Protocols ( 版) http://tools.ietf.org/html/rfc5537
[833] 世界史講義録 ( 版) http://www.geocities.jp/timeway/
This page is encoded in euc-jp
, but its Content-Type
is text/html
(with no charset
parameter).
The page includes ...
<meta name="META HTTP-EQUIV=" content="text/html;CHRSET=iso-2022-jp">... but it is broken in various ways, sigh.
Firefox correctly decodes the page as euc-jp
, while Chrome
fails to decode the page, by recognizing the content as shift_jis
.
[834] HTML5 Revision Tracker ( 版) http://html5.org/tools/web-apps-tracker?from=5041&to=5042
[835] XProc: An XML Pipeline Language ( 版) http://www.w3.org/TR/2010/REC-xproc-20100511/#p.data
[836] XProc: An XML Pipeline Language ( 版) http://www.w3.org/TR/2010/REC-xproc-20100511/#c.response_body
[842] [CITE@@en[Web Applications 1.0 r5295 <meta charset> should only work for ASCII-compatible encodings.Fixing http://www.w3.org/Bugs/Public/show_bug.cgi?id=10260]] ( ( 版)) http://html5.org/tools/web-apps-tracker?from=5294&to=5295
[843] [CITE@@en[Web Applications 1.0 r5414 Allow authors to override WebSRT's encoding using <track charset>.]] ( ( 版)) http://html5.org/tools/web-apps-tracker?from=5413&to=5414
[844] IRC logs: freenode / #whatwg / 20101126 ( ( 版)) http://krijnhoetmer.nl/irc-logs/whatwg/20101126#l-354
[848] RFC 6047 - iCalendar Message-Based Interoperability Protocol (iMIP) ( ( 版)) http://tools.ietf.org/html/rfc6047#section-2.4
[849] draft-melnikov-mime-default-charset-00 - Update to MIME regarding Charset Parameter Handling in Textual Media Types ( 版) http://tools.ietf.org/html/draft-melnikov-mime-default-charset-00
[855] Web Applications 1.0 r6641 Mention that application/x-www-form-urlencoded;charset does nothing. ( ( 版)) http://html5.org/tools/web-apps-tracker?from=6640&to=6641
[856] RFC 6365 - Terminology Used in Internationalization in the IETF ( 版) http://tools.ietf.org/html/rfc6365#page-8
[859] RFC 2277 - IETF Policy on Character Sets and Languages ( ( 版)) http://tools.ietf.org/html/rfc2277#section-3
[860] IRC logs: freenode / #whatwg / 20111218 ( ( 版)) http://krijnhoetmer.nl/irc-logs/whatwg/20111218
[869] Web Applications 1.0 r7160 Require an encoding declaration. ( ( 版)) http://html5.org/tools/web-apps-tracker?from=7159&to=7160
[870] [whatwg] Encoding sniffing algorithm ( ( 版)) http://lists.whatwg.org/pipermail/whatwg-whatwg.org/2012-September/037190.html
[871] Web Applications 1.0 r7324 Attempt to slightly more closely align with reality. ( ( 版)) http://html5.org/tools/web-apps-tracker?from=7323&to=7324
[872] Web Applications 1.0 r7360 Make a BOM override HTTP headers. ( ( 版)) http://html5.org/tools/web-apps-tracker?from=7359&to=7360
[890] Web Applications 1.0 r7958 New encoding defaults based on more data. ( ( 版)) http://html5.org/tools/web-apps-tracker?from=7957&to=7958
[893] IRC logs: freenode / #whatwg / 20131029 ( ( 版)) http://krijnhoetmer.nl/irc-logs/whatwg/20131029#l-348
[894] IRC logs: freenode / #whatwg / 20131030 ( ( 版)) http://krijnhoetmer.nl/irc-logs/whatwg/20131030#l-312
[895] Attachment #8336745 for bug #910211 ( ( 版)) https://bugzilla.mozilla.org/attachment.cgi?id=8336745&action=diff#a/dom/encoding/domainsfallbacks.properties_sec2
[898] Bug 14703 – Integrate style sheet loading with CSSOM ( ( 版)) https://www.w3.org/Bugs/Public/show_bug.cgi?id=14703
[899] Web Applications 1.0 r8391 Define how <link charset> works. ( ( 版)) http://html5.org/tools/web-apps-tracker?from=8390&to=8391
[900] Please consider if your locale could default to UTF-8 for outgoing email - Google グループ ( ( 版)) https://groups.google.com/forum/#!topic/mozilla.dev.l10n/PH7tF9m8vUY
[907] Welcome to Netscape Navigator Version 2.0 ( ( 版)) http://web.archive.org/web/20030202175634/http://wp.netscape.com/eng/mozilla/2.0/relnotes/windows-2.0.html#Images
[908] Welcome to Netscape Navigator Version 1.1 ( ( 版)) http://web.archive.org/web/20030203042026/http://wp.netscape.com/eng/mozilla/1.1/relnotes/windows-1.1.html#Images
[910] Character Model for the World Wide Web 1.0: Fundamentals ( ( 版)) http://www.w3.org/TR/charmod/#sec-EncodingIdent
[911] Bug 25534 – HTML spec should not encourage to auto-detect UTF-8 ( ( 版)) https://www.w3.org/Bugs/Public/show_bug.cgi?id=25534
[913] Internationalization Tag Set (ITS) Version 2.0 ( ( 版)) http://www.w3.org/TR/its20/#storagesize
[924] Bug 26655 – Support mistakenly `utf-`-prefixed encodings seen in the wild ( ( 版)) https://www.w3.org/Bugs/Public/show_bug.cgi?id=26655
[925] RFC 5987 - Character Set and Language Encoding for Hypertext Transfer Protocol (HTTP) Header Field Parameters ( ( 版)) http://tools.ietf.org/html/rfc5987#section-3.2
[95] ハングル工房 綾瀬 - internet上のハングル ( 版) http://www.han-lab.gr.jp/~mizuno/com/web.html
[98] XHTML™ 2.0 - XHTML Embedding Attributes Module ( 版) http://www.w3.org/TR/2010/NOTE-xhtml2-20101216/mod-embedding.html
[99] Authoring Techniques for XHTML & HTML Internationalization: Characters and Encodings 1.0 ( ( 版)) http://www.w3.org/TR/2015/NOTE-i18n-html-tech-char-20150127/
[156] Only replace charset parameter values that do not case-insensitively … · whatwg/xhr@a1f8e14 ( 版) https://github.com/whatwg/xhr/commit/a1f8e140fef9e3ee8255ef58a2c71ff9d75933d2
[158] 各ブラウザが解釈可能なcharsetのリスト ( 版) http://l0.cm/encodings/list/
[159] Add <script type="module"> and module resolution/fetching/evaluation · whatwg/html@cd1a9fb ( 版) https://github.com/whatwg/html/commit/cd1a9fb1e83f7d0bc30be8b34ecdaf444a0b19a4
[161] Update integration with Encoding Standard · whatwg/html@6a31c26 ( 版) https://github.com/whatwg/html/commit/6a31c26cf12e39dab1a488e75dd56c03d6786d39
[177] 18338 – Registries (IANA): text/html MIME type definition should require that charset="" value be valid and correct () https://www.w3.org/Bugs/Public/show_bug.cgi?id=18338
[178] [c] (0) Outlaw <meta http-equiv=content-type content=text/html… (Hixie著, ) https://github.com/whatwg/html/commit/ea48293c495d6c863ff4813cac17f37d32fdaf63
[179] [ct] (0) Require that if a <meta> charset is included, the encoding b… (Hixie著, ) https://github.com/whatwg/html/commit/ac3cdabc9466b5530e5d7f21f4586c95e19c3b5e
[181] Improve <style> and <script> processing and conformance (domenic著, ) https://github.com/whatwg/html/commit/9c612ac8641b5174849a2d3cb924fe662a8d3a09
[182] Require UTF-8 (sideshowbarker著, ) https://github.com/whatwg/html/commit/fae77e3c558b9f083dfb9086752863a4789268f5
[185] Require utf-8 when specifying character encoding by sideshowbarker · Pull Request #3091 · whatwg/html () https://github.com/whatwg/html/pull/3091
[186] Invitation to attend upcoming IETF meetings · Issue #58 · whatwg/meta () https://github.com/whatwg/meta/issues/58
[187] Define Content-Type manipulation in terms of MIME Sniffing (annevk著, ) https://github.com/whatwg/xhr/commit/edc6f8f16f58d201afb49e40ca166b8bc1ae74a3
[188] Fix send() charset overriding to use new MIME type infrastructure · Issue #188 · whatwg/xhr () https://github.com/whatwg/xhr/issues/188
[189] Define Content-Type manipulation in terms of MIME Sniffing by annevk · Pull Request #176 · whatwg/xhr () https://github.com/whatwg/xhr/pull/176
[190] Fix overrideMimeType() again (annevk著, ) https://github.com/whatwg/xhr/commit/121cee50b6f51215f046266642964b4c53a02a7c
[191] Look at overrideMimeType() again · Issue #157 · whatwg/xhr () https://github.com/whatwg/xhr/issues/157
[203] rfc3808, https://datatracker.ietf.org/doc/html/rfc3808
[204] rfc3659 () https://datatracker.ietf.org/doc/html/rfc3659#section-7.5