RFC 2854

RFC 2854

[2] RFC 2854 は、 IETF の手続き上は現在も有効ですが、 実質的に HTML Standard により置き換えられています。 IANA も現在はこちらの RFC を参照していません。

The 'text/html' Media Type

Status of this Memo

This memo provides information for the Internet community. It does not specify an Internet standard of any kind. Distribution of this memo is unlimited.


This document summarizes the history of HTML development, and defines the "text/html" MIME type by pointing to the relevant W3C recommendations; it is intended to obsolete the previous IETF documents defining HTML, including RFC 1866, RFC 1867, RFC 1980, RFC 1942 and RFC 2070, and to remove HTML from IETF Standards Track.

この文書は HTML 開発の歴史をまとめ、関係する W3C 勧告を指して text/html MIME 型を定義します。 この文書は HTML を定義する以前の IETF 文書 (RFC 1866、 RFC 1867、 RFC 1980、 RFC 1942、 RFC 2070) を廃止し、 HTML を IETF 標準化過程から削除することを意図しています。

This document was prepared at the request of the W3C HTML working group. Please send comments to www-html@w3.org, a public mailing list with archive at <http://lists.w3.org/Archives/Public/www-html/>.

この文書は W3C HTML 作業部会の要求で用意しました。 ご意見は <http://lists.w3.org/Archives/Public/www-html/> で保管される公開メイリング・リスト <MAIL:www-html@w3.org> へお寄せ下さい。

1. Introduction and background

HTML has been in use in the World Wide Web information infrastructure since 1990, and specified in various informal documents. The text/html media type was first officially defined by the IETF HTML working group in 1995 in [HTML20]. Extensions to HTML were proposed in [HTML30], [UPLOAD], [TABLES], [CLIMAPS], and [I18N].

HTML は1990年から World Wide Web 情報基盤で使われ、 種々の非公式な文書に規定されてきました。 text/html 媒体型ははじめ 1995年に IETF HTML 作業部会により RFC 1866 で定義されました。 HTML の拡張が HTML 3.0 I-D, RFC 1867, RFC 1942, RFC 1980, RFC 2070 で提案されました。

The IETF HTML working group closed Sep 1996, and work on defining HTML moved to the World Wide Web Consortium (W3C). The proposed extensions were incorporated to some extent in [HTML32], and to a larger extent in [HTML40]. The definition of multipart/form-data from [UPLOAD] was described in [FORMDATA]. In addition, a reformulation of HTML 4.0 in XML 1.0[XHTML1] was developed.

IETF HTML 作業部会は1996年9月に閉鎖し、 HTML を定義する作業は World Wide Web Consortium (W3C) に移管されました。 提案されていた拡張はある程度 HTML 3.2 で取入れられ、 更に多くが HTML 4.0 に取入れられました。 RFC 1867 からの multipart/form-data の定義は RFC 2388 で記述されています。加えて、 HTML 4.0XML 1.0による再形式化版 (XHTML 1.0) が開発されました。

[HTML32] notes "This specification defines HTML version 3.2. HTML 3.2 aims to capture recommended practice as of early '96 and as such to be used as a replacement for HTML 2.0 (RFC 1866)." Subsequent specifications for HTML describe the differences in each version.

HTML 3.2 は、この仕様書は HTML 3.2 版を定義します。 HTML 3.2 は1996年初期の推奨される慣習を捕獲するのを助けます。ですから HTML 2.0 (RFC 1866) に代わって使われるものです。 とメモっています。それ以後のHTMLの仕様書はそれぞれの版の違いを説明しています。

In addition to the development of standards, a wide variety of additional extensions, restrictions, and modifications to HTML were popularized by NCSA's Mosaic system and subsequently by the competitive implementations of Netscape Navigator and Microsoft Internet Explorer; these extensions are documented in numerous books and online guides.

規格の開発に加え、 HTML への広範囲にわたる拡張、制限、 修正が NCSA の Mosaic システムやそれに続く Netscape Navigator および Microsoft Internet Explorer の競争的実装により広まりました。 これらの拡張は数々の本や線上手引きに文書化されています。

2. Registration of MIME media type text/html

MIME media type name
MIME subtype name
Required parameters
Optional parameters
The optional parameter "charset" refers to the character encoding used to represent the HTML document as a sequence of bytes. Any registered IANA charset may be used, but UTF-8 is preferred. Although this parameter is optional, it is strongly recommended that it always be present. See Section 6 below for a discussion of charset default rules.

省略可能な引数 charset は、 HTML 文書をバイトの列として表現するのに使われる文字符号化を参照します。 任意の IANA charset を使って構いませんが、 UTF-8 が好ましいです。この引数は省略可能ですが、 常に使用することを強く推奨します。 Charset 既定値規則についての議論は 6章をご覧ください。

Note that [HTML20] included an optional "level" parameter; in practice, this parameter was never used and has been removed from this specification. [HTML30] also suggested a "version" parameter; in practice, this parameter also was never used and has been removed from this specification.

RFC 1866 は省略可能な level 引数を含んでいました。 実際には、この引数は使われたことはなく、この仕様書からは削除しています。 HTML 3.0 I-D も version 引数を提案しました。 実際には、この引数は使われたことはなく、この仕様書からは削除しています。

Encoding considerations
See Section 4 of this document.
Security considerations
See Section 7 of this document.
Interoperability considerations
HTML is designed to be interoperable across the widest possible range of platforms and devices of varying capabilities. However, there are contexts (platforms of limited display capability, for example) where not all of the capabilities of the full HTML definition are feasible. There is ongoing work to develop both a modularization of HTML and a set of profiling capabilities to identify and negotiate restricted (and extended) capabilities.

HTML は可能な限り広範囲の環境や色々な能力の装置の間で相互運用できるように設計されています。 しかし、 HTML の完全な定義のすべての能力が望まれない文脈 (例えば限られた表示能力の環境) もあります。 HTML のモジュール化と制限された (および拡張された) 能力を識別・折衝するプロファイル能力集合の両方の開発作業が行われています。

Due to the long and distributed development of HTML, current practice on the Internet includes a wide variety of HTML variants. Implementors of text/html interpreters must be prepared to be "bug-compatible" with popular browsers in order to work with many HTML documents available the Internet.

長く分散した HTML の開発のために、インターネットの現在の習慣では種々多様な HTML の異種が含まれています。 text/html の解釈器の実装者は、インターネットで入手可能な多くの HTML 文書に機能するよう有名ブラウザとの「バグ互換性」 を準備しなければなりません。

Typically, different versions are distinguishable by the DOCTYPE declaration contained within them, although the DOCTYPE declaration itself is sometimes omitted or incorrect.

普通、異なる版は文書に含まれる DOCTYPE 宣言で区別することができます。ただし、 DOCTYPE 宣言自体が時々省略されていたり不正であったりします。

Published specification
The text/html media type is now defined by W3C Recommendations; the latest published version is [HTML401]. In addition, [XHTML1] defines a profile of use of XHTML which is compatible with HTML 4.01 and which may also be labeled as text/html.

text/html 媒体型は今は W3C 勧告で定義されています。 出版済みの最新版は HTML 4.01 です。加えて、 XHTML 1.0 が HTML 4.01 と互換な XHTML の使用のプロファイルを定義しており、 これも text/html と札付けして構いません。

Applications which use this media type
The first and most common application of HTML is the World Wide Web; commonly, HTML documents contain URI references [URI] to other documents and media to be retrieved using the HTTP protocol [HTTP]. Many gateway applications provide HTML-based interfaces to other underlying complex services. Numerous other applications now also use HTML as a convenient platform-independent multimedia document representation.

HTML の最初で一番広まっている応用は World Wide Web です。 普通、 HTML 文書は HTTP プロトコルを使って取出される他の文書や媒体への URI 参照を含みます。多くの関門応用が他の下位の複雑なサービスへの HTML を基にした界面を提供しています。数々の他の応用も今では HTML を便利な環境独立多媒体文書表現として使っています。

Additional information
Magic number
There is no single initial string that is always present for HTML files. However, Section 5 below gives some guidelines for recognizing HTML files.

HTML ファイルに常に出現する一つの初期文字列はありません。 しかし、5章で HTML ファイルを認識するための指針を示します。

File extension
The file extensions 'html' or 'htm' are commonly used, but other extensions denoting file formats for preprocessing are also common.

ファイル拡張子 htmlhtm が広く使われていますが、 前処理のファイル書式を示す他の拡張子も広く使われています。

Macintosh File Type code
Person & email address to contact for further information
Dan Connolly <connolly@w3.org> Larry Masinter <lmm@acm.org>
Intended usage
Author/Change controller
The HTML specification is a work product of the World Wide Web Consortium's HTML Working Group. The W3C has change control over the HTML specification.

HTML 仕様書は World Wide Web Consortium の HTML 作業部会の成果物です。 W3C が HTML 仕様書の変更権を有します。

Further information
HTML has a means of including, by reference via URI, additional resources (image, video clip, applet) within the base document. In order to transfer a complete HTML object and the included resources in a single MIME object, the mechanisms of [MHTML] may be used.

HTML は基底文書中に URI による参照として追加の資源 (画像、動画片、applet) を取込む手段を有します。 完全に HTML 物体および取込まれた資源を一つの MIME 物体として転送するためには、 MHTML の仕組みを使うことができます。

3. Fragment Identifiers

The URI specification [URI] notes that the semantics of a fragment identifier (part of a URI after a "#") is a property of the data resulting from a retrieval action, and that the format and interpretation of fragment identifiers is dependent on the media type of the retrieval result.

URI 仕様書は素片識別子 (URI の # の後の部分) の意味は取出し動作の結果のデータの特性であり、 素片識別子の書式と解釈は取出し結果の媒体型に依存すると書いています。

For documents labeled as text/html, the fragment identifier designates the correspondingly named element; any element may be named with the "id" attribute, and A, APPLET, FRAME, IFRAME, IMG and MAP elements may be named with a "name" attribute. This is described in detail in [HTML40] section 12.

text/html と札付けされた文書では、 素片識別子は対応する名前付き要素を示します。 任意の要素が id 属性で名前を付けることができますし、 a, applet, frame, iframe, ODE(HTMLe)[img]], map の要素は name 属性で名前を付けることができます。 これは HTML 4.0 12章で詳しく説明されています。

4. Encoding considerations

Because of the availability within HTML itself for using character entity references, documents that use a wide repertoire of characters may still be represented using the US-ASCII charset and transported without encoding. However, transport of text/html using a charset other than US-ASCII may require base64 or quoted-printable encoding for 7-bit channels.

HTML 自体が実体参照を使うことができますから、 大きな文字のレパートリを使う文書であっても US-ASCII charset を使って表現して、符号化せずに輸送することができます。 しかし、 US-ASCII 以外の charset を使った ODE(MIME)[text/html]] の輸送では、7ビット輸送路のため base64quoted-printable の符号化が必要かもしれません。

As with all MIME text subtypes, the canonical form of "text/html" must always represent a line break as a sequence of a CR byte value (0x0D) followed by an LF (0x0A) byte value. Similarly, any occurrence of such a CRLF sequence in "text/html" must represent a line break. Use of CR byte values and LF byte values outside of line break sequences is also forbidden. This rule applies regardless of the character encoding ('charset') involved.

MIME の他のすべての text 亜型と同様に、 text/html の正準形は常に改行を CR バイト値 (0x0D) とそれに続く LF (0x0A) バイト値で表現しなければなりません。 同様に、 text/html でこのような CRLF 列が出現する場合は必ず改行を表現しなければなりません。 改行以外で CR バイト値や LF バイト値を使うことも禁止されています。この規則は文字符号化 (charset) に関わらず適用されます。

Note, however, that the HTTP protocol allows the transport of data not in canonical form, and, in particular, with other end-of-line conventions; see [HTTP] section 3.7.1. This exception is commonly used for HTML.

ただし、 HTTP プロトコルはデータが正準形でなくても輸送を認めており、 特に他の改行表現もよいことに注意して下さい。この例外は HTML では広く使われています。

HTML sent via email is still subject to the MIME restrictions; this is discussed fully in [MHTML] Section 10.

電子メイルを使って送られる HTML はやはり MIME の制限の対象になります。 これは MHTML 10章で完全に議論されています。

5. Recognizing HTML files

Almost all HTML files have the string "<html" or "<HTML" near the beginning of the file.

ほとんどすべての HTML ファイルは文字列 <html または <HTML をファイルの先頭付近に持ちます。

Documents conformant to HTML 2.0, HTML 3.2 and HTML 4.0 will start with a DOCTYPE declaration "<!DOCTYPE HTML" near the beginning, before the "<html". These dialects are case insensitive. Files may start with white space, comments (introduced by "<!--" ), or processing instructions (introduced by "<?") prior to the DOCTYPE declaration.

HTML 2.0, HTML 3.2, HTML 4.0 に適合する文書は先頭付近で <html より前に DOCTYPE 宣言 <!DOCTYPE HTML から始まります。ファイルは DOCTYPE 宣言より前に空白注釈 (<!-- で始まります。)、処理指令 (<? で始まります。) から始まるかもしれません。

XHTML documents (optionally) start with an XML declaration which begins with "<?xml" and are required to have a DOCTYPE declaration "<!DOCTYPE html".

XHTML 文書は (任意で) <?xml で始まる XML宣言から始まり、 DOCTYPE 宣言 <!DOCTYPE html が必要です。

6. Charset default rules

The use of an explicit charset parameter is strongly recommended. While [MIME] specifies "The default character set, which must be assumed in the absence of a charset parameter, is US-ASCII." [HTTP] Section 3.7.1, defines that "media subtypes of the 'text' type are defined to have a default charset value of 'ISO-8859-1'". Section 19.3 of [HTTP] gives additional guidelines. Using an explicit charset parameter will help avoid confusion.

明示的に charset を使用することを強く推奨します。 MIME は charset 引数が欠けたる時に使用しなければならない既定文字集合は US-ASCII です。 と既定していますが、 HTTP は媒体型 text の亜型は既定 charsetISO-8859-1 を持つと定義します。 と定義しています。 HTTP の 19.3 章は追加の指針を与えています。 明示的に charset 引数を使用することで混乱回避の助けとなります。

Using an explicit charset parameter also takes into account that the overwhelming majority of deployed browsers are set to use something else than 'ISO-8859-1' as the default; the actual default is either a corporate character encoding or character encodings widely deployed in a certain national or regional community. For further considerations, please also see Section 5.2 of [HTML40].

明示的に charset 引数を使用するというのは、 使用されている圧倒的多数のブラウザが ISO-8859-1 以外のものを既定値として使うように設定されていることも考慮しています。 実際の既定値は企業文字符号化か特定の国家・地域社会で広く用いられている文字符号化です。 詳しい考察は HTML 4.0 の5.2節もご覧ください。

7. Security Considerations

[HTML401], section B.10, notes various security issues with interpreting anchors and forms in HTML documents.

HTML 4.01 B.10 節は HTML 分書中のアンカーとフォームの解釈に纏わる種々の保安上の問題について書いています。

In addition, the introduction of scripting languages and interactive capabilities in HTML 4.0 introduced a number of security risks associated with the automatic execution of programs written by the sender but interpreted by the recipient. User agents executing such scripts or programs must be extremely careful to insure that untrusted software is executed in a protected environment.

加えて、 HTML 4.0 でスクリプト言語や対話的能力を導入したことによって、 送信者が書いて受信者が解釈するプログラムが自動的に実行されることに関する保安上の危険の数々が生まれました。 このようなスクリプト・プログラムを実行する利用者エージェントは、 信頼できないソフトウェアが保護された環境で実行されるように甚だ注意を払わなければなりません。

8. Authors' Addresses

   Daniel W. Connolly
   World Wide Web Consortium (W3C)
   MIT Laboratory for Computer Science
   545 Technology Square
   Cambridge, MA 02139, U.S.A.
   EMail: connolly@w3.org
   Larry Masinter
   75 Willow Road
   Menlo Park, CA 94025
   EMail: LM@att.com

9. References

   [CLIMAPS]  Seidman, J., "A Proposed Extension to HTML: Client-Side
              Image Maps", RFC 1980, August 1996.
   [FORMDATA] Masinter, L., "Returning Values from Forms:
              multipart/form-data", RFC 2388, August 1998.
   [HTML20]   Berners-Lee, T. and D. Connolly, "Hypertext Markup
              Language - 2.0", RFC 1866, November 1995.
   [HTML30]   Raggett, D., "HyperText Markup Language Specification
              Version 3.0", September 1995.  (Available at
   [HTML32]   Raggett, D., "HTML 3.2 Reference Specification", W3C
              Recomendation, January 1997.
              Available at <http://www.w3.org/TR/REC-html32>.
   [HTML40]   Raggett, D., et al., "HTML 4.0 Specification", W3C
              Recommendation, December 1997.
              Available at <http://www.w3.org/TR/1998/REC-html40->
   [HTML401]  Raggett, D., et al., "HTML 4.01 Specification", W3C
              Recommendation, December 1999.
              Available at <http://www.w3.org/TR/html401>.
   [HTTP]     Gettys, J., Fielding, R., Mogul, J., Frystyk, H.,
              Masinter, L., Leach, P. and T. Berners-Lee, "Hypertext
              Transfer Protocol -- HTTP/1.1", RFC 2616, June 1999.
   [I18N]     Yergeau, F., Nicol, G. and M. Duerst,
              "Internationalization of the Hypertext Markup Language",
              RFC 2070, January 1997.
   [MHTML]    Palme, J., Hotmann, A. and N. Shelness, "MIME
              Encapsulation of Aggregate Documents, such as HTML
              (MHTML)", RFC 2557, March 1999.
   [MIME]     Freed, N. and N. Borenstein, "Multipurpose Internet Mail
              Extensions (MIME) Part Two: Media Types", RFC 2046,
              November 1996.
   [TABLES]   Raggett, D., "HTML Tables", RFC 1942, May 1996.
   [UPLOAD]   Nebel, E. and L. Masinter, "Form-based File Upload in
              HTML", RFC 1867, November 1995.
   [URI]      Berners-Lee, T., Fielding, R. and L. Masinter, "Uniform
              Resource Identifiers (URI): Generic Syntax", RFC 2396,
              August 1998.
   [XHTML1]   "XHTML 1.0: The Extensible HyperText Markup Language: A
              Reformulation of HTML 4 in XML 1.0", W3C Recommendation,
              January 2000. Available at <http://www.w3.org/TR/xhtml1>.


   Funding for the RFC Editor function is currently provided by the
   Internet Society.


Connolly & Masinter Informational [Page 8]