[103] [[HTML2]]〜[[HTML4]] は [[SGML応用]]であると主張していました。また、 [[XHTML1]]、[[XHTML2]]、
[[XHTML5]] は [[XML]] の[[応用]]です。そのため、[DFN[[RUBYB[[[文書型宣言]]]@en[document type declaration]]]]によって [[DTD]]
を指定することができます。また、 [[HTML5]] では歴史的理由から[[文書]]の先頭に
[DFN[[CODE(HTML)@en[[[DOCTYPE]]]]]] を指定することになっています。

* HTML 4 の場合

[88] [[HTML文書]]は、その HTML の版を表すために[DFN[文書型宣言]]を最初に入れなければ'''なりません'''。
HTML 4 では3種類の DTD が定義されていますので、
そのうちのいずれかを参照する宣言が必要です。
<IW:HTML4:"struct/global.html#version-info"> 参照。

:[[Strict]] (厳格) DTD:[[非推奨]]ではなく、[[枠集合]]文書に現れるものではないすべての[[要素]]と[[属性]]を含みます。
[PRE[
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN"
        "http://www.w3.org/TR/html4/strict.dtd">
]PRE]


:Transitional (過渡的) DTD:Strict DTD に加え、
非推奨の要素・属性を含みます。
[PRE[
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"
        "http://www.w3.org/TR/html4/loose.dtd">
]PRE]


:Frameset (枠集合) DTD:Transitional DTD に加え[[枠]]を含みます。
[PRE[
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Frameset//EN"
        "http://www.w3.org/TR/html4/frameset.dtd">
]PRE]


[89] なお、
- 将来の版の HTML 4 の DTD に加えられた変更で従来の
HTML 4 文書が非妥当になることはありません。
- 従来の版の HTML 4 の DTD に適合するソフトウェアは将来の版の HTML 4 の認識出来ない機能を無視して構いません。

このため、文書型宣言の[[システム識別子]]の値は通常は
「最新版」を表す [[URI参照]] (>>88 に示されているもの9
を使い、特定の版の HTML 4 DTD を特に指定したいときだけそれを使うこととできます。

[101]
aaa
([[名無しさん]] [WEAK[2007-12-13 11:11:38 +00:00]])


[102]
Shiit is happened!(c)Forrest Gump
([[Sector]] [gaz@pisem.net])


[[#comment]]


* HTML の文書型宣言の色々

- [1] お題: [[HTML]] ([[不思議マーク付け]]も含む。)
の[[文書型宣言]] ([[DOCTYPE]]) の記述を収集せよ。
- [9] [CODE[<!DOCTYPE HTML PUBLIC "-//W3 Organization//DTD W3 HTML 2.0//EN">]] (''Hypertext Markup language and SGML'' <http://www.w3.org/MarkUp/1995-archive/Intro.html>)
- [10] ''Mozilla の DOCTYPE 判別'' <http://jt.mozilla.gr.jp/docs/web-developer/quirks/doctypes.html> 色々な文書型宣言 (不正なものも含む。) の例示あり
- [33] ''W3C QA - List of valid DTDs you can use in your document.'' <http://www.w3.org/QA/2002/04/valid-dtd-list.html>
- [34] [CODE[<!DOCTYPE Mosaic-Communications-Bookmark-file-1>]] [[MosaicNetscape]] の bookmark
- [37] ''SGML catalog for the W3C HTML Validation Service'' <http://validator.w3.org/sgml-lib/catalog> 色んなのが載ってます。
- [38] >>37 の [[DTD]] は ''Index of /sgml-lib'' <http://validator.w3.org/sgml-lib/> にあります。
- [54] [CODE(SGML)[<!DOCTYPE HTML PUBLIC "-//connolly hal.com//DTD WWW HTML 1.8//EN">]] ''HTML Design Notebook'' <http://www.w3.org/People/Connolly/drafts/html-design.html> で使われている。
- [55] [CODE(HTML)[<!DOCTYPE HTML PUBLIC "-//Mosaic Comm. Corp.//DTD HTML//EN">]] ''Testing mcom additions to HTML'' <http://www.w3.org/People/Connolly/html-test/mcom/test-mcom.html> で使われている。
- [67] [CODE(HTML)[<!doctype html public "html2.0">]] [[IBM]] の古い文書にある
- [71] [CODE(HTML)[<!DOCTYPE HTML PUBLIC "ISO 15445:2000//DTD HTML//EN">]] 『[[ISO-HTML]] 利用者の手引き』中に出てきたが・・・
- [72] >>71 の出典は翻訳 JIS TR の。 ([[JIS-HTML]] 参照。) しかし、 [[InternetArchive]] に残っている最古の <http://web.archive.org/web/20000815232401/woodworm.cs.uml.edu/~rprice/15445/UG.html> も、既にちゃんと [CODE(HTML)[ISO/IEC]] になってるんだよなあ。
- [73] [CODE(HTML)[<!DOCTYPE Pre-HTML PUBLIC "-//ISO-HTML User's Guide//DTD Preparation of ISO-HTML//EN">]] 『[[ISO-HTML]] 利用者の手引き』9.1.1。
- [75] [CODE(HTML)["-//Netscape//netscape extension//JA"]]: ''Phrase/Typographic markup test'' <http://web.archive.org/web/20011110215859/www.dais.is.tohoku.ac.jp/~kabe/misc/fonts.html>
- [76] [CODE(HTML)[<!doctype html public "-//W3C//DTD HTML 5.0//EN">]], [CODE(HTML)[<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 5.0//EN">]], [CODE(HTML)[<!DOCTYPE HTML PUBLIC"-//W3C//DTD HTML 5.0 Frameset//EN" "http://www.w3.org/TR/REC-html140/frameset.dtd">]]: <IW:Strictスレ:"1:423">
- [77] [CODE(HTML)[<!DOCTYPE html SYSTEM "http://www.w3.org/Style/HTML40-plus-blink.dtd">]]: ''Web Style Sheets'' <http://www.w3.org/Style/> で使われている。余程 [[blink]] 要素が使いたかったらしい。
- [78] [CODE(HTML)[<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2Final//EN"]] 壊れてる気がするが。
- [84] [CODE(HTML)[<!doctype html public "-//W3C//DTD HTML 1996-01//EN">]]: ''Extensible Markup Language (XML)'' <http://www.w3.org/TR/WD-xml-961114> の文書型。
- [87] [[FPI]] [CODE(HTML)[-//M3C//DTD XHTML Makoto Sawatari 1.6//EN]], [CODE(HTML)[-//M3C//DTD XHTML Mishio Amano 12.6//EN]], [CODE(HTML)[-//M3C//DTD XHTML Misuzu Kamio 7.23//EN]]: 単なる冗句。 ''Makoto Mishio Misuzu Cuties'' <http://m3c.misuzilla.org/>
[[#comment]]


* 文書型宣言のない HTML 文書

[79] 現在では、 HTML 文書 (あるいは [CODE(MIME)[[[text/html]]]] 実体)
には最初に文書型宣言を記述するべきであると考えられています。
[WEAK[XHTML 文書の場合は、特定の [[DTD]] に適合することを主張する場合には文書型宣言を記述するべきです。]]

[[#comment]]


** 文書型宣言のない HTML 文書 (片) の解釈

[80] >>79 はとりあえずおいておいて、文書型宣言のない HTML
(not XHTML) 文書が正しいのか考えてみます。

[81] [[WebSGML]] では文書型宣言は必須ではありませんから、
これを採用している [[HTML 4]] と [[XML]] では省略できます。
しかし HTML 4 では文書型宣言を必須と定義しています。 XML
はここでの話の対象外です。

[83] では旧来の HTML 文書で文書型宣言のないものが不当かというと、
必ずしもそうではありません。確かに、単独の文書 ([[SGML文書実体]])
としては不当です。
しかし、実はそれは[[外部解析実体]]だったとしたらどうでしょう。

つまり、[[WWWブラウザ]]は随時こんな感じの SGML 
文書実体を自動生成していると考えるのです。

[PRE[
<!SGML [VAR[その実装の SGML 宣言]]>
<!DOCTYPE [[html]] SYSTEM "[VAR[その実装の DTD]]" [
  <!ENTITY real-document SYSTEM "[VAR[当該文書の URI]]">
]>
&real-document;
]PRE]

これなら、当該文書が [[SGML文実体]]として適当である限りは、
妥当な SGML 文書じゃないですかね?

[85] >>83 の例は不正だった。 (文書要素の外の部分に[[実体参照]]は書けない。)
訂正して、
[PRE[
<!SGML [VAR[その実装の SGML 宣言]]>
<!DOCTYPE [[pre-html]] SYSTEM "[VAR[その実装の DTD]]" [
  <!ELEMENT pre-html o o (html)>
  <!ENTITY real-document SYSTEM "[VAR[当該文書の URI]]">
]>
&real-document;
]PRE]

[86] もっとも、 Web SGML ができたからもうこんな hack
を考える必要はないですし、文書型宣言もない HTML
文書実現値は往々にして SGML 的に不正なことが他にあったりするんですが。

[[#comment]]


** 仕様書の規定

[82] HTML 4 仕様書は、次のように述べています。

> HTML 2.0 仕様書は、多くの HTML 2.0 
利用者エージェントは文書が文書型宣言で始まらないとき、
HTML 2.0 仕様書を参照していると仮定すると見ていました。
経験によればこれは愚かな仮定であり、現在の仕様書はこの動作を推奨していません。

[[HTML 4]] [CITE[B.1 Notes on invalid documents]]
<IW:HTML4:"appendix/notes.html#notes-invalid-docs">

[[#comment]]


* 仕様の拡張

[91] HTML 4 は、仕様の拡張について、附属書 B (参考) で次のように述べています。

> 相互運用性の理由から、著者は SGML の仕組みを使って HTML
を[Q[拡張]] (例: DTD の拡張, 実体定義の追加, その他) してはなりません。

[[HTML 4]] [CITE[B.1 Notes on invalid documents]]
<IW:HTML4:"appendix/notes.html#notes-invalid-docs">

[92] HTML 4 は [[SGML応用]]です。 [[ISO 8879]] は SGML 応用が
SGML の仕組みの一部の使用を禁止することを認めていません。
ですから、この規定は (附属書 B (参考) の中にありますし)
強制力を持たないものであると解釈されています。

[[#comment]]


* メモ

[90]
[CODE(SGML)[<!DOCTYPE HTML PUBLIC "-//W3C//DTD Netscape 4.0//EN">]]

<http://www.hss.osaka-u.ac.jp/new/index.shtml>
([CODE(MIME)[[[text/plain]]]](藁)) で使われてます。。。
([[名無しさん]] [WEAK[2004-11-09 12:33:45 +00:00]])

[93]
上記ページの管理者です。検索でこちらに来ました。確かに、operaで見るとテキストで表示されるのでおかしいなと思っていたので確認したところ、text/htmlでした。頭のところで定義しているとおり、このページはあまり更新していないのですが、書き換えられたのかもしれません。とにかくご指摘ありがとうございました。
([[名無しさん]] [WEAK[2005-01-20 09:30:27 +00:00]])

[99]
>>90-93 よくわからないですけど依然として
[Q@en[DTD Netscape 4.0]] なのがなんとも。
([[名無しさん]] [WEAK[2007-07-04 12:17:03 +00:00]])

[[#comment]]


* メモ

[94]
[CITE@en[So, You Want An HTML Declaration, Huh?]] 
([[Joe Burns]] 著、2005年7月現在)
<http://www.htmlgoodies.com/tutorials/getting_started/article.php/3479361#intelliTxt>
(同じシリーズの内容から90年代後半に書かれたものと推測)

かなり楽しいことが書かれています。
- [Q@en[It's called an "HTML Declaration."]<http://www.htmlgoodies.com/tutorials/getting_started/article.php/3479361#intelliTxt>]
([Q[これは [DFN[HTML 宣言]]といいます。]]):
そう呼んでるのはお前らだけだ。
- [Q@en['''!DOCTYPE HTML PUBLIC''' proclaims this is an HTML document type that can be read by public browsers.]<http://www.htmlgoodies.com/tutorials/getting_started/article.php/3479361#intelliTxt>]:
([Q[これは public なブラウザが読むことの出来る HTML 文書型だと言っています。]]):
何の話だ?
- [Q@en['''//DTD HTML 3.2''' stands for '''D'''ocument '''T'''ype '''D'''escription '''H'''yperText '''M'''arkUp '''L'''anguage (version) 3.2.]<http://www.htmlgoodies.com/tutorials/getting_started/article.php/3479361#intelliTxt>]
([Q[文書型記述ハイパーテキスト・マーク付け言語 3.2 (版) を表します。]]):
[Q[文書型記述]]って何よ?
- [Q@en['''//EN''' means the document will be written in the English language.]<http://www.htmlgoodies.com/tutorials/getting_started/article.php/3479361#intelliTxt>]
([Q[''文書が''英語で書かれることを意味します。]]):
よくある間違い。

著者は [[HTML]] について詳しく知りたければ [[W3C]]
の [[Webサイト]]を頭が一杯になるまで読めと勧めていますが、
著者自身は読む前から頭が一杯で何も読まなかったのでしょうかね(藁

([[名無しさん]])

[95]
[[HTML宣言]]については別項も参照。
([[名無しさん]] [sage])

[96]
[CITE[HTML5 IRC logs: w3c / #html-wg / 20070423]] ([CODE[2007-06-30 15:38:51 +09:00]] 版) <http://krijnhoetmer.nl/irc-logs/html-wg/20070423#l-94>

> [03:12] <Hixie> and about 50% had doctypes of any kind  

[100]
[CITE[HTML5 IRC logs: freenode / #whatwg / 20070704]] ([CODE[2007-07-04 21:13:36 +09:00]] 版) <http://krijnhoetmer.nl/irc-logs/whatwg/20070704#l-230>
([[名無しさん]] [WEAK[2007-07-04 12:18:26 +00:00]])