ハイパーテキスト・マーク付け言語

HTML

[103] The World Wide Web's markup language has always been HTML.

HTML Standard

[128] HTML (えいちてぃーえむえる) (Hypertext Markup Language / ハイパーテキストマーク付け言語) は、 World Wide Web (Web) のマーク付け言語です。文書アプリケーションの構造と動作を記述できるマーク付け言語として、 歴史上世界で最も広く普及し、現在も無数に利用されています。

[13]HTML」は、マーク付け言語語彙およびそれに関連した API の総称であると共に、これを記述するための構文の名称でもあります。

[1] 構文としての「HTML」は、 HTML構文を参照。

仕様書

マーク付け言語

[104] HTML は、非常に多くの機能で構成されています。

MIME 型

[6] HTML文書MIME型text/html です。

text/html を参照。

[7] XML 構文で記述された XHTML 文書には XML MIME型が使われます。

データ構造

[24] HTML文書は、 DOM によって表されるデータ構造文字列 (またはバイト列) として表したものです。

[25] 仕様書上は専ら DOM によって HTML が規定されていますが、 Web互換性に影響のない範囲では、他の内部データ表現を用いることもできます。 例えば、 Webブラウザーではない、特定の処理のみを行う専用のソフトウェアでは、 HTML文書構文解析した結果を DOM とするかわりに、 内容を間引いて処理しやすい形に加工したデータ構造で扱うこともできます。

[26] 具体的には、 DOM 以外に次のようなデータモデルHTML の処理に使われています。

この他にも、特別な名前のない特定ソフトウェアの専用の内部形式が色々あります。

[27] HTML文書は複雑なので、正規表現で処理することはできません。 HTML文書の処理には、HTML構文解析器が必要です。

Web のマーク付け言語としての HTML

[19] Webマーク付け言語は、 Web の誕生から現在に至るまで、常に HTML でした >>103

[20] SGMLVRMLMicrosoft OfficeXMLPDFFlashSilverlight など色々な技術や製品がこの地位を狙いましたが、どれも HTML を置き換えることはできませんでした。

[22] Web の開発者の TimBL が代表をつとめる業界団体 W3C もまた、 HTMLXMLXHTML で置き換えることを目指しており、 HTML のことをまるで怨念か何かのように扱っていました >>21 が、 10年近い迷走の果てに何一つ生み出せない、完全な失敗に終わりました (XHTML 2.0 を参照)。

[23] その間も HTML の開発を継続していた民間団体 WHATWG の主張こそが本項冒頭の「Webマーク付け言語は、ずっと HTML だった」 >>103 云々なのですが、 W3C もしれっとこれをコピペして自団体の文書に掲載し、 本家面しているようです。 W3C にとっては最早 XHTML黒歴史なのでしょうか。 (その後 W3C はとうとう HTML の自力開発を断念し、 WHATWG HTMLW3C の規格として使わせてもらう契約をしました。)

[38] いまや Web にとって HTML はなくてはならない唯一の存在ですが、 HTML にとってその標準化団体は唯一不可侵の存在ではないというのが HTML の歴史の重要なポイントの一つです。 IETF, ISO, W3C と過去に HTML に関わった標準化団体も、 市場に受け入れられる標準仕様を作れないところは退場していきました。 WHATWG の地位も安泰ではなく、 市場の希望を叶えられなくなるなら次の団体が出てくることでしょう。

[39] ということは 「Webマーク付け言語である HTML」 は 「どこかの誰かが HTML だと承認したもの」 ではなく 「Web でみんなが使っているもの」 なのかもしれません。

[37] 今の Web利用者にとっては「ずっと HTML だった」 といわれてもそりゃそうだろ、ですよね。 でもその地位が脅かされていた時代もあった (それも生みの親によって) というのは記憶に留めておきたいものです。

[40] あまたの競合のうち PDF はうまいこと棲み分けして生き残ったのは興味深い点では?

[41] Flash は置き換えそうな勢いがあったように当時は思っていたけど任天堂の倒し方レベル (あるいはお釈迦様の手のひらレベル) だったという

[42] PDFpdf.js のような形でWebブラウザーに吸収されたけど Flash で同じことやろうとした試みはみんな失敗したというのは運命の分岐点。 (AppleFlash を拒んだのは市場的に大きなファクターだけど、 うまく実行エンジンを JavaScript 化できていれば滅亡まではしなかったのでは。) (あるいは因果が逆転して wasm がある時代に Flash が撲滅されそうになったら、 実行エンジンを wasm 化してなんとか生き残り得たのでは?)

[43] HTMLPDFFlashJavaScript 使ってなんか実行してレンダリングできる点は同じなんよね。 それぞれ JavaScript 以外の部分で得意不得意があるけど。 HTML に対する立ち位置なら PDFFlash も同じだったはずなのに、 PDFサブセットだけでも Webブラウザーに搭載されて生き残れたのは、 PDF が静的コンテンツメインだったからでしょうな。 Flash から動的部分を削ったら何もなくなる。

歴史

[2] 詳しくはHTMLの歴史HTMLの仕様書を参照。

[12] HTML には主として次の版がありました。

  1. HTML 1.0
  2. HTML 2.0
  3. HTML 2.x
  4. HTML 3.0
  5. HTML 3.2
  6. HTML4
  7. XHTML 1.0
  8. XHTML 1.1
  9. XHTML2
  10. XHTML 1.2
  11. HTML5
  12. HTML 5.1
  13. HTML 5.2
  14. HTML Standard

[11] このうち、 HTML 3.0 およびそれ以前は IETF の手続き上廃止または失効しています。 XHTML2XHTML 1.2 は未完成のまま破棄されました。それ以外の HTML 5.0 およびそれ以前は、 形式的には現在も有効な W3C勧告ですが、実質的に廃止状態にあります。

[3] 現在は HTMLHTML Standard で規定されています。

[14] HTML 仕様の開発は次の標準化団体が行ってきました。

[15] 現在は主として WHATWG が開発しています。

実装

[4] HTMLクライアント実装については、 Webブラウザーを参照。

他言語統合

[34] HTML への他の言語の埋め込み: HTMLにおける他言語統合点

[35] HTML を他の言語に埋め込む: HTMLの埋め込み

上位層

[5] HTML を利用し、その上に構築された技術には、次のものがあります。

前処理

[33] HTML は非常によく使われるマーク付け言語であり、 それを生成するためのHTMLに変換されることを前提とした言語も色々なものが考案されています。 HTMLの前処理

派生

[10] HTML から派生した、あるいは強く影響を受けたマーク付け言語等についてはHTMLもどき言語を参照してください。

[36] 架空HTML

メモ

[77] HTMLの参考文献も参照してください。

[89] METADATA IN HTML http://www.hixie.ch/specs/html/metadata

[97] Levels of HTML knowledge | 456 Berea Street http://www.456bereastreet.com/archive/200605/levels_of_html_knowledge/ (名無しさん 2006-05-31 22:02:05 +00:00)

[98] Your HTML level - Anne’s Weblog about Markup & Style http://annevankesteren.nl/2006/06/html-level (名無しさん 2006-06-04 08:14:39 +00:00)

[100] Websites as graphs - an HTML DOM Visualizer Applet http://www.aharef.info/static/htmlgraph/ (名無しさん 2006-06-17 12:40:37 +00:00)

[105] Main Page - Htmlpedia http://www.htmlpedia.org/wiki/Main_Page (名無しさん 2006-10-18 22:22:39 +00:00)

[106] Data persistence - Anne’s Weblog http://annevankesteren.nl/2006/10/data-persistence (名無しさん 2006-10-26 23:09:45 +00:00)

[107] Web//統計 (名無しさん [sage])

[110] Semantics in HTML - 1.”traditional semantic HTML” at microformatique - a blog about microformats and “data at the edges” (2007-01-11 09:09:55 +09:00 版) http://microformatique.com/?p=83 (名無しさん 2007-01-11 00:17:40 +00:00)

[111] Built in Semantics in HTML at microformatique - a blog about microformats and “data at the edges” (2007-01-11 09:29:07 +09:00 版) http://microformatique.com/?p=82 (名無しさん 2007-01-11 00:30:45 +00:00)

[112] draft-kikuchi-web-cert-repository-00 - Internet Public Key Infrastructure: (2007-01-27 23:13:29 +09:00 版) http://tools.ietf.org/html/draft-kikuchi-web-cert-repository-00

[113] Geekなぺーじ:HTML知識レベル (2007-02-06 09:05:17 +09:00 版) http://www.geekpage.jp/blog/?id=2007/2/5

[115] Index of /html (2007-02-12 11:58:12 +09:00 版) http://tc.labs.opera.com/html/

[116] Semantics in HTML Part II - standardizing vocabularies at microformatique - a blog about microformats and “data at the edges” (2007-02-23 08:38:20 +09:00 版) http://microformatique.com/?p=97 (名無しさん 2007-02-22 23:39:29 +00:00)

[117] Semantic data extractor - QA @ W3C (2006-11-15 14:51:23 +09:00 版) http://www.w3.org/2003/12/semantic-extractor.html (名無しさん)

[118] HTMLタグを写真で表現!『The Visual HTML Jokes Pool」』 | P O P * P O P (2007-02-26 09:13:37 +09:00 版) http://www.popxpop.com/archives/2007/02/html.html (名無しさん 2007-02-26 23:20:08 +00:00)

[119] HTML Tags illustrated | haha.nu - a lifestyle blogzine (2007-02-27 08:02:06 +09:00 版) http://haha.nu/misc/html-tags-illustrated/ (名無しさん 2007-02-26 23:30:35 +00:00)

[120] Flickr: The Visual HTML Jokes Pool (2007-02-27 08:19:54 +09:00 版) http://flickr.com/groups/htmljokes/pool/ (名無しさん 2007-02-26 23:30:50 +00:00)

[121] TeresaCentric » Best Geek Joke Ever: Head-Body Tattoo (2007-03-06 22:33:27 +09:00 版) http://teresacentric.com/2007/03/798/ (名無しさん 2007-03-06 13:35:07 +00:00)

[122] microformatique - a blog about microformats and “data at the edges” : Semantics in HTML Part III - Towards a semantic web (2007-03-15 19:48:34 +09:00 版) http://microformatique.com/?p=108 (名無しさん)

[123] WEBTECH - webtech:vantguarde (2007-03-15 21:30:02 +09:00 版) http://web.g.hatena.ne.jp/vantguarde/20070313#1173728433 (名無しさん 2007-03-15 12:31:45 +00:00)

[124] A Beginner's Guide to HTML (2003-08-15 22:48:58 +09:00 版) http://ccat.sas.upenn.edu/jod/primer.html#Acronyms

昔はみんな見ていたであろう NCSAHTML 入門ですが、 SGML について

This is perhaps best be thought of as a programming language for style sheets.

というわけのわからん説明のされ方で、その後で HTMLSGMLDTD だとか言われるわけです。

それが日本語訳では

HTML入門 (1995/6/1 編集) (1997-12-24 11:02:35 +09:00 版) http://web.archive.org/web/19980131092758/ringo.sfc.keio.ac.jp/otherdocuments/html.html#Acronyms

これはおそらく、スタイルシートを記述するための最良のプログラミング言語である。

と、 SGMLプログラミング言語であると誤訳してしまっています。 これが HTML プログラミング言語説の源流の1つの可能性はあります。 (名無しさん)

[125] My involvement with the early days of the Web (2004-12-03 00:23:13 +09:00 版) http://www.w3.org/People/Raggett/the-early-days-of-the-Web.html (名無しさん)

[126] C90%M10%Y40%: HTML売りの少女 (2007-04-03 15:46:22 +09:00 版) http://www.cyan.co.jp/blog/2007/04/html.html (名無しさん 2007-04-03 23:52:24 +00:00)

[127] 最速インターフェース研究会 :: HTMLドキュメントを解析して特徴的なループを見つけるBookmarklet (2007-06-02 22:43:52 +09:00 版) http://la.ma.la/blog/diary_200705301424.htm (名無しさん 2007-06-02 13:46:17 +00:00)

[130] IRC logs: freenode / #whatwg / 20091007 ( 版) http://krijnhoetmer.nl/irc-logs/whatwg/20091007#l-489

[131] HTML - Trademark by European Organization for Nuclear Research Geneva , - Serial Number: 74719487 ( ( 版)) http://www.trademarkia.com/html-74719487.html

[132] IRC logs: freenode / #whatwg / 20110325 ( ( 版)) http://krijnhoetmer.nl/irc-logs/whatwg/20110325#l-754

[133] IRC logs: freenode / #whatwg / 20111115 ( ( 版)) http://krijnhoetmer.nl/irc-logs/whatwg/20111115#l-1246

[134] IRC logs: freenode / #whatwg / 20120420 ( ( 版)) http://krijnhoetmer.nl/irc-logs/whatwg/20120420#l-1055

[135] [whatwg] Administrivia: Update on the relationship between the WHATWG HTML living standard and the W3C HTML5 specification ( ( 版)) http://lists.whatwg.org/pipermail/whatwg-whatwg.org/2012-July/036662.html

[136] The spec evolves... ( ( 版)) http://lists.w3.org/Archives/Public/www-talk/1992NovDec/0155.html

[137] rethinking the HTML DTD. ( ( 版)) http://lists.w3.org/Archives/Public/www-talk/1992JulAug/0012.html

[138] HTML differences from HTML4 ( ( 版)) http://html-differences.whatwg.org/

[139] [whatwg] HTML differences from HTML4 document updated ( ( 版)) http://lists.whatwg.org/pipermail/whatwg-whatwg.org/2013-May/039503.html

[140] Internationalization Tag Set (ITS) Version 2.0 ( ( 版)) http://www.w3.org/TR/its20/#def-html

[141] XLIFF Version 2.0 ( ( 版)) http://docs.oasis-open.org/xliff/xliff-core/v2.0/os/xliff-core-v2.0-os.html#fs-mod

[16] [CITE@en_US[Supported HTML Subset | Qt 4.8]] ( 版) http://doc.qt.io/qt-4.8/richtext-html-subset.html

Qt's text widgets are able to display rich text, specified using a subset of HTML 4 markup. Widgets that use QTextDocument, such as QLabel and QTextEdit, are able to display rich text specified in this way.

[17] Amazon Kindle ダイレクト・パブリッシング: Amazon の Kindle ストアでの電子出版に関するヘルプ ( 版) https://kdp.amazon.co.jp/help?topicId=A1JPUWCSD6F59O

[18] Amazon Kindle ダイレクト・パブリッシング: Amazon の Kindle ストアでの電子出版に関するヘルプ ( 版) https://kdp.amazon.co.jp/help?topicId=A1B8OEIMUN0HFY

HTMLタグ 属性 値 説明

mbp:pagebreak / 強制的に改ページします。

mbp:nu 囲まれたテキストを「下線なし」として指定します(<font>タグ属性に優先します)。

mbp:section 本のセクションを定義します。

[21] HTML の呪縛を解き放て () https://www.w3.org/2005/Talks/1122-orf-cdf/

[29] Toward Closure on HTML () https://www.w3.org/People/Connolly/drafts/html-direction.html

[30] Toward a Formalism for Communication On the Web () https://www.w3.org/People/Connolly/drafts/html-essay.html

[31] Testing mcom additions to HTML () https://www.w3.org/People/Connolly/html-test/mcom/test-mcom.html

[32] HTML Design Constraints () https://www.w3.org/MarkUp/HTMLConstraints.html

[8] >>103 の隠れた名言はいつの間にかなくなってしまってる、残念。