[32] URL Standard は、 Web におけるアドレスである URL を定義する仕様書です。 URL の構成要素としてのホスト (ドメインIPアドレス) の定義も含まれています。


[177] URL Standard では次のものが規定されています。

[180] URL を構成する細かい概念については、 URL の項を参照。

[178] URL Standard は、 URL に関する様々な歴史的な仕様書: RFC 3986, RFC 3987, HTML StandardURL の章、 URL API, RFC 6454URLの起源の章を置き換え、統合的に規定するものです。


[179] なお IPv6アドレスの記述方法の規定には RFC 4291IDNA の取り扱いには UTR #46 を参照しています。


[33] 本項では主として HTML5 以降の「URL」 (現実世界の Webブラウザーにおける URL) について扱います。 IETF 仕様等での歴史的定義については URIIRI などの項をご覧ください。

URI の時代#

[34] 元々 Webアドレスは「URL」と呼ばれていました。 RFC 1808 までは仕様上も一般的にも URL でした。しかし、かねてから URLURN などの上位概念としての「URI」が提唱されていて、 RFC 2396 以後は仕様上は専ら「URI」という語が使われるようになりました。

[35] 仕様上の概念としても「URL」が消滅したわけではなく、 URI部分集合に過ぎないとされただけでしたが、 特に区別の必要の無い時は「URI」と呼称するのが好ましいとその筋の人達には考えられていました。

[36] URI多文字拡張は、現実には Webブラウザーで「URL」の名前のまま行われていましたが、 仕様上は「IRI」という新しい呼称が与えられました。

URL の復調#

[37] Web Forms 2.0 は、はじめは当時の仕様の世界の流れに従い input 要素type 属性の値として uri を定義していましたが、 url に変更されました。

[38] Web では CSSurl() 関数JavaScriptdocument.URL 特性HTTPRefresh: url 引数など、実質すべての場面で「URI」ではなく「URL」 が使われていました。 (namespaceURI など DOM2 / DOM3 に由来する部分だけ「URI」になっています。) そのため、 Web 開発者がより慣れ親しんでいる「URL」で統一することが望ましいと考えられたのです。

[39] ただし、このときはまだ属性値url となっただけで、 仕様書中の表現は「URI (or IRI)」などとされていました。

[54] Web Applications 1.0 (HTML5Web Forms 2.0 を含む。) は 「URI (or IRI)」という表現を使っていましたが、これだけでは現実のWebブラウザーの挙動と HTML文書著者の想定を十分記述できておらず、明確化が今後の課題とされていました。

[55] Web Applications 1.0 仕様中の他の課題が大方片付いてきた2008年5月、 URL に関して規定するべき項目のリストアップが行われました。

[56] そして2008年6月、「URL」の定義が追加されました。“URI vs URI参照”や “URI vs IRI”、“URI vs 絶対URI”といった専門家にも理解できない混乱した用語の定義を使わず、 一般的に使われている意味をベースに「URL」などの語が定義されました。また、 URI/IRI として正しいかどうかに関わらず、URL であるとして与えられたすべての文字列に関して、 schemepath などの各部の取り出しの処理や絶対URL への解決の処理をどう行うべきか、 非ASCII文字をどう処理するべきかが初めて明確に規定されました。動的な DOM の変更によって絶対URLへの解決がどう影響を受けるかも規定されました。

[57] それまでは、 URI/IRI の仕様は正しくない文字列をどう処理するべきかを規定していませんでしたし、 HTML4 など数多くの仕様書が「URI」という語の定義を正しく理解せずに書かれていたりして、 何が仕様上正しいのかを確定することもできない状況でした。現実には URI/IRI として正しくない文字列href 属性などに指定されていることはありふれていますし、 非ASCII文字は (IRI 仕様が述べているように) 単純に UTF-8 として解釈するべきではないことも多々あります。 既存のWebブラウザーの動作をリバース・エンジニアリングして真似るか、 仕様書に従い役に立たないものを作るか、という不健全な時代がやっと終わり始めました。




[2] Ian Hickson もどうせ、通るわけないだろうと最初から諦めてるんだろうね。 HTTP5 同様、議論を持ちかけたけどあっちが蹴ったという記録を残しておくために。

(名無しさん 2008-06-26 14:45:00 +00:00)

[4] >>3 いいかげんに「URL」の別名を増やすのはやめて欲しいものですね。

