[5] HTTP は次の URL に関連する概念や URL を値に含むプロトコル要素を有しています。
[7] 関連して次の項も参照。
[12] HTTP によってアクセスできる資源は http:
URL で表すことができます。 http:
は HTTP over TCP/IP を、 https:
は HTTP over TLS
(HTTPS) over TCP/IP を使ったアクセスを意味しています。
[13] Unixドメインソケット上の HTTP を表す URL はありません。
[421] HTTP の要求を発行するに当ってクライアントが指定される URL のことを、対象URLといいます。クライアントにとっては、 実効要求URLは対象URLのことをいいます。
[422] 鯖は、 要求の内容やそれを受け取ったホスト名などから要求された URL を復元することになりますが、これが鯖によっての実効要求URLです。
[423] この対象URLと実効要求URLが、 HTTP の要求と応答の処理においてクライアントや鯖で通常用いられる URL です。
[424] HTTP の仕様書上は、 Content-Location:
ヘッダーの値によって決まる表現の URL も定義されています。
の項を参照してください。[415] HTTPにおけるURLの比較を参照。
[6] HTTP では起源が使われることがあります。起源も構文としては URL に含まれますが、その意味は必ずしも同じではありません。
[416] RFC 1945 (HTTP/1.0); RFC 2068・2616 (HTTP/1.1) 3.2 Uniform Resource Identifiers
URIs have been known by many names: WWW addresses, Universal Document Identifiers, Universal Resource Identifiers
{1945} [2]{2616} [3] , and finally the combination of Uniform Resource Locators (URL){1945} [4]{2616} [4] and Names (URN){1945} [16]{2616} [20] . As far as HTTP is concerned, Uniform Resource Identifiers are simply formatted strings which identify--via name, location, or any other characteristic--a{1945} networkresource.
URI は多くの名前で知られています : WWW 番地, 普遍文書識別子,
普遍資源識別子, そして最後に共通資源指示子 (URL)
と共通資源名 (URN) です。 HTTP に関係する限りでは、
(名前、位置、その他の特質によって) 識別する単なる書式化された文字列です。
URIs in HTTP can be represented in absolute form or relative to some known base URI
{1945} [9]{2616} [11] , depending upon the context of their use. The two forms are differentiated by the fact that absolute URIs always begin with a scheme name followed by a colon. {2616} For definitive information on URL syntax and semantics, see "Uniform Resource Identifiers (URI): Generic Syntax and Semantics," RFC 2396 [42] (which replaces RFCs 1738 [4] and RFC 1808 [11]). This specification adopts the definitions of "URI-reference", "absoluteURI", "relativeURI", "port", "host","abs_path", "rel_path", and "authority" from that specification.
HTTP では URI は、その使用する文脈によって絶対形で表現したり何らかの既知の基底 URI
からの相対形で表現します。二つの形式は、絶対 URI
は常に scheme 名とコロンで始まることにより区別できます。URL の構文と意味の定義的情報は (RFC 1738 と RFC 1808 を置き換える) RFC2396 『共通資源識別子 (URI): 一般構文及び意味』を見て下さい。この仕様書はその仕様書の URI-reference
, absoluteURI
, relativeURI
, port
, host
, abs_path
, rel_path
, authority
- URI = ( absoluteURI | relativeURI ) [ "#" fragment ]
- absoluteURI = scheme ":" *( uchar | reserved )
- relativeURI = net_path | abs_path | rel_path
- net_path = "//" net_loc [ abs_path ]
- abs_path = "/" rel_path
- rel_path = [ path ] [ ";" params ] [ "?" query ]
- path = fsegment *( "/" segment )
- fsegment = 1*pchar
- segment = *pchar
- params = param *( ";" param )
- param = *( pchar | "/" )
- scheme = 1*( ALPHA | DIGIT | "+" | "-" | "." )
- net_loc = *( pchar | ";" | "?" )
- query = *( uchar | reserved )
- fragment = *( uchar | reserved )
- pchar = uchar | ":" | "@" | "&" | "=" | "+"
- uchar = unreserved | escape
- unreserved = ALPHA | DIGIT | safe | extra | national
- escape = "%" HEX HEX
- reserved = ";" | "/" | "?" | ":" | "@" | "&" | "=" | "+"
- extra = "!" | "*" | "'" | "(" | ")" | ","
- safe = "$" | "-" | "_" | "."
- unsafe = CTL | SP | <"> | "#" | "%" | "<" | ">"
- national = <any OCTET excluding ALPHA, DIGIT, reserved, extra, safe, and unsafe>
For definitive information on URL syntax and semantics, see RFC 1738 [4] and RFC 1808
{1945} [9]{2068} [11] . The BNF above includes national characters not allowed in valid URLs as specified by RFC 1738, since HTTP servers are not restricted in the set of unreserved characters allowed to represent the rel_path part of addresses, and HTTP proxies may receive requests for URIs not defined by RFC 1738.
URL の構文と意味の定義的情報は RFC1738 と RFC1808
を見て下さい。上の BNF は RFC 1738 の規定する妥当な URL
これは、 HTTP サーバーは番地の rel_path
HTTP 串は RFC 1738 で定義されていない URI についての要求を受信するかもしれないことによります。
{2068,2616} The HTTP protocol does not place any a priori limit on the length of a URI. Servers MUST be able to handle the URI of any resource they serve, and SHOULD be able to handle URIs of unbounded length if they provide GET-based forms that could generate such URIs. A server SHOULD return 414 (Request-URI Too Long) status if a URI is longer than the server can handle (see section 10.4.15).
HTTP プロトコルは URI の長さに優先的な制限を設けていません。
サーバーはその供する任意の資源の URI を取扱うことができなければなりませんし、
長さに上限の無い URI を生成することがある GET
そのような URI を取扱うことができるべきです。
サーバーは、 URI が取扱うことのできる長さよりも長い場合には
414 (
Note: Servers
shouldought to be cautious about depending on URI lengths above 255 bytes, because some older client or proxy implementations may not properly support these lengths.
注意 : サーバーは、古いクライアントや串の中には255バイトを超える URI に適切に対応していない実装があるかもしれませんから、 そのような URI に依存することには慎重になるべきであります。
The "http" scheme is used to locate network resources via the HTTP protocol. This section defines the scheme-specific syntax and semantics for http URLs.
scheme は、 HTTP
この節では http
URL の scheme 依存構文と意味を定義します。
- http_URL = "http:" "//" host [ ":" port ] [ abs_path ]
- host = <A legal Internet host domain name or IP address (in dotted-decimal form), as defined by Section 2.1 of RFC 1123>
- port = *DIGIT
- http_URL = "http:" "//" host [ ":" port ] [ abs_path [ "?" query ]]
If the port is empty or not given, port 80 is assumed. The semantics are that the identified resource is located at the server listening for TCP connections on that port of that host, and the Request-URI for the resource is abs_path {2616} (section 5.1.2). {2068,2616} The use of IP addresses in URL
's SHOULD be avoided whenever possible (see RFC 1900 [24]). If the abs_path is not present in the URL, it{1945} mustMUST be given as "/" when used as a Request-URI for a resource (Section 5.1.2). {2616} If a proxy receives a host name which is not a fully qualified domain name, it MAY add its domain to the host name it received. If a proxy receives a fully qualified domain name, the proxy MUST NOT change the host name.
ポート 80
意味するところは、識別される資源はそのホストのそのポートの TCP
その資源の Request-URI
が abs_path
であるということです。IP 番地を URL で使用することは可能な限り避けるべきです。
が URL 中に現れない場合には、資源の
として使用するときには /
{1945} Note: Although the HTTP protocol is independent of the transport layer protocol, the http URL only identifies resources by their TCP location, and thus non-TCP resources must be identified by some other URI scheme.
注意 : HTTP プロトコルは転送層プロトコルとは独立していますが、
URL は TCP 位置によってのみ資源を識別しますから、
非 TCP 資源は他の URI scheme で識別しなければなりません。
The canonical form for "http" URLs is obtained by converting any UPALPHA characters in host to their LOALPHA equivalent (hostnames are case-insensitive), eliding the [ ":" port ] if the port is 80, and replacing an empty abs_path with "/".
URL の正統形は、 host
文字をすべて LOALPHA
の同等のものに変換し (ホスト名は大文字・小文字を区別しません)、
が 80
[ ":" port ]
を省略し、空の abs_path
を /
When comparing two URIs to decide if they match or not, a client SHOULD use a case-sensitive octet-by-octet comparison of the entire URIs, with these exceptions:
二つの URI が一致するかどうかを決めるために比較する時には、 クライアントは URI 全体をオクテット毎に大文字・小文字を区別して比較するべきです。 但し、次をその例外とします。
o- A port that is empty or not given is equivalent to the default port for that URI-reference;o- Comparisons of host names MUST be case-insensitive;o- Comparisons of scheme names MUST be case-insensitive;o- An empty abs_path is equivalent to an abs_path of "/".
その URI 参照の既定のポートと等しい。abs_path
は abs_path
と等しい。Characters other than those in the "reserved"
{2068,2616} and "unsafe"sets (Errata で削除)(seesection 3.2RFC 2396 [42] ) are equivalent to their ""%" HEX HEX" encodings.
集合と にある文字以外の文字は、
その unsafe
集合"%" HEX HEX
For example, the following three URIs are equivalent:
例えば、次の3つの URL は同等です。
- http://abc.com:80/~smith/home.html
- http://ABC.com/%7Esmith/home.html
- http://ABC.com:/%7esmith/home.html
Because the source of a link might be private information or might reveal an otherwise private information source, it is strongly recommended that the user be able to select whether or not the Referer field is sent. For example, a browser client could have a toggle switch for browsing openly/anonymously, which would respectively enable/disable the sending of Referer and From information.
Clients SHOULD NOT include a Referer header field in a (non-secure) HTTP request if the referring page was transferred with a secure protocol.
Authors of services which use the HTTP protocol SHOULD NOT use GET based forms for the submission of sensitive data, because this will cause this data to be encoded in the Request-URI. Many existing servers, proxies, and user agents will log the request URI in some place where it might be visible to third parties. Servers can use POST-based form submission instead
HTTP プロトコルを使用するサービスの著者は、繊細なデータの送信に
なぜなら、そうするとそのデータは Request-URI
に符号化されてしまいます。多くの既存の鯖, 串,
利用者エージェントは、要求 URI をどこかしら第三者に可視であるかもしれないところに記録します。
サーバーは代わりに POST
Implementations of HTTP origin servers
shouldSHOULD be careful to restrict the documents returned by HTTP requests to be only those that were intended by the server administrators. If an HTTP server translates HTTP URIs directly into file system calls, the servermustMUST take special care not to serve files that were not intended to be delivered to HTTP clients. For example,UnixUNIX, Microsoft Windows, and other operating systems use ".." as a path component to indicate a directory level above the current one. On such a system, an HTTP servermustMUST disallow any such construct in the Request-URI if it would otherwise allow access to a resource outside those intended to be accessible via the HTTP server. Similarly, files intended for reference only internally to the server (such as access control files, configuration files, and script code)mustMUST be protected from inappropriate retrieval, since they might contain sensitive information. Experience has shown that minor bugs in such HTTP server implementations have turned into security risks.
HTTP 起源鯖の実装者は、 HTTP 要求により返される文書が鯖管理者により意図されたものだけとなるように制限することに注意を払うべきです。
HTTP 鯖が HTTP URI を直接ファイル・システム呼出しに翻訳するのであれば、
鯖は HTTP クライアントに配送されることを意図していないファイルを給仕しないように特別の注意を払わなければなりません。
例えば、 UNIX, MicrosoftWindows, および他のオペレーティング・システムは、
経路部品 ..
このようなシステムでは、 HTTP 鯖は、 Request-URI
中でそのような構造があると、 HTTP 鯖を介して接続可能とすることを意図しているもの以外の資源に接続することを認めてしまうなら、
経験によれば、そのような HTTP 鯖実装での小さな不具合が安全上の危険性となります。
注: 変更点は RFC 1945 → RFC 2068 のもの。