[1] urn:x-suika-fam-cx:lang:
で始まる
URI参照は、 IETF の言語札に対応する識別子です。
[2] 言語札: IETF の言語札は RFC 1766
で最初に定義され、現在は RFC 3066 に基づいています。
現在改訂版が準備中です。どの版も一応は名前空間に矛盾無く作られているので、
urn:x-suika-fam-cx:lang:
では特に区別しません。
IANA に登録することもできますが、登録・未登録も特に区別しません。
[3] 構文: urn:x-suika-fam-cx:lang:
に属する URI参照は、次のような構文とします。
lang-uri := "urn:x-suika-fam-cx:" 'lang:' language-tag ["#" fragment]
language-tag := suika-urn-atom ;; 小文字の IETF 言語札
suika-urn-atom := <<http://suika.fam.cx/admin/assign/urn-20050519#SYNTAX-SUIKA-URN-ATOM>>
IETF の言語札は大文字・小文字を区別しないことになっていますが、 この URI参照群では一律に小文字で扱います。
IETF の言語札が使われるべき文脈で、
誤って不正な文字列が使われることがあります。
そのような場合も含めて機械的に処理する場合に限り、
IETF の言語札として不適当なものを
suika-urn-atom
として用いても構いません。
その場合、非予約文字以外は百分率符号化しなければならないことに注意して下さい。
注意: 非予約文字のうち、 LOW LINE
,
FULL STOP
, TILDE
は使用することができません。将来親名前空間における構文規則が変更されれば、
これらの文字の使用も認めるかもしれません。
[5] 識別子の固有性・永続性と登録: この名前空間に属する URI (但し、素片識別子は考えません。) は、すべて IETF 言語札と一対一に対応するものとします。 ですから、ある URI の固有性・永続性は対応する IETF 言語札の固有性・永続性に依存します。
IETF 言語札では、一部を除いて登録無しで文字列を使うことができます。 ですから、一部の意味が確定しているものと登録済みのものを除き、 固有性は保障されません。 意味が確定しているものと登録済みのものは廃止されたり非推奨とされたりすることがあるようですが、 非互換な再割当てが行われない限りは永続性が保障されているといえます。 しかし、登録無しのものが将来異なる意味で登録されることがありますから、 一般に永続性は保障されません。
登録済みの言語について他の文字列に再登録されることが頻繁に行われていますから、
言語と識別子の一対一対応はまったく成り立ちません。
また、そもそも言語
と呼ばれる対象の識別性が曖昧という問題もあります。
[4] 登録雛形:
sub-nid
lang