[1] RSS の language
要素は、
チャンネルが記述されている自然言語を表します。
仕様書:
[3] language
要素の内容は、
Netscape が規定したリスト (>>5) に掲載されている値、または W3C
が定義した値でなければなりません RSS 2.0, RSS Best Practices Profile。
W3C が定義した値というのは HTML4 lang
属性がリンクされていますから、
実際には IETF が規定した RFC 1766 言語札を指します。
[4]
Netscape のリストとされるもの (>>5) には、 Netscape が出版した
RSS 0.91 仕様にはない et
と
haw
が追加されている旨が記述されており、それを Netscape
のリストと呼ぶのはどうかと思うのですが、それはともかく、
このリストに掲載されている言語符号はすべて RFC 3066 言語札としても正当なものです。
[2] この要素を使うことで、集積器がある自然言語で書かれたサイトを一まとめにする、 といったことができます RSS 2.0。
<language>en-us</language>
<language>epo</language>
この例は3文字の言語符号を使っていますが、 RSS 2.0 や RSS Best Practices Profile
や HTML4 を厳密に解釈すると、 RFC 1766 でも RSS Langauge Codes
でも epo
は認められていませんから、この例は非妥当になってしまいます。
[7] 本来 XML では xml:lang
属性を使うのが正当なのでしょうが、
RSS では伝統的に要素が使われてきました。 RDF ベースの RSS 1.0
でも、 Dublin Core に由来する dc:language
要素がよく使われています。一方 Atom では xml:lang
属性が使われています。
[8] HTML の meta
要素の
http-equiv
の値 Content-Language
は language
に近い存在と捉えることもできます。
haw
だけは RFC 1766 言語札としては不適切でしたが、 それ以外は RFC 1766 言語札としても正しいものです。