[1] RDF におけるリテラルは、資源でない (RDF URI参照によって表せない) 値です。
[6] リテラルは、次の3つの要素により構成されます >>4。
[26] 字句形が NFC たるべき、という規定は、絶対的な要件ではないものの、
厳しい要件には違いありません。
NFC
は破壊的な操作で、これが原因で文字化けが生じるおそれもあります。
従って任意の自然言語文を記述するために使うのは危険です。
[10] 言語タグは、データ型IRIが http://www.w3.org/1999/02/22-rdf-syntax-ns#langString
の時に限り含まれます。この場合のリテラルを特に言語タグ付き文字列といいます。
[17] >>16 は意味的不整合ですが、構文的には非整形式ではありません。 実装は ill-typed なリテラルも受け付けて RDFグラフを生成しなければなりません。 警告を出しても構いません。 >>4
[18] RDFリテラルが等値であるとは、その字句形、 データ型IRI、言語タグがいずれも文字単位で等しいことをいいます >>4。
[2] RDF 1.0 ではリテラルには次の種類がありました。
[5] RDF 1.1 ではすべて型付きリテラルになっています。平リテラルは単純リテラルと言語タグ付き文字列に相当します。
[21] RDF 1.0 では任意の符号位置が認められていたようですが、 RDF 1.1
では xs:string
なので、 U+0000 を使えず、 U+0001-U+001F
は認めなくても良いとされているようです >>20。
According to the RDF 1.1 specification (3.3 Literals), RDF literals are Unicode strings, which should be in Normal Form C (NFC). In NIF, we will follow this recommendation in general. There are, however, circumstances which require the use of Normal Form D (NFD) or even NFKC or NFKD. Therefore NIF allows NFD, NFKC and NFKD, if the use case justifies the usage.
One such use case is, if a linguistic annotator has the requirement to annotate individual diacritics or parts of precomposed characters and syllables. For linguists with this use case or applicable languages, using NFD is obvious and well-justified. We will only give examples here and refer the interested reader to these three documents: Gernot Katzer's page about the Korean Writing system, Wikipedia article about the Korean Hangul, Unicode Normal Form specification.
[23] RDF Literal Direction Working Group Charter () https://w3c.github.io/rdf-dir-literal/draft-charter.html
[24] RDF Literals and Base Directions () https://w3c.github.io/rdf-dir-literal/
[25] w3c/rdf-dir-literal: Proposal to add base direction to RDF Literals () https://github.com/w3c/rdf-dir-literal