[1] XML情報集合 (Information Set = Infoset) は、 XML文書の持っている情報の種類を抽象的に定義したもの (「抽象データ集合」 >>24) です。
[9] XML名前空間を採用している XML 1.0 の整形式文書を対象としています。 (後に XML 1.1 も扱えるように修正されました。)
[45] XML情報集合は、XML のデータモデルの標準と考えられています。
[25] XML情報集合は、XML情報集合仕様書が規定する抽象データ集合です >>24。
[26] XML情報集合は、整形式 XML文書中の情報を参照する時に使う一貫した定義の集合を提供することを目的としたものです >>24。
[27] XML文書は、整形式であり、名前空間URLが相対URLでないなら、 情報集合を持ちます >>24。
[38] どのような情報集合であるかは、XML の版により異なることがあります >>24。
[29] 情報集合は、XML文書の構文解析以外の方法、例えば API の操作で作ることもできます >>24。 そのようなものを合成情報集合といいます >>24。
[39] 合成情報集合は、不完全あるいは一貫しない情報が含まれていることがあります。 その場合、そのままでは XML文書として表現できないこともあります。 >>24
[31] XML情報集合は、情報項目により構成されます。情報集合は木、 情報項目は節点に相当します。
[32] XML情報集合は、 API 等によって情報を提供する具体的な方法を規定するものではありません。 具体的な方法は、木構造である必要すらありません。 >>24
[10] XML 文書の情報集合は情報項目 で構成されます。
[11] 各情報項目には特性があります。 仕様書では特性は角括弧で括って示されています。
[16] XML 情報集合 IW:Infoset:"" は XML 文書に関する基本的な情報項目と特性を定義しています。
[30] XML情報集合の情報項目と特性は、すべてを網羅することを意図したものではなく、 主として他の仕様書から参照するに当っての有用性を考慮して含めるかどうかを決めています >>24。 XML情報集合が XML処理器の返さなければならない情報の最小集合であるというわけでもありません >>24。
An RDF Schema for the XML Information Set http://www.w3.org/TR/2001/NOTE-xml-infoset-rdfs-20010406 は XML 情報集合の情報項目や特性を RDF の語彙として定義しています。
[15] XInclude http://www.w3.org/TR/xinclude/ は拡張特性を定義しています。
[17] XML Schema IW:XMLSchema1:"" は PSVI を定義しています。
A schema for serialized infosets http://www.w3.org/2001/05/serialized-infoset-schema.html は XML 情報集合と XML Schema PSVIの XML 表現 (の XML Schema 定義) を用意しています。
[18] XML Linking and Style http://www.w3.org/TR/2001/NOTE-xml-link-style-20010605/ は XLink に関する特性などを提案しています。
[19] Using RDF to model XML structures (Abstract) http://www.w3.org/2000/10/swap/infoset/xmod67.html
Dan Connolly のメモ。
[34] DOM3 は DOM と XML情報集合との関係を規定していました。 DOM2 以前で提供されていなかった XML情報集合中の情報にアクセスする属性も追加されています。 しかしこれらは現在の DOM Standard には引き継がれていません。
[35] XPath 1.0 は XPath 1.0データモデルとXML情報集合との関係を規定しています。
[41] Web は当初より DOM を使っていました。 DOM は XML情報集合の設計時に (XPath 1.0データモデルや SAX と共に) ベースとされたようですから、 データモデルには類似性があります。しかし完全には同一ではありません。 両者の対応関係は、 DOM3 Core ではじめて明確化されました。
[42] ただしそれは仕様上の XML と仕様上の DOM との対応関係を記述したものに過ぎず、 どちらも実際の Web 上の用法や実装とは細部において異なっていました。 後に Web 側で新たに開発された XML5 や DOM Standard は、 どちらもXML情報集合を使っていません。
[43] Atom は XML情報集合上の語彙として規定されました。しかしそれ以外のマーク付け言語は (古くは) SGML や XML の語彙として、または (近年では) DOM 上の語彙として規定する形を採っています。 XML の衰退に伴い、 今後新たな語彙が XML情報集合として規定される可能性は低いと思われます。
[46] XML 本体 (構文) の仕様書が完成した後、 DOM や XPath 1.0データモデルや SAX が使われるようになった後、 XML情報集合の開発が進められていきました。
[21] 情報項目 & 情報集合の変遷:
WD 990517 | WD 991220 | WD 000726 | WD 001220 | WD 010202 | LWD 010316 | CR 010514 | PR 010810 | REC 011024 | PER 041210 | REC 040204 | |
文書情報項目 | |||||||||||
[] | 子供 | ||||||||||
文書実体 | X | ||||||||||
文書要素 | |||||||||||
[] | 記法 | ||||||||||
[] | 実体 | X | |||||||||
非解析対象実体 | |||||||||||
基底URI | |||||||||||
[] | 子供—注釈 | X | |||||||||
[] | 子供—文書型 | X | |||||||||
[] | 実体—その他 | X | |||||||||
[] (属性宣言) | X | ||||||||||
文字符号化方式 | |||||||||||
単独 | |||||||||||
版 | |||||||||||
全宣言処理済 | |||||||||||
要素情報項目 | |||||||||||
[] | 名前空間URI | 名前空間名 | |||||||||
[] | 局所名 | ||||||||||
接頭辞 | |||||||||||
[] | 子供 | ||||||||||
[] | 属性 | ||||||||||
宣言名前空間 | X | ||||||||||
名前空間属性 | |||||||||||
適用範囲内名前空間 | |||||||||||
[] | 子供—注釈 | X | |||||||||
子供—実体標識子 | X | ||||||||||
子供—文字データ標識子 | X | ||||||||||
基底URI | |||||||||||
親 | |||||||||||
[] (実体) | X | ||||||||||
属性情報項目 | |||||||||||
[] | 名前空間URI | 名前空間名 | |||||||||
[] | 局所名 | ||||||||||
接頭辞 | |||||||||||
正規化値 | |||||||||||
[] | 子供 | X | |||||||||
指定 | |||||||||||
[] (属性宣言) | X | ||||||||||
既定値 | X | ||||||||||
属性型 | |||||||||||
参照 | |||||||||||
子供—実体標識子 | X | ||||||||||
所有者要素 | |||||||||||
処理指令情報項目 | |||||||||||
[] | 対象 | ||||||||||
[] | 内容 | ||||||||||
基底URI | |||||||||||
記法 | |||||||||||
親 | |||||||||||
[] (実体) | X | ||||||||||
未知実体への参照情報項目 | 読み飛ばした実体への参照情報項目 | 未展開実体参照情報項目 | |||||||||
[] | 名前 | ||||||||||
[] | 被参照 | 実体 | X | ||||||||
システム識別子 | |||||||||||
公開識別子 | |||||||||||
宣言基底URI | |||||||||||
[] (実体) | X | ||||||||||
親 | |||||||||||
文字情報項目 | |||||||||||
文字符号 | |||||||||||
要素内容空白 | |||||||||||
[] (字句的種類) | X | ||||||||||
定義済実体 | X | ||||||||||
[] (実体) | X | ||||||||||
親 | |||||||||||
注釈情報項目 | |||||||||||
内容 | |||||||||||
[] (実体) | X | ||||||||||
親 | |||||||||||
文書型宣言情報項目 | |||||||||||
[] | 外部DTD | X | |||||||||
システム識別子 | |||||||||||
公開識別子 | |||||||||||
子供 | |||||||||||
親 | |||||||||||
実体情報項目 | 実体宣言情報項目 | X | |||||||||
[] | 実体型 | X | |||||||||
[] | 名前 | X | |||||||||
[] | システム識別子 | X | |||||||||
[] | 公開識別子 | X | |||||||||
基底URI | X | ||||||||||
[] | 記法 | X | |||||||||
[] | 内容 | X | |||||||||
charset | X | ||||||||||
単独 | X | ||||||||||
[] (実体) | X | ||||||||||
内部実体情報項目 | X | ||||||||||
名前 | X | ||||||||||
内容 | X | ||||||||||
外部実体情報項目 | X | ||||||||||
名前 | X | ||||||||||
システム識別子 | X | ||||||||||
公開識別子 | X | ||||||||||
基底URI | X | ||||||||||
charset | X | ||||||||||
非解析対象実体情報項目 | |||||||||||
名前 | |||||||||||
システム識別子 | |||||||||||
公開識別子 | |||||||||||
宣言基底URI | |||||||||||
記法名 | |||||||||||
記法 | |||||||||||
記法情報項目 | |||||||||||
[] | 名前 | ||||||||||
[] | システム識別子 | ||||||||||
[] | 公開識別子 | ||||||||||
基底URI | X | X | 宣言基底URI | ||||||||
[] (実体) | X | ||||||||||
属性宣言情報項目 | X | ||||||||||
[] (名前) | X | ||||||||||
[] (要素型名) | X | ||||||||||
[] (既定値) | X | ||||||||||
[] (属性型) | X | ||||||||||
[] (列挙値) | X | ||||||||||
[] (既定型) | X | ||||||||||
[] (実体) | X | ||||||||||
実体開始標識子情報項目 | X | ||||||||||
実体 | X | ||||||||||
親 | X | ||||||||||
実体終了標識子情報項目 | X | ||||||||||
実体 | X | ||||||||||
親 | X | ||||||||||
文字データ開始標識子情報項目 | X | ||||||||||
親 | X | ||||||||||
文字データ終了標識子情報項目 | X | ||||||||||
親 | X | ||||||||||
名前空間宣言情報項目 | 名前空間情報項目 | ||||||||||
接頭辞 | |||||||||||
名前空間URI | 名前空間名 | ||||||||||
子供 | X | ||||||||||
所有者要素 | X |
注意: この表では名前が同じものを同じとしていますが、 名前が同じだからといって semantics や値域も同じとは限りません。
注意: 最初の WD では特性名がありませんでした。 2番目の WD で相当するものが既になくなっている特性については丸括弧内に適当な名前を与えています。
[47] XML Information Set Requirements, , https://www.w3.org/TR/1999/NOTE-xml-infoset-req-19990218.html
[12] W3C XML Information Set Errata http://www.w3.org/2001/10/02/xml-infoset-errata.html
この文書は、仕様書の FE と SE の両方の正誤表になっています。 E01〜E03 は FE に対する修正で、 FE と SE の (正確な) 差分でもあります。
xmlns:prefix=""
に対応する名前空間情報項目が存在するという規定。
(以前から、接頭辞無しの xmlns=""
という
null名前空間宣言に対して名前空間情報項目が存在することとなっており、
その自然な拡張になっています。)]][2] 例えば XPath や DOM は XML 文書の構造を節の集合として扱ったりしますが、実体参照やマーク区間の扱いで微妙な差があったりします。そのような差異が決定的なものにならないようにどんな情報が存在しえるのかの指針とすべく作ったような感じの規格です。
[13] 2003-12-11 23:57:57 +00:00 名無しさん: >>12 の修正を反映した SE が出るみたいです : XML Information Set, second edition http://www.w3.org/TR/2003/PER-xml-infoset-20031210/
[14] で、その SE が勧告になりました http://www.w3.org/TR/2004/REC-xml-infoset-20040204。 FE との差分をとってみましたが、 >>12 の修正だけで、 他は一切変更がありませんでした。 (同時に勧告になった XML 1.1 や XML名前空間 1.1 のように変更点一覧にも載っていない修正がある規格とは大違いで、 素晴らしいことです。 (まあ、両規格と比べて抽象的なので大していじるところもないんですが。))
[20] 他のデータ・モデルとの関係
XML情報集合 | DOM | XPath 1.0データ・モデル | SGML |
---|---|---|---|
情報集合 | 木 | 木 | グローブ |
情報項目 | 節点 | 節点 | 節点 |
特性 | 属性 | (名前無し) | 特性 |
注意: 対応はおおよそのものであり、実際には詳細で異なる点が色々とあります。
[22] The elaborated infoset: A proposal ( 版) http://www.w3.org/2001/tag/doc/elabInfoset.html (名無しさん 2007-02-01 13:40:15 +00:00)