DOMとXML情報集合

DOMとXML情報集合

[1] XML情報集合DOM を含めた種々のデータモデルを元に作られましたから、 DOM木XML情報集合に変換することができますし、XML情報集合DOM木に変換することもできます。 ただし一方から他方へと完全に (情報損失なく) 変換することができるわけではありません。

DOM3 における対応関係

[2] DOM3XML情報集合からDOMへ、またDOMからXML情報集合への変換方法を定義していました。

HTML から XML 情報集合への変換

[4] HTML構文解析器の出力を XML に対応したツールに引き渡すときに、 HTML DOMXML と互換性のある形式に変換する方法を HTML Standard は定義しています。

[5]情報集合」への変換とは言っていますが、XML情報集合の用語で説明されているわけではなく、 具体的な表現形式には触れない曖昧な定義となっています。

仕様書

定義

[6] DOCTYPE に対応していないなら、 DOCTYPE を除去して構いません >>3

[7] 名前空間なしxmlns 属性xmlns: で始まる名前の属性XMLNS名前空間属性に対応していないなら、これらを除去して構いません >>3

[8] 必要に応じて名前空間宣言を出力して構いません >>3

[9] 要素属性局所名で使えない文字が含まれていれば、 Uhhhhhh (h大文字十六進数字) という形式の符号位置の表記に置き換えて構いません >>3

[10] 注釈に2連続の - や末尾の - を入れられないなら、 最初の - の後に U+0020 を挿入して構いません >>3

[11] 文字データ属性値注釈で認められない文字があれば、 U+000CU+0020、それ以外は U+FFFD に置き換えて構いません >>3

[12] 無奇癖モード限定奇癖モード奇癖モードの区別を保持できないなら、 除去して構いません >>3

[13] form要素指示子の情報を保持できないなら、除去して構いません >>3

[14] template 要素雛形内容を保持できないなら、除去して構いません >>3