[1] XML情報集合は DOM を含めた種々のデータモデルを元に作られましたから、 DOM木を XML情報集合に変換することができますし、XML情報集合をDOM木に変換することもできます。 ただし一方から他方へと完全に (情報損失なく) 変換することができるわけではありません。
[4] HTML構文解析器の出力を XML に対応したツールに引き渡すときに、 HTML DOM を XML と互換性のある形式に変換する方法を HTML Standard は定義しています。
[6] DOCTYPE に対応していないなら、 DOCTYPE
を除去して構いません >>3。
[7] 名前空間なしの xmlns 属性、
xmlns: で始まる名前の属性、
XMLNS名前空間の属性に対応していないなら、これらを除去して構いません >>3。
[8] 必要に応じて名前空間宣言を出力して構いません >>3。
[9] 要素や属性の局所名で使えない文字が含まれていれば、 Uhhhhhh
(h は大文字の十六進数字) という形式の符号位置の表記に置き換えて構いません >>3。
[10] 注釈に2連続の - や末尾の - を入れられないなら、
最初の - の後に U+0020 を挿入して構いません >>3。
[11] 文字データ、属性値、注釈で認められない文字があれば、
U+000C は U+0020、それ以外は U+FFFD
に置き換えて構いません >>3。
[12] 無奇癖モード、限定奇癖モード、奇癖モードの区別を保持できないなら、 除去して構いません >>3。