マークの付けかた

マークの付けかた

空要素と NET

[1] <http://www.geocities.co.jp/Hollywood-Studio/8691/#SD>

<br/>
EMPTYNRM YES であり SHORTTAG STARTTAG NETENABL IMMEDNET (NET "/" NESTC ">") であるため、空要素の開始タグを <br/ として、終了タグを > として記述できます。

と書かれていますけど、 +//IDN satoshii.org//SD HTML for Geocities//EN では / が名前文字なので、 <br/> と書くと要素型名br/ とみなされてしまいます。 共通識別子または属性値の直後に nestc が来る時には必ずその間に s を入れないといけないと思われます。

定義済み文字実体

[4] 定義済み文字実体 <http://www.satoshii.org/markup/notes/2004/02#date24> より:

<!ENTITY lt      "&#38;&#60;" ><!-- less-than sign, U+003C ISOnum -->
<!ENTITY amp     "&#38;&#38;" ><!-- ampersand, U+0026 ISOnum -->

...

実は、XML にはこの辺りについての厳密な規定はありません。 定義済み文字実体に対し、「相互運用性のためには DTD でも実体宣言せよ」と の注記こそあるものの、その実体宣言がどのような意味を持つのか、すなわち XML プロセ サに対してどう働くのかといった記述は全くないのです。

それはちょっと言い過ぎです。 XML 1.0 & 1.1 曰く:

If the entities lt or amp are declared, they MUST be declared as internal entities whose replacement text is a character reference to the respective character (less-than sign or ampersand) being escaped; the double escaping is REQUIRED for these entities so that references to them produce a well-formed result. If the entities gt, apos, or quot are declared, they MUST be declared as internal entities whose replacement text is the single character being escaped (or a character reference to that character; the double escaping here is OPTIONAL but harmless).

(<http://www.w3.org/TR/REC-xml#sec-predefined-ent>, <http://www.w3.org/TR/xml11#sec-predefined-ent>)

MUST への違反は誤りですから、 適合 XML処理器はこれを検出して報告して構いませんし、 回復しても構いません

でもこの違反は整形式制約でも妥当性制約でもないですから、 その XML 文書は (他に問題が無ければ) 整形式・妥当になってしまうのですね...

[5]

<!DOCTYPE doc [
<!ENTITY STAG-doc "&lt;doc&gt;" >
<!ENTITY ETAG-doc "&lt;doc&gt;" >
]>
&STAG-doc;…文書…&ETAG-doc;

2. Well-Formed XML の仕組み - Web SGML 関連 <http://www.satoshii.org/markup/websgml/wellformed-xml#xmp1>

とか。 (名無しさん 2004-05-18 10:14:56 +00:00)

[6] >>5 すみません、読み直してみたら色々めちゃくちゃですね。修正しときます。 (satoshii 2004-09-02 21:07:13 +00:00)

[7] XHTML Media Types (ja) <http://www.satoshii.org/spec/xhtml-media-types/20020801#status>

この文書は HTML Working Group charter の範疇になく、メディア型や名前空間についての一般的な問題には取り組まない。これらの問題は Technical Architecture Group (TAG) が管轄を振り分ける。

この文を自然に読むとこの文書は HTML Working Group charter の範疇になくと誤読してしまう虞が強いと思います。 (名無しさん 2005-02-09 12:06:19 +00:00)

[8] [8] >>7 うへえ、この訳はだいぶやばげですね。

メディア型や名前空間に関する一般的な問題については、HTML Working Group charter の管轄外であるから、この文書では扱わない。これらの問題は Technical Architecture Group (TAG) が取り扱うであろう。

こんな感じに修正しました。

# ここの突っ込みはほんとありがたい ;) (satoshii 2005-02-17 02:02:17 +00:00)