<html xmlns="http://www.w3.org/1999/xhtml" a0:Name="SuikaWiki" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:Version="0.9"><head></head><body><p><a0:anchor-end a0:anchor="1">[1]</a0:anchor-end> 【<a0:anchor>SGML</a0:anchor>】</p><blockquote><ul><li><code class="SGML">最小表記 = (<a0:anchor>lit</a0:anchor>, 最小データ, lit) | (<a0:anchor>lita</a0:anchor>, 最小データ, lita) —(76)</code></li><li><code class="SGML">最小データ = 最小データ文字* —(77)</code></li><li><code class="SGML">最小データ文字 = <a0:anchor>RS</a0:anchor> | <a0:anchor>RE</a0:anchor> | <a0:anchor>SPACE</a0:anchor> | <a0:anchor>LCLetter</a0:anchor> | <a0:anchor>UCLetter</a0:anchor> | <a0:anchor>Digit</a0:anchor> | <a0:anchor>Special</a0:anchor> —(78)</code></li></ul><p>最小表記は、その最小データの中の <code class="SGML">RS</code>
を無視し、2個以上連続する <code class="SGML">RE</code> 及び
<code class="SGML">SPACE</code> (先頭及び末尾に位置する場合を除く。)
を1個の <code class="SGML">SPACE</code> に置換した上で解釈する。 <ins>(以上 <a0:anchor>JISX4151</a0:anchor>‐1992 9.1.7)</ins></p><p><strong>量的制限</strong> 解釈を終えた最小表記の長さは、
その<a0:anchor>区切り子</a0:anchor>を除いて、 (<a0:anchor>具象構文</a0:anchor>の定義にかかわらず)
<a0:anchor>規格参照量集合</a0:anchor>の中の量 <code class="SGML"><a0:anchor>LITLEN</a0:anchor></code>
の値以下でなければならない。 <ins>(同 9.1.7.1)</ins></p></blockquote><p><a0:anchor-end a0:anchor="2">[2]</a0:anchor-end> 最小表記は、例えば<a0:anchor>公開識別子</a0:anchor>を指定するのに使います。 </p><p><a0:anchor-end a0:anchor="3">[3]</a0:anchor-end> 
規格参照量集合の <code class="SGML">LITLEN</code> の値は <code class="SGML">240</code>
です。従って、 <code class="SGML">RE</code> 及び <code class="SGML">SP</code>
の<a0:anchor>正規化</a0:anchor>の結果の文字列 (区切子 <code class="SGML">lit</code>
又は <code class="SGML">lita</code> を除く。) の長さが 240
以下でなければなりません。</p><p><samp class="SGML">&quot; <code class="SGML">RE</code><code class="SGML">RS</code> foo <code class="SGML">RS</code>bar <code class="SGML">RS</code><code class="SGML">RS</code>FOO<code class="SGML">TAB</code>     <code class="SGML">RS</code><code class="SGML">RE</code>   <code class="SGML">TAB</code><code class="SGML">RS</code><code class="SGML">RS</code>.<code class="SGML">RS</code><code class="SGML">RE</code><code class="SGML">RE</code>&quot;</samp>
を解釈すると、その値は
<samp class="SGML">&quot; <code class="SGML">RE</code> foo bar FOO<code class="SGML">TAB</code> <code class="SGML">TAB</code>.<code class="SGML">RE</code><code class="SGML">RE</code>&quot;</samp>
となります。たぶん。</p><p><a0:anchor-end a0:anchor="4">[4]</a0:anchor-end> <a0:anchor>WebSGML</a0:anchor> では <a0:anchor>Special</a0:anchor> が拡張されています。
従って、最小データで使用することが出来る文字は、<dl><dt><a0:anchor>旧来の SGML<title xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:10:">素のSGML</title></a0:anchor></dt><dd>[\{<code class="SGML">RS</code>}\{<code class="SGML">RE</code>}\{<code class="SGML">SPACE</code>}A-Za-z0-9'()+,-./:=?]</dd><dt><a0:anchor>Web SGML</a0:anchor></dt><dd>[\{<code class="SGML">RS</code>}\{<code class="SGML">RE</code>}\{<code class="SGML">SPACE</code>}A-Za-z0-9!#$%'()*+,-./:;=?@_]</dd></dl></p><ul><li><a0:anchor-end a0:anchor="5">[5]</a0:anchor-end> 2個以上連続する〜だから、1個だけの <code class="SGML">RE</code> はそのままなんだ。2個以上連続する (<code class="SGML">RE</code> 及び <code class="SGML">SPACE</code>) なのか 2個以上連続する <code class="SGML">RE</code> 及び2個以上連続する <code class="SGML">SPACE</code> なのかも実はよく分からん・・・。</li><li><a0:anchor-end a0:anchor="6">[6]</a0:anchor-end> <a0:anchor>XML</a0:anchor> の場合の公開識別子表記の解釈 (<a0:anchor a0:anchor="4">公開識別子</a0:anchor>) と話がちょっと違いますね。。。 この違いは正しいものなのかなあ? それとも SGML のミス? (でもミスなら 1986 年から今まで誰も気づかないのはおかしいし。。。)</li><li><a0:anchor-end a0:anchor="7">[7]</a0:anchor-end> <code class="SGML">lita</code> (<code class="SGML">'</code>) を使っていると、公開識別子に <code class="SGML">'</code> が使われている場合困ってしまいます。 <code class="SGML">'</code> は公開識別子に使うべきではないでしょう。</li><li><a0:anchor-end a0:anchor="8">[8]</a0:anchor-end> <a0:anchor>素の SGML<title xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:10:">素のSGML</title></a0:anchor> では76文字。</li><li><a0:anchor-end a0:anchor="9">[9]</a0:anchor-end> <a0:anchor>Web SGML</a0:anchor> では84文字。</li><li><a0:anchor-end a0:anchor="10">[10]</a0:anchor-end> <a0:anchor-internal a0:anchor="8">&gt;&gt;8</a0:anchor-internal>-9 は長さじゃなくて文字の種類の話。素の SGML ではどんな環境でも使える文字を選んでいたのに、 Web SGML ではそうじゃない文字まで加えちゃって、軽率というべきか、時代の変化というべきか。</li></ul></body></html>