非SGML文字

非SGML文字

[1]

非 SGML 文字 (non‐SGML character)
文書文字集合中の文字であって、 符号化表現SGML実体中に現れてはならないもの。 (JIS X 4151‐1992 3. (206))

[5]

JIS X 4151‐1992 12.1.2 非 SGML 文字の認定
文字集合区分で意味をもたないと指定した文字は、 非 SGML 文字と認定し、 NONSGML に加える。

備考 文書を受け取って変換を施した後でも、 その新しい文書文字集合が制御文字に別の符号化表現を対応付けていれば、 非 SGML 文字の種類が違ってくることがある。

回避文字は、それが重要な SGML 文字でない限り、 非 SGML 文字とする。

備考 1. 表8及び表9では、文字番号9,10及び13の文字が、 機能文字であることから、回避文字でありながら非 SGML 文字には割り当ててない。

備考 2. 文書に二つの具象構文を使う場合、 その両方の回避文字がこの規定の対象となる。

[2] 非 SGML 文字は直接にこそ SGML 実体中に書くことは出来ませんが、 文字参照を使うことで文字データに含めることができます。 (JIS 8.2 を参照。)

[3] SGML宣言文書文字集合の指定によって 意味を持たないとされた文字は非 SGML 文字, NONSGML に分類されます。 (JIS 12.1.2 を参照。)

[4] 回避文字は、それが重要なSGML文字でない限り、 やはり非 SGML 文字になります。 (JIS 12.1.2 を参照。)

複数の具象構文を使うときは双方の回避文字がその対象となります。 (JIS 12.1.2 備考 2. を参照。)

[6] >>5 JIS 12.1.1.2 によりますと、文字集合区分で SGML の文字番号が (UNUSED ではなく) 基本集合文字番号に対応付けてあっても、基本集合の側でその文字が意味をもたないのであれば意味をもたないのだそうです。 この場合、文字集合区分で意味をもたないと指定した文字には該当しないと思うのですが、それでよいのでしょうか? 非 SGML 文字にはならないのでしょうか?