[12] 
[[SGML]] には、 [[SGML]] に従って解釈できない任意の[[データ]]を扱うための[[データ実体]]という構造が存在していました。

[13] [[XML]] には同様の[[非解析対象実体]]が存在していました。
ただし [[SGML]] に比べると極めて限定的でした。

[16] 
[[文字データ実体]]や[[特定文字データ実体]]は、
[[バイト]]と[[文字]]の変換に当たる部分は [[SGML]]
の通常の方法により、その結果の解釈は[[応用]]と[[実装]]に依存した方法により定めるものでした。
[[特定文字データ実体]]は[[文字実体]]の記述によく使われていました。

[14] 
[[非SGMLデータ実体]]や[[非解析対象実体]]は、
例えば [[SGML文書]]に [[JPEG]] [[画像]]を埋め込むような場合に使う想定だったようです。
それ以外にも [[SGML]] だけで記述しきれないものを扱うための[[拡張点]]として運用可能な仕組みでした。

[15] ただその柔軟性ゆえに具体的な利用方法や処理方法の規定が一切存在せず[[応用]]や[[実装]]に委ねられており、
[[相互運用性]]に欠け使いづらいという面もありました。

* SGML データ実体

[1]
[[データ]]として[[宣言]]し、[[参照]]のときに[[構文解析]]しない[[実体]]。 data entity。 備考 これには、[[文字データ実体]], [[特定文字データ実体]]及び[[非SGMLデータ実体]]の3種類がある。 ([[JISX4151]]‐1992 定義 (174))

[2] [SAMP(SGML)[<![[ENTITY]] name [[CDATA]] "data">]] のようにして宣言される実体のことですね。

[3]
データ実体を宣言するときに使用する[[鍵語]] ([[規格参照具象構文]]の場合):
:[CODE(SGML)[[[CDATA]]]]:文字データ実体
:[CODE(SGML)[[[SDATA]]]]:特定文字データ実体
:[CODE(SGML)[[[NDATA]]]]:非 SGML データ実体

([[名無しさん]])

[4]
- [[外部データ実体]]を[[実体宣言]]で宣言するときには、 >>3 の鍵語の後に[[記法名]]と、省略可能な[[データ属性指定]]が続きます。 ([[JIS X 4151]]‐1992 9.5.5 参照)
- [[内部データ実体]]は、鍵語の後に[[引数表記]]を指定します。ただし、 [CODE(SGML)[NDATA]] は使えません。
また、内部データ実体に[[データ内容記法]]を指定することはできません。

([[名無しさん]])

[5]
データ実体は、文字データ実体・特定文字データ実体は0文字以上の[[SGML文字]]の列、非 SGML データ実体は0文字以上の[[文字]]の列です。 (JIS X 4051‐1992 5.3 参照。)

内部データ実体は、実体宣言の[[実体値]]です。 (JIS X 4051‐1992 9.5.3 参照。)

* XML 非解析対象実体

[8] 
[[XML]] としての構文に合致しない[[実体]]を、
[DFN[[RUBYB[非解析対象実体]@en[non‐parsed entity]]]]といいます。

[9] 
ありがちな使用例としては、埋め込み画像とか、音とか、動画とか。 [[TeX]] の数式とか。

[10] 
もっとも、 [[TeX]] みたいな text 系は SGML とも親和性が悪くないから、[[内容モデル]]が [CODE(SGML)[[[CDATA]]]] な要素の内容にでもしておいて、 [CODE(SGML)[[[NOTATION]]]] 属性でその書式を明示しておくのが常套手段かも。

[11] 
非解析対象実体は[[内部実体]]にはできませんから、必ず別の[[ファイル]]なり[[資源]]なりが必要になってしまいます。だからやっぱり >>10 のような手が可能ならそうしたいかもしれません。特に短い内容ならね。

[6] 
あ、念のため。 >>10 は解析対象実体の一部を[[応用]]が SGML 以上の解釈をするだけであって、その部分に非解析対象実体が埋め込まれているとは言いません。

** 分類

[17] 
[[非解析対象実体]]は[[実体]]の一種です。[[実体]]には[[非解析対象実体]]の他に[[解析対象実体]]があります。

[7] [[非解析対象実体]]は [[SGML]] でいう[[データ実体]]に相当します。


* メモ