表示文字実体集合

表示文字実体集合

[1]

表示文字実体集合 (display character entity set)
対応する定義文字実体集合と同じ実体名をもつ表示される文字実体集合。 これは、対応する定義の文字実体集合の装置依存版である。 (JIS X 4151‐1992 3. (106)

[2] つまりですよ。ある文字実体集合があるとします。 その公開識別子+//IDN example.org//ENTITIES characters//EN で、漢字「一」が含まれているとします。とすると、その定義は、 <!ENTITY one SDATA "[han ideograph one]"> とでもしておきます。 (これは定義文字実体集合です。)

ある装置では、 UCS (ISO/IEC 10646) が使えるとします。 そうすると、その装置で使う表示文字実体集合 (公開識別子は +//IDN example.org//ENTITIES characters//EN//UCS とでもしておきましょう。) でこの実体宣言は、 <!ENTITY one "&#x4E00;"> と書かれていることでしょう。

別の装置では、文書文字集合日本語EUC なので、 +//IDN example.org//ENTITIES characters//EN//EUC-Japan, <!ENTITY one "&#xB0EC;"> を使います。

また別の装置では、シフトJIS+//IDN example.org//ENTITIES characters//EN//Shift-JIS, <!ENTITY one "&#x88EA;"> を使います。 (でも SGML の文書文字集合が SJIS で使い物になるのかは知りません。)

[3] >>2 DoCoMo 辺りがよく知っていそうだw