符号化図形文字

図形文字

[11] 符号化文字集合における文字のうち制御文字でないものを図形文字 (ずけいもじ) (graphic character) といいます。

仕様書

意味

[26] 図形 (ずけい) (Graphic) は、 符号点型の1つです。 >>25 D10a 符号点型図形である符号点は、 General Category で細分され、 L, M, N, P, S, Zs のいずれかに属します (これらの General Category符号点は、 他の符号点型には属しません)。 >>44

[20] 図形文字は、 General CategoryLetter (L)、 Combining Mark (M)、 Number (N)、 Punctuation (P)、 Symbol (S)、 Space Separator (Zs) の文字です。 >>19

[21] 私用文字 (Co) を図形文字と解釈するかどうかは、 実装により定めることとされています。 >>19

歴史

[14] 画面に表示できる文字を、 印字可能文字 (printable character) といいます。

[15] 図形文字は、文字コード仕様書で伝統的に使われてきた専門用語です。 印字可能文字は、それ以外の場面で使われることが多い用語です。 印字可能文字の厳密な定義があるのかどうかはわかりませんが、 両者は交換可能な用語と思われます。

[1] >>4 「通常・・・可視的表現をもち」ってなんだろう? ソフトハイフンみたいな意味不明な「図形文字」もあるからかなあ。

[2] なお、 >>4 の定義からみても分かるように、 図形文字 ⊂ 符号化文字なわけです。

[3] >>1 でもって、その符号化文字集合の1単位長 (1オクテットとか2オクテットとか。) で表現されるとは限りません。例えば NOT EQUAL SIGN () は ISO/IEC 646 では 3/13 BS 2/15 (など) というビット組合せ群で表現されます。

[16] SP印字可能文字に含まれるのが普通です。 ISO/IEC などの定義では SP は「図形記号を持たない図形文字」であるからです。

[18] でも含まないこともあるよ。

[17] 変な感じもしますが、歴史的な絡みとかもあって仕方ないんでしょう。

ISO 文字コード

[23] ISO文字コードでは文字制御機能図形文字でした。

[8]

図形文字 (graphic character)
制御機能以外で、通常、手書き印字表示の可視的表現をもち、 一つ以上のビット組合せからなる符号化表現をもつ文字。 (JIS X 0211‐1994 4.2.42)

[9]

図形文字 (graphic character)
制御機能以外で、通常、手書き印字表示の可視表現をもち、 一つ以上のビット組合せからなる符号化表現をもつ文字JIS X 0202:1998 4.15

[4]

図形文字 (graphic character)
制御機能以外で、通常, 手書き印字表示可視的表現をもち, 一つ以上のビット組合せからなる符号化表現をもつ文字JIS X 0201:1997 3.7

[7]

図形文字 (graphic character)
制御機能以外の文字であって、通常は、手書き、 印字又は表示の可視化表現を持つ。 (JIS X 0221‐1:2001 4.20)

[5] 旧訳 図形キャラクタ

[6] 一般的に使われる意味での文字にほぼ相当する。

[10]

すべての図形文字は、 現在位置の前進動作を伴う文字 (スペーシング文字) とする。 JIS X 0201:1997 5.5

図形文字の符号化

[12] ISO R 646 以来の ISOJIS符号化文字集合が採ってきたとされる原則で、 符号化(図形)文字集合は意味や文字観念の類ではなく、 (抽象化された) 図形表現そのものを符号化する、というもの。

[13] とはいえ、実際には JIS X 0208‐1983, ‐1990 は文字観念を符号化していた (つもりでいた) し、 KS X 1001 は漢字を読みによって符号化しているし、 ISO/IEC 10646 は色々な 「意味」を含めた「図形文字」を符号化しているのだから、 この原則が一体どれだけの重みを持ったものなのかには疑問を抱かずにはいられないだろう。