[11] 符号化文字集合における文字のうち制御文字でないものを図形文字といいます。
[26]
図形は、
符号点型の1つです。
>>25 D10a
符号点型が図形である符号点は、
General Category
で細分され、
L
,
M
,
N
,
P
,
S
,
Zs
のいずれかに属します (これらの
General Category の符号点は、
他の符号点型には属しません)。
>>44
[20]
図形文字は、
General Category
が
Letter
(L
)、
Combining Mark
(M
)、
Number
(N
)、
Punctuation
(P
)、
Symbol
(S
)、
Space Separator
(Zs
)
の文字です。
>>19
[14] 画面に表示できる文字を、 印字可能文字といいます。
[15] 図形文字は、文字コードの仕様書で伝統的に使われてきた専門用語です。 印字可能文字は、それ以外の場面で使われることが多い用語です。 印字可能文字の厳密な定義があるのかどうかはわかりませんが、 両者は交換可能な用語と思われます。
[1] >>4 「通常・・・可視的表現をもち」ってなんだろう? ソフトハイフンみたいな意味不明な「図形文字」もあるからかなあ。
[2] なお、 >>4 の定義からみても分かるように、
図形文字 ⊂ 符号化文字
なわけです。
[3] >>1 でもって、その符号化文字集合の1単位長 (1オクテットとか2オクテットとか。) で表現されるとは限りません。例えば NOT EQUAL SIGN (≠) は ISO/IEC 646 では 3/13 BS 2/15
(など) というビット組合せ群で表現されます。
[16] SP
も印字可能文字に含まれるのが普通です。
ISO/IEC などの定義では SP
は「図形記号を持たない図形文字」であるからです。
[18] でも含まないこともあるよ。
[17] 変な感じもしますが、歴史的な絡みとかもあって仕方ないんでしょう。
[23] ISO文字コードでは文字は制御機能か図形文字でした。
- 図形文字 (graphic character)
- 制御機能以外の文字であって、通常は、手書き、 印字又は表示の可視化表現を持つ。 (JIS X 0221‐1:2001 4.20)
すべての図形文字は、 現在位置の前進動作を伴う文字 (スペーシング文字) とする。 JIS X 0201:1997 5.5
[12] ISO R 646 以来の ISO や JIS の符号化文字集合が採ってきたとされる原則で、 符号化(図形)文字集合は意味や文字観念の類ではなく、 (抽象化された) 図形表現そのものを符号化する、というもの。
[13] とはいえ、実際には JIS X 0208‐1983, ‐1990 は文字観念を符号化していた (つもりでいた) し、 KS X 1001 は漢字を読みによって符号化しているし、 ISO/IEC 10646 は色々な 「意味」を含めた「図形文字」を符号化しているのだから、 この原則が一体どれだけの重みを持ったものなのかには疑問を抱かずにはいられないだろう。