抽象文字

抽象文字 (Unicode)

仕様書

抽象文字

[2] 抽象文字 (abstract character) は、 テキスト的データ (textual data) 組織 (organization) 制御 (control) 表現 (representation) に使う情報の単位です。 >>1 D7

[3] データを表現する際、 そのデータの性質は、 一般に記号的 (symbolic) であり、 その他の種類のデータ (例えば音声的 (aural) なものや視覚的 (visual) なもの) ではありません。 そうした記号的なデータは、例えば letterideograph数字句読点技術的記号dingbat のようなものです。 >>1 D7

[4] 抽象文字には、 具象形 (concrete form) はありません。 グリフと混同するべきではありません (should not) >>1 D7

[5] 抽象文字は、 必ずしも利用者が 「文字」 と考えるものと対応しません。 書記素と混同するべきではありません (should not) >>1 D7

Unicode 抽象文字

[6] The Unicode Standard符号化された抽象文字を、 Unicode抽象文字 (abstract character) といいます。 >>1 D7

[7] The Unicode Standard で直接符号化されていない抽象文字であっても、 結合文字列を使って表現できることがあります。 >>1 D7

[12] 抽象文字符号点を関連付けたものを符号化済文字といいます。

[13] 1つの抽象文字が、複数種類の符号点または符号点の列で表現し得ることがあります。 重複符号化

[15] サロゲート符号点非文字は、未割当済符号点ではなく割当済符号点ですが、 抽象文字は割当済ではなく、 抽象文字と解釈してはならないとされています。

抽象文字列

[10] 抽象文字列 (abstract character sequence) は、 1つ以上抽象文字順序付き列です。 >>1 D8

[11] 抽象文字列
  1. +
    1. 抽象文字

[14] 符号化済文字列Unicode文字列とは構成要素が違います。 抽象文字は、それ自体は直接 Unicode で記述できません。

関連

[8] 抽象文字に近い概念は他の文字コード規格も定めていたことがありますが、 必ずしも The Unicode Standard の定義と等しくありません。

[9] The Unicode Standard 自身が言及している通り、 一般的な意味の「文字」とは必ずしも等しくありません (むしろ等しくないこともかなり多い)。 文字の研究者が言う「文字」の意味とも必ずしも近くありません。

メモ