<html xmlns="http://www.w3.org/1999/xhtml"><head></head><body><section><h1>仕様書</h1><refs xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:"><ul xmlns="http://www.w3.org/1999/xhtml"><li><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="1" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[1]</anchor-end> <cite>The Unicode Standard, Version 13.0 - ch03.pdf</cite>, <time>2020-03-09T17:53:34.000Z</time>, <time>2020-12-20T02:08:18.239Z</time> <anchor-external xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:resScheme="URI" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:resParameter="https://www.unicode.org/versions/latest/ch03.pdf#G2212">https://www.unicode.org/versions/latest/ch03.pdf#G2212</anchor-external></li></ul></refs></section><section><h1>抽象文字</h1><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="2" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[2]</anchor-end> 
<dfn><rubyb xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">抽象文字<rt xmlns="http://www.w3.org/1999/xhtml">abstract character</rt></rubyb></dfn>は、
<rubyb xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">テキスト的データ<rt xmlns="http://www.w3.org/1999/xhtml">textual data</rt></rubyb>の<rubyb xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">組織<rt xmlns="http://www.w3.org/1999/xhtml">organization</rt></rubyb>、
<rubyb xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">制御<rt xmlns="http://www.w3.org/1999/xhtml">control</rt></rubyb>、
<rubyb xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">表現<rt xmlns="http://www.w3.org/1999/xhtml">representation</rt></rubyb>に使う情報の単位です。
<src xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:10:"><anchor-internal xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="1" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">&gt;&gt;1</anchor-internal> D7</src></p><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="3" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[3]</anchor-end> 
データを表現する際、
そのデータの性質は、
一般に<rubyb xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">記号的<rt xmlns="http://www.w3.org/1999/xhtml">symbolic</rt></rubyb>であり、
その他の種類のデータ (例えば<rubyb xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">音声的<rt xmlns="http://www.w3.org/1999/xhtml">aural</rt></rubyb>なものや<rubyb xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">視覚的<rt xmlns="http://www.w3.org/1999/xhtml">visual</rt></rubyb>なもの)
ではありません。
そうした記号的なデータは、例えば <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">letter</anchor>、<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">ideograph</anchor>、
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">数字</anchor>、
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">句読点</anchor>、
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">技術的記号</anchor>、
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">dingbat</anchor>
のようなものです。
<src xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:10:"><anchor-internal xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="1" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">&gt;&gt;1</anchor-internal> D7</src></p><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="4" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[4]</anchor-end> 
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">抽象文字</anchor>には、
<rubyb xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">具象形<rt xmlns="http://www.w3.org/1999/xhtml">concrete form</rt></rubyb>はありません。
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">グリフ</anchor>と混同する<rubyb xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">べきではありません<rt xmlns="http://www.w3.org/1999/xhtml">should not</rt></rubyb>。
<src xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:10:"><anchor-internal xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="1" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">&gt;&gt;1</anchor-internal> D7</src></p><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="5" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[5]</anchor-end> 
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">抽象文字</anchor>は、
必ずしも<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">利用者</anchor>が
「<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">文字</anchor>」
と考えるものと対応しません。
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">書記素</anchor>と混同する<rubyb xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">べきではありません<rt xmlns="http://www.w3.org/1999/xhtml">should not</rt></rubyb>。
<src xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:10:"><anchor-internal xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="1" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">&gt;&gt;1</anchor-internal> D7</src></p></section><section><h1>Unicode 抽象文字</h1><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="6" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[6]</anchor-end> 
<cite>The Unicode Standard</cite>
に<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">符号化</anchor>された<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">抽象文字</anchor>を、
<dfn>Unicode<rubyb xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">抽象文字<rt xmlns="http://www.w3.org/1999/xhtml">abstract character</rt></rubyb></dfn>といいます。
<src xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:10:"><anchor-internal xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="1" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">&gt;&gt;1</anchor-internal> D7</src></p><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="7" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[7]</anchor-end> 
<cite>The Unicode Standard</cite>
で直接<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">符号化</anchor>されていない<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">抽象文字</anchor>であっても、
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">結合文字列</anchor>を使って表現できることがあります。
<src xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:10:"><anchor-internal xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="1" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">&gt;&gt;1</anchor-internal> D7</src></p><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="12" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[12]</anchor-end> <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">抽象文字</anchor>に<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">符号点</anchor>を関連付けたものを<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">符号化済文字</anchor>といいます。</p><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="13" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[13]</anchor-end> 1つの<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">抽象文字</anchor>が、複数種類の<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">符号点</anchor>または<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">符号点</anchor>の列で表現し得ることがあります。
<sw-see xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:"> <anchor>重複符号化</anchor> </sw-see></p><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="15" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[15]</anchor-end> 
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">サロゲート符号点</anchor>と<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">非文字</anchor>は、<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">未割当済符号点</anchor>ではなく<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">割当済符号点</anchor>ですが、
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">抽象文字</anchor>は割当済ではなく、
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">抽象文字</anchor>と解釈してはならないとされています。</p></section><section><h1>抽象文字列</h1><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="10" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[10]</anchor-end> 
<dfn><rubyb xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">抽象文字列<rt xmlns="http://www.w3.org/1999/xhtml">abstract character sequence</rt></rubyb></dfn>は、
1つ<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">以上</anchor>の<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">抽象文字</anchor>の<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">順序付き列</anchor>です。
<src xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:10:"><anchor-internal xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="1" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">&gt;&gt;1</anchor-internal> D8</src></p><figure class="railroad"><figcaption><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="11" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[11]</anchor-end> <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">抽象文字列</anchor></figcaption><ol><li>+<ol><li><anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">抽象文字</anchor></li></ol></li></ol></figure><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="14" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[14]</anchor-end> <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">符号化済文字列</anchor>、<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">Unicode文字列</anchor>とは構成要素が違います。
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">抽象文字</anchor>は、それ自体は直接
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">Unicode</anchor>
で記述できません。</p></section><section><h1>関連</h1><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="8" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[8]</anchor-end> 
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">抽象文字</anchor>に近い概念は他の<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">文字コード</anchor>規格も定めていたことがありますが、
必ずしも
<cite>The Unicode Standard</cite>
の定義と等しくありません。</p><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="9" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[9]</anchor-end> 
<cite>The Unicode Standard</cite>
自身が言及している通り、
一般的な意味の「<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">文字</anchor>」とは必ずしも等しくありません
(むしろ等しくないこともかなり多い)。
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">文字</anchor>の研究者が言う「<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">文字</anchor>」の意味とも必ずしも近くありません。</p></section><section><h1>メモ</h1></section></body></html>