<html xmlns="http://www.w3.org/1999/xhtml"><head></head><body><section><h1>互換性文字</h1><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="35" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[35]</anchor-end> <dfn><rubyb xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">互換性文字<rt xmlns="http://www.w3.org/1999/xhtml" xml:lang="en">compatibility character</rt></rubyb></dfn>は、既存の<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">規格</anchor>との互換性のために追加された、
本来の <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">Unicode</anchor> の処理モデルとは矛盾する<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">文字</anchor>のことをいいます。</p><section><h1>仕様書</h1><refs xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:"><ul xmlns="http://www.w3.org/1999/xhtml"><li><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="34" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[34]</anchor-end> <anchor-external xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:resScheme="URI" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:resParameter="http://www.unicode.org/versions/Unicode6.2.0/ch02.pdf#page=19">http://www.unicode.org/versions/Unicode6.2.0/ch02.pdf#page=19</anchor-external></li></ul></refs></section><section><h1>定義</h1><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="37" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[37]</anchor-end> <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">互換性文字</anchor>は <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">Unicode</anchor> 以外の<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">規格</anchor>との<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">相互運用性</anchor>のために追加された<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">文字</anchor>です <src xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:10:"><anchor-internal xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="34" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">&gt;&gt;34</anchor-internal></src>。</p><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="36" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[36]</anchor-end> <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">互換性文字</anchor>には<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">アラビア文字</anchor>の表現形、<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">縦書き</anchor>用の字形、丸付き文字などが含まれます
<src xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:10:"><anchor-internal xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="34" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">&gt;&gt;34</anchor-internal></src>。</p><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="38" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[38]</anchor-end> ただし<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">互換性文字</anchor>の具体的なリストはありません <src xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:10:"><anchor-internal xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="34" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">&gt;&gt;34</anchor-internal></src>。</p><comment-p xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:10:"><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="39" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[39]</anchor-end> そんなんでいいのか・・・。</comment-p><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="40" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[40]</anchor-end> <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">互換性文字</anchor>は<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">非推奨</anchor>というわけではありません <src xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:10:"><anchor-internal xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="34" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">&gt;&gt;34</anchor-internal></src>。必要があれば適宜使って良いようです。</p><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="6" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[6]</anchor-end> <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">combining half marks</anchor></p></section><section><h1>ISO/IEC 10646 における定義</h1><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="4" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[4]</anchor-end> <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">ISO/IEC 10646</anchor> の定義</p><blockquote><dl><dt>互換用文字 (compatibility character)</dt><dd>
主として既存の<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">符号化文字集合</anchor>との互換のため、
この規格群に<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">符号化文字</anchor>として含めた<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">図形文字</anchor>。
(<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">JIS X 0221</anchor>‐1:2001 4.13, ISO/IEC 10646:2003 <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">WD</anchor> 4.13)</dd></dl></blockquote><p>同22章「Compatibility Character」には互換文字がどの辺にあるのかは書かれていますが、具体的な文字の集合は規格のどこにも示されていません。</p><blockquote><ul><li><anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">BMP</anchor> では、互換文字の多くは<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">区</anchor> <code class="char">F9</code>,
<code class="char">FA</code>, <code class="char">FE</code>, <code class="char">FF</code>,
<code class="char">31</code>, <code class="char">33</code> に割当てられている。<ul><li>しかし他の位置にも割当てられている。</li></ul></li><li><anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">SIP</anchor> では、区 <code class="char">F8</code>〜<code class="char">FA</code>
に割当てられている。</li><li><code class="UCS">CJK COMPATIBILITY IDEOGRAPHS-2001</code>
<weak xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">(ISO/IEC 10646‐2:2001 までに ISO/IEC 10646 に収録された CJK 互換漢字。詳しくは規格を見て欲しいが、 <code xmlns="http://www.w3.org/1999/xhtml" class="UCS">CJK COMPATIBILITY IDEOGRAPHS</code> block の全ての文字が含まれるわけではない。)</weak>
にある文字は本来 <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">CJK統合漢字</anchor>と統合すべきだった。<ul><li>これらの文字は種々の理由で収録された。</li><li>そんなわけで互換漢字は既存規格との<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">往復変換</anchor>の時以外では非推奨。</li></ul></li></ul></blockquote><p>なにげに、途中で CJK 互換漢字の話に摩り替えられています。</p><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="10" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[10]</anchor-end></p><blockquote><p>この規格群には互換用文字が含まれているが、これは、
既存の符号化文字集合との互換性を保ち、
情報を失うことなく双方向の符号変換を可能にすることを目的としている。</p><p>BMP では、これらの文字の多くは、区 <code>F9</code>,
<code>FA</code>, <code>FE</code> 及び <code>FF</code> 内並びに区
<code>31</code> 及び <code>33</code> 内の符号位置に割り当てている。
互換用文字の幾つかは、他の区の中にも割り当てている。
(JIS X 0221‐1:2001 22. 互換用文字)</p></blockquote><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="5" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[5]</anchor-end> ちなみに、 <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">JIS</anchor> にも「<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">互換用文字</anchor>」
とかいう同じような語があります。</p><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="9" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[9]</anchor-end> <anchor-internal xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="5" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">&gt;&gt;5</anchor-internal> JIS X 0221 を見ると、 <q>compatibility character</q> の JIS での訳語が<q>互換用文字</q>らしいです。</p></section><section><h1>関連</h1><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="43" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[43]</anchor-end> <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">互換性異体字</anchor>は<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">互換性文字</anchor>の<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">部分集合</anchor>です <src xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:10:"><anchor-internal xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="34" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">&gt;&gt;34</anchor-internal></src>。</p><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="44" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[44]</anchor-end> <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">互換性分解可能文字</anchor>は<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">互換性文字</anchor>と共通する部分が多いですが、互いに異なる<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">集合</anchor>です <src xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:10:"><anchor-internal xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="34" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">&gt;&gt;34</anchor-internal></src>。 </p><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="42" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[42]</anchor-end> <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">XML</anchor> では<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">互換性文字</anchor>の使用は<rubyb xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">勧められない<rt xmlns="http://www.w3.org/1999/xhtml" xml:lang="en"><anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">discouraged</anchor></rt></rubyb>とされています。
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">XMLにおける文字</anchor>の項も参照してください。</p><refs xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:"><ul xmlns="http://www.w3.org/1999/xhtml"><li><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="41" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[41]</anchor-end> <cite xml:lang="EN">Extensible Markup Language (XML) 1.0 (Fifth Edition)</cite> (<time>2013-05-28 20:49:56 +09:00</time> 版) <anchor-external xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:resScheme="URI" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:resParameter="http://www.w3.org/TR/xml/#charsets">http://www.w3.org/TR/xml/#charsets</anchor-external></li></ul></refs></section></section><section><h1>互換文字</h1><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="1" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[1]</anchor-end> <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">互換分解</anchor>を持つ<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">文字</anchor>。 Compatible character。<ul><li><anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">Unicode規格</anchor>は、既存の基底規格での区別を表現するために互換文字を含めています。それらは <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">legacy</anchor> data の転送と処理を支援します。 Legacy data 用以外の使用は非推奨です。</li><li>互換文字のその分解との置換は基の規格との<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">往復変換</anchor>性を失うかもしれません。</li></ul></p><p>・・・と Unicode 3.0 3.6 D21 に書いてあります。</p><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="2" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[2]</anchor-end> 要は、 Unicode に入れてしまったけど他の文字の組合せで表現できる
(と <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">Unicoder</anchor> の主張する) ごみのことです。</p><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="3" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[3]</anchor-end> 互換分解を持つ文字であって<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">正規分解</anchor>を持つ文字ではないので注意しましょう。
例えば、 Unicode の定義では <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">CJK互換漢字</anchor>は互換文字ではありません。</p></section><section><h1>互換漢字</h1><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="7" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[7]</anchor-end> 
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">CJK互換漢字</anchor>のうちのいくつかは、
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">CJK互換漢字</anchor>の<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">ブロック</anchor>に所属し、
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">文字の名前</anchor>に<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">CJK互換漢字</anchor>と入っているにも関わらず、
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">CJK統合漢字</anchor>に属するものという扱いになっています。</p><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="11" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[11]</anchor-end> 
それ以外の 
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">CJK互換漢字</anchor>の多くは、
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">Unicode</anchor>
の基準では他の対応する
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">CJK統合漢字</anchor>と区別されない扱いになっていますが、
世間では<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">異体字</anchor>として区別されて使われています。
ここでは世間の意識と <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">Unicode</anchor> とのずれが
「互換性」
という言葉に押し込まれています。</p></section><section><h1>メモ</h1><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="8" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[8]</anchor-end> <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">Unicode Standard</anchor> にも注意書きがありますが、 <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">Unicode</anchor> における「互換性文字」と
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">正規化</anchor>における「互換文字」は別の概念です。明確な説明なしで使うのには危険な語であります。</p><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="45" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[45]</anchor-end> <cite xml:lang="en">Character Model for the World Wide Web 1.0: Fundamentals</cite>
( (<time>2005-02-15 14:24:00 +09:00</time> 版))
<anchor-external xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:resScheme="URI" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:resParameter="http://www.w3.org/TR/charmod/#sec-Compatibility">http://www.w3.org/TR/charmod/#sec-Compatibility</anchor-external></p></section></body></html>