[19] Unicode の 表意文字的記述ブロックの 12 の符号位置の表意文字的記述文字 (IDC) は、漢字などの構造を記述するためのものです。
[15] IDS は、 Unicodeにない漢字を記述するものです。 >>4
[17] Unicode に含まれる漢字の分析のための記述に使うこともできます。 >>4
[13] Unicode に含まれる漢字の代替図形表現を交換する手段として使うべきではありません。 >>4
[39]
IDS は通常の漢字の列に溶け込んで
「漢⿱宀子列」
のようにして外字の記述に使われます。
厳密な意味の解釈においては、
これは漢字3文字の列を表しているのか、
漢字1文字、IDSによる漢字の構造1組、漢字1文字の3組の列を表しているのか明らかではありません。
そのような厳密さが必要な場合には、
マーク付け言語の機能で
「漢<gaiji>⿱宀子</gaiji>列
」
のように記述するなど、
アプリケーション依存の方法でもう1工夫必要となります。
[20] IDC を使って表意文字的なものを記述する文字列を 表意文字的記述列 (IDS) といいます。
[21] IDS
は、
Ideographic
,
Radical
,
CJK_Stroke
,
私用,
U+FF1F
か、
IDS_BinaryOperator
に IDS
が2つ続くものか、
IDS_TrinaryOperator
に IDS
が3つ続くものです。
>>4
IDS
[22] IDS_BinaryOperator
は、
U+2FF0
, U+2FF1
,
U+2FF4
- U+2FFB
の10文字です。 >>4
[27] U+2FFB
は重ね合わせを表します。例えば
「⿻工从
」は「巫
」を表します >>4。
[23] IDS_TrinaryOperator
は、
U+2FF2
と U+2FF3
です。 >>4
[14] 同じ漢字を複数の異なる IDS で表現できるかもしれませんが、 等価性は規定されていません。 自然な分割で最短の表現とすることが好ましいですが、 要件とはなっていません。 ただ可能な限り最短の表現を使うのが好ましいとは注文されています。 >>4 分析目的の場合のように、逆に出来得る限り細かく分解する場合もあるようです。
[29] IDS の前に U+303E
IDEOGRAPHIC VARIATION INDICATOR
(〾
) を置くことで、 IDS が近似であることを示せます。
>>4
[30] IDS の IDC 以外の文字 (operand) の一覧は次の通りです。
[18] IDS は漢字だけでなく、同様の構造を持つ周辺の文字にも適用できます。 >>4
[25] 異なる用字系の混在は正式な構文上禁止されていませんが、 好ましくありません。 >>4
[28] U+FF1F
FULLWIDTH QUESTION MARK
もなぜか認められています。不明を表すのでしょうか。説明はありません。
なぜ敢えて全角形のみ認めているのか不明です。
[32] 漢字でありながら CJK統合漢字外のものとして、例えば「〇」 は認められていますが、「々」はなぜか認められていません。
[33] IVS を使う需要はありそうですが、なぜか認められていません。
[34] 仮名、ハングル、ラテン文字を部品とする漢字の例が知られますが、 認められていないため IDS で表現できません。
[41] IDC は、 IDS として以外の用法は定められていません。 しかし任意の入力を受信する実装 (文字列を処理するほとんどの実装) は、 IDS の構文に合致しない IDC を与えられた時にも適切に処理できる必要があります。
[7] IDC は制御文字でも結合文字でもありません。 >>4
[12] IDC は制御文字ではないので、 IDC の有無でレンダリングは違わなければなりません。 >>4
[8] 文字境界や語境界に影響しなければならないという要件はありません >>4 (が影響させることは禁止もされていません)。
[9] 個別の文字の並びとしてレンダリングしても構いませんし、 IDS を解釈した結果をレンダリングしても構いません。 >>4
[10] 後者の場合、 hit test、カーソル移動その他利用者インターフェイス関係では合字として扱うべきです。 >>4
[43]
IDC
のうち
「⿻
」
だけは、
機械的に合成してレンダリングすることが困難です。
[36] 漢字は基底文字になり得るので、次に結合文字が来ることが認められています。 では IDS の後に結合文字が来たときどうなるのでしょうか。 IDS を1つにまとめてレンダリングするなら、 それ全体が基底扱いになるのでしょうか。 IDS の一部分ではないので、IDS を構成する最後の漢字に結合するのはおかしい気がします。
[47]
IDS 内部に
ZWJ
,
ZWNJ
を挿入することは構文的にできません。
前後に挿入することはできますが、
効果の程は不透明です。
[3] CHaracter Information Service Environment () http://www.chise.org/ids/
[37] IDS + OpenType: Pseudo-encoding Unencoded Glyphs () https://blogs.adobe.com/CCJKType/2014/03/ids-opentype.html