Me

結合文字 (文字コード)

[20] 結合文字 (combining character) は、直前の基底文字と合成されて表示される文字です。

仕様書

意味

[10] 結合文字 (combining character) は、 General CategoryCombining Mark (M) の文字です。 これには、 General Category の値が Spacing Combining Mark (Mc), Nonspacing Mark (Mn), Enclosing Mark (Me) の文字が含まれます。 >>9

[26] 結合マーク (combining mark) は、 General_CategoryMark符号位置です >>101

[27] General_Category の値 Mark (M) は、 Mn, Mc, Me のいずれかであることを表します >>103

[28] combining mark は、 combining character と同義です >>18


[12] 私用文字 (Co) を結合文字と解釈するか否かは、 実装によります >>9。 原則は基底文字扱いとされています。 基底文字


[24] 非前進マーク (nonspacing mark) は、 General CategoryNonspacing Mark (Mn) か Enclosing Mark (Me) の結合文字です。 >>30


[29] 囲みマーク (enclosing mark) は、 非前進マークであって General CategoryEnclosing Mark (Me) であるものです。 囲みマークは、 非前進マーク部分クラスであって、 基底文字の上中下に配置するのではなく、囲むものです。 >>38


[40] 前進マーク (spacing mark) は、 結合文字であって非前進マークではないものです。 >>39


[46] 結合文字列 (combining character sequence) (CCS) は、 基底文字が0個または1個の後に、 1つ以上結合文字ZERO WIDTH JOINERZERO WIDTH NON-JOINER のいずれかが続くような列であって最長のものです。 >>45 結合文字列のうち基底文字がないものを欠陥結合文字列 (defective combining character sequence) といいます。 >>49

  1. ?
    1. 基底文字
  2. +
    1. |
      1. 結合文字
      2. ZERO WIDTH JOINER
      3. ZERO WIDTH NON-JOINER

[48] 拡張済み結合文字列 (extended combining character sequence) (ECCS) は、 拡張済み基底が0個または1個の後に、 1つ以上結合文字ZERO WIDTH JOINERZERO WIDTH NON-JOINER のいずれかが続くような列であって最長のものです。 >>47

  1. ?
    1. 拡張済み基底
  2. +
    1. |
      1. 結合文字
      2. ZERO WIDTH JOINER
      3. ZERO WIDTH NON-JOINER

一覧

性質

[11] 正準結合クラスが 0 でない文字は、結合文字です。 しかしは真ではありません。正準結合クラスが 0 の結合文字もあります。 >>9

文脈

[13] 結合文字は、通常は単独では用いません。 >>9

[14] 結合文字図形の位置付けは、直前の基底文字であって非結合文字zero width joiner でも zero width nonjoiner でもないものに依存します。 この時結合文字基底文字適用 (apply) されるといいます。 >>9

[15] そのような基底文字がない場合 (結合文字が先頭の場合や、 制御文字書式文字が前にある場合) には、孤立結合文字 (isolated combining character) といいます。 >>9

[19] 完全正規化済みなど孤立した結合文字が出現しないことを要求する応用もあります。

レンダリング

[16] 孤立結合文字である場合や、図形的結合 (graphical combination) を行えない場合には、 図形的結合なしに、基底文字であるかのように表示して構いません。 >>9

[17] Unicode 符号表代表画像には点線の円が示されています。 直前の基底文字と図形的結合して表示する場合には、基底文字を点線円部分に示すことが想定されています。 >>9

IDS との関係は IDC

非前進マーク

[32] 非前進マーク表現 (presentation) 上の位置は基底文字に依存します。 通常はそれ自体に関して visual baseline に対して間隔を消費しません。 >>30

[33] ただし、非前進マークの大きさによって基底文字の表示位置が影響されることはあります。 >>30

[34] 例えば U+20DD COMBINING ENCLOSING CIRCLE を使うと (それ自体が独立して表示幅を取ることはありませんが) その前の基底文字の周りに円を描画して、かつ前後の文字と表示が重ならないよう、 基底文字の表示位置が通常と変化することになります。

前進マーク

[41] 前進マークは一般に基底文字とそう違わない挙動を示します。 >>39

[42] しかし U+0BCA TAMIL VOWEL SIGN O のように、 (囲みマークでないにも関わらず) 基底文字の両側にレンダリングされるものもあります。 >>39

歴史

[4]

6.3.3 図形文字の結合 特に指定されない限り、図形文字は、 結合文字としてはならない。すなわち、 隣接する図形文字と組み合わせようとしてはならない。

図形文字集合によっては、複数の図形文字を一つの図形記号として可視化することによって、 追加の図形記号 (例えば、アクセント付き文字) を図形表現することを許しているものもある。この規格では、 二つの結合方法があることを認識している。

a) 基底文字図形文字は、制御文字BACKSPACE (後退) 又は CARRIAGE RETURN (復帰) を使用して、組み合わせてよい。

b) 結合文字として指定されている図形文字は、 基底文字図形文字と組み合わせてもよい。

ISO 2375 に従って、図形文字集合の登録を行おうとする申請者は、 集合中の結合文字を明らかにしておくことが期待される。

参考1. 登録では、これらの要件の詳細を求められないので、 文字集合を規定する規格は、結合文字がある場合、 それ自身で、これを指定しその用法を示しておくのがよい。

2. ISO/IEC 646図形文字では、 アクセント付き文字表現するのに、 a) の方法が認められている。

3. JIS X 0211 では、第3の方法として、文字自身の仕様に関係なく、 GRAPHIC CHARACTER COMBINATION (GCC) の制御機能を使った図形文字結合を規定している。 JIS X 0202:1998

[8]

結合文字 (combining character)
符号化文字集合の識別された部分集合の構成単位であって、先行する非結合文字 (以下、基底文字という。) と組み合わせることを意図したもの、又は基底文字の後に結合文字の列が続いた形のものと組み合わせることを意図したもの。 (JIS X 0202:1998 4.8)

[1] 2002-11-03 (日) 15:52 名無しさん: 結合文字は結合文字の typo じゃないかと一瞬思いますが、規格を良く読むとこれで正しいことが分かります。

[2]

結合文字 (combining character)
この規格群で規定する符号化文字集合の識別された部分集合の構成単位であって、先行する非結合文字 (以下、基底文字という。) と組み合わせることを意図したもの、又は基底文字の後に結合文字の列が続いた形のものと組み合わせることを意図したもの (4.14 参照)。 (JIS X 0221‐1:2001 4.12)

[3] 10646 での結合文字の使い方は、 24. に規定があります。結合文字の一覧は附属書 B にあります。結合文字が使えるかどうかは実装水準と関係します。

[35] 現在位置の前進動作を伴わない文字 (non-spacing character) 現在位置の前進動作を伴う文字の場合は、その文字が表示される時に、現在位置がその文字の幅の分だけ進行方向に移動するのですが、現在位置の前進動作を伴わない文字の場合はこれが起こりません。

[36] ですから、現在位置の前進動作を伴わない文字を使えば、 BSCR を使うこと無く重ね打ちが実現できます。

[37] 従って、現在位置の前進動作を伴わない文字は主としてアクセントの類です。

[5] I'm not a Klingon (<span style="font-family:pIqaD,code2000"> </span>) : Most combining characters in a Unicode glyph/character/whatever ( 版) http://blogs.msdn.com/shawnste/archive/2010/01/25/most-combining-characters-in-a-unicode-glyph-character-whatever.aspx

[6] Web Applications 1.0 r6611 Allow combining characters wherever, per Mark Davis. ( ( 版)) http://html5.org/tools/web-apps-tracker?from=6610&to=6611

[7] Bug 13502 – Text run starting with composing character should be valid ( ( 版)) https://www.w3.org/Bugs/Public/show_bug.cgi?id=13502

[25] 合成用の「☆」や「★」がほしい。合成用丸があるんだしw