zero width joiner

U+200D ZERO WIDTH JOINER

仕様書

意味

続け字

[8] U+200D ZERO WIDTH JOINER は、 インド系諸文字において consonant-conjuct context (virama の直後) にあって当該 conjunct の表示を制御します。 >>1

[15] 定義上結合文字列に含まれます。


[20] ANSELC1制御文字 JOINERUnicodeZWJ に対応付けられています。

導出特性値

[9] この符号位置導出特性値CONTEXTJ です。

文脈的規則

仕様書

適用範囲

[2] この文脈的規則は、登録の際に利用されます。

[3] この文脈的規則は、 lookup の際に利用されます >>1

定義

[7] この文脈的規則の結果は、次のものと同じです >>1

  1. [4] 一つ前の符号位置がなければ、未定義を返して停止します
  2. [5] そうでなく、一つ前の符号位置Canonical_Combining_ClassVirama であれば、を返して停止します
  3. [6] そうでなければ、を返して停止します

漢字の記述

CJK統合漢字合字

レンダリング

続け字

[24] 縦書きについてはCJK統合漢字合字も参照。

[23] OpenType development (LEGACY INFORMATION) - Typography | Microsoft Docs, nihar, https://docs.microsoft.com/ja-jp/typography/develop/otdevinfo#suggested-glyphs-for-complex-scripts

[25] 26487 - ZWJ (U+200D) format control should NOT be rendered with its own glyph - chromium, https://bugs.chromium.org/p/chromium/issues/detail?id=26487

関連

[10] 逆を表す ZERO WIDTH NON-JOINER もあります。

[17] ZWSP とは違って word breakline break には影響しません。 >>18

[16] CGJ とは挙動が違います。

[19] 文脈を提供する文字という機能は LRM, RLM, ALM と似ています。 bidirectional ordering controls

歴史

[21] ISIRI 3342

[22] 2011-08-six-years-of-persian-domain-names.pdf, , https://persian-computing.org/archives/IRNIC/2011-08-six-years-of-persian-domain-names.pdf

[14] Emoji ZWJ Sequences Catalog () http://www.unicode.org/emoji/charts/emoji-zwj-sequences.html

[13] Editorial: remove ZERO WIDTH JOINER characters (ricea著, ) https://github.com/whatwg/streams/commit/c58d42aa731cd494c522c90e6eeefd66cbc25b3b

[26] CSS に 4 つの新しい国際化機能を導入 | Blog | Chrome for Developers, , https://developer.chrome.com/blog/css-i18n-features?hl=ja

境界検出は ML エンジンによって実行されるため、意図したとおりの結果が得られない可能性があります。そのような場合は、ブレークポイントを手動で調整できます。<wbr> タグまたは Zero Width Space(&ZeroWidthSpace;)は中断可能な点を適用し、Zero Width Joiner(&zwj;)は中断を防ぎます。

[27] 日本語ZWSPZWJ を挿入させる慣習は現在存在しないわけだが、これによって今後増えたりするんだろうか?

[28] ZWJ合字化を目的とせず改行制御のために使うのは、 禍根を残したりしないんだろうか?