組み合わせて使う文字

組み合わせて使う文字

[318] 複数の文字を組合せて使う文字群があります。 grapheme cluster と同様、 書字方向グリフの扱いが全体として一貫している必要があります。 書字方向依存グリフ


[319] U+221A (), U+221B (), U+221C () は、 Unicode ではルート記号の上線を除いた部分が例示字形になっており >>324、 以後の文字上線を引いたものでルートを表すために使います。 したがってその全体として一括で処理する必要があります。

[320] この3文字は Bidi_Mirrored で、鏡像化されます。 Vertical_OrientationR で、寝かされます。

[321] 三乗根、四乗根には鏡像化してアラビア文字数字に差し替えた U+0606 ARABIC-INDIC CUBE ROOT, U+221B ARABIC-INDIC FOURTH ROOT があります >>323。 こちらは右横書き用で、 Bidi_Mirroredなので左横書き用にはなりません。

[322] JIS ではルート記号の上線まで含んだ例示字形になっていて、 ルートを表す数式の部分としての利用は想定されていないようです。 縦書き字形も示されていません。

[334] Unicode には更に別に U+23B7 RADICAL SYMBOL BOTTOM があり、端末用罫線素片と組み合わせることになっています。 R ですが、 Bidi_Mirrored ではありません。

[1] 根号を使った数式を表示する実装や Webサイトには、 「」 を使い、それに線を継ぎ足す方式のものが複数あります。 この種の実装は、 単独記号としての「」の字形とは両立しません。 また、 左横書き右横書き上縦書きで「」と線が一貫した挙動を示す必要があります。

[336] 罫線素片やそれに類するものとして U+23B7 - U+23BD >>332, U+2500 - U+259F >>340 があります。 符号表左横書き前提の字形で、 Vertical_OrientationR とされます。

[337] 組合せて表のようにして使う罫線素片的な歯科用記号が U+23BE - U+23CC にあります。 >>332 符号表は明らかに左横書き前提の字形ですが、 なぜか Vertical_OrientationU です。なぜ R ではないのでしょうか。

[341] JIS X 0213:2000 附属書7 1.3.13 によると、 JIS X 0213 における歯科用記号は OVERLINE, LOW LINE, BOX DRAWINGS LIGHT VERTICAL AND HORIZONTAL と併用することとされています。 これらは Unicode では R なので、 Unicode縦書きでは挙動がおかしくなります。


[364] 「――」や「……」 (中央) や「‥‥」 (中央) は、 日本の一部業界で2文字分の長さで使う記号です。 横書きでも縦書きでも、進行方向に2文字分中央の線や点で表されます。 分野の慣習によってはこうした表現を1文字分として使うのは誤りとすることがあります。 逆に分野によっては1文字分で使うのが普通とすることもあります。 またプロポーショナルフォントなど文字の枡目の意識が低いときは、 敢えて2点リーダー、3点リーダーとして正方形に設計された字形を使う必要はなく、 「・・・」、 「...」 「。。。」 といった表現も使われます (字数は場合によります)。 いずれにしても全体として一貫とした方向性になることが求められますが、 「―」や「…」や「‥」は R なので縦書きでも適切に回転します。

[7] なお倍角ダッシュUnicode に単独の文字 があります。 (JIS X 0208 になかったためか、日本ではあまり使われていません。)

[331] U+22EE VERTICAL ELLIPSIS, U+22EF MIDLINE HORIZONTAL ELLIPSIS, U+22F0 UP RIGHT DIAGONAL ELLIPSIS, U+22F1 DOWN RIGHT DIAGONAL ELLIPSIS は、 数式用の省略記号とされます。 Vertical_OrientationR で回転します。 後者2つは Bidi_Mirrored鏡像化します。 したがって物理的な向きではなく、 数式の全体的な方向性と一貫して使うことになります。 (縦書き字形も参照。)

[333] 縦に複数組合せて使うことが想定される数式用の部品 U+2320, U+2321 は、 R, Bidi_Mirrored とされています。 U+239B - U+23B3, U+23D0 は、 R とされています。 >>332 くの字点と字形構成は似ていますが、 縦書きで連続して使うことが想定されるくの字点と違って、 こちらは横書きの複数行に分けて使うことを想定したものでしょう。 最初の2文字以外がなぜ鏡像化されないのかは謎です。

[330] 濁点くの字点半角カナ濁点: 縦書き字形参照

[344] U+FE20 - U+FE2F には Combining Half Marks として、 複数の文字に組み合わせて使う発音区別符号を表すべく、 複数組合せて使うための結合文字があります。 >>345

[5] 二重の nonspacing mark (二重ダイアクリティカルマーク) 結合文字, スラー

[6] 傍線 結合文字

[376] 顔文字ASCIIアートギャル文字


[2] Vodafone の拡張したシフトJIS には、 2文字または3文字を横に並べて使う絵文字がありました。 ほとんどの絵文字Unicode に追加されましたが、 これらは企業ロゴのため追加されませんでした。

[4] DIN 31624: LIGATURE SIGN, DOUBLE TILDE (non-spacing)

[8] 00000001.PDF - 053.pdf, , https://itscj.ipsj.or.jp/ir/053.pdf

[3] Character Sets: Extended Latin (ANSEL), , https://memory.loc.gov/diglib/codetables/45.html

Double Tilde