Symbol encoding

フォント依存符号化

フォント依存の符号化機構

[1] プロトコル

実例

[2] フォント

[36] GitHub - MichinariNukazawa/RuneAssignMN_Series_Fonts, https://github.com/MichinariNukazawa/RuneAssignMN_Series_Fonts/

本フォントは、A〜zを入力するだけで手軽にルーン文字が使えるよう作成されました。 ルーン文字に割り当てられているユニコード領域にはグリフを置いていません。

Windows symbol encoding

[17] OpenTypeplatformID 3 (Windows) encodingID 0 (Symbol) >>16symbol encoding を表します。

[18] symbol encoding は、 Unicode その他の標準符号化が対応していない任意の装飾や記号 (arbitrary ornaments or symbols) フォントに使います。 >>16

[19] 通常は cmap format 4 部分表で、 符号位置 0xF020 から始まる224個以下図形文字を割り当てて使います。 >>16

[20] symbol encodingUnicode符号化ではないものの、 0xF020 からの領域は PUA に相当するものである >>16、 と説明されています。

[24] つまり [ U+F020, U+F0FF ] の領域です。

[21] 応用によっては遺物的な用法では記号文字 (symbol character) 単一バイト符号化で表し、 0x20フォントOS/2 usFirstCharIndex写像して使っていました。 >>16

[22]OpenType 仕様書symbol encoding の項で説明されているのですが、これが symbol encoding の原初の用法を意味しているのか、 symbol encoding 成立前の慣習を説明しているのか、不明瞭です。

[23] 新しいフォントでは、 Unicode にない記号 (symbol) 文字 (character) Unicode cmap部分表PUA 符号点で符号化するべきです (should) >>16 つまり symbol encoding は使用するべきではないということのようです。

メモ

[6] 1054817 – Icon fonts don't work when "allow pages to choose their own fonts" is unchecked ( ( 版)) https://bugzilla.mozilla.org/show_bug.cgi?id=1054817

[8] 789788 – Not allowing pages to choose their own fonts breaks with icon fonts ( ( 版)) https://bugzilla.mozilla.org/show_bug.cgi?id=789788

[67] Issue 3766 - chromium - Symbol and Wingdings fonts are not handled properly - An open-source browser project to help move the web forward. - Google Project Hosting ( ( 版)) http://code.google.com/p/chromium/issues/detail?id=3766

[3] フリー素材|真宗大谷派 名古屋教区第30組, http://www.nagoya30.net/free/cakra.html

wingdingsという絵文字用のフォントには、法輪に似た(船の舵かも?)文字が入っていますので、これを使用すると、簡単に法輪のイメージを作ることができます。

<span style="font-family:wingdings; color:#xxxxxx; font-size:○○px">]</span>という文字列をHTMLソースに書き加えればよいです。フォントサイズや色などのスタイルは好みに設定してください。

[4] この例示が WindowsChrome では正しく法輪らしきもので表示されるものの、 前後の &nbsp; が四角い中点として表示されます (Wingdingsグリフなしのデフォルト?)。 同じ環境の Firefox では、 フォント指定が適用されないらしく、 「]」のまま表示されます。 &nbsp; もただしく空白として表示されます。

[10] IROIRO 2000a () https://web.archive.org/web/20010714194835/http://www.asahi-net.or.jp:80/~ez3k-msym/iroiro00a.htm

Listo de Esperanto Tiparoj にエスペラント用の(というより ISO8859-3 の)フォントがある。 しかし, Windows に ISO8859-3 用の NLS ファイルがない(?) ためか, script としては 8859-1 と 8859-9 しかサポートしていないようだ。 変わりに UCS の 00A0-00FF の領域に手を入れて, 例えば 00E6 は (ae でなく) c^ にさしかえてある。

このフォントを使ったページに, Esperanto for English Speakers (Thomas Eccardt) があるが, c^ のかわりに &aelig; 実体参照を使っているのはあまりうれしくない。

[9] Antenna House によるXSL拡張仕様 (, ) https://www.antenna.co.jp/XML/axf-extension/axf-extension.htm#axf%3Asoft-hyphen-treatment

通常、SOFT HYPHEN (U+00AD) は、行分割しなかったときは表示せず、行分割した場合は表示される。しかし、この処理では、絵文字のようなフォントを使用した場合、U+00AD に割り当てられているグリフが印字されない場合が発生してしまう。axf:soft-hyphen-treatment プロパティを使用することで、この問題を回避することができる。

[7] GT書体フォントダウンロード (, ) http://www.l.u-tokyo.ac.jp/GT/downloads.html

[5] 日本語で書いている ギリシャ語です3 (黒字看板, , ) http://kurojikanbandesu.blog102.fc2.com/blog-entry-111.html

「Ω(オーム)クリーンショップ」と書いてあります。この"オーム"は、ギリシャ文字としてパソコンに入っている文字。

Ω この"オーム"は、抵抗値を表す単位としてのオーム。

W この"オーム"は、fontを"symbol"というギリシャ文字のものに指定したものです。

それぞれが違う形ですね。

[11] 墨点字フォント (, ) http://www.lighthouse.or.jp/tecti/tecti/br-font.html

「あいうえお」と書いて、その部分を「ゴシックにする」ときと同じように、 「点字線付フォント」または「点字線なしフォント」に指定します。

すると、その部分が6点の点字の「あいうえお」で表示され、 そのまま墨点字を含んだ文書がプリントできます。

[12] chardetng: A More Compact Character Encoding Detector for the Legacy Web (Henri Sivonen, , ) https://hsivonen.fi/chardetng/#fonts

[14] 910187 - Armenian localization should not use armscii-8 as the fallback encoding; should use windows-1252, https://bugzilla.mozilla.org/show_bug.cgi?id=910187

[25] , http://t-editor.sakura.ne.jp/situmon.html

[28] Japanese Windows and hangul, , https://ha1.seikyou.ne.jp/home/akairingosaita/hangul/hangul02.htm

"Yamada Language Center"で配布されている"Sorawin.ttf"は、 なんと1byte文字のフォントです。 初声、中声、終声を重ね打ちしてハングルを表示します。 欧文フォントの裏フォント(外字フォント)形式であり、 通常のハングルフォントとの互換性はありません。

[29] (PDF) Wrecked Indian Fonts: A Problem for Digitalization of Indic Documents, , https://www.researchgate.net/publication/280496031_Wrecked_Indian_Fonts_A_Problem_for_Digitalization_of_Indic_Documents

[30] 墨点字フォント, , https://web.archive.org/web/20030809032324/http://www.eonet.ne.jp/~tecti/tecti/br-font.html

[31] 点訳校正委員会報告, , http://www.shichocenter.kagoshima.kagoshima.jp/tennyaku_kosei.bak

※日本ライトハウス作成の墨点字フォントを使用しています。
 文中の墨点字部分が墨点字で表記されない場合は、
 http://www.eonet.ne.jp/~tecti/tecti/br-font.html
 から墨点字フォントをダウンロードして、インストールしてください。

[32] >>31 このページには PUA も使われてます。他の系統の点字外字でしょうか。

[33] https://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=65448&item_no=1&attribute_id=1&file_no=1

コンピュータの時代に入って,タイプライタ鍵盤 上の図形は,今度は符号表上に移し替えられた.ASCII 文字集合はおおむねタイプライタの文字集合を継承して いるから,どんな鍵盤配列をモデルにするにせよ,この 符号化方式を採用することの利点は英語版ソフトの上で の実現が容易なことである.この結果,簡便なローカラ イズ方法として多くのローカルベンダが採用するところ となったが,同時に,タイプライタ時代の鍵盤配列の混 乱がそのままコンピュータ上の文字符号にも継承される というマイナス効果ももたらすこととなった.フォント 開発者には符号表を作っているという意識は希薄であり, ある者はこうして作られた符号を accidental internal code と呼んだ.筆者らもヒンディー語だけでも 20 種類, タミル語については 17 種類のこうした符号化方式を確 認しているが,実際にはさらに多数が存在しているであ ろう.

[34] WinGreek

[35] フォント (, ) http://www.yamadera.info/fonts/fonts-index.htm