UTN #11

ビルマ文字の文字コード

Unicode 以前

印度系文字の文字コード

[11] Symposium on Multilingual Information Processing at ETL (25-26/3/96), , https://web.archive.org/web/20040414060036/http://www.m17n.org/mule/JAPANESE/gniibe.html

(10) U Thuang Tin (Myanmer)

* Myanmer でのコンピュータ利用についての発表。

* Character Set の標準はまだない。

* AVA Font (Macintosh 用), Win Myanmer (Windows 用)というのが使われて いる。

[78] Myanmar fonts & their encoding standards, Seth Hetu, 2009/06/09 15:00:16, https://groups.google.com/g/myanmarunicode/c/7W5iim9lpaA/m/Kbr4YpOQUn0J

Myanmar3, Padauk, and Parabaik follow Unicode 5.1 (the standard).

Win Innwa & Win Kalaw are ASCII.

Win Burma is ASCII (but a different encoding than Win Innwa)

Zawgyi-One is partial Unicode (non-standard)

Mya Zedi is partial Unicode (non-standard) and different from Zawgyi-One.

[131] >>130

Q: What other encodings are commonly used for the Myanmar language?

There are several ad hoc font encodings in common use, all needing specific fonts to render text. ZawgyiOne, Zawgyi 2008, and Myazedi are most commonly used.

[203] GitHub - moekyawsoe/Myanmar-Fonts: Myanmar Unicode Fonts , Myanmar Zawgyi Fonts, Myanmar Win Fonts, https://github.com/moekyawsoe/Myanmar-Fonts

Win Myanmar

[140] Win Myanmar Systems: win font, myanmar keyboard, win innwa, , https://winmyanmar.myanmars.net/

Win Myanmar fonts, Win Innwa font, WinUni Innwa font, etc..

[141] >>140 によると Win Myanmar 4 は非 Unicode、 Win Myanmar 5 は with Unicode で ISO 10646 COMPLIANT。

[183] Win Myanmar Font Gallery - Win Myanmar Systems, https://winmyanmar.tripod.com/gallery.htm

[184] >>183 配布サイトは多いが FTP ばかりで現存しない。

[142] Win Myanmar (font) - HandWiki, , https://handwiki.org/wiki/Win_Myanmar_%28font%29

[156] >>153

Win AmaraPura Font, Win BeikThaNo Font, Win Dagon Font, Win Dawei Font, Win Haka Font, Win Innlay Font, Win Innwa (with bold) Font, Win Innwa, Win Kalaw Font, Win KyaukMae Font, Win KyaukTan Font, Win KyeMone Font, Win KyineTone Font, Win LarSho Font, Win Loikaw Font, Win Magway Font, Win Mandalay Font, Win Mawlamyine Font, Win MeikHtiLar Font, Win MoneYwar Font, Win Monotype (with bold) Font, Win MonotypeNew (with bold) Font, Win MyitKyiNa Font, Win NyaungShway Font, Win PaAnn Font, Win PaThane Font, Win Pyay Font, Win PyinMaNar Font, Win Researcher (with bold) Font, Win SaGaing Font, Win SitTway Font, Win ShwayBo Font, Win TaungGyi Font, Win TaungNgoo Font, Win ThanLyin Font, Win ThanDwe Font, Win ThuWunna Font, Win Typewriter Font, Win WingDings Font, Win Yadanapone Font, Win Yangon Font

[154] >>153 ファイルの日付は平成6年から平成17年。

変換器

[91] >>90

Mainly between the following type of fonts.:

  • ASCII / Unicode 4.1~5.0 / Unicode 5.1 / UTN11-1 / UTN11-2

The following Burmese fonts will be use:

  • WinInnwa, CE Fonts, Wwin_Burmese, Gandamar Fonts, King Fonts, Metrix, Academy, Zawgyi, UniBurma, Myazedi, Myanmar3, PadaukOT, Parabaik, UniMM

[86] >>81

<select name="Choose Font" id="source" onchange="return NO(this);"><option value="Arial" selected="">-</option><option value="Zawgyi">Zawgyi-One (Zawgyi,Zawgyi1...)</option><option value="UniBurma">UniBurma (UniBurma...)</option><option value="MyaZedi">MyaZedi (Myazedi,bit,Mandalay...)</option><option value="Myanmar3">Myanmar3 (Myanmar2,...)</option><option value="Padauk">Padauk (Padauk...)</option><option value="Parabaik">Parabaik (ParabaikSans,...)</option><option value="WinInnwa">WinInnwa (WinKalaw,WinInnwa,Win Innwa,...)</option><option value="MMyanmar1">M-Myanmar1 (used in Myan Encylopedia)</option><option value="Academy">Academy (Academy,Aeyar,Aekari...)</option><option value="King">Kingmyanmarsar (King...)</option><option value="Gandamar">Gandamar-Letter1 (Gandamar...)</option><option value="Metrix">Metrix-1 Metrix-1(Matrix...)</option><option value="CE">CECLASSIC (CENORMAL,CE EXCEL...)</option><option value="MSHEAVY">MS-HEAVY (MS-MOOM)</option><option value="WwinBurmese">Wwin_Burmese (Wwin...)</option><option value="Kannaka">Kannaka (used in En-MM Dict)</option></select>

[274] この系統の変換器は内部の変換処理に U+3000 からの領域を使っています。入力にこれらが入っていないときは特に害はありませんが、 入力がこれら混じりの時、意味不明な出力が生成されることになります。

[275] また、非 Unicode 側の入出力に U+0FFF を使っています。

//character code 0x999 is dummy for ASCII/Partial Font, its to support Virma character (\u1039) in the fontmap data core.

と注釈があります >>85 が、 実際には U+0999 ではなく U+0FFF の説明と思われます。

[195] >>196

It allows you to convert between Myanmar font systems—Unicode, Zawgyi, and Win Innwa—and extract Myanmar text from uploaded images using OCR.

Convert Myanmar text between Unicode, Zawgyi, and Win

>>194 の実装のうち ZawgyiRabbit (>>23), Win Innwa は独自。

実装

Unicode のようなもの

[138] ビルマ文字の世界が特異なのは、 8ビット符号ベースの Unicode 以前の文字コードの時代と完全な Unicode の時代の間に、 Unicode のようなものフォント依存符号化の時代があることです。

[139] 類例はまったくないわけでもありませんが、規模でそうした文字コードが普及したのはミャンマーだけでしょう。

[238] Unicodeインド系文字全般と同様の方法文字を配置することを定めていますが、 大変複雑で、 (ビルマ文字に限らず) Unicode 以前の文字コードのほとんどと違う方法を採用しています。 21世紀初頭の文字のレンダリングの環境はグリフデータがあってもその複雑な処理を実装していなかったので、 Unicode文字を使いつつ、従来と同様の素朴な方法でグリフを並べる手法しか現実的な選択肢がありませんでした。

[239] 文字列Unicodeビルマ文字の並びではあるので、 本来の Unicode との区別は、従来の8ビット符号ベースの手法と違って、 単純ではありません。 文字の並び順が Unicode の本来の方法で自然か、そうでないかで推定するしかありません。

[240] この手法を採用するフォントはいくつかあります。 非標準の文字の追加などの関係で、互いに (そして文字レベルでみても本来の Unicode と) 互換性がないいくつかの方式があります。

[216] >>215

Semi-Unicode- Faked Unicode

Some Faked Unicode fonts are ZawGyi, MyaZedi, BIT, Parabike, XPartial, etc.

[132] >>130

Q: Does "UTF-8" always indicate Unicode?

Yes, when properly used with Unicode code points. "UTF-8" technically does not apply to ad hoc font encodings such as Zawgyi.

[133] >>132 の通り Unicode Consortium 側は Zawgyi のような Unicode 風であっても Unicode の規定通りでないものは UTF-8 とはいえないという見解。

[134] Unicode 側がこのような態度となるのは当然のこととはいえ、 「Unicode 対応」を謳って Unicode の規定と異なるものが使われていたのもまた事実。 Unicode と思われており、 UTF-8 のように見える方法で符号化されており、 WebブラウザーUTF-8 と認識され、 しかし厳密には Unicode の規定に反する UTF-8 のようなものは、それでは一体何者なのか、というのはじっくり考えたい問題。

[135] たとえば極端な話、文字コード表を作ると結合文字が独立して出現することになり、 意図せぬ用法なので、それは UTF-8 ではないことになってしまうのか、と。 そこまで行かなくても、何かの理由で文字の順序が入れ替わっておかしくなってしまったら、 そのことだけでその文字列Unicode文字列ではないことになってしまうのか、と。 かくいうこの記事も Zawgyi の例文を多数引用しているが、 それではこの記事は UTF-8 ではないのか、と。 あるいは >>223UTF-8 なのかどうか、と。
[136] ただ Zawgyi の場合空き領域や他の文字の領域に勝手に別の文字を割り当てて使っているので、 それを Unicode だ、 UTF-8 だ、と言うのは流石に問題があるのだろう。 UnicodeUTF-8符号構造を流用した別の符号 (つまりフォント依存符号化) というほかなかろう。
[137] 一方でUnicode文字の順序や結合文字の利用方法に関する Unicode の規定に対する違反は、それが適合性にどう作用するのか仕様上もいまいち明確でないというのが >>134 >>135 の主な論点だろう。

Zawgyi 系のフォントとその文字コード

MyaZedi

[98] 後の Zawgyi へつながる系譜のフォントだが、互換性はない。 >>12

[101] >>100

Unicode block + additional glyphs

For instance the font MyaZedi. It has the Unicode characters in the correct blocks, with additional glyphs added for accents.

  • Will display as squares if font not installed. စာအုပ္၊
  • Can be (nearly, so far) one-for-one translated from the non-Unicode font. [1] (http://www.girlza.com/my.php)
  • Can be translated into fully-compliant Unicode (although conversion not as simple).

[105] >>100

  • For Internet Explorer to work, character set must be x-user-defined (rather than utf-8). This means that the UTF-8-encoded HTML must be converted to the &# format before being sent to the browser.

変換器

[97] null, , https://web.archive.org/web/20041021063404/http://www.girlza.com/my.php

This program converts Burmese in Planet font to the MyaZedi Unicode-based font.

[99] >>97PHP によるサーバー側での変換。当時はソースも公開されていた模様だが、 Internet Archive には所蔵されていない。ただし 「Current Mapping」 として対応表が明記されている。 それ以外の変換 (入れ替えなど) があるかは不明だが、 >>101 を見るに、していなかった可能性が高い。

[241] >>97

Current Mapping

CharValuePlanetWwin_Burmese1MyazediUnicodeHex

このうち Char, Planet, Wwin_Burmese1 が同じ文字。

Planet は <font face="Planet, WinInnwa">$</font>

Wwin_Burmese1 は <font face="Wwin_Burmese1">$</font>

Myazedi は文字参照で記述。

実利用例

[111] >>110

<meta http-equiv="Content-Type" content="text/html; charset=x-user-defined">
<meta http-equiv="pragma" content="no-cache">
<meta http-equiv="expires" content="0"> 
<meta http-equiv="cache-control" content="no-cache">
	<span style="font-size: 12.0pt; font-family: Times New Roman">GSP Form (A)
	</span><span style="font-size: 12.0pt; font-family: MyaZedi">&#4145;&#4124;&#4246;&#4140;&#4096;&#4153;&#4124;&#4223;&#4140;</span><br>
&nbsp;</li>
<p><font face="Tahoma" size="2" color="Black">All of documents provided with PDF Format.&nbsp;
    <a href="https://web.archive.org/web/20041015012056/http://www.adobe.com/products/acrobat/readstep2.html"><font color="Blue">Adobe® Acrobat 
Reader®</font></a> Required.</font></p>
     <td align="center" class="smalltext" width="681">Copyright © 2003 eTradeMyanmar. All rights reserved.<br>Implemented By Solveware Solutions<tr>

(Windows-1252)

[106] ဗဟုိစာမ္ယက္‌န္ဟာ - Wikipedia, , https://web.archive.org/web/20050221092021/http://my.wikipedia.org/wiki/%E1%80%97%E1%80%9F%E1%80%AF%E1%80%AD%E1%80%85%E1%80%AC%E1%80%99%E1%80%B9%E1%80%9A%E1%80%80%E1%80%B9%E2%80%8C%E1%80%94%E1%80%B9%E1%80%9F%E1%80%AC

    <meta http-equiv="Content-Type" content="text/html; charset=utf-8"/>

(>>107 とそれ以後の変更により外部CSSでフォント名が指定されていた時代)

[108] この記事はまでアクセスできたらしいが、 その後削除されている。

Zawgyi-One

[190] Google Code Archive - Long-term storage for Google Code Project Hosting., https://code.google.com/archive/p/zawgyi/downloads

[191] >>190

ZawgyiOne2008.ttf 2008 Zawgyi-one font from Alpha Info-Tech

[157] Zawgyi Font for APPLE - MAC OS ~ i - Kayan IT and Computer Tutorials, , https://www.i-kayan.com/2022/05/zawgyi-font-for-apple-mac-os.html

[16] >>12

[33] ChromeFirefox も対応していません。当時の Webページの表示は壊れます。

識別子

[7] 言語タグt-s0 には、 Zawgyi から Unicode への変換を表す zawgyi という値があります。

実利用例

[32] 7Day Daily - ၇ ရက္ ေန႔စဥ္ သတင္းစာ, , https://web.archive.org/web/20141231172341/http://www.7daydaily.com/

フォント明示は bodyfont 13px/1.5 Verdana,Helvetica,Arial,sans-serif のみ。

[37] MYSTERY ZILLION, , https://web.archive.org/web/20080813230511/http://www.mysteryzillion.org/

	font: 10pt Zawgyi-one, verdana, geneva, lucida, 'lucida grande', arial, helvetica, sans-serif;

[67] >>66

@font-face{font-family:"Zawgyi-One";src:url(/sites/frontiermyanmar.net/themes/mspiral-wide/css/fonts/Zawgyi-One.woff) format("woff"),url(/sites/frontiermyanmar.net/themes/mspiral-wide/css/fonts/Zawgyi-One.eot) format("embedded-opentype"),url(/sites/frontiermyanmar.net/themes/mspiral-wide/css/fonts/Zawgyi-One.svg) format("svg"),url(/sites/frontiermyanmar.net/themes/mspiral-wide/css/fonts/Zawgyi-One.ttf) format("truetype");}@font-face{font-family:"Reboto";src:url(/sites/frontiermyanmar.net/themes/mspiral-wide/fonts/Roboto-Light-webfont.ttf?1444280689) format('truetype'),url(/sites/frontiermyanmar.net/themes/mspiral-wide/fonts/Roboto-Light-webfont.woff?1444280689) format('woff'),url(/sites/frontiermyanmar.net/themes/mspiral-wide/fonts/Roboto-Light-webfont.eot?1444280689) format('embedded-opentype'),url(/sites/frontiermyanmar.net/themes/mspiral-wide/fonts/Roboto-Light-webfont.svg?1444280689) format('svg');}@font-face{font-family:"ABeeZee-Regular";src:url(/sites/frontiermyanmar.net/themes/mspiral-wide/fonts/ABeeZee-Regular.ttf?1444280689) format('truetype'),url(/sites/frontiermyanmar.net/themes/mspiral-wide/fonts/ABeeZee-Regular.woff?1444280689) format('woff'),url(/sites/frontiermyanmar.net/themes/mspiral-wide/fonts/ABeeZee-Regular.eot?1444280689) format('embedded-opentype'),url(/sites/frontiermyanmar.net/themes/mspiral-wide/fonts/ABeeZee-Regular.svg?1444280689) format('svg');}@font-face{font-family:"ElegantIcons";src:url(/sites/frontiermyanmar.net/themes/mspiral-wide/fonts/ElegantIcons.ttf?1444280689) format('truetype'),url(/sites/frontiermyanmar.net/themes/mspiral-wide/fonts/ElegantIcons.woff?1444280689) format('woff'),url(/sites/frontiermyanmar.net/themes/mspiral-wide/fonts/ElegantIcons.eot?1444280689) format('embedded-opentype'),url(/sites/frontiermyanmar.net/themes/mspiral-wide/fonts/ElegantIcons.svg?1444280689) format('svg');}@font-face{font-family:"Fontawesome";src:url(/sites/frontiermyanmar.net/themes/mspiral-wide/fonts/fontawesome-webfont.ttf?1444280689) format('truetype'),url(/sites/frontiermyanmar.net/themes/mspiral-wide/fonts/fontawesome-webfont.woff?1444280689) format('woff'),url(/sites/frontiermyanmar.net/themes/mspiral-wide/fonts/fontawesome-webfont.eot?1444280689) format('embedded-opentype'),url(/sites/frontiermyanmar.net/themes/mspiral-wide/fonts/fontawesome-webfont.svg?1444280689) format('svg');}@font-face{font-family:"Museo700";src:url(/sites/frontiermyanmar.net/themes/mspiral-wide/fonts/museo700-regular-webfont.ttf?1444280689) format('truetype'),url(/sites/frontiermyanmar.net/themes/mspiral-wide/fonts/museo700-regular-webfont.woff?1444280689) format('woff'),url(/sites/frontiermyanmar.net/themes/mspiral-wide/fonts/museo700-regular-webfont.eot?1444280689) format('embedded-opentype'),url(/sites/frontiermyanmar.net/themes/mspiral-wide/fonts/museo700-regular-webfont.svg?1444280689) format('svg');}body{font-family:"Reboto","Zawgyi-One","Arial",sans-serif;}

[148] ယူနီကုတ္ေဖာင့္ သြင္းျခင္း - Installing Myanmar Unicode Font | Myanmar Language, , https://web.archive.org/web/20110813070031/http://www.myanmarlanguage.org/installing_myanmar_unicode

[149] >>148 Myanmar 3 (Unicode) の案内をしている記事で、 それが故に Zawgyi で書かれているらしい。しかしフォントは他の記事と同じく

"Masterpiece Uni Sans",Yunghkio,"Myanmar3",Parabaik,Padauk,"WinUni Innwa","Win Uni Innwa","MyMyanmar Unicode",Myanmar2,"Helvetica Neue",Arial,Helevtica,Verdana,san-serif

になっており、いずれも Unicode フォントなので、どれか1つでも入っているとこの記事は文字化けする。

[210] ꨅꨯꨤးေꨀ်ꨣꨲ ꨬ တꨵ - သꨤင္းꨀ်ꨤꨓ္ꨲတူꨀ္းယဝ္ꨵꨓြင္ꨵ - YouTube, https://www.youtube.com/watch?v=ptyJixhrPfw

Zawgyi-Tai

[18] Shan Font & Keyboard download | SourceForge.net, https://sourceforge.net/projects/shanfont/

[19] Shan Font & Keyboard / Wiki / Home, https://sourceforge.net/p/shanfont/wiki/Home/

[206] >>204 特別なフォント指定は無し

[17] Zawgyiのシャン語拡張: Zawgyi-Tai - にせねこメモ, https://nixeneko.hatenablog.com/entry/2025/05/17/144839

[255] >>21 この変換器の実装読むと、ちゃんと動作確認してるのか不安になるなあ...

Ayar

[113] >>112

As the Unicode standard has been implemented in many recent technologies and modern operating systems, Myanmar users will greatly benefit by using Ayar Myanmar Unicode font, which was developed according to the Unicode Standard 6.0.

[115] >>114

<meta http-equiv="Content-Type" content="text/html; charset=UTF-8"/>
  <base href="https://web.archive.org/web/20110501031538/http://www.ayarunicodegroup.org/"/>
  <meta http-equiv="content-type" content="text/html; charset=utf-8"/>
<script type="text/javascript">

original_content_font = 'ayar';
display_content_font = 'ayar';

function init() {
// quit if this function has already been called
if (arguments.callee.done) return;

// flag this function so we don't do the same thing twice
arguments.callee.done = true;

if (original_content_font == 'zawgyione'){
toA();
}
else if (original_content_font == 'ayar'){
toZ();
}
if (display_content_font == 'zawgyione'){
toZ();
}
else if (display_content_font == 'ayar'){
toA();
}
};

/* for Mozilla /
if (document.addEventListener) {
document.addEventListener("DOMContentLoaded", init, false);
}

/ for Internet Explorer /
/*@cc_on @*/
/*@if (@_win32)
document.write("<script defer src=ie_onload.js><"+"/script>");
/*@end @*/

/ for other browsers */
window.onload = init;
</script>
<style id="page-skin-1" type="text/css">
@font-face {
  font-family: 'Ayar';
  src: url('https://web.archive.org/web/20110501031538im_/http://ayarunicode.googlecode.com/files/ayar-webfont.eot');
  src: local('Ayar'),
	url('https://web.archive.org/web/20110501031538im_/http://www.ayarunicodegroup.org/ayar.woff') format('woff'),
        url('https://web.archive.org/web/20110501031538im_/http://www.ayarunicodegroup.org/ayar.ttf') format('opentype'),
	url('https://web.archive.org/web/20110501031538im_/http://ayarunicode.googlecode.com/svn/trunk/ayar-webfont.svgz#webfontsnhuR0D6') format('svg'),
	url('https://web.archive.org/web/20110501031538im_/http://ayarunicode.googlecode.com/svn/trunk/ayar-webfont.svg#webfontsnhuR0D6') format('svg');
	font-weight: normal;
	font-style: normal;
    unicode-range:U+1000-1097;
    text-rendering: optimizeLegibility;
  }
@font-face {
  font-family: 'Ayar Kasone';
  src: url('https://web.archive.org/web/20110501031538im_/http://www.ayarunicodegroup.org/ayar-webfont.eot');
  src: local('Ayar Kasone'),
	url('https://web.archive.org/web/20110501031538im_/http://www.ayarunicodegroup.org/ayar_kasone.woff') format('woff'),
    url('https://web.archive.org/web/20110501031538im_/http://www.ayarunicodegroup.org/ayar_kasone.ttf') format('opentype'),
	url('https://web.archive.org/web/20110501031538im_/http://ayarunicode.googlecode.com/svn/trunk/ayar_kasone-webfont.svgz#webfonty96Ct56S') format('svg'),
	url('https://web.archive.org/web/20110501031538im_/http://ayarunicode.googlecode.com/svn/trunk/ayar_kasone-webfont.svg#webfonty96Ct56S') format('svg');
	font-style: normal;
    unicode-range:U+1000-1097;
    text-rendering: optimizeLegibility;
  }
@font-face {
  font-family: 'Ayar Takhu';
  src: url('https://web.archive.org/web/20110501031538im_/http://www.ayarunicodegroup.org/ayar_takhu-webfont.eot');
  src: local('Ayar Takhu'),
	url('https://web.archive.org/web/20110501031538im_/http://www.ayarunicodegroup.org/ayar_takhu.woff') format('woff'),
    url('https://web.archive.org/web/20110501031538im_/http://www.ayarunicodegroup.org/ayar_takhu.ttf') format('opentype'),
	url('https://web.archive.org/web/20110501031538im_/http://ayarunicode.googlecode.com/svn/trunk/ayar_takhu-webfont.svgz#webfontPga0uKRT') format('svg'),
	url('https://web.archive.org/web/20110501031538im_/http://ayarunicode.googlecode.com/svn/trunk/ayar_takhu-webfont.svg#webfontPga0uKRT') format('svg');
	font-style: normal;
    unicode-range:U+1000-1097;
    text-rendering: optimizeLegibility;
  }
@font-face {
  font-family: 'Ayar Juno';
  src: url('https://web.archive.org/web/20110501031538im_/http://www.ayarunicodegroup.org/ayar_juno-webfont.eot');
  src: local('Ayar Juno'),
	url('https://web.archive.org/web/20110501031538im_/http://www.ayarunicodegroup.org/ayar_juno.woff') format('woff'),
    url('https://web.archive.org/web/20110501031538im_/http://www.ayarunicodegroup.org/ayar_juno.ttf') format('opentype'),
	url('https://web.archive.org/web/20110501031538im_/http://ayarunicode.googlecode.com/svn/trunk/ayar_juno-webfont.svgz#webfontn0PFpV0z') format('svg'),
	url('https://web.archive.org/web/20110501031538im_/http://ayarunicode.googlecode.com/svn/trunk/ayar_juno-webfont.svg#webfontn0PFpV0z') format('svg');
	font-style: normal;
    unicode-range:U+1000-1097;
    text-rendering: optimizeLegibility;
  }
@font-face {
  font-family: 'Ayar Wazo';
  src: url('https://web.archive.org/web/20110501031538im_/http://ayarunicode.googlecode.com/files/ayar_wazo-webfont.eot');
  src: local('Ayar Wazo'),
	url('https://web.archive.org/web/20110501031538im_/http://www.ayarunicodegroup.org/ayar_wazo.woff') format('woff'),
    url('https://web.archive.org/web/20110501031538im_/http://www.ayarunicodegroup.org/Ayar_Wazo.ttf') format('opentype'),
	url('https://web.archive.org/web/20110501031538im_/http://ayarunicode.googlecode.com/svn/trunk/ayar_wazo-webfont.svgz#webfontFNSUhG79') format('svg'),
	url('https://web.archive.org/web/20110501031538im_/http://ayarunicode.googlecode.com/svn/trunk/ayar_wazo-webfont.svg#webfontFNSUhG79') format('svg');
	font-weight: normal;
	font-style: normal;
    unicode-range:U+1000-1097;
    text-rendering: optimizeLegibility;
  }
h1, h2 { font-family:Ayar Kasone, Ayar Wazo, Ayar Takhu, Ayar; text-rendering: optimizeLegibility; text-shadow: 0 0.5px 0.5px #000000;}
h3, h4, h5 { font-family:Ayar Kasone, Ayar Wazo, Ayar Takhu, Ayar; text-rendering: optimizeLegibility;}
p { font-family:Ayar, Tahoma, Arial, Helvetica, serif; text-rendering: optimizeLegibility;}
                    <p>ယူနီကုဒ် အက္ခရာ​စနစ်သည် ဗမာစာနှင့်​ ြမန်မာ​တိုင်း​ရင်း​သား​ စာများ​ အပါ​အဝင် ​ေခတ်သစ် နိုင်ငံတကာ စာ​ေပ ​ေရး​ထံုး​​စနစ် အသစ် ြဖစ်သည်။ ဤ​စနစ်​အရ ြမန်မာ​အက္ခရာ​များ​ကို Universal Character Set ဟု​ေခါ်​ေသာ ကမ္ဘာသံုး​ အက္ခရာ​​ဇယား​တွင် အတိအကျ ​ေနရာ​​ချ​ထား​ြပီး​ ြဖစ်သည့်​​​အတွက် ဤ​စနစ်ကို လိုက်နာ​ပါက ြမန်မာ​​အက္ခရာများ​သည် နိုင်ငံ​တကာ အက္ခရာ ​ေရး​ထံုး​​​စနစ်တွင် အံဝင်​​ေစသြဖင့်​ စံလွဲသည့်​ ြပဿနာများ​ မရှိနိုင်ပါ။ ဥပမာ​အား​ြဖင့်​ ကွန်ပျူတာ ြဖင့်​ စာစီရာတွင်​ြဖစ်​ေစ၊​ စာလံုး​ေြပာင်း​ရာတွင်​ြဖစ်​ေစ စာလံုး​​အရွယ်နှင့်​ အထား​ အသိုများ​ မှန်ကန်​ေစြခင်း​၊​ ကွန်ပျူတာ​စနစ်ြဖင့်​ သိုမှီး​ထား​ေသာ အချက် အလက်များ​ကို စနစ်တကျ ြပန်လည်​ရှာ​ေဖွရန် လွယ်ကူ​​ေစြခင်း​၊​ အင်တာနက် သံုး​စွဲရာတွင် ​ေဖာင့််​စနစ်များ​ ညီညွတ်​သြဖင့်​ စာလံုး​များ​ကို မှန်ကန်စွာ ြမင်ရြခင်း​ စသည့်​ အ​ေထာက်​အကူများ​ ရရှိမည် ြဖစ်ပါသည်။</p>

[118] >>116, >>117convertAyarToZawgyi, convertZawgyiToAyar がある


[30] >>2

Zawgyi から Unicode へ

[12] ZawgyiとUnicode: ミャンマーの文字の電子化について - にせねこメモ, https://nixeneko.hatenablog.com/entry/2023/12/19/210000

[28] >>12 大変参考になる記事ではあるが、歴史的経緯については Unicode 側のプロパガンダじみているので要注意 (Unicode 時代の今、世界的に勝者である Unicode 側が歴史を書いているので、それを調べて書くとそうなるのは致し方がない)。

[5] ついにGoogle翻訳にビルマ語(ミャンマー語)が | エヤワディ Blog ( ()) http://www.ayeyarwady.com/blog/archives/2682

左側のビルマ語、文字化けしている。7Day Daily のWEBサイトがZawgyi-Oneを使っているせいだ。ビルマ語のサイトはWikipediaなどを除き、多くはZawgyi-Oneを使っている。

Google翻訳はこの文字化けしたZawgyi-Oneのビルマ語を自動的にUnicodeのビルマ語に変換して翻訳しているようだ。同じ文章を事前にUnicodeに変換したものと比較してみたが、だいたい同じような翻訳結果だった。


[27] Unified under one font system as Myanmar prepares to migrate from Zawgyi to Unicode · Global Voices, https://globalvoices.org/2019/09/04/unified-under-one-font-system-as-myanmar-prepares-to-migrate-from-zawgyi-to-unicode/

[73] Unicode Today – Unicode Technical Support | Myanmar, , https://web.archive.org/web/20161108104818/http://www.unicode.today/

[22] Myanmar Fonts: Unicode, Zawgyi, Pyi Daung Su Download, https://www.myanmarhouse.com.mm/en/tools/myanmar-font-download

You can download Myanmar fonts on this page including Zawgyi font, Zawgyi keyboard and Myanmar Unicode font. There are lots of Myanmar fonts available for free. One of the most popular fonts was Zawgyi font.It was called Zawgyi One font. Other popular and free Myanmar unicode fonts are Pyidaungsu Font, Myanmar 3 Font and Myanmar Padauk Font.

After that, with the help of Myanmar State Counsellor Daw Aung San Suu Kyi, PyiDaungSu font is set as a standard Myanmar unicode font to use on the internet and in Government offices. You can download all those Myanmar fonts on this page.


[102] >>100

There are four options that I've seen used on the internet for the display of Burmese characters.

  • A non-Unicode font that substitutes ISO-8859-1 characters (e.g. A B C D E) with Burmese glyphs.
  • A font with Burmese characters in the Myanmar Unicode block, with additional glyphs added to overcome non-compliant display engines.
  • A fully Unicode compliant font, with associated display technology.
  • Displaying dynamically generated PNGs (or GIFs).

This encyclopedia is using the second option at the moment.

[104] >>103

This encyclopedia is using the third option at the moment. We are using MPH Yangon, an OpenType font that contains information on how to render Burmese characters according to the Unicode standard.

[107] မီဒီယာဝီကီ:Monobook.css: တည်းဖြတ်မှု မူကွဲများ - ဝီကီပီးဒီးယား, , https://my.wikipedia.org/w/index.php?title=%E1%80%99%E1%80%AE%E1%80%92%E1%80%AE%E1%80%9A%E1%80%AC%E1%80%9D%E1%80%AE%E1%80%80%E1%80%AE:Monobook.css&diff=prev&oldid=1580 ()

body {font-family:"Times New Roman", "MPH Yangon", Padauk, MyaZedi, Code2000;}

(MPH 以下4つが追加)


[150] Google in Myanmar Language | Myanmar Language, , https://web.archive.org/web/20110727104436/http://www.myanmarlanguage.org/project/google-myanmar-language

I've been lately the major contributor of Google in your language, Myanmar, main site. I kept translating, cleaning up the raw translations, converting Zawgyi encodings to Unicode and maintaining the main site translation around 93% to 99% translated.

When I was back on the translation page last week, I felt really disappointed that all my previous translations were converted to Ayar encoding. Moreover, there were only a few cleaning-up since I left. So I have to start all over again by converting Ayar to Unicode and cleaning-up of the remaining.

Google ကုိ ျမန္မာဘာသာသုိ႕ျပန္ဆုိရာတြင္ ေက်းဇူးျပဳ၍ Zawgyi Encoding ကုိ မသုံးပါႏွင့္။

Google ကို ြမန်မာဘာသာသို့ြပန်ဆိုရာတွင် ေကျးဇူးြပု၍ Ayar Encoding ကို မသုံးပါနှင့်။

ယူနီကုတ်သုံးနေပါက Google ကို မြန်မာသာသို့ ပြန်ဆိုရာတွင် အကူအညီပေးပေးပါ။ ကျေးဇူးတင်ပါသည်။

[151] >>150 最後の部分のGoogle翻訳:

Google をビルマ語に翻訳する際は、Zawgyi エンコードを使用しないでください。

Google をビルマ語に翻訳する際は、Ayar エンコードを使用しないでください。

Unicode をご利用の場合は、Google をビルマ語に翻訳する作業にご協力ください。ありがとうございます。

[152] Google翻訳>>150 をそのまま翻訳できる。

Zawgyi の判定と変換

[171] >>158

It is a Chrome extension that will check web content and convert to Unicode encoded text if they are Zawgyi. It use Parabaik Converter and Myanmar Font Tagger Script(by Ko Thant Thet Khin Zaw). Because of Parabaik Converter, this repo will be under GPL.

[173] >>160

To detect the input string is Zawgyi text or not This is result of a code_diving from http://unicode.org/cldr/trac/browser/trunk/tools/java/org/unicode/cldr/util/MyanmarZawgyiConverter.java. Original code will detect Myanmar Ethnic's language (Shan, Mon, Karen and so on) as Zawgyi Text. Nightly, it will pretty good on detecting Zawgyi text with more than 20 patterns. Some parts are modified.

[177] >>175

Tada is created to help Zawgyi users move to unicode. Plus, Unicode users will be able to see Zawgyi because it detects Zawgyi and convert it to Unicode from system level. So, everything written in Zawgyi in your phone will be converted to Unicode.

[178] >>176

# Based on on paytan from Ko Thura Hlaing, Rabbit from Ko Htain Linn Shwe and MyanmarZawgyiConverter.java from Unicode CLDR ( Common Locale Data Repository )

[202] GitHub - kominko/mmft: Myanmar Font Tools, https://github.com/kominko/mmft

This is the chrome extension to make Myanmar lanuage appear correctly for both standardized Myanmar Unicode as well as non standard yet widely used ZawGyi.

[258] >>198 は他の (ビルマ文字以外を含めても) 文字コードの変換の実装とは違って、 ある条件に一致する部分区間があれば、それに対して特定の変換規則群を適用する、 という形になっている。ほとんどの規則は展開して一般的な文字列全体に対する操作に書き換えることができそうだが、 見通しが悪く他の実装との比較が困難。 また、すべての変換規則が宣言的な定義になっており、それを解釈する実装とわかれているが、 宣言的な記述の意味は簡単なコメントのほかは実装を読むしかなく、 実装コードは理解しやすさのために書かれているわけではないので意味を掴むのは骨が折れる。 まとめると、全体的に相当に見通しが悪く理解しづらい。 一応雰囲気を読み取った結果をメモっておくと:

  • [259] phases ごとに分かれていて、順番に適用されるが、実行時オプションで有効、無効を切り替えられる。
  • [260] rules が置換規則で、文字列の先頭から1文字ずつ、最初の規則から順番に試して最初に成功したものだけが適用されて次の文字へと進む。
  • [262] minLength, quickTests はたぶん性能のためだけなので取り敢えず無視していいはず。
  • [261] from, to の @abc のようなものは tplSeq で定義した文字クラスに展開される。 from が第1要素、 to が第2要素で、対応関係にあるものに置き換えられる。
  • [263] from の #abc のようなものは tplVar で定義した文字クラスに展開される。
  • [264] postRulesRef があれば、 to への置き換えが発生した部分文字列に postRulesDef の規則が適用される。
    • [271] 最初の規則から順に部分文字列全体に適用してから次の規則へと進む。
    • [266] ただし orGroup が同じもののうちで最初に一致した規則だけ適用される。
      • [273] 実際の使われ方を見ると、 zg2uni ではこれが意味を持つ使われ方をされていない。 uni2zg では一部で意味を持つ可能性がある。
    • [265] postRulesStart で to の何文字目にどの orGroup の規則を適用するかを指定する。
    • [272] whileMatch モードで呼び出されると、一連の後規則群によって変更があれば、再度一連の後規則群を適用しなおす。
  • [267] left, right で一致部分の前・後の文脈を指定できる。
  • [268] skip, when で実行時オプションで有効、無効を切り替えられるようになる。
  • [269] from, left, right は (tpl の置換をすれば) 正規表現。
  • [270] to は (tpl の置換をすれば) \1 \2 のような capture の参照入りの文字列。

[187] ミャンマー語のZawgyi/Unicode相互変換ツール | 株式会社雅, https://www.520328.jp/global/myanmar-conversion/#form_mm

[188] >>177 サーバー側で動作し、詳細不明。

混在事例

(完全に移行前)

[45] >>43 JavaScript 文字列でも利用

[46] >>43 属性値でも利用

<input type="text" id="txtHeaderSearch" name="k" placeholder="ရွာေဖြခ်င္သည့္ စာသား" accesskey="s" value="" class="form__input analyticstag-event" onkeydown="if (event.keyCode === 13) { FireAnalyticsTagEventOnSearch('search', $dom.get('txtHeaderSearch')[0].value) }"/>
<a role="button" href="#" title="ေရွ ႔သို႔">

[47] >>44

@font-face{font-family:Zawgyi-One-Embedded;src:url(/web/20181222152738im_/https://burmese.voanews.com/Content/responsive/fonts/zawgyione-webfont.woff) format("woff");font-weight:normal;font-style:normal}body{font-family:"Zawgyi-One","Zawgyi1","Zawgyi-One-Embedded";font-size:16px;line-height:1.5;color:#222;-webkit-font-smoothing:antialiased}body strong,body b{font-weight:bold;font-family:"Zawgyi-One","Zawgyi1","Zawgyi-One-Embedded"}

[49] >>48 この頃のツイートには新旧が混在している?

[51] >>50 のツイート本文

၂၀၂၃ မဟာသႀကၤန္ က်င္းပမယ့္ အေျခအေန

>>50Twitter Card の題名

၂၀၂၃ မဟာသင်္ကြန် ကျင်းပမယ့် အခြေအနေ

これらは同文のはずで、当時どう表示されていたかはわからないが、現在ではリンク先が Unicode になっているのでツイート本文と違っている。

[54] >>52 >>53 を比較すると、

  • [55] 公開当時 >>52Zawgyi 本文の後に Unicode 本文が繰り返されていた。
    • [56] ただし当時は全体に Zawgyi が指定されている (Webフォント利用の) ため、 Unicode の方は正しく表示されていなかった。
  • [57] 令和7年現在 >>53 は、 Unicode 本文の後に UnicodeZawgyi とみなして Unicode に二重変換したものがある。
    • [58] 前半は正しく表示される。 >>52 の後半相当。
    • [59] 後半は正しく表示されない。

[60] おそらくある時点で古い記事を一括して Zawgyi から Unicode に変換したときに、混在している記事も気にせずそのまま変換した結果が令和7年の現状なのでしょう。

[61] >>52 前半 (Zawgyi)

စစ္တပ္က စစ္ေၾကာင္းႏွစ္ေၾကာင္းနဲ႔ နယ္ေျမ႐ွင္းလင္းေနတဲ့ မႏၲေလးတိုင္း ျမင္းၿခံၿမိဳ႕နယ္ထဲမွာ ႐ြာသားေတြ ဖမ္းဆီးခံေနရတယ္လို႔ ေဒသခံေတြက ေျပာပါတယ္။ ဒီေန႔ ဧၿပီလ ၉ ရက္ေန႔မွာပဲ မီးေပါက္ေက်း႐ြာက ၅ ေယာက္၊ တည္ပင္ေက်း႐ြာက ၅ ေယာက္ စုစုေပါင္း ႐ြာသား ၁၀ ေယာက္ကို စစ္တပ္က ဖမ္းဆီးသြားတယ္လို႔ ျမင္းၿခံေဒသခံက ေျပာပါတယ္။

[62] >>52 後半 (Unicode)

စစ်တပ်က စစ်ကြောင်းနှစ်ကြောင်းနဲ့ နယ်မြေရှင်းလင်းနေတဲ့ မန္တလေးတိုင်း မြင်းခြံမြို့နယ်ထဲမှာ ရွာသားတွေ ဖမ်းဆီးခံနေရတယ်လို့ ဒေသခံတွေက ပြောပါတယ်။ ဒီနေ့ ဧပြီလ ၉ ရက်နေ့မှာပဲ မီးပေါက်ကျေးရွာက ၅ ယောက်၊ တည်ပင်ကျေးရွာက ၅ ယောက် စုစုပေါင်း ရွာသား ၁၀ ယောက်ကို စစ်တပ်က ဖမ်းဆီးသွားတယ်လို့ မြင်းခြံဒေသခံက ပြောပါတယ်။

[63] >>53 前半 (Zawgyi から変換した Unicode)

စစ်တပ်က စစ်ကြောင်းနှစ်ကြောင်းနဲ့ နယ်မြေရှင်းလင်းနေတဲ့ မန္တလေးတိုင်း မြင်းခြံမြို့နယ်ထဲမှာ ရွာသားတွေ ဖမ်းဆီးခံနေရတယ်လို့ ဒေသခံတွေက ပြောပါတယ်။ ဒီနေ့ ဧပြီလ ၉ ရက်နေ့မှာပဲ မီးပေါက်ကျေးရွာက ၅ ယောက်၊ တည်ပင်ကျေးရွာက ၅ ယောက် စုစုပေါင်း ရွာသား ၁၀ ယောက်ကို စစ်တပ်က ဖမ်းဆီးသွားတယ်လို့ မြင်းခြံဒေသခံက ပြောပါတယ်။

[64] >>53 後半 (Unicode から二重変換した壊れた Unicode)

စဈတပျက စဈကွောငျးနှဈကွောငျးနဲ့ နယျမွရှေငျးလငျးနတေဲ့ မန်တလေးတိုငျး မွငျးခွံမွို့နယျထဲမှာ ရှာသားတှေ ဖမျးဆီးခံနရေတယျလို့ ဒသေခံတှကေ ပွောပါတယျ။ ဒီနေ့ ဧပွီလ ၉ ရကျနေ့မှာပဲ မီးပေါကျကြေးရှာက ၅ ယောကျ၊ တညျပငျကြေးရှာက ၅ ယောကျ စုစုပေါငျး ရှာသား ၁၀ ယောကျကို စဈတပျက ဖမျးဆီးသှားတယျလို့ မွငျးခွံဒသေခံက ပွောပါတယျ။

[211] ဝီကီပီးဒီးယား ဆွေးနွေးချက်:Font - ဝီကီပီးဒီးယား, , https://my.wikipedia.org/wiki/%E1%80%9D%E1%80%AE%E1%80%80%E1%80%AE%E1%80%95%E1%80%AE%E1%80%B8%E1%80%92%E1%80%AE%E1%80%B8%E1%80%9A%E1%80%AC%E1%80%B8_%E1%80%86%E1%80%BD%E1%80%B1%E1%80%B8%E1%80%94%E1%80%BD%E1%80%B1%E1%80%B8%E1%80%81%E1%80%BB%E1%80%80%E1%80%BA:Font

[212] >>211 Zawgyi を好む旨の平成30年、令和元年の投稿が Zawgyi。 それ以外の Wikipedia としての要素が Unicode

Unicode ビルマ文字

[236] Unicodeインド系諸文字全般と同様の方法ビルマ文字に対応していますが、 ビルマ文字の構造ゆえの違いもあります。

[232] Unicode は当初の規定が不適切だったとして Unicode 5.1 で新しい符号化モデルを採用しました。

[233] UnicodeKorean mess 以後一度割り当てた符号位置を変更しないといっており、 ここでもその原則は破ってはいませんが、破っていないのはその原則だけで、 実質的には非互換変更に当たります。 旧モデルの文字列を現在の実装は正しく(当時の想定通りに)表示できません。

[237] 新旧を確実に区別する方法はなく、文字列のパターンなどから推定するしかありません。

Unicode 5.0 まで

[234] 当初の Unicode が採用していた旧符号化モデルは、 Unicode 5.0 まで採用されていましたが、当時のミャンマーでは Unicode 4.0 方式などと呼ばれていました。

[219] Myanmar Unicode | Burmese Unicode, , https://web.archive.org/web/20060616223809/http://www.myanmarnlp.net.mm/opentype.htm

Myanmar NLP Research Lab develop the first Myanmar Open Type font that Named Myanmar1. This Font contains not only unicode code points and glyphs but also the OTLs logics and rules.

[6] >>12

[192] >>190

Myanmar1.ttf Myanmar1 (Old Unicode 4.0 font, used in BBC web site)

実利用例

[225] >>223

      <meta http-equiv="Content-Language" content="my">
      <title>BBCBurmese.com</title>
      <meta http-equiv="expires" content="now">
      <meta http-equiv="pragma" content="no-cache">
      <meta name="description" content="">
      <meta name="keywords" content="">
      <meta name="created" content="2008-12-19T02:18:02+00:00">
      <meta name="updated" content="2008-12-19T02:18:02+00:00"><script src="https://web.archive.org/web/20081219155147js_/http://www.bbc.co.uk/worldservice/includes/javascript/popupwindow.js" type="text/javascript"></script><link rel="stylesheet" type="text/css" href="https://web.archive.org/web/20081219155147cs_/http://www.bbc.co.uk/worldservice/styles/main.css">
      <link rel="stylesheet" type="text/css" href="https://web.archive.org/web/20081219155147cs_/http://www.bbc.co.uk/worldservice/styles/layoutltr.css"><link rel="stylesheet" type="text/css" href="/web/20081219155147cs_/http://www.bbc.co.uk/myanmar/style800.css?      2.0"/>

မ္ဝမ္‌းမံ‌ေရးသား‌ခ္ယိန္: 19 ရက္ ဒီဇင္‌ဘာ 2008 - ထုတ္‌ပ္ရန္‌‌ေရးသားခ္ယိန္‌ 02:18 GMT

[227] >>226

body {font-family:Myanmar1; font-weight:normal;}

[224] >>223 現在の Webブラウザーでは結合文字が正しく(意図通りに)表示されない。 Google翻訳は適切に翻訳できる。

[231] ကယားပ္ရည္‌နယ္‌‌ - ဝိကိပိဒိယ, , https://web.archive.org/web/20061002230918/http://my.wikipedia.org/wiki/%E1%80%80%E1%80%9A%E1%80%AC%E1%80%B8%E1%80%95%E1%80%B9%E1%80%9B%E1%80%8A%E1%80%B9%E2%80%8C%E1%80%94%E1%80%9A%E1%80%B9%E2%80%8C%E2%80%8C

人工的な利用例

[230] ဗဟုိစာမ္ယက္‌န္ဟာ - ဝိကိပိဒိယ, , https://web.archive.org/web/20061117061521/http://my.wikipedia.org/wiki/%E1%80%97%E1%80%9F%E1%80%AF%E1%80%AD%E1%80%85%E1%80%AC%E1%80%99%E1%80%B9%E1%80%9A%E1%80%80%E1%80%B9%E2%80%8C%E1%80%94%E1%80%B9%E1%80%9F%E1%80%AC

၀ီကီပိဒိယတ္ဝင္‌ သုံးေသာ ယူနီကုဒ္‌အမ္ယိုးအစားမ္ဟာ ္ရမန္‌မာ၀မ္‌း ယူနီကုဒ္‌အမ္ယိုးအစား္ရဖစ္‌သည္‌။ ္ရမန္‌မာယူနီကုဒ္‌ ပုံစံေကာင္‌းရရ္ဟိဖုိ့ ပညာရ္ဟင္‌မ္ယား က္ရိုးစားေနက္ရပာသည္‌။ သင္‌ရ့ဲကူညီမ္ဟုကုိ ၀ီကီပိဒိယမ္ဟ ေန္ဝးေထ္ဝးစ္ဝာ က္ရိုဆုိပာသည္‌။

At the moment, there are 68 articles. Currently, we are standardizing the unicode font used in Myanmar wikipedia as Myanmar1 which fonts and keyboard driver can be freely availble at http://www.myanmarnlp.net.mm/opentype.htm ္ For more information about the font we're using go to Wikipedia:Font. You can discuss it at Wikipedia_talk:Font.

Unicode4 から Unicode5 への移行

[218] >>217

That is what it does currently, but the encoding model is that of Unicode 4.1, not Unicode 5.1. We need to migrate this Wikipedia and its 80 articles to the new encoding model, and we need to make sure that users can download a platform-independent font which is set as the default display font for this Wikipedia.

[228] ဗဟိုစာမျက်နှာ - ဝိကိပိဒိယ, , https://web.archive.org/web/20080508212306/http://my.wikipedia.org/wiki/%E1%80%97%E1%80%9F%E1%80%AF%E1%80%AD%E1%80%85%E1%80%AC%E1%80%99%E1%80%B9%E1%80%9A%E1%80%80%E1%80%B9%E2%80%8C%E1%80%94%E1%80%B9%E1%80%9F%E1%80%AC

မ္ရန္‌မာဘာသာ ၀ီကီပိဒိယမ္ဟ ္ရကိုဆိုပာ၏‌ ။ (Unicode 4.0 encoding)

မြန်မာစာဝီကီပိဒိယမှကြိုဆိုပါ၏။ ။ (Unicode 5.1 encoding)

မြန်​မာ​စာ​ဝီ​ကီ​ပိ​ဒိ​ယ​မှ​ကြို​ဆို​ပါ​၏။​ ။ (Unicode 5.1 encoding with zwsp)

At the moment, there are 189 articles being standardized to comply Unicode 5.1 encoding. There are some articles still need to be converted to latest Unicode 5.1 encoding from old Unicode encoding standards. You are requested to correct, add and convert to latest Unicode 5.1 encoding whatever necessaries .

Unicode 5.1 から

[235] Unicode 5.1 以後、新しいビルマ文字の符号化モデルが採用されています。

[8] >>12

[229] Padauk Font, , https://web.archive.org/web/20080604072151/http://scripts.sil.org/cms/scripts/page.php?site_id=nrsi&id=padauk

[25] GitHub - NoerNova/Panglong_Shan_Keyboard_Windows: Panglong Shan's keyboard layout for windows, https://github.com/NoerNova/Panglong_Shan_Keyboard_Windows

[26] Issues in Noto Sans Myanmar for "Shan Language" · Issue #19 · notofonts/myanmar, https://github.com/notofonts/myanmar/issues/19

Myanmar 3

[220] Myanmar Unicode | Burmese Unicode, , https://web.archive.org/web/20061018214104/http://www.myanmarnlp.net.mm/opentype.htm

Rencently, we released next version of Myanmar Unicode Open Type Font that named Myanmar2.ttf and Myanmar2ex.ttf. These two fonts implemented with proposal characters to 29th IUC Conference.This conference has not yet confirmed but still considering.In this proposal,we propose other characters that do not contain in previous version 4.1 and these are as follow:

1.Myanmar Vowel Sign Tall AA U+102B, 2.Myanmar Sign Virama U+1039, 3.Myanmar Consonant Medial Ya U+103B, 4.Myanmar Consonant Medial Ra U+103C, 5.Myanmar Consonant Medial Wa U+103D, 6.Myanmar Consonant Medial Ha U+101E, 7.Myanmar Letter Great Sa U+103F

[221] >>220 配布ファイルはソフトウェアとドキュメントで、フォントは見当たらず。


[222] Wayback Machine, https://web.archive.org/web/20120216062157/http://www.myanmarnlp.net.mm/downloads/Myanmar3_Unicode.zip

[193] >>190

mm3.ttf Myanmar3 (Latest Unicode 5.1 font provided by Myanmar NLP)

[143] Download Unicode Fonts and Keyboards | Myanmar Language, , https://web.archive.org/web/20110512143736/http://www.myanmarlanguage.org/article/download-unicode-fonts-and-keyboards

[144] Myanmar Fonts which follow Unicode rules | Myanmar Language, , https://web.archive.org/web/20110719180422/http://www.myanmarlanguage.org/unicode/myanmar-fonts-which-follow-unicode-rules

NameWindows MacLinux License LinkCredits
Myanmar3yesnoyesLGPL, CC3.0code.google.comMyanmar NLP
Masterpiece Uni SansnoyesyesGNU/Linux, OFL sourceforge.netTin Myo Htet, Ngwe Tun, Sun Tun
ParabaikyesnoyesGNU/Linux, OFL parabaik.infoNgwe Tun, Solveware Solution
PadaukyesnoyesOFLscripts.sil.orgMartin Hosken, SIL
ThanlwinyesnoyesOFLthanlwinsoft.orgKeith Stribley, Thanlwinsoft
WinuniInnwayesnoyesFree/Copyrightedmyanmars.netWin Myanmar
XenotypenoyesnoCommercial/Copyrightedxenotypetech.comXenoTypeTech
MyMyanmaryesyesyesFree/CopyrightedMyMyanmar.netMyMyanmar
YunghkioyesnoyesOFLYunghkioSaiddzone

Win Innwa 5

#Note: Nearly the same font face as Myanmar3 and bigger glyphs.

Padauk

Known Issue - In a mixture of English and Myanmar texts in Firefox in Windows 7, English texts may lose kerning and combine together rendering unreadable. Update:11June2011# Padauk font English glyphs will have same bug on Firefox 4+ on any version of Windows.

Xenotype

Known Issue - Rendering bugs on some character stacks and vowel "u".

MyMyanmar

Known Issue - Rendering bugs on some character stacks. Same rendering issue on English and Myanmar texts mixture as Padauk. Rendering issues on some character stacks, Ha-htoe+Wa-swe and vowel "u" on OSX.

Yunghkio

Known Issue - Rendering bug on ဍ္ဎ character stack.

Unicode (UTN-11) defines ဍ္ဎ = ဍ + Virama + ဎ But, MyMyanmar and XenoType do not follow that encoding sequence. Will you accept 1% incorrect?

We should consider it as a bug !!!

Yunghkio also doesn't include combine ligature of U100D and U100E, only have stacked form of U100E :)

Yunghkio has the glyph about combining ligature of U100D and U100E as A_DDHA_DDA as same with Parabaik.

I can say Myanmar3, Parabaik and Yunghkio has 100% bug free except personal preference and/or not implementing. We do not make wrong sequence (encoding) to change certain ligature.

その他のフォント

[146] >>145

The first Unicode System for Shan, Yunghkio, has been released on the 62nd National Day of Shan State, Februrary 7, 2009.

[201] GitHub - AungMyoKyaw/Myanmar-Unicode-Fonts: Myanmar Unicode Fonts, https://github.com/AungMyoKyaw/Myanmar-Unicode-Fonts

入力システム

[9] 2013年度卒業論文 - p1140245.pdf, , https://www3.cuc.ac.jp/~riho-m/sk/files/2012/paper/p1140245.pdf

音節区切り

[246] knayi-myscript/library/syllBreak.js at master · greenlikeorange/knayi-myscript · GitHub, https://github.com/greenlikeorange/knayi-myscript/blob/master/library/syllBreak.js

Zawgyi, Unicode

メモ

[14] デファクト標準できあがってたら Unicode は諦めてそのまま取り込むわけにはいかんかったのか、と思わんでもないが、 Unicode 側で新しく割り当てた別の文字と符号位置が衝突してしまってるからそのまま受け入れるという選択肢もなかったのは仕方ないのか。。。

[15] 現地人の書き順と違うものを論理順とかいうのはどのへんが論理的なんだろか。理論的には論理的なのかもしれないが。。。 不忍池をデータは「忍不池」で持って表示で入れ替えろっていってるようなもんだよな。

[29] タイのように国家標準を作れていれば歴史も違っていたのだろうね。 もっとも、タミルのように20世紀末に慌てて作っても Unicode Consortium に無視されてる事例があるから TAB 、 国家標準で国内が統一されてるレベルに西暦1990年代には達していないといけなかった、 となると結構厳しいよなあ。