クメール文字

クメール文字

文字コード

クメール文字の文字コード

[29] Fonts | Khmer Fonts | Cambodian Fonts | Khmer Unicode - All Khmer Unicode Cambodian Information Center, cambodia.org, http://www.cambodia.org/fonts/

[23] Help - Can i install Khmer unicode font (Cambodian font) on my Galaxy | Early Bird Club, , https://forum.earlybird.club/threads/can-i-install-khmer-unicode-font-cambodian-font-on-my-galaxy.268606/

Unicode

[26] FAQ and Resources on Khmer in Unicode, , https://web.archive.org/web/20060315122255/http://www.bauhahnm.clara.net/Khmer/Welcome.html

[3] How to make a khmer font | Khmer fonts — ​ពុម្ព​អក្សរ​ខ្មែរ — Polices khmères, https://www.khmerfonts.info/howto.php

[4] The state of khmer unicode | Khmer fonts — ​ពុម្ព​អក្សរ​ខ្មែរ — Polices khmères, https://www.khmerfonts.info/unicode.php

[5] >>3 >>4 Unicode にない文字がまだいくつかある

[30] Character list | Khmer fonts — ​ពុម្ព​អក្សរ​ខ្មែរ — Polices khmères, https://www.khmerfonts.info/characterlist.php

[25] Menu Francais, , https://web.archive.org/web/20060312101357/http://www.cfcambodge.org/Anglais/KhmerFont.htm

[27] Khmer OpenType specification, , https://web.archive.org/web/20051122132755/http://www.microsoft.com/typography/otfntdev/khmerot/default.htm

[2] XユーザーのMichiさん: 「若年層がクメール文字を使わずラテンを多用することを懸念する記事。確かにSNSを見るとクメール文字よりも入力しやすいのか、流行りからか、ラテンばかり。記事によれば、かつて宗主国フランスはクメール文字をラテンに置き換えようとしていたと。知らなかった。https://t.co/pOK3g1jypv」 / X, , https://twitter.com/kruphlau/status/1302034027495424005

[6] 半分はずっと内戦やってて工業化が遅れた自国の責任。もう半分は現地事情を無視して複雑な符号化を強引に押し付けてクメール文字の実装を引き伸ばした欧米人の責任。しかし欧米人は仕様だけ作ってあとは知らんふり、 文化がどうなろうと知ったことではないからなあ。

[7] Unicode帝国主義、経済的植民地主義と非難されても擁護のしようがない嫌な事件だったね。

実装

[19] KhmerOS

[20] Khmer Open Source - Browse Files at SourceForge.net, https://sourceforge.net/projects/khmer-open-source/files/

[21] All Khmer Unicode Fonts : Free Download, Borrow, and Streaming : Internet Archive, https://archive.org/details/all-khmer-unicode-fonts

[22] Download All Khmer Unicode Fonts | Society for Better Books in Cambodia, Society for Better Books in Cambodia, https://sbbic.org/2014/06/25/download-all-khmer-unicode-fonts

文字順序問題

[14] Unicodeクメール文字を極めて複雑な仕組みで符号化したにも関わらず、 その用法を十分厳密に定めることを怠り、 実装によって結合文字が異なる順序で用いられるなどの相互運用性の問題が長年放置されてきました。

[16] 基本的には結合文字の配置順の問題のようです。 Unicode には正準再順序付けのような仕組みがあり、 ラテン文字などにはおおむねうまく機能している (あくまでおおむね。) ものの、 クメール文字に対しては碌に定義されておらず、その方面の改善も期待できないようです。

[15] また、複雑な組み合わせになると実装によって正しく表示できないという問題が起こっています。 少数民族言語などに皺寄せが行きがちです。

[17] これについてはどのようなUnicode文字の組み合わせでどのようなグリフが表示されることが期待されるのか、 フォントはどのようなグリフを実装することが期待されるのか、 といったことを具体的に列挙するような規格が本質的な解決策になるのでしょうが、 そうしたものを整備しようという動きは無さそうで、 混乱は続きそうです。

[18] 網羅的な規定を設けず、文字素として利用可能な基底文字結合文字を用意すれば問題解決ということにしてしまうのは、 クメール文字に限らず Unicode の全体的な態度であり、相互運用性の問題を引き起こしがちです。

[31] >>30 がそれに近いのでしょうが、 >>11 を見るにこれでは十分ではなさそうですね。

[9] khmer encoding structure - Institute of Digital Research & Innovation, https://www.idri.edu.kh/khmer-encoding-structure/

[24] GitHub - clo-cambodia/pheasakhmer.com, https://github.com/clo-cambodia/pheasakhmer.com/

[10] utn61-Khmer_Encoding_Structure_V2.pdf, , https://www.unicode.org/notes/tn61/utn61-Khmer_Encoding_Structure_V2.pdf

shaping

[28] Shaping: Khmer OpenType specification, , https://web.archive.org/web/20050908062827/http://www.microsoft.com/typography/otfntdev/khmerot/shaping.htm

日付文字

[8] DATE: 2002-02-13 - 02101-KhmerLunarDates.pdf, , https://www.khmerfonts.info/bauhahn/02101-KhmerLunarDates.pdf

入力正規化

[32] >>12 自然言語処理のためのデータ作成のための正規化器。 クメール文字の表現については >>33 と同等とみられる。 それ以外の基礎的な部分はベンガル文字用の >>35 を流用している。

[38] >>37 の実装が >>36>>36>>12 および変換の実装を使っている。 変換の実装についてはクメール文字の文字コードを参照。

メモ