[208] 
[DFN[チベット語]]は[[チベット人]]の[[言語]]です。
[[シナ・チベット語族]]の[[言語]]の1つです。

[209] 
[DFN[チベット文字]]は[[チベット語]]の表記に普通使われる[[文字]]です。
[[チベット語]]の他に[[サンスクリット語]]などの表記にも使われます。
[[インド系文字]]の一種です。

* チベット文字

[210] 
[[チベット文字]]は[[インド系文字]]の一種です。


[212] 
[[チベット文字]]は普通[[左上横書き]]されます。

[213] 
[[インド系文字]]は一般に[[子音]]を表す[[親文字]]の上下左右に[[母音]]の[[文字素]]を組み合わせる構造を持ちますが、
[[チベット文字]]はそれとは少々異なります。

[214] 
[[チベット文字]]は主に[[親文字]]の上下に[[文字素]]を組み合わせる構造となっています。
理論上は[[文字素]]を重ねていくらでも縦に伸びていきますが、実際上は3,4個程度が限度となります。
この構造を積み (stack) といいます。

[211] 
[[チベット文字]]は[[チベット語]]の表記に用いられる場合と[[サンスクリット語]]の表記に用いられる場合とで若干違った使われ方をします。
[[サンスクリット]]のとき独特の構造となったり、特別な記号を使ったりすることがあります。
[[文字コード]]での表現や[[翻字]]や[[転写]]の手法にもこの差が影響してきます。


* 文字コードとフォント


[219] 
[[Unicode]] 以前の[[チベット文字]]の表現は、
[[中華人民共和国]]の[[多バイト文字符号化]]系の[[符号]]と、
[[欧米]]の[[フォント依存符号化]]や[[翻字]]系の[[符号]]の2種類の手法に大別できます。

[220] 
[[チベット文字]]は[[インド系文字]]ではありますが、構造の違いが大きいため、
[[インド系文字の文字コード]]の各手法との共通性はあまりありません。


-[11] 
[CITE@en[Tibetan fonts — Digital Tibetan]], [TIME[2024-07-27T08:54:50.000Z]], [TIME[2025-09-15T13:50:46.020Z]] <https://digitaltibetan.github.io/DigitalTibetan/docs/tibetan_fonts.html>
-- [13] 
[CITE@en[Editing and creating Tibetan fonts — Digital Tibetan]], [TIME[2024-07-27T08:54:50.000Z]], [TIME[2025-09-15T13:52:31.613Z]] <https://digitaltibetan.github.io/DigitalTibetan/docs/tibetan_font_creation.html>
-- [14] 
[CITE@en[Conversion of old Tibetan texts — Digital Tibetan]], [TIME[2024-07-27T08:54:50.000Z]], [TIME[2025-09-15T13:54:13.799Z]] <https://digitaltibetan.github.io/DigitalTibetan/docs/tibetan_pre_unicode.html>

[12] >>11 [[Unicode]] フォント中心、非 [[Unicode]] フォントの情報もある。

[15] >>14 たくさんの変換器の情報。

** ラテン文字翻字系符号化

[215] 
[[欧米]]などの研究者は[[ラテン文字]]に[[翻字]]して[[チベット文字]]を間接的に扱うことが多くありました。
[[20世紀]]から[[21世紀]]初頭には[[欧米]]等での[[チベット文字]]の交換の主要な方法になっており、
変換器によって[[チベット文字]]として表示したり、
[[入力システム]]で使ったりもされています。


[170] 
>>169



** フォント依存符号化

[216] 
[[欧米]]などの研究者は [[ASCII文字]]や [[Windows-1252]] の[[文字]]を[[チベット文字]]に置き換えた[[フォント依存符号化]]で[[チベット文字]]を表示してきました。

[217] 
[[Windows-1252]] の200個程度の[[バイト]]では[[チベット文字]]には不足しすぎるため、
数個の[[フォント]]を組合せ、 [[RTF]] や [[HTML]] の[[フォント]]切り替え機能と併用する手法が採られています。


;; [218] こうした手法は、他には[[エチオピア文字]]の事例があります。
[SEE[ [[エチオピア文字の文字コード]] ]]


[24] 
[CITE[Tibetan printing]], [TIME[2012-10-31T11:37:54.000Z]], [TIME[2025-09-15T15:14:28.262Z]] <http://www.kalacakra.org/print/print.htm>

[115] 
[CITE@en[The Tibetan and Himalayan Library]], [TIME[2025-10-03T15:20:16.000Z]] <https://old.thlib.org/tools/scripts/wiki/Conversion-Reversion%20for%20Tibetan%20Fonts.html>

[138] 
[CITE@en[The Tibetan and Himalayan Library]], [TIME[2025-10-04T02:15:41.000Z]] <https://old.thlib.org/tools/scripts/wiki/Legacy%20Tibetan%20Font%20Systems.html>

[143] 
[CITE@ja[Font Library]], [TIME[2020-11-02T01:05:09.000Z]], [TIME[2025-10-04T02:31:11.973Z]] <http://www.chofukuji.jp/takaragi/Font.html>

不自由

[144] [CITE[Tsampa.org: Tsampa Keyboard Font]], [[Kristoffer Lindqvist]], [TIME[2025-10-04T02:39:26.000Z]] <https://tsampa.org/tibetan/software/tsamkey/>

[[LGPL]]

*** [CITE[Tibetan Modern A]]

-
[30] 
[CITE[Index of /releases/free-tibetan/tibetan-modern/Original/]], [TIME[2025-09-16T09:43:11.000Z]] <https://download.savannah.nongnu.org/releases/free-tibetan/tibetan-modern/Original/>
- >>17

*** [CITE[Sambhota]]


[70] [CITE[Sambhota-converter]], [TIME[2020-09-07T04:11:39.000Z]], [TIME[2025-09-18T08:07:00.492Z]] <https://karmapa.github.io/tibetan-converter/sambhota-converter/index.html>

>Sambhota is a Tibetan font style that was developed by the American Nitartha company in 1999. Due to the aesthetic appeal of the font style, the font has been widely used by academia and printing houses. [SNIP[]]

[71] 
[CITE@en[GitHub - karmapa/sambhota-parser: sambotha-parser]], [TIME[2025-09-18T08:07:28.000Z]] <https://github.com/karmapa/sambhota-parser>

*** [CITE[Tibetan Machine]] シリーズ


[148] 
[DFN[[CITE[Tibetan! 5.1]]]]
は
[[Tony Duff]]
が
[[Tibetan Computer Company]]
として開発、販売した[[チベット語]]の[[ワープロ]]ソフトウェアです。
[SRC[>>131]]

[149] 
[DFN[[CITE[Tibetan Machine]]]] ([DFN[TM]])
は
[CITE[Tibetan! 5.1]]
と共に開発され同梱された[[フォント]]です。
独自仕様の数個の [[TrueType]] フォントの組合せです。
[SRC[>>131, >>145]]

[150] 
[DFN[[CITE[Tibetan Machine Web]]]] ([DFN[TMW]])
は
[[TM]] の派生[[フォント]]であり、 [[Windows]] では使えたものの
[[Mac]] や [[Webブラウザー]]で不都合があった [[TM]]
を改良しています。
[[TM]] と互換性のない独自仕様の数個の [[TrueType]] フォントの組合せです。
[SRC[>>146]]

[151] 
[DFN[[CITE[Tibetan Machine Uni]]]] ([DFN[TMU]])
は
[[TM]] / [[TMW]] の派生[[フォント]]であり、
[[Unicode]] のフォントです。
[SRC[>>147]]


[152] 
[CITE[Tibetan!]] と [[TM]] は [[Trace Foundation]]
の資金により [[GPL]] で公開されました。 [SRC[>>131]]

[153] 
[[TMW]] は [[THDL]] の協力で開発され、 [[THDL]]
は [[TM]] / [[TMW]] に対応したソフトウェアをいくつか開発しました。
[SRC[>>146]]


[132] >>131 に [CITE[TM]] と [CITE[TMW]] の詳細な説明があります。

[134] >>130 に[[機械可読]]なデータファイルがあります。

[155] >>79 の [CODE[Fonts]] にフォントと生成用データ一式があります。

[REFS[

-[131] [CITE@ja[Tibetan! 5.1 for Word Manual - Tibetan!.pdf]], [TIME[2007-03-14T15:13:17.000Z]], [TIME[2025-10-04T02:10:38.979Z]] <https://collab.its.virginia.edu/access/content/group/26a34146-33a6-48ce-001e-f16ce7908a6a/Tibetan%20Input%20Tools/Tibetan%21%20Resources/Tibetan%21.pdf>
--
[133] 
[CITE@en[The Tibetan and Himalayan Library]], [TIME[2008-11-12T21:18:47.000Z]], [TIME[2025-10-04T02:11:58.449Z]] <https://thdltools.sourceforge.net/Tibetan51Errata.html>
- [145] [CITE@en[The Tibetan and Himalayan Library]], [TIME[2025-10-04T02:57:25.000Z]] <https://old.thlib.org/tools/scripts/wiki/Tibetan%20Machine.html>
- [146] [CITE@en[The Tibetan and Himalayan Library]], [TIME[2025-10-04T02:57:45.000Z]] <https://old.thlib.org/tools/scripts/wiki/Tibet%20Machine%20Web.html>
- [147] 
[CITE@en[The Tibetan and Himalayan Library]], [TIME[2025-10-04T02:58:26.000Z]] <https://old.thlib.org/tools/scripts/wiki/Tibetan%20Machine%20Uni.html>

]REFS]





[76] >>73

>
The Tibetan Machine Web fonts have two different encodings:
-    the first version was only used for PKTC's plugin to WordPerfect
-    the second is the most common one and the only one handled by this code
>
They can be differenciated by looking at the encoding of the tsheg: if it corresponds to the ANSI hyphen (0x2D, decimal 45) it's the second encoding, else it's the first one.


*** [CITE[LTibetan]]


[140] [CITE[Home Page]], [TIME[2006-08-31T08:01:53.000Z]], [TIME[2025-10-04T02:18:47.485Z]] <http://www.interlog.com/%7Epierrer/>

[141] [CITE[Tibetan For Windows - Free Tibetan word processing font and software]], [TIME[2025-10-04T02:20:15.000Z]], [TIME[2001-05-17T03:17:38.690Z]] <https://web.archive.org/web/20010517031641/http://members.aol.com/tib4win/>


[139] [CITE@en[The Tibetan and Himalayan Library]], [TIME[2025-10-04T02:18:35.000Z]] <https://old.thlib.org/tools/scripts/wiki/LTibetan.html>

** 多バイト符号化

[27] 
[[中華人民共和国占領下チベット]]では[[東アジア]]の[[多バイト符号化]]の枠組みで[[チベット文字]]を[[符号化]]した実装事例がいくつかありました。

[187] 
[[西暦1980年代]]中期より各方式が発展してきました。
[[GB 2312]] の10区から15区や88区から94区の空きが使われたり、
[[GB 2312]] の[[漢字]]や [[GBK]] の拡張部分を置き換えたりされました。
[SRC[>>186]]


[188] >>186 によると:

- [189] 方正 Dos 編碼
-- [190] 0xAAA0 - 0xACFE, 0xB0A0 - 0xDEFE
- [191] 方正 Windows 編碼
-- [205] 本文
--- [192] 第1バイト 右
--- [193] 第2バイト 左
-- [206] 表
--- [192] 第1バイト 0xAA - 0xAC, 0xB0 - 0xDE
--- [193] 第2バイト 0xA0-0xFE
- [194] 華光 Windows 編碼
-- [195] 第1第2バイト 0x8086
-- [196] 第3第4バイト 0xB0A1 - 0xFBFE
- [197] 華光 DOS 編碼
-- [198] 第1バイト 右
-- [199] 第2バイト 左
- [200] 同元編碼
-- [201] 0x8140 - 0x8FDC, 0x908A - 0xA08D, 0xA6E1 - 0xA6F2, 0xAA70 - 0xF5F6
-- [202] [[中華人民共和国]]のネットワークで広く用いられた
- [203] 班智达編碼
-- [204] 0xB0AD - 0xEBF3



[28] [CITE[UTFC]] [SRC[>>25]] が対応しているものは:

- [29] [DFN[[CODE[Fz]]]]
-- [31] 第1バイト 0xC0..0xEF
-- [174] 第2バイト 0x21..0x7E
-- [175] [[GBK]] と併用
- [176] [DFN[[CODE[Hg]]]]
-- [177] 第1バイト 0xB0 (実割当は 0xBB) .. 0xEE
-- [178] 第2バイト 0x21..0x7E
- [179] [DFN[[CODE[Bzd]]]] : [DFN[BZDBT]]
-- [180] 第1バイト 0xA6..0xE0
-- [181] 第2バイト 0xA1..0xFF
- [182] [DFN[[CODE[Ty]]]] : [DFN[TIBETBT]]
-- [183] 第1バイト 0x81..0xF5
-- [184] 第2バイト 0x40..0xFF


[REFS[

- [186] [CITE@en-us[Southwest Jiaotong University Researsh and Realization of Tibetan Encoding Recognition and Converdion - CNKI]], [TIME[2025-10-04T06:13:05.000Z]] <https://kns.cnki.net/KCMS/detail/detail.aspx?dbcode=CMFD&filename=2010122051.nh>
#page=18

]REFS]

** Mule

[224] [CITE[Emacs]] は[[チベット文字]]の表示のために
[[94[SUP[2]]集合]]として
[DFN[[CODE[tibetan]]]] (Tibetan 2 column),
[DFN[[CODE[tibetan-1-column]]]] (Tibetan 1 column)
を実装しています。
[SEE[ [[Fp]] ]]


** Unicode

[82] [[GB 16959]] は [[Unicodeチベット文字]]と同等の[[中華人民共和国]]の[[国内規格]]です。
[SEE[ [[GB 16959]] ]]


*** Unicode チベット文字符号化モデル

[104] 
[CITE@en[The Tibetan and Himalayan Library]], [TIME[2025-10-03T14:50:41.000Z]] <https://old.thlib.org/tools/scripts/wiki/Tibetan%20Character%20Encoding%20Proposals.html>



[103] 
[CITE@en[The Tibetan and Himalayan Library]], [TIME[2025-10-03T14:49:14.000Z]] <https://old.thlib.org/tools/scripts/wiki/Encoding%20model%20of%20the%20Tibetan%20script%20in%20the%20UCS.html>

[117] 
[CITE@en[The Tibetan and Himalayan Library]], [TIME[2025-10-03T15:24:24.000Z]] <https://old.thlib.org/tools/scripts/wiki/Deprecated%20Tibetan%20Characters.html>


[83] [CITE@ja[chris fynn - Tibetan Script in the UCS]], [TIME[2025-10-04T05:20:04.000Z]] <https://sites.google.com/view/chrisfynn/home/tibetanscriptfonts/standardization/tibetanscriptintheucs>


*** PUA

[172] [[EWTS]] 方式  [SEE[ >>34 >>171 ]]

[173] [[中華人民共和国]]方式  [SEE[ [[GB/T 20542]] [[GB/T 22238]] ]]



*** Unicode フォント


[105] 
[CITE@en[The Tibetan and Himalayan Library]], [TIME[2025-10-03T14:51:42.000Z]] <https://old.thlib.org/tools/scripts/wiki/Tibetan%20Fonts.html>

[84] [[GB/T 20542]] も参照。



** 変換器

[221] 
[[Unicode]] とそれ以前の[[符号]]や、各[[符号]]相互の変換の実装がいくつかあります。

[222] 
[[インド系文字]]の多くは [[Unicode]] とそれ以外の[[符号]]で[[文字]]の表現方法が大きく異なっているため、
変換器の実装が相当に複雑になる傾向がありますが、
[[チベット文字]]に関してはそうでもありません。

[223] [[Unicodeチベット文字]]が比較的単純な手法を採用しており、
従来の[[文字コード]]との対応付けに文字の順序の入れ替えなどの複雑な処理が必要ありません。



-*-*-

- [72] [CITE@en[GitHub - eroux/tibetan-unicode-scripts: Some random Tibetan Encoding translation scripts]], [TIME[2025-09-18T08:09:29.000Z]] <https://github.com/eroux/tibetan-unicode-scripts/>
- [73] [CITE@en[GitHub - buda-base/py-tiblegenc: Python script to convert PDFs using non-Unicode Tibetan fonts in Unicode text]], [TIME[2025-09-18T08:10:41.000Z]] <https://github.com/buda-base/py-tiblegenc>
-- [74] >>72 >>25 >>69 >>16 の変換表から派生

[75] >>73

>
-    Tibetisch dBu-can
-    DBu-can
-    Youtsoweb (TCRC)
-    Youtso (TCRC)
-    Bod-Yig (TCRC)
-    Ededris
-    Dedris
-    Drutsa
-    Khamdris
-    Sama / Esama
-    LTibetan, LTibetanExtension and LMantra
-    TibetanMachine
-    TibetanMachineWeb
-    TibetanMachineSkt
-    TibetanChogyal (PKTC)
-    TibetanClassic (PKTC)
-    DzongkhaCalligraphic (PKTC)
-    TB-Youtso, TB-TTYoutso, TB2-Youtso, TB2-TTYoutso (LTWA)
-    Monlam ouchan and Monlam yigchong



-*-*-

[25] 
[CITE@en[GitHub - tracefoundation/UTFC: Universal Tibetan Font Converter]], [TIME[2025-09-18T08:01:31.000Z]] <https://github.com/tracefoundation/UTFC>

>
The converter covers 17 different Tibetan encoding schemes including 4 Tibetan transliteration schemes (ACIP, ALA-LC, THL Wylie, Wylie), Tibetan Unicode, and other 12 legacy Tibetan fonts including:
>
Sambhota 1.0 (Sama) Sambhota 2.0 (Dedris) Bandrida Tongyuan Beida Founder Huanguang LTibetan Jamyang TCRC Bod-Yig Tibetan Machine Tibetan Machine Web National Standard Extended
>
The converter also covers four common file formats including txt, Unicode txt, rich text file format (RTF) and HTML web page. You can convert file between arbitrary two encoding schemes from 16 ones mentioned above with certain file formats.



[26] [CITE[yalasoo Tibetan Culture Heritage Promotion]], [TIME[2025-09-15T15:24:13.000Z]], [TIME[2020-07-21T13:43:54.785Z]] <https://web.archive.org/web/20200721134031/http://www.yalasoo.com/English/docs/yalasoo_en_utfc.html>

[[Windows]] アプリ (バイナリー配布)

>The converter covers 17 different Tibetan encoding schemes including 4 Tibetan transliteration schemes, Unicode, and other 12 legacy Tibetan fonts including:
=    Sambhota 1.0 (Sama)
=    Sambhota 2.0 (Dedris)
=    Bandrida
=    Tongyuan
=    Beida Founder
=    Huanguang
=    LTibetan
=    Jamyang
=    TCRC Bod-Yig
=    Tibetan Machine
=    Tibetan Machine Web
=    National Standard Extended
>
The converter also covers four common file formats including txt, Unicode txt, rich text file format (RTF) and HTML web page. You can convert file between arbitrary two encoding schemes from 16 ones mentioned above with certain file formats. 

[185] [CITE@en[The Universal Tibetan Font Converter | Trace Foundation]], [TIME[2025-10-04T06:12:14.000Z]], [TIME[2012-09-29T13:21:19.145Z]] <https://web.archive.org/web/20120929092425/http://trace.org/utfc>

サーバー側実装 

-*-*-


[159] 
実際には符号化法の特性依存で不可なファイル形式の組合せもあります。

[160] 
入力ファイル形式は指定できず、ファイルの先頭バイトから自動判定されます。

[161] 
>>25 の最新版だと 
[CODE[THDLWylieTibetanSyllable.tbl]]
が本来 [CN[LF]]
区切りでなければならないところ
[CN[CRLF]]
になっているため、修正しなければ正常動作しません。

[162] 
>>25 [CODE[Converter.c]] の符号化名の定数

>
[PRE[
#define Unicode 0               //ID--0
#define TMW 1                   //ID--1
#define TM 2                    //ID--2
#define Fz 3                    //ID--3
#define Hg 4                    //ID--4
#define ACIP 5                  //ID--5
#define Wylie 6                 //ID--6
#define LTibetan 7              //ID--7
#define OldSambhota 8   //ID--8
#define NewSambhota 9   //ID--9
#define THDLWylie 10    //ID--10
#define LCWylie 11              //ID--11
#define TCRCBodYig      12      //ID--12
#define Bzd 13                  //ID--13 //2007
#define Ty 14                   //ID--14
#define NS 15                   //ID--15
#define Jamyang 16                      //ID--16  //20080924
]PRE]

[163] >>25 の実装上はいくつかに分類されています。


- [165] [DFN[AW]]  
'''A'''CIP,
'''W'''ylie, THDLWylie, LCWylie
- [164] [DFN[TSL]] : '''T'''M, '''T'''MW, 
Old'''S'''ambhota, New'''S'''ambhota, 
'''L'''Tibetan, 
TCRCBodYig, Jamyang
- [166] [DFN[FzHg]] : '''Fz''', '''Hg'''
- [167] [DFN[BTN]]  :
'''B'''zd,
'''T'''y,
'''N'''S

[168] 
[[HTML]] や [[RTF]] では指定した入出力の符号化の文字の他でも、
[[フォント]]切り替えや[[文字参照]]を使って
[[GBK]]
の文字やその他の [[Unicode文字]]の入出力もできます。


-*-*-

[81] >>80

-*-*-


[16] [CITE[ATTU - ANSI Tibetan To Unicode converter]], [TIME[2015-08-26T00:06:05.000Z]], [TIME[2025-09-15T13:56:25.098Z]] <https://www.pechamaker.com/attu/>

[[Windows]] アプリ (バイナリー配布)


-*-*-

[207] 
>>186 は出現頻度に基づく各種[[文字コードの判定]]の手法を検討してます。



** その他の実装


[69] [CITE[UDP - The Unicode - Dzongkha - Tibetan Word Processor & Database]], [TIME[2024-03-22T00:25:58.000Z]], [TIME[2025-09-18T08:03:48.211Z]] <https://leighb.com/udp/>

>UDP is a stand-alone document processing program that works with European, Tibetan, Dzongkha and many other languages in the Win/98/ME and Win/NT/2000/XP/Vista/7/10/11 environments. It supports not only word processing and databases in multiple languages, it also supports faxing and "one-click" e-mailing. It can convert a large variety of documents formats to/from Unicode.  [SNIP[]]

-
[17] 
[CITE[Fonts for UDP]], [TIME[2024-03-21T19:38:12.000Z]], [TIME[2025-09-15T14:02:16.389Z]] <https://leighb.com/udp/fonts.htm>
-[77] 
[CITE[UDP - File Conversions]], [TIME[2024-03-21T19:38:10.000Z]], [TIME[2025-09-18T08:14:40.074Z]] <https://leighb.com/udp/convert.htm>

* 翻字と転写

[169] 
[[ラテン文字]]への[[翻字]]の手法がいろいろあります。

[50] 
[[Wylie]] と [[EWTS]]  >>39

[51] 
[[DTS]] >>48


[49] [CITE@ja[Microsoft Word - tibetan (1) - tibetan.pdf]], [TIME[2024-09-30T11:06:25.000Z]], [TIME[2025-09-18T07:23:34.719Z]] <https://www.loc.gov/catdir/cpso/romanization/tibetan.pdf>

[[ALA-LC]] 形式

[112] [CITE@en[The Tibetan and Himalayan Library]], [TIME[2025-10-03T15:14:48.000Z]] <https://old.thlib.org/tools/scripts/wiki/Tibetan%20Transliteration%20and%20Transcription.html>




** ACIP

[19] [DFN[ACIP]] は[[チベット文字]]の入力符号の規格。

[20] 
実態としては入力用を想定した [[ASCII文字]]への[[翻字]]だが、
文書整形用の命令もいくつか含まれる。

[18] [CITE@ja[ticode.pdf]], [TIME[2025-09-15T14:03:44.000Z]] <https://raw.githubusercontent.com/DigitalTibetan/DigitalTibetan/main/docs/Resources/ticode.pdf>


[127] >>126 の拡張:

[128] [CITE@en[The Tibetan and Himalayan Library]], [TIME[2008-11-12T21:37:25.000Z]], [TIME[2025-10-04T01:56:05.832Z]] <https://thdltools.sourceforge.net/ACIP_To_Tibetan_Converter.html>

>
The ACIP->Tibetan converters support some non-standard extensions to the ACIP Tibetan Input Code Standard.  One of those is Unicode character escape sequences.  This extension makes it possible to represent characters that the ACIP standard does not address, and to represent one character, U+0F84, that ACIP does address with the transliteration {\} but that is misused in practice so often to refer to U+0F3C that the ACIP->Tibetan converters always produce an error upon seeing {\}. 

>
The latest Extended Wylie Transliteration Scheme standard has assigned private-use area (PUA) Unicode codepoints to some TMW glyphs.  ACIP documents that have a Unicode escape in the range U+F021 to U+F0FF, inclusive, are interpreted as intending these TMW glyphs.  ACIP->Unicode produces an error for such an escape because it is font-dependent and not standard.  Other tools will likely not understand such Unicode, so the converter will not produce it.  If you want it in the output, it is there in the error message. 

[171] 
[[EWTS]] 形式の [[PUA]] >>34


** Wylie と EWTS

[39] [DFN[Wylie]] は[[翻字]]法 (本来は[[タイプライター]]想定の[[転写]]法)。

[32] 
[DFN[EWTS]] ([DFN[Extended Wylie Transliteration Scheme]])
[SRC[>>113, >>97]]
は [[THL]] が制定した [[Wylie]] の拡張である[[翻字]]法です。

[43] 
>>39 を拡張したのが >>32 という関係が正確なようだが、
「Wylie (EWTS)」
のように併記したり
Wylie とだけ言って EWTS を指したりと、
厳密には区別されていないらしい。


[34] 
[[EWTS]] は[[翻字]]法だが、 
[[チベット文字]]を [[ASCII文字]]で記述できる他に
[CODE[\u]] や [CODE[\U]]
を使った [[Unicode]] 構文もある。また、
[[PUA]] 
[ [CC[U+F021]], [CC[U+F042]] ]
の規定を含む。


[REFS[

- [33] [CITE@en[THL Extended Wylie Transliteration Scheme | Mandala Collections - Texts]], [TIME[2025-09-16T09:48:23.000Z]] <https://texts.mandala.library.virginia.edu/text/thl-extended-wylie-transliteration-scheme>
- [35] 
[CITE[Wayback Machine]], [TIME[2025-09-16T09:55:50.000Z]] <https://web.archive.org/web/20100217022800mp_/http://www.thlib.org/reference/transliteration/teachingewts.pdf>

]REFS]


- [41] [CITE[Tibetan transliteration: convert between Wylie and Unicode]], [TIME[2025-09-18T07:07:09.000Z]] <https://www.lotsawahouse.org/Cgi/wylie.pl>
-- [40] サーバー側
-- [42] 変換部分の [[Perlモジュール]]は公開
- [46] [CITE@en[GitHub - buda-base/ewts-converter: Java Tibetan EWTS <-> Unicode converter]], [TIME[2025-09-18T07:22:35.000Z]] <https://github.com/buda-base/ewts-converter>
-- [47] >>42 の [[Java]] 移植 
-- [48] [[ALALC]], [[DTS]] にも対応
- [54] [CITE@en[GitHub - radiantspace/WyliePy: Tibetan converter to/from Wylie, ported from Java version with some fixes]], [TIME[2025-09-18T07:26:50.000Z]] <https://github.com/radiantspace/WyliePy>
-- [55] >>46 の [[Python]] 移植
- [52] [CITE@en[GitHub - radiantspace/WylieCS: Tibetan converter from/to Wylie in C#]], [TIME[2025-09-18T07:26:07.000Z]] <https://github.com/radiantspace/WylieCS>
-- [53] >>54 の [[C#]] 移植
- [56] [CITE@en[GitHub - ksanaforge/wylie: wylie transliteration port from JAVA version]], [TIME[2025-09-18T07:27:59.000Z]] <https://github.com/ksanaforge/wylie>
-- [57] >>46 の [[JavaScript]] 移植
- [58] [CITE@en[GitHub - karmapa/wylie: wylie]], [TIME[2025-09-18T07:28:53.000Z]] <https://github.com/karmapa/wylie>
-- [59] >>46 の [[JavaScript]] 移植
- [60] [CITE@en[GitHub - OpenPecha/pyewts: Tibetan Unicode to Wylie converter. (EWTS-Extended Wylie Transliteration Scheme)]], [TIME[2025-09-18T07:31:15.000Z]] <https://github.com/OpenPecha/pyewts>
-- [61] >>46 の [[Python]] 移植
-- [62] [[ACIP]] にも対応
- [63] 
[CITE@en[GitHub - buda-base/jsewts: JavaScript EWTS transliteration library]], [TIME[2025-09-18T07:32:05.000Z]] <https://github.com/buda-base/jsewts>
-- [64] >>46 >>60 の [[JavaScript]] 移植
- [44] [CITE[Tibetan transliteration: convert between EWTS (Extended Wylie) and Unicode]], [TIME[2025-06-02T16:23:57.000Z]], [TIME[2025-09-18T07:20:25.384Z]] <https://www.lotsawahouse.org/Static/tools/ewts.html>
-- [45] >>41 の新版
-- [65] [CITE@en[GitHub - rogerespel/ewts-js: Tibetan transliteration between EWTS and Unicode]], [TIME[2025-09-18T07:34:11.000Z]] <https://github.com/rogerespel/ewts-js>
--- [66] [[JavaScript]]
--- [67] >>42 の新版で、 各移植版も参考にしているという
- >>86
-- [96] >>65 利用


[8] [CITE[チベット文字の表示 - ★'s Lab]], [TIME[2023-02-27T09:38:28.000Z]], [TIME[2006-01-13T22:27:27.289Z]] <https://web.archive.org/web/20060113222526/http://star.aa.tufs.ac.jp/tibet/?%E3%83%81%E3%83%99%E3%83%83%E3%83%88%E6%96%87%E5%AD%97%E3%81%AE%E8%A1%A8%E7%A4%BA>

[85] >>8 は [CITE[PukiWiki]] 用[[プラグイン]]の利用方法説明。 ([[プラグイン]]自体は配布されていない。)
「Wylie方式による転写をチベット文字画像に変換」と [[Unicodeチベット文字]]の2つの方法がある。


** THL Simplified Phonetic Transcription


[114] 
[CITE@en[The Tibetan and Himalayan Library]], [TIME[2025-10-03T15:19:16.000Z]] <https://old.thlib.org/tools/scripts/wiki/Ethnic%20Pinyin%20of%20Tibetan.html>

[118] [CITE@en[THL Simplified Phonetic Transcription - Wikipedia]], [TIME[2025-09-19T10:16:17.000Z]], [TIME[2025-10-03T15:25:16.279Z]] <https://en.wikipedia.org/wiki/THL_Simplified_Phonetic_Transcription>


* THL


[94] [[THDL]] 改め [[THL]] はかつてこの分野で精力的に活動していた研究機関です。

[95] かつて [[Webサイト]]で公開されていたらしい情報の多くは削除されていて、
現在の [[Webサイト]]で見つけられるのは成果物の一部だけで、それらも [[URL]]
がかつてとは違っています。


- [101] 
[CITE@en[The Tibetan and Himalayan Library Homepage]], [TIME[2025-10-03T14:34:11.000Z]] <https://old.thlib.org/>
- [113] 
[CITE@en[Tibetan and Himalayan Library Essay]], [TIME[2025-10-03T15:16:30.000Z]] <https://old.thlib.org/reference/transliteration/#!essay=/thl/ewts/all/>
- [97] 
[CITE@en-US[THL Extended Wylie Transliteration Scheme]], [TIME[2025-09-24T18:48:29.000Z]], [TIME[2025-10-03T14:31:30.987Z]] <https://thlib.org/terms/#/texts/67579>
- [86] [CITE@en-US[Tibetan Terms – Tibetan and Himalayan Library]], [TIME[2025-09-24T18:48:29.000Z]], [TIME[2025-10-03T13:24:04.591Z]] <https://thlib.org/terms/#/terms/transliterate>
-- 
[87] 
[CITE[null]], [TIME[2025-09-20T16:48:14.000Z]], [TIME[2025-10-03T13:29:33.405Z]] <https://thlib.org/wp-content/plugins/mandala/app/build/static/js/5.7281e510.chunk.js?ver=1758386894>
--- [88] 
[CITE[null]], [TIME[2025-09-20T16:48:14.000Z]], [TIME[2025-10-03T13:29:45.687Z]] <https://thlib.org/wp-content/plugins/mandala/app/build/static/js/5.7281e510.chunk.js.map>
---- [89] 
[CODE[views/TranslationTool/TibConverters.js]]
(>>88 を [CODE[ewts-converter]] で検索)
-- [91] 
[CITE[null]], [TIME[2025-09-20T16:48:14.000Z]], [TIME[2025-10-03T13:33:52.419Z]] <https://thlib.org/wp-content/plugins/mandala/app/build/static/js/main.6bb6cee9.chunk.js?ver=1758386894>
--- [92] 
[CITE[null]], [TIME[2025-09-20T16:48:14.000Z]], [TIME[2025-10-03T13:34:08.958Z]] <https://thlib.org/wp-content/plugins/mandala/app/build/static/js/main.6bb6cee9.chunk.js.map>
---- [90] 
[CODE[views/TranslationTool/src/EwtsConverter.mjs]]
(>>92 を [CODE[ewts-js]] で検索)
----- [93] >>65 と同じもの
- [102] [CITE@en[THL’s Online Tibetan Phonetics Converter]], [TIME[2025-10-03T14:34:40.000Z]] <https://old.thlib.org/reference/transliteration/phconverter.php>
-- [98] 
[CITE@en-US[Tibetan Terms – Tibetan and Himalayan Library]], [TIME[2025-09-24T18:48:29.000Z]], [TIME[2025-10-03T14:32:19.637Z]] <https://thlib.org/terms/#/terms/phonetics>
-- [100] サーバー側で動作するが、 [[Perlモジュール]]は公開:
--- [99] [TIME[2025-10-03T14:33:22.00Z]]
<https://old.thlib.org/static/dls/lingua-bo-wylie.zip>



[119] [CITE@en[Tibetan and Himalayan Library - Wikipedia]], [TIME[2025-09-19T06:00:04.000Z]], [TIME[2025-10-03T15:25:35.066Z]] <https://en.wikipedia.org/wiki/Tibetan_and_Himalayan_Library>



- [80] 
[CITE@en[THL Tools (Tibetan and Himalayan Librar) / Code]], [TIME[2025-09-18T08:16:53.000Z]] <https://sourceforge.net/p/thdltools/code/>
-- [79] 
[CITE@en[THL Tools (Tibetan and Himalayan Librar) - Browse Files at SourceForge.net]], [TIME[2025-09-18T08:16:31.000Z]] <https://sourceforge.net/projects/thdltools/files/>
-[78] 
[CITE@en[The Tibetan and Himalayan Library]], [TIME[2008-11-12T21:47:15.000Z]], [TIME[2025-09-18T08:15:44.091Z]] <https://thdltools.sourceforge.net/TMW_or_TM_To_X_Converters.html>





** [CITE[Jskad]]

[121] 
[CITE@en[The Tibetan and Himalayan Library]], [TIME[2025-10-04T01:47:52.000Z]] <https://old.thlib.org/tools/scripts/wiki/Jskad%20Editor.html>

> Because Jskad supports Rich Text Format (RTF), Jskad can read and exchange documents with most major word processors. Jskad also supports RTF copy and paste, which means that you can copy and paste text directly from applications such as Microsoft Word.
>
Jskad has facilities for converting back and forth between THL Extended Wylie, Tibetan Machine, Unicode, ACIP Tibetan Input Code, and Tibetan Machine Web. This can be done either by selecting text within Jskad and using convenient menu options, or by using a powerful conversion tool documented here.
>
Jskad is meant to be used both as an efficient tool for entering unformatted Tibetan text using an attractive Tibetan font, and as a modular and programmable component in larger applications that rely on Tibetan text-entry. 

[122] 
[TIME[2025-10-04T01:49:24.500Z]]
<https://collab.its.virginia.edu/access/content/group/26a34146-33a6-48ce-001e-f16ce7908a6a/Tibetan%20Input%20Tools/Jskad/Jskad.jar>


[123] >>122 はコンパイルされた [[Java]] プログラムファイル群です。

[124] >>122 [CODE[Fonts]] に [CITE[TM]], [CITE[TMW]] の[[フォント]]ファイルも入っています。


- [135] 
[CITE@en[Nightly Builds]], [TIME[2025-10-04T02:13:23.000Z]] <https://collab.its.virginia.edu/wiki/toolbox/Nightly%20Builds.html>
- [136] [CITE@en[The Tibetan and Himalayan Library]], [TIME[2025-10-04T02:14:12.000Z]] <https://old.thlib.org/tools/wiki/Nightly%20Builds.html>


[137] [[ソースコード]]は >>79 の [CODE[thdltools/Jskad]] にあります。

-*-*-

[125] >>122 [CODE[org/thdl/tib/text/tibwn.ini]]
に
[[EWTS]],
[CITE[TM]],
[CITE[TMW]]
の変換表が入っています。

[130] [DFN[[CODE[tibwn.ini]]]]
の説明は >>129 にあります。

[157] >>156 にこれを使った変換の実装があります。

[129] [CITE@en[The Tibetan and Himalayan Library]], [TIME[2008-11-12T21:31:12.000Z]], [TIME[2025-10-04T02:01:19.365Z]] <https://thdltools.sourceforge.net/tibwn_ini_file_format.html>


-*-*-

[126] [CITE@en[The Tibetan and Himalayan Library]], [TIME[2008-11-12T21:49:36.000Z]], [TIME[2025-10-04T01:54:18.672Z]] <https://thdltools.sourceforge.net/TMW_RTF_TO_THDL_WYLIE.html>

>
-    ACIP->Unicode (Text->Text)
-    ACIP->Tibetan Machine Web (Text->RTF)
-    EWTS->Unicode (Text->Text)
-    EWTS->Tibetan Machine Web (Text->RTF)
-    TMW->ACIP (RTF->RTF)
-    TMW->ACIP (RTF->Text)
-    TM->TMW (RTF->RTF)
-    TMW->TM (RTF->RTF)
-    TMW->Unicode (RTF->RTF)
-    TMW->EWTS (RTF->RTF)
-    TMW->EWTS (RTF->Text)


** [CITE[Wylie Word]]

[110] [CITE@en[The Tibetan and Himalayan Library]], [TIME[2025-10-03T15:01:28.000Z]] <https://old.thlib.org/tools/scripts/wiki/Wylie%20Word.html>

[111] >>110 [CITE[Microsoft Word]] 用の[[マクロ]]である [DFN[[CITE[Wylie Word]]]]。
[[EWTS]] を使った[[入力システム]]として使えます。また、 [[TMW]] 
から [[EWTS]] への変換もできます。 

[154] 
>>79 の [CODE[thdltools/WylieWord/Unicode definition.txt]]
に[[文字クラス]]の定義兼 [[EWTS]] と [[Unicode]] の対応表があります。

[156] 
>>79 の
[CODE[thdltools/WylieWord/WylieWord development copy.dot]]
に
[[VBA]]
[[マクロ]]本体があります。
変換表として 
>>154
や
>>125
を参照していますが、変換処理はそれだけではなく前後にいろいろな処理があって複雑です。

[158] 
>>156 では [[Unicodeチベット文字]]のことを TScript と呼んでいるようです。
OScript というのもあって、 O は Other のこととされています。
[[Unicodeチベット文字]]以外の[[Unicode文字]]を指しているようです。

>
[PRE[
' Here and elsewhere, "TScript" means "the set of characters that Tibetans traditionally used,
' regardless of whether it is used to represent Tibetan or other languages, and regardless of
' whether it is realized as U-chen, U-med, or what."  Unfortunately as far as I know there is
' no word for this, other than "Tibetan", which is confusing when it is used to represent non-
' Tibetan text, and gives rise to absurd subroutine names like "ParseTibetanAsTibetan" vs.
' "ParseTibetanAsForeign".
]PRE]

と説明されており、実際に[[チベット文字]]表記[[サンスクリット語]]の処理などもあったりするので、
[[チベット語]]と区別した[[チベット文字]]を表す必要があるようです。


* 日時

[SEE[ [[チベット暦]] ]]


* 入力

[106] [CITE@en[The Tibetan and Himalayan Library]], [TIME[2025-10-03T14:56:53.000Z]] <https://old.thlib.org/tools/scripts/wiki/Tibetan%20Input%20System%20Principles.html>

[107] 
[CITE@en[The Tibetan and Himalayan Library]], [TIME[2025-10-03T14:57:51.000Z]] <https://old.thlib.org/tools/scripts/wiki/Tibetan%20Input%20Tools%20for%20Windows.html>

[108] [CITE@en[The Tibetan and Himalayan Library]], [TIME[2025-10-03T14:58:18.000Z]] <https://old.thlib.org/tools/scripts/wiki/Tise.html>

[109] >>108 は [[EWTS]] を使った[[入力システム]]。

[120] [CITE@en[Tise - Wikipedia]], [TIME[2025-10-02T20:31:41.000Z]], [TIME[2025-10-03T15:25:48.506Z]] <https://en.wikipedia.org/wiki/Tise>


* 照合順序

[116] [CITE@en[The Tibetan and Himalayan Library]], [TIME[2025-10-03T15:22:31.000Z]] <https://old.thlib.org/tools/scripts/wiki/Sorting%20Tibetan.html>

* 自然言語処理

[142] [CITE[Wayback Machine]], [TIME[2025-10-04T02:22:13.000Z]] <https://web.archive.org/web/20010822203546/http://www.ghg.net/dstilwell/paper2.PDF>


[21] 
[CITE@en[GitHub - OpenPecha/pybo: 🦜 NLP for Tibetan, in Python.]], [TIME[2025-09-15T14:06:45.000Z]] <https://github.com/OpenPecha/pybo>

[22] 
[CITE@en[GitHub - Esukhia/bophono: Tibetan phonetics engine in Python]], [TIME[2025-09-15T15:00:20.000Z]] <https://github.com/Esukhia/bophono>

[23] [CITE[Tibetan Phonetics Generator]], [TIME[2025-09-15T15:01:53.000Z]] <https://www.lotsawahouse.org/Cgi/phonetics.pl>

サーバー側で動作するが、 [[Perlモジュール]]も配布あり。

[68] 
[CITE@en[GitHub - thl-texts/tibetan_text_scripts: Various scripts for manipulating Tibetan texts including converting Sambhota font, adding Word styles, adjusting page numbers, and inserting milestones]], [TIME[2025-09-18T08:00:15.000Z]] <https://github.com/thl-texts/tibetan_text_scripts>

[[UDP]] を呼び出し

* 組版


[2] [CITE@en[Requirements for Tibetan Text Layout and Typography]], [TIME[2020-08-21T16:02:48.000Z]], [TIME[2020-10-18T08:19:54.886Z]] <https://w3c.github.io/tlreq/>

[1] [CITE@en[Requirements for Tibetan Text Layout and Typography]], [TIME[2020-06-12T13:37:55.000Z]], [TIME[2020-10-18T08:19:15.338Z]] <https://www.w3.org/TR/tlreq/>


- [36] 
[CITE@en[Tibetan Script Resources]], [TIME[2025-05-31T05:45:16.000Z]], [TIME[2025-09-16T09:58:21.812Z]] <https://w3c.github.io/tlreq/tibt/>
- [38] 
[CITE@en[Tibetan Gap Analysis]], [TIME[2025-05-31T05:45:16.000Z]], [TIME[2025-09-16T09:59:32.971Z]] <https://w3c.github.io/tlreq/gap-analysis/>

[37] >>36 >>38 >>2 特に意味のある情報は無い。
[TIME[2025-09-16T09:58:54.800Z]]



* メモ


[3] 
[[Tibetan Language Kit]]

[4] [CITE@JA[null]], [TIME[2020-02-14T05:47:54.000Z]], [TIME[2022-10-14T01:34:00.014Z]] <http://ichhan.sakura.ne.jp/cht/tsheg.html>

[5] [CITE@ja[チベット語のカタカナ表記について - Wikipedia]], [TIME[2022-09-30T01:33:12.000Z]], [TIME[2022-10-14T01:36:32.323Z]] <https://ja.wikipedia.org/wiki/%E3%83%81%E3%83%99%E3%83%83%E3%83%88%E8%AA%9E%E3%81%AE%E3%82%AB%E3%82%BF%E3%82%AB%E3%83%8A%E8%A1%A8%E8%A8%98%E3%81%AB%E3%81%A4%E3%81%84%E3%81%A6>

[6] [CITE@ja[Jeffrey KotykさんはTwitterを使っています: 「Someone's study notes from 9th or 10th century: Chinese words for horse and camel alongside Tibetan rta and rnga mo (I think?). https://t.co/CQdzYzKRCn https://t.co/Y4KlKtfsIh」 / Twitter]], [TIME[午後7:48 · 2022年10月9日][2022-10-09T10:48:29.000Z]], [TIME[2022-10-14T01:23:01.000Z]] <https://twitter.com/JeffreyKotyk/status/1579061230895239168>

[7] [[GB 16959]]


[9] [CITE@ja[木版刷チベット文献の文字自動認識の試み]], [TIME[2023-05-08T14:08:59.000Z]] <https://www.jstage.jst.go.jp/article/jsik/2/1/2_KJ00003381822/_article/-char/ja/>


[10] [CITE@ja[Xユーザーの袁徳礼さん: 「ヤフオクに色々なものが出品されているとツイートが流れて来るが、私も1度だけ、所謂「博物館級」の物を落札した。 写真は1960年3月10日に第1号がインド北部で亡命チベット人により発行された新聞「FREEEDOM」紙。59年にダライ・ラマ法王がインドに亡命されてから1年、民族蜂起の日が発行日→ https://t.co/YT3u74ZYVU」 / X]], [TIME[午後9:33 · 2021年5月27日][2021-05-27T12:33:43.000Z]], [TIME[2024-11-12T06:45:21.000Z]] <https://x.com/Yuan_TashiDelek/status/1397893778942222339>
