TIS620

TIS 620

[7] TIS 620 は、タイ王国符号化文字集合国家規格です。 タイで非常に良く使われていました。

代替

[8] 現在では UTF-8 を使うべきです。

仕様書

[1] 『STANDARD FOR THAI CHARACTER CODES FOR COMPUTERS』。

[2] TIS 620‐2529 (1986) と TIS 620‐2533 (1990) があるが内容は同じ。

[3] http://www.nectec.or.th/it-standards/std620/std620.htm で閲覧出来る。

[5] 参考:

[6] TIS 620-2533 ( ()) http://www.ratchakitcha.soc.go.th/DATA/PDF/2533/D/140/6318.PDF

符号化文字集合

[16] 2系統の符号>>6 で規定されている。

[14] >>6 ISO 646 と併用する符号。左側ISO 646GR に独自の図形文字集合10/0 は未割当。

[15] >>6 EBCDIC 符号。

[37] UTF-8符号化されたバイト列

変種

[4] ISO/IEC 8859‐11TIS 620 に加えて 10/00 (NO-BREAK SPACE) を定義している。

[12] , https://www.itscj-ipsj.jp/ir/166.pdf

[22] 00000001.PDF - 166.pdf, , https://itscj.ipsj.or.jp/ir/166.pdf

[11] >>12 96集合 終端バイト 5/4

[13] >>12 出典は TIS 620-2533 (1990) とされ、 G0 には ISO/IEC 10367:1991 を使うとある。

[17] 俗に >>12TIS 620ISO-IR 登録とみなされている (ISO-IR 自体が出典をそうだと言っている) が、 厳密には 10/0 が違う。


[18] 古い MuleFp 3/1 を使っていた。

[19] 新しい MuleFp 3/1lao としている。 タイ文字でなくラオ文字文字集合 Fp


[9] Windows-874 は独自の拡張を含んでいます。

[10] x-mac-thai は独自の拡張を含んでいます。

windows-874 (Encoding Standard)

[23] Encoding Standard, , https://encoding.spec.whatwg.org/#legacy-single-byte-encodings

実利用例

[25] Pathology of Male Genital System, , http://www.cai.md.chula.ac.th/chulapatho/chulapatho/lecturenote/male/index.html

Unicode との関係

[20] Unicodeタイ文字TIS 620 をベースにしている (同じではない)。

[21] Unicodeラオ文字タイ文字をベースにしている (同じではない)。

実利用例

[24] Wanchai's Home Page, , http://www.bus.tu.ac.th/usr/wanchai/

<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-11">
<meta http-equiv="Content-Type" content="text/html; charset=TIS620">
<meta HTTP-EQUIV="expires" CONTENT="Sun, 7 Jan 2001 17:01:01 GMT">

比較

[27] >>26ICUaix-TIS_620-4.3.6, glibc-TIS_620-2.1.2, hpux-thai8-11.0, solaris-eucTH-2.7 は、 1対1対応としてはおおむね同等です。

[28] Unicode Consortium の配布する ISO 8859-11 変換表、 ICUglibc-ISO_8859_11-2.1.2, iso-8859_11-2001, java-TIS620-1.3_P は、 >>270xA0U+00A0 を追加したものです。

[29] ICUglibc-IBM874-2.1.2, java-MS874-1.3_P は、 >>28Windows-1252 などと共通のいくつかの文字を追加したものです。

[30] Unicode Consortium の配布する MicrosoftCP874 変換表、 Encoding StandardWindows-874>>31ICUglibc-IBM1162-2.3.3, glibc-IBM874-2.3.3, hpux-cp874-11.11, ibm-1162_P100-1999, windows-874-2000 は、 >>290x80 を追加したものです。

[32] ICUibm-13162_P101-2000, ibm-874_P100-1995, ibm-9066_P100-1995 は、 >>27 にいくつかの文字を追加したものです。 IBM東アジアコードページに追加あsれている ¢ などですが、 U+00A00xFF に追加されています。

[33] ICUjava-Cp874-1.3_P は、 >>320x80 を追加したものです。

[34] ICUglibc-IBM1161-2.3.3, ibm-1161_P100-1999 は、 >>320xDE を追加したものです。

[35] Unicode ConsortiumApple の thai の変換表、 ICUmacos-21-10.5 は、 >>28 にいくつかの文字を追加したものです。 ApplePUA 文字を含め Unicode文字 2文字の列に対応付けられているものも含まれます。

[36] ICUwindows-10021-2000 は、 >>35 のうち2文字に対応付けられているものが除外されたものです。

メモ

[26] ISO 8859 Alphabet Soup, , https://czyborra.com/charsets/iso8859.html#ISO-8859-11

[31] Codepage & Co., , https://czyborra.com/charsets/codepages.html#CP874