[7] TIS 620 は、タイ王国の符号化文字集合の国家規格です。 タイで非常に良く使われていました。
[1] 『STANDARD FOR THAI CHARACTER CODES FOR COMPUTERS』。
[2] TIS 620‐2529 (1986) と TIS 620‐2533 (1990) があるが内容は同じ。
[3] http://www.nectec.or.th/it-standards/std620/std620.htm で閲覧出来る。
[5] 参考:
[6] TIS 620-2533 ( ()) http://www.ratchakitcha.soc.go.th/DATA/PDF/2533/D/140/6318.PDF
[14] >>6 ISO 646 と併用する符号。左側は ISO 646。 GR に独自の図形文字集合。 10/0 は未割当。
[4] ISO/IEC 8859‐11 は TIS 620 に加えて 10/00
(NO-BREAK SPACE
)
を定義している。
[12] , https://www.itscj-ipsj.jp/ir/166.pdf
[22] 00000001.PDF - 166.pdf, , https://itscj.ipsj.or.jp/ir/166.pdf
[13] >>12 出典は TIS 620-2533 (1990) とされ、 G0 には ISO/IEC 10367:1991 を使うとある。
[17] 俗に >>12 が TIS 620 の ISO-IR 登録とみなされている (ISO-IR 自体が出典をそうだと言っている) が、 厳密には 10/0 が違う。
[19] 新しい Mule は Fp 3/1 を lao
としている。
タイ文字でなくラオ文字の文字集合。
[9] Windows-874 は独自の拡張を含んでいます。
[10] x-mac-thai は独自の拡張を含んでいます。
[23] Encoding Standard, , https://encoding.spec.whatwg.org/#legacy-single-byte-encodings
[25] Pathology of Male Genital System, , http://www.cai.md.chula.ac.th/chulapatho/chulapatho/lecturenote/male/index.html
[24] Wanchai's Home Page, , http://www.bus.tu.ac.th/usr/wanchai/
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-11"> <meta http-equiv="Content-Type" content="text/html; charset=TIS620"> <meta HTTP-EQUIV="expires" CONTENT="Sun, 7 Jan 2001 17:01:01 GMT">
[27]
>>26、
ICU の
aix-TIS_620-4.3.6
,
glibc-TIS_620-2.1.2
,
hpux-thai8-11.0
,
solaris-eucTH-2.7
は、
1対1対応としてはおおむね同等です。
[28]
Unicode Consortium の配布する ISO 8859-11 変換表、
ICU の
glibc-ISO_8859_11-2.1.2
,
iso-8859_11-2001
,
java-TIS620-1.3_P
は、
>>27 の 0xA0 に U+00A0
を追加したものです。
[29]
ICU
の
glibc-IBM874-2.1.2
,
java-MS874-1.3_P
は、
>>28 に
Windows-1252 などと共通のいくつかの文字を追加したものです。
[30]
Unicode Consortium の配布する Microsoft の CP874 変換表、
Encoding Standard の Windows-874、
>>31、
ICU
の
glibc-IBM1162-2.3.3
,
glibc-IBM874-2.3.3
,
hpux-cp874-11.11
,
ibm-1162_P100-1999
,
windows-874-2000
は、
>>29
の
0x80
に
€
を追加したものです。
[32]
ICU
の
ibm-13162_P101-2000
,
ibm-874_P100-1995
,
ibm-9066_P100-1995
は、
>>27 にいくつかの文字を追加したものです。
IBM の東アジアのコードページに追加あsれている ¢
などですが、
U+00A0
も 0xFF に追加されています。
[33]
ICU
の
java-Cp874-1.3_P
は、
>>32
の
0x80
に
€
を追加したものです。
[34]
ICU
の
glibc-IBM1161-2.3.3
,
ibm-1161_P100-1999
は、
>>32
の
0xDE
に
€
を追加したものです。
[35]
Unicode Consortium の Apple の thai の変換表、
ICU
の
macos-21-10.5
は、
>>28
にいくつかの文字を追加したものです。
Apple の PUA
文字を含め Unicode文字 2文字の列に対応付けられているものも含まれます。
[36]
ICU
の
windows-10021-2000
は、
>>35 のうち2文字に対応付けられているものが除外されたものです。
[26] ISO 8859 Alphabet Soup, , https://czyborra.com/charsets/iso8859.html#ISO-8859-11
[31] Codepage & Co., , https://czyborra.com/charsets/codepages.html#CP874