[12] GNUEmacs と XEmacs で内部コードがだいぶ異なります...
%x00-7F | Type 1-1 | ASCII |
%x80 .. | Type N | 合成文字 |
%x80 .. | Emacs 21 | eight-bit-graphic |
%x81-8F C1 | Type 1-2 | 1バイト集合 |
%x90-99 C21 C22 | Type 2-3 | 2バイト集合 |
%x9A %xA0-DF C1 | Type 1-3 | 1バイト集合 (1桁) |
%x9B %xE0-EF C1 | Type 1-3 | 1バイト集合 (2桁) |
%x9C %xF0-F4 C21 C22 | Type 2-4 | 2バイト集合 (1桁) |
%x9D %xF5-FE C21 C22 | Type 2-4 | 2バイト集合 (2桁) |
%x9E %xFF? ? | Type 3-4 | 3バイト集合 (CNS 11643 = 未実装) |
%x9E .. | Emacs 21 | eight-bit-control |
%x9F | (lc-invalid) |
[13] GNU Emacs 22? からは UTF-8 base になるみたいです。 (マーくんが、まだ UTF-8 base になってないのは Emacs だけだよ, ママ〜ってうるさいよねぇ。)
[15] XEmacs 21 の src/mule-charset.h の注釈より。
%x00-7F | ASCII |
%x80 .. | Composite |
%x81-8D C1 | Dimension-1 Official |
%x8E C1 | free (ASCII) |
%x8F %xA0-BF | Control-1 |
%x90-99 C21 C22 | Dimension-2 Official |
%x9A-9D | free |
%x9E %xA0-EF C1 | Dimension-1 Private |
%x9F %xF0-FF C21 C22 | Dimension-2 Private |
[14] XEmacs UTF-2000 では内部コードが UTF-8 的だったりします。
[19] PostgreSQL も対応しています。
[18] PostgreSQL Source Code: src/include/mb/pg_wchar.h Source File, , https://doxygen.postgresql.org/pg__wchar_8h_source.html
[5] 最初のオクテット (または %x9A-9F の次のオクテット) は leading byte と呼びます。
LC | GNU Emacs 20/21 | XEmacs 21 | |
0x80 | 128 | Composite | |
0x81 | 129 | ISO/IEC 8859-1 | |
0x82 | 130 | ISO/IEC 8859-2 | |
0x83 | 131 | ISO/IEC 8859-3 | |
0x84 | 132 | ISO/IEC 8859-4 | |
0x85 | 133 | TIS 620-2533 | |
0x86 | 134 | ISO/IEC 8859-7 | |
0x87 | 135 | ISO/IEC 8859-6 | |
0x88 | 136 | ISO/IEC 8859-8 | |
0x89 | 137 | JIS X 0201-1976 Katakana | |
0x8A | 138 | JIS X 0201-1976 Roman | |
0x8B | 139 | ISO/IEC 8859-5 | |
0x8C | 140 | ISO/IEC 8859-5 | ISO/IEC 8859-9 |
0x8D | 141 | ISO/IEC 8859-9 | unused |
0x8E | 142 | (ASCII) | |
0x8F | 143 | Control-1 | |
0x90 | 144 | JIS X 0208-1978 | |
0x91 | 145 | GB 2312-80 | |
0x92 | 146 | JIS X 0208-1983 | |
0x93 | 147 | KS C 5601-1987 | |
0x94 | 148 | JIS X 0212-1990 | |
0x95 | 149 | CNS 11643 plane 1 | |
0x96 | 150 | CNS 11643 plane 2 | |
0x97 | 151 | CNS 11643 plane 14 (Mule2) | |
0x97 | 151 | JIS X 0213 plane 1 | Big5 Level 1 |
0x98 | 152 | big5-1 | Big5 Level 2 |
0x99 | 153 | big5-2 | unused |
0x9A | 154 | 1-byte private (1桁) | unused |
0x9B | 155 | 1-byte private (2桁) | unused |
0x9C | 156 | 2-byte private (1桁) | unused |
0x9D | 157 | 2-byte private (2桁) | unused |
0x9E | 158 | (CNS 11643) | 1byte private |
0x9F | 159 | 2byte private | |
0xA0 | 160 | chinese-sisheng | |
0xA1 | 161 | ipa | |
0xA2 | 162 | viscii-lower | |
0xA3 | 163 | viscii-upper | |
0xA4 | 164 | arabic-digit | |
0xA5 | 165 | arabic-1-column | |
0xA6 | 166 | ascii-right-to-left | |
0xA7 | 167 | lao | |
0xA8 | 168 | ||
0xA9 | 169 | ||
0xAA | 170 | ||
0xAB | 171 | ||
0xE0 | 224 | arabic-2-column | |
0xE1 | 225 | IS 13194 | |
0xF0 | 240 | indian-1-column | |
0xF1 | 241 | tibetan-1-column | |
0xF2 | 242 | mule-unicode-2500-33ff | |
0xF3 | 243 | mule-unicode-e000-ffff | |
0xF4 | 244 | mule-unicode-0100-24ff | |
0xF5 | 245 | ethiopic | |
0xF6 | 246 | CNS 11643 plane 3 | |
0xF7 | 247 | CNS 11643 plane 4 | |
0xF8 | 248 | CNS 11643 plane 5 | |
0xF9 | 249 | CNS 11643 plane 6 | |
0xFA | 250 | CNS 11643 plane 7 | |
0xFB | 251 | indian-2-column | |
0xFC | 252 | tibetan | |
0xFD | 253 | ||
0xFE | 254 | JIS X 0213 plane 2 | |
0xFF | 255 | (CNS 11643 (Mule2)) |
[11] 内部表現にはまた別の19ビットのものを使います。
[20] src/coding.c · master · emacs / emacs · GitLab, https://emba.gnu.org/emacs/emacs/-/blob/master/src/coding.c#L1753
[21] Symposium on Multilingual Information Processing at ETL (25-26/3/96), , https://web.archive.org/web/20040414060036/http://www.m17n.org/mule/JAPANESE/gniibe.html
(7) Werner Lemberg (Austria)
* CJK TeX (韓国語, 日本語, 中国語が使える LaTeX のマクロパッケージ)に ついてその実現についての発表。
* JTeX, JLaTeX などと異なり, 普通の TeX から使うマクロパッケージとして の実現である。
* Mule の encoding を用いている。
%コメント% どうも Mule の leading character を TeX の active character に map することでフォントの切替を行なっているらしい。