[16] KOI8 は、 キリル文字の文字コードの系統の1つです。
[17] KOI8 は KOI8-R 系と KOI8-U 系に大別されます。 どちらでもないその他もいくつかあります。
[19] KOI8-R と KOI8-U は [ 0xA0, 0xBF ] の一部が異なります。 KOI8-R の罫線素片のいくつかが KOI8-U ではキリル文字に入れ替えられています。 完全な互換性はありませんが、キリル文字主体の一般の文章ではどちらでも変わりません。
[21] 文字コードの判定の実装の1つである >>20 は KOI8-R と KOI8-U の区別を諦めてすべて KOI8-U とみなしています。 >>20 は Web を適用対象としており、罫線素片が使われることは少ないと思われますから、 そのような戦略もありなのでしょう。
[26]
ICU
の
ibm-1167_P100-2002
は
KOI8-U
とほぼ同じですが、
CR の一部が Windows-1252
のようになっています。
結果的にその部分は koi8-f
と似ていますが、
全体としてはそうでもありません。
よって KOI8-U とも koi8-f
とも互換性はありません。
[23]
koi8-e
は
[ 0xA0, 0xBF ]
に罫線素片などのかわりにキリル文字などを割り当てた形になっています。
なお CR は範囲外です。
>>22
[25]
ICU の
glibc-ECMA_CYRILLIC-2.3.3
は1対1対応としては
koi8-e
とほぼ同等ですが、 C1 が加わっています。
[24]
koi8-f
は
KOI8-U と koi8-e
をキリル文字優先で統合したような形になっています。
[18]
ICU の glibc-KOI8_T-2.3.3
は
[ 0x80, 0xBF ]
の多くが他と異なり、
Windows-1251 に近い (しかし同じではない) です。
互換性はありません。
[22] The Cyrillic Charset Soup, , https://czyborra.com/charsets/cyrillic.html
[6] RFC 1489 - Registration of a Cyrillic Character Set, , https://tools.ietf.org/html/rfc1489
[1] 名無しさん: ロシアでは中文 Windoze が安く手に入るから、それを使ってる人がたくさんいるそうです。で、そこから送るメイルなんかの charset も gb2312
とかになってるとか。
[3] Кодировка текста в русскоязычных сообщениях электронной почты ( 版) http://old.relcom.ru/Services/Infoline/TechSupport/Application/General/encode/
[2] 1130533 – latest versions of SeaMonkey dropped option to set KOI8-R charset in "Default Character Encoding" and "Fallback Character Encoding" for Mail & News ( 版) https://bugzilla.mozilla.org/show_bug.cgi?id=1130533
[7] 17053 – Support KOI8-RU mapping for KOI8-U, , https://www.w3.org/Bugs/Public/show_bug.cgi?id=17053
[4] Add koi8-ru as label for koi8-u and use the mapping Internet Explorer… · whatwg/encoding@52f08a6 ( 版) https://github.com/whatwg/encoding/commit/52f08a6259d331197685c6b417ee753b817c5a79
[5] Confusion between KOI8-U and KOI8-RU encodings · Issue #74 · whatwg/encoding () https://github.com/whatwg/encoding/issues/74
[11] Офіційний сайт групи координації домену NET.UA, , https://www.net.ua/uk/koi8-u/memories/
[12] KOI8-R in Win3.* Netscape, , http://bspu.uni-altai.ru/Docs/~ache/wnets.html
[13] Bug 151389 – more encodings conversion for gnome-terminal: ISIRI-3342 and TSCII, , https://bugzilla.gnome.org/show_bug.cgi?id=151389
* KOI8-T (modification of koi8-r encoding with letters needed for Tajik language, it was at some time the most common encoding for web pages (announced as koi8-r and viewed with modified fonts)
* KOI8-K (a non standard encoding, based on the various KOI8-* encodings and that provided the letters needed for all cyrillic languages that had some user base on Linux; that encoding was only used internally on Linux systems)
[14] KOI8-R - Russian Net Character Set, , https://koi8.pp.ru/
[15] KOI8-C: an extention of KOI8-R for old Russian orthography, Belorussian, Macedonian, Serbian and Ukrainian, , https://oldrus-ispell.sourceforge.net/koi8-extended.html