KOI8-R

KOI8 (文字コード)

[16] KOI8 は、 キリル文字文字コードの系統の1つです。

KOI

KOI

エスケープシーケンス

ANSIエスケープシーケンス

DOCS

比較

[17] KOI8KOI8-R 系と KOI8-U 系に大別されます。 どちらでもないその他もいくつかあります。

[19] KOI8-RKOI8-U は [ 0xA0, 0xBF ] の一部が異なります。 KOI8-R罫線素片のいくつかが KOI8-U ではキリル文字に入れ替えられています。 完全な互換性はありませんが、キリル文字主体の一般の文章ではどちらでも変わりません。

[21] 文字コードの判定の実装の1つである >>20KOI8-RKOI8-U の区別を諦めてすべて KOI8-U とみなしています。 >>20Web を適用対象としており、罫線素片が使われることは少ないと思われますから、 そのような戦略もありなのでしょう。

[26] ICUibm-1167_P100-2002KOI8-U とほぼ同じですが、 CR の一部が Windows-1252 のようになっています。 結果的にその部分は koi8-f と似ていますが、 全体としてはそうでもありません。 よって KOI8-U とも koi8-f とも互換性はありません。

[23] koi8-e は [ 0xA0, 0xBF ] に罫線素片などのかわりにキリル文字などを割り当てた形になっています。 なお CR は範囲外です。 >>22

[25] ICUglibc-ECMA_CYRILLIC-2.3.3 は1対1対応としては koi8-e とほぼ同等ですが、 C1 が加わっています。

[24] koi8-fKOI8-Ukoi8-eキリル文字優先で統合したような形になっています。

[18] ICUglibc-KOI8_T-2.3.3 は [ 0x80, 0xBF ] の多くが他と異なり、 Windows-1251 に近い (しかし同じではない) です。 互換性はありません。

関連

キリル文字の文字コード

メモ

[22] The Cyrillic Charset Soup, , https://czyborra.com/charsets/cyrillic.html

[6] RFC 1489 - Registration of a Cyrillic Character Set, , https://tools.ietf.org/html/rfc1489

[1] 名無しさん: ロシアでは中文 Windoze が安く手に入るから、それを使ってる人がたくさんいるそうです。で、そこから送るメイルなんかの charsetgb2312 とかになってるとか。

[3] Кодировка текста в русскоязычных сообщениях электронной почты ( 版) http://old.relcom.ru/Services/Infoline/TechSupport/Application/General/encode/

[2] 1130533 – latest versions of SeaMonkey dropped option to set KOI8-R charset in "Default Character Encoding" and "Fallback Character Encoding" for Mail & News ( 版) https://bugzilla.mozilla.org/show_bug.cgi?id=1130533

[7] 17053 – Support KOI8-RU mapping for KOI8-U, , https://www.w3.org/Bugs/Public/show_bug.cgi?id=17053

[4] Add koi8-ru as label for koi8-u and use the mapping Internet Explorer… · whatwg/encoding@52f08a6 ( 版) https://github.com/whatwg/encoding/commit/52f08a6259d331197685c6b417ee753b817c5a79

[5] Confusion between KOI8-U and KOI8-RU encodings · Issue #74 · whatwg/encoding () https://github.com/whatwg/encoding/issues/74

[8] RFC 2319

[11] Офіційний сайт групи координації домену NET.UA, , https://www.net.ua/uk/koi8-u/memories/

[12] KOI8-R in Win3.* Netscape, , http://bspu.uni-altai.ru/Docs/~ache/wnets.html

[13] Bug 151389 – more encodings conversion for gnome-terminal: ISIRI-3342 and TSCII, , https://bugzilla.gnome.org/show_bug.cgi?id=151389

* KOI8-T (modification of koi8-r encoding with letters needed for Tajik language, it was at some time the most common encoding for web pages (announced as koi8-r and viewed with modified fonts)

* KOI8-K (a non standard encoding, based on the various KOI8-* encodings and that provided the letters needed for all cyrillic languages that had some user base on Linux; that encoding was only used internally on Linux systems)

[14] KOI8-R - Russian Net Character Set, , https://koi8.pp.ru/

[15] KOI8-C: an extention of KOI8-R for old Russian orthography, Belorussian, Macedonian, Serbian and Ukrainian, , https://oldrus-ispell.sourceforge.net/koi8-extended.html