[1] KOI は、ロシア語で information interchange code の略。キリル文字の文字コード群。
SI
と SO
によって呼出します。初期状態は G0 です。
IANA 名 KOI7-switched
。
(2004年2月に IANA に登録された時、 IANA の間抜けな事務官は
KO17-switched
としました。)KOI8-E
。
(IANA 名 ISO-IR-111
と
ECMA-Cyrillic
は、2004年2月まで、
RFC 1345 の完全に間違った定義を参照していました。
ちなみに、2004年2月の修正の時に、 IANA の間抜けな事務官は
KOI8-E
を KO18-E
に (また) 間違えました。)[2] 単に KOI-8
と言った時には、
KOI-8 族の中の古く使われていた符号化文字集合を指す時と、
一般名称としての KOI-8 族を指す時があります。
[3] KOI-8 (族) は、左が ASCII (新 IRV) または旧IRV
で、 0xC0
〜0xFF
にキリル文字をいわゆる
KOI 対応順
(8ビット目を落としたら、
大文字・小文字逆のラテン文字に転写される順序)
で配置した符号化文字集合族です。
残りの
0x80
〜0xBF
は未定義です。
特に 0x80
〜0x9F
は、 ISO/IEC 6429 の C1 とする符号化文字集合もあれば、
図形文字を割り当てる符号化文字集合もあります。
[15]
GOST 13052 = koi-0
:
旧IRV
のラテン文字をキリル文字に置き換えたものです。 >>6
[16]
GOST 19768-74 = koi-7
:
旧IRV
のラテン文字の小文字をキリル文字の大文字に置き換えたものです。 >>6
[17]
koi-0
と koi-7
はキリル文字の大文字の割当が同じです。 >>6
[11] ISO 5427:1984:
[14]
>>6 では koi-0
,
koi-7
,
koi8-a
を $
ではなく
¤
としています。
[40]
>>6 の koi-0
と
ICU の glibc-ISO_5427-2.1.2
は、
1対1対応の関係としては同等です。
[41]
ICU
の
glibc-INIS_CYRILLIC-2.1.2
は、
>>40
のキリル文字以外を削除またはキリル文字に置換などしたものです。
互換性はありません。
[42]
ICU
の
glibc-ISO_5427_EXT-2.1.2
は、
>>40 と併用されることを想定したもので、
重なりはありません。
[7] その他のキリル文字系文字コード (KOI と呼ばれることがあるかは不明) :
[8] その他キリル文字がある文字コード (KOI と呼ばれてることがあるかは不明) :
[38] null, , https://lizard.phys.msu.ru/home/compu_sci/oldfonts-koi.html
[36] TeX ロシア語ハイフネーションと文字入力について, , http://yasuda.homeip.net/tex/hyphen.html
[37] OldFonts 古ロシア語フォント集成 - insomnia, , http://yasuda.homeip.net/insomnia/2009/05/oldfonts-cyrillic-fonts-package.html
[39] OldFonts 古ロシア語フォント〜Minion, Palatino 利用 - insomnia, , http://yasuda.homeip.net/insomnia/2009/06/oldfonts-minion-palatino.html
[5] Cyrillic Character Sets, , https://web.archive.org/web/20051218145224/http://www.cyrillic.com/ref/cyrillic/charsets.html
[6] The Cyrillic Charset Soup, , https://czyborra.com/charsets/cyrillic.html
[34] Cyrillic encodings (charsets). Small description, , https://segfault.kiev.ua/cyrillic-encodings/
[20] キリル文字フォントと文字コード, , https://web.archive.org/web/20001101064700/http://src-home.slav.hokudai.ac.jp/jp/Ruccify/about-font.html
日本では、Windows 3.1の時代に、ロシア語と日本語を混在させた文書を作る目的で ASCII 256字のうち英語アルファベットに割り当てられている部分をキリル文字に置き換えた特殊な「英字キリル文字置換」フォントがつくられ一部で利用されました。Macの場合も、Nakhodka という「英字キリル文字置換」フォントがあり、以前はロシア語専門家の間でもかなり使われていたようです。
[21] 「英字・キリル文字置換コード」の例, , https://web.archive.org/web/20000916222916/http://src-home.slav.hokudai.ac.jp/jp/Ruccify/j-cyrillic.html
[22] ロシア語・フォント・コレクション, , https://web.archive.org/web/20000823040404/http://src-home.slav.hokudai.ac.jp/jp/Ruccify/font.html
[24] 日本語 DOS / Windowsでロシア語を読み書きする方法 (2), , https://web.archive.org/web/20000820045857/http://src-home.slav.hokudai.ac.jp/jp/Ruccify/win3.html
[23] Mac Fonts, , https://web.archive.org/web/20000919091125/http://member.nifty.ne.jp/sibo/Pages/Japanese_Pages/Computers/Macintosh/mac_fonts.html
[9] モンゴル語文字処理, , http://www.tufs.ac.jp/ts/personal/kamimura/articles/bit_mon2.html
ついでに、96年に制定されたモンゴル語用キリル文字のモンゴル国家規格(MNS)についても聞いてみた。この規格にはコードページが3種類ある。DOS用のもの(MNS4329-96)とWINDOWS用のもの(MNS4330-96)、それにマッキントッシュ用のもの(MNS4331-96)である。これらにキーボード・レイアウト(MNS4332-96)を加えて4つ一組の規格になっている。
どうして3種類もコードページの規格があるのか知りたかったのだが、エルデネチメグさんは、キリル文字の問題はすでに解決済みで興味は全くないと言う。モンゴル語に必要なΘとYの2文字は、キリル文字セットISO 5427-1981の Extention Setに含められているからだ。
[10] Баярсайханы тэмдэглэл: MNS 5552 : 2005 үндэсний стандарт, , https://ebayaraa.blogspot.com/2009/01/mns-5552-2005.html
[18] モンゴル語フォント入力, , https://web.archive.org/web/20010220161247/http://www.netlaputa.ne.jp/~SHAGAA/photo/font2.htm
1996年秋にモンゴルで決定されたASCIIコード表準拠のキリルフォント
上のフォントとは別にPDIC用に配置変換しなおしたフォントがあります。
上の二つのフォントはキーボードファイルって奴を切り替えて使わねばなりません。が、アプリケーションの中にはキーボードを切り替えることが出来ないのもあります。そういったアプリケーション用、およびWINDOWS CE用にフォントを配列し直してみました。これはローマ字アルファベットの所にキリル文字を割り当てたモノです。使い道はあまり無いかもしれませんが、参考までに公開しておきます。
マック用CTTフォントです。
[27] tools, KAMIMURA Akira, , http://www.tufs.ac.jp/ts/personal/kamimura/prg/index.html
[19] Janko's Keyboard Generator For Windows 95 and 98 Home, Janko Stamenovic, , https://web.archive.org/web/20010204203200/http://solair.eunet.yu/~janko/engdload.htm
[29] 'Cyrillic for MS Windows Netscape' (text in English), , https://web.archive.org/web/20060615015452if_/http://www.free.net/Docs/cyrillic/cwww_eng.html
[28] ソビエト連邦はなぜ最初からロシア語以外のキリル文字を含んだ文字集合を作らなかったのでしょうかね。 ウクライナ語すら書けないのだから、最初からロシア語以外完全無視ですよね。 当時はまだそういう雰囲気の時代だったのでしょうか。
[30] INFORIS Home Page, https://web.archive.org/web/19990202063723if_/http://www.inforis.ru:8006/home.html
<P ALIGN=center><FONT SIZE=2> <A HREF="enhome.html">ENGLISH</a> | <a href="http://www.inforis.ru:8001/home.html">KOI</a> | <A HREF="http://www.inforis.ru:8002/home.html">WIN</a> | <a href="http://www.inforis.ru:8003/home.html">DOS</a> | <A HREF="http://www.inforis.ru:8005/home.html">MAC</a> | <A HREF="http://www.inforis.ru:8006/home.html">LAT</a></FONT></P>
[31] >>30 同内容をポート番号だけ変えて別文字コードで提供していた事例。 文字コード変換機能のあるプロキシを挟んでいたのだろうか。
[32] KOI8-R, Windows-1251, IBM866, x-mac-cyrillic に続く LAT は何か。
[33] Chrome も Firefox も LAT を Windows-1251 と判定する。
[35] KOI-7 - Wikipedia, , https://en.wikipedia.org/wiki/KOI-7