ラテン文字の文字コード

ラテン文字の文字コード

中欧

[36] ISO-8859-2, Windows-1250, Cork, KOI8-CS, Kamenicti, CP852, x-mac-ce, East8, ICL

[38] Ufff, zase ta čeština!, , http://webserver.ics.muni.cz/bulletin/articles/501.html

[10] Pinknet: Nastaveni, https://web.archive.org/web/19971108170336/http://www.pinknet.cz:80/setup.asp

AsciiBez háčků a čárek
CP1250Kódování Windows
8859-2Unix s podporou češtiny
KameničtíArachne a jine DOS browsery
KOI8-CSOficialní kódování (CSN)
cp852IBM Latin 2 (OS/2)
MacIntosh CEJablkoň

[11] >>10 設定をクッキーで記憶してサーバー側で切り替えていたらしい。

[32] >>27

[ASCII] [Win-1250] [CP-852] [8859-2] [MacIntosh] [CP-895] [KOI8-CS]

[33] >>32 もともとはサーバー側で変換して各種符号で提供するCGIスクリプトがあったらしい。 >>26 時点で既に稼働していない。これ以前が Internet Archive に保存されておらず、元は違うサーバーに置かれていた可能性がある。

[12] (this page is in Czech only), , https://web.archive.org/web/19961219091131/http://websmile.pef.zcu.cz/

[13] >>12 各種文字コードを混合して記述した選択メニュー

[21] Invex Computer 1995, , https://web.archive.org/web/19990125090139/http://hp7.fce.vutbr.cz/

Select language/zvolte si jazyk:

[English]

[Cesky]

  • Code Page 1250 (MS Windows)
  • ASCII (bez hacku a carek)

[22] Diakriticka samoobsluha, , https://web.archive.org/web/19981203021756/http://hawk-systems.com/web_pages/nomenia/dia.html

<form method="post" action="scripts/dia.cgi">
Z: &nbsp;&nbsp; 
<select name="kodin">
<option>ascii(+dia)
<option>cp1250
<option>iso8859-2
<option>mac-ce
</select>
 &nbsp; Do: &nbsp;
<select name="kodout">
<option>cp1250
<option>iso8859-2
<option>mac-ce
<option>ascii+dia
<option>ascii
</select><br>

[25] dia は翻字

北米原住民

[6] カナダの原住民の Dene 語表記用ラテン文字フォント依存符号化フォント WinMac>>5 で配布されており、 >>4 に変換器がある。

中央アジア

ウズベク語の文字コード


[43] アゼルバイジャン語は独立後にキリル文字からラテン文字に移行しました。

[44] Webサイトは初期のものほどロシア語英語が多く、 徐々にアゼルバイジャン語主体に切り替わっていく印象があります。

[45] 西暦1990年代には KOI8-R がよく見られますが、 Windows-1251KOI8-R と指定した事例も散見され、 混乱があったようです。 ロシア語だけでなく英語でも KOI8-R と指定されていることがあります。

[46] 西暦1990年代から西暦2000年代には Windows-1251 が非常によく見られます。 ロシア語はもちろん、アゼルバイジャン語英語でも Windows-1251 と指定されていることがあります。 アゼルバイジャン語ラテン文字は足りないので、文字参照を使うことが多いようです。

[47] 西暦2000年代から UTF-8 が使われ始めており、 西暦2010年代に統一が進んでいく印象です。

[48] Windows-1254 を使った事例もありますが、ごくわずかです。 ロケール依存の既定の文字コードも参照。

[41] >>40 TTF.fonTTF を見るとおそらくベースが Windows-1251 で、ASCIIキリル文字の間の領域にアゼルバイジャン語用のラテン文字を割り当てている。

[42] これを実用したページは Internet Archive では確認できません。

印度

インド系文字の文字コード

越南

[31] VNI : Unicode に単独の文字がないものも含まれている。

東アジア

[1] 半角と全角

[24] AJ1

[7] 文字セット及び文字数について | 多言語フォント | モリサワのフォント | 株式会社モリサワ () https://www.morisawa.co.jp/fonts/multilingual/character-set/

Pro

(100言語をサポートする独自規格) PE

(ラテン文字、キリル文字、ギリシャ文字、ベトナム語用文字をカバーする独自規格)

Unicode

[23] n441.pdf, , http://std.dkuug.dk/jtc1/sc2/wg3/docs/n441.pdf

[28] ラテン文字の barred とか with stroke や with hook のような変形文字が未だに Unicode に新規収録されるのはすごい不思議。他の文字体系だと結合文字とセットで使うことにして新規追加はしない、 とされそうなものなのに。やはり欧文の既得権益なのか?

[29] with actute や with grave のようなラテン文字が既存分以外の新規追加はされていないし、 既存分は正準等価にされているのに、傍線追加系のものがその扱いをされていないのは、 おそらく20世紀末頃のフォント技術だと単純に基底文字の上下に追加する系のもの以外を結合文字とするのは難しかったからだよなあ。 complex script への対応が進んでその制限はなくなったのだから、 ラテン文字だって今後の追加分は complex script 扱いで Unicode 大喜利の対象にして良さそうなものなのに。

[30] superscript や turned みたいなのも後置の結合文字と組み合わせると基底文字が小さくなる、 みたいなのにすればいっぱい追加しなくてもいいはずなのにね。 中央アジア東南アジアあたりでそういう文字体系だったら絶対そうしてるでしょ。 なんでラテン文字はそういう扱いを受けないのかが謎。

ラテン文字と他のアルファベットの境界

アルファベット

メモ