Unicode zone

GEO8-GOV

[458] ジョージア (ソビエト連邦グルジア共和国、独立国グルジア、 独立国ジョージア、国外ジョージア人) では多くの7ビット符号8ビット符号が使われてきました。

目次

  1. geostd8
    1. 呼称
    2. 符号化文字集合
    3. 利用状況
  2. GSCII
    1. 呼称
    2. 符号化文字集合
      1. GSCII zone
      2. Unicode zone
      3. Mac 式符号
    3. 利用状況
  3. GeoLatin
  4. GeoTranslit
  5. ロシア語鍵盤系符号化
  6. IS0 10586:1996
  7. Windows Georgian (PT 181)
  8. Mac Georgian (PT 281)
  9. Mac OS Georgian
  10. 実装
  11. 実利用例
    1. GeoLatin
    2. GEORGIAN-PS
    3. georgian-academy
  12. 関連
  13. 歴史
    1. MS-DOS の時代
    2. ジョージア科学アカデミーでの技術開発
    3. Info-Tech, BGP, Legal Authorities
    4. PS
    5. 21世紀
  14. メモ

geostd8 #

[459] いわゆる PS 標準は、20世紀末から21世紀初頭に政府機関等で使われていた8ビット符号です。

呼称#

[10] 名称や HTMLcharset 名や X での名前として GEO8-GOV が使われていました。 >>9

[11] GEO8-GOVGEORGIAN-STD への改称が予定されました。 >>9

[13] GEORGIAN-STD はその後 GEORGIAN-PS に改称されたと思われます。

[12] geostd8, GEOSTD8 >>435 georgian-std >>9, Georgian Standard Code >>544, GEORGIAN-STD(PS), GEORGIAN-STD(GEORGIAN-PS) STANDARD >>9, Georgian-PS >>435, georgian-ps >>9, georgian-ps (SP) >>151, Geo8-gov >>105, >>111, GEO8-GOV (PS) >>97, geo8-gov (PS Standard) >>89, Georgian Geo8-gov (Parliament) >>105, PS >>264, SP >>152, Parliamen-Soros >>198, Georgian Parliament standard >>435, so called "PS - Parliament-Soros" encoding >>266, PS ["Parliament-Soros Fund standard"] >>266, პარლამენტ/სოროსის ფონდის სტანდარტი 1999 წლისა >>257 (1999年議会/ソロス財団基準) "პარლამენტ-სოროსის სტანდარტს" ანუ ინფორმაციის ცენტრის ძველ სტანდარტს >>264 (議会・ソロス標準、すなわち情報センターの旧標準) といった表記も見られます。

[460] 名称の揺れが激しいですが、公式な呼称があるのかは不明です。 ジョージア国会の Web サイトで利用されており、 OSGF (ソロス財団) 等の呼びかけで国家標準となったことが、 各種の呼称の語源となっています。

符号化文字集合#

[463] 諸情報には違いや曖昧な点も多いのですが、総合すると

という構造のようです。

[469] 「かもしれない」「おそらく」は情報が曖昧なだけでなく、 実装やフォントにも違いがあるようで、あまり気にされていないと思われます。

[521] 最初に国会が配布したフォントと思われるもの (>>508) は、 0xBF までが Windows-1252 ( なし)、 その後がジョージア文字 (旧5字あり)、 0xE6 以後が割当なしです。

[522] その後新たに国会が配布したフォントと思われるもの (>>510) は、 Windows-1252 部分の一部がジョージア文字に入れ替わっています。

[395] >>9 が 「GEORGIAN-STD(GEORGIAN-PS) STANDARD」 として示すのは、 0xA0 - 0xBFLatin1 相当、 0xC0 - 0xE5ジョージア文字が並び、 残りは空欄となった符号表です。実際の当時のビットマップフォントの実装字形と思われます。

[452] PS 形式のフォントの中には、現代33字だけで残りの5字はないものも多いようです。 >>435


[441] >>14>>439Windows-1252 のうち 0xC0 - 0xE5ジョージア文字に置き換えたものです。

[442] glibcICU に組み込まれて世界的には最も普及していますが、 ジョージアの実態に合ったものなのかは不明です (特に CR 部分)。


[400] GSCII の 0xF0 以後の部分 (>>398) について >>9

They can be included in GEORGIAN-STD(PS) standard in same positions.

とも述べています。さてこの「can」はどのような意味なのでしょう。 実際そのような規定ないし利用が見られたのでしょうか。 それとも PS では空きなのでそのまま流用できそうという筆者の意見でしょうか。

利用状況#

[461] ジョージア国会 Web サイトで使われたものが現存最古ではないかと思われますが、 それ以前からの流れなどがあるのかは不明です。

[520] ジョージア国会 Web サイトはから使っているようです (>>508, >>168)。

[90] 付ファイルの記述では、 de facto Geeorgian State standard で、ほぼ Windows で用いられており、 Web でも使われていると説明されています。 >>89

[462] その後ほぼ使われなくなったのではないかとも思われますが、 詳しい利用実態の変遷は不明です。

GSCII#

[471] いわゆる InfoTech/Academy 標準、 BPG フォント符号化は、 20世紀終盤から21世紀初頭にフィンランド在住亡命ジョージア人を中心に使われていた8ビット符号です。

呼称#

[177] GEORGIAN-ILIA >>9, georgian-ilia >>9, Georgian-Academy >>435, georgian-academy >>9, georgian-academy (BPG) >>151, Infotech >>435, InfoTech-Academy >>264, ინფოტექ-აკადემიის სტანდარტი >>264 (InfoTech/Academy 標準), ბპგ-ინფოტექ კოდირება 8 ბიტიანი სისტემებისათვის >>175, BPG-InfoTech standard of Georgian scripture for 8 bit systems >>175, BPG/InfoTech ASCII >>198, BPG-InfoTech realization of "Ilia" layout/encoding for 8 bite fonts >>270, BPG >>152, BPG 8bit standard >>107, GEO8-BPG >>9, Geo8-bpg >>107, >>111, geo8-bpg (BPG -Info Tech Academy standard) >>89, GEO8-BPG (BPG) >>97, Georgian Geo8-bpg >>107, GSCII >>175, >>264, >>435, GeorgianSCII >>210, Georgian ASCII >>435, Georgian texts using our fonts (filled from ASCII 192) >>266 などと呼ばれています。

[401] X での利用に当たり(?)、 GEO8-BPG という名称が使われていましたが、 BPG-InfoTech Academy から要求があったようで、 GEORGIAN-ILIA と改称される予定だったようです。 >>9

[98] 世界各地にみられる ASCII もじり系の名前を除くと登場する固有名詞は、

で開発主体が現れています。当事者である BPG による表記も GSCII やその他を含め揺れまくっていて、固定の正式名称は存在しないものと思われます。

符号化文字集合#

[180] BPG-InfoTechWebサイトの符号化の説明では、 8ビット符号と説明しながら、 GSCII zone と ASCII/Latin1 zone (同じものを指すと思われます。) のほかに Unicode zone を提示しています。 ASCII/Latin1 zone は 0xC0 から 0xFF が含まれ、 Unicode zone は 0x10A0 から 0x10FF が含まれます。 >>175

[181] BPG-InfoTech の多くのフォントは実際にこの GSCII zone と Unicode zone の両方を実装しています。つまり、従来の8ビット符号は (ISO/IEC 8859-1Unicode の関係を読み替えることで) U+00C0 から U+00FF でそのまま利用でき、 正式な Unicode符号位置も利用できるようなフォントになっているのです。

[478] 符号の解説などで BPG や InfoTech/Academy 標準などというとき、 普通は GSCII zone のことを言っています。

[182] BPG-InfoTechWebサイトの符号化の説明では、 GSCII zone には、 Commoncase/Lowercase と Headingcase/Uppercase の2種類の字形が Webフォントで示されています。 Unicode zone には、 Modern Georgian scripture と Old Georgian scripture と Mixed Old-Headingcase/New-Commoncase Georgian scripture の3種類の字形が Webフォントで示されています。 字形が違うだけでなく、一部は字形が存在しません。 >>175

[197] なお、 HTML 本体と別の Webフォントによる字形の表示であるため、 これが執筆当時に意図した字形から変更が入っていないのか、 文字の増減はなかったのか、は検証が必要です。

[183] この字形差は、 GSCII には1組、 (当時の) Unicode には2組しかジョージア文字符号位置がないにも関わらず、 ジョージア文字の字形は少なくても3組存在しているものを、 フォントの切り替えによって実現するものです。 明記されていませんが、フォント次第でいずれかの方法で実装するということなのでしょう。

[225] >>220, >>216 などのフォント配布頁には、 GSCII, Unicode ともに空き領域の符号と文字表示例も含めて Webフォントで示されています。 しかし Webフォントも配布されているフォントも、 空き領域には字形がないので、機械的に対象範囲のすべてを提示しているに過ぎないようです。

GSCII zone#

[185] GSCII zone は3部で構成されます。 >>175

[189] このうち >>186>>187 は直接的に Unicode に対応関係があります (>>191, >>192) が、 >>188 はそうではありません。

[228] BPG-InfoTech 配布フォントは、 フォントごとに違いもありますが、 概ね次の文字を実装しているようです。

[394] >>9 が 「GEORGIAN-ILIA(GEORGIAN-ACADEMY) STANDARD」 として示すのは GR の範囲の96文字ですが、 この特徴と一致するので、まさしく BPG 配布フォントのいずれかと思われます。

[398] >>9 には 0xF0 - 0xFF について

<U00F0>-d ; <U00F1>-z; <U00F2>-l; <U00F3>-o <U00F4>-r;<U00F5>-t ; <U00F6>-u ;<U00F7>-u; <U00F8>-sh ;<U00F9>-ts ; <U00FA>-f ;

<U00FB> Georgian "&" symbol .

<U00FF> St. Nino Cross

[399] これらは当時の Unicode にも PS にも含まれませんでした。 >>9

[451] InfoTech 方式のフォントの中には、 現代33字だけでその後の5字は持たないものもあります。 >>435

[270] >>266 には

BPG-InfoTech realization of "Ilia" layout/encoding for 8 bite fonts and Unicode Georgian subset filled using Modern Georgian and Old (Khutsuri) Georgian scriptures

と題した Unicode ジョージア文字, 0x20 - 0xFF らしき部分, 鍵盤配列の画像がありますが、 このうち 8 bite fonts に相当すると思われる 0x20 - 0xFF らしき部分は、 Windows-1252 (ユーロ記号なし) のうち 0xC0 - 0xE1 だけをジョージア文字に置き換えたものになっています。 >>258 にも同じ図があります。

[391] なお、 BPGUTF-8 のことを UC-FF encoded >>389HTML十進数文字参照のことを UC-NNNN encoded >>390 という特殊な名前で呼んでいます。 >>255


[444] >>443>>438Windows-1252 のうち 0xC0 - 0xE6ジョージア文字に置き換えたものです。その続きの部分は置き換えられていません。

[445] glibcICU に組み込まれて世界的には最も普及していますが、 ジョージアの実態に合ったものなのかは不明です (特に CR 部分と 0xE7 以後の部分)。

Unicode zone#

[190] Unicode zone は次のように説明されています。 >>175

[195] このうち >>191, >>192, >>193Unicode に初期から存在した部分です。

[196] >>194 は現在の Unicode には文字が存在する領域ですが、初期は空きでした。 この記事が書かれた時期は正確には不明で (著作権表示は 、 現在確認できる Internet Archive での最古は平成20年 >>184)、 Unicode への追加が行われた西暦2000年代初頭とどちらが先なのかはっきりしません。 ここでの「Extended」の割当文字と Unicode の文字が一致しているのか、 素人目には容易に判断しかねます。

[227] >>221 には

  • ბიტმა FON-ისაგან გაკეთდა სამივე ზომის BDF ფაილი;
  • უხეშ TTF-ი ჩავსვით ბიტმაპი, BDF ფაილების შუამავლობით;

(引用時に2文字を強調)

と謎の文字が混入しています。配布フォントにもそれらの字形はありません。 現行版 >>226 だと

  • ბიტმა FON-ისაგან გაკეთდა სამივე ზომის BDF ფაილი;
  • უხეშ TTF-ი ჩავსვით ბიტმაპი, BDF ფაილების შუამავლობით;

(引用時に2文字を強調)

に修正されています。何らかの誤りだったと思われますが、 どのような理由でこのような文字化けが発生したのかが謎です。

Mac 式符号#

[240] BPG フォントは Unicode cmap を実装する他に、 Macintosh cmap で1バイト符号が実装されていることもあります。 しかしおそらくこれは当時のフォント編集ソフトウェアが自動生成したものとみられ、 この cmap が実用されることがあったかは不明です。

利用状況#

[476] ソ連末期に開発されて以来デファクト標準として使われていたと BPG 陣営は説明していますが、十分な資料がなく実態は不明ですし、 当時の符号と21世紀初頭に BPG 符号と呼ばれていたものが同じかも不明です。

[91] 付ファイルの記述では、 geo8-bpgニュースグループ, チャット #tbilisi2, Web で用いられていると説明されています。 >>89

[477] その後ほぼ使われなくなったのではないかとも思われますが、 詳しい利用実態の変遷は不明です。

GeoLatin#

[99] GeoLatin の他、 Georgian 7 bit (GeoLatin) >>105, Georgian Alphabet( 7bit State Standard ) >>105, LATIN (7bit) >>97, LATIN >>85, Latin >>89, geolat >>89, LathinGeorgian (transliteration) >>198 といった表記も見られます。

[108] Georgian 7 bit (GeoLatin Extended in bpg style :)) >>107, Georgian "Latin" Alphabet for BPG standard >>107 という表現もありますが、これは geo8-bpg との変換器の説明に出現するもので、順序が geo8-bpg と同じに揃えられていることを指すと思われます。 文字集合としては通常の GeoLatin と変わらないように見えます。

[45] GeoLatinASCII文字への翻字を使った方法です。 基本ラテン文字1文字に直接対応させられるものは小文字、 それ以外は大文字で各文字を基本ラテン文字のいずれかに当てはめています。 >>42

[46] 対応フォントがあればジョージア文字で表示され、 なくてもラテン文字として一応読めます。

[47] ジョージア文字の字形の区別まではできませんが、フォントによって切り替えられますので、 HTML などでは共存可能です。

[397] 実際には文字コードではなく US QWERTY kb maping に過ぎないとも説明されます。 >>9 ある意味そうなのかもしれませんが、鍵盤入力、情報交換、表示までこの符号によって文字が表されるのですから、 利用実態としては一種の7ビット符号と呼んでも差し支え無さそうです。

[403] BPG 陣営は、この種の原始的な翻字符号化法は、 技術的に不適切であり、符号化標準の発展を阻害する有害なものだと批判しています。 >>264 (具体例として Eka符号表が示されています。 >>404) 一理あるものの、自方式の優位性を主張する宣伝としてこのような主張がなされたことには注意が必要です。

[518] 頃には既に Windows 向けの TrueType フォント >>506 が存在したと思われます。

[93] 付ファイルの記述では、 電子メールで用いられ、 Web でも使われることがあると説明されています。 >>89

[7] 当時のジョージア電子メールの標準で、 Chelos Georgian Forum http://forums.delphi.com/chelo で用いられ、 ジョージアニュースグループで用いられ、 その他いくつかのWeb頁でも用いられるとのことです。 >>105

[106] 少々文意を掴みかねますが、

This is extended 7bit standard. Just same , but "Old" Letters are added.

E, I, V , X and H are "OLD" Georgian Letters: "e merve", "iota", "vi","xe (or xae)" and "hoi".

との説明もあります。 >>105 この5つの「古い」字がない旧版もあったのでしょうか。

[437] >>435 にも仕組みとフォント名の説明がいくらかあります。


[114] 利用事例のうち Chelos Georgian Forum は、 英語の掲示板サービスで作られた掲示板です。 ドメインが変わっているものの現在も稼働しています >>115

[116] このサイトは長らくログイン必須だったらしく、残念ながら当時のそのままのものは Internet Archive に所蔵されておらず、正確にどのような状態だったかは不明です。

[117] この掲示板の現在のトップページには

We use Eka.ttf font for 画像

  • For dynamic font click above.
  • To install Eka.ttf click hereリンク.

とあります。 >>115

[118] この Eka.ttf のリンク先は現存せず、 Internet Archive にも所蔵されていませんが、 多くのフォント配布サイトに名前と内容がそれらしいフォントがあります >>119

[121] このフォントが掲示板上でどのように使われていたのかは、現在のサイト上ではよくわかりません。

[122] 当時まで遡ると英語ジョージア文字ラテン文字への転写らしきジョージア語が使われています。 単語レベルで混在しているものもあり、全体に Eka font を適用していたようにも思えません。 GeoLatin や Eka font で生じるはずの大文字の混在もあまり見られず、 むしろ英語のような capitalize もたまに見られます。

[125] なお、8ビット符号で書かれたと思われる文字化けもたまに見られます。 >>123, >>124 現在はこのサイト全体が UTF-8 になってしまっています。

[136] >>135georgian fonts here - testing と題したの投稿ですが、

<br>I'm just testing if georgian fonts can appear here
<p><b><font face="Arachveulebrivi Thin"><font color="#990000"><font size="+2">gamarjoba. didi madloba</font></font></font></b>
</p><p>:)

などと投稿されています。

[137] Arachveulebrivi Thin というフォントが GeoLatin を実装していたのでしょうか。 しかしこのような手法がこの掲示板でその後広まったようには見えません。

[139] Arachveulebrivi Thin は多くのフォント配布サイトに名前と内容がそれらしいフォントがあります >>138

[126] また、時代が下ると Unicodeジョージア文字も使われるようになったようで、 それは現在でも文字化けせずに表示されます。ただその時代になるとこの掲示板は衰退するようで、 分量はあまり多くありません。

[120] Eka font >>119, >>404Arachveulebrivi ThinASCIIラテン文字部分にジョージア文字を割り当てており、 GeoLatin の特徴と一致します。

[140] ただし Eka font の I, V, XArachveulebrivi ThinI, L, M, N, V, X はラテン文字の字形になっています。

[141] Arachveulebrivi ThinE©Y, U«, »Q§ としています。

[142] Eka font, Arachveulebrivi Thin とも ~, `, ,,, #No としています。

GeoTranslit #

[94] GeoTranslitジョージア文字ラテン文字への転写法です (文字コードではありません)。

[95] GeoTranslit >>85, >>97 の他に geotrans >>89, TRANSLIT, GEOTRANS, translit >>97 といった表記が見られます。

[100] ラテン文字への転写とみなしたときの GeoLatin と比較すると、小文字1文字で転写されていたものはそのままで、 小文字2文字や記号付きに転写するなど、 大文字を使う独特の表記を排除した一般的な転写法となっています。

[101] 大文字は Modern-Asomtavruli 混合文を表すために使う構想があったようですが、未実装でした >>97

[396] >>9 では Transliteration 欄で示されていますが、 すべてが大文字になっています。

[103] ジョージア文字フォントがないときに有用で、 ジョージア文字フォントを持たなかったりジョージア文字を知らなかったりする非ジョージア人にも有用であると説明されています。 話す通りに書くものであるとされます。 >>85

[102] 提唱者による実装以外で使われていたのかは不明です。 ラテン文字転写が使われることはありますが、 明記されていない限り GeoTranslit を意識して採用したのかどうかは判定不能です。

ロシア語鍵盤系符号化#

[422] ロシア語用のキリル文字中心の ჲცუკენ (Ih-tCu-K-eN) 鍵盤系の符号を使ったフォントが使われていました >>255, >>411

[424] フォント依存で何種類もあったようで、 >>411 には Gorda, Gremi, Chveulebrivi の3種類が示されています。他にもあったのかもしれません。

[436] >>435 にも仕組みとフォント名の説明がいくらかあります。

[519] 頃には既に Windows 向けの TrueType フォント >>506 が存在したと思われます。


[282] >>266 には 「Non-standard/amateur layout」 という 0x21 - 0xFF符号表らしき図があります。

[331] この図は、

In the Georgian fonts presented in WWW/Internet URLs... Georgian letters are placed (in not-alphabetic/random order) in the region of symbols and English letters from ASCII 7,12, 14,15, 27, 59, 61 and mainly from 64 and can't be used for English or mixed texts,

との説明に対応するものと思われます。 >>266 ここでいう ASCII とは起算の値に 0x20 を加算すると7ビット符号ビット組合せになるもののようです。

[332] 「Georgian fonts presented in WWW/Internet URLs」 というのがいまいち理解に苦しみますが、前後の他の説明や符号の構造を総合的に勘案すると、 西暦1990年代後半頃にジョージア文字を使った Webサイトでこうしたものを使った事例もあったのでしょう。

[500] BPG 陣営は、この種の原始的な翻字符号化法は、 技術的に不適切であり、符号化標準の発展を阻害する有害なものだと批判しています。 >>264

[333] どこで誰が使っているのか説明がありませんし、 「Non-standard」はともかく「amateur」 と名付けているあたりに、説明するまでもない取るに足りない俗用という視線を感じます。

[423] >>266 と同じサイトの >>411 に示されているフォントの1つの符号表とよく似ています。

[283] 0x21 - 0x7E に飛び飛びにジョージア文字欧州数字や記号類が割り当てられています。 ASCII と同じなのは 0 - 9 など十数文字だけで、 ASCII文字でも他の位置に割り当てられているものもあります。

[284] 面白いことにこの符号にも No があります (0x3D)。 (# はありません。)

IS0 10586:1996#

[246] ISO 10586:1996ジョージア文字94文字集合です。 >>245

[247] ISO/TC 46 による図書館系の符号化文字集合の1つです。 >>245

[248] 終端バイトは未定とされています。 >>245

[249] ISO-IR 222 として ISO-IR の登録手続きが進められていたようです >>250 が、なぜか頓挫したようです。

[251] ジョージアでは極稀にしか言及 >>256 されることがないようで、 どこでどの程度使われていたのか実態は不明です。 少なくても一般のパソコン利用者が接する機会は皆無だったと思われます。

[252] 5/0 から 7/5 までに GEORGIAN-PS と同じ順序で文字が並べられています。 7/6 には U+10F6 があります。 0x4D - 0x4F には句読点があります。

[253] ジョージア文字の順序は GEORGIAN-PS と同じであるものの、 4/0 相当から始まる GEORGIAN-PS とは + 0x10 分ずれていますし、 句読点も独自であり、 互換性はありません。

[254] ISO-IR 37キリル文字との併用が想定されています。 >>245

Windows Georgian (PT 181)#

[447] >>446符号表があります。

[448] Windows とありますが、 Microsoft は無関係と思われます。

[453] >>435 はこの方式のフォントが見つからなかったとしています。

Mac Georgian (PT 281)#

[449] >>446符号表があります。

[450] Mac とありますが、 Apple は無関係と思われます。

Mac OS Georgian#

[386] Mac OS Georgian は、 Mac OS 用のジョージア文字8ビット符号です。

[387] Appleジョージア文字に対応しませんでしたが、 Mac OS は第3者がロケール的な仕組みを開発できる仕様だったので、 Michael Everson符号フォント等を開発して提供していました。 >>383, >>384, >>385

[388] Mac OS GeorgianMacRoman非ASCIIラテン文字等をジョージア文字に入れ替えたもので、 当時 Unicode にあったジョージア文字を一通り詰め込んだものとみられますが、 利用できる領域が限られているために並び順はかなり歪です。

実装#

[87] 表示のための実装はフォントを指定するだけです。


[170] ジョージア国会フォントを配布すると共に、

In order to convert from various Georgian fonts to the standard Georgian fonts Download convert.ZIP .

なるソフトウェアを配布していました。それをインストールすると、

5. If you can see a new button, a round yellow smiling face, in the Microsoft Word toolbars the converter is successfully installed. If an opened document is in Georgian but is illegible, press this button and the converter will change the encoding.

となるようです。>>165 つまり Microsoft Wordマクロで実装されていたと見られ、 フォントとそれを使った文字列ジョージア国会フォント形式に修正するようです。

[171] 「various Georgian fonts」が具体的に何かは不明ですが、 当時流通してよくつかわれていたフォントが対象になっていたのでしょうか。


[539] >>537OSGF のウェブサイト。 PS とそれを使った Webサイトの開発促進事業を行っていたようです。

[541] >>540 で配布されていたのは GeoWeb。残念ながら FTP で配布されていたファイルは現存しません。

Current version can detect up to 24 non-standard georgian encoding analyzing font tag in your document and convert them according to strandard into Geo_Times font.

とのことで、 HTML文書font 要素をみて非標準のフォント符号化から PS へと変換するようです。出力も font 要素入り HTML文書と思われます。

[543] >>542 で配布されていた SPFontsConverter for WORD はジョージア国会 Web サイトで配布されていたものと同じものだそうです。 こちらの配布も FTP であり現存しません。

[544] >>542 で配布されていた Super Coder / SuperCoder は各種フォント符号化のテキストファイルを標準フォントに変換するプログラムで、

- Georgian type1 - to Georgian Standard Code

- Georgian over LATIN Keyboard - to Georgian Standard Code

- Georgian over RUSSIAN Keyboard - to Georgian Standard Code

の変換が出来たようです。

[545] type1 は Type1 フォントでしょうか。説明がなく詳細不明です。

[546] >>544 の説明には、 meta 要素windows-1251windows-1252 が指定されていた場合、削除するか iso-8859-1 に置き換えるように勧めています。

[547] windows-1252 なら問題なさそうなものですが、それではうまくいかない Webブラウザーもあったのでしょうか。

[548] >>544 の説明はまた、Webブラウザーの設定で既定の符号化を User Defined (= x-user-defined) に設定し、そのフォントを Standard Georgian font にするように求めています。

[551] GeoWin'98 (GeoWin98) は Windows 95 / Windows 98 用の NLS です。 >>549

[552] >>537 で紹介されています。 WindowsPS 対応にするもののようです。 配布フォントは国会配布フォントのうち日付がとなっているものと同じと思われます。


[96] webconv >>84Webサーバーで利用するプログラムで、 フォーム入力文の文字コードを変換します。 GEO8-GOV, GEO8-BPG, GeoLatin, geotrans に対応しています。

[129] 開発者自身の Chelo's Georgian Forum (>>114) への投稿で、実際に利用されていた痕跡を見ることが出来ます >>127, >>128, >>130。 他の人の投稿で利用された事例は見当たりません。

[88] geosite >>86Webサーバーで利用するプログラムで、 URL の指定に応じて文字コードを変換して送出するようです。 GEO8-GOV, GEO8-BPG, GeoLatin, geotrans に対応しています。

[104] >>105JavaScript による GeoLatinGeo8-gov の変換器。 >>107GeoLatinGeo8-bpg>>111Geo8-govGeo8-bpg文字コード指定メニューから ISO8859-1 を選ぶように指示がある。

[6] >>105

   <html>
<head>
<TITLE>Georgian (geo8-gov, parliament)/Georgian 7 bit Convertor</TITLE>
<!-- Start link to PFR -->
<LINK REL=fontdef SRC="https://members.tripod.com/shoshia/pfr/ArialPFR.pfr">
<!-- End link to PFR -->
<!-- Start Bitstream WebFont Player support -->
<SCRIPT SRC="http://www.bitstream.com/wfplayer/tdserver.js" TYPE="text/javascript">
</SCRIPT>
<LINK>
<!-- End Bitstream WebFont Player support -->
<style type="text/css">
<!--
.textbox { background: transparent; background-color: White; border: 1px solid #000000; color: #000000; font-family:  "Geo_Arial"; font-size: x-small; text-align: left; scrollbar-face-color: #CCCCCC; scrollbar-shadow-color: #FFFFFF; scro
llbar-highlight-color: #FFFFFF; scrollbar-3dlight-color: #FFFFFF; scrollbar-darkshadow-color: #FFFFFF; scrollbar-track-color: #FFFFFF; scrollbar-arrow-color: #000000 }
TD {font-family:  "Geo_Arial"}
DIV {font-family:  "Geo_Arial"}
BODY {font-size: 14; font-family:  "Geo_Arial"}
-->
</style>

[8] おそらく Geo_Arialrel=fontdef で参照されているフォントgeo8-gov で符号化されているらしい。 変換器の入出力の geo8-gov はこのフォントによって実現されている。

[109] >>107

<TITLE>Georgian (geo8-bpg)/ Latin Convertor</TITLE>
<!-- Start link to PFR -->
<LINK REL=fontdef SRC="https://members.tripod.com/shoshia/pfr/Gordanew.pfr">
<!-- End link to PFR -->
<!-- Start Bitstream WebFont Player support -->
<SCRIPT SRC="http://www.bitstream.com/wfplayer/tdserver.js" TYPE="text/javascript">
</SCRIPT>
<LINK>
<!-- End Bitstream WebFont Player support -->
<style type="text/css">
<!--
.textbox { background: transparent; background-color: White; border: 1px solid #000000; color: #000000; font-family:  "GordaPFR"; font-size: x-small; text-align: left; scrollbar-face-color: #CCCCCC; scrollbar-shadow-color: #FFFFFF; scro
llbar-highlight-color: #FFFFFF; scrollbar-3dlight-color: #FFFFFF; scrollbar-darkshadow-color: #FFFFFF; scrollbar-track-color: #FFFFFF; scrollbar-arrow-color: #000000 }
TD {font-family:  "GordaPFR"}
DIV {font-family:  "GordaPFRl"}
BODY {font-size: 14; font-family:  "GordaPFR"}
-->
</style>

[110] おそらく GordaPFRgeo8-bpgフォント

[112] >>111

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML><HEAD><TITLE>Georgian (geo8-gov, parliament)/Georgian 7 bit Convertor</TITLE>
<META content="text/html; charset=geo8-gov" http-equiv=Content-Type>
<META content="text/html; charset=" name=Content-Type>

[113] >>111 には

<P>If you have Geo8-gov fonts in your system , you see both tables in correct 
encoding <BR><B>Geo8-bpg:</b> 

のように説明があり、 Webフォントは使われていない。

[156] >>155

   <meta http-equiv="Content-Type" content="text/html">
   <meta name="GENERATOR" content="Mozilla/4.7 [en] (X11; I; Linux 2.2.13 i586) [Netscape]">
   <title>Georgian PFR Fonts</title>
   <link rel=fontdef src="https://members.tripod.com/shoshia/pfr/zazaPFR.pfr">
 <link rel=fontdef src="https://members.tripod.com/shoshia/pfr/AkademiuriPFR.pfr">
 <link rel=fontdef src="https://members.tripod.com/shoshia/pfr/ArialPFR.pfr">
 <link rel=fontdef src="https://members.tripod.com/shoshia/pfr/BPGClassicnew.pfr">
 <link rel=fontdef src="https://members.tripod.com/shoshia/pfr/CaligPFR.pfr">
 <link rel=fontdef src="https://members.tripod.com/shoshia/pfr/EkaPFR.pfr">
 <link rel=fontdef src="https://members.tripod.com/shoshia/pfr/Gordanew.pfr">
<link rel=fontdef src="https://members.tripod.com/shoshia/pfr/LortkipanidzePFR.pfr">
<link rel=fontdef src="https://members.tripod.com/shoshia/pfr/rustaveliPFR.pfr">

Zaza SP, Regular (zazaPFR.pfr)

BPG Akademiuri. File AkademiuriPFR.pfr Use font face name "AkademiuriPFR"

Geo_Arial (gov. stand. ). file ArialPFR.pfr . Use font face name "Geo_Arial"

BPGClassic (BPG stand. ). file BPGClassicnew.pfr . Use font face name "BPGClassicPFR"

Geo_Caligraf (gov. stand. ). file CaligPFR.pfr . Use font face name "GEO_CALIGRAF"

EkaSP (SP. stand. ). file EkaPFR.pfr . Use font face name "Eka SP"

Gorda (BPG. stand. ). file Gordanew.pfr . Use font face name "GordaPFR"

BPG Lortkipanidze U (BPG. stand. ). file LortkipanidzePFR.pfr . Use font face name "BPG Lortkipanidze U"

SPRustavely (SP. stand. ). file rustaveliPFR.pfr . Use font face name "SPRustavely"


Unix 用フォント。

[153] >>152

With Kafont you can view Georgian web sites with lynx, send Georgian emails with pine etc.


[199] BPG は、フォントを多数制作して配布しています。関係する実装もいくつか配布しています。

[356] ბესარიონ გუგუშვილი (Besarion Gugushvili, Bessarion, Paata Gugushvili, BPG) はジョージア8ビット符号に関わる問題の重要人物です。

[366] 個人としての ბესარიონ გუგუშვილი と組織としての BPG = BPG-InfoTech のどちらの事跡かわからないものが多く、当記事では明確に区別はしていません。

[176] BPG-InfoTechWebサイトは何度か移転しつつも一応現存しています。 「一応」というのは、あまりよくメンテナンスされていないようで、 一部にリンク切れも見られます。現行サイトになくても、 過去の URL から Internet Archive で探せば所蔵されているファイルもあります。 残念ながら最初期の頁は Internet Archive にも断片的にしか所蔵されていないようです。

[206] >>205 には NC4 向けの Webフォントの紹介があります。 IE 向けもあったようです >>242 が、残念ながらそちらは Internet Archive に一部分しか所蔵されていません。



[426] 変換器 (JavaScript)。

[427] 対応形式:

   met=new Array("_eng_","_standart_","_utf8_","_utf8_UpperCase_","Manuchari","racxa","GeoFinder","RGEO","utf","UTFnoLat","RUSGANLAGEBA","AcadNusx","erti","Rusuli","aaa","ENGRUS","geo","AXTEL","Antiqua","LSI","UniToMtavr","ENGTHAI","kolkheti","odiSi","password","hhh","ichveulebrivi","sylfaen","ravi","giorgi","");

[432] 変換オプション:

		<td><select name="metodi3" size="1"><option>--უცვლელად--<option>Eng-&gt;Rus<option>Rus-&gt;Eng</select></td>

[433] 多数の形式に対応していますが、その大部分はラテン文字キリル文字鍵盤配列を前提にジョージア文字に置き換えたフォントと思われます。 挙げられたすべてがまったく異なるわけではなく、小異を含むいつかのグループに分かれます。 >>427 の指定を基礎に、 >>432 によって更に英語配列からロシア語配列、 ロシア語配列から英語配列への変換を組み合わせることができます。 無変換と合わせて3倍の組合せが可能になりますが、 すべてが実用されたものとは思われず、 利用実態については研究が必要です。


[429] >>428 変換器 (サーバー側)。

[430] 対応形式:

					<td class=box4row1 width=100%><select name=in><option value="utf8" title="Sylfaen, BPG Glaho, Arial Unicode MS...">უნიკოდი (UTF-8)</option><option value="lat1" selected title="AcadNusx, LitNusx, Avaza...">ლათინური - ინგლისური განლაგებით [ქწერტყ]</option><option value="lat2" title="Balaveri, Dumbadze TD, Literaturuli ITV...">ლათინური - რუსული განლაგებით [ღცუკენ]</option><option value="lat3" title="Academiury...">ლათინური - საბეჭდი მანქანის განლაგებით [ღჯუკენ]</option><option value="std8" title="Geo_Times, SPLiteraturuly, Oris...">სტდ8 (Geo, SP)</option><option value="trans" title="">ლათინური ტრანსლიტერაცია</option></select></td>

[431] (Google翻訳)

[434] 鍵盤配置系フォント符号化がこちらでは3つに集約されています。 このうち英語配置が >>432 の無変換、ロシア語配置が >>432 の英語からロシア語へ、 タイプライター配置が >>432 のロシア語から英語への変換に相当するようですが、 >>427 + >>432 の変換結果のいずれとも完全一致しません。 実際のフォントや鍵盤配置の実装と比較しながら詳細な研究が必要そうです。

[482] >>481 サイトの主題はジョージア文字用の無料フォントの収集と配布で、 大量のフォントが提供されています。

[483] >>481 検索条件のフォントの符号化の指定:

							<tr>
								<td align=center title="კოდირება"><select class=searchFormItem name=encoding style=width:200px><option value=>- კოდირება -</option><option value=1>უნიკოდი (UTF-8)</option><option value=2>ლათინური</option><option value=3>სტდ8 (Geo, SP)</option><option value=4>გაურკვეველი</option></select></td>
							</tr>
							<tr>
								<td align=center title="განლაგება"><select class=searchFormItem name=layout style=width:200px><option value=>- განლაგება -</option><option value=1>ლათინური [ქწერტყ]</option><option value=2>რუსული [ღცუკენ]</option><option value=3>დრაივერზე დამოკიდებული</option><option value=4>საბეჭდი მანქანა [ღჯუკენ]</option><option value=5>გაურკვეველი</option></select></td>
							</tr>

[484] Google翻訳:

- コーディング -

ユニコード(UTF-8)

ラテン

Std8(地理、SP)

未知

- レイアウト -

ラテン語 [Ktsertk]

ロシア語 [Gtsuken]

ドライバー依存

タイプライター(印刷用)

未知

[485] 今や UTF-8 もかなり多いですが、それ以外も相当数提供されています。

[486] なお UTF-8 とされるフォントの中には #No となっているものも混じっているようです。


[569] 世界的な文字コード自動判定のプログラムでは対応している事例はそれほど多くありませんが、 uchardetgeorgian-academygeorgian-ps にだけ対応しています。 >>570

実利用例#

[479] 検索エンジンなどでこれらの符号の実利用例を発見するのは困難で、 全体像は不明です。

[480] 既に消滅または UTF-8 等に置き換えられてしまったものも多いです。 歴史の長いサイトの過去の版を Internet Archive で発見できる場合があります。

GeoLatin#

[42] >>25

<link rel="FONTDEF" src="http://www.gia.ge/lado.pfr">
<link rel="FONTDEF" src="http://www.gia.ge/ladom.pfr">
<link rel="FONTDEF" src="http://www.gia.ge/oldaso.pfr">
<link rel="FONTDEF" src="http://www.gia.ge/oldnusx.pfr">

<style type="text/css">
<!-- /* $WEFT -- Created by: Gia Shervashidze (giasher@wanex.net) on 6/16/01 -- */
  @font-face {
    font-family: G&G_Lado;
    font-style:  normal;
    font-weight: normal;
    src: url(/web/20020305174756im_/http://www.gia.ge/GGLADO1.eot);
  }
  @font-face {
    font-family: G&G_LadoM;
    font-style:  normal;
    font-weight: normal;
    src: url(/web/20020305174756im_/http://www.gia.ge/GGLADOM0.eot);
  }
  @font-face {
    font-family: G&G_Old_Asomtavruli;
    font-style:  normal;
    font-weight: normal;
    src: url(/web/20020305174756im_/http://www.gia.ge/GGOLDAS1.eot);
  }
  @font-face {
    font-family: G&G_Old_NusxaXucuri;
    font-style:  normal;
    font-weight: normal;
    src: url(/web/20020305174756im_/http://www.gia.ge/GGOLDNU1.eot);
  }
-->
</style>

[44] NC4 用の PFRIE 用の EOT が指定されています。 フォントの内容は同等と思われます。

[43] 4つのフォントが順に Mkhedruli, Capitals, Asomtavruli, Nusxuri字形に対応します。この記事にはジョージア文字の一覧があります。

[69] >>19

<meta http-equiv="Content-Type" content="text/html; charset=windows-1252">
<meta http-equiv="Content-Language" content="en-us">

<title>Georgian Standards</title>
<meta name="GENERATOR" content="Microsoft FrontPage 5.0">
<meta name="ProgId" content="FrontPage.Editor.Document">


<style type="text/css">
<!-- /* $WEFT -- Created by: Gia Shervashidze (giasher@wanex.net) on 6/16/01 -- */
  @font-face {
    font-family: G&G_Lado;
    font-style:  normal;
    font-weight: normal;
    src: url(/web/20020305104106im_/http://www.gia.ge/GGLADO1.eot);
  }
  @font-face {
    font-family: G&G_Old_Asomtavruli;
    font-style:  normal;
    font-weight: normal;
    src: url(/web/20020305104106im_/http://www.gia.ge/GGOLDAS1.eot);
  }
-->
</style>

[70] >>19 には NC4 用のフォントは含まれていません。

[71] かわりではありませんが、 Windows-1252 との指定があります。

[72] G&G_Lado8ビット符号の字形や Unicode の現代文字の方の字形の表示に、 G&G_Old_AsomtavruliUnicodeAsomtavruli の方の字形の表示に使われています。

GEORGIAN-PS#

[166] ジョージア国会Webサイトではフォントを配布していました。 >>164, >>165

[172] 残念ながら配布されていた FTP サーバーは既に稼働していないようです。

[174] >>173 には多数のフォントが収録されています。ファイルの日付はからにわたっており、 >>166 の配布物に更に追加したものかもしれません。

[167] このフォントによって書かれたと思われる文書が大量にありました。 いずれも文字コードの記述も Webフォントの指定もありません。 Webブラウザーの設定で配布されたフォントを指定することが期待されていたようです。

[168] >>164 によれば遅くてもにはこの方式が使われていたようです。 当時は未だWebフォントのダウンロード機能はありません。 (この時代一応既に <font face> はありましたが、ここでは使われてはいません。)

[161] >>158 >>159 Latin1SGML文字実体参照で表されていますが、 実際にはその Latin1 と同じ値のジョージア文字8ビット符号の文字です。

[162] >>157 ジョージア文字8ビット符号の文字です。

[163] >>160 おそらくジョージア文字8ビット符号の文字です。 現在の FirefoxWindows-1251 と誤認し、そのソース表示では Windows-1252 と誤認します。

[505] >>174 の配布ファイル:


[1] >>85

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//en">
<html>
<head>
<TITLE>氏团囊韵夷辽 Georgian convertors</TITLE>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=GEO8-GOV">
<META NAME="Author" CONTENT="levan shoshiashvili, shoshia@hotmail.com">
<META NAME="keywords" CONTENT="Georgian scripture, online convertors,
onfly recoders, GEO8-GOV, GEO8-BPG, UNICODE, computer fonts, Georgian fonts,dynamic fonts, kartuli, qartuli, sakartvelo, saqartvelo,
 Tbilisi, orthodoxy, christinity,Sakartvelo">

<META NAME="Description" CONTENT="Online, onfly Georgian Recoders. GEO8-BPG,GEO8-GOV, 7bit(GeoLatin) and transliteration are supported">

<META NAME=GENERATOR content="Bluefish html editor; Slackware Linux 7.0" >
 <!-- mititebulia pfr failis mdebareoba -->

<LINK REL="fontdef" SRC="https://members.tripod.com/shoshia/pfr/geogrigol.pfr">

<!-- mititebulia pfr failis mdebareoba -->

<!-- es aris Explorerisatvis -- imitac rom naxon gverdi -->
<script LANGUAGE="JavaScript" SRC="http://www.truedoc.com/activex/tdserver.js">
</script>
<link>
<style type="text/css">
<!--
H1 {  font-family: "GEO_GRIGOLIA";font-size: 30px; font-style: normal; font-weight: bold; color: #000000; background-color: #FFFFFF; text-indent: 50pt}
P {  font-family: "GEO_GRIGOLIA";font-size: 18px; font-style: normal; font-weight: normal; color: #000000; background-color: #FFFFFF; text-indent: 10pt}
-->
</style>
</head>

[2] >>1 この題名はおそらく文字化け

[3] >>1 WindowsChrome では GBK で表示される。 WindowsFirefox では一瞬 GBK で表示された後、 Windows-1251 で再表示される。 Firefox のソース表示だと GBK で表示される。

[4] >>1GEO_GRIGOLIA なるフォントがおそらく rel=fontdef で参照されている PFR

[5] おそらく NC4 では正しくジョージア文字で表示されていたのでしょう。


[15] null, https://shoshia.tripod.com/knote.html

<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-8859-1">
<HEAD>
<TITLE></TITLE>
 <link rel=fontdef src="https://members.tripod.com/shoshia/pfr/zazaPFR.pfr">
 <link rel=fontdef src="https://members.tripod.com/shoshia/pfr/ArialPFR.pfr">

[16] >>15 2つあるが使われているのは Geo_Arial

[17] iso-8859-1 とあるので Windows-1252 と解釈されるので

<FONT FACE="Geo_Arial">
    ÂÀÌÀÒãÏÁÀÈ ÄÓ  "ÐÒÏÅÏÊÀÝÉÀÀ" ÃÀÀàÉÒÄÈ ÙÉËÀÊÄÁÓ ÃÀ ÔÄØÓÔÉ ÀÉÊÒÉ×ÄÁÀ ØÀÒÈÖËÀà ÐÀÒËÀÌÄÍÔÉÓÓ ÓÔÀÍÃÀÒÔÛÉ
ÔÄØÓÉ ÌÏÍÉÛÍÄÈ "ÌÀÖÓÉÈ" ÃÀ ÊÏÐÉÒÄÁÀ ÂÀÖÊÄÈÄÈ ÁÒÏÖÆÄÒÉÓ ÌÄÍÉÖÃÀÍ<font face="Geo_Arial">. :) </font>
</FONT>

となっている。


[534] >>533, >>536PS の開発主体のソロス財団こと OSGF のサイト。

[535] >>533 中には

<meta http-equiv="Content-Type" content="text/html">

とある。普通これは charset を指定するために使う要素なので不自然。


[568] >>567 人工的に作られたと思われるテストデータ。

georgian-academy#

[154] https://shoshia.tripod.com/readme.html

 <HEAD>
<!-- Start link to PFR -->
<LINK REL=fontdef SRC="pfr/AkademiuriPFR.pfr">
<!-- End link to PFR -->

<!-- Start Bitstream WebFont Player support -->
<SCRIPT SRC="http://www.bitstream.com/wfplayer/tdserver.js" TYPE="text/javascript">
</SCRIPT>
<LINK>
<!-- End Bitstream WebFont Player support -->
Here is this site in georgian <a target=_top href="geo1.html"><b>"qartuli qseli" <FONT HXPFR="AkademiuriPFR.pfr" FACE="AkademiuriPFR" SIZE="3">
(ÕÀÐÇÓÊÀÃ)</font></b></a>

made in BPG encoding  <a href="http://www.members.tripod.com/beso">BPG-InfoTech</a>
[169] <font hxpfr> については未詳。検索しても情報なし。 これ以外の用例も未見。

[200] >>198 : Visual Basic のソースコード。注釈ジョージア文字を含む。

[202] >>201

<!doctype html public "-//w3c//dtd html 4.0 transitional//en">
<Html>
<HEAD>
   <meta http-equiv="Content-Type" content="text/html; charset=x-user-defined">
   <meta name="Author" content="Bessarion, Paata Gugushvili">
   <meta name="GENERATOR" content="Mozilla/4.5 [en] (Win95; I) [Netscape]">
   <title>Message [ÚÌÍÁÀ]</title>
   <link rel=fontdef src="http://members.tripod.com/~beso/test/BPG_Classic_Dina.pfr">

[204] >>203 など同じサイトの他のページにも同様のもの多数。また、テスト頁も:

[217] >>215 のように UTF-8 でありながら georgian-academy 相当の Latin1 部分を使い、 Webフォントジョージア文字を表示している頁もありました。 同じページがその後の時代の >>216 では正しいジョージア文字に置き換えられています。 (同じサイトに同様の頁がいくつかあります。)

[243] >>242

<HTML>
<HEAD>

   <TITLE>Georgian Web Typography: Fonts, Intro  [ÕÀÐÇÓÊÈ ÅÄÁÈÑ ÒÈÎÍÂÐÀÔÈÀ: ÔÍÌÒÄÁÈ, ØÄÑÀÅÀÊÈ]</TITLE>
   <META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=x-user-defined">
   <META NAME="Author" CONTENT="BPG">
   <META NAME="Description" CONTENT="Georgian Scripture, Georgian Web Embedded Fonts">
   <META NAME="KeyWords" CONTENT="Georgian scripture, computer fonts, Georgian fonts, embedded fonts, dynamic fonts, portable fonts, karuli, qartuli">

<LINK rel="stylesheet" type="text/css" href="MAIN2.CSS" title="style1">

</HEAD>

[244] >>243 MAIN2.CSSWebフォントが参照されていたと推測されますが、 残念ながら Internet Archive には保存されていません。


[269] >>268 : フォント指定なし (既定のフォントとして設定されている前提か)

[275] >>274 フォント指定なし。


[566] >>565 人工的に作られたと思われるテストデータ。

関連#

フォント依存符号化, Webにおける文字コード


[528] >>19 によれば、ジョージアでは主に3つの鍵盤配置が使われています。


[573] ジョージアでは独立後ロシア語キリル文字の利用は急激に減少したとされます。 そのため Web ではあまり使われていないようです。

[572] ジョージア国会のWebサイトにはロシア関連事案でロシア語文のため KOI8 を使った例がいくつかありました。かなり特殊なケースなので、 他の民間サイトでも使われたことがあったかは不明です。

歴史#

[26] ジョージア文字には少なくても3種類があります。 それぞれ単体で用いられることもあれば、 混用されることもあります。 大文字と小文字の関係性とも似ていますが、 ラテン文字等とは異なる独特の性格があります。 ジョージア文字

[41] 現代では主にそのうちの1つ、 Mkhedruli が使われます。8ビット符号の時代は Mkhedruli を基本にしつつ他もフォントの切り替えによって利用されていました。 なお、当時はまだ UnicodeNusxuri がありませんでした >>9


[286] 現代ジョージア語で用いられるジョージア文字は33文字あります。 その他に、現行正書法で用いられなくなった5文字があります。 更に、方言や他の言語を表す文字や句読点が数個あります。

[287] ジョージア文字の配列方法は、少なくても2つあります。 >>255

[290] つまり、正書法改革の成果である現代を基準にするか、 正書法改革前から続くジョージア文字の連続性を重視するかの2つの考え方があります。

[524] >>288 寄りの人は、これが教育でジョージア人の誰もが慣れ親しんだものだといいます。 >>255 >>29 寄りの人は、 >>289ジョージア文字アルファベットに寄り添ったものだといいます。 >>19

[291] どこの、どんな言語、どんな文字体系であっても、 文字政策というのは高度に政治的な問題になり得ますが、 ジョージア文字文字コードはとりわけ深刻でした。 ジョージアという民族が、 非常に複雑な時期に情報機器インターネットの普及期を迎えてしまったことにより、 結果として、不運にも、あるいは必然的に、深い混乱を招くことになったのです。

[292] 詳細は本項の主題ではありませんし、事実関係を追うだけでも一苦労なので省きますが、 背景として注意すべき事情を挙げておきます。

[307] こうした背景のもと西暦1990年代に2つの異なる8ビット符号とそれぞれを支持する勢力が対立する状況が生まれました。

[308] ところで厄介なのは、当時ジョージア文字コードに言及した人達が、 多かれ少なかれいずれかの陣営に与する当事者であることです。 ウェブ上に現存する数少ない情報 (そもそも当時から少なかったと思われますが。) の中に、客観的な観測者の報告のような都合の良いものは見当たりません。 (仮に当時ジョージアに滞在していた外国人が記録していたとしても、この混乱した情勢では、必ずしも中立的とは言い難いでしょう。) もしかすると現地にはある程度中立的な記録 (解説の雑誌記事など)紙媒体で残っている可能性は否定できませんが、それを探し出すのも困難です。

[309] ウェブ上に現存する情報を比較するに、著者が嘘はついていないと一応信じることにしても、 自陣営に都合の悪い情報は省いているか曖昧にしているのではないかと思ってしまうこともあります。 時系列が不自然だったり、説明が不十分だったりすることも多く、 偶然のミスや丁寧でないだけとも言い切れない不信感がこの分野全体を覆っています。

[310] それでなくても、数少ない記事の相当数が当時の8ビット符号などで書かれているために、 現在の Webブラウザーでは文字化けしか読めないという惨状です。
[318] 符号名など重要な固有名詞の別名や表記揺れが多く、 同じ文書でも違った表現が使われていたりします。 逆に同じ名称でも微妙に違う符号を指していると思しきことも多く、 対象の同定にも一苦労です。

[311] 要するに、この分野の技術史を正確に理解するには、 現存記事をそのまま読むだけでは問題があり、 入念な史料批判が不可欠です。

MS-DOS の時代#

[20] ソ連領ジョージア、後に独立国ジョージアでは、 半ば頃から計算機が用いられていましたが、 符号化文字集合の標準はありませんでした。 >>19

[21] MS-DOSワープロ ChiWriter がよく使われている時代もありました。 ジョージア利用者達は、自分用の文字集合フォント符号化鍵盤配置を作っていました。 主にロシア(語)の標準を基にして作られていたもので、 符号化は5種類はありました。 >>19

ジョージア科学アカデミーでの技術開発#

[487] それより前の時代から文字符号化の開発は行われていたと BPG 陣営は主張します。 大型計算機などはジョージアにも古い時代から導入されていたかもしれませんから、 あり得ないことではありません。

[302] საქართველოს მეცნიერებათა აკადემიის (Academy of Sciences of Georgia, ASG) の საზოგადოებრივ მეცნიერებათა ინფორმაციის ცენტრისა (Center for Scientific Information in Social and Humanitarian Sciences, CSI-SHS) と გამოთვლითი მათემატიკის ინსტიტუტების მიერ (Institute of Computed Mathematics, ICM) により、 კიბერნეტიკისა და მართვის სისტემების ინსტიტუტების (サイバネティクス制御システムの諸研究所) の関与のもと、 ジョージア語用標準の開発が始められました。 >>266, >>261 CSI-SHSBPG が参画していたようです。 >>266

[27] 日本ではJIS X 0201 (ラテン文字 + 片仮名)、 JIS X 0208 (漢字) が標準化されています。世界各国と比較しても着手の時期として不自然ではありません。

[367] BPG フォントの製作が始まったとされます。 >>358 時代があまりに古く、出典も示されていないため、 ないしの誤りとも考えられますが、 に標準化事業が始まっているならあり得ないともいえません。


[351] Academy of Sciences of Georgia の Center for Scientific Information (CSI) は、 first (Beta) standard を開発しました。 この規格は古い5文字も含む PS の配列を採用していました。 >>266

[353] 具体的にどのような符号だったかは不明です。 BGP 陣営は PS をこの規格の duplicate だと説明しています >>266 が、 後述のように符号の一致は重視せずジョージア文字の配列にしか関心が無さそうなので、 duplicate というのは並び順が同じという意味であって、 符号として同じかどうかはわかりません。

[352] CSI はこの規格を進めませんでした (not forwarded)。 BGP 陣営はその理由を、 ジョージアで使われた most of popular industry standard fonts で古い5文字が設計 (design) されていなかったためとしています。 >>266

[28] BGP 陣営は PS を批判する文脈でこの旧規格を紹介していますから、 否定的に解説しています。 first (Beta) standard というのが実際どの程度の位置付けのものだったのか、 実装はされていたのか、 どのような経緯でこの案が成立し、なぜ良くないと判断されたのかなど詳細の解明が必要です。
[29] この段階で既にいくつかフォントが存在していたことがうかがえますが、 計算機用のものだったのかどうか、 既に計算機に実装されていたのならどのような符号だったのかなども不明です。
[30] 符号上で並んでいるうちの5字が抜けていようと実装上は大した問題にはならないはずです。 5字が使われなくなって数十年が経過し、未実装のフォントも多かったというのなら、 規格の最初の設計時点でも5字が常用されていないことを常識的に知っていたはずで、 それでも敢えて5字込みで並べた可能性が高いように思われます。 だとすると、この時期に既に5字を含める、含めないのイデオロギー的対立が存在し、 含める派よりも含めない派が優勢になってきたという構図を想定できますが、どうでしょうか。

[303] 、 ASG の President Aleksander Tavkhelidze を長とする Presidium of ASG に於いて Scientific Council for Computerization が設立されました。 >>266

[314] (とするのは誤り) から >>266 ないし >>261 の間に、 CSI-SHS と ICM が Scientific Institutes of Georgian Literature, Linguistics, Manuscripts, History etc. (ენათმეცნიერების ინსტიტუტი(言語学研究所), ქართული ლიტერატურის ინსტიტუტი(ジョージア文学研究所), ხელნაწერთა ინსტიტუტი(写本研究所), ისტორიის ინსტიტუტი(歴史研究所), მეცნიერებათა აკადემიის სტამბა(科学アカデミー印刷所), საქართველოს მეცნიერებათა აკადემიის კომპიუტერიზაციის სამეცნიერო საბჭო (ジョージア科学アカデミー計算機化科学評議会) の協力のもと working standard を開発しました。 GeoSCII とも呼ばれています。 >>266

[379] ინფოტექ/აკადემიის სტანდარტი 1989 წლისა >>257 (1989年 InfoTech/Academy 標準) というのはこれを指すと思われます。

[315] これは、 ASCII, ISO/IEC 8859, Academy of Sciences of USSRAlternate KOI の概念に基づいており、 ジョージア文字は現代ジョージア語の "Ilia" layout により ("Ilia" line) ASCII 0x80 から配置されました。 >>266

[354] あるいは MS-DOS 用と Windows 用の2つの作業標準であり、 ASCII, ISO/IEC 8859, Unicode に準拠しているものだとも説明されます。 >>261

[317] 歴史的文章でのみ使われる6字を追加分として含む、39文字のジョージア文字がありました。 >>266

[31] GeoSCIIUnicode準拠するというのはあり得ません。 BGP 陣営のいう Unicode 準拠というのは文字の並び順が同じことを指しているようで、 符号の互換性や規格の歴史的関係性とは無関係と思われます。
[32] 当時のジョージアWindows がどのような経路でいつ移入されたものかは不明ですが、 米国での発売は Windows 1.0Windows 2.0Windows 3.0です。 日本での普及度の感覚では Windows 1.0Windows 2.0 のためにわざわざ MS-DOS 用と異なる規格を開発して標準化するものか疑問がありますが、 ジョージアではどうだったのでしょう。
[33] Alaternate KOI が何を指すのかは不明。 KOI8 AlternativeCP866 系の符号ですが、 Academy of Sciences of USSR符号であるとは説明されていません。 しかし 0x80 からキリル文字を並べていること、他の KOI8 と違ってラテン文字との対応を無視したキリル文字順となっていることは、 GeoSCII と似ています。
[34] ASCIIISO/IEC 8859 の概念に従うとは何を言っているのかはよくわかりません。 0x00 - 0x7FASCII そのままとすることを指すのでしょうか。 0x80 から図形文字を並べることは ISO/IEC 8859 の設計と違います。
[35] 0xC0 から主要な図形文字を並べるのは ISO/IEC 8859Windows-1251, Windows-1252 と整合的です。 Windows 用の作業標準とやらがこの時点で既にあったとするなら、 ISO/IEC 8859 に従うとはそれを指すと理解できます。

[316] Capital (Mtavruli Khutsuri) と regular letters は、 異なる fonts (scriptures) とみなされました。 >>266

[36] 33文字ないし39文字のジョージア文字1組だけを 0x80 から配置したのは、 少し不思議な設計ではあります。右半面をすべて使うなら128 - 39 = 89 文字が残っています。 (もしかすると明言されている以外に句読点異体字も既に割り当てられていた可能性がありますが。)

[37] 常用されているのは1組だけですが、 追加の6字を含めているくらいですから時代の新旧はあまり重要でないはずで、 初期 Unicode のようにもう1組割り当てていても良さそうなものです。

[38] より大きな疑問はキリル文字の扱いで、 ソビエト連邦の1国としてロシア語キリル文字の需要は当時大きかったはずなのに、 89字も空きのままだったとすると不審です。

[39] KOI80xC0 - 0xFE を使っていて、 0x80 - 0xBF は空いていた、ないしは box drawing などに使われていたので、 そこにはめ込んだと考えた方が納得がいきますが、どうなのでしょう。

[355] この作業標準は、「インターネットの前身のBBSシステム」や 「インターネットの初期版」 でも試用されました。 >>261

[40] 「インターネットの前身」というのは当時世界的に行われていたパソコン通信の類でしょうか。 「インターネットの初期版」というのはインターネットメールUSENETニュースあたり (もしかすると UUCP) でしょうか。

PS#

[523] ジョージア国会Webサイトで独自のフォントを配布し、 それを使ったジョージア語法令等の公開を始めました。

[393] 時点で、 ジョージア文字の情報交換用符号が標準化されていないことが問題視されています。 >>392

[327] からにかけて、 Soros Foundation = George Soros Fund と George Guiorganashvili (Department of Informatics of the Parliament of Georgia) = Parliament Service of Information が新規格を開発しました。 >>266

[22] 付文書によると last two years において Open Society Georgian Foundation (OSGF) と Eurasia Foundation は、 ASCIIANSI (ANSIコードページ) を拡張したジョージア(語)標準を開発する company を立ち上げ、作業を行いました。 新規格は政府によって承認されたらしいといいます。 当時これは普及を目指す段階であるように説明がされています。 >>19

[77] また、付の Internet Draft によると、 この規格 geostd8 は、関係者の会合で設置された作業部会で検討され、 秋に再び関係者の会合の場で公式に採択されたもので、 ジョージアISP や政府組織を含む広範囲で支持され、 インターネットコミュニティーにおいてインターネットメールインターネットニュースWWWジョージア語の記述に広く使われているのだと説明されています。 >>75

[23] >>22>>77 は同じ著者によるもので、 >>77 から >>22 への参照もありますが (ただし >>22Internet Archive に現存するのは付のままながら、 が最古で、当時そのままのものかは不明。)、 微妙な内容の食い違いがあります。

[78] geostd8Standartization Commettee of Georgia に承認されました。 >>75

Order No.70 SSP 18.1-98 -- Information Technologies û- 8-bit single-byte coded graphic character set -- Georgian alphabet -- Part II

[79] geostd8法務大臣に承認されました。 >>75

Approved by Ministry of Justice of Georgia û No. 120.013.003.270

[328] これがいわゆる 「PS - Parliament-Soros」 符号化です。 >>266 この呼称は BPG 陣営側が言い始めたもののようにも見えます。

[329] BPG 陣営側は PS 符号化は "Ilia" layout/encoding に従っていないもので、 現代の文字の並びの中に時代遅れの古い文字を混ぜており、 逆コース (retrograde) であるとか、 Soros Foundation の資金力で State Standard を偽装 (pretendent) しているなどと批判していました。 >>266 BPG 陣営側によると、 PS は、 国賊の BPG らによって開発されデファクト標準となっていた InfoTech/Academy 規格に対抗するために作られました。 >>257 BPG 陣営側はかなり強い言葉も使って PS を非難していますが、 その内容はジョージア文字の配置順序に集約でき、 その他は政権や財団に対する批判です。 >>263, >>261, >>257, >>264, >>255


[48] >>19 によると、

  • [51] GeoSCII (extended ASCII for Georgian)
  • [52] ANSI

があり、

  • [49] Governmental Standard
    • [59] Main (Governmental)
  • [50] Alternative Standard
    • [58] Alternative (BPG)

があり、組み合わせで

の4つがあります。

[57] これでは何のことかわかりませんが、次のように解釈できます。

[66] >>19 にはこれらに加えて Unicode も示されていますが、 これらの「標準」のすべてが制定された標準の一部を構成しているのか、 一部分だけが真の「標準」なのかはよくわかりません。

[67] また、 >>19ジョージア文字だけ表に示していますが、 それ以外の領域も「標準」に含まれているのかには言及がなく不明です。 なお、符号表かもしれない画像があったようですが、 残念ながら Internet Archive に所蔵されていません。

[68] 「政府標準」の GeoWINGEORGIAN-PS の中核部分に当たります。 国会Webサイトの配布フォントと一致する形式です。

[525] 「代替標準」の GeoWINGEORGIAN-ACADEMY の中核部分に当たります。

[323] 時点で Alternative GeoWin standard とは BPG-InfoTech realization of "Ilia" layout/encoding fonts and standards のことだと BPG 陣営側も認めています。 >>266 (BPG 陣営側がいうところのデファクト標準が Alternative 呼ばわりされていることに対する含みがありそうな言及です。)

[24] 「代替標準」の GeoSCIIMS-DOS で使われていた BPG 符号と思われます。

[526] 「政府標準」の GeoSCII が使われたことがあるのかは不明です。

[527] ここでの GeoSCIIBPG 陣営のいう GeoSCII (>>314) と同じかどうかわかりません。 ここでいう GeoSCII代替標準のみが BPG 陣営いう GeoSCII のように解釈できます。

[76] Internet Draft に示されたものは微妙に違っています。 Internet Draft にはこの4つの組み合わせは登場せず、唯一、政府標準の GeoWIN に相当するものが Geostd8 に組み込まれています。 >>75

[80] Geostd8 にはその他に、 ASCII の全部と Windows-1252 の一部が含まれています。 >>75

[81] Geostd80x81 - 0x9FWindows-1250 との共通部分なのかラテン文字関係の文字は省かれていますが、 0x80ユーロ記号があり、 0xA0 - 0xBF にはラテン文字関係も含めて Windows-1252 と同じものが入っています。

[82] Geostd80xFD には U+2116 NUMERO SIGN があります。これは Windows-1250 とも Windows-1252 とも違います。 IBM866 では 0xFC にあります。

[571] ジョージアフォントの多くにがあります。ソ連ではそれだけ需要が大きかったのでしょうか。

21世紀#

[83] 107533 - Enable the Georgian Decoder, https://bugzilla.mozilla.org/show_bug.cgi?id=107533


[132] >>131 は「Georgian Browser Muraki」の紹介記事で、

  • Georgian encoding support: Unicode; BPG; SP; ITV; Latin-based, Latin-based0, TITUS Mkhedruli, WordPerfect, FontMonher.
  • Also keyboard Unicode support for searching and creating Unicode websites even on 8-bis systems (e.g. Windows 9x, etc.).
  • Georgian Email support: Automatic detection / conversion of georgian email / website encodings.
  • Georgian spell-checker, Theasures, Grammer check for every regionalized version.

と謳っています。ただしこれは冗談です。

[134] 冗談ではありますが、当時のジョージア人が切望していたものがよくわかります。

[148] >>147 にはスクリーンショットも現存します。当時の IEスクリーンショットの改変です。 viewport に加えて UIジョージア語になっています。 URLドメイン名pathジョージア文字が使われています。

[145] >>143

The preview version of first Georgian-language web browser is available at http://aiet4.tripod.com/opera

としています。残念ながらリンク先は Internet Archive にも所蔵されていませんが、 その移転先は >>149 に残っています。

[146] OperaUnicode に対応すると共に、公式にジョージア語UI が提供されるようになったのがこのときだったようです。

[150] Aiet's Georgian Site - Google in Georgian [en], , https://web.archive.org/web/20030622163800/http://aiet.qartuli.net/google/index.html


[554] BPG は当時の状況を次のようにまとめています。 >>553


[455] ジョージアではの時点でも 「Non-UCS 8-bit fonts with Latin transliteration substitutions」 が広く使われ、ダウンロード可能になっているとされます。 >>454

[456] 8ビットフォントというのがよくわかりませんが、 主に GeoLatinキリル文字用鍵盤系のフォント各種のことを指しているのでしょう。

[457] 実際にこの時代に使われているのは TrueTypeOpenTypeフォントで、 フォント技術的には Unicode ですが、Unicode文字を割り当てずにジョージア文字を割り当てる方式です。

メモ#