ラテン文字

ラテン文字

[1] ラテン文字は、英語独語をはじめとする西欧言語表記に主として用いられる用字系です。 代表的なアルファベットであり、単に「アルファベット」と呼ばれることもあります。 また、ローマ字と呼ばれることもあります。

文字

[12] ラテン文字の分類
[13] 異体字合字ダイアクリティカルマーク付きラテン文字
  • Ââ Āā á à ắ ằ ầ ẩ ɑ ɑ̃ ὰ ά a
  • ç
  • Đđ
  • Êê Ēē é è ê ệ ɛ̃ ὲ έ
  • Îî Īī
  • Ôô Ōō ò ô ố ö ờ o
  • œ̃
  • Ûû Ūū û ư ủ
  • ɔ̃

文脈

[9] ラテン文字の用途

ダイアクリティカルマーク付きラテン文字

[10] 基本ラテン文字でないラテン文字を、 拡張ラテン文字, 改造ラテン文字, ダイアクリティカルマーク付きラテン文字, アクセント付きラテン文字などといいます。

[11] 厳密に言えばダイアクリティカルマークアクセント記号を付けたラテン文字以外にも基本ラテン文字でないラテン文字がいくつかあります。

[18] >>17 では越南語ラテン文字表記に使われるものを「改造ラテン文字」と説明しています。

[23] n441.pdf, , http://std.dkuug.dk/jtc1/sc2/wg3/docs/n441.pdf

[24] AJ1

ラテン文字とそうでない文字の境界

アルファベット

字形設計

[19] Character design standards - Uppercase for Latin 1 - Typography | Microsoft Docs, alib-ms, https://docs.microsoft.com/ja-jp/typography/develop/character-design-standards/uppercase

[20] Character design standards - Lowercase for Latin 1 - Typography | Microsoft Docs, alib-ms, https://docs.microsoft.com/ja-jp/typography/develop/character-design-standards/lowercase

[21] Character design standards - Symbol characters for Latin 1 - Typography | Microsoft Docs, alib-ms, https://docs.microsoft.com/ja-jp/typography/develop/character-design-standards/symbols

フォント

文字画像データ

[22] Tesseractなどで使用できる手書き文字データセット, https://zenn.dev/tfukumori/articles/515b3b39808085#(3)-emnist%253A-%25E8%258B%25B1%25E5%25AD%2597%25E3%2580%2581%25E3%2581%258A%25E3%2582%2588%25E3%2581%25B3%25E6%2595%25B0%25E5%25AD%2597%25E3%2581%25AE%25E6%2589%258B%25E6%259B%25B8%25E3%2581%258D%25E6%2596%2587%25E5%25AD%2597%25E3%2583%2587%25E3%2583%25BC%25E3%2582%25BF%25E3%2582%25BB%25E3%2583%2583%25E3%2583%2588

ラテン文字化した言語における外来語

[27] 国語国字問題ローマ字化論者が外来語について色々言っているが、実際にやるとこういうカオスが出現するんだな。

メモ

[2]

"Latin characters" is a not-precise term for characters historically related to ancient Greek script and currently used throughout the world. <NONE>

The base Latin characters make up the ASCII repertoire and have been augmented by many single and multiple diacritics and quite a few other characters. ISO/IEC 10646 encodes the Latin characters in the ranges U+0020..U+024F, U+1E00..U+1EFF, and other ranges.

[3] RFC 6365 - Terminology Used in Internationalization in the IETF ( 版) http://tools.ietf.org/html/rfc6365#page-34

[4] Requirements for Latin Text Layout and Pagination ( ( 版)) http://www.w3.org/TR/2014/WD-dpub-latinreq-20140313/

[5] Requirements for Latin Text Layout and Pagination ( ( 版)) http://w3c.github.io/dpub-pagination/

[6] Requirements for Latin Text Layout and Pagination ( ( 版)) http://www.w3.org/TR/2014/WD-dpub-latinreq-20140930/

[8] 北京語 - Wikipedia () https://ja.wikipedia.org/wiki/%E5%8C%97%E4%BA%AC%E8%AA%9E

漢字に当てはめられないスラングなどもあり、現代においてはアルファベットで表記されるのが普通である。

[7] 文字セット及び文字数について | 多言語フォント | モリサワのフォント | 株式会社モリサワ () https://www.morisawa.co.jp/fonts/multilingual/character-set/

Pro

(100言語をサポートする独自規格) PE

(ラテン文字、キリル文字、ギリシャ文字、ベトナム語用文字をカバーする独自規格)

[15] teradaさんはTwitterを使っています 「幕末にやってきた外国人が落書きしていったらしい。 書き写した日本人にはアルファベットがこう見えたのだろうか。 ヨミ始め、ヨミ終わりなどと書いてあるので、左から右に読むことは知っていたようだが。 https://t.co/NhVfee1Whk」 / Twitter (午後0:45 · 2021年4月16日 , ) https://twitter.com/terada50397416/status/1382902830457974784

[16] 名苗瑞輝さんはTwitterを使っています 「高校生の頃、手書きでCOBOLやってたんだけど、その時に教わった書き方がまだ癖になってる で、このOやDに横線、IとUは小文字、という書き方はどこ発祥の作法なのか今更気になった https://t.co/va3AUgBwq0」 / Twitter (, ) https://twitter.com/NanaeMizuki/status/1436915637889089536

[28] ラテン文字の barred とか with stroke や with hook のような変形文字が未だに Unicode に新規収録されるのはすごい不思議。他の文字体系だと結合文字とセットで使うことにして新規追加はしない、 とされそうなものなのに。やはり欧文の既得権益なのか?

[29] with actute や with grave のようなラテン文字が既存分以外の新規追加はされていないし、 既存分は正準等価にされているのに、傍線追加系のものがその扱いをされていないのは、 おそらく20世紀末頃のフォント技術だと単純に基底文字の上下に追加する系のもの以外を結合文字とするのは難しかったからだよなあ。 complex script への対応が進んでその制限はなくなったのだから、 ラテン文字だって今後の追加分は complex script 扱いで Unicode 大喜利の対象にして良さそうなものなのに。

[30] superscript や turned みたいなのも後置の結合文字と組み合わせると基底文字が小さくなる、 みたいなのにすればいっぱい追加しなくてもいいはずなのにね。 中央アジア東南アジアあたりでそういう文字体系だったら絶対そうしてるでしょ。 なんでラテン文字はそういう扱いを受けないのかが謎。