[1] [[日本語]]で使われる[[文字]]をまとめて[DFN[[[日本語文字]]]]と言うことがあります。

* 日本語文字を構成する用字系

[3] [[日本語文字]]を構成する[[用字系]]には、次のものがあります。

[FIG(list middle)[ [11] (現代)[[日本語文字]]
- [4] [[平仮名]]
- [5] [[片仮名]]
- [6] [[漢字]]
- [7] [[アラビア数字]]
- [8] [[ローマ字]] ([[ラテン文字]])
- [[句読点]]
- [[変体仮名]]
- [[返り点]] ([[漢文]])
- [[ギリシャ文字]] ([[数学]]など)
- [[梵字]] ([[仏教]]など)
- 特別な[[ラテン文字]]
-- [[IPA]] [[発音記号]]
-- [[ローマ数字]] ([[時計]]、記号としてなど)
- [[漫符]]
- [9] その他[[記号]]など
]FIG]

[20] 
特殊なもの:
[[日本語新字]],
[[神代文字]],
[[速記文字]],
[[点字]],
[[絵暦文字]],
[[めくら帳数字]]

[26] 
[[方言]]については[[日本語方言]]の各項を参照。特に[[琉球諸語]]については[[琉球諸語]]を参照。


* 用字系符号

[2] [[ISO]] の[[用字系符号]]では [DFN[[CODE[[[Jpan]]]]]] が[[日本語文字]]に割り当てられています。

* 組版規則

[12] [[日本語文字]]を使った[[組版]]の特徴的な機能には、次のものがあります。
[FIG(short list)[
- [[縦組み]]
- [[ルビ]]
- [[圏点]]
- [[割注]]
- [[左横書き]]
- [[右横書き]]
- [[縦中横]]
- [[禁則処理]]
- [[囲み文字]]
]FIG]

[18] 
[[Webページ]]で[[右横書き]]する方法: [[右横書き]]

* グリフ

[13] [[計算機]]の[[画面]]上での視認性を考慮した実用的な[[日本語文字]]の[[フォント]]は、
[[グリフ]]の設計で次の事項に配慮するべきと思われます。

[FIG(list)[
- [14] [[漢字]]の「二」と[[片仮名]]の「ニ」の区別が付きやすいこと
-- どちらも[[読み]]が「[[に]]」であり、[[入力]]時にどちらが選ばれているか特にわかりにくい
- [15] [[濁点]]と[[半濁点]]の区別が付きやすいこと
- [16] [[長音記号]]「ー」と[[負]]の[[符号]]「-」と[[ダッシュ]]「―」の区別が付きやすいこと
]FIG]

[17] [[固定幅フォント]]や [[2ch]] 式 [[AA]] 用の[[フォント]]のように、
各[[グリフ]]の[[幅]]が特定の大きさであることが求められる場合もあります。

* 文字コード

[HISTORY[
[10] [[Unicode]] 以前は次の[[文字コード]]が使われていました。

[FIG(short list)[
- [CODE[iso-2022-jp]]
- [CODE[euc-jp]]
- [CODE[shift_jis]]
- [[EBCDIK]]
- [[TRONコード]]
]FIG]
]HISTORY]

[25] 
関連:
[[情報システムにおける神代文字]]

* プロトコル

[22] [[コーパスのタグセット]]

* 表記法

[SEE[ [[現代日本語]] ]]

* 日本語文字としてのラテン文字

[28] 
[[日本語ローマ字]]

[27] 
[CITE@ja[目的の登記にローマ字を含む語句を用いることについて(通知) 法務省民商第2365号 平成14年10月7日 – touki 2030]], [TIME[2025-02-26T03:48:06.000Z]] <https://shihoshoshi.com/touki2030/archives/1969>



* メモ

[29] 
日本の文字文化は、漢字とひらがな、カタカナという三種類の文字体系が長い間共存し、さらにそれぞれに多くの異体字や表記のバリエーションが存在します。漢字と仮名の組み合わせ方も、時代や地域、流派によって様々です。

[30] 
こうした多様性は、政府が強力に文字表記の標準化を推進することなく、むしろ文化的な「余白」を残す形で長く維持されてきました。標準化が行われなかったために、表記の自由度が高く、地域や個人の特色が文字の使い方に反映されてきたのです。

[31] 
[[中華王朝]]や[[朝鮮]]、[[蒙古]]といった大陸の国家では、文字の統一や新たな文字の制定が政治的な統制や文化的統一のために国家主導で積極的に行われました。
具体的には、

- [32] [[秦]]の[[始皇帝]]による[[小篆]]への統一
- [33] [[唐]]の[[開成石経]]による標準字体の公示
- [34] [[清]]の[CITE[康煕字典]]の編纂
- [36] [[元]]の[[パスパ文字]]の制定
- [35] [[李氏朝鮮]]の[[世宗大王]]による[[訓民正音]]の制定

といったものがその代表例です。これらの国家は、広大な領土を効率的に統治し、官僚制度を円滑に運営するために、文字の統一を重要な政策課題としました。

[37] 
一方で[[日本]]では、中央集権体制の度合いや社会構造の違いにより、文字の統一を強制する政治的必要性が高くはありませんでした。日本は地方や集団ごとに慣習や文化が異なる分散的な社会構造を持っており、その結果、日本では多様な書体や表記法が自然に許容され、多様性を尊重する文化が形成されました。書道や文学においても、ひとつの「正しい」書き方を押し付けるのではなく、豊かな表現の幅が評価されてきました。このことは、日本文化全体の基本的な価値観である「多様性を受け入れ、柔軟に独自の発展を遂げる」姿勢を反映しています。

[38] 
[[日本]]でも[[天武天皇]]は[[新字]]を制定したと[CITE[日本書紀]]に記録されていますが、
その詳細は伝わりません。[[江戸時代]]には[[御家流]]が普及しましたが、それとて[[江戸幕府]]の政治的影響力から自然に普及した[[デファクト標準]]に過ぎず、
政策として強制されたものではありませんでした。



[19] [CITE@ja[㆑さんはTwitterを使っています: 「漢字仮名交じり文斜め読みの原理はこれだったのかもしれない 逆に、これが浸透するとディスレクシアへの影響が気になる まで妄想した」 / Twitter]], [TIME[2022-06-14T03:37:39.000Z]], [TIME[2022-06-14T03:47:25.383Z]] <https://twitter.com/Wartemeinnicht/status/1527326935260737536>


- [23] [CITE@ja[Xユーザーのなぎせ ゆうきさん: 「今気づいたけど、現代の公的な発行物で変体仮名が使われている稀有な事例なのでは🤔」 / X]], [TIME[午後3:26 · 2024年1月29日][2024-01-29T06:26:27.000Z]], [TIME[2024-02-07T02:27:45.000Z]] <https://twitter.com/nagise/status/1751854301256044772>
- [21] [CITE@ja[Xユーザーのくろょさん: 「@nagise @naka_aki_spl いつぞやのカルチャーラジオで言ってましたが、弐千円札には日本で使われてきたほとんど全ての書体が入ってるらしいですよ。隷書・篆書・草書・行書・楷書・仮名、だったかな(かなりうろおぼえ)。」 / X]], [TIME[午後9:04 · 2024年1月29日][2024-01-29T12:04:20.000Z]], [TIME[2024-02-07T02:27:45.000Z]] <https://twitter.com/yoroyoro_kuroyo/status/1751939328559972627>

[24] 
[[ラテン文字]] ([[英語]]、[[日本語ローマ字]])、[[欧州数字]]までかいてある