[6] [DFN[[RUBY[文字][もじ]@en[character]]]]は、[[言語]]の表記に用いる[[記号]]の類の[[単位]]であっておおよそ最小単位と考えられるもの、
あるいはそれを[[符号化]]したもの、あるいはその[[符号化]]したものを表現することを主な目的とした[[ビット組合せ]]のことをいいます。

[7] 極めて基本的な用語であるにも関わらず、あるいは基本的な用語であるからこそ、
「[[文字]]」には様々な定義が存在し、曖昧に使われています。

* 色々な意味

[1] [[RFC 3536]] は「[DFN[[RUBYB[文字]@en[character]]]]」は少なくても3通りの意味で使われていて、
最初の2つであることが多いと述べています。

>
- [2] a general description of a text entity
- [3] a unit of a writing system, often synonymous with "letter" or similar terms
- [4] the encoded entity itself

[5] [[RFC 3536]] 自体では ([[IETF]] では) [[ISO/IEC 10646]] でいう「[[文字]]」の定義が採用されています。
ここでいうと >>2 でしょうか。 >>4 は[[符号化文字]]でしょうかね。

[15] [[制御文字]]や[[私用域]]の[[符号位置]]のように、
日常的な意味の[[文字]]ではない[[文字]]もあります。

[14] [[符号位置]]のことを便宜上[[文字]]ということもあります。
その場合、未割当の[[符号位置]]、[[非文字]]、[[サロゲート]]の片割れなども[[文字]]と呼ぶことがあります。

[SEE[ [[文字のようなもの]] ]]

* 種別

[23] [SEE[ [[書字体系]] ]]

[FIG(short list)[ [25] 用途による分類
- [[文字][letter]]
- [[数字]]
- [[発音区別符]]
- [[句読点]]
- [[記号]]
- [[音符]]
- [[絵文字]]
- [[疑似文字]]

]FIG]

[FIG(short list)[ [26] [[文字]]の[[特性]]
- [[画数]]
- [[幽霊文字]]
]FIG]

[33] [[文字のようなもの]]も参照。

* 符号化

[20] 
[[文字コード]]参照。

* 処理

[SEE[ [[文字列処理]] ]]


* レンダリング

[16] [[文字のレンダリング]]参照。

* セキュリティー

[21] [[文字のセキュリティー]]参照。

* 応用

[FIG(short list)[ [29] [[文字]]の[[応用]]
- [[顔文字]]
- [[AA]]

]FIG]

* 歴史

[8] [CITE@en[Web Applications 1.0 r6648 Try to tidy up some more of the Unicode/code unit mess with a probably over-reaching definition (there's over 2000 uses of the word 'character' in the text, so I didn't check that all of them use this new definition... hopefully it works out; otherwise, we'll just have to try something else again).]]
( ([TIME[2011-10-07 08:24:00 +09:00]] 版))
<http://html5.org/tools/web-apps-tracker?from=6647&to=6648>

[9] [CITE@en[RFC 6365 - Terminology Used in Internationalization in the IETF]]
([TIME[2011-09-10 19:11:51 +09:00]] 版)
<http://tools.ietf.org/html/rfc6365#page-6>

[10] [CITE[IRC logs: freenode / #whatwg / 20140328]]
( ([TIME[2014-03-30 01:03:25 +09:00]] 版))
<http://krijnhoetmer.nl/irc-logs/whatwg/20140328#l-591>

[11] [CITE@en[XQuery and XPath Data Model 3.0]]
( ([TIME[2014-04-08 07:00:06 +09:00]] 版))
<http://www.w3.org/TR/xpath-datamodel-3/#dt-character>

[12] [CITE@EN[XPath and XQuery Functions and Operators 3.0]]
( ([TIME[2014-04-08 07:02:07 +09:00]] 版))
<http://www.w3.org/TR/xpath-functions-3/#character>

[13] [CITE@en[Character Model for the World Wide Web 1.0: Fundamentals]]
( ([TIME[2005-02-15 14:24:00 +09:00]] 版))
<http://www.w3.org/TR/charmod/#sec-PerceptionsIntro>

[17] [CITE@en[XQuery and XPath Data Model 3.1]]
([TIME[2017-03-20 07:26:25 +09:00]])
<https://www.w3.org/TR/2017/REC-xpath-datamodel-31-20170321/#dt-character>

[18] [CITE@EN[XPath and XQuery Functions and Operators 3.1]]
([TIME[2017-03-21 16:02:06 +09:00]])
<https://www.w3.org/TR/2017/REC-xpath-functions-31-20170321/#character>

[19] [CITE@en[Editorial: let code point and friends be defined by Infra]]
([[annevk]]著, [TIME[2017-03-29 17:47:15 +09:00]])
<https://github.com/whatwg/html/commit/59595d9c2ccadb9332c15048be5d30174532ee70>

[24] [CITE[絹と立方体]]


[22] [CITE@en[SSML 1.0 say-as attribute values]]
([TIME[2018-10-09 22:31:33 +09:00]])
<https://www.w3.org/TR/2005/NOTE-ssml-sayas-20050526/#charstring>

[27] [CITE[悪筆文字の定量化とその構造的特徴]]
([TIME[2002-03-22 02:20:04 +09:00]])
<http://www2.lib.yamagata-u.ac.jp/kiyou/kiyouh/kiyouh-15-1/image/kiyouh-15-1-w085to097.pdf>

[28] [CITE[GICAS: Grammatological Informatics based on Corpora of Asian Scripts]], [TIME[2016-07-19 23:55:30 +09:00]] <http://www.gicas.jp/index.html>


[30] [CITE@ja[#3486. 固有の文字を発明しなかったとしても……]], [TIME[2023-01-25T23:53:15.000Z]], [TIME[2023-09-08T05:11:30.237Z]] <http://user.keio.ac.jp/~rhotta/hellog/2018-11-12-1.html>

>[SNIP[]]日本語固有の文字と主張されてきた「神代文字」を否定した直後に,沖森 (33--34) は次のようなフォローの文章を続けている.
>>    自らが使用する言語に固有の文字があることを願う気持ちは,自然な心情としてそれなりに理解できます.しかし,ギリシア文字がフェニキア文字に由来すること,そのギリシア文字からラテン文字が作り出されたことなどからわかるように,ほかの言語の文字に工夫を加えて,自らの言語に適した文字を作り上げていくというのも自然の流れですし,むしろ世界の言語における文字成立の由来としてはその方が圧倒的に多いのです.ですから,固有の文字体系がないという劣等感を持つ必要はまったくありませんし,それよりも,工夫を凝らして自らの言語をしっかりと書き記せる文字を成立させたことを誇りに思ってよいのです.
> この議論は,世界的な言語である英語の歴史で考えてみても通用する.英語には固有の文字はない.[SNIP[]]

[31] 
「アイヌ語には文字はない(現在形)」
というデマもこうした「気持ち」の裏返しなのだろうか。


[34] 
[CITE@en[Signs on Stone Age objects: Precursor to written language dates back 40,000 years | Universität des Saarlandes]], [[Universität des Saarlandes]], [TIME[2026-02-25T09:34:38.000Z]] <https://www.uni-saarland.de/en/news/steinzeit-zeichen-44061.html>


[32] 
[CITE@ja[Xユーザーの平川哲生 Tetsuo Hirakawaさん: 「またまた……と思ったらソースがガチでびっくり。 人類学&計算言語学のめちゃくちゃ重要な転換点になる、画期的な論文! https://t.co/R0tZM5VLkm https://t.co/PDnKbWuii1」 / X]], [TIME[午後8:44 · 2026年2月24日][2026-02-24T11:44:31.000Z]], [TIME[2026-02-25T06:59:58.000Z]] <https://x.com/bokuen/status/2026261956462834088>


[35] 
[CITE@ja[4万年前の遺物から見つかった記号、古代文字の前身の可能性 新研究(1/2) - CNN.co.jp]], [TIME[2026-02-26T07:38:21.000Z]] <https://www.cnn.co.jp/fringe/35244340.html?ref=rss>
