文字

文字 (一般名詞)

[6] 文字 (もじ) (character) は、言語の表記に用いる記号の類の単位であっておおよそ最小単位と考えられるもの、 あるいはそれを符号化したもの、あるいはその符号化したものを表現することを主な目的としたビット組合せのことをいいます。

[7] 極めて基本的な用語であるにも関わらず、あるいは基本的な用語であるからこそ、 「文字」には様々な定義が存在し、曖昧に使われています。

色々な意味

[1] RFC 3536 は「文字 (character) 」は少なくても3通りの意味で使われていて、 最初の2つであることが多いと述べています。

  • [2] a general description of a text entity
  • [3] a unit of a writing system, often synonymous with "letter" or similar terms
  • [4] the encoded entity itself

[5] RFC 3536 自体では (IETF では) ISO/IEC 10646 でいう「文字」の定義が採用されています。 ここでいうと >>2 でしょうか。 >>4符号化文字でしょうかね。

[15] 制御文字私用域符号位置のように、 日常的な意味の文字ではない文字もあります。

[14] 符号位置のことを便宜上文字ということもあります。 その場合、未割当の符号位置非文字サロゲートの片割れなども文字と呼ぶことがあります。

種別

[23] 書字体系

[25] 用途による分類
[26] 文字特性
[32] 文字とは何か

符号化

[20] 文字コード参照。

レンダリング

[16] 文字のレンダリング参照。

セキュリティー

[21] 文字のセキュリティー参照。

応用

[29] 文字応用

歴史

[8] Web Applications 1.0 r6648 Try to tidy up some more of the Unicode/code unit mess with a probably over-reaching definition (there's over 2000 uses of the word 'character' in the text, so I didn't check that all of them use this new definition... hopefully it works out; otherwise, we'll just have to try something else again). ( ( 版)) http://html5.org/tools/web-apps-tracker?from=6647&to=6648

[9] RFC 6365 - Terminology Used in Internationalization in the IETF ( 版) http://tools.ietf.org/html/rfc6365#page-6

[10] IRC logs: freenode / #whatwg / 20140328 ( ( 版)) http://krijnhoetmer.nl/irc-logs/whatwg/20140328#l-591

[11] XQuery and XPath Data Model 3.0 ( ( 版)) http://www.w3.org/TR/xpath-datamodel-3/#dt-character

[12] XPath and XQuery Functions and Operators 3.0 ( ( 版)) http://www.w3.org/TR/xpath-functions-3/#character

[13] Character Model for the World Wide Web 1.0: Fundamentals ( ( 版)) http://www.w3.org/TR/charmod/#sec-PerceptionsIntro

[17] XQuery and XPath Data Model 3.1 () https://www.w3.org/TR/2017/REC-xpath-datamodel-31-20170321/#dt-character

[18] XPath and XQuery Functions and Operators 3.1 () https://www.w3.org/TR/2017/REC-xpath-functions-31-20170321/#character

[19] Editorial: let code point and friends be defined by Infra (annevk著, ) https://github.com/whatwg/html/commit/59595d9c2ccadb9332c15048be5d30174532ee70

[24] 絹と立方体

[22] SSML 1.0 say-as attribute values () https://www.w3.org/TR/2005/NOTE-ssml-sayas-20050526/#charstring

[27] 悪筆文字の定量化とその構造的特徴 () http://www2.lib.yamagata-u.ac.jp/kiyou/kiyouh/kiyouh-15-1/image/kiyouh-15-1-w085to097.pdf

[28] GICAS: Grammatological Informatics based on Corpora of Asian Scripts, http://www.gicas.jp/index.html

[30] #3486. 固有の文字を発明しなかったとしても……, , http://user.keio.ac.jp/~rhotta/hellog/2018-11-12-1.html

日本語固有の文字と主張されてきた「神代文字」を否定した直後に,沖森 (33--34) は次のようなフォローの文章を続けている.

自らが使用する言語に固有の文字があることを願う気持ちは,自然な心情としてそれなりに理解できます.しかし,ギリシア文字がフェニキア文字に由来すること,そのギリシア文字からラテン文字が作り出されたことなどからわかるように,ほかの言語の文字に工夫を加えて,自らの言語に適した文字を作り上げていくというのも自然の流れですし,むしろ世界の言語における文字成立の由来としてはその方が圧倒的に多いのです.ですから,固有の文字体系がないという劣等感を持つ必要はまったくありませんし,それよりも,工夫を凝らして自らの言語をしっかりと書き記せる文字を成立させたことを誇りに思ってよいのです.

この議論は,世界的な言語である英語の歴史で考えてみても通用する.英語には固有の文字はない.

[31] 「アイヌ語には文字はない(現在形)」 というデマもこうした「気持ち」の裏返しなのだろうか。