文字のようなもの

文字のようなもの

[3] 文字と共に文字のようなものが使われることがあります。

文字と文字以外と

文字, 記号

文字とバイト

[10] 20世紀頃は文字バイトの区別が明確になされないことが多くありました。

文字, バイト, オクテット

char, 非SGMLデータ実体

文字列データに出現する文字のようなもの

[187] 文字の処理に出現する文字文字のような情報の例:

[9] 文字文字列を値とするデータ型0-1空文字列などで nullundefinednil のような意味を表すことがあります。


[11] 情報システムでは多くの場合文字コードにある文字 (符号化文字) を第一級文字と考え、それ以外の人間にとっての文字はシステム上の文字とは考えないことが多いです。

[12] それでも符号化文字 (内字) でない文字 (外字) を符号化文字と同じように扱いたいという需要は少なくありません。

[13] そこで第一級文字とまったく同等でもないにせよ、 それに近い扱いができる仕組みが色々考案され、利用されています。 外字


[18] 正規表現などの文字クラスは通常符号化文字1つの集合として定義されますが、 短い文字列空文字列も含めることができる場合があります。

[19] Unicode基底文字結合文字の組合せで表現されるような文字文字クラスに入れて単独の文字と同等に扱わせたいことがあります。


[2] 関連: 文字コードの変換, Unicodeの符号空間, 文字列型, 文字列処理

文字のように見せかけた文字ではないもの

疑似文字

文書システム上の文字と同等のもの

[14] 文書としての文字列を表示したり、編集したりできるシステム (例えば WYSIWYG エディター) では、文字ではないものの、いろいろな操作に関して文字と似たように扱われるオブジェクトが存在する場合があります。

[15] HTML では br, img, video, iframe などが文字と同じように扱われる場面があったりします。

[16] リッチテキストに対して検索その他の文字列操作を行うシステムでは、 文字でないオブジェクト文字と並列の機構で扱われることがあります。

[17] Microsoft Word検索機能で使われる正規表現のような構文では、 通常の文字の他に、改行改段落に相当する構造に一致する機能があります。

メモ