文字のようなもの

文字のようなもの

[3] 文字と共に文字のようなものが使われることがあります。

文字と文字以外と

文字, 記号

[32] 文字とは何か

文字とバイト

[10] 20世紀頃は文字バイトの区別が明確になされないことが多くありました。

文字, バイト, オクテット

[35] 中華人民共和国ではバイト字节と訳されています。 バイト

char, 非SGMLデータ実体

[26] URLパーセント符号化のように、文字列の中に escape として (文字escape したものではなく) バイトを埋め込む形のものがあります。

文字列データに出現する文字のようなもの

[187] 文字の処理に出現する文字文字のような情報の例:

[9] 文字文字列を値とするデータ型0-1空文字列などで nullundefinednil のような意味を表すことがあります。


[11] 情報システムでは多くの場合文字コードにある文字 (符号化文字) を第一級文字と考え、それ以外の人間にとっての文字はシステム上の文字とは考えないことが多いです。

[12] それでも符号化文字 (内字) でない文字 (外字) を符号化文字と同じように扱いたいという需要は少なくありません。

[13] そこで第一級文字とまったく同等でもないにせよ、 それに近い扱いができる仕組みが色々考案され、利用されています。 外字


[18] 正規表現などの文字クラスは通常符号化文字1つの集合として定義されますが、 短い文字列空文字列も含めることができる場合があります。

[19] Unicode基底文字結合文字の組合せで表現されるような文字文字クラスに入れて単独の文字と同等に扱わせたいことがあります。


[2] 関連: 文字コードの変換, Unicodeの符号空間, 文字列型, 文字列処理

文字のように見せかけた文字ではないもの

疑似文字

文書システム上の文字と同等のもの

[14] 文書としての文字列を表示したり、編集したりできるシステム (例えば WYSIWYG エディター) では、文字ではないものの、いろいろな操作に関して文字と似たように扱われるオブジェクトが存在する場合があります。

[15] HTML では br, img, video, iframe などが文字と同じように扱われる場面があったりします。

[27] CSS では inline-block など inline 系の display を設定した文字に近い見た目その他の扱いを受けることになります。

[30] TRONコードTAD文字コードとしての側面であり、 TAD文字データ以外であっても画像その他各種のデータを統合的に扱えるハイパーテキスト文書形式となっています。

[20] NAPLPS 等の画像符号化技術は画像 (やその他の媒体) を文字コードと統合的な技術体系で取り扱おうとした試みでした。 その他にも mosaic罫線素片のような画像図形CUI 要素の記述のための文字は多くの文字コード体系に取り込まれています。

[21] ISO/IEC 6429 やその他のエスケープシーケンス技術による制御機能は、 端末印刷機などの制御を文字コードと統合的な技術体系で取り扱っています。

[24] その他にも初期の計算機プラットフォーム文字OSハードウェアの制御命令を同位の構造として扱っていることがありました。

[22] 非SGMLデータ実体への実体参照文字列ではないオブジェクト文字列の中に埋め込める機構です。

[23] XML情報集合では1つの Unicode文字を表現できる文字情報項目は他の要素等の情報項目と同位の情報項目 (オブジェクト) として定義されていました。

[25] 外字系の技術の中には、画像など文字以外のオブジェクトに対して文字 (外字) であるというフラグを付与することで文字に近い扱いを求める形のものもあります。

[29] Webデザインに於いてはアイコンフォントのような形で小さな文字フォントの技術を使って記述することがあります。

[31] 正規表現やそれに類する構文では、文字と並列に文字クラス選択 (|) のような文字(列)の集合を置くことや、 境界 (^, \b など) を置くことができたりします。

[16] リッチテキストに対して検索その他の文字列操作を行うシステムでは、 文字でないオブジェクト文字と並列の機構で扱われることがあります。

[17] Microsoft Word検索機能で使われる正規表現のような構文では、 通常の文字の他に、改行改段落に相当する構造に一致する機能があります。

メモ