[3] 文字と共に文字のようなものが使われることがあります。
[10] 20世紀頃は文字とバイトの区別が明確になされないことが多くありました。
[35]
中華人民共和国ではバイトが字节と訳されています。
[26] URL のパーセント符号化のように、文字列の中に escape として (文字を escape したものではなく) バイトを埋め込む形のものがあります。
[187] 文字の処理に出現する文字や文字のような情報の例:
BOM[9] 文字や文字列を値とするデータ型で 0 や -1 や空文字列などで null や undefined や nil のような意味を表すことがあります。
[11] 情報システムでは多くの場合文字コードにある文字 (符号化文字) を第一級の文字と考え、それ以外の人間にとっての文字はシステム上の文字とは考えないことが多いです。
[12] それでも符号化文字 (内字) でない文字 (外字) を符号化文字と同じように扱いたいという需要は少なくありません。
[13]
そこで第一級の文字とまったく同等でもないにせよ、
それに近い扱いができる仕組みが色々考案され、利用されています。
[18] 正規表現などの文字クラスは通常符号化文字1つの集合として定義されますが、 短い文字列や空文字列も含めることができる場合があります。
[2] 関連: 文字コードの変換, Unicodeの符号空間, 文字列型, 文字列処理
[14] 文書としての文字列を表示したり、編集したりできるシステム (例えば WYSIWYG エディター) では、文字ではないものの、いろいろな操作に関して文字と似たように扱われるオブジェクトが存在する場合があります。
[27]
CSS では inline-block など inline 系の display
を設定した箱が文字に近い見た目その他の扱いを受けることになります。
[30] TRONコードは TAD の文字コードとしての側面であり、 TAD は文字データ以外であっても画像その他各種のデータを統合的に扱えるハイパーテキスト文書形式となっています。
[20] NAPLPS 等の画像符号化技術は画像 (やその他の媒体) を文字コードと統合的な技術体系で取り扱おうとした試みでした。 その他にも mosaic や罫線素片のような画像、図形、CUI 要素の記述のための文字は多くの文字コード体系に取り込まれています。
[21] ISO/IEC 6429 やその他のエスケープシーケンス技術による制御機能は、 端末や印刷機などの制御を文字コードと統合的な技術体系で取り扱っています。
[24] その他にも初期の計算機プラットフォームは文字と OS やハードウェアの制御命令を同位の構造として扱っていることがありました。
[22] 非SGMLデータ実体への実体参照は文字列ではないオブジェクトを文字列の中に埋め込める機構です。
[23] XML情報集合では1つの Unicode文字を表現できる文字情報項目は他の要素等の情報項目と同位の情報項目 (オブジェクト) として定義されていました。
[25] 外字系の技術の中には、画像など文字以外のオブジェクトに対して文字 (外字) であるというフラグを付与することで文字に近い扱いを求める形のものもあります。
[29] Webデザインに於いてはアイコンフォントのような形で小さな絵を文字やフォントの技術を使って記述することがあります。
[31]
正規表現やそれに類する構文では、文字と並列に文字クラスや選択 (|)
のような文字(列)の集合を置くことや、
境界 (^, \b など) を置くことができたりします。
[16] リッチテキストに対して検索その他の文字列操作を行うシステムでは、 文字でないオブジェクトが文字と並列の機構で扱われることがあります。