漢字コード

文字集合 (文字)

[2] 文字集合 (character set) は、文字集合です。

意味

[3] しばしば「文字コード」の意味で用いられます。 charset と略すことが非常によくあります。 charset

[4] そうでなければ多くの場合文字集合符号化文字集合やそれに類するもののことを指しています。 符号化文字集合, CIDFont

[5] いずれにせよ、文字集合は単なる文字の (数学的な) 集合ではなく、 やや特殊な性質を持っています。

[7] 稀に、文字通り文字の集合の意味のこともあります。 明確に示すため文字クラスなど他の用語を使うことが多いようです。 文字クラス

[8] なお、文字コード分野の専門用語で純粋な文字の集合に近い意味の言葉としてレパートリがあります。 (ただし専門的過ぎてあまり一般的ではありません。)

漢字集合

[6] 漢字集合は、特に漢字を含む文字集合です。 JIS X 0208 など非漢字を含んでいても、全体として漢字集合と呼ばれることがあります。 漢字集合文字コード漢字コードともいいます。

漢字表, 文字コード

[9] Windows 3.1, https://zsigri.tripod.com/fontboard/cjk/win31.html#cp40demo

TwinBridge Chinese Partner 4.0

LanguageR/W 8-bitView 7-bit
Traditional ChineseBIG5, BIG5CJK, TBCJK -
Simplified ChineseGB (= EUC-CN), GBCJK, TBCJK HZ

TwinBridge Japanese Partner 4.0

Supported character sets and encoding forms: 8-bit encoded EUC-JP, Shift-JIS, TBCJK, JISCJK and SJISCJK.

歴史

SGML での定義

[1]

各々の文字が符号化表現で関連付けられるような符号集合に割り当てられた文字レパートリ。 (JISX4151‐1992 (276))