符号化文字集合 (文字コード)

[16] 符号化文字集合 (coded character set) は、文字に符号 (コード) を割り当てたものについての ISO/IEC や JIS などで用いられている用語です。一般に文字コードと呼ばれるものに当たります (が、文字コードという語はしばしば曖昧に用いられます)。

[24] Unicode に統一された現在ではほとんど意味のない用語となりました。

ISO における定義

[4]

JIS X 0211‐1994 4.2.18 符号化文字集合 (coded character set), 符号 (code)
文字集合を定め、かつ、その集合内の文字とビット組合せを1対1に関係付ける、あいまいでない規則の集合。

[5]

符号化文字集合 (coded character set), 符号 (code)
文字集合を定め、かつ、その集合内の文字とビット組合せを1対1に関係付ける、あいまいでない規則の集合。
参考符号化文字集合と符号とは、交換可能な用語である。例えば、7ビット符号化集合と7ビット符号と、同じ意味である。 JIS X 0202:1998 4.5
注意: この参考は、 JIS X 0202 が ISO/IEC 2022 に対して追加した部分です。

[1]

符号化文字集合 (coded character set)
文字集合を定め、かつ、その集合内の文字とビット組合せを 1対1に関係付ける、あいまいでない規則の集合。
参考符号化文字集合と符号とは、交換可能な用語である。例えば、7ビット符号化文字集合と7ビット符号とは、同じ意味である。 JIS X 0201:1997 3.12

[3]

符号化文字集合 (coded character set)
文字集合及びその集合の文字と符号化表現との間の関係を定めるあいまいさのない規則の集合。 (JIS X 0221‐1:2001 4.9)

[9]

A coded character set (CCS) is a set of unambiguous rules that establishes a character set and the relationship between the characters of the set and their coded representation. <ISOIEC10646>

[10] RFC 3536 - Terminology Used in Internationalization in the IETF (2011-01-29 02:14:52 +09:00 版) <http://tools.ietf.org/html/rfc3536#page-5>

[8] 符号化文字集合と符号が同義というのはどうも納得いかないんだけど、そういう定義である以上 (ISO/IEC や JIS の文脈では) この2つは「交換可能な用語」です。

[7] 交換したら符号化文字集合が符号化文字集合化文字集合になってしまいましたが・・・

[6] 業界的に再帰(謎)ですね。。。

IETF における定義

[17] IETF での符号化文字集合の定義は、 ISO/IEC の定義と同じようで若干の違いがあります。 IETF ではしばしば符号化文字集合と対になる概念として文字符号化方式を用います。前者を CCS、後者を CES と略します。 CCS は文字と符号を対応付けるものですが、 CES はその符号を更に別の符号へと対応付けます。一般的に文字コードと呼ばれるものは、 CCS と CES の組み合わせとされています。

[18] 例えば一般的に UTF-8 と呼ばれる文字コードは、 Unicode Standard によって定義される文字と符号位置の組み合わせから成る CCS と、 Unicode Standard によって定義される符号位置から UTF-8 のオクテット列の対応関係から成る CES の組み合わせと理解されます。

[2]

符号化文字集合 (coded character set)
整数の部分集合が変域であって、文字レパートリが値域である関数。ある整数の集合が存在して、符号化文字集合とその集合中の整数が文字を決定する。逆に文字と符号化文字集合が符号位置を決定する。 (まれに、一つではなく幾つかの符号位置になることもある。) (RFC 1866, ISO‐HTML <http://purl.org/NET/ISO+IEC.15445/15445.html#DEFS> 4.6)

[11] RFC 6365 - Terminology Used in Internationalization in the IETF (2011-09-10 19:11:51 +09:00 版) <http://tools.ietf.org/html/rfc6365#page-7>

[12]

A Coded Character Set (CCS) is a mapping from a set of abstract characters to a set of integers. Examples of coded character sets are ISO 10646 [ISO-10646], US-ASCII [ASCII], and ISO-8859 series [ISO-8859].

RFC 2130 - The Report of the IAB Character Set Workshop held 29 February - 1 March, 1996 (2011-09-04 12:12:00 +09:00 版) <http://tools.ietf.org/html/rfc2130#page-8>

[13] RFC 2277 - IETF Policy on Character Sets and Languages ( (2011-11-20 13:18:05 +09:00 版)) <http://tools.ietf.org/html/rfc2277#section-3>