[16] 符号化文字集合は、 文字に符号を割り当てたものについての ISO/IEC や JIS などで用いられている用語です。 一般に文字コードと呼ばれるものに当たります (が、文字コードという語はしばしば曖昧に用いられます)。
[24] Unicode に統一された現在ではほとんど意味のない用語となりました。
- JIS X 0211‐1994 4.2.18 符号化文字集合 (coded character set), 符号 (code)
- 文字集合を定め、かつ、その集合内の文字とビット組合せを1対1に関係付ける、 あいまいでない規則の集合。
- 符号化文字集合 (coded character set), 符号 (code)
- 文字集合を定め、かつ、 その集合内の文字とビット組合せを1対1に関係付ける、 あいまいでない規則の集合。
- 参考
符号化文字集合と符号とは、交換可能な用語である。例えば、7ビット符号化集合と7ビット符号と、同じ意味である。 JIS X 0202:1998 4.5- 注意: この
参考は、 JIS X 0202 が ISO/IEC 2022 に対して追加した部分です。
- 符号化文字集合 (coded character set)
- 文字集合及びその集合の文字と符号化表現との間の関係を定めるあいまいさのない規則の集合。 (JIS X 0221‐1:2001 4.9)
A coded character set (CCS) is a set of unambiguous rules that establishes a character set and the relationship between the characters of the set and their coded representation. <ISOIEC10646>
[8] 符号化文字集合と符号が同義というのはどうも納得いかないんだけど、そういう定義である以上 (ISO/IEC や JIS の文脈では) この2つは「交換可能な用語」です。
[7] 交換したら符号化文字集合
が符号化文字集合化文字集合
になってしまいましたが・・・
[6] 業界的に再帰(謎)ですね。。。
[17] IETF での符号化文字集合の定義は、 ISO/IEC の定義と同じようで若干の違いがあります。 IETF ではしばしば符号化文字集合と対になる概念として文字符号化方式を用います。 前者を CCS、後者を CES と略します。 CCS は文字と符号を対応付けるものですが、 CES はその符号を更に別の符号へと対応付けます。 一般的に文字コードと呼ばれるものは、 CCS と CES の組み合わせとされています。
[18] 例えば一般的に UTF-8 と呼ばれる文字コードは、 Unicode Standard によって定義される文字と符号位置の組み合わせから成る CCS と、 Unicode Standard によって定義される符号位置から UTF-8 のオクテット列の対応関係から成る CES の組み合わせと理解されます。
[11] RFC 6365 - Terminology Used in Internationalization in the IETF ( 版) <http://tools.ietf.org/html/rfc6365#page-7>
[13] RFC 2277 - IETF Policy on Character Sets and Languages ( ( 版)) <http://tools.ietf.org/html/rfc2277#section-3>
[19] 符号化文字集合は、符号化文字の集合ですが、 数学的な意味の集合とは厳密には異なり、やや特異な性質を持っています。
[20] 集合の要素である「符号化文字」は、 文字を符号化したものです。つまり、符号化文字集合の要素には数値が割り振られています。 通常はこの数値と文字は一対一対応しますが (重複符号化の禁止の原則)、 これが成立していないケースがあります。
[21] また集合の要素である「符号化文字」の定義はしばしば曖昧で、 重複符号化でなくとも、2つの符号化文字の区別が曖昧だったり、 ある文字がどちらで符号化できるのか (どちらでもできないのか) 明確にされていないこともあります。
[22] 更に、符号化文字集合には私用域や未割り当ての符号位置が含まれることがあります。 つまり集合の要素が文脈により変化したり、存在しない (が複数あっても互いには区別される) ものだったりします。
[23] 符号拡張法を用いた文字コードのことも符号化文字集合と呼ぶことがありますが、 その場合そもそも集合と言えるものかどうかも怪しいところです。
[15] Character Model for the World Wide Web 1.0: Fundamentals ( ( 版)) <http://www.w3.org/TR/charmod/#def-CCS>