[1] [DFN[[RUBY[符号化済文字][ふごうかずみもじ][(en)coded character]]]]は、
[[符号化文字集合]]における ([[符号化]]された) [[文字]]です。

* 仕様書

[REFS[
- [44] [CITE[[[The Unicode Standard]], Version 13.0 - ch02.pdf]], [TIME[2020-03-09T17:53:32.000Z]], [TIME[2020-12-20T08:35:03.323Z]] <https://www.unicode.org/versions/latest/ch02.pdf#G14527>
- [35] [CITE[[[The Unicode Standard]], Version 13.0 - ch03.pdf]], [TIME[2020-03-09T17:53:34.000Z]], [TIME[2020-12-20T02:08:18.239Z]] <https://www.unicode.org/versions/latest/ch03.pdf#G2212>
]REFS]


* 符号化

[12] 
[[文字コード]]規格に[[文字]]を割り当てることを[DFN[[RUBY[符号化][ふごうか][encode]]]]といいます。

[13] 
[[文字]]視点 ([[符号化済文字]]に''なる''こと)、
または[[文字コード]]規格開発者視点 ([[符号化済文字]]に''する''こと)
の用語でしょうか。
[[文字コード]]関連規格や、それに関係する文書でよく見かけます。

[14] 
一般の技術者や、[[文字コード]]関連以外の多くの技術仕様では、
[[符号化]]は[[文字]] (やその他のもの) を[[バイト列]]として表現する変換・保存・送信のための操作のことを指して言うことが多いようですから、
意味にずれがあります。

* 符号化済文字

[8] 
[DFN[[RUBY[符号化済文字][ふごうかずみもじ][encoded character]]]]
([DFN[coded character]])
は、
[[抽象文字]]と[[符号点]]の関連付け ([[写像]]) です。
[SRC[>>35 D11]]
[CITE[The Unicode Standard]]
では、
特に断らない限り、
[DFN[[RUBY[[[文字]]][もじ][character]]]]とは[[符号化済文字]]です
[SRC[>>35]]。


[9] 
非公式には、
[[抽象文字]]に[[割当済符号点]]を一緒にしたものと考えることもできます。
[SRC[>>35 D11]]

;; [10] [[ISO/IEC 10646]] ではむしろこちらが
[[coded character]]
の本義だったようです。
語義からもそちらが自然な解釈です。

[11] 
1つの[[抽象文字]]が、複数種類の[[符号点]]や[[符号点]]の列で表現し得ることがあります。
[SEE[ [[重複符号化]] ]]

[15] 
[[符号化済文字列]]は[[符号化済文字]]の列とは少し意味が違います。
[CITE[The Unicode Standard]] は[[文字列]]とは[[符号化済文字列]]としているので、
[[文字]]と[[文字列]]の意味にずれがあります。

* 割当済文字

[17] 
[RUBYB[[[抽象文字]]に割当済][assigned to abstract character]]の[[符号点]]は、
[[符号点型]]が[[図形][図形文字]]、
[[書式][書式文字]]、
[[制御][制御文字]]、
[[私用][私用文字]]のいずれかです。
[SRC[>>44]]

[7] 
[[割当済文字]]は、[[ブロック]]に属します [SRC[>>35 D10b]]。
[SEE[ [[ブロック]] ]]

[REFS[
- [20] [[抽象文字]]に割当済の符号点の一覧
<https://chars.suikawiki.org/set/%24unicode%3Aassigned-to-abstract-character>
]REFS]

* 割当済符号点

[18] 
[DFN[[RUBYB[指示済符号点][designated code point]]]]
([DFN[[RUBYB[割当済符号点][assigned code point]]]])
は、
[[符号点型]]が[[図形][図形文字]]、
[[書式][書式文字]]、
[[制御][制御文字]]、
[[私用][私用文字]]、
[[サロゲート]]、
[[非文字]]のいずれかです。
[SRC[>>44]]


[16] 
[[割当済符号点]]には[[割当済文字]]の他に、
[[サロゲート符号点]]と[[非文字]]があります。

[19] 
属さない[[Unicode符号点]]は、[[未割当符号点]]だけです。

[REFS[
- [21] [[指示済符号点]]の一覧
<https://chars.suikawiki.org/set/%24unicode%3Adesignated>
]REFS]

* 関連

[SEE[ [[外字]], [[文字のようなもの]] ]]

* 歴史

[2]
> 
: 符号化文字 (coded character):
[[符号化表現]]をもつ[[文字]]。
([[JIS X 0221]]‐1:2001 4.8)

[3] 
>
A character together with its coded representation.  <ISOIEC10646>

;; [CITE@en[RFC 3536 - Terminology Used in Internationalization in the IETF]] ([TIME[2011-01-29 02:14:52 +09:00]] 版) <http://tools.ietf.org/html/rfc3536#page-5>


[4] [CITE@en[RFC 6365 - Terminology Used in Internationalization in the IETF]]
([TIME[2011-09-10 19:11:51 +09:00]] 版)
<http://tools.ietf.org/html/rfc6365#page-6>

[6] [[特性 (UCD)]]

[5] [[包摂規準]]