C1集合

C1集合

[26] C1 は、補助的な制御文字のための符号化文字集合です。

[27] ISO/IEC 2022 の符号構造における CR領域や、 ESC Fe 型のエスケープシーケンスで利用できます。

[28] Unicode では U+0080 - U+009F や、 ESC Fe 型のエスケープシーケンスで利用できます。

概要

[6] 符号化制御機能補助集合は、 C1 とも呼ばれます JIS X 0202:1998 6.4.4

[1] 符号化制御機能補助集合の要件:

[4] 符号化制御機能補助集合は、 CR (08/0009/15) に呼出された時にはそのビット組合せ1つで制御文字として表現できます。 また、エスケープ・シーケンス ESC Fe (Fe = 04/0005/15) のでも表現できます。 JIS X 0202:1998 6.4.3

[7] >>4 の後者のエスケープ・シーケンスによる表現は、 制御文字ではありません (定義上)。一般に C0C1制御文字集合と呼ばれますが、 わざわざそうではなく制御機能集合だとしているのはそういう理由と思われます。

[8] 8ビット符号単独シフト機能を使用する場合は、 符号化制御機能補助集合 (C1) に SS2SS3 が含まれなければなりません JIS X 0202:1998 8.5.27ビット符号単独シフト機能を使用する場合は、 符号化制御機能基本集合 (C0) または 符号化制御機能補助集合 (C1) に SS2SS3 が含まれなければなりません JIS X 0202:1998 9.5.2

[16] C1文字集合とは、 Supplementary sets of coded control functions。 符号化制御機能の補助集合 (JISX0202:1998 6.4.3)。 C1制御文字集合。

[18] 8ビット環境では CR (08/00〜09/15) に指示呼び出し して使う。または、 ESC Fe (Fe = 04/00〜05/15) を使う。

ESC Fe を使う時は、 CR は使用しない。 逆も然り。 (ISO/IEC2022 1994 8.5.2)

[17] ESCAPE を含めない (shall not)。 ISO/IEC6429/JISX0211C0文字集合伝送制御機能 transmission control function も含めない (shall not)。 (ISO/IEC2022 1994 6.4, JISX0202:1998 6.4.2)

[19] SS2 と SS3 を含める(shall)。 (ISO/IEC2022 1994 8.5.2)

[20] 実際には (おそらく ISO.IEC 2022 の規定ができる以前で) SS2SS3 を持っていない C1 集合もあります。

[21] 仕様書はよく読むと、これらシフト機能を使う符号は、 と限定があります。使うなら含める、使わないなら含めなくてよい。 ほとんど何も言っていないのと同じことで、 SS2SS3 がない C1集合にも何の問題もないわけです。

[11] 呼出し: 8ビット符号符号要素 C1符号化制御機能補助集合指示すると、 同時にその集合呼出すことになります。その場合、 CR 領域に呼出すか、または ESC Fe 型のエスケープ・シーケンス (Fe04/0005/15) で呼出すかのいずれかになります。 後者の場合は CR 領域は使用しないことになります。 どちらの方法を採るかは、符号の版で規定します。 7ビット符号の場合は、 ESC Fe 型のエスケープ・シーケンス呼出します。 JIS X 0202:1998 8.5.2

[12] C0CL が (歴史的事情も含めて) 混用されているように、 C1CR も混同されぎみです。但し、7ビット・8ビット問題がある関係上、 C0/CL より C1/CR の区別の方がやや理解されているとは思われます。

[13] C1 文字集合は、指示した後、 CR 領域の符号位置呼び出しされているものを使うことも出来ますし、 ESC Fe 形式で表現することが出来ます。

[14] CR 領域は 08/0009/15 ですから8ビット, ESC Fe 形式は 01/11 04/0005/15 ですから7ビットで表現されます。どちらを使うか、あるいはどちらも使えるかは、告知シーケンス (又は情報交換の当事者間の合意) により決定します。

[15] ISO-8859-* and the C1 control range (Henri Sivonen <hsivonen@...> 著, 版) http://permalink.gmane.org/gmane.org.w3c.whatwg.discuss/10846 (名無しさん 2007-06-04 11:57:24 +00:00)

[29] JIS X 0211 SS3 だけの C1 - JIS X 0213

Unicode

[9] 理論上は Unicode (ISO/IEC 10646) 環境下でも CRエスケープシーケンスによって C1 を使うことは可能です。

[10] 現実には、従来の端末エスケープシーケンス機能を現在まで引き続き実装しているような例外を除き、 使われることはありません。

ISO/IEC 10646におけるエスケープシーケンス

非制御文字

[23] ISO/IEC 2022 の符号構造では、 C1制御文字集合ビット組合せのすべては制御文字に割当 (または未割当) しなければなりません。

[25] MARC-8 (ANSEL) は C1JOINER, NON-JOINER を割り当てています。 これらは Unicode では ZWJ, ZWNJ に対応付けられていて、 制御文字 (Cc) ではない扱いになっています。

関連

[22] 他にC0集合があります。

[30] ESC eKanji

メモ