6F

6F

[10] IDENTIFY REVISED REGISTRATION (IRR) は、文字集合の更新番号を表すものでした。 指示シーケンスの直前に置くエスケープシーケンスでした。

本項は歴史的事項を説明しています。本項の内容の一部または全部は、現在の状況とは異なるかもしれません。

(なお本項の内容の一部または全部は、互換性または歴史的連続性のために現在も有効な場合もあります。しかし新たに利用することは避けるべきです。)

目次

  1. 構文
  2. 文字集合の改訂と改訂番号
  3. IRR を利用した文字集合
  4. 誤り処理
  5. 実態
  6. ISO/IEC 10646 における利用
  7. ASN.1 における利用
  8. 関連
  9. メモ

構文#

[11]

名前
IDENTIFY REVISED REGISTRATION
日本語通用名称
改訂版の識別
略号
IRR
符号化表現
ESC 02/06 Ft (6Fエスケープ・シーケンス)

[13] IRRISO-IR に登録されている文字集合改訂番号を識別します。 JIS X 0202:1998 14.5

[27] 6Fエスケープ・シーケンスは、 文字集合改訂番号 (IDENTIFY REVISED REGISTRATION) に使われます。

[28] 仕様書:

[29]

[15] IRR は、 符号化制御機能集合指示する CZD 又は C1D か、符号化図形文字集合指示する GnDmGnDMm の直前に置きます。 その直後に置かれた指示機能によって指示が行われる文字集合の改訂番号を IRR が識別します。 JIS X 0202:1998 14.5.2

  1. revised-designation = IRR designation
  2. IRR = ESC %x26 F ;; IDENTIFY REVISED REGISTRATION
  3. F = %x40-7E
  4. designation = <ISO-IR に登録された文字集合の指示列 (C0, C1, G0G3)>

文字集合の改訂と改訂番号#

[14] 文字集合の改訂: ここでいう文字集合の改訂とは次のように定められています JIS X 0202:1998 14.5

[41] 改訂番号は 1〜63 で、 04/0007/14 に対応します。 JIS X 0202:1998 14.5.2

[31] 改訂番号が割り当てられるのは、改訂後の版です。最初の版には IRR を使い(え)ません。

[30] IRR私用終端バイトが使えるか使えないかは明言されていませんが、 改訂番号の範囲外なので使えなそうです。

[49] 私用終端バイトが使われたという噂もあるらしいです。 NAPLPS

[32] 改訂番号の意味は仕様書が明言していません。常識的に考えれば、 オリジナル → 改訂1 → 改訂2 → ・・・と順に改訂していると理解するべきでしょうが。 既存の利用例は改訂1を使ったものだけで、それ以外は未だ使われていません。

[33] オリジナル → 改訂1と矛盾するオリジナル → 改訂2の追加も認められる、 と解釈できないこともありませんが・・・。

[16] IRR指示機能を組合せることにより、 古い装置システムも新しい版を認識できます。 JIS X 0202:1998 14.5.2 参考

[17] >>16 つまり装置システムは未知の IRR を無視しても良いということのようです。 改訂1はオリジナルとみなされます。

[34] >>32 の解釈に従えば、改訂 n + 1 は改訂 n とみなすことになります。

[18] (ISO/IEC2022:1994 14.5)

文字集合に文字の追加だけが行われて、それが ISO2375 により ISO-IR に登録されている時に、 IRR を使って更新文字集合を識別出来ます。

[42] IRR私用終端バイト指示シーケンスを組合せられるのか明言されていませんが、 IRR の要件に ISO-IR への登録があるということは、 私用終端バイト指示シーケンスには使えないということです。

[43] IRR空集合指示シーケンスを組合せられるのか明言されていませんが、 空集合の改訂とは意味がわかりませんし、 ISO-IR にその改訂を登録することも不可能でしょう。

[44] DOCS やその他のエスケープシーケンスとも組合せられません。


[63] IRR でない登録簿の書き換えは ISO-IR 参照。

IRR を利用した文字集合#

[35] ISO-IR には次の3つが登録されています。

72Third Supplementary Set for Videotex, (Mosaic), CCITTESC <I> d
173Third supplementary set of Mosaic Characters/ Videotex and FacsimileESC & @ ESC <I> d
67Additional Control Functions for Bibliographic Use according to ISO 6630ESC " B
124Upward Compatible Version of ISO 6630 (Registration 67)ESC & @ ESC " B
87JIS X 0208-1983ESC $ [<I>] B
168JIS X 0208-1990ESC & @ ESC $ [<I>] B

[62] JIS X 0208-1990指示シーケンスは、 JIS X 0208:1997 (およびそれ以降) でも使われています (同規格の本文で規定されています)。 SC2 および JISC の見解では JIS X 0208-1990JIS X 0208:1997 は新たな更新番号を要しない等しい文字集合であるようです。 (それには異論もあり得ます。) JIS X 0208:1997

[36] ISO-IR 未登録ですが、 ISO/IEC 6429 に1つあります。

73C1 Control Set of ISO 6429-1983ESC 02/02 04/03
--ISO/IEC6429:1992 C1 文字集合ESC 02/06 04/00 ESC 02/02 04/03

[1] ISO/IEC6429のC1文字集合は、 ISO/IEC 6429:1992 において文字の追加と削除を伴う非互換な変更が行われました。 ISO/IEC 6429:1992 や JISX0202:1998 によるとこの新しい文字集合の指示呼び出しシーケンスは上に示した改訂番号つきのものです。

[8] この改訂は、文字の追加のみの変更が認められるという ISO/IEC2022 の規定に違反しています。 (それで登録されなかったのでしょうか。 ISO/IEC 6429SC2 が制定したはずなのに、おかしいですね。)

[40] ISO/IEC 10646 は仕様書中で ISO/IEC 6429指示シーケンスを説明していますが、 IRR には言及していません。 最新の ISO/IEC 6429 が使えないということでもなさそうなのですが、 SC2 がどのような意図なのかわかりません。

[38] 改訂番号1 (4/0) 以外の例は知られていません。

[37] 今後 ISO-IR に新たな IRR 終端バイトが登録される可能性は低いと思われます。 他の規格で定義される可能性も低いと思われます。


[57] ecma35libFpIRR を大量に定義して使っています。 非標準の拡張を含む文字集合の各種バリエーションや、 Unicode との対応関係の違いを切り替えることができるようです。 >>56

[58] 94集合 >>56
IRR Fp指示 F文字集合
3/04/0 (@)Old IRV with tilde (rather than overscore)
3/04/1 (A)DEC NRCS
3/04/2 (B)ASCII with overscore (rather than tilde)
3/04/3 (C)DEC NRCS
3/04/5 (E)DEC NRCS
3/04/8 (H)DEC NRCS
3/04/9 (I)JIS X 0201 katakana, IBM's 4992 (used for its counterparts from IBM's 1041 in the Shift_JIS filter).
3/14/9 (I)JIS X 0201 katakana, an analogous extraction from MacJapanese.
3/24/9 (I)JIS X 0201 katakana, an extraction from Windows-31J and friends.
3/34/9 (I)JIS X 0201 katakana, an extraction from Windows-31J and friends, suppressing the 0x80 control mapping in some DOCS filters in favour of the Euro.
3/04/10 (J)JIS-Roman with tilde (rather than overscore)
3/04/15 (O)DIN 31624, falling thru to T.51 for unallocated cells
3/154/15 (O)DIN 31624, possibly-older German relative of ISO 5426-1
3/05/0 (P)ISO 5426-1, falling thru to T.51 for unallocated cells
3/155/0 (P)ISO 5426-1, bibliographic set related to (but incompatible with) T.51
3/05/9 (Y)ETS 300 706 Latin G0 for Italy
3/06/0 (`)DEC NRCS
3/16/0 (`)Danish equivalent to NS 4551 (IBM's 1017)
3/06/7 (g)DEC NRCS
3/06/12 (l)ITU T.51-1988 first supplementary set with ETS 300 706 extensions (default for this F-byte)
3/16/12 (l)ITU T.51-1988 first supplementary set with ETS 300 706 extensions, alternative mapping
3/156/12 (l)ITU T.51-1988 first supplementary set (i.e. older version of the T.51 supplementary set without NBSP, SHY, not sign or brvbar)
3/06/15 (o)ISO-8859-1 RHS cropped to 94-set, with backslash replacing yen sign (superset of the non-JISCII set for OCR-B).
3/156/15 (o)JIS X 9010 non-JISCII set for OCR-B.
3/07/1 (q)JIS X 9010 backslash-only set for JIS X 9008, mapping to OCR DOUBLE BACKSLASH.
3/157/1 (q)JIS X 9010 backslash-only set for JIS X 9008, mapping to ASCII as strongly implied by registration rubric (subset of the non-JISCII set for OCR-B).
3/02/1 (!) 4/2 (B)DEC NRCS, invariant subset
3/12/1 (!) 4/2 (B)ETS 300 706 Latin G0, invariant subset
3/02/1 (!) 4/5 (E)ANSEL supplementary set, Library of Congress version (i.e. eszett at 0x47)
3/12/1 (!) 4/5 (E)ANSEL supplementary set, combined Library of Congress and Genealogical Society of Utah versions, i.e. duplicate eszetts at 0x47 and 0x4F (default for this F-byte)
3/152/1 (!) 4/5 (E)ANSEL supplementary set, ANSI standard version (i.e. no eszett)
[59] 96集合
IRR Fp指示 F文字集合
3/04/10 (J)Complete ITU T.51 supplementary set (same as IRR 0 G*D6 R; default for this F-byte)
3/15 (?)4/10 (J)ITU T.51 supplementary set for use with old IRV (excludes universal currency sign and hash)
3/05/2 (R)Complete ITU T.51 supplementary set (same as IRR 0 G*D6 J; default for this F-byte)
3/155/2 (R)ITU T.51 supplementary set for use with ASCII (excludes dollar and hash)
[60] 942集合
IRR Fp指示 F文字集合
3/04/0 (@)JIS C 6226, version encoded by IBM-932 and IBM-942
3/14/0 (@)JIS C 6226, version used by NEC PC98 (default for this F-byte)
3/24/0 (@)JIS C 6226-1978, character mapping changes by 90JIS pivot only
3/34/0 (@)JIS C 6226-1978, character mappings by CID map only, resulting in some gaps (since CID maps are intended to preserve font correctness, not data integrity)
3/154/0 (@)JIS C 6226-1978, with mappings for characters changed to those suitable for the 1978 edition
3/04/1 (A)GB/T 12345 (hybrid approach)
3/14/1 (A)GB 18030-2000 levels 1 and 2
3/24/1 (A)GB 18030-2005 levels 1 and 2 (default)
3/44/1 (A)GB 18030, favouring duplicate mappings over PUA mappings for standard characters
3/54/1 (A)GB/T 2312, variant used on classic Mac OS, updated mappings
3/64/1 (A)GB/T 2312-1980, UTC version
3/74/1 (A)GB/T 2312-1980, with alterations but not extensions from GB 6345.1-1986
3/84/1 (A)GB/T 12345 (strict compliance, including retaining certain simplified characters from GB/T 2312 which are often implemented replaced by traditional versions)
3/94/1 (A)GB/T 12345 (UTC mapping, including additional replacements by traditional versions, and lacking non‑hanzi not present in GB/T 2312)
3/104/1 (A)GB/T 2312, IBM version with PUA filling empty space and extensions in row 94
3/114/1 (A)GB/T 2312, variant used on classic Mac OS, as specified by Apple
3/124/1 (A)GB/T 2312, variant used on classic Mac OS, mixed mappings
3/134/1 (A)GB/T 2312, Microsoft version
3/154/1 (A)GB/T 2312-1980
3/04/2 (B)JIS X 0208, WHATWG variant (default; synchronised with Windows-31J)
3/14/2 (B)JIS X 0208, "KanjiTalk 7" (row+84 verticals, non-NEC gaiji) variant used on classic Mac OS, updated mappings
3/24/2 (B)JIS X 0208, "PostScript" / "KanjiTalk 6 PostScript" (row+84 verticals, NEC gaiji) variant used on classic Mac OS, updated mappings
3/34/2 (B)JIS X 0208, "KanjiTalk 6 non-PostScript" (row+10 verticals, NEC gaiji) variant used on classic Mac OS
3/44/2 (B)JIS X 0208, with UTC-style mapping of em dash / horizontal bar character
3/54/2 (B)JIS X 0208, Open Group version for JIS-Roman based EUC-JP
3/64/2 (B)JIS X 0208, Open Group version for ASCII-based EUC-JP
3/74/2 (B)JIS X 0208, Open Group version for Microsoft-style EUC-JP
3/84/2 (B)JIS X 0208, version encoded by IBM-954
3/94/2 (B)JIS X 0208, DoCoMo JIS emoji
3/104/2 (B)JIS X 0208, KDDI JIS emoji, symbolic zodiac variant
3/114/2 (B)JIS X 0208, SoftBank JIS emoji
3/124/2 (B)JIS X 0208, KDDI JIS emoji, pictorial zodiac variant
3/134/2 (B)JIS X 0208, Fujitsu version
3/144/2 (B)JIS X 0208, ARIB STD-B.24 version
3/154/2 (B)JIS C 6226 / X 0208-1983
2/0 3/04/2 (B)"KanjiTalk 7" variant (row+84 verticals, non-NEC gaiji) used on classic Mac OS, Apple mappings
2/0 3/14/2 (B)"PostScript" / "KanjiTalk 6 PostScript" variant (row+84 verticals, NEC gaiji) used on classic Mac OS, Apple mappings
3/04/3 (C)KS C 5601-1987, but using old-UTC mappings for the non-syllables
3/14/3 (C)KS X 1001-1998 Wansung code. The Euro sign update, also adding the registered trademark sign, and matching the WHATWG mapping.
3/24/3 (C)KS X 1001-2002 (adding the South Korean postal mark)
3/34/3 (C)KS X 1001-1987 extended, main plane of Apple/Elex extension (HangulTalk), updated mappings
3/44/3 (C)KS X 1001-1987, using IBM mappings
3/54/3 (C)KS X 1001-1987 extended, main plane of Apple/Elex extension (HangulTalk), old Apple mappings
3/64/3 (C)KS X 1001-1987 extended, main plane of Apple/Elex extension (HangulTalk), Apple mappings
3/154/3 (C)KS C 5601-1987 Wansung code, using new-UTC mappings (harmonious with Microsoft and WHATWG)
3/04/4 (D)JIS X 0212 with va/vi/ve/vo
3/14/4 (D)JIS X 0212, Open Group version for JIS-Roman based EUC-JP
3/24/4 (D)JIS X 0212, Open Group version for ASCII-based EUC-JP
3/34/4 (D)JIS X 0212, Open Group version for Microsoft-style EUC-JP
3/44/4 (D)JIS X 0212, version encoded by IBM-954
3/54/4 (D)JIS X 0212, version encoded by ICU's EUC-JP
3/154/4 (D)JIS X 0212:1990
3/04/5 (E)CCITT Hanzi Code, with a more conventional mapping of the lowercase gs (appropriate for their GB 18030 reference glyphs)
3/14/5 (E)CCITT Hanzi Code, combined with an additional hanzi extension in row 8
3/24/5 (E)GB 6345.1-1986
3/34/5 (E)GB 8565.2-1988
3/44/5 (E)Pseudo-G8, an incorrect version of GB 8565.2-1988 which had been referenced by older versions of the Unihan database (incorrectly shifts the actual GB 8565.2 characters 15-90 through 15-93 back by one code point over 15-89, and also includes the row 8 hanzi extensions and most of the CCITT hanzi extensions).
3/154/5 (E)CCITT Hanzi Code (GB 2312 variant) from ITU T.101-C, which bases it on GB 6345.1-1986 and GB 8565.2-1988 with further adjustments and expansions
3/04/7 (G)CNS 11643 plane 1, recommended version (default)
3/14/7 (G)CNS 11643 plane 1, mapped from Microsoft Big-5
3/24/7 (G)CNS 11643 plane 1, according to UTC mappings
3/34/7 (G)CNS 11643 plane 1, mapped from UTC Big-5
3/44/7 (G)CNS 11643 plane 1, mapped from Macintosh-compatible Big-5
3/54/7 (G)CNS 11643 plane 1, as officially defined in Taiwan
3/64/7 (G)CNS 11643 plane 1, an IBM-related variant
3/74/7 (G)CNS 11643 plane 1, mapped from IBM Big-5
3/84/7 (G)CNS 11643 plane 1, mapped from IBM's Microsoft-style Big-5
3/94/7 (G)CNS 11643 plane 1, mapped from WHATWG/HTML5 Big-5
3/104/7 (G)CNS 11643 plane 1, mapped from Mozilla Big-5
3/114/7 (G)CNS 11643 plane 1, per ICU ISO-2022-CN mappings
3/124/7 (G)CNS 11643 plane 1, per ICU EUC-TW 2014 mappings
3/134/7 (G)CNS 11643 plane 1, per Yasuoka's mappings
3/14/8 (H)CNS 11643 plane 2, Big5 mappings
3/154/8 (H)CNS 11643 plane 2
3/04/9 (I)CNS 11643-1988 plane 14
3/14/9 (I)CNS 11643-1988 plane 14 with extensions, as submitted to the IRG
3/24/9 (I)CNS 11643-2007 plane 3
3/34/9 (I)CNS 11643-2007 plane 3, plus the additional assignments from CNS 11643-1988 plane 14 (default)
3/44/9 (I)CNS 11643-1988 plane 14, UTC mappings (partial, with extensions)
3/54/9 (I)CNS 11643-1992 plane 3, per former ICU ISO-2022-CN-EXT mappings
3/64/9 (I)CNS 11643-1992 plane 3, per ICU EUC-TW 2014 mappings
3/74/9 (I)CNS 11643-1992 plane 3, per Yasuoka's mappings
3/154/9 (I)CNS 11643-1992 plane 3
3/04/10 (J)CNS 11643-1992 plane 4, as officially defined in Taiwan
3/14/10 (J)CNS 11643-1992 plane 4, per former ICU ISO-2022-CN-EXT mappings
3/24/10 (J)CNS 11643-1992 plane 4, per ICU EUC-TW 2014 mappings
3/34/10 (J)CNS 11643-1992 plane 4, per Yasuoka's mappings
3/154/10 (J)CNS 11643-1992 plane 4
3/04/11 (K)CNS 11643-1992 plane 5, as officially defined in Taiwan
3/14/11 (K)CNS 11643-1992 plane 5, per former ICU ISO-2022-CN-EXT mappings
3/24/11 (K)CNS 11643-1992 plane 5, per ICU EUC-TW 2014 mappings
3/34/11 (K)CNS 11643-1992 plane 5, per Yasuoka's mappings
3/154/11 (K)CNS 11643-1992 plane 5
3/04/12 (L)CNS 11643-1992 plane 6, as officially defined in Taiwan
3/14/12 (L)CNS 11643-1992 plane 6, per former ICU ISO-2022-CN-EXT mappings
3/24/12 (L)CNS 11643-1992 plane 6, per ICU EUC-TW 2014 mappings
3/34/12 (L)CNS 11643-1992 plane 6, per Yasuoka's mappings
3/154/12 (L)CNS 11643-1992 plane 6
3/04/13 (M)CNS 11643-1992 plane 7, as officially defined in Taiwan
3/14/13 (M)CNS 11643-1992 plane 7, per former ICU ISO-2022-CN-EXT mappings
3/24/13 (M)CNS 11643-1992 plane 7, per ICU EUC-TW 2014 mappings
3/34/13 (M)CNS 11643-1992 plane 7, per Yasuoka's mappings
3/154/13 (M)CNS 11643-1992 plane 7
3/04/14 (N)KPS 9566-2003 (only the main plane unless in the UHC DOCS)
3/14/14 (N)KPS 9566-2011 (only the main plane unless in the UHC DOCS)
3/24/14 (N)All KPS 9566 editions overlayed (but only the main plane unless in the UHC DOCS)
3/154/14 (N)KPS 9566-97

[61] 私用終端バイト指示列に対するものは Fp 参照。

誤り処理#

エスケープシーケンスのエラー処理の項も参照

実態#

[9] IRR はほとんど使われませんでした。

[23] JIS X 0208 の実装のほとんどは、 IRR なしの ESC $ B のまま JIS X 0208-1990 を実装 (= 2文字追加) していました。

[25] RFC 1468 ISO-2022-JP は、 IRR を使用しないで JIS X 0208-1990 を使おうとしていました。

[22] DECの文字コードとしての ISO-2022-JP 等は、 IRR なしの ESC $ B が JIS X 0208-1990 であるとしています。 DECの文字コード

[24] JIS X 0208:1997RFC1468符号化表現は、 ESC $ B が JIS X 0208:1997 であるとしています。

[20] ctext では IRR は使いません。 常に上方交換なので最新版とみなせるのだとされています。 ctext

[21] そのような解釈が ISO/IEC 2022 に適合するのかは怪しいですが。

[26] ISO-IR 165, JIS X 0213:2000 第1面, JIS X 0213:2004 第1面は IRR 付きになってもよさそうなものでしたが、 使われずに新しい符号化図形文字集合として登録されました。

[39] KS X 1001KPS 9577 も改訂版が IRR 付きになってもよさそうなものですが、 ISO-IR に登録されていません。

[50] KS X 1001 は文字を追加しても平気で元の終端バイトを使い続けています。 KS X 1001

[45] 公開テキスト指示シーケンスでは JIS X 0208-1990 の記述に使われています。


[53] ISO-IR 72 を supersedes する ISO-IR 173 がに登録されました。 どちらも94集合終端バイト6/4 とされています。 指示シーケンス, 94集合

[54] ISO-IR 173 には元空き領域図形文字が追加されていますが、 ISO 2375 4.4.2 に従いエスケープシーケンスを改めずに改正したと書かれています。

[55] 当時の ISO 2375 がどんな規定だったのかわかりませんが、 登録が JIS X 0208-1990 (ISO-IR 168) より後ですから、 IRR はあったはずで、それにも関わらずこんな登録が行われたのです。

ISO/IEC 10646 における利用#

[19] ISO/IEC 10646 で利用できるのかどうかは不明瞭です。 ISO/IEC 10646におけるエスケープシーケンス

ASN.1 における利用#

[46] ISO/IEC 2022 character abstract syntax では元の符号化文字集合ISO-IR 登録番号と IRR の改訂番号を組合せて使います。 ISO/IEC 2022 character abstract syntax

[47] 改訂なしは 0 で表します。

関連#

[48] NAPLPS 用にこれと衝突する使われ方があったとする説があります。

メモ#