[10] IDENTIFY REVISED REGISTRATION
(IRR
)
は、文字集合の更新番号を表すものでした。
指示シーケンスの直前に置くエスケープシーケンスでした。
[13] IRR
は ISO-IR
に登録されている文字集合の改訂番号を識別します。
JIS X 0202:1998 14.5
[27] 6F
型エスケープ・シーケンスは、
文字集合改訂番号 (IDENTIFY REVISED REGISTRATION
)
に使われます。
[28] 仕様書:
エスケープ・シーケンス /= 6F 型エスケープ・シーケンス
6F 型エスケープ・シーケンス := IRR / 6F 型予約エスケープ・シーケンス
IRR := 標準 IRR / 私用 IRR ;;
IDENTIFY REVISED REGISTRATION
標準 IRR := ESC
%x26 Ft
私用 IRR := ESC
%x26 *I Fp
6F 型予約エスケープ・シーケンス := ESC
%x21 1*I Ft
I := %x20-2F ;; 中間バイト
Fp := %x30-3F ;; 私用終端バイト
Ft := %x40-7E ;; 標準終端バイト
[15]
IRR
は、
符号化制御機能集合を指示する CZD
又は C1D
か、符号化図形文字集合を指示する
GnDm
か
GnDMm
の直前に置きます。
その直後に置かれた指示機能によって指示が行われる文字集合の改訂番号を
IRR
が識別します。
JIS X 0202:1998 14.5.2
[14] 文字集合の改訂: ここでいう文字集合の改訂とは次のように定められています JIS X 0202:1998 14.5。
[41]
改訂番号は 1〜63 で、 04/00
〜07/14
に対応します。
JIS X 0202:1998 14.5.2
[31]
改訂番号が割り当てられるのは、改訂後の版です。最初の版には
IRR
を使い(え)ません。
[30]
IRR
で私用終端バイトが使えるか使えないかは明言されていませんが、
改訂番号の範囲外なので使えなそうです。
[49]
私用終端バイトが使われたという噂もあるらしいです。
[32] 改訂番号の意味は仕様書が明言していません。常識的に考えれば、 オリジナル → 改訂1 → 改訂2 → ・・・と順に改訂していると理解するべきでしょうが。 既存の利用例は改訂1を使ったものだけで、それ以外は未だ使われていません。
[16] IRR
と指示機能を組合せることにより、
古い装置やシステムも新しい版を認識できます。
JIS X 0202:1998 14.5.2 参考
[17] >>16 つまり装置やシステムは未知の
IRR
を無視しても良いということのようです。
改訂1はオリジナルとみなされます。
[34] >>32 の解釈に従えば、改訂 n + 1 は改訂 n とみなすことになります。
[18] (ISO/IEC2022:1994 14.5)
文字集合に文字の追加だけが行われて、それが ISO2375 により ISO-IR に登録されている時に、 IRR を使って更新文字集合を識別出来ます。
[42] IRR と私用終端バイトの指示シーケンスを組合せられるのか明言されていませんが、 IRR の要件に ISO-IR への登録があるということは、 私用終端バイトの指示シーケンスには使えないということです。
[43] IRR と空集合の指示シーケンスを組合せられるのか明言されていませんが、 空集合の改訂とは意味がわかりませんし、 ISO-IR にその改訂を登録することも不可能でしょう。
[44]
DOCS
やその他のエスケープシーケンスとも組合せられません。
72 | Third Supplementary Set for Videotex, (Mosaic), CCITT | ESC <I> d |
173 | Third supplementary set of Mosaic Characters/ Videotex and Facsimile | ESC & @ ESC <I> d |
67 | Additional Control Functions for Bibliographic Use according to ISO 6630 | ESC " B |
124 | Upward Compatible Version of ISO 6630 (Registration 67) | ESC & @ ESC " B |
87 | JIS X 0208-1983 | ESC $ [<I>] B |
168 | JIS X 0208-1990 | ESC & @ ESC $ [<I>] B |
[62]
JIS X 0208-1990 の指示シーケンスは、
JIS X 0208:1997 (およびそれ以降) でも使われています
(同規格の本文で規定されています)。
SC2 および JISC の見解では
JIS X 0208-1990 と JIS X 0208:1997
は新たな更新番号を要しない等しい文字集合であるようです。
(それには異論もあり得ます。)
[36] ISO-IR 未登録ですが、 ISO/IEC 6429 に1つあります。
73 | C1 Control Set of ISO 6429-1983 | ESC 02/02 04/03 |
-- | ISO/IEC6429:1992 C1 文字集合 | ESC 02/06 04/00 ESC 02/02 04/03 |
[1] ISO/IEC6429のC1文字集合は、 ISO/IEC 6429:1992 において文字の追加と削除を伴う非互換な変更が行われました。 ISO/IEC 6429:1992 や JISX0202:1998 によるとこの新しい文字集合の指示・呼び出しシーケンスは上に示した改訂番号つきのものです。
[8] この改訂は、文字の追加のみの変更が認められるという ISO/IEC2022 の規定に違反しています。 (それで登録されなかったのでしょうか。 ISO/IEC 6429 は SC2 が制定したはずなのに、おかしいですね。)
[40]
ISO/IEC 10646 は仕様書中で ISO/IEC 6429 の指示シーケンスを説明していますが、
IRR
には言及していません。
最新の ISO/IEC 6429 が使えないということでもなさそうなのですが、
SC2 がどのような意図なのかわかりません。
[38] 改訂番号1 (4/0) 以外の例は知られていません。
[37]
今後 ISO-IR に新たな IRR
終端バイトが登録される可能性は低いと思われます。
他の規格で定義される可能性も低いと思われます。
[57]
ecma35lib
が
Fp の IRR
を大量に定義して使っています。
非標準の拡張を含む文字集合の各種バリエーションや、
Unicode との対応関係の違いを切り替えることができるようです。
>>56
IRR Fp | 指示 F | 文字集合 |
---|---|---|
3/0 | 4/0 (@) | Old IRV with tilde (rather than overscore) |
3/0 | 4/1 (A) | DEC NRCS |
3/0 | 4/2 (B) | ASCII with overscore (rather than tilde) |
3/0 | 4/3 (C) | DEC NRCS |
3/0 | 4/5 (E) | DEC NRCS |
3/0 | 4/8 (H) | DEC NRCS |
3/0 | 4/9 (I) | JIS X 0201 katakana, IBM's 4992 (used for its counterparts from IBM's 1041 in the Shift_JIS filter). |
3/1 | 4/9 (I) | JIS X 0201 katakana, an analogous extraction from MacJapanese. |
3/2 | 4/9 (I) | JIS X 0201 katakana, an extraction from Windows-31J and friends. |
3/3 | 4/9 (I) | JIS X 0201 katakana, an extraction from Windows-31J and friends, suppressing the 0x80 control mapping in some DOCS filters in favour of the Euro. |
3/0 | 4/10 (J) | JIS-Roman with tilde (rather than overscore) |
3/0 | 4/15 (O) | DIN 31624, falling thru to T.51 for unallocated cells |
3/15 | 4/15 (O) | DIN 31624, possibly-older German relative of ISO 5426-1 |
3/0 | 5/0 (P) | ISO 5426-1, falling thru to T.51 for unallocated cells |
3/15 | 5/0 (P) | ISO 5426-1, bibliographic set related to (but incompatible with) T.51 |
3/0 | 5/9 (Y) | ETS 300 706 Latin G0 for Italy |
3/0 | 6/0 (`) | DEC NRCS |
3/1 | 6/0 (`) | Danish equivalent to NS 4551 (IBM's 1017) |
3/0 | 6/7 (g) | DEC NRCS |
3/0 | 6/12 (l) | ITU T.51-1988 first supplementary set with ETS 300 706 extensions (default for this F-byte) |
3/1 | 6/12 (l) | ITU T.51-1988 first supplementary set with ETS 300 706 extensions, alternative mapping |
3/15 | 6/12 (l) | ITU T.51-1988 first supplementary set (i.e. older version of the T.51 supplementary set without NBSP, SHY, not sign or brvbar) |
3/0 | 6/15 (o) | ISO-8859-1 RHS cropped to 94-set, with backslash replacing yen sign (superset of the non-JISCII set for OCR-B). |
3/15 | 6/15 (o) | JIS X 9010 non-JISCII set for OCR-B. |
3/0 | 7/1 (q) | JIS X 9010 backslash-only set for JIS X 9008, mapping to OCR DOUBLE BACKSLASH. |
3/15 | 7/1 (q) | JIS X 9010 backslash-only set for JIS X 9008, mapping to ASCII as strongly implied by registration rubric (subset of the non-JISCII set for OCR-B). |
3/0 | 2/1 (!) 4/2 (B) | DEC NRCS, invariant subset |
3/1 | 2/1 (!) 4/2 (B) | ETS 300 706 Latin G0, invariant subset |
3/0 | 2/1 (!) 4/5 (E) | ANSEL supplementary set, Library of Congress version (i.e. eszett at 0x47) |
3/1 | 2/1 (!) 4/5 (E) | ANSEL supplementary set, combined Library of Congress and Genealogical Society of Utah versions, i.e. duplicate eszetts at 0x47 and 0x4F (default for this F-byte) |
3/15 | 2/1 (!) 4/5 (E) | ANSEL supplementary set, ANSI standard version (i.e. no eszett) |
IRR Fp | 指示 F | 文字集合 |
---|---|---|
3/0 | 4/10 (J) | Complete ITU T.51 supplementary set (same as IRR 0 G*D6 R; default for this F-byte) |
3/15 (?) | 4/10 (J) | ITU T.51 supplementary set for use with old IRV (excludes universal currency sign and hash) |
3/0 | 5/2 (R) | Complete ITU T.51 supplementary set (same as IRR 0 G*D6 J; default for this F-byte) |
3/15 | 5/2 (R) | ITU T.51 supplementary set for use with ASCII (excludes dollar and hash) |
IRR Fp | 指示 F | 文字集合 |
---|---|---|
3/0 | 4/0 (@) | JIS C 6226, version encoded by IBM-932 and IBM-942 |
3/1 | 4/0 (@) | JIS C 6226, version used by NEC PC98 (default for this F-byte) |
3/2 | 4/0 (@) | JIS C 6226-1978, character mapping changes by 90JIS pivot only |
3/3 | 4/0 (@) | JIS C 6226-1978, character mappings by CID map only, resulting in some gaps (since CID maps are intended to preserve font correctness, not data integrity) |
3/15 | 4/0 (@) | JIS C 6226-1978, with mappings for characters changed to those suitable for the 1978 edition |
3/0 | 4/1 (A) | GB/T 12345 (hybrid approach) |
3/1 | 4/1 (A) | GB 18030-2000 levels 1 and 2 |
3/2 | 4/1 (A) | GB 18030-2005 levels 1 and 2 (default) |
3/4 | 4/1 (A) | GB 18030, favouring duplicate mappings over PUA mappings for standard characters |
3/5 | 4/1 (A) | GB/T 2312, variant used on classic Mac OS, updated mappings |
3/6 | 4/1 (A) | GB/T 2312-1980, UTC version |
3/7 | 4/1 (A) | GB/T 2312-1980, with alterations but not extensions from GB 6345.1-1986 |
3/8 | 4/1 (A) | GB/T 12345 (strict compliance, including retaining certain simplified characters from GB/T 2312 which are often implemented replaced by traditional versions) |
3/9 | 4/1 (A) | GB/T 12345 (UTC mapping, including additional replacements by traditional versions, and lacking non‑hanzi not present in GB/T 2312) |
3/10 | 4/1 (A) | GB/T 2312, IBM version with PUA filling empty space and extensions in row 94 |
3/11 | 4/1 (A) | GB/T 2312, variant used on classic Mac OS, as specified by Apple |
3/12 | 4/1 (A) | GB/T 2312, variant used on classic Mac OS, mixed mappings |
3/13 | 4/1 (A) | GB/T 2312, Microsoft version |
3/15 | 4/1 (A) | GB/T 2312-1980 |
3/0 | 4/2 (B) | JIS X 0208, WHATWG variant (default; synchronised with Windows-31J) |
3/1 | 4/2 (B) | JIS X 0208, "KanjiTalk 7" (row+84 verticals, non-NEC gaiji) variant used on classic Mac OS, updated mappings |
3/2 | 4/2 (B) | JIS X 0208, "PostScript" / "KanjiTalk 6 PostScript" (row+84 verticals, NEC gaiji) variant used on classic Mac OS, updated mappings |
3/3 | 4/2 (B) | JIS X 0208, "KanjiTalk 6 non-PostScript" (row+10 verticals, NEC gaiji) variant used on classic Mac OS |
3/4 | 4/2 (B) | JIS X 0208, with UTC-style mapping of em dash / horizontal bar character |
3/5 | 4/2 (B) | JIS X 0208, Open Group version for JIS-Roman based EUC-JP |
3/6 | 4/2 (B) | JIS X 0208, Open Group version for ASCII-based EUC-JP |
3/7 | 4/2 (B) | JIS X 0208, Open Group version for Microsoft-style EUC-JP |
3/8 | 4/2 (B) | JIS X 0208, version encoded by IBM-954 |
3/9 | 4/2 (B) | JIS X 0208, DoCoMo JIS emoji |
3/10 | 4/2 (B) | JIS X 0208, KDDI JIS emoji, symbolic zodiac variant |
3/11 | 4/2 (B) | JIS X 0208, SoftBank JIS emoji |
3/12 | 4/2 (B) | JIS X 0208, KDDI JIS emoji, pictorial zodiac variant |
3/13 | 4/2 (B) | JIS X 0208, Fujitsu version |
3/14 | 4/2 (B) | JIS X 0208, ARIB STD-B.24 version |
3/15 | 4/2 (B) | JIS C 6226 / X 0208-1983 |
2/0 3/0 | 4/2 (B) | "KanjiTalk 7" variant (row+84 verticals, non-NEC gaiji) used on classic Mac OS, Apple mappings |
2/0 3/1 | 4/2 (B) | "PostScript" / "KanjiTalk 6 PostScript" variant (row+84 verticals, NEC gaiji) used on classic Mac OS, Apple mappings |
3/0 | 4/3 (C) | KS C 5601-1987, but using old-UTC mappings for the non-syllables |
3/1 | 4/3 (C) | KS X 1001-1998 Wansung code. The Euro sign update, also adding the registered trademark sign, and matching the WHATWG mapping. |
3/2 | 4/3 (C) | KS X 1001-2002 (adding the South Korean postal mark) |
3/3 | 4/3 (C) | KS X 1001-1987 extended, main plane of Apple/Elex extension (HangulTalk), updated mappings |
3/4 | 4/3 (C) | KS X 1001-1987, using IBM mappings |
3/5 | 4/3 (C) | KS X 1001-1987 extended, main plane of Apple/Elex extension (HangulTalk), old Apple mappings |
3/6 | 4/3 (C) | KS X 1001-1987 extended, main plane of Apple/Elex extension (HangulTalk), Apple mappings |
3/15 | 4/3 (C) | KS C 5601-1987 Wansung code, using new-UTC mappings (harmonious with Microsoft and WHATWG) |
3/0 | 4/4 (D) | JIS X 0212 with va/vi/ve/vo |
3/1 | 4/4 (D) | JIS X 0212, Open Group version for JIS-Roman based EUC-JP |
3/2 | 4/4 (D) | JIS X 0212, Open Group version for ASCII-based EUC-JP |
3/3 | 4/4 (D) | JIS X 0212, Open Group version for Microsoft-style EUC-JP |
3/4 | 4/4 (D) | JIS X 0212, version encoded by IBM-954 |
3/5 | 4/4 (D) | JIS X 0212, version encoded by ICU's EUC-JP |
3/15 | 4/4 (D) | JIS X 0212:1990 |
3/0 | 4/5 (E) | CCITT Hanzi Code, with a more conventional mapping of the lowercase gs (appropriate for their GB 18030 reference glyphs) |
3/1 | 4/5 (E) | CCITT Hanzi Code, combined with an additional hanzi extension in row 8 |
3/2 | 4/5 (E) | GB 6345.1-1986 |
3/3 | 4/5 (E) | GB 8565.2-1988 |
3/4 | 4/5 (E) | Pseudo-G8, an incorrect version of GB 8565.2-1988 which had been referenced by older versions of the Unihan database (incorrectly shifts the actual GB 8565.2 characters 15-90 through 15-93 back by one code point over 15-89, and also includes the row 8 hanzi extensions and most of the CCITT hanzi extensions). |
3/15 | 4/5 (E) | CCITT Hanzi Code (GB 2312 variant) from ITU T.101-C, which bases it on GB 6345.1-1986 and GB 8565.2-1988 with further adjustments and expansions |
3/0 | 4/7 (G) | CNS 11643 plane 1, recommended version (default) |
3/1 | 4/7 (G) | CNS 11643 plane 1, mapped from Microsoft Big-5 |
3/2 | 4/7 (G) | CNS 11643 plane 1, according to UTC mappings |
3/3 | 4/7 (G) | CNS 11643 plane 1, mapped from UTC Big-5 |
3/4 | 4/7 (G) | CNS 11643 plane 1, mapped from Macintosh-compatible Big-5 |
3/5 | 4/7 (G) | CNS 11643 plane 1, as officially defined in Taiwan |
3/6 | 4/7 (G) | CNS 11643 plane 1, an IBM-related variant |
3/7 | 4/7 (G) | CNS 11643 plane 1, mapped from IBM Big-5 |
3/8 | 4/7 (G) | CNS 11643 plane 1, mapped from IBM's Microsoft-style Big-5 |
3/9 | 4/7 (G) | CNS 11643 plane 1, mapped from WHATWG/HTML5 Big-5 |
3/10 | 4/7 (G) | CNS 11643 plane 1, mapped from Mozilla Big-5 |
3/11 | 4/7 (G) | CNS 11643 plane 1, per ICU ISO-2022-CN mappings |
3/12 | 4/7 (G) | CNS 11643 plane 1, per ICU EUC-TW 2014 mappings |
3/13 | 4/7 (G) | CNS 11643 plane 1, per Yasuoka's mappings |
3/1 | 4/8 (H) | CNS 11643 plane 2, Big5 mappings |
3/15 | 4/8 (H) | CNS 11643 plane 2 |
3/0 | 4/9 (I) | CNS 11643-1988 plane 14 |
3/1 | 4/9 (I) | CNS 11643-1988 plane 14 with extensions, as submitted to the IRG |
3/2 | 4/9 (I) | CNS 11643-2007 plane 3 |
3/3 | 4/9 (I) | CNS 11643-2007 plane 3, plus the additional assignments from CNS 11643-1988 plane 14 (default) |
3/4 | 4/9 (I) | CNS 11643-1988 plane 14, UTC mappings (partial, with extensions) |
3/5 | 4/9 (I) | CNS 11643-1992 plane 3, per former ICU ISO-2022-CN-EXT mappings |
3/6 | 4/9 (I) | CNS 11643-1992 plane 3, per ICU EUC-TW 2014 mappings |
3/7 | 4/9 (I) | CNS 11643-1992 plane 3, per Yasuoka's mappings |
3/15 | 4/9 (I) | CNS 11643-1992 plane 3 |
3/0 | 4/10 (J) | CNS 11643-1992 plane 4, as officially defined in Taiwan |
3/1 | 4/10 (J) | CNS 11643-1992 plane 4, per former ICU ISO-2022-CN-EXT mappings |
3/2 | 4/10 (J) | CNS 11643-1992 plane 4, per ICU EUC-TW 2014 mappings |
3/3 | 4/10 (J) | CNS 11643-1992 plane 4, per Yasuoka's mappings |
3/15 | 4/10 (J) | CNS 11643-1992 plane 4 |
3/0 | 4/11 (K) | CNS 11643-1992 plane 5, as officially defined in Taiwan |
3/1 | 4/11 (K) | CNS 11643-1992 plane 5, per former ICU ISO-2022-CN-EXT mappings |
3/2 | 4/11 (K) | CNS 11643-1992 plane 5, per ICU EUC-TW 2014 mappings |
3/3 | 4/11 (K) | CNS 11643-1992 plane 5, per Yasuoka's mappings |
3/15 | 4/11 (K) | CNS 11643-1992 plane 5 |
3/0 | 4/12 (L) | CNS 11643-1992 plane 6, as officially defined in Taiwan |
3/1 | 4/12 (L) | CNS 11643-1992 plane 6, per former ICU ISO-2022-CN-EXT mappings |
3/2 | 4/12 (L) | CNS 11643-1992 plane 6, per ICU EUC-TW 2014 mappings |
3/3 | 4/12 (L) | CNS 11643-1992 plane 6, per Yasuoka's mappings |
3/15 | 4/12 (L) | CNS 11643-1992 plane 6 |
3/0 | 4/13 (M) | CNS 11643-1992 plane 7, as officially defined in Taiwan |
3/1 | 4/13 (M) | CNS 11643-1992 plane 7, per former ICU ISO-2022-CN-EXT mappings |
3/2 | 4/13 (M) | CNS 11643-1992 plane 7, per ICU EUC-TW 2014 mappings |
3/3 | 4/13 (M) | CNS 11643-1992 plane 7, per Yasuoka's mappings |
3/15 | 4/13 (M) | CNS 11643-1992 plane 7 |
3/0 | 4/14 (N) | KPS 9566-2003 (only the main plane unless in the UHC DOCS) |
3/1 | 4/14 (N) | KPS 9566-2011 (only the main plane unless in the UHC DOCS) |
3/2 | 4/14 (N) | All KPS 9566 editions overlayed (but only the main plane unless in the UHC DOCS) |
3/15 | 4/14 (N) | KPS 9566-97 |
[61] 私用終端バイトの指示列に対するものは Fp 参照。
[23] JIS X 0208 の実装のほとんどは、 IRR なしの ESC $ B のまま JIS X 0208-1990 を実装 (= 2文字追加) していました。
[25] RFC 1468 ISO-2022-JP は、 IRR を使用しないで JIS X 0208-1990 を使おうとしていました。
[22]
DECの文字コードとしての ISO-2022-JP 等は、
IRR なしの ESC $ B が JIS X 0208-1990
であるとしています。
[24] JIS X 0208:1997 のRFC1468符号化表現は、 ESC $ B が JIS X 0208:1997 であるとしています。
[20]
ctext
では IRR
は使いません。
常に上方交換なので最新版とみなせるのだとされています。
[26] ISO-IR 165, JIS X 0213:2000 第1面, JIS X 0213:2004 第1面は IRR 付きになってもよさそうなものでしたが、 使われずに新しい符号化図形文字集合として登録されました。
[39] KS X 1001 や KPS 9577 も改訂版が IRR 付きになってもよさそうなものですが、 ISO-IR に登録されていません。
[45] 公開テキスト指示シーケンスでは JIS X 0208-1990 の記述に使われています。
[53]
ISO-IR 72 を supersedes する ISO-IR 173 がに登録されました。
どちらも94集合で終端バイトは 6/4 とされています。
[54] ISO-IR 173 には元空き領域に図形文字が追加されていますが、 ISO 2375 4.4.2 に従いエスケープシーケンスを改めずに改正したと書かれています。
[55] 当時の ISO 2375 がどんな規定だったのかわかりませんが、 登録が JIS X 0208-1990 (ISO-IR 168) より後ですから、 IRR はあったはずで、それにも関わらずこんな登録が行われたのです。
[19]
ISO/IEC 10646 で利用できるのかどうかは不明瞭です。
[46]
ISO/IEC 2022 character abstract syntax
では元の符号化文字集合の ISO-IR 登録番号と
IRR
の改訂番号を組合せて使います。