[1] ISO/IEC 10646 は、 UCS (Universal Multiple-octet Coded Character Set、 (多オクテットの) 国際符号化文字集合) を規定する ISO/IEC の国際標準です。
[2] UCS は、4オクテット (厳密には31ビット) の符号空間に世界中の文字を符号化しています。 ISO/IEC JTC1/SC2(/WG2) によって開発されています。
[5] Unicode Consortium によって開発されている Unicode Standard と事実上同じ符号化文字集合となっていて、両者は共同で標準化作業を行っています。 このため、稀に Unicode と ISO/IEC 10646 の総称を UCS と呼ぶこともあります。
[18] 政治的にやむを得ない場合を除き、 Unicode ではなく ISO/IEC 10646 を使うべき場面はありません (>>14)。
[8] 符号位置を8ビットごとに区切って上位のオクテットから順に群、面、 区、点といいます。
[9] 十六進数により U-HHHHHHHH
とも表記します (十六進数部分は8桁固定)。また0群
0面-16面は U+HHHH
とも表記します (十六進数部分は4-6桁可変)。
[7] 現在または過去の ISO/IEC 10646 は次の符号化文字集合を規定しています。
[6] Unicode Consortium が Unicode の文字について Unicode Character Database として詳細な情報を公開しているのに対し、 ISO/IEC 10646 は附属書にわずかに説明があるだけで、 代表字形と文字の名前以外の情報はほとんど含まれていません。 (Unicode ではなく) UCS を実用レベルで実装するのはほとんど不可能と思われます。
[4] JIS は日本語版を JIS X 0221 として出版しています。 (ただし基本的に数年遅れのようです。政治的理由から JIS を参照しなければならない場面以外に、 実用的な価値は皆無です。)
[37] 古い ISO/IEC 10646 は、 実装水準を 1、 2、 3 の3種類定義していました。 現在の ISO/IEC 10646 ではこの区分は廃止されており、 実装水準3相当となっています。
[38]
ISO/IEC 2022 エスケープシーケンス DOCS
[39]
実装水準1では、
結合文字 (附属書B.1) と、
HANGUL JAMO
ブロックの文字をつかってはなりません。
[40]
実装水準2では、
附属書B.2の文字
(B.1の一部および HANGUL JAMO
)
をつかってはなりません。
[41] 実装水準1と実装水準2では、 インド系文字に関する unique-spelling rule に従わなければなりません。
[13] Unicode と ISO/IEC 10646 は実質的に同じ文字コードですが、 仕様書としてはまったく異なっています。両者の標準化手続きは連動していますが、 両者の出版には時間差があります。
[14] 実用上 ISO/IEC 10646 には実装するのに十分な情報が含まれておらず、 Unicode が広く利用されています。他の標準化団体の仕様書等から ISO/IEC 10646 と Unicode のどちらを引用するべきかという議論も 00年代初期までは盛んに行われていましたが、 Unicode の方が積極的に Web で情報を公開していることもあり、現在では Unicode を参照するのが普通です。
[34] しかも、 初期の版は Unicode とは同内容の別規格という建前を保っていましたが、 何度目かの改訂から徐々に一部の規定で Unicode を参照するようになっています。
[15] 国家機関などで公的標準を参照しなければならない制約があるなど特殊な状況を除き、 ISO/IEC 10646 を使う意味はほとんどありません。
規格番号 | 出版日 | 規格名 | ほぼ相当する Unicode の版 |
---|---|---|---|
1983-07 | 2オクテット規格の提案 | ||
1984-04 | JTC1/SC2/WG2 組織 (JTC1 は当時 TC97) | ||
WD 10646 | 1987 | 1st WD (A案/B案) | |
1987-03 | 符号化方式が決定 (A案) | ||
DP 10646 | 1989-01 | 1st DP | |
1989-10 | draft? | ||
1989-12 | 2nd DP | ||
1990 | CJK-JRG | ||
DIS 10646:1991 | 1990-12-06 | 1st DIS | Information technology: Universal Coded Character Set |
1991-02 | draft? | ||
1991-04 | 1st DIS 投票否決 | ||
1991 | Unicode 化決定 | ||
DIS 10646-1.2:1992 | 1992 | ||
1992-06 | 2nd DIS 投票通過 | ||
ISO/IEC 10646-1:1993 | 1993-05 | Part 1: Architecture and Basic Multilingual Plane | 1.1 |
ISO/IEC 10646-1:2000 | 2000-09-15 | Part 1: Architecture and Basic Multilingual Plane | 3.0 |
ISO/IEC 10646-2:2001 | 2001-11-01 | Part 2: Supplementary Planes | 3.1 |
ISO/IEC 10646-1:2000/Amd.1:2002 | 2002-07-15 | AMENDMENT 1: Mathematical symbols and other characters | 3.2 |
ISO/IEC 10646-1:2000/Amd.2 | 4.0 | ||
ISO/IEC 10646-2:2001/Amd.1 | 4.0 | ||
ISO/IEC 10646:2003 | 2003 | Information technology —— Universal Multiple‐Octet Coded Character Set (UCS) | |
ISO/IEC 10646:2003/Amd.1 | 2005-11-22 | AMENDMENT 1: Glagolitic, Coptic, Georgian and other characters |
[3] 10646 の第一部と第二部を併合するのは Unicode との同期が面倒だかららしいぞ... (名無しさん [sage] 2004-04-07 02:56:20 +00:00)
[19] JIS X 0221-1995 国際符号化文字集合 (UCS) ――第1部 構造及び基本多言語面は、 1995年/平成7年1月1日制定、1月4日官報公示。
[21] ISO/IEC 10646-1:1993 の対応国内規格でした。
[22] JIS 独自の次の附属書がありました。
[23] 附属書1では次の文字集合が定義されていました。
[24] 基本日本文字集合には COMBINING ENCLOSING CIRCLE
が (なぜか) 含まれていたようです。
[25] 基本日本文字集合と追加非漢字集合にはなぜかどちらにも
TILDE
,
HYPHEN
,
OVERLINE
,
IDEOGRAPHIC SPACE
が重複して含まれていたようです。
[20] 2000年/平成12年6月20日確認、2001年/平成13年4月20日廃止。
[26] JIS X 0221-1:2001 国際符号化文字集合 (UCS) ――第1部 構造及び基本多言語面は、 2001年/平成13年4月20日のものです。
[27] ISO/IEC 10646-1:2000 の対応国内規格でした。
[28] 旧 JIS の附属書は規定から参考に変わって存続しています。 おおまかな構成は変わっていないようですが、細かい内容は修正されているようです。
[29] mohta 氏が IETF を通じてに出版した
RFC 1815 は、2つの ISO/IEC 10646 のプロファイルを定義し、
IANA charset として登録しました。
[30] ISO-10646
は、 ISO/IEC 8859-1 相当の部分集合でした。
ISO-10646-J-1
は、 JIS X 0208 と半角文字、全角文字にほぼ相当する部分集合でした。
CJK統合漢字は「J」欄を用いるとしていました。
いずれも非推奨であり、 ISO-8859-1 または
ISO-2022-JP を使うべきとされていました。
All of the parameters contained in the above three headers, except
for the "realm" field, MAY be extended to ISO 10646-1 values using
the framework described in [RFC5987].
[32] ISO/IEC 10646:2017が発行 漢字の国際規格化が完了 | 文字情報基盤整備事業 () http://mojikiban.ipa.go.jp/4825.html
[35] 国際符号化文字集合(UCS) JIS改正原案作成委員会 | IPSJ/ITSCJ (一般社団法人 情報処理学会 情報規格調査会, , ) https://www.itscj.ipsj.or.jp/hyojunka/h_sn_member/h_sn_katsudo/h_sn_katsudo2012/jucs_2012.html