Unicode Standard

Unicode Standard

[2] The Unicode Standard は、 Unicode の中心的な仕様書です。 Unicode Consortium が発行しています。

呼称

[1] TUS は、 The Unicode Standard の略らしい。この略語は Unicoder 界隈でしか通用しない。

[38] 正式文書の事例として、 UAX #45 で略称として使われています。

[9] 頻繁に改訂版が出版されています。 Unicodeの版

[14] Unicode 1.0 は現行版との違いが多々あり、 事実上別仕様と考えるべきものです。

[15] Unicode 1.1 は現行版にかなり近いものですが、 ハングルの大移動前で、 互換性がありません。

[16] Unicode 2.0 以後はおおむね互換性が保たれています。 phi mess のような細部の非互換変更はあります。

[12] 普通は最新版を参照するべきです。

URL

[22] The Unicode Standard の本文は https://www.unicode.org/versions/Unicode13.0.0/ch23.pdf#M9.35858.HeadingBreak.132.Layout.Controls のような URL で章ごとの PDF で提供されています。

[23] https://www.unicode.org/versions/latest/ch23.pdf#M9.35858.HeadingBreak.132.Layout.Controls のような latest とついた URL で、 最新版の The Unicode Standard を参照できます。 ただし、 章番号が変わってしまうとリンク切れしてしまいます。 章構成は過去に何度か変更 (途中に新章を挿入) されているようです。

[24] https://www.unicode.org/versions/Unicode13.0.0/UnicodeStandard-13.0.pdf のような URL で全章まとめた PDF が提供されています。 どこにあるかわからない事項を探すのに便利ですが、 バージョン番号がファイル名に入っているので、 最新版を参照する URL が作れません。

[25] PDF 内の章節や図は素片識別子で直接リンクできます。 素片識別子は、 PDF 文中のリンクや、 PDF ビューアーの目次表示 (Chrome にはないが Firefox にはあります。) で知ることが出来ます。

規定

[6] Unicode Standard では色々な概念が定義されています。

[26] The Unicode Standard

[7] 技術としての全体は Unicode も参照。

[17] 組織と標準化手続きに関しては Unicode Consortium を参照。

ISO/IEC 10646 との関係

[18] 技術的、政治的関係は Unicode を参照。

[19] 仕様書としては The Unicode StandardISO/IEC 10646 はまったくの別物です。

[20] ISO/IEC 10646 の規定内容は、大部分が、やや異なる表現で The Unicode Standard に含まれます。 The Unicode Standard の方がボリュームがあって詳細です。 技術的厳密さはときに ISO/IEC 10646 の方が優れていることも無いでもないですが、 The Unicode Standard の方が実装に必要な情報を豊富に含んでいます。

[21] 近年の ISO/IEC 10646 は多くの項目で The Unicode Standard やその他の Unicode Consortium の仕様書を参照しているため、 単独では使えません。 逆に The Unicode Standard とその他の仕様書は完結していて単独で実装可能です。

仏語版

[27] The Unicode Standard英語で書かれていますが、 その他に一部が仏語に翻訳されたものがあります。


[30] Unicode ConsortiumWebサイトで、 仏語版の符号表が公開されています。 >>28 Unicode 13 のものが公開された >>29 後、 Unicode 14 のものに更新されました。 しかし今後も更新するかは保証しないとされています >>29

[31] 符号表における文字の名前仏語に翻訳されていますが、 規定の一部ではないとされています。 >>29 文字の名前

[32] 文字の名前を始めとする符号表に含まれる情報は、 本来の英語版は UCD に含まれますが、 仏語版は含まれていません。


[34] その仏語符号表の協力者としても名前が挙げられている >>29 Patrick AndriesWebサイトで、 The Unicode Standard 本文や符号表UCD の一部の仏語訳が公開されています。 >>33

[35] このサイトについて Unicode Consortium 側からの正式な言及は見つけられません。 このサイトに言及したメールが UnicodeWebサイトに複数アーカイブされており、 認知はされているようです。

[36] UnicodeWebサイトのものと同じと思われる符号表や、 その元データと思われる UCD の一部ファイルの仏語版がこちらのサイトで公開されています。 そのファイルの貢献者欄には、 Unicode ブログで紹介された協力者の面々が示されています >>37

関連

[8] Unicode Standard 本体に含まれない追加仕様が UAXUTSUTR 各シリーズで発行されています。 追加とはいってもそのうちのいくつかは無視できない重要な技術を定めています。

歴史

[5] 初期は紙の本として(のみ)出版されていたようですが、その後 Unicode Consortium のサイトで無料で PDF が入手できるようになりました。 6 以降は紙の本は発行されていないようです。

[13] その後オンデマンド印刷版を発注できるようになったみたいです。

[10] 仕様書PDF でとても読みにくい。 歴史的にはその方がよかったのでしょうけれども、 今の時代は HTML + SVG + Web Fonts にしてもらった方が読みやすいように思うのですが、 どうにかならないものでしょうか。

[11] 同じ話題でも定義と実装の指針と文字ごとの説明 (と符号表) (と各種 UTR) であちこちに分散して書かれているのが非常に面倒くさい。 しかもそれぞれに似たようなことが少しずつ違う表現で再掲されていたりもして、 解釈するのがとても厳しい。