私用 (Unicode)

[22] Unicode の私用域 (private use area) は、 Unicode Standard で特定の意味が規定されず、利用者等が用途を定めることができる符号位置群です。

代替

[93] 私用文字は、相互運用性に問題があるため、使うべきではありません (>>12)。文字化けの巣窟です。

[94] 外字の情報交換には、私用文字を使わない方法を用いるべきです。外字

仕様書

[123] The Unicode Standard, Version 13.0 - ch02.pdf, 2020-03-09T17:53:32.000Z, 2020-12-20T08:35:03.323Z https://www.unicode.org/versions/latest/ch02.pdf#G14527
[121] The Unicode Standard, Version 13.0 - ch03.pdf, 2020-03-09T17:53:34.000Z, 2020-12-20T02:08:18.239Z https://www.unicode.org/versions/latest/ch03.pdf#G2212
[44] The Unicode Standard, Version 13.0 - ch23.pdf, 2020-03-09T17:53:52.000Z, 2020-12-17T05:54:04.634Z https://www.unicode.org/versions/latest/ch23.pdf#G19184

意味

[122] 私用 (しよう) (Private-Use) は、符号点型の1つです。 >>121 D10a General Category Co と同義です。 >>123

[77] 私用文字 (private-use character) は、割り当てられた Unicode符号位置であって、その解釈は The Unicode Standard では規定されず、当事者間の私的な合意によって決定されるものです。 >>44

[112] 「割り当てられた」というのは未割当の符号位置に対するものです。非文字も未割当扱いです。

[7] 他の文字コードとの変換表で対応関係が規定されている場合、実装者が内部的に用いる場合、実装者が規定して利用者に提供する場合、フォントが規定して利用者に提供する場合、利用者が自ら規定して用いる場合があります。

[78] 私用文字は、よく end-user defined character (EUDC) として使われます。 >>44 外字エディタのような一般の利用者が外字を定義できる仕組みが用意されていることがあります。

[79] プラットフォームやアプリケーションやフォントの開発者が、予め定めた独自の割当の文字が私用文字として提供されていることがあります。

符号点

[76] Unicode の私用域 (Private Use Area) (PUA) は、主、副A、副Bの 3つの領域から構成されます。

[65] primary Private Use Area は、 U+E000 - U+F8FF の6400個の私用文字 (private-use character) です。 >>44

[66] primary Private Use Area は、 U+F8FF から始まり符号位置が小さくなっていく corporate use subarea と、 U+E000 から始まり符号位置が大きくなっていく end-user subarea に二分されます。 >>44

[70] この分割は、プラットフォームで定義された私用文字と末端利用者が定義する私用文字との衝突の可能性を減らすための慣行で、規定ではありません。分割点は定義されておらず、衝突の回避の手法も実装と末端利用者依存とされています。あくまで便法として提案されたものに過ぎないため、この区分を採用しなくても構いません。 >>44

[67] corporate use subarea は、システム事業者やソフトウェア開発者が内部用に私用文字を予約したいとき、好ましい (preferred) 領域です。完全に内部用で末端利用者には見えないもの、例えば操作の指示のようなものに使っても構いませんし、事業者規定の文字の割当として出版して応用や末端利用者の利用に供しても構いません。 >>44

[68] ただし情報交換可能でない内部用の指示の類には非文字を使うのが好ましい (preferred) です。 >>44

[69] end-user subarea は、末端利用者が文字を定義したり、末端利用者アプリケーションが文字を割り当てていくための領域として使ったりする想定です。 >>44

[73] Supplementary Private Use Area-A は U+F0000 - U+FFFFD、 Supplementary Private Use Area-B は U+100000 - U+10FFFD で、合計131068個の私用文字です。 primary PUA で足りない時に使えます。 >>44

[74] 私用文字としての用法は primary PUA も両 supplementary PUA もまったく同じです。 supplementary PUA には corporate use, end-user の区分はありません。

[82] 第15面 U+F0000 - U+FFFFF, 第16面 U+100000 - U+10FFFF は、非文字 U+FFFFE, U+FFFFF, U+10FFFE, U+10FFFF を除き、すべて私用文字に割り当てられています。この2つの面を私用面 (Private Use Plane) (PUP) と呼ぶことがあります。

特性

[89] 私用域の符号位置にも、他の符号位置と同じように特性値が決められています。しかし私的な同意に基づく上書きも認められています。文字特性

安定性

[80] Unicode の私用文字の符号位置は、恒久的に私用に割り当てられています。 >>44

[81] Unicode Consortium が特定の標準の文字の割当を承認したり文書化したりすることはありません。 >>44

[87] 私用文字としての利用実績が、 Unicode への文字の追加の如何やその技法の決定に直接影響を及ぼすことはありません。 >>44

[88] Unicode へ文字の追加を提案する人達が、フォントや国内規格の PUA に提案する文字を並べて事前に使っていることは珍しくありません。しかしそれが PUA 内の符号位置のまま標準化されることはあり得ませんし、別に追加されることになったとしても文字の配列順が変更されることはよくあります。

[84] かつて ISO/IEC 10646 は U-60000000 - U-7FFFFFFF, U-00E00000 - U-00FFFFFF も私用としていました。

[85] この領域を使っていた実装もありました。

[86] ところがこの領域は Unicode では表せないということで、ばっさり消し去ってなかったことにされました。

文脈

[119] 任意の Unicode文字を受け付けるプロトコルやマーク付け言語やデータ形式は、私用文字の利用にも特に制限は設けていません。

[120] XMLの名前のように、識別子系の構文は私用文字を認めないことが多いようです。

[125] なぜか IDS でも利用が認められています。

処理

[114] 私用文字を特別に扱わず、ただの符号位置として扱う実装も少なくありません。実は多くの処理はそれでいいのかもしれません。

[115] プラットフォームによっては EUDC の仕組みが組み込まれています。アプリケーションはただの符号位置と扱うだけで、利用者がプラットフォームを介して定義した外字を使うことができます。

[116] 多くのプロトコルやマーク付け言語は、私用文字に対して特別な扱いを設けていません。意図したものにせよ、そうでないにせよ、現実に私用文字はそれなりに使われ、それなりに流通しています。従って入出力時に私用文字だからという理由で除去したり U+FFFD に置換したりするのは、データの破壊につながります。

[117] 適合性検査器や lint のような検査ツールの類は、私用文字を検出して警告するべきでしょう。

[118] データの互換性と相互運用性のため、フォントが明示的に指定され埋め込まれている場合を除いて、私用文字は常に未割当符号位置のように表示し、なるべく入力させなくする方が安全かもしれません。

相互運用性

[12] 私用文字は、その性質上、相互運用性はまったく期待できません。書き捨ての文書など例外的な場合を除き、使うべきではありません。また他の誰がどのような用途で用いているかわかりませんから、内部処理用にも使うべきではありません。

[71] たとえ corporate use subarea であっても、異なる事業者の定義した私用文字の相互の衝突の回避の方法は用意されていません。どの事業者の定義を採用したか記述する方法も用意されていません。

[72] 利用者間の私用文字の相互の衝突の回避の方法は用意されていません。私用文字の定義を記述し交換する標準的な方法もありません。

[95] 同じプラットフォームであっても、違うフォントに切り替えるだけで、私用文字は文字化けしてしまう可能性があります。

[96] フォント依存の私用文字は、フォント名を指定できるワープロなどでは保持できますが、同じフォントを持たない別のシステムでは文字化けします。

[97] PDF として保存する場合は、フォントを埋め込むなら同じ私用文字が再現されるはずです。埋め込みしないなら私用文字を使ってはいけません。

[98] Web では Web Fonts を使えば私用文字を利用できます。取り回しに難がありますから、できれば避けるべきです。 Web Fonts を使えないときは使うべきではありません。

[99] 私用文字の一貫した扱いのためには、グリフデータの他に、特性も共有する必要があります。しかし The Unicode Standard はその手段を定義していません。 >>44 他に一般的な手法もありません。特定のアプリケーションだけで使える仕組みは探せばあるかもしれませんが、可搬性はありません。

歴史

[83]

私用面 (private use planes)
この符号化文字集合中の面であって、この規格群で文字を規定しない面 (10. 参照)。 (JIS X 0221‐1:2001 4.31)

[42] JIS X 0221‐1:2001

10. 私用の群、面及び領域
10.1 私用文字
この規格群では、私用文字にはいかなる制限も加えない。私用文字は、利用者定義の文字を備えるのに使用できる。例えば、これは、漢字の用字の利用者には一般的な要件となる。
備考私用文字の意味のある交換のためには、この規格群とは別に、送受者間の合意が必要となる。
私用文字は、動的に再定義可能な文字の適用業務に使用できる。
備考動的に再定義可能な文字の意味のある交換のためには、この規格群とは別に、送受者間の合意が必要となる。この規格群は、動的に再定義可能な文字の定義又は設定の技法を規定しない。

動的に再定義可能な文字というのは、 JIS X 0202 で言う動的再指定可能文字のことです。

10.2 私用文字の符号位置
群 60〜7F の32個の符号位置は、私用とする。
群 00 の面 0F 及び面 10 並びに面 E0〜FF の32個の面の符号位置は、私用とする。
基本多言語面の6400個の符号位置 E000〜F8FF は、私用とする。
これらの符号位置の内容は、この規格群では規定しない (10.1 参照)。

[43] 同じ JIS X 0221‐1:2001 の 11. 備考には、

この規格で規定する文字の名前及び符号位置を、この規格群の将来の改正で変更する意図はない。

... と書いてありますけど、私用文字はその意図の範囲外なのでしょう。 (私用文字は符号位置を規定するけど内容 (文字) は規定しないから?)

利用例

[143] 私用文字の割当

range: 範囲
desc: 説明
src: 出典

desc: RFC 1345
src: >>21
range: [ U+E000, U+E028 ]

desc: Hatena::Emoji
range: [ U+E000, U+E03F ]

desc: BLISSYMBOLICS65
range: [ U+E000, U+E0AF ]
src: >>141

range: [ U+E000, U+E0DF ]
src: >>151

range: [ U+E000, U+E0E3 ]
desc: 源暎こぶり明朝等
src: 濁点と半濁点の文字

range: [ U+E000, U+E0FF ]
desc: 希顶语

range: [ U+E000, U+E2FF ]
desc: Musa

range: [ U+E000, U+EFFF ]
desc: Wenlin

range: [ U+E000, U+F848 ]
desc: Big5 (含: CP950, UAO, HKSCS)

desc: CSUR, UCSUR
range: [ U+E000, U+EDFF ]

desc: 漢陽PUA
range: [ U+E000, U+F8FF ]

desc: MUFI
range: [ U+E000, U+F8FF ]

desc: 登記統一文字
range: [ U+E000, U+F8FF ], [ U+F0000, U+103FFF ]

src: >>157
desc: にしき的フォント
range: [ U+E000, U+F8FF ], [ U+F0000, U+100FFF ]

range: [ U+E001, U+E0A0 ]
desc: 済州書体

desc: MathML
range: [ U+E200, U+F804 ]

desc: ARIB STD-B62
range: [ U+E081, U+E7F3 ]

src: >>158
range: [ U+E800, U+E8FF ]

desc: MARC (CCCII)
range: [ U+E8B0, U+EA04 ]

range: [ U+EC00, ... ]
desc: ARIB DRCS ARIBの文字コード

desc: ROVSTD
range: [ U+EE00, U+EE8B ]
src: >>141

desc: 字躰帳変体仮名
range: [ U+F000, U+F035 ]

src: >>1
desc: VietThai
range: [ U+F000, U+F07E ]

desc: OpenType symbol encoding
range: [ U+F000, U+F0FF ] ([ U+F020, U+F0FF ])
src: >>142

range: [ U+F000, U+F0FF ]
src: >>2
desc: Cygwin ASCII ファイル名

range: [ U+F000, U+F7FF ]
desc: Shift-Mojikyo

range: [ U+F000, U+F8FF ]
desc: Linux Zone

range: [ U+F000, U+F8FF ]
desc: SIL Corporate PUA

desc: WGL4
range: [ U+F001, U+F002 ]
src: >>148, >>144, >>159

desc: CDP外字
range: [ U+F137 - U+F6B0 ]

src: >>149
desc: Unicode Corporate Characters used by PfaEdit
range: [ U+F500, U+F580 ]

src: >>144, >>146
desc: Unicode Corporate Use Subarea as used by Adobe Systems
range: [ U+F600, U+F7FF ]

src: >>145, >>146
desc: Apple Unicode corporate-zone characters
range: [ U+F700, U+F8FF ]

src: >>26
desc: x-user-defined
range: [ U+F780, U+F7FF ]

desc: FKOkinawan 沖縄文字
range: [ U+FA80, U+FA9C ]

desc: CSUR
range: [ U+F8A0, U+F8FF ]

desc: CNS 11643
range: [ U+F0000, U+FFFFD ]

desc: Wenlin Private-Use Variation Selectors (PVS)
range: [ U+F0000, U+FFFFD ]

desc: CSUR, UCSUR
range: [ U+F0000, U+10FFFF ]

desc: Hatena::Emoji
range: [ U+FA700, U+FA7FF ]

desc: DRCSTerm
range: [ U+100000, U+10FFFF ]

desc: CITPC私用文字マッピングテーブル
range: [ U+101000, U+104FFF ]

range: [ U-00E00000, U-00E1E337 ]
desc: XEmacs-UCS, XEmacs 21.2 94²文字集合

src: >>140
desc: AH外字 (文字)
range: [ U-00E00000, U-00E0FFFF ]

src: >>133
desc: XEmacs UTF-2000 大漢和辞典等
range: [ U-00E00000, U-00E8FFFF ]

src: >>140
desc: AH外字 (外字)
range: [ U-00E10000, U-00E1FFFF ]

src: >>133
desc: XEmacs UTF-2000 ISO/IEC 2022 図形文字集合
range: [ U-00E90940, U-00FFFFFF ]

desc: XEmacs UTF-2000 漢字
range: [ U-61000000, U-620CFFFF ]

desc: i18n Arena internal encoding
range: [ U-61000000, U-6400FFFF ]

[159] Character design standards - Lowercase for Latin 1 - Typography | Microsoft Docs, alib-ms, 2022-08-27T03:45:29.000Z https://docs.microsoft.com/ja-jp/typography/develop/character-design-standards/lowercase

The fi and fl ligature placed in all fonts released previous to the Unicode 2.0 specification, were set at the beginning of the private use area at positions U+f001 and U+f002.

[26] 文字符号化 x-user-defined は、 [ U+F780, U+F7FF ] を [ 0x80, 0xFF ] と対応付けています。

[140] アンテナハウス外字コード, 2021-08-31T04:40:08.000Z, 2022-06-16T13:06:52.233Z https://www.antenna.co.jp/jan/jan-dialogs_web/i01-0221.html

「アンテナハウス外字コード」 (以下、AH外字コード) は「JIS X0221-1995 (=ISO/IEC 10646-1:1993)」を独自に拡張したものです。AH外字コードは以下の構造をもっています。
① AH外字は JIS X0201-1976、JIS X0208-1990 に定義されていない図形文字です。但し、パソコン(ハードウエア)、ワープロ専用機、パソコンソフトが JISに定義されている文字と同じ字種を別のコードに定義している場合、それを外字扱いとし別のコードを割り振っています。
② AH外字のうち、JIS X0221-1995 に定義されている文字は JIS X0221-1995 のコードを使用しています。特に、JIS X0212-1990 (JIS 第 3 水準) の定義文字はAH外字とし、この文字は JIS X0221-1995 における対応表を採用しています。
③ AH外字のうち JIS X0221-1995 に定義されていない文字は、JIS X0221-1995の私用領域のうち群 00 面 E0 を使用して文字コードを割り当てます。
④ AH外字のうち JIS に定義されている文字と同じ字種については、面 E0 を使います。
⑤ ワープロのユーザ定義文字のコードの交換用に群 00 面 E1 を使用します。

[1] Emacs VietThai environment http://www.m17n.org/vietthai/forEmacs.html

As the proposal for VietThai script to the Unicode is still in progress, we use the Private Use Area for VietThai characters (U+F000..U+F07E). A VietThai font encoded accordingly is also available in the package.

[141] Index of /download/pua, 2022-06-16T13:12:24.000Z http://www.yudit.org/download/pua/

[2] Special filenames ( (2011-03-01 18:26:29 +09:00 版)) http://www.cygwin.com/cygwin-ug-net/using-specialnames.html

[3] Private Use (Unicode) - Wikipedia, the free encyclopedia ( (2012-03-04 20:44:51 +09:00 版)) http://en.wikipedia.org/wiki/Private_Use_(Unicode)#Example_code_point_U.2BF8FF

[4] Bug 16862 – Indexes: GB18030 and Microsoft encodings should support PUA code points ( (2013-10-27 03:50:39 +09:00 版)) https://www.w3.org/Bugs/Public/show_bug.cgi?id=16862

[5] Character Model for the World Wide Web 1.0: Fundamentals ( (2005-02-15 14:24:00 +09:00 版)) http://www.w3.org/TR/charmod/#sec-PrivateUse

[9] JsonWireProtocol - selenium - A description of the protocol used by WebDriver to communicate with remote instances - Browser automation framework - Google Project Hosting ( (2014-10-30 06:29:12 +09:00 版)) https://code.google.com/p/selenium/wiki/JsonWireProtocol#/session/:sessionId/element/:id/value

[10] 5-1a. 錦明朝かな(明朝体フォント) ( (2014-04-19 11:30:08 +09:00 版)) http://www.akenotsuki.com/eyeben/font/nishiki_kana.html#knownissue

[11] WebDriver ( (2014-11-07 11:12:19 +09:00 版)) https://dvcs.w3.org/hg/webdriver/raw-file/default/webdriver-spec.html#character-types

[13] (2005-04-05 10:04:12 +09:00 版) http://www.unicode.org/Public/MAPPINGS/VENDORS/APPLE/CORPCHAR.TXT

[15] w3c/smufl (2015-08-31 11:42:29 +09:00 版) https://github.com/w3c/smufl

SMuFL is a specification that provides a standard way of mapping the thousands of musical symbols required by conventional music notation into the Private Use Area in Unicode’s Basic Multilingual Plane for a single (format-independent) font.

[17] アイコンフォント、絵文字

[18] FORUM21 (2006-03-08 17:20:56 +09:00 版) http://www.forum21.jp/contents/contents6-15.html

バットは920で、プロ選手のなかでも重い方なんですよ。

[19] WebKit on Twitter: "The Pay JS code has landed in open source. https://t.co/AJfKFtdKxy" (2016-06-26 12:48:01 +09:00) https://twitter.com/webkit/status/746441587811508227

[20] Basic message formatting | Slack (Slack著, 2016-07-13 00:57:54 +09:00) https://api.slack.com/docs/message-formatting

The Slack message server and API handle conversion from several binary emoji formats - the Unicode Unified format (used by OSX 10.7+ and iOS 6+), the Softbank format (used by iOS 5) and the Google format (used by some Android devices). These Unicode code points will be converted into their colon-format equivalents.

[21] RFC 1345 - Character Mnemonics and Character Sets (2016-07-13 09:31:02 +09:00) https://tools.ietf.org/html/rfc1345#page-40

[24] XForms 2.0 - XForms Users Community Group (2016-12-11 09:41:21 +09:00) https://www.w3.org/community/xformsusers/wiki/XForms_2.0#External_JSON_values

The content of a string is copied across. Escaped characters are transformed as necessary; characters and escapes that have no equivalent XML character (\b, \f, and characters of the form \uxxxx less than \u0020, except for \u0009, \u000A, and \u000D) are transformed by adding \uE000 to them.

[25] Remove the last 14 characters PUA of GB18030-2005 · Issue #27 · whatwg/encoding (2016-12-20 20:28:47 +09:00) https://github.com/whatwg/encoding/issues/27

[27] Bogus Shift_JIS (2017-05-03 16:11:15 +09:00) https://hsivonen.com/test/moz/bogus_shift_jis.htm

IE6 had the following behaviors:
The bytes 0xFD, 0xFE and 0xFF decode to U+F8F1, U+F8F2 and U+F8F3, respectively.

[28] remove Gecko quirks from shift_jis (annevk著, 2012-04-09 17:25:02 +09:00) https://github.com/whatwg/encoding/commit/651f672ee988702da03f56ad8bdfda00b51a21ea

[29] bug 6180 – EUDC (外字) が表示されない ( (2014-12-19 18:17:50 +09:00 版)) http://bugzilla.mozilla.gr.jp/show_bug.cgi?id=6180

[30] 399369 – Disable font fallback when a character is in the private use areas ( (2014-12-19 18:18:16 +09:00 版)) https://bugzilla.mozilla.org/show_bug.cgi?id=399369

[31] Comments on XML Part 1 from Japanese experts (Murata Makoto著, 1997-05-28 10:48:56 +09:00) https://lists.w3.org/Archives/Public/w3c-sgml-wg/1997May/0612.html

[40] 私用領域をのぞく : ウェブロギスティック雑記 (2019-03-10 21:32:38 +09:00) http://blog.livedoor.jp/itomata/archives/4630030.html

[41] BabelStone

[33] にしき的フォント - TYPVS LITTERARVM NISICIAE (2020-09-09T12:53:21.000Z, 2020-09-11T06:05:46.375Z) http://hwm3.gyao.ne.jp/shiroi-niwatori/nishiki-teki.htm

[45] EACC

[46] 蒙古文字縦書き

[47] Koin変体仮名 (2020-06-19T10:58:38.000Z, 2020-10-19T07:19:19.871Z) http://www10.plala.or.jp/koin/koinhentaigana.html

[50] KPS 9566

[51] CNS 11643 and Big5 comparison tables - HarJIT's Website (2020-09-30T22:18:32.000Z, 2020-10-26T02:59:44.149Z) https://harjit.moe/cns-conc.html

[52] 日本語で書いている「」(福の旧字) (黒字看板, 2020-11-09T03:38:56.000Z, 2020-11-09T03:39:08.992Z) http://kurojikanbandesu.blog102.fc2.com/blog-entry-202.html

「」と書いてあります。「」は、「福」の旧字です。

[53] 「福」を意図したらしい U+E259

[54] 日本語で書いている「」(清の旧字) (黒字看板, 2020-11-09T12:28:51.000Z, 2020-11-09T12:28:54.189Z) http://kurojikanbandesu.blog102.fc2.com/blog-entry-131.html

[55] 日本語で書いている「」(精の旧字) (黒字看板, 2020-11-09T12:29:26.000Z, 2020-11-09T12:29:28.296Z) http://kurojikanbandesu.blog102.fc2.com/blog-entry-124.html

[56] 日本語で書いている「」(黒の旧字) (黒字看板, 2020-11-09T12:31:03.000Z, 2020-11-09T12:31:04.359Z) http://kurojikanbandesu.blog102.fc2.com/blog-entry-115.html

[57] 日本語で書いている「」(都の旧字) (黒字看板, 2020-11-09T12:32:16.000Z, 2020-11-09T12:32:18.070Z) http://kurojikanbandesu.blog102.fc2.com/blog-entry-104.html

[58] 日本語で書いている「靜」(静の異体字) (黒字看板, 2020-11-09T12:34:43.000Z, 2020-11-09T12:35:09.613Z) http://kurojikanbandesu.blog102.fc2.com/blog-entry-79.html

旧字なら、「」+「爭」で「靜」。

[59] GlyphWiki:フォント生成 - GlyphWiki (2020-11-12T02:26:05.000Z) https://glyphwiki.org/wiki/GlyphWiki:%e3%83%95%e3%82%a9%e3%83%b3%e3%83%88%e7%94%9f%e6%88%90#i13

[61] GlyphWiki:フォント対応状況 - GlyphWiki (2020-11-12T02:27:46.000Z) https://glyphwiki.org/wiki/GlyphWiki:%e3%83%95%e3%82%a9%e3%83%b3%e3%83%88%e5%af%be%e5%bf%9c%e7%8a%b6%e6%b3%81

[63] Unicode Character Encoding Stability Policy ( (2013-06-27 23:43:16 +09:00 版)) http://www.unicode.org/policies/stability_policy.html#Property_Value

[6] 第2の外字ファイル | フォント・外字エディタ TTEdit (2020-01-22T23:56:39.000Z, 2020-11-13T08:58:50.275Z) https://opentype.jp/gaijino2.htm

[8] 甲骨文字フォント (2011-09-07T14:54:41.000Z, 2020-11-16T03:06:30.824Z) http://kanji-database.sourceforge.net/fonts/koukotsu/index.html

[126] Nasuフォント ver2014.0925 の合成用濁点・半濁点 - itouhiroはてなブログ, 2020-12-27T12:15:17.000Z http://itouhiro.hatenablog.com/entry/20140925/font

[127] 十八史略僖宗大乱の裡に卒す。 - 寡黙堂ひとりごと, 2021-10-03T07:44:41.000Z https://blog.goo.ne.jp/ta-dash-i/e/aa7bed50c0060eaff34250cc9366faca

改元者五。曰乾符・廣明・中和・光啓・文。

「文」は「文德」であるはず。

[128] 🐊⁧🇺🇲🇲🇾🇫🇴🇹🇦🇷🇺 うみほたる⁦☘️☘︎🍀さんはTwitterを使っています「現在のTwitterのWebフォントは私用領域の U+EA00 にTwitterのロゴ  を置いており、また [‌CHIRPBIRDICON‌] という文字列をタイプすることでそのグリフ  に置き換わるというイースターエッグがありますが(環境によっては表示されず)、当にしき的フォントもそれと互換性を持つようにしてみました。 https://t.co/SzWrzMGF1N」 / Twitter (2021-10-20T03:39:30.000Z, 2021-10-20T05:47:08.590Z) https://twitter.com/Umihotarus/status/1445353417472237570

[129] オジングさん (@ojk7958) / Twitter (2021-10-29T06:09:03.000Z, 2021-10-30T02:06:25.000Z) https://twitter.com/ojk7958

[130] 護流蔵さん (@GORUZOU13) / Twitter (2021-10-31T11:07:54.000Z, 2021-10-31T15:35:10.157Z) https://twitter.com/GORUZOU13

[131] 入管外字

[132] news zeroさんはTwitterを使っています: 「今夜の #newszero は11時30分から放送 ▽首都 #キーウ「#ミサイル攻撃」強化へ…ロシア軍撤退2週間で ▽マリウポリで何が「#アゾフ連隊」元幹部直撃 ▽#北朝鮮記念日ナゼ「軍事パレードなし」 ▽#ツイッター「買収」提案 #イーロン・マスク氏狙いは ▽#りくりゅうペア9歳差ギャップ越え」 / Twitter, 2022-04-15T12:13:40.000Z, 2022-04-15T14:36:51.183Z https://twitter.com/ntvnewszero/status/1514943661762822146

[139] 台北經濟部與利雅德財經部間促進暨保障投資備忘錄-全國法規資料庫, 2022-05-28T23:14:03.000Z https://law.moj.gov.tw/LawClass/LawAll.aspx?pcode=Y0070190

      投資形式之任何變更均不應影響其屬於投資行為之本質;
      「投資報酬」:係指經因投資而產生之獲利,尤指利潤、股息、
        權利金、資本利得或任何類獲利或給付。
      「投資人」:係指雙方任一方之:
        自然人,或公司或法人而具有該方之國籍者;
        任何政府機構或公營公司。

[157] Nishiki-teki PUA Charlist 3.30 - nishiki-teki_pua.pdf, 2022-05-03T10:40:57.000Z, 2022-08-15T05:35:57.860Z https://umihotaru.work/nishiki-teki_pua.pdf

[158] [こかげ] フォント : Nu ワッカオイ, 2020-01-26T15:14:12.000Z, 2022-08-17T07:09:00.310Z http://kokagem.sakura.ne.jp/font/wakkaoi/

[160] Character design standards - Symbol characters for Latin 1 - Typography | Microsoft Docs, alib-ms, 2022-08-27T03:59:30.000Z https://docs.microsoft.com/ja-jp/typography/develop/character-design-standards/symbols

Some TrueType fonts that do not contain support for the Greek language have used the Unicode value in the private use area instead of the lowercase Greek pi Unicode value.

[161] Red Star OS

[162] 2012-01-07T08:35:33.000Z, 2022-10-10T15:05:44.084Z http://yozvox.web.fc2.com/Readme.txt

    ・ Private Area “U+F711~U+F8EA”。このコード割り当ては、
      “charset.info(http://charset.info/)”で以前配布されていた
      “Shift_JIS-2004(JIS X 0213:2004) vs Unicode mapping table”
      (http://charset.info/sjis-2004-std.txt)に記載されている代替用
      “UCS private area mapping”に従っています。なお、現在配布されてい
      る同ファイルには、この代替コードは掲載されていません。

    総てのフォント(一部を除く)には、外字が内蔵されています。通常の外字と
    してShift JISコードでアクセスできるコード範囲に内蔵していますので、
    Unicodeの扱えない(Shift JISだけしか扱えない)アプリからでも使用するこ
    とができます。

[163] 私用領域をのぞく : ウェブロギスティック雑記, 2022-10-15T11:05:52.000Z http://blog.livedoor.jp/itomata/archives/4630030.html

[164] 渡邉直太@ジェットコースター社長(@REXCOASTER)さん / Twitter, 2022-10-19T15:05:07.000Z, 2022-10-20T02:28:45.357Z https://twitter.com/REXCOASTER

[165] >>164 なにかの絵文字?

[38] GB/T 20542

[14] tenji/n1-nec-hikanji.txt at master · code4sabae/tenji · GitHub, 2022-10-24T11:58:14.000Z https://github.com/code4sabae/tenji/blob/master/data/n1-nec-hikanji.txt

MacJapanese 重複字に U+F87F がついている。 (NEC非漢字というファイル名ですが、マイクロソフト標準キャラクタセットのNEC特殊文字ではなく MacJapaneseの非漢字の一部です。)

[16] Character Encodings - Private Use Agreements - Voynich Unicode - Voynich, 2023-01-11T05:35:25.000Z https://www.kreativekorp.com/charset/pua/VoynichUnicode/block/FF400/

[32] Character Encodings - Private Use Agreements - MirOS - Octets, 2023-01-11T05:36:56.000Z https://www.kreativekorp.com/charset/pua/MirOS/block/EF80/

[167] Character Encodings - Private Use Agreements - Medieval Unicode Font Initiative, 2023-01-11T05:37:29.000Z https://www.kreativekorp.com/charset/pua/MedievalUnicodeFontInitiative/

[168] Character Encodings - Private Use Agreements - Linux - DEC VT Graphics, 2023-01-11T05:39:55.000Z https://www.kreativekorp.com/charset/pua/Linux/block/F800/

[169] Character Encodings - Private Use Agreements - Linux - Keyboard Symbols, 2023-01-11T05:40:10.000Z https://www.kreativekorp.com/charset/pua/Linux/block/F810/

[181] Kreative Software Private Use Area Assignments, 2023-01-11T06:04:01.000Z https://www.kreativekorp.com/miscpages/kspua.shtml

[173] Character Encodings - Private Use Agreements - Fairfax HD, 2023-01-11T05:52:44.000Z https://www.kreativekorp.com/charset/pua/FairfaxHD/

[174] Character Encodings - Private Use Agreements - Fairfax, 2023-01-11T05:52:56.000Z https://www.kreativekorp.com/charset/pua/Fairfax/

[175] Character Encodings - Private Use Agreements - Constructium, 2023-01-11T05:53:09.000Z https://www.kreativekorp.com/charset/pua/Constructium/

[180] Character Encodings - Private Use Agreements - Alco, 2023-01-11T05:55:23.000Z https://www.kreativekorp.com/charset/pua/Alco/

[176] Character Encodings - Private Use Agreements - Apple - Keyboard Function Keys, 2023-01-11T05:54:00.000Z https://www.kreativekorp.com/charset/pua/Apple/block/F700/

[177] Character Encodings - Private Use Agreements - Apple - Hoefler Ornaments, 2023-01-11T05:54:13.000Z https://www.kreativekorp.com/charset/pua/Apple/block/F800/

[178] Character Encodings - Private Use Agreements - Apple - Mac OS Compatibility-A, 2023-01-11T05:54:31.000Z https://www.kreativekorp.com/charset/pua/Apple/block/F840/

[179] Character Encodings - Private Use Agreements - Apple - Mac OS Compatibility-B, 2023-01-11T05:54:56.000Z https://www.kreativekorp.com/charset/pua/Apple/block/F880/

[182] 82346:中国古代の皇帝と暦, 2023-02-15T12:30:53.000Z https://aterui.ws.hosei.ac.jp/kodai/detail.php?id=82346

平 隆郎

漢字注記 &M-050735;

[183] >>182 U+E348 が「㔟」

[184] Private Use Areas - Wikipedia (2023-05-12T23:40:57.000Z, 2023-05-16T03:31:55.050Z) https://en.wikipedia.org/wiki/Private_Use_Areas

[185] GT

[186] 新・新しい日本語を作る会

[194] GitHub - m80126colin/UniHakka: 客家語舊編碼替換套件, 2023-07-05T12:19:13.000Z https://github.com/m80126colin/UniHakka

將客委會、教育部客家語內碼,轉換為 Unicode 標準之套件。

[195] UniHakka 客家語私有碼對應表 - Google スプレッドシート, 2023-07-05T12:19:41.000Z https://docs.google.com/spreadsheets/d/1_OLALrobGqdlMRoBZIgVmx5AnsixFJdgDeqHdrJAwCA/edit#gid=222478151

[196] グループ:筆まめ人名外字4 - GlyphWiki, 2023-07-10T06:07:12.000Z https://glyphwiki.org/wiki/Group:%e7%ad%86%e3%81%be%e3%82%81%e4%ba%ba%e5%90%8d%e5%a4%96%e5%ad%974

[35] [ U+F100, U+F1FF ] が [ 0x00, 0xFF ] っぽい表示になるのはどういう現象なのだろう?

[37] 文字関係

key: manakai:private
desc: 私用のビット組合せまたは符号位置への割当またはその他のビット組合せまたは符号位置への非標準の割当。

[197] PUA used for IIT mapped to UCS · Issue #I5J4T8 · Eiso Chan/irg - Gitee, 2023-11-20T05:25:06.000Z https://gitee.com/eisoch/irg/issues/I5J4T8

[198] Apple-selected Emoji mappings in PUA/EUDC · Issue #I66MZK · Eiso Chan/irg - Gitee, 2023-11-20T05:30:46.000Z https://gitee.com/eisoch/irg/issues/I66MZK

This was originally the own behaviours of Apple and SoftBank, but the PUA range Apple selected is also used for the historical or ongoing unencoded characters in mainland China, Hong Kong SAR and Taiwan Province, which are ideographs mainly, so some app would change the PUA character to the encoded Emoji characters or sequences, that will make the huge confusion for the historical or ongoing unencoded ideographs in the ideographic real name system among our daily lives.

[199] GL-NovantiquaMinamoto/fonts/ttf/GL-NovantiquaMinamoto.ttf at main · Gutenberg-Labo/GL-NovantiquaMinamoto · GitHub, 2023-12-19T04:05:57.000Z https://github.com/Gutenberg-Labo/GL-NovantiquaMinamoto
- [200] GL-Novantiqua-GlyphsList - GL-Novantiqua-GlyphsList.pdf, 2023-12-19T04:06:29.000Z https://raw.githubusercontent.com/Gutenberg-Labo/GL-NovantiquaMinamoto/main/documents/GL-Novantiqua-GlyphsList.pdf#page=3

[201] 角行系文字フォント

[202] アイコンフォント

[203] アソーグ文字 - Tanukipedia (タヌキペディア), 2024-03-06T05:26:35.000Z, 2024-03-11T05:26:52.250Z https://tanukipedia.miraheze.org/wiki/%E3%82%A2%E3%82%BD%E3%83%BC%E3%82%B0%E6%96%87%E5%AD%97

[204] 「暫定正字明朝」ダウンロード - 特定非営利活動法人文字文化協會 (2024-04-17T13:22:20.000Z, 2024-04-18T09:51:48.537Z) https://www.pcc.or.jp/basechar/seijimincho.html

「時」の異體字である「⿰日之」(日偏に之)はUnicode未收錄の文字ですが、國語問題協議會會報『國語國字』で使用頻度が高いため、この文字のみを收めたフォントを作成しました。この文字を私用領域のU+E000に配置してゐます。「IPAmj明朝」を基に作成したフォントですので、「IPAmj明朝」または派生フォント(「暫定正字明朝」など)と組合せてお使ひ下さい。

[90] GitHub - XimcoYuzuriha/Xim_Sans: 自作フォント「Xim Sans」の配布場所, 2024-07-08T05:09:49.000Z https://github.com/XimcoYuzuriha/Xim_Sans/tree/main

[91] EMUFI

[92] 粵切字

[103] GitHub - tonsky/FiraCode: Free monospaced font with programming ligatures, 2024-10-14T02:40:01.000Z https://github.com/tonsky/FiraCode

Plane 15

私用 (Unicode)

代替

仕様書

意味

符号点

特性

安定性

文脈

処理

相互運用性

関連

歴史

利用例