私用域

PUA (Unicode)

[22] Unicode私用域 (private use area) は、 Unicode Standard で特定の意味が規定されず、 利用者等が用途を定めることができる符号位置群です。

用法

[7] 他の文字コードとの変換表で対応関係が規定されている場合、 実装者が内部的に用いる場合、 実装者が規定して利用者に提供する場合、 フォントが規定して利用者に提供する場合、 利用者が自ら規定して用いる場合があります。

[12] その性質上、相互運用性はまったく期待できません。 書き捨ての文書など例外的な場合を除き、使うべきではありません。 また他の誰がどのような用途で用いているかわかりませんから、 内部処理用にも使うべきではありません。

関連

[23] Unicode 以前の文字コードやその実装にも、 外字EUDC自由領域といった呼称で同様の符号位置ビット組合せが用意されていたり、 空き領域を実装が勝手に使ったりしていました。

[36] Unicodeにない文字

利用例

[26] 文字符号化 x-user-defined は、 [ U+F780, U+F7FF ] を [ 0x80, 0xFF ] と対応付けています。

[1] Emacs VietThai environment http://www.m17n.org/vietthai/forEmacs.html

As the proposal for VietThai script to the Unicode is still in progress, we use the Private Use Area for VietThai characters (U+F000..U+F07E). A VietThai font encoded accordingly is also available in the package.

[2] Special filenames ( ( 版)) http://www.cygwin.com/cygwin-ug-net/using-specialnames.html

[3] Private Use (Unicode) - Wikipedia, the free encyclopedia ( ( 版)) http://en.wikipedia.org/wiki/Private_Use_(Unicode)#Example_code_point_U.2BF8FF

[4] Bug 16862 – Indexes: GB18030 and Microsoft encodings should support PUA code points ( ( 版)) https://www.w3.org/Bugs/Public/show_bug.cgi?id=16862

[5] Character Model for the World Wide Web 1.0: Fundamentals ( ( 版)) http://www.w3.org/TR/charmod/#sec-PrivateUse

[6] 1054817 – Icon fonts don't work when "allow pages to choose their own fonts" is unchecked ( ( 版)) https://bugzilla.mozilla.org/show_bug.cgi?id=1054817

[8] 789788 – Not allowing pages to choose their own fonts breaks with icon fonts ( ( 版)) https://bugzilla.mozilla.org/show_bug.cgi?id=789788

[9] JsonWireProtocol - selenium - A description of the protocol used by WebDriver to communicate with remote instances - Browser automation framework - Google Project Hosting ( ( 版)) https://code.google.com/p/selenium/wiki/JsonWireProtocol#/session/:sessionId/element/:id/value

[10] 5-1a. 錦明朝かな(明朝体フォント) ( ( 版)) http://www.akenotsuki.com/eyeben/font/nishiki_kana.html#knownissue

[11] WebDriver ( ( 版)) https://dvcs.w3.org/hg/webdriver/raw-file/default/webdriver-spec.html#character-types

[13] ( 版) http://www.unicode.org/Public/MAPPINGS/VENDORS/APPLE/CORPCHAR.TXT

[14] Ligature Symbols (Kazuyuki Motoyama 著, 版) http://kudakurage.com/ligature_symbols/

[15] w3c/smufl ( 版) https://github.com/w3c/smufl

SMuFL is a specification that provides a standard way of mapping the thousands of musical symbols required by conventional music notation into the Private Use Area in Unicode’s Basic Multilingual Plane for a single (format-independent) font.

[16] ( 版) http://www.arib.or.jp/english/html/overview/doc/2-STD-B24v5_1-1p3.pdf#page=156

DRCS の文字は、基本多言語面の私用領域に対応付ける。

私用領域の利用にあたっては、DRCS は EC 区 00 点から順次用いることとする。

[17] ( 版) http://247dieter.com/

<input type="text" placeholder="気になるワードを入力" value="" name="s" id="s" />

<button type="submit" id="searchsubmit"></button>

フォント指定で Font Awesome (虫眼鏡アイコン)
[18] FORUM21 ( 版) http://www.forum21.jp/contents/contents6-15.html

バットは920で、プロ選手のなかでも重い方なんですよ。

[19] WebKit on Twitter: "The Pay JS code has landed in open source. https://t.co/AJfKFtdKxy" () https://twitter.com/webkit/status/746441587811508227

[20] Basic message formatting | Slack (Slack著, ) https://api.slack.com/docs/message-formatting

The Slack message server and API handle conversion from several binary emoji formats - the Unicode Unified format (used by OSX 10.7+ and iOS 6+), the Softbank format (used by iOS 5) and the Google format (used by some Android devices). These Unicode code points will be converted into their colon-format equivalents.

[21] RFC 1345 - Character Mnemonics and Character Sets () https://tools.ietf.org/html/rfc1345#page-40

[24] XForms 2.0 - XForms Users Community Group () https://www.w3.org/community/xformsusers/wiki/XForms_2.0#External_JSON_values

The content of a string is copied across. Escaped characters are transformed as necessary; characters and escapes that have no equivalent XML character (\b, \f, and characters of the form \uxxxx less than \u0020, except for \u0009, \u000A, and \u000D) are transformed by adding \uE000 to them.

[25] Remove the last 14 characters PUA of GB18030-2005 · Issue #27 · whatwg/encoding () https://github.com/whatwg/encoding/issues/27

[27] Bogus Shift_JIS () https://hsivonen.com/test/moz/bogus_shift_jis.htm

IE6 had the following behaviors:

The bytes 0xFD, 0xFE and 0xFF decode to U+F8F1, U+F8F2 and U+F8F3, respectively.

[28] remove Gecko quirks from shift_jis (annevk著, ) https://github.com/whatwg/encoding/commit/651f672ee988702da03f56ad8bdfda00b51a21ea

[29] bug 6180 – EUDC (外字) が表示されない ( ( 版)) http://bugzilla.mozilla.gr.jp/show_bug.cgi?id=6180

[30] 399369 – Disable font fallback when a character is in the private use areas ( ( 版)) https://bugzilla.mozilla.org/show_bug.cgi?id=399369

[31] Comments on XML Part 1 from Japanese experts (Murata Makoto著, ) https://lists.w3.org/Archives/Public/w3c-sgml-wg/1997May/0612.html

[32] LINE API Reference () https://devdocs.line.me/ja/#send-message-object

Textにはemoticonを含めることができます。emoticonはUnicodeで管理されていますので、文字コードを変換してご利用ください。

右の例では文字コード(0x1000B2)を使用しています。ブラウザでは文字化けしていますが、LINE上では正常に表示することができます。

() https://devdocs.line.me/files/emoticon.pdf

[33] U+100000 - U+1000FF絵文字が割り当てられている。 普通に Unicode に含まれる絵文字も少なくない気がするが。。。

[34] ご利用方法について|国税庁法人番号公表サイト ( ()) http://www.houjin-bangou.nta.go.jp/website/riyo-hoho/

商号又は名称、所在地にシステム外字(規格外の文字)が含まれている場合は、「登記記録等における表記」も併せて印刷されます。

[35] Character Description Language - Wenlin Guide () http://guide.wenlininstitute.org/wenlin4.3/Character_Description_Language

Wenlin Variation Sequences depend on Wenlin CDL font support: Wenlin uses a whole plane of Private-Use Area (PUA) characters (U+F0000..U+FFFFD), to define its own Private-Use Variation Selectors (PVS). Wenlin uses these PVS to define Wenlin’s own Private Variation Sequences, used to manage glyph variation in the CDL Database.