* 仕様書

[REFS[
- [6] [CITE[[[The Unicode Standard]], Version 12.0 - ch23.pdf]] ([TIME[2019-03-02 07:15:46 +09:00]]) <https://www.unicode.org/versions/latest/ch23.pdf#G14832>
]REFS]

* 意味

[10] 
[DFN[[CC[U+FFFD]]]]
[DFN[[CN[REPLACEMENT CHARACTER]]]]
([DFN[�]])
は、
[CITE[Unicode Standard]]
中の[RUBYB[一般の代用文字][general substitute character]]です。
[SRC[>>6]]

[11] 既存の [[Unicode文字]]に[[写像]]できない、
他の[[符号化]]の「未知」の[[文字]]の代用とすることができます。
[SRC[>>6]]

[12] 
[[ill-formed sequence]] の [[Unicode符号化形]]間の変換で生じた変換エラーを示す手段としても使えます。
[SRC[>>6]]

[21] 
[[非文字]]を
[CODE[U+FFFD]]
に置き換えることがあります。
[SEE[ [[非文字]] ]]

[19] 
[CITE[Encoding Standard]]
は、
入力の[[バイト列]]に不適切で解釈できないものが含まれる時、
これを1個[[以上]]の
[CODE[U+FFFD]]
として出力します。

[20] 
[[HTML構文解析器]]は、
入力に
[CODE[U+0000]]
があるとき、
かわりに
[CODE[U+FFFD]]
として出力します。

* □

[13] 
歴史学などでは摩耗などによる判読不能を [CODE[□]] で表す慣習があります。

[14] 
文字数が推定可能なとき、複数の□を連続させることがあります。
文字数が不明瞭なとき、[[長方形]]を使うことがあります。

[15] 
不確実ながら推定できる[[文字]]があるとき、□の枠内にこれを入れて示すことがあります。
( [DFN[⃞]] )


[16] 
稀に[[△]]を使う例も見られます。
一般の文献では[[○]]や[[×]]など他の[[伏せ字]]を使うことがあります。

[REFS[

[FIG(quote)[
[FIGCAPTION[
[255] [CITE[[LINES[木崎愛吉][旧蔵]]本山コレクション[[金石文]]拓本選]], 
[[関西大学なにわ・大阪文化遺産学研究センター]],
発行日 2008年3月31日,
[TIME[2011-03-24T01:46:00.000Z]], [TIME[2020-11-30T11:36:22.993Z]] <https://www.kansai-u.ac.jp/Museum/naniwa/publication/book12.pdf>
]FIGCAPTION]

PDF 6頁

>
[VRL[
•判読できない文字は□で示した。文字数が不明のときは[ASIS[冂凵][上・下四角(接さず)]]とした。なお、他の資料で判読されている
場合は、□の右側に〔    〕で文字を付し、推測される場合は〔    ヵ〕とした。

]VRL]

]FIG]

]REFS]

[24] [CITE@ja[東洋文庫リポジトリ]], [[NetCommons]], [TIME[2021-11-28T02:39:27.000Z]] <https://toyo-bunko.repo.nii.ac.jp/?action=pages_view_main&active_action=repository_view_main_item_detail&item_id=5671&item_no=1&page_id=25&block_id=47>
PDF 6頁

判読不能の編のみ□ (縦長長方形)、旁は判読された文字要素。

[25] [CITE@ja[RyuseiさんはTwitterを使っています 「https://t.co/CXjQDJXNoP ヒエログリフに提案されている制御文字類、碑文の欠損を表す文字があるのが面白い https://t.co/XmRZKVfSAY」 / Twitter]], [TIME[2022-01-07T01:23:05.000Z]], [TIME[2022-01-07T01:28:28.904Z]] <https://twitter.com/mandel59/status/1479211471628554240>

[26] [CITE@ja[拾萬字鏡さんはTwitterを使っています 「そういえば、日本にも虫損や欠損まで忠実に写しとった写本が存在するけど、こういうの面白い。 https://t.co/vYRSxNmAqZ」 / Twitter]], [TIME[2022-01-07T01:24:14.000Z]], [TIME[2022-01-07T01:28:42.284Z]] <https://twitter.com/JUMANJIKYO/status/1479234575155208192>

[27] 
[CODE[gap]], [CODE[unclear]]

[28] 
[CITE@ja-JP[大覚寺文書 上]], [[大覚寺史資料編纂室]], [TIME[1980.9][1980]], [TIME[2023-11-28T02:04:43.000Z]], [TIME[2023-11-29T04:25:08.304Z]] <https://dl.ndl.go.jp/pid/12208094/1/15> (要登録)


- [35] 
[CITE@ja[Proposal to encode a blank character for Khitan Small Script - 23065-n5205-khitan-small-blank.pdf]], [TIME[2023-03-20T15:16:57.000Z]], [TIME[2024-11-06T02:53:07.624Z]] <https://www.unicode.org/L2/L2023/23065-n5205-khitan-small-blank.pdf>
- [36] 
[CITE@ja[Recommendations to UTC #181 (November 2024) on Script Proposals - 24228-script-wg-report.pdf]], [TIME[2024-11-04T15:55:24.000Z]], [TIME[2024-11-06T02:53:27.372Z]] <https://www.unicode.org/L2/L2024/24228-script-wg-report.pdf#page=11>


[37] 
>>35 [[契丹小字]]用の[CH[□]]。

[38] 
明らかに[[漢字]]の用法からの流用なのに[[漢字]]用はないんだよぬ。


* 関連

[SEE[ [[伏せ字]], [[文字コードの変換]] ]]

* 歴史

[4] [CITE@en[HTML5 Revision Tracker]]
([TIME[2010-07-14 22:40:52 +09:00]] 版)
<http://html5.org/tools/web-apps-tracker?from=5155&to=5156>

* メモ

[3] [[UCS]] を作る時に [CODE(char)[GETA MARK]] と 
[CODE(char)[REPLACEMENT CHARACTER]]
は unify しておくべきだったんじゃないでしょうかね?

[1] [TIME[2002-12-31 11:50]] ''>>0'': 今更言っても無駄無駄。

[5] [CODE(char)[U+001A]] [CODE(charname)@en[SUBSTITUTE]] も[[制御文字]]だけど本来同じもののような。

[2] >>3 [[図形文字の符号化]]w

[7] [CITE@en[U+3013 GETA MARK (〓) - Charinfo]] ([TIME[2017-03-20 11:26:55 +09:00]]) <https://chars.suikawiki.org/string?s=%E3%80%93>

[FIG(quote)[
[FIGCAPTION[
[8] [CITE[''''''[''''''mixi'''''']'''''' 困ったなぁ どうしたの?例〓無駄遣いして金欠'''['''i:163''']''']]
( ([TIME[2017-03-20 11:26:10 +09:00]] 版))
<http://mixi.jp/view_voice_topic.pl?topic_id=63849>
]FIGCAPTION]

> つぶやきネタに答えよう
> 困ったなぁ どうしたの?例〓無駄遣いして金欠たらーっ(汗)

]FIG]

[9] [[文字化け]]ではなく元から「〓」っぽい。


[FIG(quote)[
[FIGCAPTION[
[17] [CITE@ja[算木 - Wikipedia]]
([TIME[2020-04-19 20:21:32 +09:00]])
<https://ja.wikipedia.org/wiki/%E7%AE%97%E6%9C%A8>
]FIGCAPTION]

> また当初「0」は空白だったが、「〇」を書くようになった。718年に瞿曇悉達によりインド数字から導入されたとも'''['''5''']'''、中国語で欠字を表した「□」から来ているとも'''['''7''']'''言われる。

]FIG]


[FIG(quote)[
[FIGCAPTION[
[18] [CITE@ja[古代日本の戸籍制度 - Wikipedia]]
([TIME[2020-04-26 16:16:13 +09:00]])
<https://ja.wikipedia.org/wiki/%E5%8F%A4%E4%BB%A3%E6%97%A5%E6%9C%AC%E3%81%AE%E6%88%B8%E7%B1%8D%E5%88%B6%E5%BA%A6>
]FIGCAPTION]

> 647年(大化3)から664年(天智3)までの間に一括投棄された飛鳥京の木簡に「白髪部五十戸、◎十口」とある。◎は五と思われる。

]FIG]


[22] [CITE[【有料生放送】桑原由気と本渡楓のパリパリパーリィ☆~4th Anniversary Online Parry~Smile Summer Parry~ - 2021/07/06(火) 20:00開始 - ニコニコ生放送]]
([TIME[2021-07-12 19:58:58 +09:00]])
<https://live.nicovideo.jp/watch/lv332607124?ref=qtimetable&zroute=index>


[23] [CITE[kiyo4619.pdf]], [TIME[2013-07-24T04:38:46.000Z]], [TIME[2021-11-23T09:03:20.572Z]] <https://www.kansai-u.ac.jp/Tozaiken/publication/asset/bulletin/46/kiyo4619.pdf#page=15>

>(○は空格、×は判読不能)

-*-*-


[29] <https://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=107388&item_no=1&attribute_id=1&file_no=1>
#page=4

[30] 
[CITE[コーパス用テキストを対象とした文字処理支援ツール「〓箱」-文字校正・処理情報付与作業の効率化- | CiNii Research]], [TIME[2024-02-10T08:39:33.000Z]] <https://cir.nii.ac.jp/crid/1050011097177990144>

[31] 「[RUBY[〓][ゲタ]]箱」というソフトウェア。[[外字]]処理ツールなのでこの名前にしたらしい。

[32] ドキッとする名前だなあ・・・

-*-*-

[FIG(short list data)[ [[文字]]

:[F[文字]]:[CH[〓]]
:[F[関連]]:[CH[�]]
:[F[関連]]:[CH[□]]
:[F[字形類似]]:[CH[=]]
:[F[字形類似]]:[CH[二]]
:[F[字形類似]]:[CH[ニ]]
:[F[字形類似]]:[CH[‖]]

]FIG]

[FIG(short list data)[ [[文字]]

:[F[文字]]:[CH[□]]
:[F[関連]]:[CH[○]]
:[F[関連]]:[CH[△]]
:[F[関連]]:[CH[×]]
:[F[字形類似]]:[CH[口]]
:[F[字形類似]]:[CH[囗]]
:[F[字形類似]]:[CH[ロ]]

]FIG]


[33] [CITE@ja[Xユーザーの上北ふたごさん: 「7月11日 お⃞誕⃞生⃞日⃞お⃞め⃞で⃞と⃞う⃞!⃞ #キュアヤムヤム💛#華満らん #デパプリ #precure https://t.co/Q79YZNxCpl」 / X]], [TIME[午前7:59 · 2024年7月11日][2024-07-10T22:59:05.000Z]], [TIME[2024-07-11T01:51:59.000Z]] <https://x.com/kamikitafutago/status/1811173326745977322>


[34] 
>>33 うちの [[Windows]] では [[Chrome]] でも [[Firefox]] でもうまく合成されずに「お□」のように表示されているのだけど、これを投稿した人には自然に見えているのだろうぬ。


[39] >>33 うちの [[Windows]] の [[Chrome]] だと[CH[お]]から[CH[う]]まではまあまあまともに表示できるけど
[CH[!]] は細くて[CH[□]]がその右揃えで[CH[う]]に重なるように表示される。また、
他の[[仮名]]も微妙に[[文字幅]]が違ってるせいで不規則に歪んでいるように思える。
[TIME[2025-10-19T07:01:55.000Z]]


[40] [CITE@ja[BA67898227_2004_048_049.pdf]], [TIME[2013-08-14T16:30:16.000Z]], [TIME[2025-12-16T03:42:16.275Z]] <https://repository.nabunken.go.jp/dspace/bitstream/11177/797/1/BA67898227_2004_048_049.pdf#page=2>

[41] >>40
残画からの推定と内容からの推定を区別している