置換文字

仕様書

意味

[10] U+FFFD REPLACEMENT CHARACTER () は、 Unicode Standard 中の一般の代用文字 (general substitute character) です。 >>6

[11] 既存の Unicode文字写像できない、 他の符号化の「未知」の文字の代用とすることができます。 >>6

[12] ill-formed sequenceUnicode符号化形間の変換で生じた変換エラーを示す手段としても使えます。 >>6

[21] 非文字U+FFFD に置き換えることがあります。 非文字

[19] Encoding Standard は、 入力のバイト列に不適切で解釈できないものが含まれる時、 これを1個以上U+FFFD として出力します。

[20] HTML構文解析器は、 入力に U+0000 があるとき、 かわりに U+FFFD として出力します。

[13] 歴史学などでは摩耗などによる判読不能を で表す慣習があります。

[14] 文字数が推定可能なとき、複数の□を連続させることがあります。 文字数が不明瞭なとき、長方形を使うことがあります。

[15] 不確実ながら推定できる文字があるとき、□の枠内にこれを入れて示すことがあります。 ( )

[16] 稀にを使う例も見られます。 一般の文献では×など他の伏せ字を使うことがあります。

[255] 木崎愛吉旧蔵本山コレクション金石文拓本選, 関西大学なにわ・大阪文化遺産学研究センター, 発行日 2008年3月31日, , https://www.kansai-u.ac.jp/Museum/naniwa/publication/book12.pdf

PDF 6頁

•判読できない文字は□で示した。文字数が不明のときは冂凵上・下四角(接さず)とした。なお、他の資料で判読されている 場合は、□の右側に〔 〕で文字を付し、推測される場合は〔 ヵ〕とした。

[24] 東洋文庫リポジトリ, NetCommons, https://toyo-bunko.repo.nii.ac.jp/?action=pages_view_main&active_action=repository_view_main_item_detail&item_id=5671&item_no=1&page_id=25&block_id=47 PDF 6頁

判読不能の編のみ□ (縦長長方形)、旁は判読された文字要素。

[25] RyuseiさんはTwitterを使っています 「https://t.co/CXjQDJXNoP ヒエログリフに提案されている制御文字類、碑文の欠損を表す文字があるのが面白い https://t.co/XmRZKVfSAY」 / Twitter, , https://twitter.com/mandel59/status/1479211471628554240

[26] 拾萬字鏡さんはTwitterを使っています 「そういえば、日本にも虫損や欠損まで忠実に写しとった写本が存在するけど、こういうの面白い。 https://t.co/vYRSxNmAqZ」 / Twitter, , https://twitter.com/JUMANJIKYO/status/1479234575155208192

[27] gap, unclear

[28] 大覚寺文書 上, 大覚寺史資料編纂室, , , https://dl.ndl.go.jp/pid/12208094/1/15 (要登録)

関連

伏せ字

歴史

[4] HTML5 Revision Tracker ( 版) http://html5.org/tools/web-apps-tracker?from=5155&to=5156

メモ

[3] UCS を作る時に GETA MARKREPLACEMENT CHARACTER は unify しておくべきだったんじゃないでしょうかね?

[1] >>0: 今更言っても無駄無駄。

[5] U+001A SUBSTITUTE制御文字だけど本来同じもののような。

[2] >>3 図形文字の符号化w

[7] U+3013 GETA MARK (〓) - Charinfo () https://chars.suikawiki.org/string?s=%E3%80%93

[8] [mixi] 困ったなぁ どうしたの?例〓無駄遣いして金欠[i:163] ( ( 版)) http://mixi.jp/view_voice_topic.pl?topic_id=63849

つぶやきネタに答えよう

困ったなぁ どうしたの?例〓無駄遣いして金欠たらーっ(汗)

[9] 文字化けではなく元から「〓」っぽい。

[17] 算木 - Wikipedia () https://ja.wikipedia.org/wiki/%E7%AE%97%E6%9C%A8

また当初「0」は空白だったが、「〇」を書くようになった。718年に瞿曇悉達によりインド数字から導入されたとも[5]、中国語で欠字を表した「□」から来ているとも[7]言われる。

[18] 古代日本の戸籍制度 - Wikipedia () https://ja.wikipedia.org/wiki/%E5%8F%A4%E4%BB%A3%E6%97%A5%E6%9C%AC%E3%81%AE%E6%88%B8%E7%B1%8D%E5%88%B6%E5%BA%A6

647年(大化3)から664年(天智3)までの間に一括投棄された飛鳥京の木簡に「白髪部五十戸、◎十口」とある。◎は五と思われる。

[22] 【有料生放送】桑原由気と本渡楓のパリパリパーリィ☆~4th Anniversary Online Parry~Smile Summer Parry~ - 2021/07/06(火) 20:00開始 - ニコニコ生放送 () https://live.nicovideo.jp/watch/lv332607124?ref=qtimetable&zroute=index

[23] kiyo4619.pdf, , https://www.kansai-u.ac.jp/Tozaiken/publication/asset/bulletin/46/kiyo4619.pdf#page=15

(○は空格、×は判読不能)


[29] https://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=107388&item_no=1&attribute_id=1&file_no=1 #page=4

[30] コーパス用テキストを対象とした文字処理支援ツール「〓箱」-文字校正・処理情報付与作業の効率化- | CiNii Research, https://cir.nii.ac.jp/crid/1050011097177990144

[31] (ゲタ) 箱」というソフトウェア。外字処理ツールなのでこの名前にしたらしい。

[32] ドキッとする名前だなあ・・・


文字
文字
関連
関連
字形類似
=
字形類似
字形類似
字形類似
文字
文字
関連
関連
関連
×
字形類似
字形類似
字形類似

[33] Xユーザーの上北ふたごさん: 「7月11日 お⃞誕⃞生⃞日⃞お⃞め⃞で⃞と⃞う⃞!⃞ #キュアヤムヤム💛#華満らん #デパプリ #precure https://t.co/Q79YZNxCpl」 / X, , https://x.com/kamikitafutago/status/1811173326745977322

[34] >>33 うちの Windows では Chrome でも Firefox でもうまく合成されずに「お□」のように表示されているのだけど、これを投稿した人には自然に見えているのだろうぬ。