文字化けの修復

文字化けの修復

修復方法

[2] $B(B などの前に ESC を補って ISO-2022-JP に (制御符号を落とす MTA 対策)。

[1] Encode::Repair - Repair wrongly encoded text strings - metacpan.org, https://metacpan.org/pod/Encode::Repair

[4] UTF-8符号化されたバイト列

壊れたデータ(?)の事例

[5] null, , http://plaza.harmonix.ne.jp/~onizuka/literal/EVA01-po.txt

[6] >>5 Content-Typetext/plaincharset なし。 FirefoxShift_JIS と判断 (TLD の既定値か)。「修復」機能が使えない。 ChromeISO-2022-JP と判断。

[7] >>5

de 1995. Em Portugal, a esta$B.H(Bo SIC iniciou a sua transmissao em meados do 
m$B/T(B de Dezembro de 1997.

-----------------------------------------------------------------------------

Gen$B#S(Bico de Abertura

[8] >>7 ISO-2022-JP指示シーケンスが入っているが、 JIS X 0208文字が割り当てられた区点位置ではない。 Chrome では文字化けJIS X 0213 と解釈しても意味がある文字列にはならない。 何らかの誤った文字コード変換の結果生じた壊れたデータか。

[9] How to Fix Mojibake (string only, original file lost) : r/techsupport, https://www.reddit.com/r/techsupport/comments/n4i01s/how_to_fix_mojibake_string_only_original_file_lost/

[11] 日本冷凍空調学会, https://www.jsrae.or.jp/nenjitaikai_dummy/J/index.html

[12] >>11 EUC-JPShift_JIS と誤認したまま UTF-8 に変換して破壊?

[13] ー??ゥフウナケ 、ハ、?ヌ、簔?フシシ。テ、ェフ荀、ケ遉?サー??テー??ゥフウナケ, , https://www.ichijo.co.jp/inquiry/img/advice_input.html

[14] >>13 Shift_JISEUC-JP の混合

[15] ーオホマキラ,ニテシ・ムナモーオホマキラ、ホタ・逾癸シ・ォ[ーーキラエ・ーーキラエ・ゥカネウーイメ], , http://mail.asahigauge.co.jp/english/products/category2_1.html

[16] >>15 UTF-8EUC-jPの混合

[17] ¿©°é¡¡¥¦¥£¥º¥¬¥¹CLUB¡ÃÂèÆó²ó¡¡¥¦¥£¥º¥¬¥¹Á´¹ñ¿Æ»Ò¥¯¥Ã¥­¥ó¥°¥³¥ó¥Æ¥¹¥È¡ä Ãæ¹ñÃ϶èÂç²ñ³µÍ×, https://www.gas.or.jp/shokuiku/zenkoku-oyako-cooking/contest2/tikutyuugoku.html

[18] >>17 EUC-JPUTF-8 符号化したものと UTF-8 の混合

[19] meibo, , http://www.miya-shoko.or.jp/rengo/content/meibo.html

[20] >>19 Shift_JISUTF-8 の混合

[21] 。レ・サ。シ・・皈、・・ロ, , https://beauty-s.com/site/gold/royal/smf_page/week_beauty_phone.html

[22] >>21 EUC-JPShift_JIS と誤認して UTF-8 符号化したもの

[28] >>25 >>26 >>27 本文は ISO/IEC 8859-1 系? 記号らしきものは該当する符号が見当たらず...

[29] Harry Potter und der Orden des Phᅵnix (Band 5): Amazon.de: Joanne K. Rowling, Klaus Fritz: Bücher, , https://web.archive.org/web/20120611032018/http://www.amazon.de/Harry-Potter-Orden-Ph%C3%B6nix-Band/dp/3551555559

<meta http-equiv="content-type" content="text/html; charset=iso-8859-15"/>

[30] >>29 ISO-8859-15 になっているけど UTF-8 っぽい化け方、 しかし UTF-8 で読んでも化けてしまう。壊れてる?


[10] ファイル名の文字コードにも事例あり。

[23] バイト列UTF-8 符号化して生じたものはUTF-8符号化されたバイト列参照。

関連

[3] 関連: 文字コード選択メニュー, 文字コードの変換, 文字コードの判定, 文字コードの混在

メモ

[24] ABM Resellers, Ghassan Bendali, , https://web.archive.org/web/19980509043242/http://www.appleme.co.ae/resellers.html

謎の &Yacute; が頻発