文字コードの修復

文字コードの修復

修復方法

[2] $B(B などの前に ESC を補って ISO-2022-JP に (制御符号を落とす MTA 対策)。

[1] Encode::Repair - Repair wrongly encoded text strings - metacpan.org, https://metacpan.org/pod/Encode::Repair

[4] UTF-8符号化されたバイト列

壊れたデータ(?)の事例

[5] null, , http://plaza.harmonix.ne.jp/~onizuka/literal/EVA01-po.txt

[6] >>5 Content-Typetext/plaincharset なし。 FirefoxShift_JIS と判断 (TLD の既定値か)。「修復」機能が使えない。 ChromeISO-2022-JP と判断。

[7] >>5

de 1995. Em Portugal, a esta$B.H(Bo SIC iniciou a sua transmissao em meados do 
m$B/T(B de Dezembro de 1997.

-----------------------------------------------------------------------------

Gen$B#S(Bico de Abertura

[8] >>7 ISO-2022-JP指示シーケンスが入っているが、 JIS X 0208文字が割り当てられた区点位置ではない。 Chrome では文字化けJIS X 0213 と解釈しても意味がある文字列にはならない。 何らかの誤った文字コード変換の結果生じた壊れたデータか。

関連

[3] 関連: 文字コード選択メニュー

メモ