文字コードの混在

文字コードの混在

[1] 1つのテキストファイル文字コード体系は通常は1つだけですが、 稀に複数の文字コード体系が混在していることがあります。

実利用例

[42] i-DNS.net Main Page, , https://web.archive.org/web/20010201060300/http://i-dns.net/

[43] >>42Big5, GB 2312, Shift_JIS, EUC-KR, Windows-1256 が混在した文書です(!)。

[44] document.charset も参照。

[45] 現在の WindowsFirefoxChrome では Windows-1252 と誤認されてしまいます。 文字コード選択メニューもないので文字化けの解消方法がありません。 Firefox の修復機能も有効になりません。

[2] https://web.archive.org/web/19961219091131im_/http://websmile.pef.zcu.cz/

[6] https://web.archive.org/web/20000829132216im_/http://www.cdac.org.in/html/gist/multitxt.htm

[7] https://web.archive.org/web/20000302172616im_/http://www.cdac.org.in:80/html/gist/multidld.htm

[8] https://web.archive.org/web/20000819083216im_/http://www.aczone.com/itrans/s1html.html

[9] https://web.archive.org/web/20000304161654im_/http://www.geocities.com/Athens/Delphi/2627/ttfonts.html

8bit + Latin1 entities

[10] https://members.tripod.com/tomcat_f14/link.html

Big5 + Shift_JIS

[11] https://web.archive.org/web/20190806093220im_/http://www.angelfire.com/empire/thamizh/padanGaL/index.html

UTF-16ed TSCII, broken by insertion of ASCII trailer by the hosting server

[12] https://web.archive.org/web/20070627000015im_/http://parc.cdac.in/Contents.asp

PASCII + 7bit "UTOPIC"

[13] https://lists.fu-berlin.de/pipermail/ipoa-forum/2012-September.txt

ISO-8859-1, ISO-8859-15, UTF-8

[14] https://thieunuvh.tripod.com/vanhoa/ConGaiviq.html

VISCII + VIQR

[15] https://thieunuvh.tripod.com/vanhoa/BaMeviq.html

VISCII + VIQR

[16] https://thieunuvh.tripod.com/vanhoa/MeToiviq.html

VISCII + VIQR

[17] https://web.archive.org/web/20230409125357im_/https://burmese.voanews.com/a/7042708.html

UTF-8 Unicode + Zawgyi

[18] https://www.tamillexicon.com/uc/help

UTF-8 TSCII + TAB


[46] ISO-2022-JPシフトJISの混在については ISO-2022-JP 参照。

[47] ASCII7ビット符号の混在についてはフォント依存符号化参照。

人工的な利用例

[3] https://zsigri.tripod.com/fontboard/cjk/gbhzgbk.html

EUC-CN + HZ

[4] https://zsigri.tripod.com/fontboard/cjk/jis.html

SJIS + 日本語EUC + JISコード

[5] https://zsigri.tripod.com/fontboard/cjk/ksc.html

ISO-2022-KR + EUC-KR

関連

Webブラウザーによる文字コード判定の失敗事例集

Webにおける文字コード, HTMLにおける文字コード

メモ