FDFE

文字コード判定器を意識した著者による記述

[135] 文字コードの判定を助けるため、紛らわしい他の文字コードに出現しない文字を含めたり、 当該文字コードで典型的な文字を最初の方に含めたりする技法が使われることがあります。

[137] 文字コードが乱立しながら頻度解析等の手法が未発達だった平成時代初期の Web でよく用いられました。日本など乱立が著しかった地域に多く見られます。

[197] 文字化けしないようにするには - とほほのWWW入門, , https://www.tohoho-web.com/wwwxx005.htm#spell-character

[253] 「美乳」で文字化けが直るって本当?, , https://www.shtml.jp/mojibake/binew.html

[136] TOPICS - VC, , https://web.archive.org/web/19980131160510fw_/http://www.villagecenter.co.jp/cgi-bin/contents.cgi?0=TOPICS
<body bgcolor="black" text="white" link="yellow" vlink="#FF8080">
<!--
あいうえおかきくけこさしすせそたちつてと
IEが EUC を認識しないので、その対策です。(^_^;
-->

[247] Yahoo! JAPAN - 文字化け対策 その他, , https://web.archive.org/web/20030202085121/http://docs.yahoo.co.jp/docs/help/mojibake/sonota.html

[232] Yahoo! Sports, , https://web.archive.org/web/19990116231624/http://yahoo.co.jp/

<!--�-->
<!-- YTAG JDATETIME 3 START -->
<!--1999/01/17(日) 08:05:00-->
<!-- YTAG JDATETIME 3 END -->
<title>Yahoo! Sports</title>
</head>
EUC-JP

[233] になっているのは 0xFDFE。空き領域ながら、 文字コードの判定の補助として使われていた >>197

[262] Yahoo! JAPAN, , https://web.archive.org/web/20070101014502/http://yahoo.co.jp/

<meta http-equiv="Content-Type" content="text/html; charset=euc-jp">
<!--京-->
<title>Yahoo! JAPAN</title>
<meta name="description" content="日本最大級のポータルサイト。検索、オークション、ニュース、メール、コミュニティ、ショッピング、など80以上のサービスを展開。あなたの生活をより豊かにする「ライフ・エンジン」を目指していきます。">

[234] txtやhtmlファイルが文字化けしてしまう - Microsoft Q&A, https://learn.microsoft.com/ja-jp/answers/questions/3812530/txt-html

ファイルの先頭近くに全角空白を入れておけば誤判定しにくいでしょう。

[246] 「美乳」で文字化けが直るって本当?, , https://www.shtml.jp/mojibake/binew.html

[263] 美乳?, , http://www.tvt.ne.jp/~kumapooh/061106.html

[249] goo, , https://web.archive.org/web/19981111191346/http://goo.ne.jp/

<html>
<!-- 孝 -->
<!-- Goo Ver.2.980827 -->
<!-- Query Page -->
EUC-JP

[248] goo, , https://web.archive.org/web/19981212034346/http://www2.goo.ne.jp/

<html>
<!-- 悌 -->
<!-- Goo Ver.2.981119 -->
<!-- Query Page -->
EUC-JP

[250] goo, , https://web.archive.org/web/20010105012600/http://www.goo.ne.jp/

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
<html>
<!-- 龠 -->
EUC-JP

[251] >>250 Chrome は正しく EUC-JP と判定。 FirefoxWindows-1253 として読み込み、 しばらくして EUC-JP で再読み込み。

[252] goo, , https://web.archive.org/web/20020124072803/http://www.goo.ne.jp/

<!-- <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/REC-html40/loose.dtd"> -->
<html lang="ja">
<!-- � 龠 -->
EUC-JP, 0xFDFE

[259] 20040209 美乳|雑記草(ざっきそう), https://note.com/zakkisou/n/n59402f97e0ef

<!--美乳-->

<!--龠龠龠-->

[260] A memo about HTML charset information, , https://www.asahi-net.or.jp/~sd5a-ucd/essay/htmlcharset.html

HTMLのソースを眺めていると、先頭の方に「<-- 美乳 -->」「<-- 譚 -->」などの意味不明なコメントが挿入されていることがあります。

「美乳」や「譚」の場合、句点コードで表すと「40区94点、38区93点」「75区93点」であり、Shift_JISで符号化した場合はEUC-JPが利用しないコード、EUC-JPで符号化した場合にはShiftJISが利用しないコードになる文字なので、両者のどちらで符号化する場合でも識別子として役立つ文字であると言えます。また例えば「入口」という熟語の句点コードは「38区94点、24区93点」なので、ソースの先頭の方に記しておくのに「美乳」や「譚」よりは適した文字列でしょう。

[258] 文字コードの部屋 -- Web のエンコード, , http://web.archive.org/web/20040202014837/http://www.mikeneko.ne.jp/~lab/kcode/web.html

[261] IE7 で画面が真っ白になるページの対処方法 - drk7jp, , https://www.drk7.jp/MT/archives/001163.html

[257] Unicode 版美乳テーブルを探せ, 緇隰(くろさわ), , https://qlosawa.sakura.ne.jp/language/binyu.html

[264] UTF-8 の文字化け対策! 「美乳」ではなく「†(ダガー)」を使う | 亜細亜ノ蛾, https://asiamoth.com/201110222342/