<html xmlns="http://www.w3.org/1999/xhtml" a0:Name="SuikaWiki" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:Version="0.9"><head><a0:parameter name="page-icon"><a0:value>字β</a0:value></a0:parameter></head><body><ul><li><a0:anchor-end a0:anchor="1">[1]</a0:anchor-end> <a0:anchor>ISO/IEC646</a0:anchor>, <a0:anchor>ISO/IEC8859</a0:anchor>, <a0:anchor>JISX0201</a0:anchor>, <a0:anchor>ISO/IEC10646</a0:anchor>, <a0:anchor>Unicode</a0:anchor> などが<a0:anchor>文書文字集合</a0:anchor>である状態に於いて、文字 <a0:anchor>@</a0:anchor> (<code class="char">AT SIGN</code>) を表す<a0:anchor>数値文字参照</a0:anchor> (<a0:anchor>NCR</a0:anchor>)。</li><li><a0:anchor-end a0:anchor="2">[2]</a0:anchor-end> <a0:anchor>HTML</a0:anchor> でリンク先などに<a0:anchor>メイル・アドレス</a0:anchor>を書く際に、
<code>@</code> を <code>&amp;#64;</code> とか <code>&amp;#x40;</code>
と書くのが流行ってます。<ul><li>Web を巡ってメイル・アドレスを収集していく <a0:anchor>spamer</a0:anchor>
のロボットはへたれで、こうすると解釈できないらしいです。</li><li>かつて流行った <a0:anchor>.nospam</a0:anchor> のような違法な方法と違って、
この方法は完全に合法ですし、大昔のかなり古典的な <a0:anchor>UA</a0:anchor>
でも使ってない限り (へたれロボットのような手抜き UA
を除く。) 問題なく扱えますから、なるほど良い考えです。</li><li>ただ、これだけ広まっている以上、
既にロボットも対策している気もしなくもありません。
よって効能の程は不明です。</li><li>対策対策として、 <code>@</code> 以外の文字も NCR
にしてしまえばいいでしょう。でもそういうのも対策されたら・・
その時は <a0:anchor>XML</a0:anchor> にしてしまって内部実体・・以下略。
流石に XML を parse するロボットはいないでしょう、ってことでね。</li><li><a0:anchor-end a0:anchor="3">[3]</a0:anchor-end> でも、そのへたれロボットがちゃんと <a0:anchor>HTML</a0:anchor>
を parse してなくて、「@」を含むメイル・アドレスっぽい文字列、という<a0:anchor>正規表現</a0:anchor>でも使ってるんだったら、かんり有効そうですね。</li></ul></li><li><a0:anchor-end a0:anchor="4">[4]</a0:anchor-end> <a0:anchor-internal a0:anchor="2">&gt;&gt;2</a0:anchor-internal> 既に <code class="HTML">&amp;#64;</code> だけでなら対策したロボットがいるみたいです。</li><li><a0:anchor-end a0:anchor="5">[5]</a0:anchor-end> 既に文字参照 hack は無意味らしい: <em>robotはぢきについて</em> <a0:anchor-external a0:resParameter="http://c-moon.jp/robots.shtml#IndyLibrary" a0:resScheme="URI">http://c-moon.jp/robots.shtml#IndyLibrary</a0:anchor-external></li></ul></body></html>