#?SuikaWiki/0.9 page-icon="字β"

- [1] [[ISO/IEC646]], [[ISO/IEC8859]], [[JISX0201]], [[ISO/IEC10646]], [[Unicode]] などが[[文書文字集合]]である状態に於いて、文字 [[@]] ([CODE(char)[AT SIGN]]) を表す[[数値文字参照]] ([[NCR]])。
- [2] [[HTML]] でリンク先などに[[メイル・アドレス]]を書く際に、
[CODE[@]] を [CODE[&#64;]] とか [CODE[&#x40;]]
と書くのが流行ってます。
-- Web を巡ってメイル・アドレスを収集していく [[spamer]]
のロボットはへたれで、こうすると解釈できないらしいです。
-- かつて流行った [[.nospam]] のような違法な方法と違って、
この方法は完全に合法ですし、大昔のかなり古典的な [[UA]]
でも使ってない限り (へたれロボットのような手抜き UA
を除く。) 問題なく扱えますから、なるほど良い考えです。
-- ただ、これだけ広まっている以上、
既にロボットも対策している気もしなくもありません。
よって効能の程は不明です。
-- 対策対策として、 [CODE[@]] 以外の文字も NCR
にしてしまえばいいでしょう。でもそういうのも対策されたら・・
その時は [[XML]] にしてしまって内部実体・・以下略。
流石に XML を parse するロボットはいないでしょう、ってことでね。
-- [3] でも、そのへたれロボットがちゃんと [[HTML]]
を parse してなくて、「@」を含むメイル・アドレスっぽい文字列、という[[正規表現]]でも使ってるんだったら、かんり有効そうですね。
- [4] >>2 既に [CODE(HTML)[&#64;]] だけでなら対策したロボットがいるみたいです。
- [5] 既に文字参照 hack は無意味らしい: ''robotはぢきについて'' <http://c-moon.jp/robots.shtml#IndyLibrary>
