Spam対策
総合情報メディアセンターというところの教員をしていると、学内から「センターでSpam対策をできないか?」という問い合わせを受けることが多い。ところが、真剣に考えると、この問題、かなり複雑だ。
まず、センターで厳しいSpam制限をすると、大事なメールがうっかり届かなくなることがある。メールは研究に必要という立場の人にとっては、「1000通のSpamを受け取ること」と、「1通の重要なメールを逃すこと」のどちらかを選べと言われれば、大抵、前者を選ぶ。
適当に緩いSpam制限をしても、それでも拒否されるメールが存在する。そこで、センターではSpam制限をあまり行なわない方向で対応している。
ところで、お金を払ってでもいいから…という人に一言。お金をもらっても、メールの中身を見ない限りは、完全なSpamフィルタリングは不可能だ。まだ機械は人間のような知能を持つに至っていない。だから、人間がSpamだと見るメールでも、それを機械がうっかり通ししてしまうことがある。その逆もある。
ここでは、なるべく精度が高そうな対策の話を記す。
例えば、Spamメールを送る業者の Black List を作って、そこからのメールを拒否する方法がわりと有効なのだが、時々、Black List に Spamメール業者でないとことが登録されてしまうことがあり、そうなると、普通のメールでも受け取れなくなってしまう。先日も某超大手プロバイダがまるごと登録されてしまって、困った。
また、Spamメールに固有の文字列を集めた辞書を作るという方法もある。これもそれなりに有効だ。僕は、自分で作った辞書を公開している。
http://www.tt.tuat.ac.jp/mail4me/deny-body.txtこの中の各行と、メールの本文のどれかが一致すれば、そのメールは Spam とみなされるようにしてある。
僕の場合、こういう努力をたくさん組み合わせているので、1日のうちすり抜けてくるSpamは10通程度にまで押え込んでいる。ちなみに、すり抜けられないで捕まってしまうSpamは、2006年6月1日〜19日までの合計で8,448通であった。1日平均で444通、1時間平均18通であった。逆に計算をすると3分14秒に1通のSpamが届いていることになる。実際、こうして、blogの記事を書いている間でも、12通のSpamが引っかかっていた。
でも、こういう努力をできない人の場合は、学習型Spamフィルターを備えたMUAを勧めたい。たとえば Thunderbird などは非常に精度が高い。
あるいは、gmailなどのフリーメールサイトを利用するのもいい手だと思う。
こういう道具を乗り換えずして、有効なSpam対策はあり得ない。
中途半端な終り方ですが、これにて終り。
| 固定リンク
この記事へのコメントは終了しました。
コメント
個人単位でできるSPAM対策には限界がありますが,メールサーバを管理できる場合には,
吉田和幸, throttlingによるspamメール抑制の効果について, 情報処理学会研究報告 2005-DSM-037, pp.69-73, 2005
など,MTAに手を加える各種の方法が報告されています.
投稿: puglee | 2006年7月 2日 (日) 14:37
pugleeさん、辰己です。
僕の記事がよくわかりにくかったかもしれませんね。私の場合は、総合情報メディアセンターの教員ですので、サーバーを触る立場にあります。もちろん、MTAをいじるなどの工夫はできるのです。
私が言いたいことは、「Spam対策は機械では完璧にできない」ということです。100万通のメールを、受け取る人の望み通りに1通も誤りなくSpamとそれ以外を分けることは、どんなに素晴らしいツールでも無理でしょう。特に恐いのは、正しいメールを受け取り拒否することです。Spamを送る側も工夫しているので、毎日Spamは変わるし、ある人にとってはSpamと判定されるメールでも、「それはSpamではない」と思う人もいます。
人間がそのメールを見ていいのなら、受け取る人の思想に近い誰かをSpamを避けるために雇えば済む話ですが、Spamかそうでないかを他人に判別してもらうなんてことを望む人なんていないですよね?
投稿: たつみ | 2006年7月 4日 (火) 15:20