« プログラミングについて | トップページ | 博士が100にんいるむら »

2005年8月 2日 (火)

SPAMフィルタリング

日本語のSPAMが最近多いが、僕は公開しているメールアドレスが多いせいか、もともとSPAMが多い。

世の中の人はどうやってフィルタリングをしているのか知らないが、僕の場合は自分でプログラムを作ってフィルタリングをしている。方法の詳細は業務上の秘密(笑)だが、フィルタに洩れたメールがあれば、その特徴をじっと見て、二度とフィルタが漏らさないようにルールを変えるということを毎日行なってきた結果だ。今のところ、99%位が洩れずにフィルタされている。僕が公開している「否定語リスト」のURLを、ここに書いておこう。

http://www.tt.tuat.ac.jp/mail4me/deny-body.txt

これを、procmailなら、


:0 B
* ?nkf -me|fgrep -i -f /home/tatsumi/dokoka/nanika/deny-body.txt
spam/.

のようにして使う。

このURLは、SPAM LINKS (http://spamlinks.net/filter-bl.htm)からも参照されていて、毎日沢山の人がダウンロードしてくれている。他にも、いかにも否定語っぽい言葉でYahoo/Googleで見つけてこられる方も多い。適当に、いかがわしい言葉やまずそうな言葉を4つくらいYahooに調べさせると、必ず僕のページがヒットする。(また笑)

最近、フィルタで落されたSPAMはこんな感じだ。
spamgraph

4月になって急激に減っているように見えるのは、神戸大学宛のメールアドレスの転送をexpireしたからであって、SPAMそのものが減っているわけではない。

で、話はフィルタリング技術のことなんだけど、これってやっぱりプログラムを書く能力が試されているように思う。

|

« プログラミングについて | トップページ | 博士が100にんいるむら »

コメント

タイトル : SPAMメール その2
最近スパムメールがはやっていますね。

投稿: Tracked from 情報科blog | 2005年10月 9日 (日) 10:13

この記事へのコメントは終了しました。

トラックバック


この記事へのトラックバック一覧です: SPAMフィルタリング:

« プログラミングについて | トップページ | 博士が100にんいるむら »