E-Mail SPAM und die Weisheit der Vielen

spam.gifIm DRS1 Rendez-vouz vom 22. September erzählt Guido Berger von einem neuen Verfahren gehen Spam. Er beschreibt wie Firmen "schwarze Listen", sogenannte Blacklists von IP-Adressen von Servern führen, von denen SPAM verschickt worden war. Diese IP Adressen können dann von den Providern zum sperren der einkommenden Mails benützt werden.

Unabhängig von der Frage ob dieses Blacklist-Verfahren als "neu" bezeichnet werden kann oder nicht (ich bin da anderer Meinung als der Autor), weisst der Beitrag auf ein wichtiges Problem im Zusammenhang mit Blacklists hin. Ein Problem, dass sich übrigens immer stellt, wenn irgendwo sogenannte "schwarze Listen" zum Einsatz kommen:

Wer entscheidet, ob jemand auf eine Blacklist kommt? Wer spielt hier den Richter über gut und böse? Die Welt ist nicht binär und gerade bei den unzähligen SPAM Blacklists zeigt sich sehr gut, dass es einfach sehr viele Eiferer gibt, die immer zur Stelle sind, wenn es darum geht zu richten. Ist man dann einmal auf einer solchen Liste gelandet, ist es dann auch sehr schwer wieder gelöscht zu werden.

Eine andere Möglichkeit als Blacklists zur SPAM-Abwehr zu benützen stellen regelbasierte Systeme dar, wie sie häufig in E-Mail Programmen wie Outlook anzutreffen sind. Doch auch diese haben Ihre Tücken. Ein Beispiel: So ist es zwar so, dass Spam Mails oft HTML-Komponenten beinhalten, die durch den Aufruf von Bildern, die auf bestimmten Servern liegen, sich bestätigen lassen, dass die E-Mail Adresse existiert. Aus diesem Grund deklarieren viele regelbasierte Anti-SPAM Programme solche Mails als SPAM. Nun gibt es aber auch viele Anwendungen derselben Methode, die nichts mit SPAM zu tun haben. Die Feedburner Signatur in meinen E-Mails würde zum Beispiel durch die strikte Anwendung dieser Regel als SPAM-Email deklariert. 

Die Firma Cloudmark, deren Spamfilter ich nun schon seit einigen Jahren benütze, hat hier m.E. das Ei des Columbus gefunden. Cloudmark verwendet zwar letztendlich auch ein Blacklist-Verfahren, allerdings mit dem grossen Unterschied, dass Millionen von Usern diese Blacklist permanent pflegen und diese eher auf die einzelnen Mails als auf den Absender Server angewendet wird. Das bedeutet, wenn immer ein User ein Mail als SPAM deklariert, wird diese deklaration an Cloudmark zurückgemeldet. Wenn genügend User derselben Meinung sind, wird dieses besagte Mail bei allen anderen Usern auch als SPAM deklariert. Genauso verhält es sich im umgekehrten Falle. Wenn ein User ein als Spam deklariertes Mail als unbedenklich meldet, und dass viele andere auch so sehen, wird das Mail aus der Blacklist entfernt. Dabei werden die Meldung der User noch zusätzlich gewichtet. Das heisst, ein User der regelmässig Spammeldungen macht, die von der Mehrheit mitgetragen werden, erhält mehr Gewicht mit seiner Meldung, als wenn er jedesmal korrigiert wird. Zum Beispiel weil er vergessen hat einen Newslette abonniert zu haben und diesen nun einfach als SPAM meldet. Meine und die Erfahrung vieler meiner Kollegen, die das Produkt auch benützen zeigen, dass dieser SPAM Filter am zuverlässigsten die Spreu vom Weizen trennt.

Die Cloudmark Anti-SPAM Lösung ist übrigens ein sehr interessantes Beispiel für eine praktische Anwendung der Ideen aus "Die Weisheit der Vielen"