Computergenerierte Handschrift gegen Spambots
Archivmeldung vom 15.01.2009
Bitte beachten Sie, dass die Meldung den Stand der Dinge zum Zeitpunkt ihrer Veröffentlichung am 15.01.2009 wiedergibt. Eventuelle in der Zwischenzeit veränderte Sachverhalte bleiben daher unberücksichtigt.
Freigeschaltet durch Oliver RandakForscher an der State University of New York in Buffalo haben einen Ansatz entwickelt, der besser vor Spambot-Attacken schützen könnte als bisherige Captcha-Bildrätsel. Der Ansatz der Forscher aus Buffalo setzt darauf, mit einem Algorithmus und einer Datenbank handgeschriebener Buchstaben Handschrift-Bildrätsel zu erstellen.
Sie sollen Software zur optischen
Zeichenerkennung (Optical Character Recognition, OCR) größere Probleme
bereiten als bisherige Bildrätsel und so Spammern mit ihren Werkzeugen
das Leben schwer machen. "Das ist ein Wettrüsten. Jeder Captcha, der
existiert, wurde geknackt", betont Mitentwickler Achint Oommen Thomas
gegenüber dem US-Magazin Technology Review.
Captchas sind Bildrätsel, bei denen ein User ein gelesenes Wort
wieder eingeben muss, um Zugriff auf ein Webangebot zu erhalten. Diese
Rätsel schützen beispielsweise die Anmeldung zu Webmail-Programmen.
Doch Spammer nutzen OCR-Tools, um diese Rätsel automatisch zu knacken.
Das System von Thomas und Kollegen ist dazu gedacht, genau das zu
erschweren. Dazu nutzen die Wissenschaftler eine Datenbank mit über
20.000 handgeschriebenen Buchstaben, um zufällig Worte zu erzeugen.
Algorithmen glätten dabei die Verbindung zwischen den einzelnen
Zeichen, sodass eine durchgehende, computergenerierte Handschrift
entsteht.
"Ehe der Computer einen Buchstaben identifizieren kann, muss er ihn erst einmal finden", sagt Thomas. Genau das soll durch den durchgehenden Schriftzug erschwert werden und Tests der Wissenschaftler sind vielversprechend verlaufen. Einige der besten OCR-Systeme haben eine Erfolgsrate von weniger als einem Prozent. Wie wichtig es ist, Programmen die Zeichenerkennung zu erschweren, zeigen beispielsweise die Ergebnisse von Forschern der britischen Newcastle University aus dem Jahr 2008. Sie konnten mit einem automatisierten Separierungs-Angriff, der Zeichen eines Captchas voneinander trennt und dann einzeln identifiziert, die damalige Version des Hotmail-Captchas mit 60-prozentiger Erfolgsrate knacken. Microsoft hat sein System seither deutlich verbessert, doch der Ansatz aus Buffalo könnte noch besseren Schutz gegen Missbrauch bieten.
Das Entziffern von Handschriften ist allerdings auch für menschliche Nutzer relativ schwer. Diese Tatsache berücksichtigen die Wissenschaftler bei der Verarbeitung seiner Buchstaben. "Wir verzerren sie zufällig, aber nur innerhalb vorgegebener Grenzen - sonst werden sie für Menschen unlesbar", sagt Thomas. Dennoch erkennen Menschen die Handschrift-Bilder derzeit nur in drei Viertel der Fälle richtig. "Das ist viel zu wenig", meint Jeff Yan, einer der Wissenschaftler aus Newcastle. Auch Luis von Ahn, einer der Väter der Captcha-Idee, ist dieser Ansicht. Bei seinem aktuellen System "reCaptcha" liege die Erfolgsrate menschlicher Nutzer bei 96 Prozent. "Und dennoch beschweren sich die Leute", so der Wissenschafter. Da in der modernen Welt immer weniger von Hand geschrieben wird, könne die Fähigkeit der Menschen, verschnörkelte Schrift zu entziffern, auch immer weiter abnehmen.
"Ehe der Computer einen Buchstaben identifizieren kann, muss er ihn erst einmal finden", sagt Thomas. Genau das soll durch den durchgehenden Schriftzug erschwert werden und Tests der Wissenschaftler sind vielversprechend verlaufen. Einige der besten OCR-Systeme haben eine Erfolgsrate von weniger als einem Prozent. Wie wichtig es ist, Programmen die Zeichenerkennung zu erschweren, zeigen beispielsweise die Ergebnisse von Forschern der britischen Newcastle University aus dem Jahr 2008. Sie konnten mit einem automatisierten Separierungs-Angriff, der Zeichen eines Captchas voneinander trennt und dann einzeln identifiziert, die damalige Version des Hotmail-Captchas mit 60-prozentiger Erfolgsrate knacken. Microsoft hat sein System seither deutlich verbessert, doch der Ansatz aus Buffalo könnte noch besseren Schutz gegen Missbrauch bieten.
Das Entziffern von Handschriften ist allerdings auch für menschliche Nutzer relativ schwer. Diese Tatsache berücksichtigen die Wissenschaftler bei der Verarbeitung seiner Buchstaben. "Wir verzerren sie zufällig, aber nur innerhalb vorgegebener Grenzen - sonst werden sie für Menschen unlesbar", sagt Thomas. Dennoch erkennen Menschen die Handschrift-Bilder derzeit nur in drei Viertel der Fälle richtig. "Das ist viel zu wenig", meint Jeff Yan, einer der Wissenschaftler aus Newcastle. Auch Luis von Ahn, einer der Väter der Captcha-Idee, ist dieser Ansicht. Bei seinem aktuellen System "reCaptcha" liege die Erfolgsrate menschlicher Nutzer bei 96 Prozent. "Und dennoch beschweren sich die Leute", so der Wissenschafter. Da in der modernen Welt immer weniger von Hand geschrieben wird, könne die Fähigkeit der Menschen, verschnörkelte Schrift zu entziffern, auch immer weiter abnehmen.