Home

Captchas sinnvoll nutzen

Montag, 28. Mai 2007 | Autor:

Captchas sind die­se schlecht leser­li­chen Din­ger, die man auf man­chen Web­sei­ten abtip­pen muss, um zu bewei­sen, dass man ein Mensch ist. Pro­gram­me, die auto­ma­tisch im gan­zen Netz Foren, Gäs­te­bü­cher und Kom­men­ta­re mit Spam fül­len, erken­nen im Ide­al­fall nicht, was dort steht. So kann man theo­re­tisch Mensch von Maschi­ne unter­schei­den - captcha ist daher ein ver­ein­fach­ter Turing-Test.

Nun ist es stumpf­sin­nig, die­se Din­ger stän­dig abzu­tip­pen. Da haben sich cle­ve­re Leu­te von der Car­ne­gie Mel­lon Uni­ver­si­ty was ein­fal­len las­sen: Captchas wer­den benutzt um Bücher zu digi­ta­li­sie­ren. Beim Scan­nen von gedruck­ten Büchern tre­ten immer wie­der Feh­ler auf, da die OCR-Soft­ware nicht alle Buch­sta­ben oder Wör­ter kor­rekt erkennt. Die Soft­ware mel­det dann in der Regel einen Feh­ler wie „Wort konn­te nicht erkannt werden.”

Die­se OCR-Soft­ware ist recht aus­ge­reift - wenn sie ein Wort nicht kor­rekt erkennt, tut es ein Spam-Pro­gramm wahr­schein­lich erst recht nicht. Zudem ist der Vor­rat sol­cher Wor­te nahe­zu uner­schöpf­lich, denn Bücher gibt es genug.

Als Captcha wird einem also ein Wort aus einem Buch prä­sen­tiert, dass auto­ma­tisch nicht ein­deu­tig zu iden­ti­fi­ze­ri­en war - und zusätz­lich eins, des­sen Lösung bekannt ist, um auch die eigent­li­che Funk­ti­on von Captchas noch zu erfül­len. Man löst das Captcha und bekommt Zugang zur Kom­men­tar­funk­ti­on oder was auch immer - gleich­zei­tig hat man gehol­fen, ein Buch zu digitalisieren. 🙂

Die­se Captchas gibt es auf der Web­site zum Down­load, unter ande­rem für Word­Press, was ich gleich ein­bau­en wer­de - die gan­zen Spam-Bots mit ihren p0rn-Links gehen mir lang­sam auf die Nerven.

Mehr Infor­ma­tio­nen gibt es auf recaptcha.net.

Tags »

Trackback: