Home

Captchas sinnvoll nutzen

Montag, 28. Mai 2007 | Autor:

Capt­chas sind diese schlecht leser­li­chen Din­ger, die man auf man­chen Web­sei­ten abtip­pen muss, um zu bewei­sen, dass man ein Mensch ist. Pro­gramme, die auto­ma­tisch im gan­zen Netz Foren, Gäs­te­bü­cher und Kom­men­tare mit Spam fül­len, erken­nen im Ide­al­fall nicht, was dort steht. So kann man theo­re­tisch Mensch von Maschine unter­schei­den - capt­cha ist daher ein ver­ein­fach­ter Turing-Test.

Nun ist es stumpf­sin­nig, diese Din­ger stän­dig abzu­tip­pen. Da haben sich cle­vere Leute von der Car­ne­gie Mel­lon Uni­ver­sity was ein­fal­len las­sen: Capt­chas wer­den benutzt um Bücher zu digi­ta­li­sie­ren. Beim Scan­nen von gedruck­ten Büchern tre­ten immer wie­der Feh­ler auf, da die OCR-Software nicht alle Buch­sta­ben oder Wör­ter kor­rekt erkennt. Die Soft­ware mel­det dann in der Regel einen Feh­ler wie „Wort konnte nicht erkannt werden.”

Diese OCR-Software ist recht aus­ge­reift - wenn sie ein Wort nicht kor­rekt erkennt, tut es ein Spam-Programm wahr­schein­lich erst recht nicht. Zudem ist der Vor­rat sol­cher Worte nahezu uner­schöpf­lich, denn Bücher gibt es genug.

Als Capt­cha wird einem also ein Wort aus einem Buch prä­sen­tiert, dass auto­ma­tisch nicht ein­deu­tig zu iden­ti­fi­ze­rien war - und zusätz­lich eins, des­sen Lösung bekannt ist, um auch die eigent­li­che Funk­tion von Capt­chas noch zu erfül­len. Man löst das Capt­cha und bekommt Zugang zur Kom­men­tar­funk­tion oder was auch immer - gleich­zei­tig hat man gehol­fen, ein Buch zu digitalisieren. :)

Diese Capt­chas gibt es auf der Web­site zum Down­load, unter ande­rem für Word­Press, was ich gleich ein­bauen werde - die gan­zen Spam-Bots mit ihren p0rn-Links gehen mir lang­sam auf die Nerven.

Mehr Infor­ma­tio­nen gibt es auf recaptcha.net.

Tags »

Trackback: Trackback-URL |  Feed zum Beitrag: RSS 2.0
Thema: Internet

Du kannst diesen Beitrag kommentieren.
Pingen ist momentan nicht möglich.

Kommentar abgeben