TIP#1037: Co je to CAPTCHA

CAPTCHA je ona extrémně otravná věc, kdy musíte „něco“ přečíst z obrázku a poté to opsat do políčka. Děláte to proto, abyste potvrdili, že jste „živý člověk“ a nikoliv robot, stroj. Byl to také původní důvod vzniku CAPTCHA (viz Jak se bránit proti komentářovému spamu na blogu/webu?), ale v průběhu let se to celé stalo poněkud irelevantním.

Řada CAPTCHA řešení je dnes nedostatečná a OCR (rozpoznávání písma) je běžně dokáže přečíst. Pokud nedokáže, tak spammeři nasazují armády levné pracovní síly, která prostě CAPTCHA čte a zadává. Nakonec běžnému člověku trvá zadání CAPTCHA okolo deseti sekund, takže případný překonávatel jich pro spammery dokáže za hodinu překonat opravdu hodně. Pokročilejší metody rozpoznávání CAPTCHA nasazují umělou inteligenci, nebo lépe řečeno hloubkové a strojové učení.

CAPTCHA je zkratka z Completely Automated Public Turing test to tell Computers and Humans Apart (ano, takhle složité to je). Zmínka o turingově testu je tam tak trochu legrační, ale vypovídá tomu, že CAPTCHA vznikla v dobách poměrně dávných (2003).

Je dobré vědět, že CAPTCHA je zásadní problém pro lidi s postižením (zrakově, ale i třeba schopností správně číst). Řeší se to často tím, že CAPTCHA mívají možnost nechat si kód přečíst, ale tam narazíte na to jazykovou bariéru. Proto je obecně lepší se CAPTCHA vyhnout a zkoušet používat jiné metody blokování robotických návštěvníků.

Zajímavostí je využít CAPTCHA k digitalizaci knih, novin a časopisů. V rámci projektu reCAPTCHA totiž Google předkládal místo nesmyslných řetězců slova z tištěných materiálů a zadáváním tak návštěvníci webu digitalizovali obsah.

TIP: Zdejší ‣ Jazykový koutek obsahuje další záhadné zkratky a termíny

Reklamy