captcha.jpgreCAPTCHA es un sistema que aprovecha el sistema de identificación humana conocido como CAPTCHA para digitalizar palabras que no son reconocidas al ser escaneadas.

Dándole una vuelta de tuerca al sistema de CAPTCHAS, los desarrolladores de reCAPTCHA encontraron en esta tarea (a veces tediosa), una solución práctica o un problema común.

El sistema funciona básicamente así: al digitalizar libros, muchas palabras no son reconocidas por los OCR (Optical Character Recognition), y son marcadas como desconocidas. Cada una de las palabras no reconocidas es alojada en un servidor que las presentará, junto a otra, en un CAPTCHA de alguna página web. Los usuarios, al escribirla correctamente, están indicándole al sistema qué palabra es realmente.

Una vez que varias personas identificaron la palabra, el sistema la toma como válida y la puede aplicar a la digitalización de un libro.

¡Dos pájaros de un tiro! No sólo protege a los webmasters de spam, sino que también ayuda a la digitalización de libros. Realmente una iniciativa muy original e interesante.

Si tienes un blog en Wordpress pueden instalar la aplicación mediante un plugin, y automáticamente ya estarás ayudando con el proyecto.

| Vía reCAPTCHA