reCAPTCHA es un sistema que aprovecha el sistema de identificación humana conocido como CAPTCHA para digitalizar palabras que no son reconocidas al ser escaneadas.
Dándole una vuelta de tuerca al sistema de CAPTCHAS, los desarrolladores de reCAPTCHA encontraron en esta tarea (a veces tediosa), una solución práctica o un problema común.
El sistema funciona básicamente así: al digitalizar libros, muchas palabras no son reconocidas por los OCR (Optical Character Recognition), y son marcadas como desconocidas. Cada una de las palabras no reconocidas es alojada en un servidor que las presentará, junto a otra, en un CAPTCHA de alguna página web. Los usuarios, al escribirla correctamente, están indicándole al sistema qué palabra es realmente.
Una vez que varias personas identificaron la palabra, el sistema la toma como válida y la puede aplicar a la digitalización de un libro.
¡Dos pájaros de un tiro! No sólo protege a los webmasters de spam, sino que también ayuda a la digitalización de libros. Realmente una iniciativa muy original e interesante.
Si tienes un blog en Wordpress pueden instalar la aplicación mediante un plugin, y automáticamente ya estarás ayudando con el proyecto.
| Vía reCAPTCHA

Suscríbete a nuestro RSS Feed



Suscríbete a nuestro RSS Feed

No entiendo bien como funciona la primera vez. Si no se sabe de que palabra se trata, como se comprueba de que lo ingresado sea correcto?
Nacho,
Pueden ser por dos casos (conozco otro sistema parecido a este):
a) Alguien del grupo ese ingresa las palabras posibles (más de una);
b) El sistema OCR captura una especie de -forma- de la palabra… de la cual se desplegan múltiples posibilidades… si varios input apuntan a la misma posibilidad, entonces termina por darse como válido dicho input. Esto no quiere decir que la palabra sea introducida correctamente… sino que el grupo que ingresó el input, en realidad pensó igual.
Saludos
Ahora me cierra un poco más.
Gracias por la respuesta!
“The way it works is that the program generates two CAPTCHA’s, one for which it knows the answer and the other that it cannot read. When the human deciphers both and the computer see that the human correctly answered the one it already knew, it assumes that the answer to the other one is correct also. It then takes that new word that it just got the answer for and creates another pair for someone else to read to make sure the original word was correct.” http://recaptcha.net/
…Entonces básicamente se trata de presentar dos imágenes, una de ellas con una palabra conocida (con el mismo proceso) y otra desconocida, si el usuario ingresa correctamente la palabra conocida se supone que hará lo mismo con la otra, la validez de este supuesto se comprueba comparando las respuestas de otros usuarios para la misma palabra.