Aug
16
Usando CAPTCHAs para Digitalizar Libros
Archivado En: Uncategorized
Todos (o casi todos) hemos entrado alguna vez a una página que nos pide introducir el texto de una imagen, con diversos propósitos, desde suscribirnos a un servicio hasta hacer alguna compra. Bueno, pues esos cuadritos se llaman CAPTCHAs (Completely Automated Public Turing Test to Tell Computers and Humans Apart), y a alguien se le ocurrió que sería buena idea usarlas para algo útil. Debido a que dichos pequeños acertijos son llenados unas 60 millones de veces al día, se trata de una cantidad enorme de trabajo desperdiciado. A algunas personas se les ha ocurrido que podrían servir para digitalizar libros y convertirlos en su contraparte electrónica. Cuando se escanea un texto en papel para convertirlo en texto digital, es frecuente que algunos puntos no sean reconocidos por el sistema de reconocimiento óptico (OCR), sino que requieren el ojo humano para descifrarlos. Esos son los fragmentos que se enviarían a los CAPTCHAs. ¿No es genial? Ello ayudaría al escaneo y digitalización de miles de libros al día, y la persona que resolviera el CAPTCHA ni se enteraría, pero estaría colaborando al crecimiento y a la preservación de la cultura. Aún existen millones de libros sin digitalizar, con los derechos digitales caducados (obras del dominio público) y encerrados en las bibliotecas. Con un mecanismo como éste, podrían estar libres en la red para que cualquiera los leyera.
© Andrés Borbón 2007
Artículos Relacionados:
________________________________________________________________________________________
Comentarios
3 Comentarios a “Usando CAPTCHAs para Digitalizar Libros”
Deja un Comentario


¡Me parece una idea genial! Es un proyecto realmente interesante.
Yo lo creo igual. Todos esos millones de personas resolviendo Captchas cada día podrían hacer en unos lo que las máquinas de OCR no han logrado en todo este tiempo. Seríamos como la mano de obra de la digitalización editorial. Ojalá que de verdad lo implementen.
Saludos.
Andrés.
[...] Usando CAPTCHAs para ayudar a digitalizar libros ¡Qué buena idea la que se describe en este artículo! [...]