28 jun 2010

Google Docs lee textos escaneados


Así que tienes ese viejo guión de hace 10 años que imprimiste, pero hace tiempo que perdiste el disco en que lo tenías guardado. Si es el momento de resucitarlo y no te apetece dedicar un par de días a volver a pasar a máquina tediosamente todo el texto, no temas, Google está aquí.

Google está llevando al gran público otra de sus funciones experimentales: el reconocimiento óptico de caracteres. Esta función, originaria del técnico de software Jaron Schaeffer, ha dejado su fase experimental para pasar a funcionar en Google Docs. Ésta es la respuesta de Google a Microsoft, en materia de cloud computing.

El reconocimiento óptico de caracteres es la traducción automática de texto, ya sea escrito a mano, a máquina o de otro modo, a “texto codificado automáticamente”, esto es, un archivo .txt o .doc editable.

Según la nota de prensa original sobre esta función publicada por Google, el reconocimiento óptico “sólo funcionará bien en imágenes de alta resolución, así que incluso si el documento original está descolorido y granulado, debemos escoger una resolución DPI alta al escanear para obtener mejores resultados.


En cuatro idiomas

La opción de traducir una imagen a texto está disponible en la pantalla de carga y puede usarse en archivos PDF, JPEG, GIF y PNG. Como se advertía en la nota de prensa, puede que no se conserve todo el formato, por lo que se incluye un original del escaneado en el documento. Actualmente, el reconocimiento óptico en Google Docs puede usarse en inglés, francés, alemán y español, pero, como siempre, la políglota Google afirma que se incorporarán más idiomas.

El único problema hasta ahora podría ser que no funciona muy bien del todo. El anuncio oficial por parte de Google sólo menciona documentos, por lo que hemos buscado algunas imágenes escritas a mano en la red y hemos intentado subirlas sin conseguir ningún texto. Nuestro colaborador comentaba cuando la noticia nos llamó la atención originalmente al verla en el blog no oficial Google Operating System que “quienes dependan mucho de las funciones de reconocimiento óptico probablemente queden decepcionados con las funciones y puede que obtengan mejores resultados con soluciones comerciales”.





No hay comentarios:

Hemeroteca

Etiquetas