Google Docs introduce reconocimiento OCR para reconocer texto en PDFs y en imágenes
Google acaba de añadir una opción interesante en su suite ofimática online: la posibilidad de poder subir una imagen o un archivo PDF al servicio y que éste pueda reconocer los caracteres utilizando el sistema de reconocimiento OCR y convertirlos en un documento editable.
El reconocimiento de caracteres OCR es un sistema que seguro que os suena si tenéis un escáner: detecta caracteres a partir de una imagen y los convierte a texto plano, de modo que podemos por ejemplo escanear un libro y transcribirlo automáticamente sin tener que copiarlo nosotros a mano. Google sencillamente ha trasladado este sistema de reconocimiento en Google Docs.
De todos modos los resultados, tras probar la conversión de un PDF a un documento editable, no es que sean ideales. La conversión omite todas las imágenes, y si quieres transcribir un PDF con ilustraciones pasarás a tener un texto plano (que no siempre es correcto) sin retornos de línea ni las ilustraciones. Menos da una piedra, pero esperemos que Google poco a poco vaya mejorando esta funcionalidad.
Fuente:http://www.genbeta.com/actualidad/google-docs-introduce-reconocimiento-ocr-para-reconocer-texto-en-pdfs-y-en-imagenes