Foro de elhacker.net

Foros Generales => Dudas Generales => Mensaje iniciado por: DonPilin en 14 Junio 2022, 13:50 pm



Título: NO PUEDO BUSCAR PALABRAS EN UN PDF
Publicado por: DonPilin en 14 Junio 2022, 13:50 pm
Hola b dia,alguien sabe como buscar palabras en un pdf en el cual no se puede copiar sus carecteres?EN todo caso como hacer para poder copiar  sus carecteres?Gracias
PD BUSCA PERO NO ENCUENTRA DEBIDO A QUE ESTA COMO CAPTURAS DE PANTALLAS EL PDF Y NO EDITABLE.


Título: Re: NO PUEDO BUSCAR PALABRAS EN UN PDF
Publicado por: EdePC en 14 Junio 2022, 14:44 pm
Tienes que aplicar OCR del tipo "para búsquedas" en tu PDF, lo puedes hacer con Acrobat Pro que al menos a mi me ha dado excelentes resultados o usar una alternativa gratuita OnLine como https://tools.pdf24.org/es/ocr-pdf

Obviamente todo dependerá de que tan legible estén los caracteres a reconocer


Título: Re: NO PUEDO BUSCAR PALABRAS EN UN PDF
Publicado por: Danielㅤ en 14 Junio 2022, 15:03 pm
Hola, cuando eso sucede que no se pueden copiar caracteres, palabras o frases en un PDF es porque generalmente no es un texto en si, sinó que son imágenes, no necesariamente tienen que ser capturas de pantalla, pueden ser textos convertidos a imágenes, de hecho hay programas y librerías (módulos) para realizar ese trabajo.


Saludos


Título: Re: NO PUEDO BUSCAR PALABRAS EN UN PDF
Publicado por: el-brujo en 14 Junio 2022, 18:29 pm
Yo también suelo usar Adobe Acrobat Professional, su reconocimiento de texto (OCR) funciona muy bien.

(https://i.imgur.com/9C6iNqv.jpg)


Título: Re: NO PUEDO BUSCAR PALABRAS EN UN PDF
Publicado por: EdePC en 15 Junio 2022, 13:43 pm
Yo también suelo usar Adobe Acrobat Professional, su reconocimiento de texto (OCR) funciona muy bien.

(https://i.imgur.com/9C6iNqv.jpg)

Correcto, yo he probado y utilizado bastante Acrobat Pro, las versiones X y XI actualizados tienen un muy buen OCR salvo un par de limitaciones: Problemas al realizar OCR en una página que contiene imágenes y a la vez texto normal, y otro problema al hacer OCR del tipo texto editable para luego editar el texto reconocido, el problema es que en las versiones X y XI no se crea un juego de caracteres para ser utilizados en reemplazo, siempre se tiene que usar una fuente existente en el sistema.

Las versiones nuevas de Acrobat como la 2017 en adelante son más pesaditas pero su OCR es excelente, sin las limitaciones anteriores. Claro que si se va hacer un OCR para búsquedas queda perfecto el XI que es más ligero en consumo de recursos.