Foro de elhacker.net

Programación => Scripting => Mensaje iniciado por: OssoH en 22 Septiembre 2022, 15:07 pm



Título: Saber la posición de una imagen dentro de un PDF
Publicado por: OssoH en 22 Septiembre 2022, 15:07 pm
Hola,
Extraer imágenes PDF y saber en qué página se encuentra y qué ubicación (x0,y0,x1,y1) tienen dentro del PDF.
Gracias al siguiente enlace he conseguido extraer las imágenes y guardarlas en local.
https://www.thepythoncode.com/article/extract-pdf-images-in-python

Ahora me falta y no sé como hacerlo el saber que posición ocupa esta imagen dentro del pdf.

¿me aconsejan otra libreria?
Algún consejo.
Gracias.



Título: Re: Saber la posición de una imagen dentro de un PDF
Publicado por: reymosquito en 23 Septiembre 2022, 07:30 am
¿consejo?
1)poné el código de lo que has intentado
2)ya que subís enlaces, podrías hacerlo con algún pdf a trabajar
3)"Extraer imágenes PDF y saber en qué página se encuentra y qué ubicación (x0,y0,x1,y1)" parece una tarea, no esperes todo hecho sin mostrar algún avance.


Título: Re: Saber la posición de una imagen dentro de un PDF
Publicado por: OssoH en 23 Septiembre 2022, 10:38 am
He dado con la solución.

Código:
import fitz

doc = fitz.open("test.pdf")
page = doc[0]
items = page.getImageList(full=True)

# bypass `item[-1] != 0`
item = list(items[0])
item[-1]=0

bbox = page.getImageBbox(item)
print(bbox)
# Rect(57.900001525878906, 129.5078125, 688.8927612304688, 582.1100463867188)