Foro de elhacker.net

Programación => Programación General => Mensaje iniciado por: fileteruso en 28 Marzo 2021, 20:44 pm



Título: ¿Hay alguna posibilidad de crear estructuras de datos internamente en un documento PDF?
Publicado por: fileteruso en 28 Marzo 2021, 20:44 pm
Estoy haciendo un proyecto y necesito almacenar de manera interna en un documento PDF pequeños datasets que luego puedan ser extraídos. Estos datos pueden ser de tipo entero, real, booleano y cadenas de texto. A nivel de guardado creo que PDF trae de manera básica arrays donde podría almacenar esos datos, pero me surgen dudas respecto a la extracción, sobre todo en cuanto a la identificación de esos datos.

¡Si alguien tiene alguna idea estaría muy agradecido de que la compartiera!

ACTUALIZACIÓN (07/04):
He visto que existen ciertos objetos internos en PDF que se llaman diccionarios y que a su vez podrían contener otros objetos de tipo array que pueden servir para mi propósito. El problema que tengo ahora es todo el tema de identificación del objeto, tanto al guardar como al extraer.

ACTUALIZACIÓN (16/04):
Finalmente he visto que es posible usar la librería iText para Java que permite manipular documentos PDF. Estoy guardando datos en el objeto PDF Catalog que viene de manera predeterminada en todos los documentos PDF para evitar problemas de identificación ya que mediante el uso de iText el acceso y modificación de este objeto PDF Catalog es trivial.


Título: Re: ¿Hay alguna posibilidad de crear estructuras de datos internamente en un documento PDF?
Publicado por: marax en 8 Abril 2021, 18:25 pm
Si te gusta la manera exhaustiva... Leyendo esto puedes hacer eso y mucho mas

https://www.adobe.com/content/dam/acom/en/devnet/pdf/pdfs/PDF32000_2008.pdf (https://www.adobe.com/content/dam/acom/en/devnet/pdf/pdfs/PDF32000_2008.pdf)


Título: Re: ¿Hay alguna posibilidad de crear estructuras de datos internamente en un documento PDF?
Publicado por: fileteruso en 16 Abril 2021, 02:12 am
Ya le estuve echando un ojo, el problema que trae es que, aparte de ser muy extensa, viene cuál es la estructura interna de un documento PDF pero no cómo manipular esa estructura. Finalmente, como he puesto en la última actualización del hilo, me he decantado por usar la librería iText para Java para hacerlo.

Si te gusta la manera exhaustiva... Leyendo esto puedes hacer eso y mucho mas

https://www.adobe.com/content/dam/acom/en/devnet/pdf/pdfs/PDF32000_2008.pdf (https://www.adobe.com/content/dam/acom/en/devnet/pdf/pdfs/PDF32000_2008.pdf)