Foro de elhacker.net

Programación => Scripting => Mensaje iniciado por: valrojo en 7 Abril 2020, 13:36 pm



Título: Convertir PDFs a text usando Python
Publicado por: valrojo en 7 Abril 2020, 13:36 pm
Tengo que cconvertir un PDF a text usando Python, el profesor nos ha dicho que utilicemos esta sentecia:
Código
  1. python3 pdf2txt.py document1.pdf > text.txt
pero a mi me sale el siguiente error: SyntaxError: invalid syntax

Para ello he utilizado python3.8


Título: Re: Convertir PDFs a text usando Python
Publicado por: Shell Root en 7 Abril 2020, 15:15 pm
Y tienes pdf2txt.py?


Título: Re: Convertir PDFs a text usando Python
Publicado por: valrojo en 7 Abril 2020, 15:46 pm
Sí, lo he tenido que instalar.


Título: Re: Convertir PDFs a text usando Python
Publicado por: tincopasan en 7 Abril 2020, 20:15 pm
Citar
el profesor nos ha dicho que utilicemos esta sentecia:
Código
bueno, estás esperando que te hagamos la tarea, que es muy simple, pero...

Citar
pero a mi me sale el siguiente error: SyntaxError: invalid syntax

¿y qué código has realizado para ello?


Título: Re: Convertir PDFs a text usando Python
Publicado por: valrojo en 9 Abril 2020, 13:33 pm
Es mi primera vez programando. Solo quiero saber cual es el error, no que me lo solucionéis.


Título: Re: Convertir PDFs a text usando Python
Publicado por: @XSStringManolo en 9 Abril 2020, 14:29 pm
Tengo que cconvertir un PDF a text usando Python, el profesor nos ha dicho que utilicemos esta sentecia:
Código
  1. python3 pdf2txt.py document1.pdf > text.txt
pero a mi me sale el siguiente error: SyntaxError: invalid syntax

Para ello he utilizado python3.8

Por si no entiendes el comando te lo explico:

python3 es el intérprete de python3.

pdf2txt.py es el programa que convierte un pdf a texto.

document1.pdf es el pdf que quieres convertir.

> text.txt es donde se guardará el resultado del comando anterior.

Me da a mi que el programa está escrito en Python2.
Instala python2 y ejecútalo así:
python pdf2txt.py document1.pdf > text.txt

No conozco el programa pero si no te va el output prueba con:
python pdf2txt.py document1.pdf -o text.txt

No entiendo mucho cual es la finalidad del ejercicio. No tendrás que escribir tu la utilidad pdf2txt.py en lugar de usar una existente?