Foro de elhacker.net

Sistemas Operativos => GNU/Linux => Mensaje iniciado por: user-marcos en 11 Julio 2015, 19:35 pm



Título: Cambiar la codificación de un pdf
Publicado por: user-marcos en 11 Julio 2015, 19:35 pm
Buena señores soy el pesao de los pdf. Gracias al mensaje anterior he podido realizar la conversión, después de preparar el algoritmo para convertir más de 15000 ficheros html, me doy cuenta que están decodificados, ¿Sabéis como puede cambiarlos utf8?
Un saludo.   


Título: Re: Cambiar la codificación de un pdf
Publicado por: Slava_TZD en 23 Julio 2015, 16:44 pm
Código:
iconv -f iso-8859-1 -t utf-8 Cambiarlacodificacióndeunpdf.html -o Cambiarlacodificacióndeunpdf.UTF8.html

El charset original en el ejemplo es iso-8859-1 pero puede variar según de donde estés bajando los htmls, puedes sacarlo con file:

Código:
file -bi file.html

Saludos