Foro de elhacker.net

Programación => Scripting => Mensaje iniciado por: Fluflu en 26 Julio 2010, 18:54 pm



Título: Visualizar web batch
Publicado por: Fluflu en 26 Julio 2010, 18:54 pm
Hola, necesito copiar el texto de una Web y pegarlo en un .doc para tener la información más accesible, el problema es que el texto se encuentra dividido en capitulos, uno en cada pagina y son en total 400, las url son faciles simplemente varia el número del capitulo. Me gustaría saber si es posible hacer un Batch capaz de extraer el texto de cada pagina y redireccionarlo a un .doc, creo que para cada url con un bucle FOR que aumentara en 1 el numero de capitulo bastaría pero lo de extraer el texto no sabría hacerlo.

¿A alguien se le ocurre algo? ¿Se puede visualizar una Web desde la consola (Aunque sea en HTML)?

Nota: la url es del tipo web/sección/capitulo.html por eso con sumar 1 cada capitulo serviría creo.

Si no se puede ya lo haré a mano, me llevará bastante pero en fin...

GRACIAS :)


Título: Re: Visualizar web batch
Publicado por: winroot en 26 Julio 2010, 19:09 pm
se que es raro, pero en mi windows xp tengo un comando llamado get que copia todo el fuente de una web, y lo puedes mandar a un archivo.
Código:
inicio>ejecutar>cmd>get http://www.web.com/f.htm >>c:\a.doc
/code]
fijate si dispones de el comando get, sinó lo mejor sería conseguir una tool en línea de comandos que lo haga, o hacerlo en php , que sería muy simple creo.
saludos 


Título: Re: Visualizar web batch
Publicado por: EvilGoblin en 26 Julio 2010, 19:33 pm
bajate wget o curl que los manejas de la linea de comandos para anidarlo a un batch



Título: Re: Visualizar web batch
Publicado por: Fluflu en 27 Julio 2010, 20:30 pm
Gracias por responder ;) , lo cierto es que a los pocos minutos de preguntar se me ocurrió hacer el script en Bash en vez de en batch usando el comando wget y un par de bucles y me ha funcionado a la perfección. Pregunté porque si que me sonaba que había un comando para bajar el codigo de fuente (GET, gracias winroot, lo recordaré para la próxima),gracias también evilgoblim, he usado el wget de Ubuntu que ya lo trae instalado para usar en la consola. Bueno, siento haber preguntado para hacer luego lo que me ha dado la gana jeje. :P