elhacker.net cabecera Bienvenido(a), Visitante. Por favor Ingresar o Registrarse
¿Perdiste tu email de activación?.

 

 


Tema destacado: Guía rápida para descarga de herramientas gratuitas de seguridad y desinfección


+  Foro de elhacker.net
|-+  Programación
| |-+  Python (Moderador: Danielㅤ)
| | |-+  [PYTHON] Como descargar un directorio web completo
0 Usuarios y 1 Visitante están viendo este tema.
Páginas: [1] Ir Abajo Respuesta Imprimir
Autor Tema: [PYTHON] Como descargar un directorio web completo  (Leído 5,415 veces)
n3w

Desconectado Desconectado

Mensajes: 87


¿Libertad? ¿Para qué?


Ver Perfil
[PYTHON] Como descargar un directorio web completo
« en: 14 Diciembre 2012, 13:22 pm »

Buenas a todos:

Como explica el título estoy intentando descargarme una revista online entera desde el primero hasta el último número que han liberado de forma gratuita. Decidí hacerme un script en python porque me apetecía recordar el lenguaje.
El caso es que no se de qué forma puedo listar los archivos de un directorio web enteros o directamente descargarme todos los posibles ficheros descargables de ese directorio.
Hacer
Código:
wget -r -np http://sitioweb.com/ 
ya me descargaría todos los ficheros del árbol de directorios hacia abajo de forma recursiva, sin embargo quiero hacerlo directamente desde python.
Si, he probado con urllib, pero que yo sepa solo me descarga ficheros uno a uno por su path exacto.


Un saludo


En línea

Novlucker
Ninja y
Colaborador
***
Desconectado Desconectado

Mensajes: 10.683

Yo que tu lo pienso dos veces


Ver Perfil
Re: [PYTHON] Como descargar un directorio web completo
« Respuesta #1 en: 14 Diciembre 2012, 13:41 pm »

Lo que debes de hacer es parsear el HTML en busca de los links descargables.

Saludos


En línea

Contribuye con la limpieza del foro, reporta los "casos perdidos" a un MOD XD
"Hay dos cosas infinitas: el Universo y la estupidez  humana. Y de la primera no estoy muy seguro."
Albert Einstein
n3w

Desconectado Desconectado

Mensajes: 87


¿Libertad? ¿Para qué?


Ver Perfil
Re: [PYTHON] Como descargar un directorio web completo
« Respuesta #2 en: 14 Diciembre 2012, 13:44 pm »

Gracias =) es un lío pudiendo descargarme el wget para windows. pero quería hacerlo exclusivamente con los módulos predeterminados en python.

Un saludo ^^
En línea

0x5d

Desconectado Desconectado

Mensajes: 241



Ver Perfil WWW
Re: [PYTHON] Como descargar un directorio web completo
« Respuesta #3 en: 15 Diciembre 2012, 18:08 pm »

Gracias =) es un lío pudiendo descargarme el wget para windows. pero quería hacerlo exclusivamente con los módulos predeterminados en python.

Un saludo ^^
Hola, muy buen día.

Como dice acá el "colega" Novlucker

Lo que debes de hacer es parsear el HTML en busca de los links descargables.

Saludos

Parsea el html, tienes la opción de hacer un
Código
  1. import urllib2
  2. from HTMLParser import *
  3.  
  4. class Parser(HTMLParser):
  5.  
  6.  def handle_data(self, data):
  7.    return data
  8.  
  9. web = urllib2.urlopen("http://www.elhacker.net").read()
  10. parsear = Parser()
  11. print parsear.feed(web)
  12.  
Sino deseas hacerlo así, te recomiendo que averigües sobre la librería "re" , podrás encontrar los enlaces de una web vía Expresiones Regulares .

Saludos.
En línea

Páginas: [1] Ir Arriba Respuesta Imprimir 

Ir a:  

Mensajes similares
Asunto Iniciado por Respuestas Vistas Último mensaje
[Python] Multihilo para descargar archivos
Python
aaronduran2 0 3,677 Último mensaje 2 Junio 2011, 17:56 pm
por aaronduran2
De donde puedo descargar wow completo?
Juegos y Consolas
javikore 1 3,773 Último mensaje 9 Agosto 2011, 12:02 pm
por peib0l
como descargar swf completo de una pagina
Software
astro1 0 2,110 Último mensaje 14 Abril 2012, 18:12 pm
por astro1
[PYTHON] Cómo puedo indicar el directorio y tipo de archivo?
Python
Maldito karma 3 3,847 Último mensaje 25 Julio 2012, 22:37 pm
por Eleкtro
[PYTHON] donde descargar easy canvas?
Python
za.asi 1 3,596 Último mensaje 2 Marzo 2017, 11:26 am
por ofierrog
WAP2 - Aviso Legal - Powered by SMF 1.1.21 | SMF © 2006-2008, Simple Machines