elhacker.net cabecera Bienvenido(a), Visitante. Por favor Ingresar o Registrarse
¿Perdiste tu email de activación?.

 

 


Tema destacado: Arreglado, de nuevo, el registro del warzone (wargame) de EHN


+  Foro de elhacker.net
|-+  Programación
| |-+  Programación General
| | |-+  Orientacion sobre programar bot/spider que recopile datos de paginas Youtube
0 Usuarios y 1 Visitante están viendo este tema.
Páginas: [1] Ir Abajo Respuesta Imprimir
Autor Tema: Orientacion sobre programar bot/spider que recopile datos de paginas Youtube  (Leído 3,456 veces)
beat fenix

Desconectado Desconectado

Mensajes: 3


Ver Perfil
Orientacion sobre programar bot/spider que recopile datos de paginas Youtube
« en: 20 Junio 2011, 12:22 pm »

Hola,
Estoy bastante verde en esto de programación, espero que podais orientarme minimamente porque no he encontrado aun nada por donde tirar. No se que lenguaje necesito para hacer esto, y no me manejo en ninguno, tendria que aprender. Vamos al lio.

Necesitaría programar un bot o spider que recopile el numero de suscriptores de las paginas de Youtube que yo le diga (con una lista). En mi imaginación el algoritmo es sencillo, tengo una lista de url´s y le digo que cada 7 dias vaya a esas paginas y me recopile, de entre toda la información que tiene, solo el numero de suscriptores. Con eso me valdría, pero si ademas me hace una tablita curiosa, poniendo en una columna diferente los datos de la fecha en que fueron tomados, bien, si no con que sobreescriba los datos, suficiente.

Gracias.


En línea

beat fenix

Desconectado Desconectado

Mensajes: 3


Ver Perfil
Re: Orientacion sobre programar bot/spider que recopile datos de paginas Youtube
« Respuesta #1 en: 22 Junio 2011, 14:38 pm »

Por si alguien esta en mi misma situacion ire posteando lo que vaya consiguiendo. He estado avanzando un poco por mi cuenta. Me he mirado el libro de Raul Gonzalez Duque que recomendais aqui "Python para todos" y buscando cosas por internet.
 
Como primer paso, he consiguido un codigo con el que veo parte del codigo HTML de una pagina web.

Código:
import urllib                                       
sock = urllib.urlopen("http://www.youtube.com/user/comunidadzonaa")
htmlSource = sock.read()                            
sock.close()                                        
print htmlSource
raw_input()

Me faltaria conseguir extraer la info que me interesa de ahi (Creo que en esa pantalla solo veo una parte del codigo de la pagina) y que en lugar de poner la url ahi que la coja de una lista (eso sera mas facil, creo)

Si veis que me voy por donde no es me comentais


« Última modificación: 22 Junio 2011, 14:41 pm por beat fenix » En línea

Páginas: [1] Ir Arriba Respuesta Imprimir 

Ir a:  

WAP2 - Aviso Legal - Powered by SMF 1.1.21 | SMF © 2006-2008, Simple Machines