Foro de elhacker.net

Programación => Programación General => Mensaje iniciado por: beat fenix en 20 Junio 2011, 12:22 pm



Título: Orientacion sobre programar bot/spider que recopile datos de paginas Youtube
Publicado por: beat fenix en 20 Junio 2011, 12:22 pm
Hola,
Estoy bastante verde en esto de programación, espero que podais orientarme minimamente porque no he encontrado aun nada por donde tirar. No se que lenguaje necesito para hacer esto, y no me manejo en ninguno, tendria que aprender. Vamos al lio.

Necesitaría programar un bot o spider que recopile el numero de suscriptores de las paginas de Youtube que yo le diga (con una lista). En mi imaginación el algoritmo es sencillo, tengo una lista de url´s y le digo que cada 7 dias vaya a esas paginas y me recopile, de entre toda la información que tiene, solo el numero de suscriptores. Con eso me valdría, pero si ademas me hace una tablita curiosa, poniendo en una columna diferente los datos de la fecha en que fueron tomados, bien, si no con que sobreescriba los datos, suficiente.

Gracias.


Título: Re: Orientacion sobre programar bot/spider que recopile datos de paginas Youtube
Publicado por: beat fenix en 22 Junio 2011, 14:38 pm
Por si alguien esta en mi misma situacion ire posteando lo que vaya consiguiendo. He estado avanzando un poco por mi cuenta. Me he mirado el libro de Raul Gonzalez Duque que recomendais aqui "Python para todos" y buscando cosas por internet.
 
Como primer paso, he consiguido un codigo con el que veo parte del codigo HTML de una pagina web.

Código:
import urllib                                       
sock = urllib.urlopen("http://www.youtube.com/user/comunidadzonaa")
htmlSource = sock.read()                            
sock.close()                                        
print htmlSource
raw_input()

Me faltaria conseguir extraer la info que me interesa de ahi (Creo que en esa pantalla solo veo una parte del codigo de la pagina) y que en lugar de poner la url ahi que la coja de una lista (eso sera mas facil, creo)

Si veis que me voy por donde no es me comentais