Llevo un tiempo buscando la manera de extraer información de un apartado de una web especifico para así poder ver los datos a través del tiempo.
Ejemplo de lo que quiero hacer:
Imaginad que quiero extraer el numero de gente conectados al foro de la página del hacker.net (no es el caso) y solo quiero guardar ese numero, no otra cosa. (Es información pública, nada de hacking)
Como podría hacerlo? (solo la parte de extraer la información adecuada, guardarlo en un fichero de texto y tal eso ya sé cómo hacerlo)
Muchas gracias a todos de antemano ! sois todos geniales.
En línea
# "Saber romper medidas de seguridad no hacen que seas hacker, al igual que saber hacer un puente en un coche no te convierte en un ingeniero de automoción" -- Eric Raymond
Si sabés PHP podrías hacer un script que se ejecute cada cierto tiempo con cronjobs, con el mismo PHP leer el HTML de la página y con expresiones regulares llegar al número de usuarios y guardarlo en un archivo de texto.
También con python aunque no sabría como hacer para que se ejecute solo.
« Última modificación: 2 Septiembre 2013, 17:31 pm por kokaroto »
La verdad eso es muuuuuy facl, yo tengo una aplicación que obtiene datos de cualquier página web, esta información o datos luego se los puede guardar en un archivo de texto o una BBDD de datos, este proceso lo utilizo para:
1.- Obtener las Ultimas Noticias del dia 2.- Obtener el estado del tiempo y reporte de temperatura 3.- Información de la Wikipedia 4- Información del RAI Diccionario de la Real Academia Española 5.- Lista de enlaces de una consulta en Google 6.- Resultados de juegos , deportes 7.- Valores de cotozaciones de monedas.
etc
Saludos
En línea
Nadie conoce lo que se puede llegar a alcanzar o conseguir, sino hasta que se decide dar el primer paso.