Título: Script para mostrar IP's de los dominios que aparecen en una búsqueda de Google Publicado por: Skali en 13 Julio 2016, 02:28 am Que tal gente, quería hacer un pequeño script en python, ya tengo todo en la mente. Básicamente uso una libreria para navegar x la web, leo del teclado un uri para luego enviar la consulta con un inurl:uri en el parametro q, de consulta de google. Despues parseo la respuesta para quedarme solo con los nombres de los dominios, los filtro para sacar el www. y lo que esta a partir del uri, para poder hacer un ping, con cada uno de los dominios fitlrados, parsear los resultados del ping para quesarte con la ip, y despues guardar en un archivo linea por línea todas las ips...
Los problemas que me surgieron son los siguientes: 1) No se que parámetro se usa para manejar el numero de pagina de google, porque se supone que se tiene que ir recorriendo todas las paginas hasta que ya no haya mas resultados. 2) Seguramente despues de navegar por un par de paginas me pida un captcha, tienen idea como bypassearlo? Gracias por la ayuda, si me dan una mano con ésto, despues subo el script terminado! Saludos Título: Re: Script para mostrar IP's de los dominios que aparecen en una búsqueda de Google Publicado por: Skali en 14 Julio 2016, 09:29 am lo primero ya lo resolví, el parametro es start... Por cada página google muestra 10 enlaces, si estas en la pagina uno es start=0, pagina 2, start=10, y asi susesivamente
Título: Re: Script para mostrar IP's de los dominios que aparecen en una búsqueda de Google Publicado por: Poyoncio en 20 Julio 2016, 21:03 pm Se seguramente no te interese pero hace un tiempo hice algo parecido, igual te sirve porque esta bastante simplificado:
Esta parte del codigo se encargaria de extraer las urls de las paginas web de un fichero. En la carpeta del script tienes que tener un documento llamado url1.txt con almenos 1 url o sino haces un raw_input y que automaticamente se escriba en el fichero Código Luego, esta parte se encarga de leer un dominio de url1.txt y convertirlo en una ipv4, ahi tienes que tu anteriormente haber filtrado el http://www o https://www haces un .replace('http://www' or 'https//www', '') y ya estaria filtrado: Código
Ademas puedes meter threads y que lea si ya estan esas direcciones dentro del fichero Si tienes alguna duda solo tienes que enviar mensaje estoy interesado en este proyecto |