elhacker.net cabecera Bienvenido(a), Visitante. Por favor Ingresar o Registrarse
¿Perdiste tu email de activación?.

 

 


Tema destacado: Curso de javascript por TickTack


+  Foro de elhacker.net
|-+  Seguridad Informática
| |-+  Hacking (Moderador: toxeek)
| | |-+  [Google] Peticiones de búsqueda automáticas
0 Usuarios y 1 Visitante están viendo este tema.
Páginas: [1] Ir Abajo Respuesta Imprimir
Autor Tema: [Google] Peticiones de búsqueda automáticas  (Leído 3,693 veces)
kub0x
Enlightenment Seeker
Colaborador
***
Desconectado Desconectado

Mensajes: 1.486


S3C M4NI4C


Ver Perfil
[Google] Peticiones de búsqueda automáticas
« en: 10 Junio 2013, 17:13 pm »

Buenas,

estoy desarrollando una aplicación que realiza múltiples consultas de parámetros en Google para posteriormente tratar esos datos y clasificarlos.

El problema se presenta al ver que Google clasifica mi tráfico como automático proveniente de un Bot. Se me ocurren varías técnicas para evitar que filtren mis resultados y pidan una confirmación (Captcha) para seguir utilizando el servicio:

• Aumentar el tiempo de espera entre petición. (Funciona ;) )
• Usar una lista de proxys, donde se utilizará uno al azar de la lista en cada petición. (Not Tested)
• ¿Hacerme pasar por un GoogleBot? (Spoofing) :D
• Y la MEJOR de todas: emplear BING (y/o otros buscadores).

Me gustaría que alguien arrojara algo de luz al asunto. No veo viable utilizar OCR para resolver el Captcha. ¿Se podría lograr bypassearlo mediante el uso de cookies?

Cualquier tipo de info es agradecida.

Saludos!
En línea

Viejos siempre viejos,
Ellos tienen el poder,
Y la juventud,
¡En el ataúd! Criaturas Al poder.

Visita mi perfil en ResearchGate

0xDani


Desconectado Desconectado

Mensajes: 1.077



Ver Perfil
Re: [Google] Peticiones de búsqueda automáticas
« Respuesta #1 en: 10 Junio 2013, 17:34 pm »

Bypassear el captcha lo veo difícil. Si no te importa aumentar el tiempo entre cada petición, es lo más sencillo.

Y si vas a usar proxies, piensa que no necesitas una lista larga. En vez de aumentar el tiempo de espera al triple, puedes ir alternando peticiones desde tres proxies distintos, por ejemplo.

Saludos.
En línea

I keep searching for something that I never seem to find, but maybe I won't, because I left it all behind!

I code for $$$
Hago trabajos en C/C++
Contactar por PM
OmarHack


Desconectado Desconectado

Mensajes: 1.268


Ver Perfil
Re: [Google] Peticiones de búsqueda automáticas
« Respuesta #2 en: 20 Junio 2013, 17:10 pm »

¿Y si entras a google desde google? xD
No sé si funcionará, a lo mejor sí.
Quiero decir usando el enlace de buscar google en google.
Es este:
https://www.google.es/url?sa=t&rct=j&q=&esrc=s&source=web&cd=6&cad=rja&sqi=2&ved=0CE8QFjAF&url=http%3A%2F%2Fwww.google.com%2Fintl%2Fes%2F&ei=jBvDUbqRF8nDPKahgcAC&usg=AFQjCNG7F5Zb3fk8Ocb_77P7m34mrj-fKg&sig2=HgjtroTa6TjUr7glnuv8Dg&bvm=bv.48175248,d.ZWU
En línea

I like to test things.
#!drvy


Desconectado Desconectado

Mensajes: 5.855



Ver Perfil WWW
Re: [Google] Peticiones de búsqueda automáticas
« Respuesta #3 en: 20 Junio 2013, 17:17 pm »

Citar
• Aumentar el tiempo de espera entre petición. (Funciona ;) )

Al cabo de un tiempo, si las peticiones son muy "sospechosas" (dorks) te acaba bloqueando igual.

Citar
• Usar una lista de proxys, donde se utilizará uno al azar de la lista en cada petición. (Not Tested)

Google ya hace pasar por captcha a muchos proxys.. sobre todo las que se utilizan por mucha gente xD.

Citar
• ¿Hacerme pasar por un GoogleBot? (Spoofing) :D

No se, pero, si fuera un desarrollador de google, me aseguraría de que mi bot proviene de una IP que yo controlo :P

Citar
• Y la MEJOR de todas: emplear BING (y/o otros buscadores).

Sin duda la mejor xD.

Saludos
En línea

kub0x
Enlightenment Seeker
Colaborador
***
Desconectado Desconectado

Mensajes: 1.486


S3C M4NI4C


Ver Perfil
Re: [Google] Peticiones de búsqueda automáticas
« Respuesta #4 en: 20 Junio 2013, 17:38 pm »

@OmarHack: debido a la compleja parametización de dicha página me supondría trabajo tener que eliminar lo que tengo y tener que basarme en dicha página de búsqueda.
Actualmente utilizo esta dirección, a la que le paso los parametros de búsqueda http://www.google.es/search?q=+aqui+los+params. Y aun así no estoy seguro de que funcione, ya que Google bloquea el servicio a aquellas IPs que generan tráfico constante y/o realizan consultas automáticas y pesadas.

@OxDani: Ya probé con una lista de Proxys. Sigo a dos velas ya que el Captcha se muestra constantemente. En cuanto al aumento del tiempo entre peticiones, pues, sigue bloqueandome el servicio, tal vez es porque guardo las cookies utilizadas en la primera petición para futuras peticiones.

@drvy| BSM: Gracias por la info, si hubieras respondido antes me hubieras ahorrado un quebradero de cabeza :D (hemos llegado a la misma conclusión). Cabe añadir que Google es el rey de los motores de búsqueda, y aunque Bing ofrezca Info que Google no tiene indexada, todos sabemos que Google ofrece amplios y mejores resultados, he ahí la cuestión de porque necesito emplearlo.

La implementación de búsquedas en Google la dejaré para el final del desarrollo de la App, ya que funciona del todo bien hasta que te bloquean el servicio.

Gracias a todos por vuestra atención. Cualquier consejo es bienvenido.

Saludos!
En línea

Viejos siempre viejos,
Ellos tienen el poder,
Y la juventud,
¡En el ataúd! Criaturas Al poder.

Visita mi perfil en ResearchGate

Páginas: [1] Ir Arriba Respuesta Imprimir 

Ir a:  

WAP2 - Aviso Legal - Powered by SMF 1.1.21 | SMF © 2006-2008, Simple Machines