Foro de elhacker.net

Programación => Scripting => Mensaje iniciado por: binario010101 en 1 Diciembre 2013, 18:51 pm



Título: descargar archivos de internet desde bat usando wget error con los captcha
Publicado por: binario010101 en 1 Diciembre 2013, 18:51 pm
hola amigos ya se que existen muchos gestores de descargas que pueden saltarse o resolver los captcha pero yo estoy usando wget y un bat para realizar mis descargas el problema no e podido resolver los captcha.

Código:
wget -b --limit-rate=20k -cv -Ep  -i enlaces.txt
tengo el wget en la misma carpeta que el bat y el archivo enlaces.txt con los enlaces de descargas. funciona bien

en internet dicen que se puede hacer con Python o con  l pero no encuentro un lugar donde lo expliquen?

http://blog.rodrigorega.es/tag/captcha/ (http://blog.rodrigorega.es/tag/captcha/)
https://groups.google.com/forum/#!topic/linux.debian.user/iVf1QhbSXWM (https://groups.google.com/forum/#!topic/linux.debian.user/iVf1QhbSXWM)


Título: Re: descargar archivos de internet desde bat usando wget error con los captcha
Publicado por: Eleкtro en 1 Diciembre 2013, 19:17 pm
Ni siquiera especificas el tipo de imagen captcha del que se trata, pero desde luego, con puro Batch no vas a poder.

Si son Captchas simples como los de la imagen del primer enlace entonces puedes utilizar cualquier motor OCR commandline como por ejemplo el archi-conocido Tesseract, o cualquier otro de estos (http://en.wikipedia.org/wiki/Comparison_of_optical_character_recognition_software).

Si se trata de imágenes RE-captcha de Google, o figuras como circulos, lo tienes más dificil, y en ese caso debes acudir a servicios de pago como este (http://www.9kw.eu/plugins.html), el cual ofrece todo tipo de Plugins/API/Herramienta commandline, los créditos de uso también los puedes ganar de forma manual.

Saludos


Título: Re: descargar archivos de internet desde bat usando wget error con los captcha
Publicado por: binario010101 en 1 Diciembre 2013, 19:21 pm
son captcha de letras y numeros, son los mas usados pero igual me sirve uno mas avanzado. y efectivamente se que nesesito una aplicacion externa el problema es que no se como usarla ni cual.


Título: Re: descargar archivos de internet desde bat usando wget error con los captcha
Publicado por: Eleкtro en 1 Diciembre 2013, 19:27 pm
son captcha de letras y numeros, son los mas usados

No es una respuesta lo suficientemente clarificadora, deberías postear una imagen del captcha para saber de que tipo de servicio se trata y así aconsejarte mejor,
de todas formas te he indicado lo que deberías usar en cada caso de servicio captcha.

Tessaract es muy facil de usar, aquí (http://tesseract-ocr.googlecode.com/svn/trunk/doc/tesseract.1.html) tienes un manual, pero no vas a conseguir ni un 1% de aciertos si se tratan de re-captchas de Google, ese tipo de captchas deben ser resueltos de forma humana, el servicio 9kw que te indiqué es perfecto para esa tarea, aunque hay varios más como CaptchaBrotherHood, pero no se si disponen de herramientas commandline para usar en proyectos Batch.

Saludos