Foro de elhacker.net

Programación => Scripting => Mensaje iniciado por: aangrymasther en 20 Diciembre 2022, 14:17 pm



Título: [PYTHON ]Ayuda expresiones regulares
Publicado por: aangrymasther en 20 Diciembre 2022, 14:17 pm
Buenas peña, os cuento las penas que me llevan a consultaros. Estoy trasteando con expresiones regulares para intentar detectar las URLs que puedan existir dentro de una página web para consultarlas y ver si funcionan bien (devuelven  un 200) o si están vacías (404). El caso es que la expresión que estoy utilizando no me detecta las url desde python, si embargo en páginas que "simulan" las expresiones funcionan a la perfección. ¿Se os ocurre porque no funciona en python? La expresión que estoy usando es la siguiente.
http\[\s\]?:\/\/([a-z|A-z]|[0-9]|\.?)+[^<"'>]+

Muchas gracias de antemano y felices fiestas.

PD: Si a alguien le interesa puedo rularle el código cuando lo tenga acabado, quiero usarlo para ver que direcciones tengo que cambiar en las páginas web  ;-).


Título: Re: [PYTHON ]Ayuda expresiones regulares
Publicado por: aangrymasther en 20 Diciembre 2022, 16:29 pm
Bueno ya he sacado una expresión que parece funcionar (solo he estado como 4h probando  :rolleyes:): [http|https]?:\/\/[a-z]+\.?[a-z]+\.?[a-z]+[/]?[0-9a-z\-/#A-Z\.]+
Ahora solo tengo que solucionar un problema que me da con el timeout (supongo que serán medidas de seguridad de los servidores y tendré que ponerle una espera entre consulta y consulta)
  y estará listo.