Título: [PYTHON ]Ayuda expresiones regulares Publicado por: aangrymasther en 20 Diciembre 2022, 14:17 pm Buenas peña, os cuento las penas que me llevan a consultaros. Estoy trasteando con expresiones regulares para intentar detectar las URLs que puedan existir dentro de una página web para consultarlas y ver si funcionan bien (devuelven un 200) o si están vacías (404). El caso es que la expresión que estoy utilizando no me detecta las url desde python, si embargo en páginas que "simulan" las expresiones funcionan a la perfección. ¿Se os ocurre porque no funciona en python? La expresión que estoy usando es la siguiente.
http\[\s\]?:\/\/([a-z|A-z]|[0-9]|\.?)+[^<"'>]+ Muchas gracias de antema PD: Si a alguien le interesa puedo rularle el código cuando lo tenga acabado, quiero usarlo para ver que direcciones tengo que cambiar en las páginas web ;-). Título: Re: [PYTHON ]Ayuda expresiones regulares Publicado por: aangrymasther en 20 Diciembre 2022, 16:29 pm Bueno ya he sacado una expresión que parece funcionar (solo he estado como 4h probando :rolleyes:): [http|https]?:\/\/[a-z]+\.?[a-z]+\.?[a-z]+[/]?[0-9a-z\-/#A-Z\.]+
Ahora solo tengo que solucionar un problema que me da con el timeout (supongo que serán medidas de seguridad de los servidores y tendré que ponerle una espera entre consulta y consulta) y estará listo. |