Buenas peña, os cuento las penas que me llevan a consultaros. Estoy trasteando con expresiones regulares para intentar detectar las URLs que puedan existir dentro de una página web para consultarlas y ver si funcionan bien (devuelven un 200) o si están vacías (404). El caso es que la expresión que estoy utilizando no me detecta las url desde python, si embargo en páginas que "simulan" las expresiones funcionan a la perfección. ¿Se os ocurre porque no funciona en python? La expresión que estoy usando es la siguiente.
http\[\s\]?:\/\/([a-z|A-z]|[0-9]|\.?)+[^<"'>]+
Muchas gracias de antema
no y felices fiestas.
PD: Si a alguien le interesa puedo rularle el código cuando lo tenga acabado, quiero usarlo para ver que direcciones tengo que cambiar en las páginas web
.