Foro de elhacker.net

Programación => Scripting => Mensaje iniciado por: aaronduran2 en 16 Noviembre 2010, 11:18 am



Título: [SOLUCIONADO] [Bash] Problemas con grep en una URL
Publicado por: aaronduran2 en 16 Noviembre 2010, 11:18 am
Hola. Tengo un código para descargar el código fuente de una página, y que de ahí extraiga todas las direcciones URL que encuentre:

Código:
curl -s --url "$URLBase" | sed 's/^.*http/http/' | grep "http://kuro.hanyuu.net/" | cut -d'"' -f1 > $HOME/Links.txt

El problema es que en la lista de enlaces, incluye unos que empiezan por "URL/data/preview/", y esos no me interesan.
Probé con:
Código:
grep "http://kuro.hanyuu.net/*g*"
y añadir
Código:
grep [image|jpeg]
para que solo obtuviese las que tuviesen esa coincidencia, pero no funcionan.

¿Algún ejemplo que me permita detectar si la URL incluye "/data/preview/"?

Gracias de antemano.


Título: Re: [Bash] Problemas con grep en una URL
Publicado por: Shell Root en 17 Noviembre 2010, 04:21 am
Pues entonces, intenta formular una expresión regular que realice las acciones que necesites, por ejemplo,
Código
  1. http:\/\/(.*\.(net|com|org))


Título: Re: [Bash] Problemas con grep en una URL
Publicado por: aaronduran2 en 19 Noviembre 2010, 19:45 pm
La verdad es que soy un poco negado para esto de las RegExp... XD

¿Cómo debería aplicarlo a la línea que tengo?

Gracias por el tiempo ;)


Título: Re: [Bash] Problemas con grep en una URL
Publicado por: aaronduran2 en 20 Noviembre 2010, 23:58 pm
Bueno, al final lo solucioné, era fallo mío XD

Además, debía usar egrep para que me detectase las ExpReg:

Código:
egrep 'http://kuro.hanyuu.net/image/(.*)|jpeg(.*)/'

Gracias.