Foro de elhacker.net

Programación => Scripting => Mensaje iniciado por: Reevo en 18 Agosto 2019, 14:00 pm



Título: Scripting para content Grabber
Publicado por: Reevo en 18 Agosto 2019, 14:00 pm
Buenas!

Creo que este es el hilo más apropiado para poner mi duda, así que ahi voy con ello.

Llevo un par de días utilizando content Grabber. Se trata de un programa que sirve para scrapear sitios webs de forma sencilla (su panel te permite hacer prácticamente todo de forma muy visual).
Tiene unas opciones más avanzadas donde permite para las diferentes acciones o comandos que ejecuta, ejecutar un script (permite regex, c# y otro más).

Me gustaría si alguien es capaz de ayudarme con eso. He estado probando regex y no he conseguido dar con la forma de hacerlo correctamente. C# no me asusta (he programado cosillas en C++) así que también es algo que me plantearía como opción posible.

Sabeis de algún sito donde pueda mirar documentación para hacer esto? Lo que me gustaría es, teniendo un input de html limpio -sin estilo en linea - borrar determinadas etiquetas según lo extrae (como <div> o <span>). Todo lo que he probado hasta el momento no me ha servido :(

Gracias!


Título: Re: Scripting para content Grabber
Publicado por: engel lex en 18 Agosto 2019, 14:17 pm
si es con regex y tiene opción de sustitución seria algo como

Código:
\<.+?\>

y el sustituto seria vacío (nada)