elhacker.net cabecera Bienvenido(a), Visitante. Por favor Ingresar o Registrarse
¿Perdiste tu email de activación?.

 

 


Tema destacado: Estamos en la red social de Mastodon


+  Foro de elhacker.net
|-+  Programación
| |-+  Scripting
| | |-+  Scripting para content Grabber
0 Usuarios y 1 Visitante están viendo este tema.
Páginas: [1] Ir Abajo Respuesta Imprimir
Autor Tema: Scripting para content Grabber  (Leído 2,213 veces)
Reevo

Desconectado Desconectado

Mensajes: 2


Apasionado de la edición de contenido multimedia.


Ver Perfil WWW
Scripting para content Grabber
« en: 18 Agosto 2019, 14:00 pm »

Buenas!

Creo que este es el hilo más apropiado para poner mi duda, así que ahi voy con ello.

Llevo un par de días utilizando content Grabber. Se trata de un programa que sirve para scrapear sitios webs de forma sencilla (su panel te permite hacer prácticamente todo de forma muy visual).
Tiene unas opciones más avanzadas donde permite para las diferentes acciones o comandos que ejecuta, ejecutar un script (permite regex, c# y otro más).

Me gustaría si alguien es capaz de ayudarme con eso. He estado probando regex y no he conseguido dar con la forma de hacerlo correctamente. C# no me asusta (he programado cosillas en C++) así que también es algo que me plantearía como opción posible.

Sabeis de algún sito donde pueda mirar documentación para hacer esto? Lo que me gustaría es, teniendo un input de html limpio -sin estilo en linea - borrar determinadas etiquetas según lo extrae (como <div> o <span>). Todo lo que he probado hasta el momento no me ha servido :(

Gracias!


En línea

engel lex
Moderador Global
***
Desconectado Desconectado

Mensajes: 15.514



Ver Perfil
Re: Scripting para content Grabber
« Respuesta #1 en: 18 Agosto 2019, 14:17 pm »

si es con regex y tiene opción de sustitución seria algo como

Código:
\<.+?\>

y el sustituto seria vacío (nada)


En línea

El problema con la sociedad actualmente radica en que todos creen que tienen el derecho de tener una opinión, y que esa opinión sea validada por todos, cuando lo correcto es que todos tengan derecho a una opinión, siempre y cuando esa opinión pueda ser ignorada, cuestionada, e incluso ser sujeta a burla, particularmente cuando no tiene sentido alguno.
Páginas: [1] Ir Arriba Respuesta Imprimir 

Ir a:  

Mensajes similares
Asunto Iniciado por Respuestas Vistas Último mensaje
Duda sobre meta http-equiv="Content-Type" content="text/html; charset=utf-8"
Desarrollo Web
Hadess_inf 3 12,791 Último mensaje 22 Julio 2010, 06:44 am
por Morris
Seis herramientas para realizar "content curation
Noticias
wolfbcn 0 1,982 Último mensaje 29 Septiembre 2012, 13:58 pm
por wolfbcn
Content Locker para blogger?
Programación General
manfer1 0 1,696 Último mensaje 26 Febrero 2014, 02:55 am
por manfer1
¿Cómo se haría? Proxy grabber [C#]
.NET (C#, VB.NET, ASP)
nevachana 3 3,214 Último mensaje 11 Febrero 2015, 19:39 pm
por nevachana
Proxies Grabber
Seguridad
dimineko 1 2,303 Último mensaje 3 Diciembre 2017, 19:08 pm
por dimitrix
WAP2 - Aviso Legal - Powered by SMF 1.1.21 | SMF © 2006-2008, Simple Machines