Alguien me recomienda alguna libreria para un scraper web?

Bienvenido(a), Visitante. Por favor Ingresar o Registrarse
¿Perdiste tu email de activación?.

2 Agosto 2026, 18:04 pm

Tema destacado: Como proteger una cartera - billetera de Bitcoin

Foro de elhacker.net

Programación

Programación General

.NET (C#, VB.NET, ASP) (Moderador: kub0x)

Alguien me recomienda alguna libreria para un scraper web?

0 Usuarios y 1 Visitante están viendo este tema.

Páginas: [1]

Ir Abajo

Respuesta

Imprimir

Autor

Tema: Alguien me recomienda alguna libreria para un scraper web? (Leído 2,833 veces)

raytex

Desconectado

Desconectado

Mensajes: 6

Ver Perfil

Alguien me recomienda alguna libreria para un scraper web?

« en: 23 Agosto 2015, 18:13 pm »

Alguien me podría recomendar alguna librería de C# para realizar un scraper web que se logge en una pagina y saque información.

Mod: tema movido, esto no es C/C++ es .net


« Última modificación: 23 Agosto 2015, 18:22 pm por engel lex »	En línea

Eleкtro

Ex-Staff

Desconectado

Desconectado

Mensajes: 10.040

Ver Perfil

Re: Alguien me recomienda alguna libreria para un scraper web?

« Respuesta #1 en: 24 Agosto 2015, 10:31 am »

Para el web-scrapping, lee lo siguiente:

Cita de: Elektro

Cita de: zonahurbana en 16 Junio 2015, 00:00 am

¿recorres el DOM y obtienes valores de ciertas etiquetas?

Practiamente en eso consiste el web-crawling, en parsear los documentos Html para obtener información específica.

Hay varios modos de hacerlo, la más ordinaria es utilizando las funciones built-in de .net para partir un string (String.Split) y filtrarla mediante substracciones (String.Substring, String.IndexOf, String.LastInfexOf, etc...),
otra manera sería utilizando expresiones regulares (RegEx),
y otra manera sería utilizando ciertas librerías (HtmlagilityPack en caso de .Net) para representar el árbol del documento Html orientado a objetos,
entre alguna que otra metodología más que habrá.

Dices que estás interesado en ello, pues aquí puedes ver un pequeño ejemplo con el que puedes empezar:
➢ http://foro.elhacker.net/net/leer_datos_de_una_tabla_html-t436957.0.html

Y aquí tienes el source que compartí de un web-spider que recolecta los enlaces de una página de música en particular:
➢ [SOURCE] Plixid Leecher - By Elektro

También existe una librería especializada en el web-scrapping para .Net, se llama aBot, aunque nunca la llegué a probar en profundidad:
➢ https://github.com/sjdirect/abot
(también la puedes descargar por la consola de NuGet)

EDITO: Aparte de algunas Classes de .Net Framework que puedes utilizar para el parseo de Html o Xml, cómo HtmlElement o Xelement

Saludos


	En línea

Páginas: [1]

Ir Arriba

Respuesta

Imprimir

Ir a:

Mensajes similares
		Asunto	Iniciado por	Respuestas	Vistas	Último mensaje
		ALguien me recomienda alguna pagina?? Diseño Gráfico	Hades_Hell	3	4,507	11 Noviembre 2009, 02:04 am por dark_sargon
		alguien me recomienda una antena para wifi??? Materiales y equipos	holamega12	1	3,930	8 Abril 2013, 01:44 am por P4nd3m0n1um
		Duda: ¿Alguna libreria de C para multihilo? Programación C/C++	erest0r	7	3,978	1 Agosto 2014, 04:09 am por erest0r
		Alguien sabe alguna librería para comprimir archivos en .rar Programación C/C++	gibranini	1	2,831	6 Noviembre 2014, 23:55 pm por _Enko
		Conoceis alguna librería para test-to-speach y reconocimiento de voz? Programación General	@XSStringManolo	5	8,297	19 Noviembre 2019, 22:50 pm por @XSStringManolo

WAP2 - Aviso Legal - Powered by SMF 1.1.21 | SMF © 2006-2008, Simple Machines