elhacker.net cabecera Bienvenido(a), Visitante. Por favor Ingresar o Registrarse
¿Perdiste tu email de activación?.

 

 


Tema destacado: Guía actualizada para evitar que un ransomware ataque tu empresa


+  Foro de elhacker.net
|-+  Programación
| |-+  Programación General
| | |-+  HTML parse [ayuda]
0 Usuarios y 1 Visitante están viendo este tema.
Páginas: [1] Ir Abajo Respuesta Imprimir
Autor Tema: HTML parse [ayuda]  (Leído 1,594 veces)
Grave


Desconectado Desconectado

Mensajes: 314


|\|0\/\/ 15 7|-|3 71/\/\3


Ver Perfil WWW
HTML parse [ayuda]
« en: 31 Agosto 2015, 01:13 am »

hola alguien podría ayudarme a idear un algoritmo elegante que permita leer el contenido de una etiqueta teniendo en cuenta que adentro pueden haber mas etiquetas del mismo tipo, osea recursion, he intentado con una cola y con una función recursiva pero no consigo resultados eficientes, agradecería cualquier ayuda en cualquier lenguaje conocido


En línea

"y el conocimiento os hara libres"

Module Console1
   Console.Write("Hello Word")
   Console.ReadLine()
End Module
http://aion.cr0n0triger.operaunite.com/
eLank0
eLhAcKeR r00Lz


Desconectado Desconectado

Mensajes: 1.062



Ver Perfil WWW
Re: HTML parse [ayuda]
« Respuesta #1 en: 2 Septiembre 2015, 14:44 pm »

All you need is web scrapping. Búsca sobre ello...

Salu2


En línea

Eleкtro
Ex-Staff
*
Desconectado Desconectado

Mensajes: 9.809



Ver Perfil
Re: HTML parse [ayuda]
« Respuesta #2 en: 6 Septiembre 2015, 16:50 pm »

agradecería cualquier ayuda en cualquier lenguaje conocido

¿Realmente quieres desarrollar el algoritmo desde cero?, lo vengo a decir por que según que lenguaje entonces sería cómo reinventar la rueda, algo un poco innecesario al existir ya herramientas especializadas, pero igualmente te lo pregunto por saber si la razón es justificable (ej. ganas de aprender) o no lo es (ej. desconocimiento de librerías).

En .Net, mi opción favorita por su simplicidad y eficacia, tienes la librería de terceros HTML Agility Pack, la cual es un muy buen parser de documentos Html (para el web-scrapping), aunque también puedes parsear Html con la librería de classes de .Net, con las classes de documentos Html, vamos, que no tienes que reinvetar nada, pero se haría más tedioso que usando las facilidades de dicha librería.
http://htmlagilitypack.codeplex.com/

En Python tienes el módulo HTMLParser, e imagino que existirán varias herramientas más de terceros.
http://docs.python.org/2/library/htmlparser.html

En Ruby tienes la gema Nokogiri, la cual es la recomendación Top de las gemas para parsear html.
http://www.nokogiri.org/tutorials/parsing_an_html_xml_document.html

Saludos
« Última modificación: 6 Septiembre 2015, 16:53 pm por Eleкtro » En línea

Páginas: [1] Ir Arriba Respuesta Imprimir 

Ir a:  

Mensajes similares
Asunto Iniciado por Respuestas Vistas Último mensaje
Mostrar codigo fuente escondido por HTML Protector, HTML Guardian, Altrise, etc.
Desarrollo Web
sirdarckcat 1 13,861 Último mensaje 10 Enero 2012, 09:40 am
por gm-vl
que es mejor, escribir codigo html desde un echo o html solo
Desarrollo Web
morenochico 1 4,553 Último mensaje 14 Febrero 2011, 19:10 pm
por ~ Yoya ~
AYUDA: Java Parse URL
Java
SeñorX95 9 2,984 Último mensaje 11 Marzo 2015, 22:48 pm
por Usuario Invitado
WAP2 - Aviso Legal - Powered by SMF 1.1.21 | SMF © 2006-2008, Simple Machines