Autor
|
Tema: Parsear html desde en java (Leído 5,149 veces)
|
soyderiver2007
Desconectado
Mensajes: 5
|
Hola, alguien me podría ayudar, necesito extraer los párrafos de un archivo con extensión html, el tag para los párrafos es "p". espero que alguien me pueda ayudar muchas gracias, saludos.
|
|
|
En línea
|
|
|
|
Leyer
Desconectado
Mensajes: 786
leyer@elhacker.net
|
Prueba asi Pattern p = Pattern.compile("<p>(.*?)</p>"); Matcher m = p.matcher(html); while (m. find()) System. out. println(m. group(1));
Un saludo.
|
|
|
En línea
|
|
|
|
soyderiver2007
Desconectado
Mensajes: 5
|
Muchas gracias Leyer, ya lo hice utilizando Jsoup. Igual lo voy a probar Saludos.
|
|
|
En línea
|
|
|
|
athlit
Desconectado
Mensajes: 83
|
Leyer era justo lo que andaba buscando. En un par de lineas obtengo lo que hacía con muchas muchas más......
Gracias por compartir.
Un saludo.
|
|
|
En línea
|
|
|
|
Debci
Wiki
Desconectado
Mensajes: 2.021
Actualizate o muere!
|
Si quieres profundizar mas este tema, te recomiendo que visites este link. Son expresiones regulares y con ellas se pueden hacer barbaridades! Saludos
|
|
|
En línea
|
|
|
|
athlit
Desconectado
Mensajes: 83
|
Pues te lo agradezco mucho, ayer estuve buscando por ahí para entender el patrón que pusiste, y aprender más a cerca de las expresiones regulares. No tuve mucho éxito.
Gracias por el link!
|
|
|
En línea
|
|
|
|
|
Mensajes similares |
|
Asunto |
Iniciado por |
Respuestas |
Vistas |
Último mensaje |
|
|
Parsear html, ¿algo sencillo?
Java
|
Ragnarok
|
3
|
9,418
|
5 Junio 2007, 18:20 pm
por alvk4r
|
|
|
Parsear HTML con PHP – Simple HTML DOM Parser
PHP
|
madpitbull_99
|
3
|
15,504
|
1 Abril 2014, 09:54 am
por BlackM4ster
|
|
|
Parsear con PHP Simple HTML DOM
PHP
|
multi-media asdfg
|
5
|
6,462
|
16 Julio 2011, 01:20 am
por multi-media asdfg
|
|
|
Parsear HTML
.NET (C#, VB.NET, ASP)
|
spiritdead
|
2
|
2,973
|
26 Diciembre 2012, 23:55 pm
por spiritdead
|
|
|
Parsear código HTML en Vb.net
.NET (C#, VB.NET, ASP)
|
#Aitor
|
2
|
4,086
|
28 Junio 2014, 04:02 am
por Eleкtro
|
|