elhacker.net cabecera Bienvenido(a), Visitante. Por favor Ingresar o Registrarse
¿Perdiste tu email de activación?.

 

 


Tema destacado: Arreglado, de nuevo, el registro del warzone (wargame) de EHN


+  Foro de elhacker.net
|-+  Programación
| |-+  Programación General
| | |-+  Java
| | | |-+  PARSER EN JAVA
0 Usuarios y 1 Visitante están viendo este tema.
Páginas: [1] Ir Abajo Respuesta Imprimir
Autor Tema: PARSER EN JAVA  (Leído 10,159 veces)
oihantze

Desconectado Desconectado

Mensajes: 19


Ver Perfil
PARSER EN JAVA
« en: 15 Julio 2009, 16:51 pm »

Hola!

estoy haciendo un Parser para coger informacion de una pagina HTML. El parser consiste en coger las URL de los trabajos, el titulo y una pequeña descripcion de ella.
Al coger el titulo y las URL no tengo ningun tipo de problema puesto que esta dentro de una etiqueta. el problema lo tengo cuando tengo que coger texto que esta fuera de el.

Alguien me podria ayudar?????

esta es la pagina de la que me quiero bajar la informacion:
http://www.elprisma.com/buscar/resultados.asp?search=base%20de%20datos

esta es la parte que me interesa: (lo que esta en negrita es lo que no se como coger)

<table border="0" cellpadding="0" cellspacing="0" width="560">
<tr height="20">
<td class="ta" height="20" width="500" valign="middle">
<span class="num">1.</span><a title="Auditoría de Sistemas" href="../apuntes/curso.asp?id=6954">Auditoría de Sistemas</a></td>
<td class="ta" height="20" width="60" valign="middle" align="center"> </td>
</tr>
<tr>
<td class="tb" colspan="2" height="45" width="560" valign="top" align="justify">
<p align="justify">
<span class="des">Conceptos generales de auditoría de sistemas y control. Políticas de seguridad informática. Técnicas de auditoría asistidas por computador. Auditoría en un sistema de base de datos. Data Warehouse. Auditoría a sistemas operativos.</span></p>
</td>

</tr>
</table>


tengo que utilizar esto: public void handleText(char[] data, int pos) ?????????????????'

ayudarme porfavor!!! que si no soluciono este problema no puedo continuar con el proyecto!!!!!

gracias


En línea

sirdarckcat
Aspirante a supervillano
Colaborador
***
Desconectado Desconectado

Mensajes: 7.029


No estoy loco, soy mentalmente divergente


Ver Perfil WWW
Re: PARSER EN JAVA
« Respuesta #1 en: 15 Julio 2009, 16:53 pm »

que estas usando para parsear el codigo html?


En línea

Amerikano|Cls


Desconectado Desconectado

Mensajes: 789


[Beyond This Life]


Ver Perfil WWW
Re: PARSER EN JAVA
« Respuesta #2 en: 15 Julio 2009, 17:06 pm »

No he intntado hacer un parser nunca pero sabiendo que los html funcionan a traves de las etiquetas, podrias por ejemplo contar cada etiqueta que se ha abierto y asi tener el control, por decir, si tienes esto:

Código
  1. hola estoy afuera
  2. pepe
  3. </body>
  4. </html>

Para poder captar el mensaje "hola estoy afuera"  podras usar dos contadores, uno para las etiquetas abiertas y otro para las etiquetas que cierran entonces, si los 2 contadores en el mismo instante son iguales quiere decir que estas fuera, y luego coges todo lo que se encuentre allí, no se, es lo que te entendí  ;).

salu2
En línea





Mi blog:
http://amerikanocls.blogspot.com
sirdarckcat
Aspirante a supervillano
Colaborador
***
Desconectado Desconectado

Mensajes: 7.029


No estoy loco, soy mentalmente divergente


Ver Perfil WWW
Re: PARSER EN JAVA
« Respuesta #3 en: 15 Julio 2009, 17:17 pm »

no es tan facil hacer un parser de html, hay muchas tags que no se cierran (img, br, meta, etc..).

pero el esta usando un parser ya hecho, por eso le pregunto cual.. java tiene uno (swing), pero no sabe leer codigo html malformado, aunque ahora que veo su mensaje creo que si esta usando swing.

http://java.sun.com/j2se/1.3/docs/api/javax/swing/text/html/parser/Parser.html#handleText(char[])

asi que pues, si debes usar handleText xD, y una variable que cheque cual es la clase de la ultima tag abierta (tu estas buscando un span con clase "des".

Saludos!!
En línea

oihantze

Desconectado Desconectado

Mensajes: 19


Ver Perfil
Re: PARSER EN JAVA
« Respuesta #4 en: 15 Julio 2009, 17:45 pm »

muchas gracias por las respuestas  pero soy nueva en esto de los parsers y no me sigo enterando  :-\

alguien me podria poner un ejemplo???

esque... en todos los ejemplos que encuentro en Internet veo que hay que hacer un for, pero.. un for de donde a donde??? me supongo que sera posicionandote en la etiqueta que deseas, pero como lo hago????

 bufff estoy hecha un lio!!!!

si alguien puede ayudarme un poko mas....

gracias
En línea

Páginas: [1] Ir Arriba Respuesta Imprimir 

Ir a:  

Mensajes similares
Asunto Iniciado por Respuestas Vistas Último mensaje
Parser buscador en respuestas php arrojadas por el servidor
Desarrollo Web
vichj 2 2,204 Último mensaje 30 Abril 2013, 04:44 am
por vichj
Problemas con Parser Grammer sql php
PHP
luisdeleonsk8 0 1,544 Último mensaje 6 Junio 2013, 05:16 am
por luisdeleonsk8
[Android] web service error Gson parser[Solucionado]
Java
kondrag_X1 1 2,158 Último mensaje 28 Octubre 2015, 20:18 pm
por kondrag_X1
WAP2 - Aviso Legal - Powered by SMF 1.1.21 | SMF © 2006-2008, Simple Machines