Hola!
estoy haciendo un Parser para coger informacion de una pagina HTML. El parser consiste en coger las URL de los trabajos, el titulo y una pequeña descripcion de ella.
Al coger el titulo y las URL no tengo ningun tipo de problema puesto que esta dentro de una etiqueta. el problema lo tengo cuando tengo que coger texto que esta fuera de el.
Alguien me podria ayudar?????
esta es la pagina de la que me quiero bajar la informacion:
http://www.elprisma.com/buscar/resultados.asp?search=base%20de%20datos
esta es la parte que me interesa: (lo que esta en negrita es lo que no se como coger)
<table border="0" cellpadding="0" cellspacing="0" width="560">
<tr height="20">
<td class="ta" height="20" width="500" valign="middle">
<span class="num">1.</span><a title="Auditoría de Sistemas" href="../apuntes/curso.asp?id=6954">Auditoría de Sistemas</a></td>
<td class="ta" height="20" width="60" valign="middle" align="center"> </td>
</tr>
<tr>
<td class="tb" colspan="2" height="45" width="560" valign="top" align="justify">
<p align="justify">
<span class="des">Conceptos generales de auditoría de sistemas y control. Políticas de seguridad informática. Técnicas de auditoría asistidas por computador. Auditoría en un sistema de base de datos. Data Warehouse. Auditoría a sistemas operativos.</span></p>
</td>
</tr>
</table>
tengo que utilizar esto: public void handleText(char[] data, int pos) ?????????????????'
ayudarme porfavor!!! que si no soluciono este problema no puedo continuar con el proyecto!!!!!
gracias