Foro de elhacker.net

Programación => .NET (C#, VB.NET, ASP) => Mensaje iniciado por: spiritdead en 26 Diciembre 2012, 21:45 pm



Título: Parsear HTML
Publicado por: spiritdead en 26 Diciembre 2012, 21:45 pm
alguno tiene buen menejo de las clases htmlelement, htmldocument,htmlelementcollection

para descomponer esto bien ?

Código:
<div id="print-conversation" style="display: block;">
<div class="comment clearfix">
<div class="comment-data">
<a class="min-avatar" href="/eduardocque3">
<img class="avatar-48" src="http://o1.t26.net/img/avatares/m/48/9.jpg">
</a>
</div>
<div class="comment-text">
<div class="comment-author clearfix">
@<a href="/eduardocque3" data-uid="20491876" class="hovercard">eduardocque3</a>
<span class="subtext">
<span title="26.12.2012 a las 8:06 hs." ts="1356520010">Hace 9 horas</span>
</span>
<div class="comment-content">
esto es 1 comentario </div>
</div>
</div>
</div>
.
.
.
.
:/ xD esta vez si me jodio

necesito separarle primero en un vector de "class=comment-content" y despues desglozar cada <div class=comment-content>

para extraer ciertos datos q le busco :/

EDITADO: Poner titulos descriptivos.


Título: Re: duda
Publicado por: seba123neo en 26 Diciembre 2012, 23:15 pm
para parsear HTML en .NET esta la libreria Html Agility Pack.


Título: Re: duda
Publicado por: spiritdead en 26 Diciembre 2012, 23:55 pm
para parsear HTML en .NET esta la libreria Html Agility Pack.

eso habia leido, pero a la final lo hice a mano u.u

encontre 1 patron en el html por suerte es exacto siempre