Foro de elhacker.net

Programación => .NET (C#, VB.NET, ASP) => Mensaje iniciado por: TrashAmbishion en 7 Julio 2012, 14:44 pm



Título: Parsear HTML ayuda !!!
Publicado por: TrashAmbishion en 7 Julio 2012, 14:44 pm
Hola amigos pues eso ando buscando algun code para aprender a parsear un HTML... lo que ando tratando de hacer es cargar un CAPTCHA en un PictureBox... gracias cualquier ayuda... Les dejo algo que encontre pero no se hacerlo funcionar...

http://www.codeproject.com/Articles/19407/HTML-Parsing-using-NET-Framework

Salu2


Título: Re: Parsear HTML ayuda !!!
Publicado por: Anvil en 7 Julio 2012, 21:36 pm
Checa este proyecto:

https://htmlagilitypack.codeplex.com/ (https://htmlagilitypack.codeplex.com/)


Título: Re: Parsear HTML ayuda !!!
Publicado por: TrashAmbishion en 8 Julio 2012, 16:46 pm
Checa este proyecto:

https://htmlagilitypack.codeplex.com/ (https://htmlagilitypack.codeplex.com/)

Excelente, ya habia oido de ella pero tampoco lograba hacerla funcionar pero bueno Google bastante hasta que encontre un ejemplo sencillo y explicativo de como usar los NODOs..

Ahora hay un problema la web que trato de parsear se carga en IEFRAME y me da error con el HTMLAGILITY... estuve pensando en usar algun componente como el Webbrowser que me deje una ves que este cargada la pagina completa acceder al codigo HTML y hacer la busqueda cruda...

??? Que crees??


Título: Re: Parsear HTML ayuda !!!
Publicado por: Anvil en 8 Julio 2012, 16:51 pm
¿por que no entras directo al iframe?


Título: Re: Parsear HTML ayuda !!!
Publicado por: TrashAmbishion en 8 Julio 2012, 18:50 pm
¿por que no entras directo al iframe?

Cuando llamo a la pag principal, tiene este IEFRAME con el cod..

  <frameset border="0" framespacing="0" bordercolor="#0" rows="*,0%" frameborder="NO" cols="*">
    <frame id="mainFrame" name="mainFrame" marginwidth="0" marginheight="0" src="msn_files/index.htm">
    <frame id="rcvFrame" name="rcvFrame" marginwidth="0" marginheight="0" src="" noresize="noresize">
  </frameset><noframes></noframes>

y en el index.html tiene otro IEFRAME

   <frameset border="0" framespacing="0" bordercolor="#0" rows="*,0%" frameborder="NO" cols="*">
        <frame id="mainFrame" name="mainFrame" marginwidth="0" marginheight="0" src="index_data/sms.htm">
         <frame id="rcvFrame" name="rcvFrame" marginwidth="0" marginheight="0" src="msn_files/index.htm" noresize="noresize">
   </frameset><noframes></noframes>

y esa vendria siendo la ultima pagina sms.html pero no me deja entrar directoo..