Foro de elhacker.net

Programación => Scripting => Mensaje iniciado por: lnvisible en 28 Mayo 2011, 21:44 pm



Título: [python] procesar html
Publicado por: lnvisible en 28 Mayo 2011, 21:44 pm
Hola.

Quiero procesar html en python, no estoy segura de si quiero pasarlo a objetos python como con amara, si quiero usar xml.dom que viene ya de serie con python o si quiero usar xquery o xpath para extraer los valors.  :¬¬

De lo que estoy segura es de que no quiero aprender las cuatro cosas para luego ver que no me vale, o que otra es mejor o que he perdido el tiempo, o que no se.  :-\
¿que es lo mejor y lo que deberia aprender?  :huh:

Quiero algo que sea facil, estandar y potente. Lo quiero todo  ;D

GRacias!!

PD: ah!!  :-X uso python3, amara no me vale por eso, pero puede que haya otras cosas iguales  :huh:


Título: Re: [python] procesar html
Publicado por: LeXeL en 31 Mayo 2011, 21:50 pm
Pues como yo lo veo puedes usar Regex o Beatifull soup:
-regex viene predeterminado en python con la libreria re
- y beatifull soup pues hace el trabajo.

miralos y dime que tal


Título: Re: [python] procesar html
Publicado por: lnvisible en 11 Junio 2011, 15:55 pm
regex es muy complicado, puede haber cosas en varias líenas.  :¬¬

beautifull soup lo vi hace mucho y es muy bueno, pero no tanto para python3.  :-(

Creo que usaré dom, al menos es estándar.  :-\