Imprimir Página - [python] procesar html

Título: [python] procesar html
Publicado por: lnvisible en 28 Mayo 2011, 21:44 pm

Hola.

Quiero procesar html en python, no estoy segura de si quiero pasarlo a objetos python como con amara, si quiero usar xml.dom que viene ya de serie con python o si quiero usar xquery o xpath para extraer los valors. :¬¬

De lo que estoy segura es de que no quiero aprender las cuatro cosas para luego ver que no me vale, o que otra es mejor o que he perdido el tiempo, o que no se. :-\
¿que es lo mejor y lo que deberia aprender? :huh:

Quiero algo que sea facil, estandar y potente. Lo quiero todo ;D

GRacias!!

PD: ah!! :-X uso python3, amara no me vale por eso, pero puede que haya otras cosas iguales :huh:

Título: Re: [python] procesar html
Publicado por: LeXeL en 31 Mayo 2011, 21:50 pm

Pues como yo lo veo puedes usar Regex o Beatifull soup:
-regex viene predeterminado en python con la libreria re
- y beatifull soup pues hace el trabajo.

miralos y dime que tal

Título: Re: [python] procesar html
Publicado por: lnvisible en 11 Junio 2011, 15:55 pm

regex es muy complicado, puede haber cosas en varias líenas. :¬¬

beautifull soup lo vi hace mucho y es muy bueno, pero no tanto para python3. :-(

Creo que usaré dom, al menos es estándar. :-\

Foro de elhacker.net

Programación => Scripting => Mensaje iniciado por: lnvisible en 28 Mayo 2011, 21:44 pm