Título: [python] procesar html Publicado por: lnvisible en 28 Mayo 2011, 21:44 pm Hola.
Quiero procesar html en python, no estoy segura de si quiero pasarlo a objetos python como con amara, si quiero usar xml.dom que viene ya de serie con python o si quiero usar xquery o xpath para extraer los valors. :¬¬ De lo que estoy segura es de que no quiero aprender las cuatro cosas para luego ver que no me vale, o que otra es mejor o que he perdido el tiempo, o que no se. :-\ ¿que es lo mejor y lo que deberia aprender? :huh: Quiero algo que sea facil, estandar y potente. Lo quiero todo ;D GRacias!! PD: ah!! :-X uso python3, amara no me vale por eso, pero puede que haya otras cosas iguales :huh: Título: Re: [python] procesar html Publicado por: LeXeL en 31 Mayo 2011, 21:50 pm Pues como yo lo veo puedes usar Regex o Beatifull soup:
-regex viene predeterminado en python con la libreria re - y beatifull soup pues hace el trabajo. miralos y dime que tal Título: Re: [python] procesar html Publicado por: lnvisible en 11 Junio 2011, 15:55 pm regex es muy complicado, puede haber cosas en varias líenas. :¬¬
beautifull soup lo vi hace mucho y es muy bueno, pero no tanto para python3. :-( Creo que usaré dom, al menos es estándar. :-\ |