Soy nuevo en Elhacker...
tengo una pregunta.... (obviamente, no?? ) y es k... como puedo representar en python (con la libreria de Expresiones regulares(re)) Cualkier cosa hasta k aparezca un "<"???
por ejemplo, tengo esto en un codigo fuente de una pagina web:
Código:
<p>Titulo Original: The Cutting Edge: Fire and Ice<br />GENERO: Romance | Comedia | Drama<br />PAIS: Estados Unidos<br />DURACION: 90 Minutos<br />AÑO: 2010<br />DIRECTOR: Stephen Herek<br />GUION: Holly Brix<br />INTERPRETES: Brendan Fehr, Francia Raisa, Marcela Pizarro, Russell Yuen, Stephen Amell, Zhenhu Han<br />PRODUCTOR: Craig Roessler, Sara Berrisford, Hudson Hickman<br />Código: http://www.imdb.com/title/tt1600058/</p>
entonces, Como puedotomar desde Titulo Original, hasta Ice? (sin k el "<" aparezca...)
estaba probando con esto:
titulo=re.search("(T.tulo Original|T.TULO ORIGINAL): .*<", source).group()
Pero es que me toma TODO el codigo hasta la parte final...osea, la linea completa evitando los ultimos 3 caracteres ("/p>")...
No puedo usar .{rango} ya que separa un conjunto de paginas donde habla de peliculas, y los nombres de todas las peliculas no estan TODOS en un rango de caracteres valido... ya k si pongo uno pequeño, me salta con el error de atributo: a NoneType no se le asigna el atributo Group y si pongo uno muy grande, me toma la parte de genero....
Algun Script k me tome todos los datos de una vez por y para todas???
Espero respuestas,ayuda.... lo k sea.. gracias