Foro de elhacker.net

Programación => PHP => Mensaje iniciado por: mark182 en 1 Marzo 2013, 04:39 am



Título: Extraer datos de cierta web con PHP
Publicado por: mark182 en 1 Marzo 2013, 04:39 am
Alguien me podría ayudar a extraer los datos de una web? Me habian dicho que lo podria hacer con la funcion file_get_contents() y preg_match_all(). Pero la verdad que se me esta complicando mucho, por eso les pido ayuda. La web que me interesa es esta:

http://futbol.indiceargentina.com.ar/fixture-torneo-clausura-2013-argentina.html (http://futbol.indiceargentina.com.ar/fixture-torneo-clausura-2013-argentina.html)

Y los datos que necesito son:

*La fecha (Primera Fecha, Segunda Fecha, etc)
*La fecha en si (dia y horario del partido)
*Los equipos
*Y el resultado

Puede ser de esa web o de esta otra:

http://www.damefobal.com.ar/fixture-torneos-inicial-y-final-primera-division-2012-2013/ (http://www.damefobal.com.ar/fixture-torneos-inicial-y-final-primera-division-2012-2013/)

Me parece que es mas facil extraer los datos de la primer web, por un tema de como esta la estructura de las web.



Muchisimas gracias!


Título: Re: Extraer datos de cierta web con PHP
Publicado por: kalvinman en 1 Marzo 2013, 21:34 pm
hace mucho tiempo programe algo parecido pero no encuentro el codigo que use, es simplemente con la libreria CURL de PHP que puede abrir una conexion con un sitio web simulando una navegacion real, puedes enviarle datos POST, GET, etc, y luego parceas el contenido usando expresiones regulares.

Tambien te puede servir buscar crawlers o spiders programdas en PHP de seguro esto te servira, son aplicaciones que navegan por la red y recogen datos.


Título: Re: Extraer datos de cierta web con PHP
Publicado por: mark182 en 1 Marzo 2013, 21:40 pm
Si, pude ibtener los datos pero el tema es que se me esta complicando para parsear los datos que necesito. No ando muy bien con las expresiones regulares. En eso necesito que me ayuden.

Gracias!


Título: Re: Extraer datos de cierta web con PHP
Publicado por: дٳŦ٭ en 6 Marzo 2013, 01:15 am
Prueba con cURL y expresiones regulares.

Saludos