Detectar Links y meter en un array

Foro de elhacker.net

Programación

Desarrollo Web

PHP (Moderador: #!drvy)

Detectar Links y meter en un array

0 Usuarios y 1 Visitante están viendo este tema.

Páginas: [1] 2

Autor

Tema: Detectar Links y meter en un array (Leído 7,330 veces)

Auton

Desconectado

Mensajes: 5

Detectar Links y meter en un array

« en: 18 Junio 2011, 11:31 am »

Hola,
por no subir de nuevo un antiguo tema hago la pregunta en uno nuevo.

El tema es este:

http://foro.elhacker.net/php/buscar_links_y_meter_en_un_array-t293080.0.html

y mi pregunta es cómo puedo extraer el texto del link aparte de la url.

Gracias


	En línea

madpitbull_99

Colaborador

Desconectado

Mensajes: 1.911

Re: Detectar Links y meter en un array

« Respuesta #1 en: 18 Junio 2011, 12:05 pm »

Escribí un post que te puede ayudar: Parsear HTML con PHP – Simple HTML DOM Parser.

Con esa librería se puede hacer fácilmente lo que tú quieres.


	En línea

«Si quieres la paz prepárate para la guerra» Flavius Vegetius

[Taller]Instalación/Configuración y Teoría de Servicios en Red

Auton

Desconectado

Mensajes: 5

Re: Detectar Links y meter en un array

« Respuesta #2 en: 18 Junio 2011, 13:11 pm »

Hola,
muchas gracias por tu pronta respuesta.
Esa librería y código están realmente bien.
Quizá lo necesite en algún momento pero busco algo que creo que es más sencillo a partir de algo que ya tengo. Con este mismo código

Código:

<?
$html = file_get_contents('http://www.example.com');

$dom = new DOMDocument();
@$dom->loadHTML($html);

// grab all the on the page
$xpath = new DOMXPath($dom);
$hrefs = $xpath->evaluate("/html/body//a");

for ($i = 0; $i < $hrefs->length; $i++) {
       $href = $hrefs->item($i);
       $url = $href->getAttribute('href');
       echo $url.',';
}
?>

ya consigo extraer todas las urls de un html sin librerías en la variable $url, y me imagino que de la misma manera que tenemos la url me imagino que no debe ser muy dificil extraer lo que hay entre: <a href="http://ellink">
y </a> en otra variable, aunque para mí no es tan sencillo claro.
Si no aparece algo recurriré a lo que me dices.
Gracias de nuevo


« Última modificación: 18 Junio 2011, 13:16 pm por Auton »	En línea

madpitbull_99

Colaborador

Desconectado

Mensajes: 1.911

Re: Detectar Links y meter en un array

« Respuesta #3 en: 18 Junio 2011, 14:18 pm »

Mira esta función que sirve para extraer el contenido situado entre dos delimitadores:

Código

<?php
 
    /**
     * Devuelve el contenido situado entre dos delimitadores.
     *
     * @return string
     */
    function getContentFromDelimiters($string, $start, $end) {
        $pos = stripos($string, $start);
        $str = substr($string, $pos);
        $str_two = substr($str, strlen($start));
        $second_pos = stripos($str_two, $end);
        $str_three = substr($str_two, 0, $second_pos);
        $unit = trim($str_three);
        return $unit;
    }
 
    /**
     * Funcionamiento y Uso
     */
 
    $handler = fopen ("http://madhacking.com", r);
    if ($handler)
        echo "[Ok] Access to site.<br />";
    while (!feof($handler)) {
        $webData .= fread($handler, 12000);
    }
    //var_dump($webData);
    fclose($handler);
 
    $webTitle = getContentFromDelimiters($webData, "<title>", "</title>");
    echo "<b>The web title is: </b>".$webTitle;
?>

También viene con un ejemplo de uso. Lo importante está en la línea resaltada.

Supongo que es lo que quieres, mira a ver si te sirve.


	En línea

«Si quieres la paz prepárate para la guerra» Flavius Vegetius

[Taller]Instalación/Configuración y Teoría de Servicios en Red

Auton

Desconectado

Mensajes: 5

Re: Detectar Links y meter en un array

« Respuesta #4 en: 19 Junio 2011, 19:51 pm »

Muchas gracias,
ahora estoy intentando utilizar esto pero para que encuentre los textos de los enlaces de la página de forma dinámica dentro del bucle de mi código.
Te contaré


	En línea

Shell Root

Moderador Global

Desconectado

Mensajes: 3.724

Re: Detectar Links y meter en un array

« Respuesta #5 en: 19 Junio 2011, 20:36 pm »

Te puede servir de apoyo

http://shellrootsecurity.blogspot.com/2010/06/simulacion-de-la-tool-list-urlspy-en_1763.html


	En línea

Te vendería mi talento por poder dormir tranquilo.

Auton

Desconectado

Mensajes: 5

Re: Detectar Links y meter en un array

« Respuesta #6 en: 21 Junio 2011, 09:38 am »

Hola,
muchas gracias por tu aportación.
Había visto preg_match_all pero no entiendo muy bien que debo hacer con este código.
'argv' ?
No se dónde tendría que poner la url del contenido de donde tengo que extraer los links (con su texto de link).

Muchas gracias


	En línea

Shell Root

Moderador Global

Desconectado

Mensajes: 3.724

Re: Detectar Links y meter en un array

« Respuesta #7 en: 21 Junio 2011, 15:49 pm »

Lo que pasa es que esto se realiza por medio de la consola y por el paso de argumentos tal como,

Código

$ php list-urls.php [URL]


	En línea

Te vendería mi talento por poder dormir tranquilo.

Auton

Desconectado

Mensajes: 5

Re: Detectar Links y meter en un array

« Respuesta #8 en: 24 Junio 2011, 12:01 pm »

Hola!
Ya tengo la solución !
Ante todo gracias por vuestras respuestas.
Aunque la solución era más sencilla.
Partiendo del mismo código que había puesto sólo he tenido que añadir $text = $href->nodeValue; donde la variable $text será el texto del link.

Código:

<?
$html = file_get_contents('http://www.example.com');

$dom = new DOMDocument();
@$dom->loadHTML($html);

// grab all the on the page
$xpath = new DOMXPath($dom);
$hrefs = $xpath->evaluate("/html/body//a");

for ($i = 0; $i < $hrefs->length; $i++) {
       $href = $hrefs->item($i);
       $url = $href->getAttribute('href');
       $text = $href->nodeValue;
       echo "<a href='$url'>$text</a>";
}
?>

De hecho ahora lo que me faltaría es detectar una imagen en caso de que en lugar de texto fuese una el cuerpo del enlace.


« Última modificación: 24 Junio 2011, 12:12 pm por Auton »	En línea

WHK

Moderador Global

Desconectado

Mensajes: 6.612

Sin conocimiento no hay espíritu

Re: Detectar Links y meter en un array

« Respuesta #9 en: 25 Junio 2011, 08:19 am »

Sin librerías:

Código

<?php
 
$buffer = file_get_contents('http://foro.elhacker.net/');
$links = explode('<a', $buffer);
array_shift($links);
foreach($links as $id => $link){
	$lnk = explode('href="', $link);
	$lnk = explode('"', $lnk[1]);
	$lnk = $lnk[0];
	$text = explode('>', $link);
	$text = explode('<', $text[1]);
	$text = $text[0];
	if(substr(trim($text), 0, 1) == '<')
		$type = 'object';
	elseif(!trim($text))
		$type = 'bad link';
	else
		$type = 'text';
 
	$ob_links[] = array(
		'id'	=> ($id + 1),
		'link'	=> $lnk,
		'text'	=> $text,
		'type'	=> $type
	);
}
 
print_r($ob_links);
 
?>


	En línea

- https://yhojann.cl/ - https://whk.cl/

Páginas: [1] 2

Ir a:

Mensajes similares
	Asunto	Iniciado por	Respuestas	Vistas	Último mensaje
	Copiar parte de una array a otra array Programación Visual Basic	sircid	3	6,206	19 Diciembre 2007, 11:27 am por LeandroA
	Buscar links y meter en un array! PHP	A2Corp	3	4,137	11 Mayo 2010, 06:03 am por A2Corp
	Meter en un array la salida de una consulta de varios documentos con Foreach. PHP	frauzamb	1	2,850	13 Mayo 2014, 20:02 pm por DanB
	Detectar links PHP	jalbtercero	1	3,097	4 Junio 2016, 03:03 am por [u]nsigned
	como meter datos en un array Programación C/C++	alexmila	2	2,498	18 Mayo 2017, 20:12 pm por MAFUS