Foro de elhacker.net

Foros Generales => Noticias => Mensaje iniciado por: wolfbcn en 21 Junio 2012, 02:44 am



Título: Un ‘detective web’ permite recuperar el 81% de los enlaces rotos
Publicado por: wolfbcn en 21 Junio 2012, 02:44 am
Para acabar con el molesto problema de los links erróneos, un grupo de investigadores de la UNED ha desarrollado un sencillo sistema basado en seguir la pista que este contenido deja en la web. Según los investigadores, la nueva herramienta permite recuperar hasta el 81% de los enlaces obsoletos.

Algunos estudios calculan que el 67% de las direcciones de Internet se convierten en erróneas tras un período de cuatro años de vida. En algunas ocasiones, el enlace es incorrecto porque la página ha desaparecido y, en otros casos, porque la información ha sido movida de sitio. Investigadores de la UNED han desarrollado un sistema que hace la función de un 'detective privado' para encontrar las pistas de ese contenido y seguir así su rastro.

"Estas pistas consisten en referencias y enlaces obsoletos en motores de búsqueda, librerías digitales, servicios web y redes sociales", explica Juan Martínez-Romo, investigador del grupo de procesamiento de lenguaje natural y recuperación de Información de la UNED y autor principal del proyecto.

Recabadas las pistas, el sistema al que se ha denominadoDetective Brooklynk (http://alderamin.lsi.uned.es:8080/brooklynk/) elabora dinámicamente una estrategia para encontrar la página desaparecida o una equivalente de la forma más eficiente, es decir, consumiendo los mínimos recursos y el menor tiempo. De este modo, insertando el link erróneo, el programa devuelve al usuario una lista de enlaces en los que puede estar la información que busca, ya sea de la misma página o bien de otras que lo hayan recogido.

Detective Brooklynk elabora dinámicamente una estrategia para encontrar la página desaparecida o una equivalente

Para comprobar la efectividad de la herramienta, cuyo desarrollo se ha publicado en la revista Information Processing and Management (http://www.journals.elsevier.com/information-processing-and-management/)los investigadores seleccionaron aleatoriamente un conjunto de páginas con enlaces rotos e intentaron recuperar su contenido. "Con el sistema que hemos desarrollado, conseguimos recuperar el 81% de los links erróneos", asegura Martínez-Romo.

Los motores de búsqueda penalizan

El problema de los enlaces obsoletos es una de las asignaturas pendientes de Internet, y perjudica tanto a usuarios como a creadores. "Es evidente que, de cara a un internauta, encontrar este tipo de problemas dificulta y entorpece sus búsquedas, pero, además, esto repercute en una perdida de fiabilidad y prestigio para el dueño de la página", comenta el investigador.

A estas molestias se suma el hecho de que los motores de búsqueda penalizan a las páginas a la hora de mostrarlas en la lista de resultados. En los últimos años, han aparecido algoritmos que proponen la modificación del PageRank (algoritmo de ranking utilizado por los motores de búsqueda) para que tenga en cuenta esa clase de errores.

El sistema desarrollado por la UNED evitaría esta penalización, explica el responsable del proyecto. A la espera de su versión definitiva, es un prototipo que utiliza parte de las estrategias presentadas en el artículo.

FUENTE :http://www.laflecha.net/canales/blackhats/noticias/un-detective-web-permite-recuperar-el-81-de-los-enlaces-rotos


Título: Re: Un ‘detective web’ permite recuperar el 81% de los enlaces rotos
Publicado por: --<<<@u6u$t0>>>-- en 21 Junio 2012, 03:43 am
Creo que habria que hacer un estandar para que las webs puedan informar a los buscadores o a las demas webs que consulten si el link esta actualizado sobre como era el enlace antes asi la pagina que guarda un enlace a ese sitio lo actualiza.

Algo se debe poder hacer para reducir este problema sino se va perdiendo mucho material que en el futuro sera acceder. ¿de que sirve leer una noticia si no podes saber si la fuente original realmente lo publico la informacion?