elhacker.net cabecera Bienvenido(a), Visitante. Por favor Ingresar o Registrarse
¿Perdiste tu email de activación?.

 

 


Tema destacado: Introducción a la Factorización De Semiprimos (RSA)


+  Foro de elhacker.net
|-+  Foros Generales
| |-+  Dudas Generales (Moderador: engel lex)
| | |-+  Extraer texto de una web
0 Usuarios y 1 Visitante están viendo este tema.
Páginas: [1] Ir Abajo Respuesta Imprimir
Autor Tema: Extraer texto de una web  (Leído 3,216 veces)
pills

Desconectado Desconectado

Mensajes: 8


Ver Perfil
Extraer texto de una web
« en: 21 Junio 2015, 20:00 pm »

Hola,

Con el objeto para la elaboración de un estudio, me gustaría pasar unas tablas estadísticas a 'libreoffice calc' extraídas de una página web escrita en html. Sé que lo puedo hacer copiando con el ratón los datos y de ahí llevarlo a un archivo '.txt' para finalmente importarlo a 'libreoffice calc' pero debido a que se trata de gran cantidad de webs podría acabar para cuando me creciera la barba.
He pensado en varias alternativas, como por ejemplo obtener el código fuente de la web que me interesa pero no sé luego como pasarlo para que se vea en un texto plano con las cadenas de texto con la información completa que quiero, ya que tengo entendido que la mayor parte de ésta se almacena en unas 'cajas' con el valor de las variables por las que están formadas y que no muestran su interior o al menos yo no lo consigo averiguar. He mirado también otro modo que consistiría en pasar el código html a texto plano pero sigue sin aparecer el contenido de las variables. Llevo un buen rato investigando sobre tal asunto y no encuentro nada que me pueda ayudar. Mis conocimientos sobre html son nulos, si en cambio manejo algo de shell linux.

Se agradecería una respuesta que pudiera ayudarme. Gracias.


« Última modificación: 21 Junio 2015, 21:17 pm por pills » En línea

Eleкtro
Ex-Staff
*
Desconectado Desconectado

Mensajes: 9.878



Ver Perfil
Re: Extraer texto de una web
« Respuesta #1 en: 21 Junio 2015, 21:29 pm »

Intenta formular una pregunta informática debidamente.

1. Muestra un enlace a la página.

2. Especifica la información en particular que deseas extraer.

3. Especifica que lenguaje de programación tienes pensado o usar o te es indiferente usar.

4. Formula la pregunta en el subforo dedicado a dicho lenguaje de programación.

5. Muestra lo que hayas intentado hacer por ti mismo, aquí no se hacen trabajos.

6. Descarga la API/SDK de libre office y documéntate sobre los miembros que la componen viendo la referencia de la API y los ejemplos que proveen en la página oficial, si tienes pensado hacer conversiones a un formato específico de este programa entonces la vas a necesitar. Si solo quieres extraer datos de un documento Html para pasarlo a texto plano, entonces olvida lo que acabo de decir en este punto.

Saludos!


« Última modificación: 21 Junio 2015, 21:32 pm por Eleкtro » En línea



Páginas: [1] Ir Arriba Respuesta Imprimir 

Ir a:  

Mensajes similares
Asunto Iniciado por Respuestas Vistas Último mensaje
Extraer el texto de un *.txt « 1 2 »
Programación Visual Basic
vivachapas 10 3,828 Último mensaje 14 Octubre 2006, 00:09 am
por vivachapas
Extraer texto de html en bat ?
Scripting
novato04 2 3,073 Último mensaje 26 Agosto 2014, 12:15 pm
por Eleкtro
Ayuda extraer texto de una web
.NET (C#, VB.NET, ASP)
error404x 1 2,453 Último mensaje 19 Junio 2015, 03:51 am
por Eleкtro
Extraer texto de una imagen jpg, png o video .avi
Java
alcastro 1 1,959 Último mensaje 2 Septiembre 2016, 23:13 pm
por Javasote
Extraer texto de una imagen jpg, png o video .avi
.NET (C#, VB.NET, ASP)
alcastro 2 3,766 Último mensaje 25 Agosto 2016, 18:10 pm
por Eleкtro
WAP2 - Aviso Legal - Powered by SMF 1.1.21 | SMF © 2006-2008, Simple Machines