Autor
|
Tema: Extraer texto de una web (Leído 3,380 veces)
|
pills
Desconectado
Mensajes: 8
|
Hola,
Con el objeto para la elaboración de un estudio, me gustaría pasar unas tablas estadísticas a 'libreoffice calc' extraídas de una página web escrita en html. Sé que lo puedo hacer copiando con el ratón los datos y de ahí llevarlo a un archivo '.txt' para finalmente importarlo a 'libreoffice calc' pero debido a que se trata de gran cantidad de webs podría acabar para cuando me creciera la barba. He pensado en varias alternativas, como por ejemplo obtener el código fuente de la web que me interesa pero no sé luego como pasarlo para que se vea en un texto plano con las cadenas de texto con la información completa que quiero, ya que tengo entendido que la mayor parte de ésta se almacena en unas 'cajas' con el valor de las variables por las que están formadas y que no muestran su interior o al menos yo no lo consigo averiguar. He mirado también otro modo que consistiría en pasar el código html a texto plano pero sigue sin aparecer el contenido de las variables. Llevo un buen rato investigando sobre tal asunto y no encuentro nada que me pueda ayudar. Mis conocimientos sobre html son nulos, si en cambio manejo algo de shell linux.
Se agradecería una respuesta que pudiera ayudarme. Gracias.
|
|
« Última modificación: 21 Junio 2015, 21:17 pm por pills »
|
En línea
|
|
|
|
Eleкtro
Ex-Staff
Desconectado
Mensajes: 9.885
|
Intenta formular una pregunta informática debidamente.
1. Muestra un enlace a la página.
2. Especifica la información en particular que deseas extraer.
3. Especifica que lenguaje de programación tienes pensado o usar o te es indiferente usar.
4. Formula la pregunta en el subforo dedicado a dicho lenguaje de programación.
5. Muestra lo que hayas intentado hacer por ti mismo, aquí no se hacen trabajos.
6. Descarga la API/SDK de libre office y documéntate sobre los miembros que la componen viendo la referencia de la API y los ejemplos que proveen en la página oficial, si tienes pensado hacer conversiones a un formato específico de este programa entonces la vas a necesitar. Si solo quieres extraer datos de un documento Html para pasarlo a texto plano, entonces olvida lo que acabo de decir en este punto.
Saludos!
|
|
« Última modificación: 21 Junio 2015, 21:32 pm por Eleкtro »
|
En línea
|
|
|
|
|
Mensajes similares |
|
Asunto |
Iniciado por |
Respuestas |
Vistas |
Último mensaje |
|
|
Extraer el texto de un *.txt
« 1 2 »
Programación Visual Basic
|
vivachapas
|
10
|
3,852
|
14 Octubre 2006, 00:09 am
por vivachapas
|
|
|
Extraer texto de html en bat ?
Scripting
|
novato04
|
2
|
3,109
|
26 Agosto 2014, 12:15 pm
por Eleкtro
|
|
|
Ayuda extraer texto de una web
.NET (C#, VB.NET, ASP)
|
error404x
|
1
|
2,598
|
19 Junio 2015, 03:51 am
por Eleкtro
|
|
|
Extraer texto de una imagen jpg, png o video .avi
Java
|
alcastro
|
1
|
1,969
|
2 Septiembre 2016, 23:13 pm
por Javasote
|
|
|
Extraer texto de una imagen jpg, png o video .avi
.NET (C#, VB.NET, ASP)
|
alcastro
|
2
|
3,907
|
25 Agosto 2016, 18:10 pm
por Eleкtro
|
|