Foro de elhacker.net

Foros Generales => Dudas Generales => Mensaje iniciado por: KTM en 6 Diciembre 2019, 02:14 am



Título: Cómo extraer información de un código de fuente?
Publicado por: KTM en 6 Diciembre 2019, 02:14 am
Buenas noches,

Soy nuevo en el foro, llegué aquí porque ando interesado en levantar un "programa" que me extraiga información de una página web en específico. Por ejemplo, cualquier página web de comercio electrónico.

Mi idea es ver cómo puedo poner un link en un excel y que a X horas del día, me ponga el precio que tiene la página. Mi idea es levantar un histórico de precios para ver cómo varían.

Tomemos como ejemplo:

https://beckboots.com/collections/beck-stock-cowboy-boots/products/handmade-cowboy-boot-stock-182

Aquí, en donde sale el precio de la bota (399$) siempre está en el mismo sitio:

<meta property="og:price:amount" content="399.00" />

Entonces, la idea sería, poner el link en una celda en excel, y que por columnas se vaya llenando el precio según la fecha.

Me explico? No sé programar, pero quiero aprender a hacer "programas" para mi uso personal.

Me encantaría escuchar sus comentarios y//o ideas.

Saludos


Título: Re: Cómo extraer información de un código de fuente?
Publicado por: engel lex en 6 Diciembre 2019, 02:22 am
aunque es posible sinceramente el excel no es la mejor tecnica para eso ni de cerca...

yo recomendaría un servidor mysql, y un programa hecho en python

con python y la librer requests (viene por defecto) facilmente puedes leer la pagina y con pymysql (tienes que instalarla) puedes meterlo a la base de datos... a demás una tarea programada en tu pc para todos los dias a la misma hora correr el script te evitaría tener que estar pendiente de ello (obviamente debes tener el pc encendido a esa hora)... tambien hay librerias para modificar un excel y poder incluir el valor ahí si no quieres usar bases de datos, aunque es un poco mas complicado usualmente

python no es tan dificil de aprender, te recomiendo que busques tutoriales... asegurate de ir por python3 y no 2 ya que este ultimo pronto será obsoleto... el mysql tampoco tiene ninguna dificultad realmente


Título: Re: Cómo extraer información de un código de fuente?
Publicado por: Markks en 6 Diciembre 2019, 03:04 am
Siguiendo con lo que menciona Mr.Who es practicamente imposible crear tus "propios programas" sin involucrarte en un lenguaje de programación.
Saludos  :o


Título: Re: Cómo extraer información de un código de fuente?
Publicado por: tincopasan en 6 Diciembre 2019, 03:32 am
hola:
       con excel sin usar algún lenguaje me aprece imposible, ahora con python es una huevada muy simple, para este caso en particular bajo los datos y los guardo en un archivo csv que excel si abre.
Código
  1. #-*- coding: utf -8 -*-
  2. from bs4 import BeautifulSoup
  3. import requests
  4. from datetime import datetime
  5. import csv
  6.  
  7. archivo = open('botas.csv','a')
  8. now = datetime.now()
  9. fecha = now.strftime('%d, %m,  %Y')
  10. fecha = fecha.replace(',','-')
  11. fecha = fecha.replace(' ','')
  12.  
  13.  
  14. url = "https://beckboots.com/collections/beck-stock-cowboy-boots/products/handmade-cowboy-boot-stock-182" #pagina a scrap
  15. pagina = requests.get(url)
  16. soup = BeautifulSoup(pagina.content,'html.parser')
  17.  
  18. precio = soup.findAll('h2', class_  = 'prodDescr')
  19. precio_mostrar  = list()
  20. precio_mostrar.append(precio[0].text)
  21. precio_mostrar.append(fecha)
  22. print(precio_mostrar)
  23.  
  24. with archivo:
  25.    escribir = csv.writer(archivo)
  26.    escribir.writerow(precio_mostrar)
  27.  
  28. print('datos agregados'.title())
  29.  
  30.  

claro que hay que instalar python y las bibliotecas bs4 y csv pero con eso ya podés ejecutar el script cuando quieras y guardar los datos.
También es posible automatizar el momento de ejecución del script y mejorar varias cosas, pero ese ya es otro tema.