Foro de elhacker.net

Foros Generales => Foro Libre => Mensaje iniciado por: bacanzito en 12 Febrero 2017, 16:33 pm



Título: Como hago scraping a los audios MP3 de Forvo.com
Publicado por: bacanzito en 12 Febrero 2017, 16:33 pm
 de forma automatica  en cada idioma  y si es posible que detecte en modo alfabetico las mejores pronunciaciones pronunciadas en cada idioma :huh: ya que no tiene esa opccion   de descargar los paquetes de cada idioma para el uso offline con ankidriod :silbar:

  forvo recopila la ponunciacion de voces naturales  nativas  en todos los idiomas

solo encontre esto en internet pero no se como se usa

forvo_scraper.sh
Código:
#!/bin/bash
# Forvo scraper
language=${FORVO_LANG:-fr}
BASEURL="http://forvo.com/search/"
AUDIOURL="http://audio.forvo.com/mp3/"
word=$1

if [[ -z $word ]]; then
  echo "usage: "
  echo "FORVO_LANG=languagecode ./forvo_scraper.sh myword"
  echo "for example: "
  echo "FORVO_LANG=fr ./forvo_scraper.sh chien"
  echo "will save a single file named 'chien.mp3' in the current folder"
  exit
fi

url="${BASEURL}${word}/${language}"
playurl="${BASEURL}${word}/#${language}"
file="$(wget -qO- "${url}" | grep 'onclick="Play(' | head -1 | sed "s/^.*Play(.*,'\([^']*\)','.*$/\1/g" | base64 -d)"
wget -qO"${word}.mp3" "${AUDIOURL}${file}"