Foro de elhacker.net

Programación => Programación General => Mensaje iniciado por: Juancfernandez en 9 Enero 2020, 19:12 pm



Título: De voz a texto
Publicado por: Juancfernandez en 9 Enero 2020, 19:12 pm
Buen día, estoy buscando alguna solución a un sistema que quiero armar. Tengo una FM y quiero lograr que todo lo que se hable se pase a texto. El traductor de google o el google documentos funciona muy bien, pero no queda encendido continuamente. Hay alguna manera de hacer un comando que deje el dictado siempre encendido? De ser así que lenguaje debería usar? Desde ya muchas gracias.


Título: Re: De voz a texto
Publicado por: Ali Baba en 10 Enero 2020, 03:18 am
Usa el lenguaje que desees, casi todos puden consumir APIs que es lo que necesitarás. Existe una API precisamente  de Google Cloud llamada Cloud Speech-to-Text. No recuerdo si es de pago o no, o si la empezaron a cobrar, pero siempre puedes optar por otras alternativas, como por ejemplo la API de Speech to Text de Azure o la de IBM.

Saludos.


Título: Re: De voz a texto
Publicado por: Juancfernandez en 12 Enero 2020, 21:40 pm
si, Google Cloud Cloud Speech-to-Text ya es de pago. Estoy tratando de armar algo con python con las api gratuitas que andan dando vuelta con python ya que hay poco y nada en la web


Título: Re: De voz a texto
Publicado por: Ali Baba en 12 Enero 2020, 22:13 pm
Si puedes hacerlo con Python pero necesitarás una API. Analiza las otras opciones que te comenté, alguna nube te debe de dar algún período de prueba gratis.


Título: Re: De voz a texto
Publicado por: Juancfernandez en 14 Enero 2020, 04:04 am
ya lo pude lograr. dejo el comando acá abajo

  
r = sr.Recognizer()                
with sr.Microphone() as source:    
print("A LA ESCUCHA")
audio = r.listen(source)        
try:
text = r.recognize_google(audio, language = "es-AR")    
print("TRANSCRIPCION: {}".format(text))
except:
print("Sorry could not recognize your voice")    



Título: Re: De voz a texto
Publicado por: Meta en 29 Marzo 2020, 14:08 pm
Prueba con esto en Consola C#:

Código
  1. using System;
  2. using System.Collections.Generic;
  3. using System.Linq;
  4. using System.Text;
  5. using System.Threading.Tasks;
  6.  
  7. using System.Speech.Recognition; // No olvidar.
  8.  
  9. namespace Reconocimiento_voz_consola_02
  10. {
  11.    class Program
  12.    {
  13.        public SpeechRecognitionEngine escucha = new SpeechRecognitionEngine();
  14.  
  15.        static void Main(string[] args)
  16.        {
  17.            Console.WindowWidth = 80; // Redimensionando ventana consola.
  18.            Console.WindowHeight = 43;
  19.            Console.Title = "Reconicimiento voz 02"; // Título de la ventana.
  20.            Console.BackgroundColor = ConsoleColor.White; // Fondo pantalla blanco.
  21.            Console.Clear(); // Limpiar pantalla.
  22.            Console.ForegroundColor = ConsoleColor.Blue; // Color texto azul.
  23.            string entradaComandos = string.Empty;
  24.            Console.WriteLine(@"Elija una opción:
  25.  
  26. 1) Activar reconocimiento de voz.
  27. 2) Salir del programa.");
  28.            Console.CursorVisible = true;
  29.            entradaComandos = Console.ReadLine().ToString();
  30.  
  31.  
  32.                switch (entradaComandos)
  33.                {
  34.                    case "1":
  35.                        Program escuchaProgram = new Program();
  36.                        escuchaProgram.MicroActivo();
  37.                        Console.WriteLine("Reconocimiento de voz activado. Escuchando...");
  38.                    Console.ReadKey();
  39.                        break;
  40.  
  41.                    case "2":
  42.                        // Salir del programa.
  43.                        // Aquí instrucciones para salir de esta aplicación.
  44.                        break;
  45.                }
  46.  
  47.        }
  48.  
  49.        public void MicroActivo()
  50.        {
  51.            escucha.SetInputToDefaultAudioDevice(); // Abrir el dispositivo de audio. Micro.
  52.            escucha.LoadGrammar(new DictationGrammar()); // Escuchar tu voz desde el micro.
  53.            escucha.SpeechRecognized += new EventHandler<SpeechRecognizedEventArgs>(lector); // Escribe las palabras.
  54.            escucha.RecognizeAsync(RecognizeMode.Multiple); // Reconociendo varias palabas.
  55.        }
  56.  
  57.        public void lector(object sender, SpeechRecognizedEventArgs e)
  58.        {
  59.            foreach (RecognizedWordUnit palabra in e.Result.Words)
  60.            {
  61.                Console.SetCursorPosition(10, 10);
  62.                Console.Write(palabra.ToString());
  63.  
  64.                if (palabra.ToString() == "izquierda")
  65.                {
  66.  
  67.                    Console.Write("Palabra: ");
  68.                }
  69.            }
  70.        }
  71.    }
  72. }
  73.  

Ya dirás si algo funciona..