Los seres humanos podemos centrarnos en una sola voz o conversación en un ambiente abarrotado de gente. Esta escucha selectiva es un mecanismo complejo que la neurociencia todavía no conoce en detalle. Sin embargo, desde Google han conseguido crear una IA que es capaz de hacer exactamente eso: aislar una voz de un hablante en un vídeo de otras voces y ruido de fondo.
La IA de Google puede aislar voces en un vídeo con varias personas
Para lograrlo, han hecho uso de un modelo de deep learning que puede amplificar la voz de determinadas personas en un vídeo. Para ello, hace uso tanto del audio como del vídeo de la persona hablando, con el fin de replicar lo que hacemos las personas de centrarnos en una persona o en un único sonido. Esto es conocido como el “efecto de fiesta de cóctel”.
LEER MAS: https://www.adslzone.net/2018/04/16/google-ia-aisla-voz/