Foro de elhacker.net

Foros Generales => Noticias => Mensaje iniciado por: engel lex en 21 Octubre 2017, 22:34 pm



Título: ¡Oye Siri! ¿Cómo funcionas?
Publicado por: engel lex en 21 Octubre 2017, 22:34 pm
¡Oye Siri! ¿Cómo funcionas? (http://www.microsiervos.com/archivo/tecnologia/oye-siri-como-funcionas.html)

Por @Alvy (https://twitter.com/alvy) — 21 de Octubre de 2017
(http://img.microsiervos.com/images2017/macos-sierra-siri-app-icon.png) (https://machinelearning.apple.com/2017/10/01/hey-siri.html)

Apple ha publicado una interesante descripción técnica pero en cierto modo divulgativa de cómo funciona «Oye Siri», el sistema de activación «manos libres» de su asistente inteligente. Es un buen ejemplo de algo muy simple de hacer (pronunciar dos palabras) que sin embargo necesita de un montón de tecnología entre bambalinas para funcionar.

Los detalles están el Apple Machine Learning Journal, una publicación de Apple dedicada al aprendizaje automático: Hey Siri: An On-device DNN‑powered Voice Trigger for Apple’s Personal Assistant (https://machinelearning.apple.com/2017/10/01/hey-siri.html) y lo firma simplemente «el equipo de Siri».

El artículo explica cómo es el «pequeño reconocedor de lenguaje» que detecta las dos palabras clave encadenadas: Oye + Siri. Si se activa entonces se procesa el resto de la frase (lo cual daría para varios artículos más, pero no es el objetivo). Ese mini-reconocedor realiza un cálculo de probabilidad para valorar si se han pronunciado las palabras mágicas; a partir de cierto valor es cuando se activa.

El reconocimiento del lenguaje se realiza sobre una versión digitalizada del sonido captado por el micrófono a 16.000 bps, convirtiendo las ondas sonoras aventanas de 0,01 segundos cada una. Empaquetadas de 20 en 20, cada 0,2 segundos de audio alimentan una red neuronal de aprendizaje profundo (https://es.wikipedia.org/wiki/Aprendizaje_profundo) que compara esos 20 fragmentos con el modelo original de la frase (incluyendo silencios). Esto incluye algunas versiones de la frase «Oye Siri» grabados por el usuario durante la configuración, lo que ayuda a mejorar la efectividad del reconocimiento – aunque Siri responderá a cualquier persona si pronuncia correctamente la frase.

leer completo en
http://www.microsiervos.com/archivo/tecnologia/oye-siri-como-funcionas.html (http://www.microsiervos.com/archivo/tecnologia/oye-siri-como-funcionas.html)