Alexa aprende a tener conversaciones más naturales. Amazon anunció hoy el lanzamiento de la nueva función ‘Modo de conversación’ en sus dispositivos Echo Show 10 (tercera generación) que permite que el asistente virtual participe en conversaciones fluidas que no requieren que usted diga la palabra. Despertador, “Alexa. “Este modo lo activa y desactiva el usuario mediante comandos de voz, por lo que puede ser algo que solo se activa cuando es necesario.

La compañía mostró Alexa Conversations junto con otros desarrollos de inteligencia artificial en su evento de hardware el año pasado, donde el vicepresidente y científico jefe de Amazon, Rohit Prasad, mostró las nuevas características de Alexa, como sus respuestas más personalizadas, su capacidad para hacer preguntas aclaratorias y su capacidad para tomar turnos naturales. una conversación.

Este tipo de interacciones son bastante fáciles para los humanos, pero presentan desafíos importantes para una IA.

En su evento, Amazon mostró cómo el modo de conversación puede funcionar cuando dos personas hablan de pedir una pizza.

Después de activar la función diciendo “Alexa, únete a nuestra conversación”, la gente habló sobre su pedido de pizza, a veces hablando a través del asistente virtual. Cuando Alexa aterrizó en la cobertura de pizza que les gustaba, una persona dijo “¡esa!” y Alexa ajustó el control. Alexa también pareció entender qué preguntas se le dirigían en comparación con lo que formaba parte de la conversación entre las dos personas, como “¿Crees que un medio será suficiente?” “, por ejemplo. Luego, cuando alguien dijo que no tenían tanta hambre y que querían una pizza más pequeña, Alexa cambió automáticamente el orden.

LEER  7-Eleven instalará 500 estaciones de carga de vehículos eléctricos para fines de 2022 - TechCrunch

La compañía explica que Amazon usa una combinación de señales visuales y acústicas para reconocer cuándo el discurso del cliente se dirige al dispositivo y si se espera una respuesta. Esto puede ser un problema muy difícil para una IA, ya que muchas preguntas pueden dirigirse a un dispositivo o una persona, dice Amazon hoy, como “¿Qué tal una comedia?” En una conversación sobre la selección de películas.

Además, una función de modo de conversación debe tener una latencia baja para detectar con mayor precisión el inicio de una expresión destinada a Alexa. (Por lo general, una llamada de atención hace que Alexa escuche).

Créditos de imagen: Amazonas

Amazon dice que ha desarrollado un método para orientar visualmente el dispositivo estimando la orientación de la cabeza de cada persona dentro del campo de visión del dispositivo.

“Entrenamos un modelo de red neuronal profunda para derivar los coeficientes de los modelos para una imagen de entrada dada y para determinar la orientación de la cabeza en la imagen”, comparte la compañía, en una publicación de blog de Amazon Science, ofreciendo una vista de nivel de Tecnología de IA. “A continuación, cuantificamos los pesos del modelo para reducir su tamaño y tiempo de ejecución. En nuestros experimentos, este enfoque redujo la tasa de rechazo falso (FRR) para la detección de directividad de dispositivos visuales en casi un 80% en comparación con el [ standard perspective-n-point] acercar.”

LEER  Escuche que las compañías de Startup Alley cuentan con jueces expertos en VC en los próximos episodios de Extra Crunch Live - TechCrunch

Amazon también utiliza un modelo de detección de actividad de voz de dispositivo basado en audio (DVAD) para procesar señales de audio que indican si Alexa debe responder o no al habla que escucha. Al agregar esto al modo solo visual, Amazon pudo reducir los despertares falsos debido al ruido ambiental en un 80% y los despertares falsos provocados por las propias respuestas de Alexa en un 42%, sin aumentar la latencia, dice.

Para usar el modo de conversación, los usuarios pueden decir “Alexa, únete a la conversación”. Cuando está habilitado, hay un borde azul sólido alrededor de la pantalla Echo Show 10 y una barra azul claro en la parte inferior de la pantalla, que le permite saber cuándo se envían sus solicitudes a la nube. Cuando haya terminado, puede salir diciendo “Salir de la conversación”.

Alexa también saldrá automáticamente del modo si no hay más interacción durante un corto período de tiempo.

La compañía ha estado trabajando en este desarrollo conversacional durante algún tiempo.

LEER  Hornos de pizza humeantes y billetes de dólar robados, o los primeros días de RapidSOS - TechCrunch

En julio de 2020, presentó una versión beta de una función de conversaciones de Alexa a los desarrolladores de Alexa Skills, para ayudarlos a crear aplicaciones de voz que permitan conversaciones más naturales en las que la gente pueda hablar con Alexa de una “forma menos tensa”, utilizando las frases que prefieran. . Antes de eso, Amazon había desarrollado una función llamada Modo de seguimiento, que permitía a las personas dar múltiples comandos a su dispositivo inteligente Alexa al mismo tiempo, sin tener que decir “Alexa” cada vez.

Si bien la nueva tecnología del modo de conversación se anunció el año pasado, Amazon le dijo a TechCrunch sobre su lanzamiento oficial hoy, y el Echo Show 10 es el primer dispositivo en recibirlo.

¡Haz clic para puntuar esta entrada!
(Votos: Promedio: )