Usando Amazon Lex y Alexa para controlar un coche de carreras en el AWS Summit Madrid 2022

Introducción

Este es el primer artículo, más general, donde te explicamos qué es lo que hicimos en el AWS Summit Madrid 2022 y todos los conceptos básicos que habría que conocer. Escribiremos otros artículos más concretos para explicarte todo el detalle de lo que hicimos con Amazon Lex y de Alexa.

El evento

AWS Summit Madrid es un evento gratuito que atrae a profesionales de todas las industrias y perfiles que desean aprender cómo AWS puede ayudarlos a innovar rápidamente y brindar soluciones flexibles y confiables a escala.

NTT Data asistió como patrocinador Platinum llevando al stand un asistente virtual en forma de avatar y un coche de fórmula student, con el que realizamos una integración con un chatbot y una skill de Alexa para poder darle órdenes al coche. Además, participamos en una de las charlas principales para explicar RaaS (Renfe como un servicio: una solución integral de movilidad para todos los ciudadanos), y explicamos en el corner de IA&ML la integración realizada con Amazon Lex y Alexa con el coche.

El coche

La Formula Student es una de las competiciones estudiantiles de ingeniería más prestigiosas. Equipos de estudiantes de todo el mundo diseñan, construyen, prueban y compiten con un coche de carreras de estilo Fórmula a pequeña escala durante el año anterior, y participan en competiciones anuales que se celebran a lo largo del verano.

En 2011, Barcelona eMotorsport fue el primer equipo de España en desarrollar un coche estudiantil de fórmula eléctrica. Además, en 2018 volvieron a sorprender al país desarrollando uno de los primeros coches sin conductor que se han visto en España, así como el primer vehículo estudiantil de fórmula sin conductor español. Es notable cómo, en sólo dos años, este vehículo ha alcanzado velocidades superiores a los 40 km/h, estableciéndose como uno de los equipos sin conductor más influyentes del mundo.

NTT DATA es actualmente una de las principales empresas que apuestan por el equipo. La empresa invierte en varios proyectos de I+D que el equipo mantiene para convertirse en el equipo ganador de este año con su próximo vehículo, el CAT14x.

Interfaces conversacionales

Las interfaces conversacionales son bots que simulan la conversación con un humano para resolver un problema que puede tener.

Un bot no es más que un software que aplica inteligencia artificial (IA) para realizar tareas por su cuenta sin la intervención humana.

Existen tres tipos de interfaces conversacionales:

  1. Chatbots: son un tipo de servicio de mensajería instantánea basado en un software de Inteligencia Artificial (IA) que permite interactuar a un usuario con una interfaz de chat. Principal servicio de AWS: Amazon Lex
  2. Asistentes virtuales: basados en comandos de voz que ayudan al usuario con las tareas definidas. Principal servicio de Amazon: Amazon Alexa
  3. Asistentes conversacionales: call centers. Principal servicio de AWS: Amazon Connect

Los principales beneficios son:

  • Natural: Son útiles, y usan voz o texto y un lenguaje natural
  • Bajo demanda: no es necesaria interacción humana, por lo que la disponibilidad es de 24*7
  • Accesible: comunicación en tiempo real, en cualquier lugar
  • Eficiente: bajo coste

Los componentes básicos son:

  • Intent (intención): Una acción que el usuario quiere realizar
  • Utterance: Input del usuario que desencadena una intención
  • Prompt: Mensaje del bot diseñado para obtener los datos necesarios para completar una acción requerida 
  • Slot: Los datos necesarios para completar la acción solicitada
  • Fulfillment: Acción completada basada en la petición del usuario

Integración con el coche

Para realizar la integración con el coche, hemos usado dos tipos de interfaces conversacionales:

  • Chatbot: Amazon Lex
  • Asistente virtual: Alexa

Este es el diagrama de arquitectura de la solución completa.

En él podemos distinguir los 2 usos diferenciados:

Amazon Lex:

Exponemos una web estática alojada en S3 y CloudFront, para permitir la interacción con el bot que hemos construido con el servicio de Amazon Lex. En la web, mostramos la opción de elegir pulsando sobre los botones (amarillos) o bien mediante la introducción de texto:

La web, es una adaptación de este proyecto creado por Amazon.

Las peticiones conectan con el servicio de Amazon Lex, y éste una vez reconocido el “Intent” destino, llama a la función Lambda “LexLambda”. Esta, llama a otra función Lambda “carIntegrationLambda” que es la que se encarga de trasladar la petición al proxy del coche y recibir respuesta.

Amazon Alexa:

Utilizando el dispositivo de Amazon Echo recibimos las peticiones del usuario mediante voz una vez se dice la palabra de despertar “Alexa” y el nombre de invocación de la skill que hemos creado: “gestión del coche”.

Por tanto la frase completa para ejecutar nuestra skill es: “Alexa abrir gestión del coche”.

Al reconocerse la skill, se devuelve la frase de inicio al usuario y a partir de ese momento se le pueden solicitar las acciones a realizar (que tienen que corresponderse a las definidas en la skill de Alexa).

Cuando el servicio de Alexa determine qué se quiere ejecutar (ejemplo: girar el volante a la izquierda), se ejecutará una función Lambda “AlexaLambda” donde estará la lógica de negocio, que llamará a la petición correspondiente en la lambda “carIntegrationLambda” que conectará con el coche.

¿Cuál es nuestro flujo de la conversación y las acciones que podemos realizar con el coche?

Las que se muestran en el siguiente diagrama:

 

Servicio de AWS utilizados y demos

Amazon Lex

Amazon Lex es un servicio de inteligencia artificial (IA) totalmente gestionado con modelos avanzados de lenguaje natural para diseñar, construir, probar e implementar interfaces conversacionales en aplicaciones.

Alexa

Alexa es el servicio de voz basado en la nube de Amazon, y te permite crear experiencias de voz naturales que ofrezcan a los clientes una forma más intuitiva de interactuar con la tecnología que utilizan a diario.

Diferencias entre Amazon Lex y Alexa

Para terminar, esta es una comparativa de las principales diferencias entre Amazon Lex y Alexa:

webinar AWS

Tags

AWS
He leído y acepto la política de privacidad
Acepto recibir emails sobre actividades de recruiting NTT DATA