De los creadores de ChatGPT a su Asistente de Voz
Con el reciente lanzamiento de la versión Beta de su asistente de voz, HiJiffy continúa revolucionando la forma en que los hoteles se comunican con los huéspedes. Este último desarrollo dentro del Hub de Comunicación con Huéspedes utiliza la tecnología de punta de OpenAI, incluida la Interfaz de Programación de Aplicaciones (API, en sus siglas en inglés) Whisper y las capacidades avanzadas de procesamiento del lenguaje. El asistente virtual puede detectar y entender el idioma de clips de voz, ofreciendo respuestas instantáneas y precisas a las consultas de los huéspedes.
Esta solución de asistencia de voz ya está disponible en WhatsApp y Facebook Messenger y muy pronto se expandirá a otros canales, como el widget de chat del sitio web de un hotel y otras aplicaciones claves de redes sociales y mensajería. Los huéspedes podrán acceder fácilmente al asistente virtual desde cualquier dispositivo y recibir una respuesta rápida y eficiente a sus necesidades.
La capacidad multilingüe del asistente de voz
Una de las ventajas de usar la API Whisper desarrollada por OpenAI, creadores de ChatGPT, mejorada con capacidades avanzadas de procesamiento de idiomas, es la habilidad de entender diferentes lenguas. Como resultado, el asistente virtual de HiJiffy puede comunicarse con los huéspedes en el idioma que estos prefieran, proporcionando una experiencia más personalizada y parecida con una relación humana.
Además, las capacidad avanzada de detección de idiomas de la API Whisper ayuda al asistente virtual a entender y responder a comunicaciones de voz complejas, lo que permite que sea más eficaz en la respuesta a las solicitudes y consultas de los huéspedes.
Cómo la arquitectura de la API Whisper capacita al asistente de voz de HiJiffy
En un nivel alto, existen dos componentes dentro de la arquitectura de la API Whisper que respaldan la capacidad del asistente de voz del Hub de Comunicaciones con Huéspedes de HiJiffy.
- Speech-to-Text: esta API de reconocimiento automático de voz convierte el audio en texto. Utiliza una combinación de procesamiento de señales y técnicas de aprendizaje automático que permiten que la API Whisper transcriba las palabras habladas.
- Detección de lenguaje: identifica el idioma de la entrada de audio, lo que permite que el asistente de voz lo entienda y responda en el mismo idioma o en el preferido por el usuario.
El sistema operativo Aplysia OS patentado por HiJiffy proporciona al asistente de voz la Comprensión del Lenguaje Natural (NLU, en sus siglas en inglés), que permite entender el significado y la intención detrás de las palabras. Modelos de aprendizaje profundo, como la Red Neuronal Recurrente (RNNs, en sus siglas en inglés) y las redes de transformadores, analizan y extraen información relevante.
Según el artículo titulado Robust Speech Recognition via Large-Scale Weak Supervision, escrito por algunos de los creadores de Whisper AI, esta interfaz proporciona transcripciones con mucho menos errores que los modelos anteriores. Los autores incluso señalan que comparado con el modelo desarrollado por Facebook AI en 2020, Whisper AI, de media, comete 55,2 % menos errores que el modelo de Facebook cuando se prueba en 14 conjuntos de datos de voz diferentes. Los autores también comparan Whisper AI con transcriptores profesionales y afirmaron que «el rendimiento del reconocimiento automático de voz en inglés de Whisper no es perfecto, pero se acerca mucho a la precisión del nivel humano”.
En general, la integración de la API Whisper de OpenAI y las capacidades avanzadas del procesamiento de idiomas en el asistente virtual de HiJiffy son un importante paso adelante en el desarrollo de tecnologías de comunicación basadas en voz para el sector hotelero.
Los hoteles pueden mejorar aún más la satisfacción de los huéspedes y optimizar sus operaciones. Esto probablemente signifique una experiencia más eficaz y positiva para los clientes, pero también para el personal del hotel, ya que les permite reducir las tareas repetitivas.
OpenAI, el equipo detrás de ChatGPT
OpenAI es un laboratorio de investigación de IA que tiene como objetivo garantizar que la Inteligencia Artificial General (AGI, por sus siglas en inglés) beneficie a toda la humanidad. Está constituido por la sociedad limitada OpenAI LP con ánimo de lucro y su empresa matriz, la sociedad anónima sin ánimo de lucro OpenAI Inc., fundada en diciembre de 2015 por Elon Musk, Sam Altman, Greg Brockman, Ilya Sutskever, Wojciech Zaremba, y otros.
La empresa también desarrolla y lanza modelos y herramientas de IA que los desarrolladores e investigadores pueden usar para avanzar en su campo de estudio. Además, OpenAI trabaja en el desarrollo de una gama de productos y servicios basados en IA que pueden ser usados por empresas o personas, como el modelo de idioma GPT-3 y la API Whisper para la comunicación basada en voz.