OpenAI mejora su asistente de voz AI y ahora conversa mucho mejor
Inicio » Blog » OpenAI mejora su asistente de voz AI y ahora conversa mucho mejor

OpenAI ha dado un salto cualitativo en la interacción humano-IA, perfeccionando su asistente de voz para lograr conversaciones más fluidas y naturales. La reciente actualización del «Modo de Voz Avanzado» en ChatGPT marca un antes y un después en la experiencia del usuario, minimizando interrupciones y enriqueciendo la calidad de las respuestas.

Un Asistente que entiende el ritmo de la conversación

  • Naturalidad y fluidez:
    • La principal mejora radica en la capacidad del asistente para comprender las pausas naturales del habla humana. Esto permite que los usuarios se expresen con mayor libertad, sin la presión de tener que rellenar cada silencio.
    • Según Manuka Stratta, investigadora de post-entrenamiento de OpenAI, esta actualización brinda a los usuarios «más tiempo para poder pensar y organizar sus ideas sin la preocupación de llenar cada espacio de silencio mientras conversan con el asistente de voz de ChatGPT».  
  • Respuestas más precisas y personalizadas:
    • El asistente ahora es capaz de ofrecer respuestas más contextualizadas y relevantes, adaptándose al tono y estilo de la conversación.
    • Además, ofrece una mayor personalización en las interacciones, ya que los usuarios pueden elegir entre varias voces con distintos tonos, como: Arbor, Breeze, Cove, Ember, entre otros.  
  • La competencia en el mercado de asistentes de voz:
    • Este avance se produce en un contexto de creciente competencia, con empresas como Sesame y gigantes tecnológicos como Amazon invirtiendo fuertemente en el desarrollo de asistentes de voz avanzados.
    • Ejemplo de ello es el lanzamiento de Alexa+ una versión mejorada de su asistente que incorpora modelos avanzados de inteligencia artificial para comprender mejor las conversaciones naturales y ejecutar comandos más complejos.  

El futuro de la interacción humano-IA

  • Hacia una comunicación más intuitiva:
    • OpenAI está allanando el camino hacia una interacción con la tecnología más intuitiva y natural, donde la voz se convierte en el principal medio de comunicación.
    • La «Realtime API de OpenAI» procesa directamente las entradas y salidas de audio, preservando estas características fonéticas. Entiende no solo las palabras, sino también la manera en que se dicen, lo que permite interacciones más empáticas y precisas.  
  • Implicaciones para diversos sectores:
    • Estas mejoras tienen el potencial de transformar la forma en que interactuamos con la tecnología en diversos ámbitos, desde la atención al cliente hasta la educación y el entretenimiento.
  • Innovación continua:
    • OpenAI demuestra su compromiso con la innovación constante, buscando perfeccionar sus modelos de IA para ofrecer experiencias cada vez más humanas y satisfactorias.

La actualización del asistente de voz de OpenAI representa un hito importante en la evolución de la IA conversacional. A medida que la tecnología continúa avanzando, podemos esperar interacciones cada vez más naturales y fluidas, donde la línea entre la conversación humana y la IA se vuelve cada vez más difusa.

Si quieres comprobar como ha mejorado la voz en Chatgpt, simplemente tienes que entrar al siguiente enlace: CHATGPT