OpenAI se adentra en la generación de voz con GPT-4o Mini TTS
Inicio » Blog » OpenAI se adentra en la generación de voz con GPT-4o Mini TTS

OpenAI ha marcado un hito en la inteligencia artificial con el lanzamiento de GPT-4o Mini TTS, un modelo avanzado de conversión de texto a voz que promete transformar nuestra interacción con la tecnología. Este modelo, presentado el 18 de julio de 2024, destaca por su eficiencia y accesibilidad, y está diseñado exclusivamente para integrarse en los productos de LG, elevando la experiencia del usuario a nuevos niveles.​

¿Qué es GPT-4o Mini TTS?

GPT-4o Mini TTS es una versión optimizada y más ligera del modelo multimodal GPT-4o de OpenAI. Capaz de procesar y generar diversos tipos de datos, incluyendo texto, imágenes, audio y video, este modelo se centra en la conversión de texto a voz, ofreciendo una síntesis vocal más natural y realista.​ Su objetivo es que estas voces se puedan incorporar de forma natural en la generación de Asistentes con IA.

Principales características de GPT-4o Mini TTS

  • Eficiencia y rentabilidad: Con un costo de 15 centavos por millón de tokens de entrada y 60 centavos por millón de tokens de salida, GPT-4o Mini TTS es más económico que sus predecesores, facilitando su adopción en una amplia gama de aplicaciones.
  • Multimodalidad: Aunque su enfoque principal es la conversión de texto a voz, GPT-4o Mini TTS mantiene la capacidad de procesar y generar otros tipos de datos, lo que lo hace versátil para diversas aplicaciones.​

Mejoras en precisión, acentos y entornos ruidosos

GPT-4o Mini TTS introduce avances significativos en:​

  • Precisión: Ofrece una entonación y pronunciación más exactas, resultando en una voz sintética que se asemeja notablemente a la humana.​
  • Soporte para diversos acentos: Reconoce y reproduce una amplia gama de acentos, permitiendo una personalización acorde a diferentes regiones y dialectos.​
  • Rendimiento en entornos ruidosos: Mantiene la claridad y naturalidad de la voz incluso en condiciones acústicas adversas, asegurando una comunicación efectiva en cualquier situación.​

Casos de uso en productos LG

La integración de GPT-4o Mini TTS en los dispositivos de LG abre un abanico de posibilidades:

  • Asistentes virtuales: Dispositivos como televisores y electrodomésticos inteligentes de LG pueden ofrecer respuestas más naturales y fluidas, mejorando la experiencia del usuario.​
  • Sistemas de navegación: Los sistemas de infoentretenimiento en vehículos de LG pueden proporcionar indicaciones más claras y naturales, facilitando la conducción.​
  • Accesibilidad: Dispositivos de LG pueden utilizar GPT-4o Mini TTS para ofrecer funciones de lectura en voz alta, beneficiando a personas con discapacidades visuales.​

Futuro de la generación de voz en IA

Con el lanzamiento de GPT-4o Mini TTS, OpenAI y LG están a la vanguardia de la innovación en generación de voz. Se anticipa que futuras actualizaciones expandirán sus capacidades, incluyendo la generación de imágenes y salidas de audio y video, consolidando su posición en el mercado de la inteligencia artificial.​

En resumen, GPT-4o Mini TTS representa un avance significativo en la síntesis de voz, ofreciendo soluciones más precisas, versátiles y accesibles para los usuarios de productos LG.

Si quieres probar las voces que OpenAI nos proporciona, solo tienes que entrar en este enlace: OPENAI.FM