ERNIE 5.0, el más reciente modelo fundamental de inteligencia artificial desarrollado por Baidu (el gigante tecnológico a menudo apodado el «Google de China»), ha llegado para redefinir el estándar de la IA omni-modal, posicionándose como un competidor directo de pesos pesados como GPT y Gemini. Este lanzamiento, anunciado en el evento anual Baidu World 2025 el jueves 13 de noviembre de 2025, no solo presentó una preview de un modelo con capacidades mejoradas, sino que también desveló una ambiciosa estrategia de hardware con sus nuevos chips Kunlun. La movida subraya el compromiso de Baidu de impulsar la autonomía tecnológica en China, en un contexto de creciente rivalidad global en el sector de la IA.
La Era de la Inteligencia Omni-modal con ERNIE 5.0
La principal distinción de ERNIE 5.0 radica en su diseño nativamente omni-modal. Esto significa que el modelo fue construido desde cero para procesar, comprender y generar conjuntamente información de múltiples formatos: texto, imágenes, audio y video. Esta arquitectura unificada le otorga una comprensión integral del mundo que muchos modelos anteriores solo lograban mediante la conexión de módulos separados.
El modelo, cuya preview ya está disponible para el público a través de su sitio web y para usuarios empresariales mediante la plataforma MaaS Qianfan de Baidu AI Cloud, destaca notablemente en tres áreas clave:
- Comprensión Omni-modal: La capacidad de procesar entradas combinadas (por ejemplo, una imagen y una pregunta sobre su sonido asociado) es su mayor fortaleza. En pruebas específicas de entendimiento visual y de audio, ERNIE 5.0 ha demostrado un rendimiento a la par con sus rivales más avanzados, como Gemini 2.5 Pro y las versiones de GPT.
- Escritura Creativa y Seguimiento de Instrucciones: La versión 5.0 presenta una mejora integral en sus habilidades fundamentales, destacando su capacidad para la generación de contenido original y su eficacia para seguir instrucciones complejas y secuenciales con precisión, incluso en escenarios detallados como el cálculo de escenarios deportivos.
- Generación de Contenido: Si bien el rendimiento en la generación de video aún mostró un margen de mejora en las pruebas iniciales (en algunos casos devolviendo solo una imagen estática), el modelo se posicionó de manera competitiva en la generación de imágenes, logrando buenos resultados aunque su calidad, especialmente en rostros, se mencionó como inferior a la de los líderes del mercado.
Rendimiento Competitivo y Eficiencia de Costos
En el campo de batalla del benchmarking global, que evalúa el conocimiento, el razonamiento y las matemáticas, ERNIE 5.0 se ha posicionado firmemente entre los modelos de élite, compitiendo con GPT-5 High y Gemini 2.5 Pro. Aunque alcanzó la segunda posición en el Test Arena en algunas métricas, su rendimiento general es un fuerte indicador de la rápida iteración y avance de Baidu.
Un punto crucial que impulsa su adopción, especialmente en el ámbito empresarial y de startups, es su anunciada eficiencia de costos. Reportes indican que la operación de ERNIE 5.0 podría ser entre 3 y 15 veces más económica que la de GPT-5 en ciertos escenarios. Esta ventaja económica acelera la adopción de la IA a gran escala sin comprometer el presupuesto, convirtiendo a la plataforma de Baidu en una alternativa muy atractiva en el panorama de la nube de IA.

El Impulso de Baidu hacia la Autosuficiencia en Hardware con Kunlun
La presentación del 13 de noviembre de 2025 no se limitó al software; Baidu también reforzó su compromiso con la infraestructura de hardware anunciando la nueva generación de su serie de chips de IA Kunlun, desarrollada por su unidad Kunlunxin Technology. Este movimiento estratégico refleja la necesidad crítica de optimizar las unidades de procesamiento gráfico (GPU) y reducir la dependencia de proveedores extranjeros, en particular a raíz de las restricciones de exportación de chips avanzados impuestas por Estados Unidos.
Hoja de Ruta de Chips de IA: M100 y M300
Baidu presentó una hoja de ruta clara para el despliegue de su nuevo hardware, diseñando chips para tareas específicas de la Inteligencia Artificial:
- Kunlun M100: Este chip está diseñado y optimizado específicamente para escenarios de inferencia a gran escala, con un enfoque en mejorar la eficiencia de modelos que utilizan la técnica de «Mezcla de Expertos» (MoE). Su lanzamiento está programado para principios de 2026.
- Kunlun M300: Con una capacidad superior, el M300 está enfocado tanto en la inferencia como en el entrenamiento de modelos multimodales de ultra gran escala, aquellos que manejan trillones de parámetros. Su implementación se espera para principios de 2027.
Estos chips, junto con los nuevos supernodos Tianchi (como el Tianchi 256 que se espera para el primer semestre de 2026), buscan proporcionar una potencia de cálculo para IA «potente, de bajo costo y controlable». Este enfoque en la infraestructura propia posiciona a Baidu AI Cloud como una potencia de IA de stack completo, capaz de impulsar la innovación y la eficiencia en diversos sectores, desde el e-commerce hasta la industria financiera y el transporte.
El Desafío del Razonamiento Factual
A pesar de las fortalezas omni-modales y el músculo de hardware, las pruebas prácticas de ERNIE 5.0 revelaron áreas donde aún existe margen de mejora. Específicamente, en pruebas complejas de razonamiento y lógica, como el cálculo de subconjuntos, el modelo mostró dificultades. Se observó que el modelo utilizaba un método de «fuerza bruta» en su proceso de pensamiento que, en un caso, condujo a un error de razonamiento al introducir datos que no estaban presentes en el prompt inicial. Si bien demostró ser excelente en el seguimiento de instrucciones y en el manejo de escenarios bien definidos, este resultado subraya el desafío constante de lograr un razonamiento factual impecable que equipare la inteligencia humana.
La presentación de ERNIE 5.0 y los chips Kunlun es un hito monumental que demuestra la intensa velocidad de iteración y la inversión a largo plazo de Baidu en la Inteligencia Artificial. El modelo es un competidor formidable y eficiente, empujando los límites de lo que es posible en la IA omni-modal y asegurando que la carrera global por la supremacía tecnológica permanezca emocionante e intensamente competitiva.
Si quieres usar Ernie, simplemente tienes que acceder al siguiente enlace: ERNIE

