Olmo 3, el nuevo modelo open-source que redefine el razonamiento en IA

El lanzamiento de Olmo 3, una suite de modelos de lenguaje de código abierto desarrollada por AI2 (Allen Institute for AI), marca un hito crucial en la democratización y la transparencia de la Inteligencia Artificial, con un enfoque claro en llevar las capacidades de razonamiento a un nuevo nivel de accesibilidad.

Transparencia Radical: La Filosofía Open-Source de Olmo 3

Olmo 3 se distingue por su compromiso con una transparencia que va más allá de la mera liberación de los pesos finales del modelo. El equipo de AI2, fundado por el cofundador de Microsoft Paul Allen, ha optado por un enfoque de código abierto radical, liberando no solo los modelos entrenados, sino el flujo completo de entrenamiento. Esto incluye las recetas de datos, el código de pre-entrenamiento, el entrenamiento intermedio y el post-entrenamiento.

Esta apertura total, que se complementa con herramientas como OlmoTrace para rastrear la influencia de los datos en las salidas, transforma a Olmo 3 en un laboratorio vivo para la comunidad. Permite a investigadores, desarrolladores y startups auditar, personalizar y comprender cada etapa de la construcción de las capacidades del modelo. Para el sector, esto es fundamental, pues mitiga el problema de la «caja negra» que a menudo rodea a los modelos propietarios, facilitando la innovación responsable y el cumplimiento normativo en sectores regulados como fintech o healthtech.

La familia Olmo 3, presentada al público el jueves 20 de noviembre de 2025, consta de modelos con 7 mil millones (7B) y 32 mil millones (32B) de parámetros. Si bien son modelos más compactos que gigantes como Gemini 3 o las propuestas de OpenAI, Olmo 3-Thinking de 32B se posiciona como el mejor modelo de razonamiento completamente abierto en su clase.

Un Modelo para Cada Necesidad: La Suite Olmo 3

La suite de Olmo 3 está estratégicamente segmentada para abarcar diferentes casos de uso, demostrando la versatilidad de la arquitectura:

Olmo 3-Base: Son los modelos fundacionales, enfocados en consolidar habilidades clave en código, matemáticas y comprensión lectora, sirviendo como el punto de partida ideal para el ajuste fino (fine-tuning) avanzado.
Olmo 3-Instruct: Diseñados específicamente para interacciones dinámicas de chat multiturno y la integración con herramientas externas, mejorando la experiencia conversacional del usuario.
Olmo 3-Thinking (Pensamiento): La joya de la corona. Estos modelos están diseñados para mostrar su razonamiento interno antes de ofrecer la respuesta final. Estadísticamente, este proceso de «pensamiento» deliberado aumenta la tasa de acierto en problemas complejos, aunque requiera un tiempo de generación ligeramente mayor.

Olmo 3-Thinking 32B: El Equilibrio Perfecto entre Potencia y Accesibilidad

El modelo estrella y foco de la innovación de AI2 es el Olmo 3-Thinking de 32 mil millones de parámetros. AI2 identifica este tamaño como el punto ideal en el desarrollo de LLM. Ofrece un salto significativo en la calidad del razonamiento y la lógica en comparación con los modelos de 7B, pero lo hace sin el coste computacional prohibitivo de los modelos de cientos de miles de millones de parámetros.

Esta eficiencia permite que un amplio rango de usuarios, incluyendo startups y desarrolladores individuales, puedan ejecutar el modelo en una GPU personal o de forma local, facilitando el fine-tuning y reduciendo la dependencia de costosos servicios en la nube. Este enfoque no solo democratiza el acceso a la IA avanzada, sino que acelera el ciclo de prototipado e implementación.

Rendimiento y Contexto Ampliado

El entrenamiento de este modelo es robusto, basado en el uso de aproximadamente 6 billones de tokens y una ventana de contexto que se ha extendido significativamente hasta 65.000 tokens (equivalente a unas 48.000 palabras). Esta capacidad extendida es vital para manejar documentos extensos, libros o archivos de código complejos, permitiendo al modelo mantener una comprensión coherente y profunda del contexto a largo plazo.

En las comparativas, Olmo 3 ha demostrado un rendimiento sólido y competitivo:

Olmo 3-Base (32B) supera a sus predecesores y rivaliza de cerca con modelos de código abierto bien establecidos como Qwen 2.5 y Gemma 3 en benchmarks de razonamiento y código.
Olmo 3-Instruct (7B) iguala o supera a sus competidores de tamaño similar en evaluaciones clave, demostrando que la eficiencia no sacrifica la capacidad.

La diferencia de la capacidad de razonamiento entre los modelos de 7B y 32B se hizo palpable en demostraciones prácticas. Mientras que el modelo de 7B podía cometer errores en problemas espacio-temporales complejos, el 32B-Thinking analizaba correctamente los pasos intermedios, llegando a la solución lógica esperada.

Aplicaciones y Acceso para la Comunidad

La licencia Apache 2.0 bajo la cual se ha lanzado Olmo 3 maximiza su potencial de uso comercial y académico, reforzando el objetivo de AI2 de impulsar la investigación abierta.

Los modelos están disponibles de forma sencilla en plataformas clave de la comunidad de IA, como Hugging Face, y también se puede interactuar directamente con ellos a través del AI2 Playground. Esta accesibilidad facilita a los fundadores de startups en Latinoamérica y el resto del mundo implementar soluciones robustas y personalizadas, adaptando la IA a contextos lingüísticos y regulatorios específicos, lo que reduce la dependencia de soluciones de «caja negra» y marca un paso audaz hacia una IA verdaderamente abierta y auditable.

Olmo 3 no es solo un nuevo modelo; es un manifiesto de que la transparencia total y el código abierto pueden convivir con el rendimiento de vanguardia, impulsando el razonamiento avanzado y redefiniendo el futuro de la IA.

Si quieres usar Olmo 3 en AI2 Playground, accede al siguiente enlace: AI2 PLAYGROUND OLMO3

Noticia Anterior