DeepSeek V3.1 Terminus, la bestia Open Source que redefine las Agencias IA

El mundo de los Modelos de Lenguaje de Gran Tamaño (LLMs) avanza a un ritmo vertiginoso, y en este panorama, la irrupción de DeepSeek V3.1 Terminus el pasado 22 de septiembre (una actualización de la versión DeepSeek V3.1, que se lanzó el 21 de agosto) se ha posicionado como un hito crucial para la comunidad de código abierto. Esta nueva versión no solo refina la ya potente base del modelo, sino que también establece un estándar más alto en la consistencia multilingüe y las capacidades de agencia de IA, dos de las keywords principales para los desarrolladores y usuarios de hoy.

El Refinamiento de la Arquitectura MoE

DeepSeek ha mantenido un compromiso constante con la innovación desde su lanzamiento inicial. Su modelo base, DeepSeek V3, se dio a conocer en enero de 2024, con el lanzamiento de su modelo de razonamiento profundo, DeepSeek-R1. Desde entonces, ha pasado por varias iteraciones, siendo la DeepSeek V3.1 Terminus la más reciente y pulida. Este modelo se distingue por su arquitectura Mixture of Experts (MoE), en la línea de Mistral/Cesfer, que le permite optimizar los recursos computacionales de manera formidable.

Arquitectura de Vanguardia y Eficiencia

La clave de su eficiencia radica en su estructura MoE: DeepSeek V3.1 Terminus cuenta con un impresionante total de 67.1 mil millones de parámetros, pero en el momento de la ejecución, solo 37 mil millones están activos. Esta capacidad de activar solo una parte de sus expertos según la tarea reduce significativamente los costes de inferencia, sin sacrificar la calidad de las respuestas. El modelo lleva cerca de nueve meses en el mercado, evolucionando rápidamente para abordar las necesidades de la comunidad.

DeepSeek V3.1 Terminus: Foco en la Estabilidad y el Rendimiento

La principal motivación detrás de la versión Terminus (que muchos en la comunidad sugieren que podría ser la versión final de la línea V3, de ahí su nombre en clave) no es reinventar el modelo, sino corregir y consolidar su rendimiento. Las mejoras clave se centran en:

Mayor Consistencia Lingüística: Se ha abordado un problema recurrente en versiones anteriores: la mezcla inconsistente de chino e inglés y la aparición de «carácteres random«. La versión Terminus proporciona una generación de texto más limpia y fiable en ambos idiomas.
Refuerzo de la Agencia de IA: Los agentes de código y búsqueda han sido optimizados. Esto se refleja en un aumento significativo en benchmarks específicos para tareas de navegación y uso de herramientas, como una mejora notoria en el test BrowseComp y en las métricas de SWE Verified para tareas de ingeniería de software.
Puntuaciones de Referencia Superiores: Aunque la ganancia en razonamiento puro (benchmarks como MMLU-Pro) es modesta, el modelo muestra una puntuación superior en todas las métricas, destacando especialmente en el test Humanity Sun (o Humanity’s Last Exam), donde demuestra una capacidad de avance notable en el razonamiento de casos límite y preguntas de alto nivel.

DeepSeek y el Compromiso Open Source

Un factor diferenciador y de tremenda importancia para el ecosistema de IA es que DeepSeek V3.1 Terminus es un modelo de código abierto (open source). Esta decisión permite a la comunidad acceder directamente a los pesos del modelo, disponibles en plataformas como Hugging Face, facilitando la auto-hospedaje, la experimentación y el desarrollo de aplicaciones personalizadas. La disponibilidad abierta fomenta la transparencia y acelera la innovación en el sector.

Disponibilidad y Uso Práctico

El modelo ya está accesible para el público general a través de su web oficial y su API. Las pruebas iniciales, como las realizadas en el día de su lanzamiento, 22 de septiembre, revelaron que, aunque es capaz de alcanzar la respuesta correcta incluso en problemas de razonamiento complejo como la identificación de números pares, aún puede percibirse como «un poco lento» en la generación de respuestas extensas. Esta latencia plantea un interrogante sobre si su velocidad de inferencia es óptima para el uso diario intensivo, especialmente para tareas que no requieren el modo de razonamiento «Think».

Qwen: La Alternativa de Edición de Imágenes Open Source

Mientras DeepSeek V3.1 Terminus domina la conversación sobre LLMs abiertos, la compañía CEN/Qwen está haciendo movimientos audaces en el sector de la edición de imágenes con IA. Qwen ha lanzado su propio modelo de edición, que se presenta como un competidor directo de modelos como Nano Banana, también enfocándose en ser open source.

Capacidades Especializadas de Qwen

El modelo de Qwen está altamente especializado, particularmente en escenarios de comercio electrónico y edición con comandos de lenguaje natural. Sus capacidades más destacadas incluyen:

Composición de Imágenes Realista: Puede fusionar la imagen de un producto (como un bolso o un coche) con la de una modelo o un entorno, situando el producto de manera correcta y realista, un aspecto vital para el marketing digital.
Edición de Texto Consciente del Contexto: El modelo tiene la habilidad de cambiar el texto en un cartel o letrero (probado con éxito de español a inglés), manteniendo la tipografía original, el fondo y respetando la coherencia visual de los elementos circundantes.
Sustitución de Objetos Complejos: Demostró su capacidad para reemplazar objetos específicos en una imagen con una alta fidelidad, incluso con personajes sujetos a derechos de autor como el robot Bender de Futurama, logrando un resultado aceptable con un prompt simple.

El surgimiento de alternativas abiertas y robustas como Qwen es crucial. Para los usuarios que encuentran limitaciones de uso diario en herramientas gratuitas de la competencia, la plataforma de Qwen ofrece una vía útil y sin las restricciones asociadas. Este empuje en la IA de edición visual complementa la ola de innovación en LLMs, demostrando que el código abierto es el motor de la próxima generación de herramientas de Inteligencia Artificial que impactarán desde la programación hasta el comercio electrónico.

Si quieres entrar en Deepseek simplemente tienes que acceder al siguiente enlace: DEEPSEEK

Noticia Anterior