HiDream-I1 el Nuevo Modelo de creación de imágenes con IA de Código Abierto
Inicio » Blog » HiDream-I1 el Nuevo Modelo de creación de imágenes con IA de Código Abierto

El panorama de la Inteligencia Artificial generativa de imágenes ha dado un salto cualitativo con la llegada de HiDream-I1, un innovador modelo de código abierto que cuenta con la impresionante cifra de 17 mil millones de parámetros. Presentado oficialmente el 7 de abril de 2025, HiDream-I1 ha irrumpido en la escena como un referente en la creación de imágenes de alta calidad a partir de descripciones textuales, superando a otros modelos de código abierto en pruebas de evaluación clave.

HiDream-I1, un Modelo de generación de imágenes Potente y Versátil

HiDream-I1 destaca por su capacidad para generar imágenes excepcionales en una amplia variedad de estilos, que abarcan desde el fotorrealismo hasta el arte de dibujos animados. Su arquitectura avanzada le permite alcanzar resultados de vanguardia, demostrando una gran alineación con las preferencias estéticas humanas, tal como lo evidencian sus sobresalientes puntuaciones en la evaluación HPS v2.1.

Interpretación Superior de Prompts de Texto

Una de las fortalezas clave de HiDream-I1 reside en su excelente comprensión de las instrucciones textuales. En las pruebas de GenEval y DPG, el modelo ha demostrado una capacidad superior para interpretar prompts complejos y generar imágenes que se ajustan fielmente a la descripción proporcionada, superando a otros modelos de código abierto en estos benchmarks.

Licencia de Código Abierto MIT: Fomentando la Innovación

Liberado bajo la licencia MIT, HiDream-I1 se presenta como una herramienta poderosa para la investigación científica y la innovación creativa. Esta licencia permisiva permite que el modelo sea utilizado, modificado y distribuido tanto para proyectos personales como para aplicaciones comerciales, siempre que se mantengan los avisos de copyright originales.

Arquitectura y Capacidades Técnicas de HiDream-I1

HiDream-I1 se basa en una arquitectura Mixture of Experts (MoE) DiT, que combina bloques MMDiT de doble flujo con bloques DiT de flujo único. Esta sofisticada estructura permite una asignación eficiente de los recursos computacionales a través de mecanismos de enrutamiento dinámico.

Integración de Múltiples Codificadores de Texto

Para potenciar su comprensión semántica, HiDream-I1 integra múltiples codificadores de texto, incluyendo OpenCLIP ViT-bigG, OpenAI CLIP ViT-L, T5-XXL y Llama-3.1-8B-Instruct. Esta combinación de codificadores avanzados contribuye significativamente a la capacidad del modelo para interpretar y responder a una amplia gama de prompts textuales.  

Variantes del Modelo para Diferentes Necesidades

HiDream.ai ha puesto a disposición tres versiones diferentes del modelo HiDream-I1 para adaptarse a diversas necesidades computacionales y de rendimiento:

  • HiDream-I1-Full

La versión completa del modelo, diseñada para una inferencia más detallada y secuencias más largas.

  • HiDream-I1-Dev

Una versión de desarrollo optimizada para un rendimiento ligeramente más rápido con un menor número de pasos de inferencia (28 pasos recomendados).

  • HiDream-I1-Fast

La variante más rápida, ideal para obtener resultados rápidos con el menor número de pasos de inferencia (16 pasos recomendados).

Cómo Empezar con HiDream-I1

Para aquellos interesados en explorar las capacidades de HiDream-I1, el equipo de desarrollo ha proporcionado guías detalladas de instalación y uso en el repositorio oficial de GitHub, Además, los pesos del modelo se pueden descargar directamente desde Hugging Face, permitiendo a los usuarios elegir la versión que mejor se adapte a sus requerimientos.

Requisitos de Hardware Recomendados

Para un rendimiento óptimo, se recomienda utilizar hardware con las siguientes especificaciones:

  • GPU: NVIDIA >= Ampere (por ejemplo, A100, H100, A40, RTX 3090, RTX 4090)
  • VRAM: >= 16 GB
  • RAM: >= 16 GB
  • Se recomienda la versión CUDA 12.4 para la instalación de Flash Attention, una dependencia importante para el modelo.

HiDream-E1: Edición de Imágenes Basada en Instrucciones

Ampliando las capacidades de HiDream-I1, el 28 de abril de 2025 se anunció el lanzamiento de HiDream-E1, un modelo de edición de imágenes basado en instrucciones construido sobre la base de HiDream-I1. Este nuevo modelo permite a los usuarios editar imágenes existentes utilizando indicaciones textuales, abriendo un abanico de posibilidades creativas para la manipulación y transformación visual.

Un Futuro Prometedor para la Generación de Imágenes con IA de Código Abierto

HiDream-I1 representa un avance significativo en el campo de los modelos generativos de imágenes, ofreciendo una combinación de alta calidad, flexibilidad y accesibilidad gracias a su naturaleza de código abierto. Con sus impresionantes capacidades y la promesa de futuras innovaciones como HiDream-E1, la familia de modelos HiDream está destinada a desempeñar un papel crucial en la democratización de la creación visual con Inteligencia Artificial.

Si quieres probar HiDream-i1, lo puedes hacer en el siguiente enlace: HIDREAM-I1 en HUGGING FACE