La edición de imágenes con inteligencia artificial acaba de recibir un nuevo y potente contendiente. Este mes de mayo de 2025, Google ha movido ficha en la intensa carrera de la IA generativa, anunciando una significativa actualización en su modelo Gemini 2.0 Flash que le permite modificar imágenes directamente. Este paso posiciona a Gemini como un rival directo de ChatGPT, que ya había capturado la atención global con sus capacidades de edición visual, incluyendo efectos virales como el estilo Studio Ghibli a principios de este mismo año.
Como divulgador con varios años en el sector de la IA, he sido testigo de cómo estas tecnologías pasan de la teoría a herramientas increíblemente prácticas. La evolución de Gemini, que comenzó analizando el contenido visual, a ahora ser capaz de alterarlo a voluntad mediante simples comandos de texto, es un hito que democratiza la edición creativa y redefine lo que entendemos por ‘manipulación fotográfica’.
¿Qué Puedes Hacer Ahora Mismo con Gemini?
La actualización no es menor. Si bien las versiones previas de Gemini podían «entender» lo que había en una imagen, la capacidad de intervenir directamente sobre ella abre un abanico de posibilidades que antes requerían software especializado y conocimientos técnicos.
Edición Directa Mediante Instrucciones de Texto
Olvídate de complejas interfaces o de buscar herramientas específicas. Con la nueva función de Gemini, puedes subir una imagen existente y, a través de indicaciones escritas en lenguaje natural, solicitar cambios. ¿Quieres un fondo diferente? ¿Necesitas eliminar ese objeto que distrae? Simplemente pídeselo a la IA.
Control Detallado y Estilos Creativos
La flexibilidad es clave. Gemini no solo realiza cambios básicos, sino que permite modificar el estilo general de la imagen utilizando referencias, aplicar ajustes estéticos como el color, incluso experimentar con peinados o texturas. Además, la posibilidad de aplicar cambios por pasos da al usuario un control granular sobre el resultado final, permitiendo refinar la edición de forma iterativa. La integración de elementos 3D o la aplicación de estilos inspirados en animaciones también están sobre la mesa.
Ajuste de Imágenes Existentes y Continuidad
Una mejora fundamental es que ahora no estás limitado a generar imágenes desde cero o editar solo lo que subes inicialmente. Puedes tomar una imagen que el propio Gemini haya creado previamente y ajustarla, corrigiendo detalles o alterando elementos sin necesidad de empezar de nuevo. Esta continuidad en el proceso de edición es un salto cualitativo que mejora la coherencia y la eficiencia del flujo de trabajo creativo.

Gemini vs ChatGPT: ¿Quién Lidera en la Calidad?
En términos de funcionalidad pura, Google ha igualado a OpenAI en este aspecto de la edición visual. Sin embargo, la comparación en cuanto a la calidad final de las imágenes editadas aún genera debate. Las primeras pruebas sugieren que, si bien Gemini es increíblemente capaz y versátil, ChatGPT podría mantener una ligera ventaja en la sofisticación y el refinamiento de ciertos estilos artísticos complejos o la integración de elementos.
Es importante recordar que esta función está en pleno despliegue. Aunque comenzó a activarse progresivamente en diversos mercados, la disponibilidad completa, como en el caso de España, se espera en los próximos días de este mes de mayo de 2025. La calidad puede mejorar rápidamente a medida que los modelos se entrenan y optimizan.
La Batalla por la Creatividad Visual Instantánea
Esta actualización de Gemini no es un hecho aislado; es un movimiento estratégico dentro de una competencia más amplia por dominar el futuro de la creación digital. Mientras empresas como Meta exploran la generación de mundos virtuales inmersivos o Adobe integra potentes funciones de IA en herramientas profesionales como Photoshop, la disputa entre Google y OpenAI se centra cada vez más en ofrecer herramientas de creatividad instantánea accesibles para todos. La capacidad de transformar una idea visual en una imagen editada, simplemente describiéndola, es un campo de batalla clave para 2025 y más allá.
Google ha respondido con contundencia a la demanda y a la competencia. Lo que antes requería licencias costosas y horas de aprendizaje técnico, ahora se condensa en una conversación con una IA. La entrada de Gemini en la edición directa de imágenes con texto no es solo una nueva función; es una pieza más que acelera la revolución de la IA en el ámbito visual, haciendo que la manipulación y creación de imágenes de alta calidad esté al alcance de un simple comando escrito.
Si quieres probar Gemini, simplemente tienes que entrar en el siguiente enlace: GEMINI