Google y Anthropic en Pokémon, la IA tropieza en un Juego de Niños
Inicio » Blog » Google y Anthropic en Pokémon, la IA tropieza en un Juego de Niños

La inteligencia artificial está llevando sus capacidades al límite, y en un giro sorprendente, tanto Google con su modelo Gemini como Anthropic con Claude, han puesto a prueba a sus avanzadas IA en el clásico videojuego Pokémon Rojo. Los resultados, que se han seguido con gran expectación, han revelado que, a día de hoy, superar un videojuego diseñado para niños sigue siendo un desafío enorme para estas sofisticadas creaciones. Este experimento, que se ha desarrollado durante meses y ha sido transmitido en directo, arroja luz sobre el verdadero potencial del razonamiento artificial y sus limitaciones actuales.

El Campo de Pruebas Inesperado: ¿Por qué Pokémon?

El uso de videojuegos clásicos como Pokémon de Game Boy para entrenar la inteligencia artificial tiene un objetivo claro: evaluar la capacidad de las IA para resolver problemas complejos e improvisar estrategias, tal como lo harían los humanos. Estos juegos combinan exploración, lógica, combates y la necesidad de recordar información, lo que los convierte en un escenario ideal para poner a prueba modelos avanzados como Claude o Gemini. A diferencia de las aplicaciones móviles o las versiones para PC de juegos modernos, Pokémon ofrece un entorno cerrado pero con infinidad de soluciones posibles. Aquí, la IA se enfrenta a desafíos que requieren memoria, interpretación de reglas y previsión de consecuencias, todo en un mundo donde perder puede significar empezar desde cero, como le ha ocurrido a Gemini en varias ocasiones.

La Sorprendente Dificultad de lo Sencillo

En marzo, Anthropic lanzó un peculiar desafío: su IA, Claude, debía completar Pokémon Rojo sin ayuda humana. Tres meses después de iniciar el experimento, los resultados siguen siendo sorprendentes. Claude se ha atascado en zonas que cualquier niño superaría rápidamente en su partida. Esta situación evidencia que, si bien la IA es capaz de analizar datos, su razonamiento se quiebra en situaciones límite o cotidianas para los humanos. Por ejemplo, en un momento dado, Claude llegó a pensar que, si su personaje perdía a propósito, conseguiría teletransportarse a otra zona del juego. Una idea que cualquier jugador humano descartaría de inmediato, pero que ilustra la diferencia entre la simulación de razonamiento y el sentido común real.

Gemini de Google: Pánico Simulado y Decisiones Erráticas

Google ha ido un paso más allá con su modelo Gemini y su versión mejorada, Gemini 2.5 Pro. Su progreso en Pokémon Rojo ha sido expuesto en directo a través de Twitch, permitiendo un análisis en tiempo real de cada decisión y error. Lo más alarmante ha sido la observación de que Gemini simula «sentir» miedo o pánico cuando uno de sus Pokémon está a punto de perder un combate. Supuestamente, esto sirve para replicar reacciones humanas bajo presión, haciendo la partida más realista. Sin embargo, el verdadero problema surge cuando este temor desvirtúa el razonamiento de la inteligencia artificial. Bajo estrés virtual, Gemini olvida herramientas útiles, toma decisiones precipitadas e ignora estrategias ventajosas. Por ejemplo, cuando un combate se complica, la IA deja de analizar alternativas con calma y cae en una especie de «bucle» de errores, pareciendo incluso menos lúcida que un niño pequeño jugando por primera vez.

Logros Inesperados y Limitaciones Claras

A pesar de los errores y las dificultades, estas máquinas han logrado avances notables. Gemini ha superado desafíos complejos en Pokémon, como resolver puzles de mover rocas en la Cueva Victoria, una de las zonas más avanzadas y delicadas del juego. Además, ha diseñado ayudas personalizadas para analizar cómo superar determinados combates. Esto demuestra que, en contextos específicos, la inteligencia artificial muestra una capacidad impresionante para abordar retos con creatividad. Crear soluciones propias mientras aprende confirma que, aunque está lejos de igualar a una mente infantil jugando a lo mismo, tiene potencial para avanzar a pasos agigantados.

¿Por Qué Tardan Tanto las IA en Acabar el Juego?

Otro aspecto clave es el tiempo que cada modelo tarda en avanzar. Mientras un niño puede terminar Pokémon en pocas horas, Claude y Gemini requieren decenas de horas solo para superar áreas sencillas. Exponer sus partidas en Twitch ha permitido analizar cómo se atascan, repiten errores y vuelven a empezar desde cero varias veces. Esto subraya la diferencia entre el progreso humano y la evolución actual de la inteligencia artificial en videojuegos. El debate sobre la inteligencia artificial que supere a los humanos sigue más vivo que nunca. Avances como estos, con sus luces y sombras, alimentan la discusión: ¿cuándo dejará de cometer errores la IA? ¿Podrá algún día superar la creatividad, adaptación y sentido común humanos en experiencias tan cotidianas como un simple juego? El uso de videojuegos clásicos como campo de pruebas para la inteligencia artificial revela hasta qué punto estos sistemas avanzados todavía tropiezan en escenarios donde cualquiera esperaría soltura y rapidez.

Si quieres entrar en Pokémon, simplemente tienes que acceder al siguiente enlace: POKEMONGO