Juventud Rebelde - Diario de la Juventud Cubana

Gemini 3 supera a ChatGPT y redefine el liderazgo en IA

Si somos honestos, Gemini 3 Pro humilla a ChatGPT 5.1. Sencillamente es mucho mejor. Este nuevo modelo supera a sus competidores en una variedad de pruebas de referencia clave y establece un nuevo techo ahora mismo inalcanzable para los demás

Autor:

Yurisander Guevara Zaila

El reciente lanzamiento de Gemini 3 Pro, marca el inicio de una nueva era en la inteligencia artificial generativa (IA). Google ha posicionado su modelo de lenguaje —que mantiene bloqueado para Cuba—, como el sistema de inteligencia artificial más avanzado del momento. Esto redefine la competencia global, sitúa a Google en un liderazgo tecnológico que no experimentaba en años y pone en serios aprietos a OpenAI y su producto estrella, ChatGPT.

El avance de la inteligencia artificial ocurre a diario. Hace dos años, Google comenzó con Gemini 1, un proyecto científico que resultó uno de los más ambiciosos para la empresa. Ahora, con la llegada de Gemini 3, Google demuestra su compromiso, poniendo la nueva versión a disposición de todos sus productos.

Si somos honestos, Gemini 3 Pro humilla a ChatGPT 5.1. Sencillamente es mucho mejor. Este nuevo modelo supera a sus competidores en una variedad de pruebas de referencia clave y establece un nuevo techo ahora mismo inalcanzable para los demás.

Según la documentación oficial, Gemini 3 Pro rompe la clasificación del LM Arena, superando su propio récord anterior por 50 puntos, una distancia que en el mundo de la IA es un abismo. Un análisis de Artificial Analysis, una empresa independiente que corre comparativas de rendimiento para medir el poder de los modelos, señala a Gemini 3 Pro como el nuevo líder en IA.

Solidez total 

El modelo demuestra una gran solidez en todos los aspectos. En el famoso «último examen de la humanidad», diseñado con preguntas complejas para hacer fallar a la IA, Gemini 3 logra un 37.5 por ciento de acierto, una cifra mucho mayor que el 26.5 por ciento de ChatGPT 5.1.

El modelo también exhibe rendimientos superiores a los de ChatGPT y Anthropic en 20 pruebas de referencia. Supera a otros modelos en más de una docena de evaluaciones que miden conocimientos técnicos, resolución de acertijos lógicos, problemas matemáticos y reconocimiento de imágenes.

El secreto detrás de Gemini 3.0 radica en la mejora del prentrenamiento y el posentrenamiento. Otro aspecto clave es su multimodalidad nativa real. El modelo no lee texto e imágenes por separado: puede «ver, escuchar, entender, razonar, pensar, codificar y tomar acción». Ahora es capaz de leer el ambiente y entiende la intención, los matices y el contexto profundo de video, audio y todo tipo de contenido.

En Gemini 3 el modo de pensamiento profundo permite razonar a nivel de doctorando universitario, según Google. Además, cuenta con una ventana de contexto de hasta un millón de tokens, lo que significa que puede analizar largos textos o grandes repositorios de código. Esta capacidad equivale a tener memoria a corto plazo para una conversación equivalente a un libro de 4 000 páginas.

Gemini 3 Pro demuestra una capacidad de entendimiento superior, incluso en tareas abstractas. Por ejemplo, en pruebas de razonamiento, resolvió correctamente el famoso problema de la mesa que cojea, mientras que ChatGPT 5.1 dio una respuesta incorrecta. En un problema matemático de integrales, ambos encontraron la solución correcta, pero Gemini 3 la generó cuatro veces más rápido.

El modelo tiene una solidez innegable en la programación. Los usuarios reportan que Gemini 3 resulta muy superior para la codificación y la creación de aplicaciones. El modelo resolvió con éxito un prompt muy exigente para programar el juego Snake en un hexágono rotatorio, e incorporó un entrenamiento de IA para que la serpiente aprenda a jugar. Además, supera a ChatGPT 5.1 en la creación de animaciones complejas.

Gemini 3 muestra una agudeza impresionante para no dejarse engañar por el sobrentrenamiento. Por ejemplo, detecta mensajes ocultos en imágenes que ChatGPT no percibe y es capaz de identificar imágenes con siete dedos en una mano, mientras que su rival identifica solo cinco.

Entretanto, el modo agente de Gemini identifica los requerimientos de cada tarea y ejecuta el proceso por pasos utilizando sus accesos a herramientas como Google Search, Workspace, GitHub y YouTube Music.

Integración y ecosistema de Google 

Google es la única empresa que lo tiene todo: la aplicación, los modelos y el hardware, nube incluida. Este ecosistema dota a la empresa de una infraestructura, chips y productos que permiten llevar la inteligencia artificial a miles de millones de usuarios.

La integración de Gemini 3 en el motor de búsqueda a través del Modo IA ocurrió desde el primer día. Esto significa que, para búsquedas complejas, la IA no solo responde con contexto, sino que genera interfaces visuales y experiencias dinámicas.

El modelo ha sido integrado además en todo el ecosistema de productividad de Google. Al pedirle a Gemini que cree una presentación, genera una versión que se abre directamente en Google Slide para edición. Eso representa un flujo de trabajo en el que el usuario puede investigar contenido, crear la presentación, generar video, ponerlo en una página web que crea Gemini y publicarlo, todo dentro del mismo ecosistema con un solo usuario y contraseña.

Preocupación en OpenAI 

La posición renovada de Google genera gran preocupación entre sus principales adversarios, especialmente en OpenAI. El propio Sam Altman, director ejecutivo esta última, alertó a su equipo sobre un «ambiente complicado durante un tiempo» por el progreso de Google.

Altman reconoció que la ventaja tecnológica de OpenAI sobre Google y Anthropic se reduce. Además, advirtió que estas dificultades pueden tener consecuencias existenciales para OpenAI, una empresa que aún no es rentable y requiere de financiación constante.

La verdadera preocupación de OpenAI no radica únicamente en el modelo de Google, sino en la amenaza de que la burbuja de inversión estalle antes de que complete su propia infraestructura. OpenAI depende completamente de Microsoft para los servidores, de NVIDIA para los chips y de inversores externos para la financiación.

Así, OpenAI se enfrenta a una carrera contrarreloj. Si la inversión se frena antes de que complete su infraestructura propia, seguirá atada a proveedores costosos y no podrá competir en costes con Google. Quedarse a medio camino resulta el peor escenario posible.

Fin de la frontera visual 

El lanzamiento de Gemini 3 potencia la utilización de productos relacionados, como Nano Banana Pro, una herramienta generadora de imágenes que contribuyó al rápido incremento de usuarios de Gemini, cuya base de usuarios mensuales alcanzó 650 millones. Nano Banana Pro salió al mismo tiempo que Gemini 3.

El nuevo generador de imágenes de Google borra la frontera entre realidad e IA, planteando un desafío sin precedentes. El resultado ha dejado a especialistas sin herramientas para diferenciar lo real de lo artificial. Nano Banana Pro elimina las señales que antes servían como pistas para identificar imágenes creadas por IA, como dedos mal formados o texturas irreales del cabello. La calidad de las imágenes que genera Nano Banana Pro es de 4K.

Google asegura que el sistema combina hasta 14 elementos visuales distintos en una sola composición coherente, mantiene la consistencia de hasta cinco personas en una escena y logra renderizar texto legible y preciso dentro de la imagen, una capacidad que antes fallaba en la IA. 

Este fenómeno amplifica la preocupación por la desinformación. El modelo extrae información en tiempo real a través de la búsqueda de Google, lo que le permite crear infografías y visualizaciones con contexto verosímil. La única forma de identificar estas imágenes depende de la propia compañía, ya que el software existente quedó obsoleto. Google implementó SynthID, una marca de agua digital invisible incrustada en los píxeles de cada imagen. Esta firma digital resulta imperceptible y no se altera sin destruir la imagen, lo que permite identificar el contenido como generado por IA incluso después de recortes o capturas de pantalla. Pero solo lo pueden hacer ellos. 
 

Comparte esta noticia

Enviar por E-mail

  • Los comentarios deben basarse en el respeto a los criterios.
  • No se admitirán ofensas, frases vulgares, ni palabras obscenas.
  • Nos reservamos el derecho de no publicar los que incumplan con las normas de este sitio.