DeepSeek, un pinchazo al futuro de la inteligencia artificial

Suplementos

Código Fuente

Fundada a finales de 2023 en Hangzhou, China, DeepSeek era un nombre más en la interminable lista de empresas dedicadas a la inteligencia artificial generativa. Esta semana provocó un cambio de paradigma y pérdidas multimillonarias con su último modelo, el R1

Publicado: Miércoles 29 enero 2025 | 10:41:18 pm.

Autor:

Yurisander Guevara Zaila

guevara@juventudrebelde.cu

Cuando Jen-Hsun Huang se fue a dormir el pasado domingo por la noche, lo hizo como el presidente ejecutivo de la compañía tecnológica más valiosa del mundo: Nvidia. Pero al mediodía del lunes Huang no solo había perdido 20 000 millones de dólares, sino que la devaluación de su empresa era de 600 mil millones de dólares, la cifra más alta registrada en cualquier bolsa de valores en toda la historia. La razón: DeepSeek, una empresa china de inteligencia artificial (IA), que con su nuevo modelo, el R1, ha puesto al mundo tecnológico patas arriba.

Fundada a finales de 2023 por Liang Wenfeng en Hangzhou, China, DeepSeek era un nombre más en la interminable lista de empresas dedicadas a la inteligencia artificial generativa, tecnología que nos promete, y ya ofrece, soluciones que parecen sacadas de libros de ciencia ficción.

En 2024 presentó modelos, como V3, con ciertas limitaciones tecnológicas y hasta sesgos, lo cual no puso su nombre en el mapa. Pero con R1, un modelo de razonamiento profundo que, además, es de código abierto, le ha nacido en 2025 un serio competidor a OpenAI y su ChatGPT, a Gemini de Google y a Llama de Meta. Así de poderosa es esta herramienta.

Qué es Deepseek

DeepSeek es el nombre de la empresa detrás de esta innovadora tecnología. La firma china ha desarrollado un modelo de inteligencia artificial basado en grandes modelos de lenguaje (LLM, por sus siglas en inglés) que destacan por su accesibilidad, al ser de código abierto. Esta característica, poco común entre los principales actores del sector, permite a cualquier usuario analizar el funcionamiento interno de la IA, personalizarla y adaptarla a diversos escenarios, incluyendo usos comerciales. En contraste, modelos como ChatGPT de OpenAI o Perplexity AI mantienen un enfoque de código cerrado, restringiendo el acceso a su núcleo funcional y limitando las posibilidades de personalización.

El modelo DeepSeek V3, una de sus principales propuestas, es un ejemplo de eficiencia y rendimiento. Con solo 5,5 millones de dólares invertidos en su entrenamiento, logró superar en pruebas de programación y razonamiento a competidores como Llama 3.1 de Meta y GPT-4 o de OpenAI, cuya creación requirió inversiones significativamente mayores. Para ponerlo en perspectiva, entrenar GPT-4 costó aproximadamente 80 millones de dólares, un monto 14 veces superior al de DeepSeek V3, según datos de CNN.

Sin embargo, el verdadero punto de inflexión lo marca DeepSeek R1, un modelo especializado en razonamiento lógico. Ese modelo ha conseguido resultados sorprendentes en pruebas matemáticas como MATH-500, alcanzando una precisión del 97,3 por ciento, superando al 96,4 por ciento obtenido por modelos avanzados de OpenAI. El logro no solo coloca a DeepSeek en la élite tecnológica: rompe con el dominio occidental en el desarrollo de inteligencia artificial. Es la primera vez que un modelo chino de código abierto iguala, e incluso supera, a sus contrapartes occidentales en términos de rendimiento.

Cómo se diferencia

Al comparar DeepSeek con ChatGPT y Perplexity AI, emergen diferencias notables. ChatGPT, ampliamente reconocido por su capacidad de generar textos elaborados y adaptarse a diversas tonalidades y estilos, prioriza la versatilidad en la interacción. Perplexity, por su parte, destaca por su integración con búsquedas en internet, ofreciendo respuestas actualizadas con fuentes verificables. DeepSeek compensa estas diferencias con su enfoque de código abierto, su alto rendimiento en razonamiento lógico y matemático, y la posibilidad de ser implementado localmente sin necesidad de suscripciones o restricciones.

El desarrollo de DeepSeek también introduce innovaciones técnicas notables. A diferencia de otros modelos que dependen de grandes volúmenes de datos etiquetados, DeepSeek emplea aprendizaje por refuerzo puro. Este enfoque permite que el modelo aprenda de manera autónoma mediante prueba y error, desarrollando estrategias únicas y mejorando continuamente su capacidad de razonamiento. Una vez completado el entrenamiento inicial, el modelo es refinado con técnicas supervisadas, logrando una combinación óptima entre autonomía y precisión.

En términos de experiencia de usuario, DeepSeek ofrece una interfaz intuitiva que permite realizar preguntas en lenguaje natural y obtener respuestas claras y precisas. Su capacidad para manejar consultas complejas, junto con herramientas como el modo «DeepThink» para razonamientos más profundos, lo diferencia de otras alternativas. Además, su diseño de código abierto y su disponibilidad gratuita lo convierten en una opción atractiva para desarrolladores, investigadores y usuarios con necesidades específicas. Tiene, por ejemplo, una aplicación en Google Play que puedes descargar de manera gratuita, y no necesita de VPN, algo que, para Cuba, es muchas veces una condición que impone el bloqueo yanqui.

Una burbuja que explota

Desde hace tiempo se ha asegurado por expertos en economía que lo de la inteligencia artificial generativa es una burbuja económica a punto de explotar. DeepSeek parece ser la aguja en ese sentido. Que solo hayan tenido que invertir 5,6 millones de dólares para desarrollar el producto que hoy está en el mercado es un batazo en la nunca de las grandes tecnológicas.

Acaso por eso las acciones estadounidenses cayeron bruscamente el lunes último. La bolsa Nasdaq, de gran peso tecnológico, se desplomó un 3,1 por ciento y el S&P 500 cayó un 1,5 por ciento. El Dow, impulsado por empresas de atención médica y de consumo que podrían verse afectadas por la IA, subió 289 puntos, o alrededor de un 0,7 por ciento más. Las pérdidas bursátiles fueron mucho más profundas al comienzo del día.

Meta dijo la semana pasada que gastaría más de 65 000 millones de dólares este año en el desarrollo de la IA. Sam Altman, al frente de OpenAI, aseguró el año pasado que la industria de la IA necesitaría billones de dólares para respaldar el desarrollo de chips necesarios que alimentasen los centros de datos hambrientos de electricidad que ejecutan los complejos modelos del sector. Eso disparó las ventas de chips de Nvidia, por ejemplo.

Ahora Marc Andreessen, uno de los principales inversores en tecnología del mundo, calificó a DeepSeek en una publicación en X como «uno de los avances más asombrosos e impresionantes que he visto».

El sorprendente logro de una startup de IA relativamente desconocida se vuelve aún más impactante cuando se considera que Estados Unidos ha trabajado durante años para restringir el suministro de chips de IA de alta potencia a China, citando preocupaciones de «seguridad nacional». Eso significa que DeepSeek ha desarrollado su modelo de bajo costo en chips de IA de poca potencia. De ahí el desplome de las acciones bursátiles.

En perspectiva, Nvidia comenzó el lunes como la acción pública más valiosa del mercado (más de 3,4 billones de dólares) después de que sus acciones se duplicaran con creces en cada uno de los últimos dos años. Terminó el día en tercer lugar detrás de Apple y Microsoft.

Metay Alphabet, la empresa matriz de Google, también cayeron bruscamente. Los competidores de Nvidia: Marvell, Broadcom, Micron y TSMC, igualmente se desplomaron. Oracle, Vertiv, Constellation, NuScale y otras empresas de energía y centros de datos sufrieron lo suyo.

La noticia también provocó un gran cambio en las inversiones en empresas no tecnológicas en Wall Street.

Las empresas energéticas se han valorizado significativamente en los últimos años debido a las enormes cantidades de electricidad necesarias para alimentar los centros de datos de IA. Pero todas se desplomaron el lunes. Bitcoin y otras criptomonedas también cayeron.

Un logro, aunque sea asombroso, puede no ser suficiente para contrarrestar años de progreso en la IA. Y es poco probable que se produzca un cambio masivo de clientes a una startup china. Por lo tanto, la venta masiva del mercado puede ser un poco exagerada, o tal vez los inversores estaban buscando una excusa para vender, analizó CNN.

Lo cierto es que el tiempo dirá si la amenaza de DeepSeek es real: la carrera está en marcha en cuanto a qué tecnología funciona y cómo responderán y evolucionarán los grandes jugadores occidentales. Y por el momento la ballenita azul ha irrumpido con todo en el mundo de la IA.

Enviar por E-mail

Deje su comentario

Acepto los términos y condiciones

Normas

Los comentarios deben basarse en el respeto a los criterios.
No se admitirán ofensas, frases vulgares, ni palabras obscenas.
Nos reservamos el derecho de no publicar los que incumplan con las normas de este sitio.