El momento de la IA

28 de enero de 2025

Si has escuchado de un tal deepseek que va a destruir a OpenIA pero ni entiendes ni madres o que supone todo este ruido que hay respecto a la IA, aquí un resumen de lo que ha pasado y por qué es tan importante todo esto.

El 20 de diciembre pasado OpenIA presentó su modelo o3, el primer modelo que “razona” antes de darte una respuesta. o3 estará disponible en marzo de este año. Fue todo un boom por las capacidades que tiene y todo las cosas increíbles que se pueden hacer con este modelo. Todo mundo emocionado por lo que se viene. En general se presentó como un cambio de paradigma.

Tan solo 6 días después, aparece de la nada una empresa china llamada Deepseek que presenta su modelo Deepseek v3, la principal novedad fue que el costo de su entrenamiento fue bastante barato y de un rendimiento a la par o superior en comparación a los modelos GPT 4o de OpenIA y 3.5 Sonnet de Claude. Además, mostraron un paper donde explican como lo hicieron, que lograron y en general que metodología siguieron. Ah y se me olvidaba, es open source con licencia MIT, que para efectos prácticos, permite tomarlo, modificarlo y comercializarlo.

Hasta aquí todo tranquilo, hubo un poco de ruido entre los nerds de la comunidad, pero hasta ahí.

La magia ocurrió el pasado 20 de enero, Deepseek libera su nuevo modelo razonador: R1.

Aquí fue donde empezó el desmadre, por varias razones:

Solo un mes después de presentar V3, presentan un modelo razonador, R1.
R1 tiene un rendimiento similar a o3.
Es open source y el modelo esta libre para que cualquiera lo pueda descargar y usar, incluso comercializar (igual que V3).
El costo de entrenar R1 fue de 5M USD vs los más de 100M USD que gastó OpenIA.
Liberaron un paper donde explican como funciona el modelo razonador, cosa que hasta ese momento era secreto de estado. Al final, la comunidad nerd descubrió que su funcionamiento no era tan sofisticado como creían.
El precio del API es un 95% más barato que los modelos cerrados (OpenIA, Claude).
Y como cereza del pastel, lo liberaron el día de la toma de posesión de Trump.

No sé si estes dimensionando lo anterior, pero cambió absolutamente todo el juego.

Para poder tener servicios como el de chatgpt, son necesarias inmensas cantidades de tarjetas gráficas y datacenters para procesar toodo eso, ahora podrías ejecutar el modelo en una computadora de mucha menor capacidad. No es que puedas ejecutar el modelo completo en tu compu, pero si abarata un montón el hardware necesario para correr esto.

Es por esto que para Nvidia (proveedora de la mayoría de los chips de IA del mundo) y hasta hace unos días la compañía mas valiosa del mundo, se vuelve una situación complicada, hace unos años dejaron de enfocarse en el gaming y pivotaron a IA. Ahora que todo mundo se dio cuenta que ya no necesitas tanto procesamiento, su negocio se ve amenazado. No digo que vaya a desaparecer, se van a seguir utilizando sus chips para IA pero si antes necesitabas 100 tarjetas gráficas, ahora necesitas solo 10. Hay tanto pánico que en las últimas horas sus acciones han bajado un 20% , algo histórico, esto es el equivalente a perder un aproximado de 400,000 millones de dólares.

Mismo caso para las eléctricas, si pensaban que iban a hacer su agosto con la IA, pues nada, toca reajustar.

Tema inversionistas, que pasa si durante los últimos años te han dicho que necesitan miles de millones de dólares para desarrollar IA, que porque es un muy caro entrenarla, que los datacenters, que mucha gráfica. De pronto llega una empresa china y te dice “naaambre, dame 5 millones y con eso la armamos”, bueno, ya te imaginaras como esta el asunto.

Por otro lado, hay mucho escepticismo acerca del rendimiento de Deepseek, los detractores están buscando si realmente hace lo que dice o hay mentiras y verdades a medias. Veremos si hay trampa o simplemente están en etapa de negación.

Mas allá de lo que pase con las empresas, la realidad es que esto le conviene a casi todos. R1 al ser open source, las empresas privadas van a copiar características y se van a abaratar costos. La IA cada vez será mas accesible para todos.

Apenas es 42 de enero (nomas no se acaba pinche mes) y esto de la IA se ha movido bastante, que buen pinche momento para estar vivos y ver estas cosas.

—R