Contáctanos

DeepSeek: La revolución de la IA que no viste venir

Richard Bownes
Chief Data Scientist
Default person placeholder image: minimalist white circular icon resembling a person

10 febrero, 2025

Sabemos que las noticias sobre DeepSeek están cambiando rápidamente y actualizaremos este artículo periódicamente para brindarte las últimas novedades y los insights más recientes.

DeepSeek, una empresa con acceso limitado a las GPUs y con operación bajo embargo, le ha hecho frente a los actores principales de la IA y ha emergido como un serio competidor, gracias a los recientes lanzamientos de sus modelos V3 y R1. Por una fracción del costo y con muchos menos recursos, han logrado crear un modelo que está ampliando los límites de lo que es posible en términos de IA. 

Pero DeepSeek-R1 no es solo un gran avance, es un llamado de atención para toda la industria de la IA. Olvídate de la vieja narrativa que afirma que se necesita una infraestructura masiva y miles de millones en costes de computación para lograr un progreso real. DeepSeek está reescribiendo las reglas, demostrando que no se necesitan centros de datos masivos para crear una IA que desafíe a gigantes como OpenAI, Meta y Anthropic. 

Más barata. Más rápida. Más inteligente. ¿DeepSeek ha cambiado el mundo de la tecnología? Todo indica que sí. 

Rompiendo barreras con recursos limitados

Cuando pensamos en modelos de IA SOTA (State of the Art), probablemente imaginamos enormes clústeres de GPUs que consumen millones de dólares en electricidad. Sin embargo, DeepSeek-R1 nos muestra un panorama (muy) diferente. Con un presupuesto de solo 6 millones de dólares, DeepSeek ha conseguido construir un modelo que está a un paso de alcanzar a los mejores modelos de razonamiento del mercado. 

No se trata solo de ahorrar dinero, sino de poner a la IA más avanzada al alcance de todas las personas, independientemente de su capacidad informática. En un mundo en el que las limitaciones de hardware suelen establecer quién entra en el juego de la IA, el éxito de DeepSeek demuestra que el ingenio aún puede triunfar.  

El poder de la investigación progresiva

Lo más impresionante del éxito de DeepSeek es la investigación que la sustenta; no estamos ante un acierto aislado, sino que estamos observando el resultado de años de trabajo duro y de polinización cruzada dentro de la comunidad de la IA. 

El enfoque de DeepSeek integra los principales avances de la IA: aprendizaje por refuerzo, mezcla de expertos (MoE) e instrucciones de cadena de pensamiento (CoT), junto con cálculo en tiempo de prueba. También se basa en la investigación sobre políticas de entrenamiento, tales como la optimización de políticas proximales (PPO) y la optimización de preferencia directa (DPO), para desarrollar la optimización de políticas relativas de grupo (GRPO), el último avance en algoritmos de aprendizaje por refuerzo para el entrenamiento de grandes modelos de lenguaje (LLMs). GRPO es el componente crucial que le permitió al modelo aprender autoverificación y búsqueda en la fase de preentrenamiento. 

Aunque muchos de estos conceptos no son una novedad, lo que DeepSeek ha hecho es desarrollar y consolidar estas innovaciones para alcanzar una eficiencia inmensa, llegando incluso a escribir su propio código PTX, prescindiendo así de CUDA de NVIDIA para optimizar cada parte del proceso de entrenamiento de sus modelos. Y como han abierto el código de toda la arquitectura, este trabajo fundacional ahora está disponible para que lo aproveche quien quiera. No se trata solo de un modelo, sino de la antesala de bienvenida para la próxima ola de desarrollo de la IA. 

Ciencia abierta, código abierto

Al hacer que sus modelos y metodología estén disponibles para todos, DeepSeek ha abierto la puerta a que cualquier persona, desde investigadores hasta startups, pueda utilizar estas herramientas y mejorarlas. Este movimiento se hace eco de lo que plataformas como HuggingFace han hecho para ganar accesibilidad en los modelos y ayuda a crear un canal impulsado por la comunidad que acelera el desarrollo y la velocidad de iteración. No importa que empresas como OpenAI o Meta presten mucha atención al éxito de DeepSeek y que incluso se beneficien de él, se trata de la creciente de una marea científica que elevará a todos los barcos. 

Impacto empresarial y consideraciones estratégicas

DeepSeek ha demostrado que la IA de alto rendimiento ya no está limitada a quienes cuentan con los presupuestos más generosos. Para las empresas, podría haber llegado el momento de replantearse los costes de la infraestructura de IA, las relaciones con los proveedores y las estrategias de despliegue. Al adoptar modelos más eficientes, las organizaciones pueden mejorar su rentabilidad y acelerar la innovación, mientras que reducen la dependencia de costosos sistemas informáticos masivos y el bloqueo de proveedores. 

A medida que la IA sea más accesible, el panorama competitivo cambiará y las empresas no solo deberán centrarse en tener acceso a esta tecnología, sino en cómo implementarla.  

A largo plazo, la atención se desplazará de la potencia computacional bruta a la capacidad de ejecutar la IA con eficacia, convirtiéndola en un diferenciador competitivo clave. Las empresas que se adapten serán las que logren pensar de forma creativa, reducir las barreras operativas y de implantación, y fomentar una cultura que integre estos cambios. 

También estamos ante el potencial de una IA más personalizada. Los modelos de lenguaje pequeños han formado parte de la conversación durante mucho tiempo debido a su potencial para ser entrenados eficientemente en conjuntos de datos más pequeños, alojados a costes más bajos y adaptados a casos de uso específicos. El siguiente paso en esta revolución de la IA podría combinar la enorme potencia de los grandes modelos SOTA con la capacidad de ser ajustados o reentrenados para aplicaciones específicas de una manera eficiente en cuanto a precio. Esto crea una ventaja competitiva no a través del acceso a la tecnología, sino a través del uso a medida de tecnologías alineadas verticalmente. 

Navegando por el cambio constante

En Valtech, combinamos una profunda experiencia en IA con enfoques estratégicos a medida y los mejores marcos de trabajo multi-modelos que ayudan a las empresas a liberar valor, independientemente de la rapidez con la que cambie el mundo. ¿Quieres convertir tu potencial de IA en acción? Ponte en contacto con nosotros y comencemos. 

DESBLOQUEA TU POTENCIAL

Insights que impulsan la acción 

 

  • Olvídate de los grandes presupuestos y triunfa con innovación: La carrera de la IA no es solo cuestión de grandes inversiones. Las empresas que se enfoquen en la resolución creativa de problemas y en la optimización de recursos pueden dar un gran salto hacia adelante. 
  • Súbete a las olas de transformación: El cambio no se produce gradualmente, sino en oleadas masivas y disruptivas. Una actitud flexible y curiosa ayudará a las empresas a mantenerse a la vanguardia y convertir la agitación en oportunidad.  
  • Libérate de los cuellos de botella de la IA: Añade valor, impulsa la innovación y escapa de la dependencia de los proveedores adoptando marcos de trabajo multi-modelo más inteligentes y flexibles. El futuro pertenece a quienes se replantean la infraestructura y escalan la IA a su propia medida. 

Contáctanos

Reinventemos el futuro