Contate-nos

DeepSeek: a revolução da IA que você não esperava

Richard Bownes
Chief Data Scientist
Default person placeholder image: minimalist white circular icon resembling a person

fevereiro 10, 2025

Sabemos que as notícias sobre o DeepSeek estão mudando rapidamente. Atualizaremos este artigo periodicamente para trazer a você as últimas notícias e percepções.

A DeepSeek, uma empresa com acesso limitado a GPUs e operando sob embargo, enfrentou as principais concorrentes de IA e surgiu como uma séria competidora, graças aos recentes lançamentos de seus modelos V3 e R1. Por uma fração do custo e com muito menos recursos, conseguiram criar um modelo que está ampliando os limites do que é possível em termos de IA.  

Mas o DeepSeek-R1 não é apenas um avanço, é um alerta para todo o setor de IA. Esqueça a velha narrativa de que é preciso uma infraestrutura maciça e bilhões em custos de computação para fazer um progresso real. O DeepSeek está reescrevendo as regras, provando que não são necessários grandes centros de dados para criar uma IA que desafie gigantes como OpenAI, Meta e Anthropic 

Mais barato. Mais rápido. Mais inteligente. O DeepSeek mudou o mundo da tecnologia? Ao que tudo indica, sim. 

Quebrando barreiras com recursos limitados

Quando pensamos em modelos de IA SOTA (State of the Art), provavelmente imaginamos enormes clusters de GPUs que consomem milhões de dólares em eletricidade. No entanto, o DeepSeek-R1 mostra um cenário (muito) diferente. Com um orçamento de apenas US$ 6 milhões, a DeepSeek conseguiu criar um modelo que está a um passo de alcançar os melhores modelos de raciocínio do mercado.  

Não se trata apenas de economizar dinheiro, mas de tornar a IA mais avançada disponível para todos, independentemente de sua capacidade de computação. Em um mundo em que as limitações de hardware geralmente ditam quem entra no jogo da IA, o sucesso do DeepSeek mostra que a engenhosidade ainda pode triunfar.  

O poder da pesquisa progressiva

O que é mais impressionante no sucesso do DeepSeek é a pesquisa que o sustenta; não estamos diante de um sucesso isolado, mas sim do resultado de anos de trabalho árduo e polinização cruzada dentro da comunidade de IA.  

A abordagem do DeepSeek integra os principais avanços em IA: aprendizado por reforço, mistura de instruções de especialistas (MoE) e cadeia de pensamento (CoT), juntamente com computação em tempo de teste. Também se baseia em pesquisas sobre políticas de treinamento, como a otimização de políticas proximais (PPO) e a otimização de preferências diretas (DPO), para desenvolver a otimização de políticas relativas a grupos (GRPO), o mais recente avanço em algoritmos de aprendizagem por reforço para o treinamento de grandes modelos de linguagem (LLMs). O GRPO é o componente crucial que permitiu ao modelo aprender autoverificação e busca na fase de pré-treinamento. 

Embora muitos desses conceitos não sejam novos, o que a DeepSeek fez foi desenvolver e consolidar essas inovações para alcançar uma imensa eficiência, chegando ao ponto de escrever seu próprio código PTX, dispensando assim o CUDA da NVIDIA para otimizar cada parte do processo de treinamento do modelo. E, como abriram o código-fonte de toda a arquitetura, esse trabalho fundamental está agora disponível para quem quiser aproveitá-lo. Não se trata apenas de um modelo, mas de um precursor para a próxima onda de desenvolvimento de IA. 

Ciência Aberta, Código Aberto

Ao disponibilizar seus modelos e sua metodologia para todos, o DeepSeek abriu as portas para que qualquer pessoa, desde pesquisadores até startups, use essas ferramentas e as aprimore. Essa medida ecoa o que plataformas como a HuggingFace fizeram para obter acessibilidade aos modelos e ajuda a criar um pipeline orientado pela comunidade que acelera o desenvolvimento e a velocidade de iteração. Independentemente do fato de empresas como a OpenAI ou a Meta prestarem muita atenção ao sucesso do DeepSeek e até mesmo se beneficiarem dele, é a subida de uma maré científica que elevará todos os barcos.  

Impacto nos negócios e considerações estratégicas

O DeepSeek mostrou que a IA de alto desempenho não está mais limitada àqueles com os orçamentos mais generosos. Para as empresas, talvez seja hora de repensar os custos de infraestrutura de IA, os relacionamentos com fornecedores e as estratégias de implementação. Ao adotar modelos mais eficientes, as organizações podem melhorar sua lucratividade e acelerar a inovação, reduzindo a dependência de sistemas de TI caros e enormes e a dependência de fornecedores 

À medida que a IA se tornar mais acessível, o cenário competitivo mudará e as empresas precisarão se concentrar não apenas em ter acesso a essa tecnologia, mas em como implementá-la.   

No longo prazo, o foco deixará de ser o poder computacional bruto e passará a ser a capacidade de executar a IA de forma eficaz, tornando-a um diferencial competitivo fundamental. As empresas que se adaptarem serão aquelas que conseguirem pensar de forma criativa, reduzir as barreiras operacionais e de implementação e promover uma cultura que adote essas mudanças 

Também estamos diante do potencial de uma IA mais personalizada. muito tempo, modelos de linguagem pequenos fazem parte da conversa devido ao seu potencial de serem treinados com eficiência em conjuntos de dados menores, hospedados a custos mais baixos e adaptados a casos de uso específicos. A próxima etapa dessa revolução da IA poderia combinar o enorme poder dos grandes modelos SOTA com a capacidade de serem ajustados ou treinados novamente para aplicações específicas de forma econômica. Isso cria uma vantagem competitiva não pelo acesso à tecnologia, mas pelo uso personalizado de tecnologias alinhadas verticalmente. 

Navegando em constante mudança

Na Valtech, combinamos uma profunda experiência em IA com abordagens estratégicas personalizadas e as melhores estruturas de vários modelos da categoria, que ajudam as empresas a liberar valor, independentemente da velocidade com que o mundo muda. Entre em contato conosco e vamos começar

DESBLOQUEIE SEU POTENCIAL

Insights que impulsionam a ação 

 

  • Esqueça os grandes orçamentos e tenha sucesso com a inovação: A corrida da IA não se trata apenas de grandes investimentos. As empresas que se concentram na solução criativa de problemas e na otimização de recursos podem dar um grande salto.  
  • Pegue carona nas ondas da transformação: A mudança não acontece gradualmente, mas em ondas maciças e disruptivas. Uma atitude flexível e curiosa ajudará as empresas a se manterem à frente da curva e a transformarem a agitação em oportunidade.   
  • Liberte-se dos gargalos da IA: agregue valor, impulsione a inovação e escape do aprisionamento ao fornecedor adotando estruturas de vários modelos mais inteligentes e flexíveis. O futuro pertence àqueles que repensam a infraestrutura e dimensionam a IA em seus próprios termos. 

Contate-nos