DeepSeek V4: tudo o que você precisa saber

Resumo

O DeepSeek V4 é o próximo modelo principal do laboratório chinês de IA DeepSeek e deve ser o modelo de IA de código aberto mais capaz já lançado.
Arquitetura híbrida. O V4 combina raciocínio e não raciocínio em um único modelo, eliminando a divisão entre o V3.X e o R1 e provavelmente encerrando de vez a linha R2.
1 trilhão de parâmetros. Cerca de 37 bilhões ativos por token via Mixture-of-Experts, mantendo os custos de inferência próximos aos de um modelo de porte médio.
Janela de contexto de mais de 1 milhão de tokens, viabilizada pelo DeepSeek Sparse Attention (DSA) — uma das maiores entre os modelos disponíveis publicamente.
Novos métodos de memória e treinamento. Memória condicional Engram para recuperação de contexto quase infinita, além das Manifold-Constrained Hyper-Connections (mHC) para um treinamento estável de modelos com trilhões de parâmetros.
Primeiro modelo de fronteira em chips chineses. A inferência vai rodar no Ascend 950PR da Huawei por meio do framework CANN Next, compatível com CUDA — o primeiro grande modelo de IA explicitamente otimizado fora da Nvidia.
Vazaram 83,7% no SWE-Bench Verified — sem verificação. Se o número se confirmar, seria forte, mas ainda ficaria atrás do líder verificado atual, o Claude Opus 4.8, com 88,6% no mesmo benchmark.
Lançamento de código aberto sob uma licença permissiva Apache 2.0 é o esperado, com os pesos disponíveis no Hugging Face.
Na Overchat AI. Você já pode usar o DeepSeek V3.2 hoje, e o V4 será adicionado assim que estiver disponível. Entre na lista de espera para ser avisado quando o V4 for lançado.

‍

Atualizações mais recentes

16 de abril de 2026. O CEO da Nvidia, Jensen Huang, alertou no Dwarkesh Podcast que o fato de a DeepSeek otimizar o V4 para rodar em chips da Huawei em vez de hardware americano seria "um resultado terrível" para os Estados Unidos. O comentário confirma o quanto esse lançamento se tornou estrategicamente importante.

‍

4 de abril de 2026. A Reuters confirmou — citando o The Information — que o V4 vai rodar a inferência no novo processador Ascend 950PR da Huawei. Segundo consta, o treinamento ainda foi feito em chips Nvidia Blackwell. Alibaba, ByteDance e Tencent fizeram pedidos em massa de centenas de milhares de chips Ascend 950PR como preparação, e os preços dos chips subiram cerca de 20% em poucas semanas.

‍

1 de abril de 2026. Supostos benchmarks do V4 vazaram no X pela conta @bridgemindai, alegando 83,7% no SWE-Bench Verified, 88,4% no IMO Answer Bench e 23,5% no FrontierMath Tier 4. As community notes apontaram que uma pontuação de 99,4% no AIME 2026 seria impossível no sistema de pontuação oficial, então trate o vazamento como um todo como não verificado e provavelmente em parte fabricado. O número do SWE-Bench reapareceu em várias fontes secundárias e é o ponto de dado isolado mais plausível.

‍

9 de março de 2026. Um "V4 Lite" não anunciado (também chamado de Sealion-lite, com cerca de 200 bilhões de parâmetros) apareceu discretamente na plataforma da DeepSeek. Desenvolvedores que o testaram relataram uma melhora de 30% na velocidade de inferência em relação ao V3.2 e 94% de recuperação de contexto em 128 mil tokens. Na prática, isso valida a arquitetura central do V4 antes do lançamento completo do modelo principal.

‍

Entre na lista de espera na Overchat AI para ser avisado no instante em que o V4 for lançado.

‍

O que é o DeepSeek 4?

Sobre o DeepSeek V4. O DeepSeek V4 é a primeira atualização de número inteiro da empresa de IA sediada em Hangzhou desde que o DeepSeek V3 foi lançado em dezembro de 2024. É o próximo modelo principal, usado por quase um milhão de pessoas por mês só na plataforma oficial do chatbot.

‍

O modelo. A DeepSeek construiu sua reputação como um modelo de programação altamente capaz, otimizado para raciocínio e tarefas complexas. O V4 dá continuidade a essa herança — sendo principalmente um modelo de programação e desenvolvimento, deve se sair melhor em lógica e trabalho prático do que em escrita com IA.

‍

Arquitetura híbrida. O V4 é um modelo híbrido que dá conta tanto de tarefas com raciocínio quanto sem raciocínio. Isso significa que a distinção entre o R1 e o V3.X está deixando de existir, e o DeepSeek R2 provavelmente nem vai mais sair.

‍

Escala. Os números vazados colocam o V4 em cerca de 1 trilhão de parâmetros no total, com aproximadamente 37 bilhões ativos por token via arquitetura Mixture-of-Experts. Isso mantém os custos de inferência próximos aos de um modelo de 37B, ao mesmo tempo em que dá ao V4 a capacidade de um sistema com trilhões de parâmetros.

‍

Principais recursos do DeepSeek V4

Manifold-Constrained Hyper-Connections (mHC). Em 1º de janeiro de 2026, a DeepSeek publicou um artigo de pesquisa coassinado pelo fundador Liang Wenfeng descrevendo um novo método de treinamento. A abordagem muda a forma como a informação flui pelas camadas do modelo e permite um desempenho melhor sem custo computacional adicional significativo. Ela também resolve a instabilidade de gradiente na escala de trilhões de parâmetros, que historicamente tornava os grandes modelos MoE pouco confiáveis de treinar.

‍

Sistema de memória Engram. Publicada em 13 de janeiro de 2026, essa tecnologia de memória condicional permite que o modelo retenha e recupere informações de forma seletiva conforme o contexto. Na prática, o modelo consome o contexto bem mais devagar e se mantém preciso ao longo de documentos, bases de código e conversas mais longas. Os primeiros testes do V4 Lite relatam 94% de recuperação de contexto em 128 mil tokens, contra cerca de 45% do V3.2 no mesmo tamanho.

‍

DeepSeek Sparse Attention (DSA). Permite que as janelas de contexto ultrapassem um milhão de tokens. Essa é uma das maiores janelas de contexto de qualquer modelo disponível publicamente.

‍

Arquitetura Mixture-of-Experts (MoE). Dando continuidade ao V3, o modelo ativa apenas uma fração do total de seus parâmetros a cada requisição, o que melhora drasticamente a eficiência.

‍

O caminho de hardware do Huawei Ascend 950PR. O V4 é o primeiro modelo de IA de fronteira explicitamente otimizado para chips de fabricação doméstica chinesa. A inferência vai rodar no Ascend 950PR da Huawei por meio do framework de computação heterogênea CANN Next, que é compatível com CUDA. Isso importa do ponto de vista estratégico porque é o primeiro modelo de fronteira a provar que um sistema de IA competitivo pode rodar sem hardware da Nvidia em produção.

‍

Quem criou o DeepSeek?

A DeepSeek foi fundada em julho de 2023 por Liang Wenfeng, um empreendedor de 40 anos que também foi cofundador do fundo de hedge quantitativo High-Flyer.

‍

Liang estudou na Universidade de Zhejiang, formando-se em engenharia eletrônica da informação e engenharia de comunicação. Em 2015, ele cofundou a High-Flyer com colegas de turma. O fundo de hedge depende de IA e de modelos matemáticos para tomar decisões de negociação e ultrapassou 100 bilhões de yuans (cerca de 14 bilhões de dólares) em ativos até 2021.

‍

A DeepSeek opera como uma subsidiária da High-Flyer, que continua sendo sua única financiadora. Liang detém uma participação de 84%. A empresa adota uma abordagem de contratação incomum: recruta principalmente em universidades chinesas, muitas vezes traz recém-formados e busca talentos com formação fora da ciência da computação, incluindo poesia e matemática avançada.

‍

Liang já afirmou que o objetivo da empresa não é o lucro rápido, mas sim fazer a IA avançar rumo à inteligência artificial geral.

‍

Quão bom o DeepSeek V4 vai ser?

Os benchmarks vazados. Em 1º de abril de 2026, supostos benchmarks do V4 surgiram no X alegando os seguintes números no SWE-Bench Verified:

‍

DeepSeek V4: 83,7%
GPT-5.2 High: 80,0%
Kimi K2.5 Thinking: 76,8%
Gemini 3.0 Pro: 76,2%
DeepSeek V3.2 Thinking: 73,1%

‍

Se for verdade, 83,7% seria uma pontuação forte — mas ainda ficaria atrás do líder verificado atual. O Claude Opus 4.8, lançado no fim de maio de 2026, está em 88,6% no SWE-bench Verified, então, mesmo tomando o número vazado ao pé da letra, o V4 não seria o melhor modelo de programação do mundo nesse benchmark. E o mesmo vazamento também alegava uma pontuação de 99,4% no AIME 2026, o que é matematicamente impossível no sistema de pontuação oficial (o máximo possível é 99,2% ou 100%). As community notes apontaram que a imagem é provavelmente falsa. Trate o número de 83,7% do SWE-Bench como uma alegação não verificada, e não como um benchmark confirmado.

‍

Contexto sobre os benchmarks internos. Fontes que conversaram com o The Information disseram que o V4 supera os modelos Claude e GPT nos testes internos da DeepSeek. Testes internos devem sempre ser encarados com cautela, mas a DeepSeek tem um histórico de subestimar, em vez de exagerar, seus lançamentos. Quando o DeepSeek R1 foi lançado em janeiro de 2025, ele empatou com os modelos da OpenAI em matemática e raciocínio, apesar de, segundo consta, ter custado apenas 6 milhões de dólares para ser treinado.

‍

Qual é a data de lançamento do DeepSeek 4?

A DeepSeek mira um lançamento por volta de meados de fevereiro de 2026, que provavelmente vai coincidir com as celebrações do Ano Novo Lunar em 17 de fevereiro.

‍

Se isso se confirmar, seria o mesmo momento do lançamento do R1 da DeepSeek, em 20 de janeiro de 2025, pouco antes do feriado de uma semana do Ano Novo Lunar na China. Aquele lançamento provocou uma queda de 1 trilhão de dólares nas ações de tecnologia, incluindo 600 bilhões de dólares só da Nvidia.

No entanto, a DeepSeek se recusou a confirmar oficialmente a data de lançamento.

‍

Onde acessar o DeepSeek V4

‍

Overchat AI

‍A Overchat AI é uma plataforma tudo-em-um que dá acesso a vários modelos de IA, incluindo o DeepSeek. No momento, você pode acessar o DeepSeek V3.2 pela web ou pelos apps para iOS e Android, com um plano gratuito de 50 mensagens por mês. O V4 será adicionado à Overchat AI assim que ficar disponível. Entre na lista de espera para ser avisado quando o V4 for lançado.

‍

Plataformas oficiais do DeepSeek

‍

DeepSeek Chat: chatbot gratuito baseado na web
API do DeepSeek: cobrança por uso, bem mais barata que a dos concorrentes
Apps para iOS e Android

‍

Acesso de código aberto

‍A expectativa é que a DeepSeek lance o V4 como um modelo de pesos abertos sob uma licença permissiva Apache 2.0. Você vai poder baixar os pesos do Hugging Face, rodar localmente com ferramentas como Ollama ou vLLM, hospedar por conta própria em plataformas de nuvem e fazer fine-tuning para casos de uso específicos. Por causa da eficiência do MoE e da quantização INT8/INT4, o V4 deve rodar em hardware de consumo, como duas RTX 4090 ou uma única RTX 5090.

‍

Quais são as melhores alternativas ao DeepSeek V4?

Veja os modelos de IA com os quais se espera que o V4 concorra em benchmarks:

‍

Claude Opus 4.8: o atual carro-chefe da Anthropic e o líder verificado em programação, com 88,6% no SWE-bench Verified. Conhecido pelo raciocínio sólido e pelo processamento de contextos longos.
GPT-5.5: o carro-chefe atual da OpenAI, muito usado para escrita, programação e análise em aplicações de consumo e corporativas.
Gemini 3.1 Pro: o carro-chefe multimodal atual do Google, líder em raciocínio e análise de dados, com contexto de 1 milhão de tokens e integração profunda com seu ecossistema.

‍

Perguntas frequentes

‍

O DeepSeek V4 é gratuito para usar?

Sim — a interface do chatbot provavelmente vai continuar gratuita. O acesso à API é cobrado por uso, mas é bem mais barato que o dos concorrentes. Se for lançado como código aberto, você também poderá rodá-lo localmente de graça.

‍

O DeepSeek V4 vai funcionar fora da China?

Sim. Com base no padrão que a DeepSeek já estabeleceu com o V3 e o V3.2, a expectativa é que o acesso internacional à API por api.deepseek.com continue. Isso não foi confirmado oficialmente para o V4, e vale a pena ficar de olho no contexto geopolítico em torno das exportações de chips entre EUA e China.

‍

O DeepSeek é seguro de usar?

Sim. Você pode ter ouvido que o app do DeepSeek foi banido em alguns países por questões de privacidade. Isso é principalmente político, motivado pela origem chinesa da empresa. O DeepSeek é usado por mais de 1 milhão de pessoas por mês, e muitos usuários dizem que é o melhor modelo de IA disponível hoje.

‍

Conclusão

Se os rumores forem verdadeiros, o DeepSeek V4 será o melhor modelo de IA para programação até agora. Aqui vai um resumo rápido das coisas mais importantes que você precisa saber sobre o lançamento que está por vir.

‍

Principais pontos

O DeepSeek V4 é o próximo modelo principal de código aberto do laboratório chinês de IA DeepSeek e deve ser o modelo de código aberto mais capaz já lançado.
Salto de arquitetura. Raciocínio híbrido, 1 trilhão de parâmetros no total (~37B ativos), contexto de mais de 1 milhão de tokens e novos métodos de treinamento (mHC, Engram, DSA).
Huawei Ascend 950PR. O V4 é o primeiro modelo de IA de fronteira a rodar inferência em produção em chips chineses, um grande passo para longe da Nvidia.
Vazaram 83,7% no SWE-Bench Verified. Sem verificação, mas em linha com o histórico da DeepSeek de lançamentos discretos que superam as expectativas.
Na Overchat AI. O DeepSeek V3.2 já está disponível hoje, e o V4 será adicionado no instante em que for lançado. Entre na lista de espera.

‍

Para saber mais sobre o cronograma, leia nosso artigo completo sobre a data de lançamento do DeepSeek V4.