/
DeepSeek 4: tudo o que você precisa saber sobre o modelo de IA mais ambicioso do DeepSeek até agora
Last Updated:
Apr 19, 2026

DeepSeek 4: tudo o que você precisa saber sobre o modelo de IA mais ambicioso do DeepSeek até agora

Última atualização: 19 de abril de 2026

O laboratório chinês de IA DeepSeek está se preparando para lançar seu modelo de IA mais poderoso até agora. Espera-se que o DeepSeek V4 redefina as tabelas de classificação de código aberto, superando o GPT-5.5 da OpenAI e o Claude Opus 4.7 da Anthropic em benchmarks de codificação.

Continue lendo para saber tudo o que sabemos até agora sobre o modelo, os últimos vazamentos e onde você poderá acessá-lo assim que estiver disponível.

Para obter mais informações sobre quando o modelo será lançado, consulte nosso artigo dedicado sobre Data de lançamento do DeepSeek V4.

Entre na lista de espera no Overchat AI para ser notificado no momento em que o DeepSeek V4 for lançado.

TLDR

  • DeepSeek Versão 4 é o próximo modelo principal do laboratório chinês de IA DeepSeek, que deve ser o modelo de IA de código aberto mais capaz já lançado.
  • Arquitetura híbrida. O V4 combina raciocínio e não raciocínio em um único modelo, retirando a divisão entre V3.X e R1 e provavelmente encerrando totalmente a linha R2.
  • 1 trilhão de parâmetros. Aproximadamente 37 bilhões de ativos por token por meio de uma mistura de especialistas, mantendo os custos de inferência próximos aos de um modelo de médio porte.
  • Janela de contexto de mais de 1 milhão de tokens, habilitado pelo DeepSeek Sparse Attention (DSA). Para comparação, o Claude Opus 4.7 é 200K.
  • Novos métodos de memória e treinamento. Memória condicional de engramas para recuperação de contexto quase infinita, além de hiperconexões restritas por múltiplos (MHC) para treinamento estável de trilhões de parâmetros.
  • Primeiro modelo de fronteira em silício chinês. A inferência será executada no Ascend 950PR da Huawei por meio da estrutura CANN Next compatível com CUDA, o primeiro grande modelo de IA otimizado explicitamente fora da Nvidia.
  • Vazou 83,7% no SWE-Bench Verified — não verificado, mas se necessário, o V4 seria o melhor modelo de codificação do mundo.
  • Versão de código aberto sob uma licença permissiva do Apache 2.0, é esperado, com pesos disponíveis via Hugging Face.
  • Sem IA de Overchat. Você pode usar o DeepSeek V3.2 hoje, e o V4 será adicionado assim que estiver disponível. Entre na lista de espera para ser notificado quando a V4 for lançada.

Atualizações mais recentes

16 de abril de 2026. O CEO da Nvidia, Jensen Huang, alertou no Dwarkesh Podcast que otimizou o V4 da DeepSeek para rodar em chips Huawei em vez de hardware americano seria “um resultado horrível” para os Estados Unidos. O comentário confirma o quão estrategicamente importante esse lançamento se tornou.

4 de abril de 2026. A Reuters confirmou — citando The Information — que o V4 fará uma inferência sobre o novo processador Ascend 950PR da Huawei. Segundo consta, o treinamento ainda aconteceu nos chips Nvidia Blackwell. Alibaba, ByteDance e Tencent fizeram pedidos em massa de centenas de milhares de chips Ascend 950PR em preparação, e os preços dos chips subiram cerca de 20% em semanas.

1 de abril de 2026. Os supostos benchmarks V4 vazaram no X por meio da conta @bridgemindai, alegando 83,7% no SWE-Bench Verified, 88,4% no IMO Answer Bench e 23,5% no FrontierMath Tier 4. As notas da comunidade sinalizaram uma pontuação AIME 2026 de 99,4% como impossível no sistema de pontuação oficial, portanto, tratam o vazamento completo como não verificado e provavelmente parcialmente fabricado. O número do SWE-Bench reapareceu em várias fontes secundárias e é o ponto de dados único mais plausível.

9 de março de 2026. Um “V4 Lite” não anunciado (também conhecido como Sealion-lite, com parâmetros de ~200B) apareceu silenciosamente na plataforma DeepSeek. Os desenvolvedores que testaram relataram uma melhoria de 30% na velocidade de inferência em relação à V3.2 e 94% de recuperação de contexto em 128 mil tokens. Isso valida efetivamente a arquitetura V4 principal antes do lançamento completo do carro-chefe.

Entre na lista de espera no Overchat AI para ser notificado no momento em que a V4 for lançada.

O que é o DeepSeek 4?

Sobre o DeepSeek V4. O DeepSeek V4 é a primeira atualização com números inteiros da empresa de IA com sede em Hangzhou desde que o DeepSeek V3 foi lançado em dezembro de 2024. É o próximo modelo principal, usado por quase um milhão de pessoas por mês somente na plataforma oficial do chatbot.

O modelo. O DeepSeek construiu uma reputação como um modelo de codificação altamente capaz, otimizado para raciocínio e tarefas complexas. O V4 continua essa herança — principalmente um modelo de codificação e programação; provavelmente se destacará em trabalhos lógicos e práticos, em vez de Escrita em IA.

Arquitetura híbrida. O V4 é um modelo híbrido que suporta tarefas de raciocínio e não raciocínio. Isso significa que a distinção entre R1 e V3.X está desaparecendo e DeepSeek R2 provavelmente não está chegando.

Escala. Os números vazados colocam o V4 em aproximadamente 1 trilhão de parâmetros totais, com cerca de 37 bilhões ativos por token por meio da arquitetura Mixture-of-Experts. Isso mantém os custos de inferência próximos a um modelo de 37B, ao mesmo tempo em que dá ao V4 a capacidade de um sistema de trilhões de parâmetros.

Principais características do DeepSeek V4

Hiperconexões com restrições múltiplas (MHC). Em 1º de janeiro de 2026, a DeepSeek publicou um artigo de pesquisa em parceria com o fundador Liang Wenfeng descrevendo um novo método de treinamento. A abordagem muda de forma que as informações fluem pelas camadas do modelo e permite um melhor desempenho sem custos computacionais adicionais significativos. Ele também aborda a instabilidade do gradiente na escala de trilhões de parâmetros, o que historicamente tornou os grandes modelos de MoE não confiáveis para treinar.

Sistema de memória Engram. Postada em 13 de janeiro de 2026, essa tecnologia de memória condicional permite que o modelo retenha e recupere informações seletivamente com base no contexto. Na prática, o modelo consome contexto muito mais lentamente e permanece preciso em documentos, bases de código e bate-papos mais longos. Os primeiros testes do V4 Lite relatam 94% de recuperação de contexto em 128 mil tokens, em comparação com cerca de 45% da V3.2 com o mesmo tamanho.

Atenção esparsa do DeepSeek (DSA). Permite que as janelas de contexto excedam um milhão de tokens. Para comparação, o Claude Opus 4.7 tem uma janela de 200.000 tokens. Essa é uma das maiores janelas de contexto em qualquer modelo disponível publicamente.

Arquitetura mista de especialistas (MoE). Continuando com a V3, o modelo ativa apenas uma fração de seus parâmetros totais por solicitação, melhorando drasticamente a eficiência.

Caminho de hardware do Huawei Ascend 950PR. O V4 é o primeiro modelo de IA de fronteira explicitamente otimizado para o silício doméstico chinês. A inferência será executada no Ascend 950PR da Huawei por meio da estrutura de computação heterogênea CANN Next, que é compatível com CUDA. Isso é importante estrategicamente porque é o primeiro modelo de fronteira que prova que um sistema de IA competitivo pode funcionar sem o hardware da Nvidia em produção.

Quem criou o DeepSeek?

A DeepSeek foi fundada em julho de 2023 por Liang Wenfeng, um empresário de 40 anos que também foi cofundador do fundo de hedge quantitativo High-Flyer.

Liang estudou na Universidade de Zhejiang, obtendo diplomas em engenharia eletrônica da informação e engenharia de comunicação. Em 2015, ele cofundou a High-Flyer com colegas de classe. O fundo de hedge depende de modelos matemáticos e de IA para decisões de negociação e ultrapassou 100 bilhões de yuans (cerca de 14 bilhões de dólares) em ativos até 2021.

A DeepSeek opera como subsidiária da High-Flyer, que continua sendo sua única financiadora. Liang deteve uma participação de 84%. A empresa adota uma abordagem de contratação incomum: recrutando principalmente em universidades chinesas, geralmente contratando recém-formados e buscando talentos com formação não relacionada à ciência da computação, incluindo poesia e matemática avançada.

Liang afirmou que o objetivo da empresa não é obter lucros rápidos, mas promover a IA em direção à inteligência artificial geral.

Quão bom será o DeepSeek V4?

Os benchmarks vazados. Em 1º de abril de 2026, supostos benchmarks V4 surgiram no X, reivindicando os seguintes números no SWE-Bench Verified:

  • DeepSeek V4:83,7%
  • GPT-5.2 Alto: 80,0%
  • Pensamento de Kimi K2.5:76,8%
  • Gemini 3.0 Pro: 76,2%
  • Pensamento do DeepSeek V3.2:73,1%

Se for preciso, isso tornaria o V4 o melhor modelo de codificação do mundo. No entanto, o mesmo vazamento também reivindicou uma pontuação AIME 2026 de 99,4%, o que é matematicamente impossível no sistema de pontuação oficial (o máximo alcançável é 99,2% ou 100%). As notas da comunidade sinalizaram a imagem como provavelmente falsa. Trate o número de 83,7% do SWE-Bench como uma afirmação não verificada, não como uma referência confirmada.

Contexto sobre benchmarks internos. Fontes que falaram com o The Information disseram que o V4 supera os modelos Claude e GPT nos testes internos do DeepSeek. Os testes internos sempre devem ser tratados com cautela, mas o DeepSeek tem um histórico de subestimar, em vez de exagerar, seus lançamentos. Quando o DeepSeek R1 foi lançado em janeiro de 2025, ele combinava com os modelos da OpenAI em matemática e raciocínio, embora supostamente custasse apenas 6 milhões de dólares para treinar.

Leia mais sobre DeepSeek vs ChatGPT.

Qual é a data de lançamento do DeepSeek 4?

O DeepSeek tem como alvo um lançamento em torno de meados de fevereiro de 2026, que provavelmente coincidirá com as celebrações do Ano Novo Lunar em 17 de fevereiro.

Se for verdade, esse seria o mesmo momento do lançamento do R1 da DeepSeek em 20 de janeiro de 2025, pouco antes do feriado do Ano Novo Lunar de uma semana na China. Esse lançamento provocou uma venda de $1 trilhão em ações de tecnologia, incluindo $600 bilhões somente da Nvidia.

No entanto, o DeepSeek se recusou a confirmar oficialmente a data de lançamento.

Onde acessar o DeepSeek V4

IA para Overchat

IA para Overchat é uma plataforma tudo-em-um que fornece acesso a vários modelos de IA, incluindo o DeepSeek. Atualmente, você pode acessar o DeepSeek V3.2 on-line ou por meio de aplicativos móveis para iOS e Android, com um nível gratuito de 50 mensagens por mês. A versão V4 será adicionada ao IA do Overchat assim que estiver disponível. Entre na lista de espera para ser notificado quando a V4 for lançada.

Plataformas oficiais do DeepSeek

  • DeepSeek Chat: chatbot gratuito baseado na web
  • API DeepSeek: preços de pagamento por uso, significativamente mais baratos que os concorrentes
  • Aplicativos móveis para iOS e Android

Acesso ao código aberto

Espera-se que o DeepSeek lance o V4 como um modelo aberto sob uma licença permissiva do Apache 2.0. Você pode baixar pesos do Hugging Face, executar localmente usando ferramentas como Ollama ou vLLM, hospedar automaticamente em plataformas de nuvem e fazer configurações para casos de uso específicos. Devido à eficiência do MoE e à quantização do INT8/INT4, a V4 deve ser executada em hardware de consumo, como RTX 4090s duplo ou um único RTX 5090.

Quais são as melhores alternativas ao DeepSeek V4?

Aqui estão os modelos de IA com os quais se espera que o V4 compita em benchmarks:

  • Cláusula Opus 4.7: O mais recente carro-chefe da Anthropic. Familiarizado pelo raciocínio sólido e pelo processamento de longo contexto.
  • GPT-5,5: O carro-chefe atual da OpenAI, amplamente usado para escrever, codificar e analisar aplicativos corporativos e de consumo.
  • Gêmeos 3.0: O modelo multimodal mais recente do Google com profunda integração de ecossistemas.
  • Kimi K2.5: O carro-chefe da Moonshot AI, o concorrente chinês mais próximo do V4 em benchmarks de codificação.

PERGUNTAS FREQUENTES

O uso do DeepSeek V4 é gratuito?

Sim — a interface do chatbot provavelmente permanecerá gratuita. O acesso à API é pago por uso, mas significativamente mais barato do que os concorrentes. Se lançado como código aberto, você também pode executá-lo localmente gratuitamente.

O DeepSeek V4 funcionará fora da China?

Sim. Com base no padrão estabelecido pelo DeepSeek como V3 e V3.2, esperamos que o acesso internacional à API por meio de api.deepseek.com continue. Isso não foi confirmado oficialmente para o V4, e vale a pena monitorar o contexto geopolítico em torno das exportações de chips entre EUA e China.

O DeepSeek é seguro de usar?

Sim. Você já deve ter ouvido falar que o aplicativo do DeepSeek foi banido em alguns países por questões de privacidade. Isso é principalmente político, impulsionado pela origem chinesa da empresa. O DeepSeek é usado por mais de 1 milhão de pessoas mensalmente, e muitos usuários dizem que é o melhor modelo de IA disponível hoje.

Conclusão

Se os rumores forem verdadeiros, o DeepSeek V4 será o melhor modelo de codificação de IA até agora. Aqui está um breve resumo das coisas mais importantes que você precisa saber sobre o próximo lançamento.

Principais conclusões

  • DeepSeek Versão 4 é o próximo modelo de IA de código aberto emblemático do laboratório chinês de IA DeepSeek, que deve ser o modelo de código aberto mais capaz já lançado.
  • Salto arquitetônico. Raciocínio híbrido, 1 trilhão de parâmetros totais (~ 37 B ativos), mais de 1 milhão de contexto de token e novos métodos de treinamento (MHC, Engram, DSA).
  • Huawei Ascend 950PR. O V4 é o primeiro modelo de IA de fronteira que executa inferência de produção no silício chinês, a um grande passo da Nvidia.
  • Vazou 83,7% no SWE-Bench Verified. Não verificado, mas consistente com o histórico de lançamentos silenciosos do DeepSeek que superam as expectativas.
  • Sem IA de Overchat. O DeepSeek V3.2 está disponível hoje e o V4 será adicionado no momento em que for lançado. Entre na lista de espera.

Para saber mais sobre o cronograma, leia nosso artigo completo sobre Data de lançamento do DeepSeek V4.