/
Kimi K2.5 está agora no Overchat AI — o primeiro modelo de código aberto a vencer o Opus 4.5
Last Updated:
Jan 31, 2026

Kimi K2.5 está agora no Overchat AI — o primeiro modelo de código aberto a vencer o Opus 4.5

Inteligência artificial Moonshot lançou Kimi K2.5 — seu modelo de IA mais poderoso até hoje. É o primeiro modelo de inteligência artificial de código aberto a vencer gigantes como o GPT-5.2 e o Claude Opus 4.5 em muitos benchmarks — por uma fração do custo.

O modelo já está ativo no Overchat AI, e você pode comece a conversar com Kimi K2.5 aqui.

Então, o que torna esse modelo de IA do Moonshot tão excepcional? Ele combina uma capacidade muito forte de entender imagens e vídeos, um modo de agente de ponta e o melhor desempenho da categoria em codificação e escrita criativa. Isso a torna a oferta mais completa do mercado. Continue lendo para saber todos os detalhes.

O que é o Kimi K2.5?

O Kimi K2.5 é o principal modelo de código aberto da Moonshot AI. Foi lançado em 27 de janeiro de 2026 e o Moonshot o posiciona como uma alternativa ao GPT-5,2 e Cláusula Opus 4.5.

Ele é construído em uma arquitetura mista de especialistas com um total de 1 trilhão de parâmetros, embora apenas 32 bilhões sejam ativados por solicitação. Como resultado, o modelo é muito rápido e preciso.

Quando o testamos, parecia que seu desempenho estava no mesmo nível do Claude Opus 4.5, uma visão reforçada pelos benchmarks. Discutiremos isso com mais detalhes posteriormente. Demorou cerca de metade do tempo para produzir uma resposta.

Outro recurso de destaque do Kimi K2.5 é sua capacidade de entender imagens e vídeos com precisão. Ele possui um codificador de visão de 400 milhões de parâmetros chamado MoonVit, que é especificamente responsável pela interpretação de imagens e vídeos. O que isso significa na prática?

Por exemplo, forneça uma maquete de design como captura de tela e ela a produzirá com especificações perfeitas em pixels.

O modelo vem em várias configurações:

  • K2.5 Instantâneo — para respostas mais rápidas
  • Pensamento K2.5 — para problemas complexos
  • Agente K2.5 — quando você usa ferramentas externas
  • Enxame de agentes K2.5 (beta) — executar até 100 agentes trabalhando em grandes tarefas simultaneamente

O modo Agent Swarm é único — nunca vimos recursos como esse fora das soluções corporativas personalizadas. Mas como isso funciona na prática? O Kimi K2.5 pode direcionar até 100 subagentes de forma independente, cada um trabalhando em uma tarefa separada. De acordo com o Moonshot, isso acelera o modelo em 4,5x em comparação com quando apenas uma IA está funcionando.

É um pouco decepcionante que o aumento de velocidade não seja linear, ou seja, tornando-o 100 vezes mais rápido, mas isso ainda é impressionante.

Benchmarks do Kimi K2.5

O desempenho de referência não conta toda a história, mas esses números estabelecem onde o K2.5 está entre os modelos de fronteira.

Principais benchmarks

Benchmark Kimi K2.5
HLE (with tools) 50.2%
BrowseComp 74.9%
AIME 2025 96.1%
GPQA Diamond 87.6%
SWE-Bench Verified 76.8%
LiveCodeBench v6 85.0%

Benchmarks de visão

Benchmark Kimi K2.5
MMMU Pro 78.5%
MathVision 84.2%
VideoMMMU 86.6%

Kimi K2.5 vs outros modelos de IA

Agora, vamos dar uma olhada em como o Kimi K2.5 se compara a outros modelos, incluindo produtos emblemáticos proprietários e concorrentes de código aberto.

Kimi K2.5 vs Claude Opus 4.5

Benchmark Kimi K2.5 Claude Opus 4.5 Winner
HLE (with tools) 50.2% ~45% Kimi K2.5
SWE-Bench Verified 76.8% 80.9% Claude Opus 4.5
BrowseComp 74.9% ~24% Kimi K2.5
Benchmark Run Cost $0.27 $1.14 Kimi K2.5

O Kimi K2.5 realmente supera o Claude Opus 4.5 na maioria dos testes! Embora custe muito menos para ser executado, falaremos mais sobre isso mais tarde.

Kimi K2.5 x ChatGPT (GPT-5.2)

Benchmark Kimi K2.5 GPT-5.2 xhigh Winner
AIME 2025 96.1% 100% GPT-5.2
HLE (with tools) 50.2% ~42% Kimi K2.5
LiveCodeBench v6 85.0% 87.0% GPT-5.2
Benchmark Run Cost $0.27 $0.48 Kimi K2.5

Os resultados são mais mistos: o GPT-5.2 tem melhor desempenho em matemática, mas o K2.5 tem melhor desempenho em tarefas complexas, especialmente em relação aos agentes. No entanto, estamos dividindo os cabelos aqui.

Kimi K2.5 vs Gemini 3 Pro

Benchmark Kimi K2.5 Gemini 3 Pro Winner
GPQA Diamond 87.6% 91.9% Gemini 3 Pro
VideoMMMU 86.6% 87.6% Gemini 3 Pro

Testes mostram que o Gêmeos 3 Pro supera o K2.5 em termos de raciocínio científico e compreensão de vídeo, apesar do fato de a arquitetura do Kimi ter sido projetada especificamente para entender a mídia visual. Isso é interessante, mas não achamos que Gêmeos seja mais preciso na prática.

Kimi K2.5 x DeepSeek V3.2

Benchmark Kimi K2.5 DeepSeek V3.2 Winner
HLE (with tools) 50.2% ~46% Kimi K2.5
SWE-Bench Verified 76.8% ~75% Kimi K2.5

O Kimi K2.5 supera o DeepSeek V3.2 em todos os testes. Com isso dito, é preciso se perguntar, quando DeepSeek 4 lançamentos, ele vencerá o Kimi 2.5?

Preços do Kimi K2.5

Em termos de preço, o Kimi K2.5 é um dos modelos mais econômicos em relação ao seu desempenho. De um modo geral, somente os modelos de código fechado funcionam em um nível comparável e custam de duas a quatro vezes mais para serem executados.

Preços da API

  • Entrada (perda de cache): $0,60
  • Entrada (cache atingido): $0,10 — $0,30
  • Saída: $2,50 — $3,00

Para contextualizar, executar um pacote completo de benchmark no Kimi K2.5 custa aproximadamente 4 vezes menos do que o Claude Opus 4.5 e quase metade do GPT-5.2.

Onde acessar o Kimi K2.5

Uma das maneiras mais rápidas de experimentar o Kimi K2.5 é no Overchat AI. Você pode começar a conversar com a modelo agora mesmo:

👉 Converse com Kimi K2.5 no Overchat AI

Kimi.com e o aplicativo Kimi

O Kimi K2.5 também está disponível no Kimi [.] com e no aplicativo móvel Kimi, com quatro modos: K2.5 Instant, K2.5 Thinking, K2.5 Agent e K2.5 Agent Swarm (Beta). Atualmente, o Agent Swarm está disponível para usuários pagos de alto nível.

Para desenvolvedores

Os desenvolvedores podem acessar o Kimi K2.5 por meio da API Moonshot ou de fornecedores terceirizados, como Together AI e Fireworks. A API é compatível com OpenAI, então você pode trocá-la por fluxos de trabalho existentes com o mínimo de alterações. A janela de contexto é de 256 mil tokens.

Conclusão

O Kimi K2.5 é o modelo de pesos abertos mais forte disponível para tarefas de agente. Ela alcançou o SOTA global no Humanity's Last Exam e no BrowseComp e combinou modelos proprietários em benchmarks de codificação. A capacidade de enxame de agentes — 100 subagentes executando 1.500 chamadas de ferramentas ao mesmo tempo — é algo que nenhum outro modelo oferece.

👉 Comece a conversar com Kimi K2.5

Perguntas frequentes

O que é o Kimi K2.5?

O Kimi K2.5 é o principal modelo de pesos abertos da Moonshot AI, lançado em 27 de janeiro de 2026. Ele apresenta uma arquitetura de 1 trilhão de parâmetros com mistura de especialistas (32B ativos), multimodalidade nativa com compreensão de imagem e vídeo e um sistema de enxame de agentes que pode orquestrar até 100 subagentes. Ele alcança pontuações de última geração em benchmarks de agências como HLE (50,2%) e BrowseComp (74,9%).

Qual é a data de lançamento do Kimi K2.5?

O Kimi K2.5 foi lançado oficialmente em 27 de janeiro de 2026, embora alguns usuários tenham relatado que o modelo foi lançado silenciosamente no Kimi.com alguns dias antes, com recursos aprimorados de verificação de fatos e visão.

O que é melhor, Kimi K2.5 vs Claude Opus 4.5?

Depende do caso de uso. Por exemplo, o Kimi K2.5 supera o Claude Opus 4.5 em benchmarks de agentes, mas para codificação pura, Claude ainda obtém pontuações mais altas (verificado pelo SWE-Bench: 80,9% versus 76,8%). Dito isso, o Kimi K2.5 também custa cerca de 4x menos.

O que é melhor, Kimi K2.5 vs GPT-5.2?

O GPT-5.2 ainda é o melhor modelo de IA para matemática (ele pontua 100% no AIME 2025, Kimi pontua 96,1%). Para fluxos de trabalho agentes, a visão é bem diferente: o Kimi K2.5 vence por uma margem de 8%, o que é significativo. E, novamente, custa uma fração do GPT 5.2

Onde posso acessar o Kimi K2.5?

Você pode acesse Kimi K2.5 no Overchat AI agora mesmo. Também está disponível no Kimi.com, no aplicativo móvel Kimi, e por meio da API Moonshot para desenvolvedores.

Kimi K2.5 é gratuito?

Sim, você pode experimentar o Kimi K2.5 gratuitamente no Overchat AI. Ele também oferece acesso gratuito ao Kimi [.] com com uso limitado. Além disso, sendo um modelo de código aberto sob uma Licença MIT modificada, você pode executá-lo localmente, mas precisará de um hardware muito bom para iniciá-lo.