Kimi K2.5: o modelo de código aberto que rivaliza com os gigantes

A Moonshot AI lançou o Kimi K2.5 — seu modelo de IA mais poderoso até hoje. Foi o primeiro modelo de inteligência artificial de código aberto a competir de igual para igual com gigantes como o GPT-5.5 e o Claude Opus 4.8 em vários benchmarks — por uma fração do custo.

‍

O modelo já está disponível no Overchat AI, e você pode começar a conversar com o Kimi K2.5 aqui.

‍

Então, o que torna esse modelo da Moonshot AI tão excepcional? Ele combina uma capacidade muito forte de entender imagens e vídeos, um modo de agente de ponta e um desempenho de primeira linha em programação e escrita criativa. Isso faz dele a oferta mais completa do mercado. Continue lendo para conferir todos os detalhes.

TLDR

O Kimi K2.5 é o modelo de pesos abertos principal da Moonshot AI (lançado em 27 de janeiro de 2026), construído sobre uma arquitetura mixture-of-experts de 1 trilhão de parâmetros com apenas 32B ativos por requisição — o que o torna rápido e preciso.
Inclui o MoonViT, um codificador de visão de 400M de parâmetros que lida tão bem com imagens e vídeos que consegue reproduzir mockups de design com precisão de pixel.
Quatro configurações: K2.5 Instant (rápido), K2.5 Thinking (problemas complexos), K2.5 Agent (uso de ferramentas externas) e K2.5 Agent Swarm (beta) — que pode orquestrar até 100 subagentes ao mesmo tempo para um ganho de velocidade de 4,5x em tarefas grandes.
vs Claude Opus 4.8: o Kimi K2.5 é competitivo em benchmarks de agentes e custa cerca de 4x menos, mas o Opus 4.8, mais novo da Anthropic, abriu vantagem clara em programação pura (SWE-Bench Verified de 88,6% contra 76,8%).
vs GPT-5.5: o modelo principal atual da OpenAI leva ligeira vantagem em matemática pura e programação, mas o Kimi vence em fluxos de trabalho com agentes por cerca de 8%, e por uma fração do preço.
vs Gemini 3 Pro: no papel, o Gemini lidera em raciocínio científico e compreensão de vídeo, embora, na prática, a diferença seja difícil de perceber.
vs DeepSeek V3.2: o Kimi domina em todos os benchmarks — o que levanta a questão de como o DeepSeek 4 vai responder.
Preço de API: US$ 0,60 de entrada com cache miss (US$ 0,10 a US$ 0,30 com cache hit) e US$ 2,50 a US$ 3,00 de saída por milhão de tokens — cerca de metade do GPT-5.5 e um quarto do Claude Opus 4.8.
Janela de contexto de 256K tokens, API compatível com OpenAI para integração fácil, e disponível no Overchat AI, no Kimi.com, no app do Kimi para celular e via Moonshot + Together AI + Fireworks.
É open source sob uma Licença MIT Modificada, então você pode rodá-lo localmente se tiver um hardware potente o suficiente.

‍

O que é o Kimi K2.5?

O Kimi K2.5 é o modelo de código aberto principal da Moonshot AI. Ele foi lançado em 27 de janeiro de 2026, e a Moonshot o posiciona como uma alternativa ao GPT-5.5 e ao Claude Opus 4.8.

‍

Ele é construído sobre uma arquitetura mixture-of-experts com 1 trilhão de parâmetros no total, embora apenas 32 bilhões sejam ativados por requisição. Como resultado, o modelo é ao mesmo tempo muito rápido e muito preciso.

‍

Quando o testamos, sentimos que seu desempenho ficava perto do dos modelos Opus da Anthropic em tarefas do dia a dia, uma impressão reforçada pelos benchmarks (embora o Opus 4.8, mais novo da Anthropic, tenha aberto vantagem clara em programação desde então). Vamos discutir isso em mais detalhes adiante. Ele levou cerca de metade do tempo para produzir uma resposta.

‍

Outro recurso de destaque do Kimi K2.5 é sua capacidade de entender imagens e vídeos com precisão. Ele conta com um codificador de visão de 400 milhões de parâmetros chamado MoonViT, responsável especificamente por interpretar imagens e vídeos. O que isso significa na prática?

‍

Por exemplo, forneça um mockup de design como captura de tela e ele o reproduzirá com precisão de pixel.

‍

O modelo vem em várias configurações:

‍

K2.5 Instant — para respostas mais rápidas
K2.5 Thinking — para problemas complexos
K2.5 Agent — quando você usa ferramentas externas
K2.5 Agent Swarm (Beta) — para rodar até 100 agentes trabalhando em tarefas grandes ao mesmo tempo

‍

O modo Agent Swarm é único — nunca vimos recursos assim fora de soluções corporativas sob medida. Mas como ele funciona na prática? O Kimi K2.5 pode direcionar até 100 subagentes de forma independente, cada um trabalhando em uma tarefa separada. Segundo a Moonshot, isso acelera o modelo em 4,5x em comparação a quando apenas uma IA está trabalhando.

‍

É um pouco decepcionante que o ganho de velocidade não seja linear, ou seja, que não o torne 100 vezes mais rápido, mas ainda assim é impressionante.

‍

Benchmarks do Kimi K2.5

O desempenho em benchmarks não conta a história toda, mas esses números mostram onde o K2.5 se posiciona entre os modelos de fronteira.

‍

Benchmarks principais

‍

Benchmark	Kimi K2.5
HLE (with tools)	50.2%
BrowseComp	74.9%
AIME 2025	96.1%
GPQA Diamond	87.6%
SWE-Bench Verified	76.8%
LiveCodeBench v6	85.0%

‍

Benchmarks de visão

‍

Benchmark	Kimi K2.5
MMMU Pro	78.5%
MathVision	84.2%
VideoMMMU	86.6%

‍

Kimi K2.5 vs outros modelos de IA

Agora, vamos dar uma olhada em como o Kimi K2.5 se compara a outros modelos, incluindo tanto produtos proprietários de ponta quanto concorrentes de código aberto.

‍

Kimi K2.5 vs Claude Opus 4.8

‍

Benchmark	Kimi K2.5	Claude Opus 4.8	Winner
HLE (with tools)	50.2%	~45%	Kimi K2.5
SWE-Bench Verified	76.8%	88.6%	Claude Opus 4.8
BrowseComp	74.9%	~24%	Kimi K2.5
Benchmark Run Cost	$0.27	$1.14	Kimi K2.5

‍

O Kimi K2.5 ainda vence aqui nos testes de agentes e de custo, e custa muito menos para rodar — embora, em programação pura (SWE-Bench Verified), o novo Claude Opus 4.8 tenha aberto vantagem clara. Falaremos mais sobre custo adiante.

‍

Kimi K2.5 vs ChatGPT (GPT-5.5)

‍

Benchmark	Kimi K2.5	GPT-5.5	Winner
SWE-Bench Verified	76.8%	88.7%	GPT-5.5
HLE (with tools)	50.2%	~42%	Kimi K2.5

‍

Os resultados são mais variados: o GPT-5.5 vai melhor em programação e em matemática pura, mas o K2.5 se sai melhor em tarefas complexas, especialmente no que diz respeito a agentes — e por uma fração do preço.

‍

Kimi K2.5 vs Gemini 3 Pro

‍

Benchmark	Kimi K2.5	Gemini 3 Pro	Winner
GPQA Diamond	87.6%	91.9%	Gemini 3 Pro
VideoMMMU	86.6%	87.6%	Gemini 3 Pro

‍

Os testes mostram que o Gemini 3 Pro supera o K2.5 em raciocínio científico e compreensão de vídeo, apesar de a arquitetura do Kimi ter sido projetada especificamente para entender mídia visual. Isso é interessante, mas não achamos que o Gemini seja mais preciso na prática.

‍

Kimi K2.5 vs DeepSeek V3.2

‍

Benchmark	Kimi K2.5	DeepSeek V3.2	Winner
HLE (with tools)	50.2%	~46%	Kimi K2.5
SWE-Bench Verified	76.8%	~75%	Kimi K2.5

‍

O Kimi K2.5 arrasa o DeepSeek V3.2 em todos os testes. Dito isso, fica a pergunta: quando o DeepSeek 4 for lançado, será que ele vai superar o Kimi 2.5?

‍

Preços do Kimi K2.5

Em termos de preço, o Kimi K2.5 é um dos modelos mais econômicos em relação ao seu desempenho. De modo geral, só os modelos de código fechado atuam em um nível comparável, e esses custam de duas a quatro vezes mais para rodar.

‍

Preços da API

‍

Entrada (cache miss): US$ 0,60
Entrada (cache hit): US$ 0,10 a US$ 0,30
Saída: US$ 2,50 a US$ 3,00

‍

Para contextualizar, rodar um conjunto completo de benchmarks no Kimi K2.5 custa cerca de 4x menos do que no Claude Opus 4.8 e quase metade do GPT-5.5.

‍

Onde acessar o Kimi K2.5

Uma das formas mais rápidas de experimentar o Kimi K2.5 é no Overchat AI. Você pode começar a conversar com o modelo agora mesmo:

‍

👉 Converse com o Kimi K2.5 no Overchat AI

‍

Kimi.com e o app do Kimi

O Kimi K2.5 também está disponível no Kimi[.]com e no app do Kimi para celular, com quatro modos: K2.5 Instant, K2.5 Thinking, K2.5 Agent e K2.5 Agent Swarm (Beta). No momento, o Agent Swarm está disponível para usuários pagantes de planos mais altos.

‍

Para desenvolvedores

Os desenvolvedores podem acessar o Kimi K2.5 pela API da Moonshot ou por provedores terceiros como Together AI e Fireworks. A API é compatível com OpenAI, então você pode encaixá-la em fluxos de trabalho existentes com alterações mínimas. A janela de contexto é de 256K tokens.

‍

Conclusão

O Kimi K2.5 é o modelo de pesos abertos mais forte disponível para tarefas com agentes. Ele alcançou o estado da arte global no Humanity's Last Exam e no BrowseComp, e empatou com modelos proprietários em benchmarks de programação. A capacidade de enxame de agentes — 100 subagentes rodando 1.500 chamadas de ferramentas ao mesmo tempo — é algo que nenhum outro modelo oferece.

‍

👉 Comece a conversar com o Kimi K2.5

‍

Perguntas frequentes

‍

O que é o Kimi K2.5?

O Kimi K2.5 é o modelo de pesos abertos principal da Moonshot AI, lançado em 27 de janeiro de 2026. Ele traz uma arquitetura mixture-of-experts de 1 trilhão de parâmetros (32B ativos), multimodalidade nativa com compreensão de imagem e vídeo, e um sistema de enxame de agentes capaz de orquestrar até 100 subagentes. Ele atinge pontuações de estado da arte em benchmarks de agentes como HLE (50,2%) e BrowseComp (74,9%).

‍

Qual é a data de lançamento do Kimi K2.5?

O Kimi K2.5 foi lançado oficialmente em 27 de janeiro de 2026, embora alguns usuários tenham relatado que o modelo foi disponibilizado discretamente no Kimi.com alguns dias antes, com recursos aprimorados de verificação de fatos e de visão.

‍

O que é melhor: Kimi K2.5 ou Claude Opus 4.8?

Depende do caso de uso. O Kimi K2.5 se mantém firme contra o Claude em benchmarks de agentes, mas, para programação pura, o Opus 4.8, mais novo da Anthropic, está claramente à frente (SWE-Bench Verified: 88,6% contra 76,8%). Dito isso, o Kimi K2.5 também custa cerca de 4x menos.

‍

O que é melhor: Kimi K2.5 ou GPT-5.5?

O GPT-5.5, da OpenAI, leva vantagem em matemática pura e programação (SWE-Bench Verified: 88,7% contra 76,8%). Para fluxos de trabalho com agentes, o cenário é bem diferente: o Kimi K2.5 vence por uma margem de cerca de 8%, o que é significativo. E, de novo, custa uma fração do GPT-5.5.

‍

Onde posso acessar o Kimi K2.5?

Você pode acessar o Kimi K2.5 no Overchat AI agora mesmo. Ele também está disponível no Kimi.com, no app do Kimi para celular e pela API da Moonshot, para desenvolvedores.

‍

O Kimi K2.5 é gratuito?

Sim, você pode experimentar o Kimi K2.5 de graça no Overchat AI. Ele também oferece acesso gratuito no Kimi[.]com, com uso limitado. Além disso, por ser um modelo de código aberto sob uma Licença MIT Modificada, você pode rodá-lo localmente — mas vai precisar de um hardware muito bom para colocá-lo no ar.