O que é o Kimi K2.5?
O Kimi K2.5 é o principal modelo de código aberto da Moonshot AI. Foi lançado em 27 de janeiro de 2026 e o Moonshot o posiciona como uma alternativa ao GPT-5,2 e Cláusula Opus 4.5.
Ele é construído em uma arquitetura mista de especialistas com um total de 1 trilhão de parâmetros, embora apenas 32 bilhões sejam ativados por solicitação. Como resultado, o modelo é muito rápido e preciso.
Quando o testamos, parecia que seu desempenho estava no mesmo nível do Claude Opus 4.5, uma visão reforçada pelos benchmarks. Discutiremos isso com mais detalhes posteriormente. Demorou cerca de metade do tempo para produzir uma resposta.
Outro recurso de destaque do Kimi K2.5 é sua capacidade de entender imagens e vídeos com precisão. Ele possui um codificador de visão de 400 milhões de parâmetros chamado MoonVit, que é especificamente responsável pela interpretação de imagens e vídeos. O que isso significa na prática?
Por exemplo, forneça uma maquete de design como captura de tela e ela a produzirá com especificações perfeitas em pixels.
O modelo vem em várias configurações:
- K2.5 Instantâneo — para respostas mais rápidas
- Pensamento K2.5 — para problemas complexos
- Agente K2.5 — quando você usa ferramentas externas
- Enxame de agentes K2.5 (beta) — executar até 100 agentes trabalhando em grandes tarefas simultaneamente
O modo Agent Swarm é único — nunca vimos recursos como esse fora das soluções corporativas personalizadas. Mas como isso funciona na prática? O Kimi K2.5 pode direcionar até 100 subagentes de forma independente, cada um trabalhando em uma tarefa separada. De acordo com o Moonshot, isso acelera o modelo em 4,5x em comparação com quando apenas uma IA está funcionando.
É um pouco decepcionante que o aumento de velocidade não seja linear, ou seja, tornando-o 100 vezes mais rápido, mas isso ainda é impressionante.
Benchmarks do Kimi K2.5
O desempenho de referência não conta toda a história, mas esses números estabelecem onde o K2.5 está entre os modelos de fronteira.
Principais benchmarks
| Benchmark |
Kimi K2.5 |
| HLE (with tools) |
50.2% |
| BrowseComp |
74.9% |
| AIME 2025 |
96.1% |
| GPQA Diamond |
87.6% |
| SWE-Bench Verified |
76.8% |
| LiveCodeBench v6 |
85.0% |
Benchmarks de visão
| Benchmark |
Kimi K2.5 |
| MMMU Pro |
78.5% |
| MathVision |
84.2% |
| VideoMMMU |
86.6% |
Kimi K2.5 vs outros modelos de IA
Agora, vamos dar uma olhada em como o Kimi K2.5 se compara a outros modelos, incluindo produtos emblemáticos proprietários e concorrentes de código aberto.
Kimi K2.5 vs Claude Opus 4.5
| Benchmark |
Kimi K2.5 |
Claude Opus 4.5 |
Winner |
| HLE (with tools) |
50.2% |
~45% |
Kimi K2.5 |
| SWE-Bench Verified |
76.8% |
80.9% |
Claude Opus 4.5 |
| BrowseComp |
74.9% |
~24% |
Kimi K2.5 |
| Benchmark Run Cost |
$0.27 |
$1.14 |
Kimi K2.5 |
O Kimi K2.5 realmente supera o Claude Opus 4.5 na maioria dos testes! Embora custe muito menos para ser executado, falaremos mais sobre isso mais tarde.
Kimi K2.5 x ChatGPT (GPT-5.2)
| Benchmark |
Kimi K2.5 |
GPT-5.2 xhigh |
Winner |
| AIME 2025 |
96.1% |
100% |
GPT-5.2 |
| HLE (with tools) |
50.2% |
~42% |
Kimi K2.5 |
| LiveCodeBench v6 |
85.0% |
87.0% |
GPT-5.2 |
| Benchmark Run Cost |
$0.27 |
$0.48 |
Kimi K2.5 |
Os resultados são mais mistos: o GPT-5.2 tem melhor desempenho em matemática, mas o K2.5 tem melhor desempenho em tarefas complexas, especialmente em relação aos agentes. No entanto, estamos dividindo os cabelos aqui.
Kimi K2.5 vs Gemini 3 Pro
| Benchmark |
Kimi K2.5 |
Gemini 3 Pro |
Winner |
| GPQA Diamond |
87.6% |
91.9% |
Gemini 3 Pro |
| VideoMMMU |
86.6% |
87.6% |
Gemini 3 Pro |
Testes mostram que o Gêmeos 3 Pro supera o K2.5 em termos de raciocínio científico e compreensão de vídeo, apesar do fato de a arquitetura do Kimi ter sido projetada especificamente para entender a mídia visual. Isso é interessante, mas não achamos que Gêmeos seja mais preciso na prática.
Kimi K2.5 x DeepSeek V3.2
| Benchmark |
Kimi K2.5 |
DeepSeek V3.2 |
Winner |
| HLE (with tools) |
50.2% |
~46% |
Kimi K2.5 |
| SWE-Bench Verified |
76.8% |
~75% |
Kimi K2.5 |
O Kimi K2.5 supera o DeepSeek V3.2 em todos os testes. Com isso dito, é preciso se perguntar, quando DeepSeek 4 lançamentos, ele vencerá o Kimi 2.5?
Preços do Kimi K2.5
Em termos de preço, o Kimi K2.5 é um dos modelos mais econômicos em relação ao seu desempenho. De um modo geral, somente os modelos de código fechado funcionam em um nível comparável e custam de duas a quatro vezes mais para serem executados.
Preços da API
- Entrada (perda de cache): $0,60
- Entrada (cache atingido): $0,10 — $0,30
- Saída: $2,50 — $3,00
Para contextualizar, executar um pacote completo de benchmark no Kimi K2.5 custa aproximadamente 4 vezes menos do que o Claude Opus 4.5 e quase metade do GPT-5.2.
Onde acessar o Kimi K2.5
Uma das maneiras mais rápidas de experimentar o Kimi K2.5 é no Overchat AI. Você pode começar a conversar com a modelo agora mesmo:
👉 Converse com Kimi K2.5 no Overchat AI
Kimi.com e o aplicativo Kimi
O Kimi K2.5 também está disponível no Kimi [.] com e no aplicativo móvel Kimi, com quatro modos: K2.5 Instant, K2.5 Thinking, K2.5 Agent e K2.5 Agent Swarm (Beta). Atualmente, o Agent Swarm está disponível para usuários pagos de alto nível.
Para desenvolvedores
Os desenvolvedores podem acessar o Kimi K2.5 por meio da API Moonshot ou de fornecedores terceirizados, como Together AI e Fireworks. A API é compatível com OpenAI, então você pode trocá-la por fluxos de trabalho existentes com o mínimo de alterações. A janela de contexto é de 256 mil tokens.
Conclusão
O Kimi K2.5 é o modelo de pesos abertos mais forte disponível para tarefas de agente. Ela alcançou o SOTA global no Humanity's Last Exam e no BrowseComp e combinou modelos proprietários em benchmarks de codificação. A capacidade de enxame de agentes — 100 subagentes executando 1.500 chamadas de ferramentas ao mesmo tempo — é algo que nenhum outro modelo oferece.
👉 Comece a conversar com Kimi K2.5
Perguntas frequentes
O que é o Kimi K2.5?
O Kimi K2.5 é o principal modelo de pesos abertos da Moonshot AI, lançado em 27 de janeiro de 2026. Ele apresenta uma arquitetura de 1 trilhão de parâmetros com mistura de especialistas (32B ativos), multimodalidade nativa com compreensão de imagem e vídeo e um sistema de enxame de agentes que pode orquestrar até 100 subagentes. Ele alcança pontuações de última geração em benchmarks de agências como HLE (50,2%) e BrowseComp (74,9%).
Qual é a data de lançamento do Kimi K2.5?
O Kimi K2.5 foi lançado oficialmente em 27 de janeiro de 2026, embora alguns usuários tenham relatado que o modelo foi lançado silenciosamente no Kimi.com alguns dias antes, com recursos aprimorados de verificação de fatos e visão.
O que é melhor, Kimi K2.5 vs Claude Opus 4.5?
Depende do caso de uso. Por exemplo, o Kimi K2.5 supera o Claude Opus 4.5 em benchmarks de agentes, mas para codificação pura, Claude ainda obtém pontuações mais altas (verificado pelo SWE-Bench: 80,9% versus 76,8%). Dito isso, o Kimi K2.5 também custa cerca de 4x menos.
O que é melhor, Kimi K2.5 vs GPT-5.2?
O GPT-5.2 ainda é o melhor modelo de IA para matemática (ele pontua 100% no AIME 2025, Kimi pontua 96,1%). Para fluxos de trabalho agentes, a visão é bem diferente: o Kimi K2.5 vence por uma margem de 8%, o que é significativo. E, novamente, custa uma fração do GPT 5.2
Onde posso acessar o Kimi K2.5?
Você pode acesse Kimi K2.5 no Overchat AI agora mesmo. Também está disponível no Kimi.com, no aplicativo móvel Kimi, e por meio da API Moonshot para desenvolvedores.
Kimi K2.5 é gratuito?
Sim, você pode experimentar o Kimi K2.5 gratuitamente no Overchat AI. Ele também oferece acesso gratuito ao Kimi [.] com com uso limitado. Além disso, sendo um modelo de código aberto sob uma Licença MIT modificada, você pode executá-lo localmente, mas precisará de um hardware muito bom para iniciá-lo.