MiniMax M3 vs Qwen 3.7 Max: comparação direta de qual é melhor
Last Updated:
2026-06-09
MiniMax M3 vs Qwen 3.7 Max: comparação direta de qual é melhor
Neste artigo, vamos comparar o MiniMax M3 e o Qwen 3.7 Max — dois modelos chineses criados por laboratórios diferentes, com arquiteturas diferentes e sob licenças diferentes — mas que, mesmo assim, são modelos mais baratos que prometem superar muitos dos principais modelos proprietários do Ocidente. Mas será que eles conseguem brigar acima do próprio peso?
Para responder a essa pergunta, vamos primeiro analisar os benchmarks publicados e, em seguida, colocar cada modelo à prova com um conjunto de prompts difíceis de programação, matemática e mais.
Os dois modelos podem ser testados na Overchat AI, que foi justamente onde rodamos os prompts do mundo real apresentados a seguir.
Se você preferir não ler a comparação completa, aqui está uma tabela resumindo os pontos principais:
Atributo
MiniMax M3
Qwen 3.7 Max
Melhor para
Implantação com pesos abertos, trabalho com contexto longo e multimodal, escrita natural
Trabalho com texto que exige muita matemática e raciocínio
Licença
Pesos abertos
Proprietária, apenas via API
Modalidade
Texto, imagem, vídeo
Apenas texto
Contexto
1M de tokens
1M de tokens
Lançamento
1 de junho de 2026
20 de maio de 2026
Preço (entrada/saída por 1M)
~US$ 0,60 / US$ 2,40
~US$ 2,50 / US$ 7,50
Recomendações rápidas por caso de uso:
Para programação: está acirrado. O Qwen 3.7 Max pontua mais alto nos benchmarks, mas, no nosso próprio teste, os dois modelos chegaram à mesma solução ideal e o MiniMax explicou melhor.
Para matemática: Qwen 3.7 Max. Ele apresenta os melhores números em matemática de competição entre todos os modelos chineses e também levou a melhor sobre o MiniMax no nosso teste de matemática.
Para escrita: MiniMax M3. Essa foi a diferença mais clara que observamos — sua prosa pareceu muito mais natural do que a do Qwen.
Para tarefas multimodais ou de contexto longo: MiniMax M3, o único dos dois que aceita entrada de imagem e vídeo.
Para hospedagem própria ou escala sensível a custos: MiniMax M3, que oferece pesos abertos e o menor preço por token.
Ao longo dos três testes práticos, preferimos usar o MiniMax M3 no geral. Ele venceu dois dos três e suas explicações foram consistentemente mais claras.
MiniMax M3 vs Qwen 3.7 Max em resumo
Antes de olhar para os benchmarks específicos, vamos primeiro entender o que são esses modelos e comparar suas especificações. Aqui está uma tabela com as informações mais importantes sobre cada um:
Especificação
MiniMax M3
Qwen 3.7 Max
Desenvolvedor
MiniMax (Shanghai Hixi Technology)
Alibaba (equipe Qwen)
Data de lançamento
1 de junho de 2026
20 de maio de 2026
Licença
Pesos abertos
Proprietária
Arquitetura
MiniMax Sparse Attention (MSA)
Modelo de raciocínio denso
Modalidade
Texto, imagem, vídeo
Texto
Janela de contexto
1M de tokens (512K garantidos)
1M de tokens
Modo de raciocínio
Ativável/desativável
Sempre ativo
SWE-Bench Pro
59,0% (informado pela fabricante)
Informado pela fabricante, veja os benchmarks
Preço de entrada (por 1M)
~US$ 0,60
~US$ 2,50
Preço de saída (por 1M)
~US$ 2,40
~US$ 7,50
Principais diferenças
Você provavelmente já notou, pela tabela acima, que existem 4 áreas em que esses modelos mais se diferenciam em termos de especificações:
Licença: o M3 tem pesos abertos, com os pesos publicados para hospedagem própria. O Qwen 3.7 Max é fechado e só pode ser acessado pela API da Alibaba.
Modalidade: o M3 aceita entrada de imagem e vídeo de forma nativa. O Qwen 3.7 Max trabalha apenas com texto.
Arquitetura: o M3 usa um design de atenção esparsa, criado para eficiência em contextos longos. O Qwen 3.7 Max é um modelo de raciocínio que executa seu processo de pensamento em cada requisição.
Preço: o M3 é cerca de quatro vezes mais barato nos tokens de entrada.
Para quem cada modelo é mais indicado
O MiniMax M3 é mais indicado para usuários que precisam hospedar o modelo por conta própria, ou para qualquer pessoa que queira enviar entradas de imagem ou vídeo. Ele também é o mais barato dos dois, o que o torna uma boa escolha para tarefas de alto volume, em que você espera consumir muitos tokens. Nos nossos testes, ele também se mostrou o melhor na escrita, então é uma boa pedida para trabalhos longos e criativos.
Já o Qwen 3.7 Max é mais adequado para tarefas que envolvem apenas texto e exigem do modelo uma capacidade de raciocínio considerável: problemas complexos de programação de backend, cálculos matemáticos avançados e análise de grandes bases de dados estatísticas.
O que é o MiniMax M3?
O MiniMax M3 é o principal modelo de linguagem lançado pelo laboratório de Xangai MiniMax em 1 de junho de 2026.
É o primeiro modelo de pesos abertos a oferecer, simultaneamente:
Desempenho de programação de nível de ponta
Uma janela de contexto de um milhão de tokens
Capacidade de processar imagens e vídeos de forma nativa
Arquitetura e abordagem de treinamento
O M3 é construído sobre um novo mecanismo de atenção que o laboratório chama de MiniMax Sparse Attention (MSA). A maioria dos modelos usa atenção densa, que fica muito mais cara à medida que a entrada aumenta. Esse custo é a principal razão pela qual janelas de contexto longas são difíceis de oferecer. A MSA foi projetada para lidar com entradas muito longas mantendo esse custo baixo.
A MiniMax afirma que isso torna o M3 muito mais rápido do que o seu modelo anterior, o M2, ao trabalhar com entradas muito longas. Isso também ajuda com um problema específico em tarefas longas. Conforme uma conversa cresce, um modelo normalmente precisa reprocessar cada vez mais texto a cada passo, e a MSA foi feita para reduzir essa sobrecarga.
Principais recursos
Vamos dar uma olhada nos principais recursos do MiniMax M3:
Programação. Esse é o recurso que a MiniMax coloca à frente. No SWE-Bench Pro — um benchmark que entrega ao modelo relatórios reais de bugs de projetos de código aberto e verifica se a correção dele passa nos testes do projeto — o M3 atinge 59 por cento. Isso é maior do que as pontuações que a MiniMax informa para o GPT-5.5 e o Gemini 3.1 Pro, e logo abaixo do Claude Opus 4.7, o que é uma companhia e tanto para um modelo de pesos abertos.
Entrada multimodal. O M3 consegue ler imagens e vídeo, e também consegue operar um computador desktop.
Contexto longo. Ele tem uma janela de contexto de 1M de tokens, com um mínimo garantido de 512K tokens. Isso é grande o suficiente para conter uma base de código inteira ou um documento longo em um único prompt.
Modo de raciocínio ativável. Você pode ligar ou desligar o raciocínio passo a passo dele em cada requisição, dependendo de a tarefa exigir isso ou não.
Preço e disponibilidade
Veja como está a situação de acesso ao M3 e quanto ele custa:
Licença: pesos abertos. A MiniMax planejava publicar os pesos do modelo e um relatório técnico no Hugging Face e no GitHub em cerca de dez dias após o lançamento, então você pode rodá-lo no seu próprio hardware.
API: já está no ar, a cerca de US$ 0,60 por milhão de tokens de entrada no comprimento de contexto padrão. Chamadas acima de 512K tokens custam mais.
Jeito mais fácil de testar: diretamente naOverchat AI, sem nenhuma configuração.
O que é o Qwen 3.7 Max?
O Qwen 3.7 Max é o principal modelo da família Qwen, da Alibaba. A Alibaba o anunciou no Alibaba Cloud Summit, em Hangzhou, em 20 de maio de 2026. É um modelo apenas de texto, feito para raciocínio, programação e tarefas longas.
Arquitetura e abordagem de treinamento
O Qwen 3.7 Max é um modelo de raciocínio. Ele resolve um problema passo a passo antes de dar uma resposta, em vez de responder de imediato. O modelo também marca uma mudança estratégica para a Alibaba. Os modelos Qwen anteriores tinham pesos abertos, mas o Qwen 3.7 Max é proprietário e disponível apenas via API. É o primeiro passo da Alibaba rumo a uma abordagem de fronteira fechada.
Principais recursos
Vamos dar uma olhada em onde o Qwen 3.7 Max é mais forte. Ele se destaca principalmente em matemática e raciocínio, áreas em que pontua mais alto do que qualquer outro modelo chinês nos principais benchmarks:
Matemática de competição HMMT — 97,1. A HMMT é uma das competições de matemática de ensino médio mais difíceis dos Estados Unidos. Uma pontuação tão alta significa que o modelo resolve quase todos os problemas, e é a maior pontuação da tabela de comparação da Alibaba.
GPQA Diamond — 92,4. O GPQA Diamond é um conjunto de questões científicas de nível de pós-graduação escritas para serem "à prova de Google", de modo que recompensam o raciocínio em vez da memorização. Especialistas com doutorado acertam cerca de 65 por cento, o que faz de 92,4 um resultado muito forte.
Humanity's Last Exam — 41,4. Este é um benchmark deliberadamente brutal de questões para especialistas em muitas áreas, em que até os melhores modelos pontuam baixo. Quanto maior o número, melhor, e o Qwen lidera entre seus pares chineses aqui.
Contexto longo — 1M de tokens. Sua janela de contexto subiu em relação aos 256K do Qwen 3.6 Max anterior, o que o coloca em pé de igualdade com os outros principais modelos atuais.
Preço e disponibilidade
Veja como acessar o Qwen 3.7 Max e quanto ele custa:
Licença: proprietária. Não há pesos abertos, então você não pode hospedá-lo por conta própria.
Onde acessá-lo: pelo Alibaba Cloud Model Studio e por endpoints de API compatíveis.
Preço: cerca de US$ 2,50 por milhão de tokens de entrada e US$ 7,50 por milhão de tokens de saída, mais ou menos metade do preço de modelos ocidentais comparáveis.
Jeito mais fácil de testar: diretamente naOverchat AI, o mesmo lugar onde você pode testar o M3.
Linha do tempo dos lançamentos
Histórico de lançamentos do MiniMax M3
Início de 2026 — M2.5 e M2.7. A MiniMax lançou vários modelos da série M em rápida sucessão. O M2.7 chamou atenção porque o laboratório afirmou que o modelo ajudou a desenvolver a si mesmo, executando loops de otimização por conta própria.
Semanas antes do lançamento — prévias da arquitetura. A MiniMax começou a apresentar prévias do seu novo design de atenção esparsa antes do lançamento do modelo.
1 de junho de 2026 — lançamento do M3. O modelo entrou no ar pela API da MiniMax e pelo app MiniMax Code, com um modo de raciocínio que pode ser ligado ou desligado.
Em até ~10 dias após o lançamento — pesos abertos. A MiniMax planejava publicar os pesos do modelo e um relatório técnico completo no Hugging Face e no GitHub.
Histórico de lançamentos do Qwen 3.7 Max
14 de maio de 2026 — prévia na LM Arena. Uma versão de prévia apareceu no ranking público da LM Arena, sem nenhum comunicado à imprensa. Sua pontuação Elo de texto chegou a cerca de 1.475, perto do top dez em matemática, programação e tarefas de software.
18–19 de maio de 2026 — API entra no ar. O acesso foi liberado em plataformas de terceiros e no Alibaba Cloud Model Studio, um dia antes do anúncio público.
20 de maio de 2026 — lançamento oficial. A Alibaba anunciou formalmente o Qwen 3.7 Max no Alibaba Cloud Summit, em Hangzhou.
Uma mudança estratégica. Diferentemente dos modelos Qwen anteriores, de pesos abertos, o Qwen 3.7 Max foi lançado como um modelo fechado e proprietário — o primeiro passo da Alibaba rumo a uma abordagem de fronteira fechada.
Qwen 3.7 Max vs Qwen 3.7 Plus
A Alibaba lançou dois modelos sob o nome Qwen 3.7 com poucas semanas de diferença. Eles são feitos para trabalhos diferentes:
O Qwen 3.7 Max é apenas de texto e foi lançado em 20 de maio de 2026. Ele é feito para programação, raciocínio e tarefas longas de texto. É o modelo usado nesta comparação.
O Qwen 3.7 Plus é multimodal e foi lançado em 1 de junho de 2026. Ele é construído sobre o modelo Max, com recursos adicionais de visão e controle de tela para tarefas de uso de computador.
Desempenho nos benchmarks
Veja como os dois modelos se saíram nos benchmarks. Só uma observação rápida: os números vêm diretamente dos desenvolvedores e há alguns testes que não cobrem os dois modelos. Vamos marcar o desempenho de um modelo que não foi testado com o sinal "~".
Benchmark
O que mede
MiniMax M3
Qwen 3.7 Max
SWE-Bench Pro
Corrigir bugs reais em bases de código de código aberto
59,0%
~
Programação (agregado)
Média entre os testes diretos de programação
67,0
73,6
Terminal-Bench 2.0
Executar comandos de terminal de forma segura e correta
66,0%
69,7%
Agêntico (agregado)
Média entre os testes agênticos diretos
71,9
69,7
HMMT
Matemática de competição difícil do ensino médio
~
97,1
PolyMATH
Matemática de competição multilíngue
~
86,5
GPQA Diamond
Questões científicas de nível de pós-graduação, "à prova de Google"
~
92,4
Humanity's Last Exam
Questões muito difíceis para especialistas em muitas áreas
~
41,4
Em resumo, os números publicados dizem que o Qwen 3.7 Max é mais forte em programação, matemática e raciocínio, enquanto o MiniMax M3 lidera em tarefas agênticas e vence com folga em preço e abertura. A próxima seção verifica se a vantagem de raciocínio do Qwen aparece em prompts reais.
Testes no mundo real
Agora vamos submeter os dois modelos a três testes, cada um cobrindo uma habilidade diferente: programação algorítmica difícil, raciocínio matemático e escrita longa.
Metodologia dos testes
Rodamos os dois modelos naOverchat AI, que oferece o MiniMax M3 e o Qwen 3.7 Max em um só lugar. Isso nos permitiu dar cada prompt aos dois modelos nas mesmas condições. Toda tarefa usou o mesmo prompt para ambos, sem nenhuma ajuda complementar. Cada resposta abaixo é mostrada exatamente como o modelo a retornou. Os prompts vêm de benchmarks consagrados.
Critérios de avaliação
Julgamos cada tarefa com base em um conjunto fixo de critérios adequado ao seu tipo:
Programação: o código lida com casos extremos, roda corretamente, usa uma abordagem sensata e vem com uma explicação clara?
Matemática e raciocínio: a resposta final está correta e o desenvolvimento é sólido e completo?
Escrita: ela segue o briefing, tem uma voz clara, se sustenta como um todo e evita enchimento?
Teste 1: programação algorítmica difícil
Este é o "Trapping Rain Water", um problema clássico que o LeetCode classifica como Difícil.
Prompt
Dados n números inteiros não negativos que representam um mapa de elevação onde a largura de
cada barra é 1, calcule quanta água ele consegue reter depois da chuva.
Por exemplo, dadas as alturas [0,1,0,2,1,0,1,3,2,1,2,1], a resposta é 6.
Restrições:
- n == height.length
- 1 <= n <= 20.000
- 0 <= height[i] <= 100.000
Forneça uma solução que rode em tempo linear e use espaço extra constante, e
explique a ideia por trás da sua abordagem.
A abordagem ingênua compara cada barra com as barras mais altas à sua esquerda e à sua direita, o que funciona, mas roda em tempo O(n²). Estamos atrás da solução melhor, que roda em uma única passagem linear: ou pré-calculando os máximos acumulados de cada lado, ou usando dois ponteiros que avançam para dentro a partir das pontas. Uma boa resposta deve usar uma dessas estratégias, explicar a ideia por trás dela com clareza e fornecer um código executável que trate os casos extremos, como um mapa de elevação vazio ou plano, em que nenhuma água é retida.
Resultados do MiniMax M3
Resultados do Qwen 3.7 Max
Vencedor
Os dois modelos produziram a mesma solução: a abordagem ideal de dois ponteiros, que roda em tempo linear e espaço constante.
Rodamos as duas versões com o exemplo e uma variedade de casos extremos — um mapa vazio, um plano e mapas estritamente crescentes e decrescentes — e elas retornaram a resposta correta todas as vezes. O código é funcionalmente idêntico, então é a explicação que decide essa.
Cada modelo explicou bem a ideia central, e cada um incluiu uma prova de por que a abordagem está correta, o que é mais do que o prompt pedia.
No entanto, o MiniMax acrescentou duas coisas que o Qwen não fez.
Um passo a passo do exemplo, acompanhando os ponteiros e a contagem de água acumulada em cada etapa, o que torna a lógica fácil de seguir.
Uma pequena tabela comparando as quatro abordagens mais comuns — força bruta, vetores de prefixo/sufixo, pilha monotônica e dois ponteiros — que mostra de relance por que a de dois ponteiros é a única que atende tanto ao limite de tempo quanto ao de espaço.
A resposta do Qwen é excelente, e sua prova de correção, apresentada como um argumento numerado, é provavelmente a mais elegante das duas. Ainda assim, o passo a passo e a tabela comparativa tornam a resposta do MiniMax mais completa e mais útil para quem está aprendendo o problema.
Vencedor: MiniMax M3.
Teste 2: matemática complexa e raciocínio
Este é um problema retirado palavra por palavra da HMMT de novembro de 2025 (Problema 9). A HMMT é uma das competições amadoras de matemática mais difíceis dos Estados Unidos. O problema tem uma única resposta verificável.
Prompt
Sejam a, b e c números complexos distintos dois a dois e não nulos, tais que
(10a + b)(10a + c) = a + 1/a,
(10b + a)(10b + c) = b + 1/b,
(10c + a)(10c + b) = c + 1/c.
Calcule abc.
A resposta correta aqui é 1/91. Uma boa resposta deve chegar a esse valor por meio de uma derivação clara, sem pular os passos difíceis, e deve declarar a resposta final de forma explícita, em vez de deixá-la escondida no desenvolvimento.
Resultados do MiniMax M3
Resultados do Qwen 3.7 Max
Vencedor
Os dois modelos chegaram à resposta correta de 1/91, então este teste se resume a como eles chegaram lá, e eles seguiram caminhos visivelmente diferentes.
O MiniMax M3 multiplicou cada equação pela sua variável e reescreveu tudo em termos das funções simétricas — a soma, os produtos dois a dois e o produto abc. Isso permitiu mostrar que a, b e c são todas raízes da mesma equação cúbica, e duas aplicações das fórmulas de Vieta deram a soma e o produto diretamente. A derivação é compacta e chega à resposta sem nenhum passo desperdiçado.
O Qwen 3.7 Max pegou as equações aos pares e subtraiu umas das outras. Os termos correspondentes se cancelaram, as diferenças se fatoraram e todo o sistema desabou em uma única relação: 91 = 1/abc. Aí o Qwen continuou. Ele derivou a mesma equação cúbica que o M3 havia usado, verificou que as raízes correspondem à soma e ao produto exigidos e confirmou que os três números realmente são distintos e não nulos.
As duas derivações são sólidas, e nenhuma pula os passos difíceis. É a verificação que separa as duas. O problema especifica que a, b e c são números complexos distintos dois a dois e não nulos, e só o Qwen confirmou que tais números de fato existem e satisfazem as condições. O M3 parou no instante em que teve a resposta. Essa verificação extra torna a solução do Qwen a mais completa e confiável das duas.
Vencedor: Qwen 3.7 Max.
Teste 3: escrita longa
Este teste analisa a escrita aberta sob restrições rígidas. As restrições nos permitem julgar o resultado pelo quanto ele segue o briefing e por ter ou não uma voz de verdade, em vez de por uma impressão vaga.
Prompt
Escreva um conto de aproximadamente 600 palavras sobre um faroleiro que
recebe uma carta sem endereço de remetente. A história deve ser escrita inteiramente
na segunda pessoa ("você"), nunca deve declarar o conteúdo da carta diretamente
e deve terminar em uma imagem, e não em uma linha de diálogo. Mantenha um único
tempo verbal consistente do início ao fim.
A história precisa cumprir as quatro restrições: segunda pessoa do início ao fim, o conteúdo da carta nunca declarado, um final em uma imagem em vez de diálogo e um tempo verbal consistente. Além disso, buscamos uma voz de verdade, em vez de uma prosa genérica, uma estrutura que se sustente do começo ao fim e contenção suficiente para evitar enchimento e clichês.
Resultados do MiniMax M3
Resultados do Qwen 3.7 Max
Vencedor
É interessante ver que os dois contos se sobrepõem bastante: as mesmas passagens de carregar o envelope escada acima, lê-lo sob o facho de luz, dobrá-lo e guardá-lo e terminar na paisagem.
No entanto, na nossa opinião, o MiniMax usa o detalhe sensorial de um jeito que parece bem menos forçado, lendo-se como algo que você poderia encontrar num livro de verdade. Frases como "o Atlântico roendo as rochas lá embaixo", "você passou o polegar por baixo da aba" e "aquilo puxava uma lembrança mais antiga que a casa do faroleiro, mais antiga que a própria lanterna" têm certo peso. Isso é escrita de IA, vale dizer, mas não se registra de cara como conteúdo vazio, principalmente se você não estiver tentando julgar com dureza.
Já o Qwen empilha seus detalhes de forma mais mecânica, como se estivesse se esforçando demais para mostrar em vez de contar. As imagens em que ele se apoia ficam mais sem graça por causa desse esforço, e a tensão acaba transparecendo.
Ainda assim, para ser justo, o MiniMax escorregou para o território do conteúdo vazio de IA com "Suas mãos não tremeram. Sua respiração não mudou. Mas algo atrás do seu esterno se mexeu". Mesmo assim, temos que dar essa ao MiniMax M3.
Vencedor: MiniMax M3.
Pontos fortes e fracos
Onde o MiniMax M3 se sai melhor
O M3 é o único dos dois que consegue ler imagens e vídeo. Ele também tem pesos abertos, então você pode rodá-lo no seu próprio hardware. Seu design de atenção esparsa torna o trabalho com contexto longo mais barato, e ele lidera o Qwen em benchmarks agênticos e de uso de ferramentas.
Nossos próprios testes adicionaram mais dois pontos fortes a essa lista. O M3 foi claramente o melhor na escrita, produzindo uma prosa que pareceu natural onde a do Qwen pareceu forçada.
Ele também explicou suas respostas melhor de modo geral: tanto no teste de programação quanto no de matemática, mesmo onde os dois modelos chegaram ao mesmo resultado, a explicação do M3 foi mais fácil de acompanhar. Para trabalhos de alto volume ou multimodais, e para quem valoriza uma resposta clara e legível, esses pontos fortes muitas vezes importam mais do que um ponto ou dois nos benchmarks de raciocínio sobre texto.
Onde o Qwen 3.7 Max se sai melhor
O Qwen 3.7 Max lidera nos números publicados de programação, matemática e raciocínio de nível de pós-graduação.
Sua maior vantagem é em matemática de competição, e isso se confirmou nos nossos próprios testes: ele venceu o teste de matemática, chegando à resposta certa e sendo o único dos dois a verificar o próprio trabalho.
Qual modelo você deve escolher?
Vamos resumir rapidinho e falar sobre qual modelo escolher com base na tarefa à sua frente.
Melhor modelo para programação
Essa está acirrada. O Qwen 3.7 Max pontua mais alto nos benchmarks publicados de programação, então, no papel, ele é melhor.
Mas, no nosso próprio teste de programação, os dois foram difíceis de separar: ambos chegaram à mesma solução ideal, e o MiniMax acabou saindo na frente pela força de uma explicação mais clara. Diríamos — vá de MiniMax.
Melhor modelo para matemática
O Qwen 3.7 Max é a melhor escolha para matemática. Ele apresenta as maiores pontuações em matemática de competição entre todos os modelos chineses, e a matemática é a área em que ele mais se distancia do M3.
Melhor modelo para escrita
MiniMax M3. Essa foi a maior diferença que vimos em qualquer um dos três testes. A prosa do M3 pareceu algo saído de um livro de verdade. Para escrita longa ou criativa, o M3 é a escolha óbvia.
Melhor modelo para uso empresarial
Depende do que mais importa para o seu negócio.
Se você precisa de controle dos dados, hospedagem própria ou entrada de imagem e vídeo, MiniMax M3.
Se você faz principalmente análises com muito texto e quer o raciocínio mais forte, Qwen 3.7 Max.
Conclusão
Segundo os benchmarks publicados, o Qwen 3.7 Max é o modelo mais forte em programação, matemática e raciocínio. No entanto, nos nossos próprios testes, o MiniMax M3 saiu na frente nos três testes práticos, vencendo as tarefas de programação e de escrita. Isso foi, principalmente, uma questão de preferência subjetiva — pareceu mais agradável trabalhar com esse modelo. Mas, ao trabalhar com IA, tudo o que você faz é ler as respostas dela, então a capacidade de entregar explicações claras e de se comunicar com clareza não deve ser subestimada. Só por essa razão, e dado que os dois modelos são genuinamente muito fortes, recomendaríamos usar o MiniMax M3 em vez do Qwen 3.7 Max para a maioria das pessoas — pelo menos se você tiver que escolher apenas um.
O que talvez você nem precise fazer, já que naOverchat AI você pode testar os dois lado a lado em um só lugar e decidir de qual gosta mais, ou simplesmente continuar usando os dois ao mesmo tempo.
FAQ
O MiniMax M3 é melhor que o Qwen 3.7 Max?
Nenhum dos dois é melhor em tudo. O Qwen 3.7 Max lidera nos benchmarks publicados de programação, matemática e raciocínio. O MiniMax M3 lidera em tarefas agênticas, multimodalidade, abertura e preço. Nos nossos próprios testes práticos, o M3 saiu na frente no geral, vencendo as tarefas de programação e de escrita, enquanto o Qwen levou a de matemática, e preferimos usá-lo. A escolha certa ainda depende de a sua prioridade ser os benchmarks de raciocínio ou aspectos como custo, flexibilidade e qualidade da escrita.
Qual modelo é melhor para programação: MiniMax M3 ou Qwen 3.7 Max?
Está acirrado. O Qwen 3.7 Max pontua mais alto em todos os benchmarks de programação em que os dois foram comparados, então, no papel, é o melhor programador. No nosso próprio teste, porém, ambos chegaram à mesma solução ideal e o MiniMax levou a melhor por uma explicação mais clara. O M3 também lidera especificamente em tarefas agênticas de programação, em que o modelo trabalha passo a passo ao longo de um trabalho maior.
Qual modelo se sai melhor em tarefas de matemática e raciocínio?
Qwen 3.7 Max. Ele apresenta os melhores números em matemática de competição entre todos os modelos chineses, incluindo um reportado 97,1 na HMMT. Ele também lidera em benchmarks de raciocínio de nível de pós-graduação, como o GPQA Diamond.
Como o MiniMax M3 se compara ao Qwen 3.7 Plus?
Eles miram trabalhos diferentes. O M3 é um modelo de pesos abertos e multimodal, voltado para raciocínio geral e trabalho com contexto longo. O Qwen 3.7 Plus é um modelo agente multimodal feito para percepção de tela e tarefas de uso de computador. Para trabalho com GUI e visão agêntica, o Plus é a comparação mais próxima. Para raciocínio geral, o M3 se sustenta por conta própria.
Vale a pena fazer upgrade do Qwen 3.7 Plus para o Qwen 3.7 Max?
Eles não são realmente um caminho de upgrade um do outro. O Max é apenas de texto e focado em raciocínio, enquanto o Plus adiciona visão e controle de GUI. Escolha o Max para raciocínio sobre texto e programação, e escolha o Plus para tarefas que exigem que o modelo veja e opere uma interface.
Qual modelo tem a maior janela de contexto?
Eles empatam. Tanto o MiniMax M3 quanto o Qwen 3.7 Max oferecem uma janela de contexto de 1M de tokens. O M3 garante um mínimo de 512K tokens em total fidelidade.
Qual modelo é mais rápido em tarefas do mundo real?
Isso depende da tarefa e do modo de raciocínio. A arquitetura de atenção esparsa do M3 é feita para velocidade em contextos longos, e ela permite desligar o raciocínio para tarefas simples. O Qwen 3.7 Max executa seu processo de raciocínio em cada requisição, o que pode acrescentar latência em tarefas que não precisariam dele.
Qual modelo produz a melhor escrita longa?
MiniMax M3, com uma margem clara nos nossos testes. Dado o mesmo briefing de escrita criativa, sua prosa fluiu de forma natural, enquanto o Qwen 3.7 Max empilhou detalhes sensoriais de um jeito que pareceu forçado. Essa foi a maior diferença de qualidade que vimos nos três testes.
O MiniMax M3 e o Qwen 3.7 Max conseguem usar ferramentas e agentes?
Sim. Os dois são feitos para trabalho agêntico e de uso de ferramentas, e os dois laboratórios divulgam capacidades autônomas de longo prazo. Nos benchmarks diretos publicados, o M3 mantém uma leve vantagem nas medidas agênticas e de uso de ferramentas.
Qual modelo tem melhor custo-benefício?
MiniMax M3. Ele custa cerca de US$ 0,60 por milhão de tokens de entrada, contra os ~US$ 2,50 do Qwen 3.7 Max, o que o torna cerca de quatro vezes mais barato na entrada. Seus pesos abertos também permitem a hospedagem própria, o que pode reduzir ainda mais os custos em escala.
Quais são as maiores diferenças entre o MiniMax M3 e o Qwen 3.7 Max?
São quatro. O M3 tem pesos abertos, enquanto o Qwen é fechado. O M3 é multimodal, enquanto o Qwen é apenas de texto. O M3 usa atenção esparsa, enquanto o Qwen é um modelo de raciocínio denso. E o M3 é bem mais barato. Em capacidade, o Qwen lidera no raciocínio sobre texto, enquanto o M3 lidera em tarefas agênticas.
O MiniMax M3 é de código aberto?
O M3 tem pesos abertos. A MiniMax publica os pesos do modelo para download e hospedagem própria, com um relatório técnico lançado junto. Pesos abertos significa que o próprio modelo treinado está disponível, que é a parte que importa para a hospedagem própria.
O Qwen 3.7 Max é de código aberto?
Não. O Qwen 3.7 Max é proprietário e disponível apenas via API. Isso é uma ruptura notável em relação aos modelos Qwen anteriores, que eram lançados sob licenças permissivas de pesos abertos.
Qual é a melhor alternativa ao MiniMax M3 e ao Qwen 3.7 Max?
Depende da necessidade. A família V4 da DeepSeek é outra forte opção de pesos abertos. Modelos ocidentais de ponta, como o Claude Opus, o GPT-5.5 e o Gemini 3.1 Pro, oferecem capacidade de fronteira a um custo mais alto. O Qwen 3.7 Plus é a opção para trabalho com agente multimodal. Vários deles podem ser comparados diretamente na Overchat AI.