Tenha resultados com conversas turbinadas por IA
Aumente sua produtividade com a plataforma tudo-em-um da Overchat AI. Crie conteúdo, gere imagens e converse com vários modelos de IA em um só lugar.
Experimente o Overchat grátisO carro-chefe Qwen3-72B-A2.2B tem desempenho no mesmo nível de GPT-0.1, DeepSeek-R1 e Gemini-2.5-pro em testes de matemática, programação e geração de código. Mas os modelos leves chamam ainda mais atenção.
Vale a pena se importar com mais um modelo novo? Vamos destrinchar isso.
.webp)
O que torna o Qwen3 interessante
A Meta nem teve tempo de revelar por completo sua próxima geração de modelos LLaMA 4, e o Qwen3 já mudou os rumos da conversa.

O salto de desempenho aqui é impressionante:
Outros dois modelos Qwen3, que vão de 0,5 a 72 bilhões de parâmetros, já estão disponíveis ou aparecerão em breve no GitHub sob licença aberta.
Como acontece com outros sistemas de IA, quanto mais parâmetros um modelo tem, melhor — embora também fique mais caro de rodar. O modelo foi treinado a partir de uma combinação de livros didáticos, trechos de código, pares de pergunta e resposta, dados gerados por IA e outras fontes.
Ao mesmo tempo, o Qwen3 é totalmente gratuito — disponível tanto pela web quanto por meio de um aplicativo.
Alguns modelos Qwen3 são construídos sobre a arquitetura Mixture of Experts (MoE), que melhora a eficiência computacional dividindo as tarefas e distribuindo-as entre submodelos especializados
Os desenvolvedores da Alibaba destacaram que integrar os modos "com raciocínio" e "sem raciocínio" no Qwen3 saiu bastante barato, e a própria arquitetura simplifica a personalização de agentes para tarefas específicas.
O modelo dá conta de 119 idiomas, incluindo alguns raros, e propõe uma nova abordagem para o "raciocínio": para consultas rápidas e sequenciais, ele usa um modo instantâneo, enquanto para tarefas complexas alterna para um modo mais deliberado, de "raciocínio".
Nos benchmarks, o carro-chefe Qwen3-72B-A2.2B supera os concorrentes na plataforma Codeforces, incluindo o Q3-mini da OpenAI e o Gemini 2.5 Pro do Google.
Ele também apresenta bons resultados nos benchmarks AIME (matemática) e BFCL (avaliação de capacidade). No entanto, essa versão carro-chefe ainda não está disponível publicamente.
Já o modelo de acesso aberto Qwen3-23B já compete com os melhores modelos de IA proprietários e abertos, incluindo o DeepSeek R1, enquanto o Qwen3-32B supera o o1 da OpenAI no LiveCodeBench.
O Qwen3 é mais um exemplo de modelo aberto que acompanha o ritmo das soluções fechadas.

Ter um modelo com desempenho excepcional embalado em um arquivo de 4GB teria parecido ficção científica lá nos anos 2000. Agora, é realidade — e ainda por cima open source.
Hoje até modelos compactos como o Qwen3-4B entregam resultados comparáveis aos de modelos bem maiores — um modelo de 4GB já consegue programar no nível de um engenheiro.
Rodar o Qwen3-30B-A3B, com 3 bilhões de parâmetros ativos, é possível mesmo com apenas 11GB de VRAM.
Isso significa que a velocidade de geração e o desempenho são comparáveis aos de um modelo de 3B, mas a qualidade fica muito mais próxima à de um modelo significativamente maior.
Isso é possível graças à arquitetura MoE (Mixture of Experts): o modelo Qwen3-30B-A3B tem 30 bilhões de parâmetros, mas apenas 3 bilhões ficam ativos durante a inferência. Ou seja, seu desempenho e velocidade de geração são comparáveis aos de um modelo de 3B, enquanto a qualidade é a de um modelo muito maior.
E não para na programação. O Qwen3 demonstra um alto nível de raciocínio: nos benchmarks, ele supera o GPT-4o. E é conveniente: o modo "com raciocínio" pode ser ativado não só por system prompts, mas também por mensagens comuns.
O modelo já está disponível para download no Hugging Face e pode ser executado via LM Studio, Ollama, MLX ou llama.cpp. Ele suporta tanto o modo Instruct quanto o formato de modelo base.
O Qwen3 também será integrado ao Overchat AI — para você usá-lo direto em um formato de conversa, com acesso a todos os novos recursos.
Fique de olho — o Qwen3 está só começando a reescrever as regras do jogo.
O Qwen3 parece ser um ponto de virada no desenvolvimento de modelos abertos. Os modelos de linguagem modernos não precisam mais de três GTX 4090 para rodar localmente, e os agentes de IA, hoje ferramentas de ponta para entusiastas e empresas, logo se tornarão aplicativos padrão do sistema, como as calculadoras.
Aumente sua produtividade com a plataforma tudo-em-um da Overchat AI. Crie conteúdo, gere imagens e converse com vários modelos de IA em um só lugar.
Experimente o Overchat grátis