Qwen 3: o novo modelo de IA open source da China

O que torna o Qwen3 interessante

A Meta nem teve tempo de revelar por completo sua próxima geração de modelos LLaMA 4, e o Qwen3 já mudou os rumos da conversa.

Llama model, represented by a green box, being outpaced by Qwen and DeepSeek, represented as two muscular man. — Os modelos open source chineses estão em alta neste momento

O salto de desempenho aqui é impressionante:

O Qwen3-3.8B supera o antecessor Qwen2-32B em quase 10 vezes
O modelo compacto Qwen3-4B chega perto do desempenho do Qwen2-72B-Instruct

Outros dois modelos Qwen3, que vão de 0,5 a 72 bilhões de parâmetros, já estão disponíveis ou aparecerão em breve no GitHub sob licença aberta.

Como acontece com outros sistemas de IA, quanto mais parâmetros um modelo tem, melhor — embora também fique mais caro de rodar. O modelo foi treinado a partir de uma combinação de livros didáticos, trechos de código, pares de pergunta e resposta, dados gerados por IA e outras fontes.

Ao mesmo tempo, o Qwen3 é totalmente gratuito — disponível tanto pela web quanto por meio de um aplicativo.

As 6 melhores alternativas ao ChatGPT

Vantagens do Qwen3

Mixture of Experts (MoE)

Alguns modelos Qwen3 são construídos sobre a arquitetura Mixture of Experts (MoE), que melhora a eficiência computacional dividindo as tarefas e distribuindo-as entre submodelos especializados

Eficiência

Os desenvolvedores da Alibaba destacaram que integrar os modos "com raciocínio" e "sem raciocínio" no Qwen3 saiu bastante barato, e a própria arquitetura simplifica a personalização de agentes para tarefas específicas.

Suporte multilíngue

O modelo dá conta de 119 idiomas, incluindo alguns raros, e propõe uma nova abordagem para o "raciocínio": para consultas rápidas e sequenciais, ele usa um modo instantâneo, enquanto para tarefas complexas alterna para um modo mais deliberado, de "raciocínio".

Resultados do Qwen3 nos benchmarks

Nos benchmarks, o carro-chefe Qwen3-72B-A2.2B supera os concorrentes na plataforma Codeforces, incluindo o Q3-mini da OpenAI e o Gemini 2.5 Pro do Google.

Ele também apresenta bons resultados nos benchmarks AIME (matemática) e BFCL (avaliação de capacidade). No entanto, essa versão carro-chefe ainda não está disponível publicamente.

Já o modelo de acesso aberto Qwen3-23B já compete com os melhores modelos de IA proprietários e abertos, incluindo o DeepSeek R1, enquanto o Qwen3-32B supera o o1 da OpenAI no LiveCodeBench.

O Qwen3 é mais um exemplo de modelo aberto que acompanha o ritmo das soluções fechadas.

Qwen 3 Benchark results — Resultados do Qwen3 nos benchmarks. Fonte: Qwen

O que isso significa na prática

Ter um modelo com desempenho excepcional embalado em um arquivo de 4GB teria parecido ficção científica lá nos anos 2000. Agora, é realidade — e ainda por cima open source.

Hoje até modelos compactos como o Qwen3-4B entregam resultados comparáveis aos de modelos bem maiores — um modelo de 4GB já consegue programar no nível de um engenheiro.

Rodar o Qwen3-30B-A3B, com 3 bilhões de parâmetros ativos, é possível mesmo com apenas 11GB de VRAM.

Isso significa que a velocidade de geração e o desempenho são comparáveis aos de um modelo de 3B, mas a qualidade fica muito mais próxima à de um modelo significativamente maior.

Isso é possível graças à arquitetura MoE (Mixture of Experts): o modelo Qwen3-30B-A3B tem 30 bilhões de parâmetros, mas apenas 3 bilhões ficam ativos durante a inferência. Ou seja, seu desempenho e velocidade de geração são comparáveis aos de um modelo de 3B, enquanto a qualidade é a de um modelo muito maior.

E não para na programação. O Qwen3 demonstra um alto nível de raciocínio: nos benchmarks, ele supera o GPT-4o. E é conveniente: o modo "com raciocínio" pode ser ativado não só por system prompts, mas também por mensagens comuns.

Onde usar o Qwen3

O modelo já está disponível para download no Hugging Face e pode ser executado via LM Studio, Ollama, MLX ou llama.cpp. Ele suporta tanto o modo Instruct quanto o formato de modelo base.

O Qwen3 também será integrado ao Overchat AI — para você usá-lo direto em um formato de conversa, com acesso a todos os novos recursos.

Fique de olho — o Qwen3 está só começando a reescrever as regras do jogo.

Para encerrar

O Qwen3 parece ser um ponto de virada no desenvolvimento de modelos abertos. Os modelos de linguagem modernos não precisam mais de três GTX 4090 para rodar localmente, e os agentes de IA, hoje ferramentas de ponta para entusiastas e empresas, logo se tornarão aplicativos padrão do sistema, como as calculadoras.

‍