O que são os modelos de geração de vídeo Veo?
Veo é a família de modelos de geração de vídeo de IA do Google DeepMind. A série inclui Veo (anunciado em maio de 2024), Veo 2 (lançado em dezembro de 2024) e Veo 3 (lançado em maio de 2025).
O Google desenvolveu esses modelos para competir com o Sora da OpenAI e o Gen-3 da Runway. Eles geram vídeos a partir de mensagens de texto ou imagens, com saídas que variam de 4 a 8 segundos, dependendo da versão.
Os modelos estão disponíveis em Gerador de vídeo Overchat AI, a plataforma VideoFX do Google, o AI Test Kitchen e APIs de terceiros, como fal.ai. Cada versão trouxe grandes melhorias na qualidade, consistência e velocidade de geração do vídeo.
O modelo Veo mais recente: Veo 3
Veo 3 lançado em maio de 2025, marcando um avanço na geração de vídeo com IA ao se tornar o primeiro modelo a gerar áudio sincronizado junto com vídeo. Isso inclui diálogos, efeitos sonoros e ruído ambiente que combinam com o conteúdo visual.
Quando foi lançado pela primeira vez, esse modelo era o melhor que havia em física, iluminação e animação. Mas mais tarde foi derrotado pela OpenAI Sora 2.
Especificações técnicas:
✅ Saída 1080p
✅ Clipes de 8 segundos
✅ Proporções de 16:9 (paisagem) e 9:16 (retrato)
✅ Geração de áudio nativo com capacidade de sincronização labial
Existem duas variantes do Veo 3: O Veo 3 padrão produz qualidade máxima, enquanto o Veo 3 Fast é otimizado para velocidade.
O Veo 3 é muito bom em seguir as instruções sobre ângulos de câmera, movimentos e como compor uma cena. O modelo entende instruções difíceis, como “zoom dolly” ou “tracking shot”, e as executa com sucesso. A versão Fast é mais rápida e barata, mas não é tão boa.
Quando o Veo 4 será lançado?
Veo 2 foi lançado em dezembro 2024, e Veo 3 foi lançado em maio de 2025 — exatamente 5 meses depois.
Se o Google mantiver esse ritmo, Veo 4 deve chegar por volta de outubro ou novembro de 2025. No entanto, eles podem esperar até dezembro para coincidir com o cronograma de lançamento do Veo 2.
Outra possibilidade é maio de 2026 no Google I/O, onde a empresa tradicionalmente anuncia os principais produtos de IA. Isso lhes daria um ano inteiro para desenvolver melhorias significativas.
A competição desempenha um grande papel no tempo. O Sora 2 da OpenAI já superou o Veo 3 em qualidade, o que pode levar o Google a lançar mais cedo ou mais tarde.
✅Dezembro de 2025 para Veo 4 parece ser a previsão mais realista, pois lhes dá tempo suficiente para dar um grande salto para competir com os próximos lançamentos da OpenAI.
Quais são as capacidades esperadas do Veo 4?
Agora vamos falar sobre o que o Veo 4 pode trazer para a mesa. Aqui estão as atualizações mais prováveis:
- Vídeos com mais de 8 segundos
- Inserir-se em cenas com avatares
- Melhor consistência de cena
- Texto melhor
- Melhor instrução a seguir
- Geração de cenas em vários ângulos
- Edição de vídeo em tempo real
Vamos detalhar cada um deles com mais detalhes.
Vídeos com mais de 8 segundos
Os modelos Veo atuais atingem no máximo clipes de 8 segundos. O Veo 4 provavelmente levará isso para 15 a 30 segundos, igualando ou excedendo as capacidades do Sora 2.
Isso é muito provável, pois a NVIDIA já demonstrou vídeos consistentes de 1 minuto, então a tecnologia existe — o Google só precisa implementá-la com eficiência.
Inserir-se em cenas com avatares
O Veo 4 pode permitir que você envie sua foto e voz para criar vídeos personalizados, assim como o Sora 2.
Esse recurso usaria sua imagem como referência para gerar aparências consistentes dos personagens em todo o vídeo. Seu avatar se moveria naturalmente e combinaria com a iluminação da cena.
A clonagem de voz pode ser sincronizada com os movimentos da boca do avatar. Você digitaria diálogos e o vídeo mostraria você falando essas palavras perfeitamente.
Melhor consistência de cena
Às vezes, o Veo 3 tem dificuldade em manter objetos e fundos estáveis em todos os quadros. Os personagens podem mudar as cores das roupas ou os móveis podem mudar ligeiramente de posição.
O Veo 4 deve manter uma consistência perfeita durante todo o vídeo. Essa melhoria vem de uma melhor compreensão temporal. O modelo precisa lembrar o que gerou nos quadros anteriores e seguir essas decisões.
Texto melhor
O Veo 3 já entende os movimentos da câmera, mas às vezes as instruções a seguir não funcionam. Por exemplo, você pode descrever uma foto e o Veo 3 reverterá o movimento da câmera. Ele começará do meio ou do último quadro e funcionará de trás para frente. Também pode perder detalhes de palavras secundárias.
Em contraste, O Veo 4 deve acertar todas as instruções que você der.
Geração de cenas em vários ângulos
O Veo 4 pode gerar a mesma cena de vários ângulos de câmera simultaneamente. Você escreveria uma mensagem e tiraria fotos de frente, de lado, de cima e de trás.
Esse recurso funcionaria como ter 5 câmeras filmando a mesma ação. Os concorrentes do Google ainda não resolveram isso. Se o Veo 4 oferecer geração de vários ângulos, ele superaria o Sora, o Runway e todas as outras IA de vídeo do mercado.
Edição de vídeo em tempo real
Os modelos atuais forçam você a começar de novo se não gostar de um detalhe, mas dizem que O Veo 4 pode permitir que você modifique vídeos enquanto eles estão sendo gerados.
Esse recurso seria absolutamente revolucionário! Isso não apenas transformaria a forma como trabalhamos com vídeos de IA, mas também reduziria os custos.
Essas gerações podem ser caras e, atualmente, trabalhamos por tentativa e erro. Quanto menos tentativas você tiver que fazer para alcançar o resultado desejado, melhor.
Onde acessar o Veo 4?
O Veo 4 provavelmente aparecerá nos mesmos lugares que o Veo 3, além de plataformas potencialmente novas. Aqui é onde você o encontrará:
IA do Overchat oferecerá a geração de vídeo Veo 4 com o melhor preço.
O Google VideoFX é a plataforma oficial do Google para modelos Veo, oferecendo o conjunto completo de recursos.
O AI Test Kitchen serve como playground experimental do Google. Os recursos beta e de acesso antecipado geralmente são lançados aqui primeiro, embora com limites de uso.
Algumas pessoas acreditam que o Google integrará o Veo 4 ao Workspace, assim como fez com o Gemini. Isso permitiria gerar vídeos diretamente no Google Slides ou Docs. Embora isso seja ótimo, é improvável que seja disponibilizado para todos os usuários, pois a geração de vídeo é cara e é difícil imaginar o Google oferecendo esse recurso para usuários não pagantes.
Quanto custará o Veo 4?
Os preços atuais do Veo 3 nos dão pistas sobre a estrutura de custos do Veo 4. No fal.ai, o Veo 3 custa aproximadamente $23 por minuto de vídeo gerado em clipes de 8 segundos.
O Google provavelmente manterá o sistema hierárquico atual:
- Nível gratuito: 1—3 vídeos da variante rápida
- Básico: $20-30/mês
- Pro: $100-150/mês para 500 vídeos
- Enterprise: preços personalizados para geração ilimitada
Vídeos mais longos significam custos mais altos. Se o Veo 4 gerar clipes de 30 segundos, cada vídeo poderá custar 4 vezes mais potência de computação do que as saídas atuais de 8 segundos.
Mas se o Sora 2 reduzir os preços do Google, espere ajustes rápidos. Ambas as empresas estão queimando dinheiro para conquistar participação de mercado.
Você também poderá acessar o Veo 4 no Overchat AI por apenas $4,99 por semana.
Conclusão
Veo é a família de modelos de geração de vídeo do Google DeepMind que transformam texto e imagens em vídeos com áudio. A série foi lançada com Veo em maio de 2024, seguida por Veo 2 em dezembro de 2024 e Veo 3 em maio de 2025.
O Veo 4 provavelmente será lançado em dezembro de 2025 ou maio de 2026, com base no padrão de lançamento atual do Google. O modelo deve trazer vídeos mais longos (15 a 30 segundos), melhor consistência, texto mais claro e geração revolucionária de vários ângulos e edição em tempo real.
Você está animado com o Veo 4? Não resta muito tempo até o lançamento, mas, enquanto isso, você pode experimente com o Veo 3 no Overchat AI e comece a criar vídeos incríveis de IA agora mesmo!