Após a apresentação e lançamento do Gemini Deep Think AI, seu modelo mais avançado de inteligência artificial em maio deste ano, chega o novo modelo de mídia generativa.
Apresentado pela primeira vez no Google I/O 2025, no dia 20 de maio, o Veo 3 – um modelo de geração de vídeo por inteligência artificial desenvolvido pelo Google DeepMind – foi disponibilizado em 17 de julho na API Gemini.
Com avanços significativos em relação ao Veo 2, os novos modelos criam imagens, vídeos e músicas. “Pessoas ao redor do mundo já geraram dezenas de milhões de vídeos de alta qualidade com o Veo 3 (junto com algumas novas tendências de vídeo divertidas e interessantes). É o nosso primeiro modelo a incorporar saídas de vídeo de alta fidelidade e áudio nativo, primeiro com texto para vídeo e, em breve, com imagem para vídeo”, anunciou o Google em meados do mês passado.
Veo 3: Vídeo, conheça o áudio
“O Veo 3, nosso novo modelo de geração de vídeo de última geração, não apenas melhora a qualidade do Veo 2, mas, pela primeira vez, também pode gerar vídeos com áudio — ruídos de trânsito no fundo de uma cena de rua da cidade, pássaros cantando em um parque e até mesmo diálogos entre personagens,” anunciou a multinacional americana.
Em todos os aspectos, o Veo 3 se destaca, desde a introdução de texto e imagem até a física do mundo real e a sincronização labial precisa. É ótimo para compreensão; você pode contar uma história curta na sua introdução, e o modelo retorna um clipe que lhe dá vida. O Veo 3 está disponível hoje para assinantes do Google AI Pro e Ultra nos Estados Unidos (EUA) no aplicativo Gemini, no Flow e para usuários corporativos no Vertex AI.
No Brasil, também é possível usar a ferramenta paga: o Veo 3 está disponível no plano Google AI Pro por R$ 96,99 e no Google AI Ultra por R$ 1.209,90, mensalmente.
Capacidades do Veo 3
O Veo 3 foi projetado para lidar com uma variedade de tarefas de geração de vídeo, desde narrativas cinematográficas até animações dinâmicas de personagens. Com o Veo 3, você pode criar experiências mais imersivas, gerando não apenas visuais impressionantes, mas também diálogos e efeitos sonoros com qualidade de áudio.
:: Som sincronizado: gera nativamente áudio rico — diálogos, efeitos e música — e o sincroniza com vídeo em uma única passagem.
:: Qualidade cinematográfica: produz vídeos impressionantes de alta definição que capturam nuances criativas em seu prompt, desde texturas complexas até efeitos de iluminação sutis.
:: Física realista: simula a física do mundo real para proporcionar movimentos autênticos, desde o movimento natural dos personagens até o fluxo preciso da água e a projeção de sombras.
Vejamos alguns exemplos
Explore estes exemplos e muito mais com o Veo 3 no Google AI Studio, disponível como um modelo de SDK (Kit de Desenvolvimento de Software) — conjunto de ferramentas, bibliotecas, documentação e exemplos de código — e um aplicativo inicial interativo para remixar, copiar e estender. O aplicativo inicial e seu código de exemplo oferecem uma maneira conveniente para usuários do nível pago criarem protótipos rapidamente com o Veo 3 e mais na API Gemini, diretamente do Google AI Studio.
Destaque – Imagem: Google AI / Reprodução



