Após a apresentação e lançamento do Gemini Deep Think AI, seu modelo mais avançado de inteligência artificial em maio deste ano, chega o novo modelo de mídia generativa.


Apresentado pela primeira vez no Google I/O 2025, no dia 20 de maio, o Veo 3 – um modelo de geração de vídeo por inteligência artificial desenvolvido pelo Google DeepMind – foi disponibilizado em 17 de julho na API Gemini.

Com avanços significativos em relação ao Veo 2, os novos modelos criam imagens, vídeos e músicas. “Pessoas ao redor do mundo já geraram dezenas de milhões de vídeos de alta qualidade com o Veo 3 (junto com algumas novas tendências de vídeo divertidas e interessantes). É o nosso primeiro modelo a incorporar saídas de vídeo de alta fidelidade e áudio nativo, primeiro com texto para vídeo e, em breve, com imagem para vídeo”, anunciou o Google em meados do mês passado.

Veo 3: Vídeo, conheça o áudio

“O Veo 3, nosso novo modelo de geração de vídeo de última geração, não apenas melhora a qualidade do Veo 2, mas, pela primeira vez, também pode gerar vídeos com áudio — ruídos de trânsito no fundo de uma cena de rua da cidade, pássaros cantando em um parque e até mesmo diálogos entre personagens,” anunciou a multinacional americana.

 

 

 

 

 

 

 

 

Em todos os aspectos, o Veo 3 se destaca, desde a introdução de texto e imagem até a física do mundo real e a sincronização labial precisa. É ótimo para compreensão; você pode contar uma história curta na sua introdução, e o modelo retorna um clipe que lhe dá vida. O Veo 3 está disponível hoje para assinantes do Google AI Pro e Ultra nos Estados Unidos (EUA) no aplicativo Gemini, no Flow e para usuários corporativos no Vertex AI.

No Brasil, também é possível usar a ferramenta paga: o Veo 3 está disponível no plano Google AI Pro por R$ 96,99 e no Google AI Ultra por R$ 1.209,90, mensalmente.

Capacidades do Veo 3

O Veo 3 foi projetado para lidar com uma variedade de tarefas de geração de vídeo, desde narrativas cinematográficas até animações dinâmicas de personagens. Com o Veo 3, você pode criar experiências mais imersivas, gerando não apenas visuais impressionantes, mas também diálogos e efeitos sonoros com qualidade de áudio.

:: Som sincronizado: gera nativamente áudio rico — diálogos, efeitos e música — e o sincroniza com vídeo em uma única passagem.

:: Qualidade cinematográfica: produz vídeos impressionantes de alta definição que capturam nuances criativas em seu prompt, desde texturas complexas até efeitos de iluminação sutis.

:: Física realista: simula a física do mundo real para proporcionar movimentos autênticos, desde o movimento natural dos personagens até o fluxo preciso da água e a projeção de sombras.

Vejamos alguns exemplos

 

 

 

 

Explore estes exemplos e muito mais com o Veo 3 no Google AI Studio, disponível como um modelo de SDK (Kit de Desenvolvimento de Software) ­— conjunto de ferramentas, bibliotecas, documentação e exemplos de código — e um aplicativo inicial interativo para remixar, copiar e estender. O aplicativo inicial e seu código de exemplo oferecem uma maneira conveniente para usuários do nível pago criarem protótipos rapidamente com o Veo 3 e mais na API Gemini, diretamente do Google AI Studio.


Destaque – Imagem: Google AI / Reprodução


Leia outras matérias desta editoria

Europa aposta em robôs e IA para evitar crise do envelhecimento no trabalho e manter trabalhadores experientes ativos

Rede financiada pela União Europeia desenvolve soluções centradas no ser humano para enfrentar escassez de mão de obra e mudanças demográficas no setor industrial O envelhecimento da força de trabalho na Europa está redesenhando o futuro da indústria....

Startup brasileira é finalista do MIT Solve e apresenta tecnologia contra o câncer na OMS, em Genebra

Única representante do Brasil entre finalistas do MIT Solve, Huna apresenta solução com inteligência artificial que promete antecipar diagnósticos e transformar a forma como os sistemas de saúde enfrentam o câncer. A Huna, startup brasileira de tecnologia...

Como Dolby Atmos e Dolby Vision estão transformando o cinema e levando o público para dentro da história

Novas tecnologias de som e imagem elevam filmes premiados a experiências imersivas, transformando áudio e vídeo em protagonistas da narrativa, nas salas de cinema e plataformas de streaming. O cinema contemporâneo mostra que som e imagem não são apenas...

Escassez de talentos em tecnologia desafia empresas para contratar no Brasil, relatam pesquisas

Levantamentos junto a lideranças de tecnologia mostra falta de profissionais qualificados em todos os níveis, especialmente sêniores, o que impacta inovação, adoção de IA e transformação digital nas empresas A escassez de profissionais qualificados em...

CEO da NVIDIA, Jensen Huang, e líderes globais de tecnologia apresentam a Era da IA no GTC 2026

Keynote de Huang, mais de 1.000 sessões e os avanços em toda a pilha de IA são os destaques da principal conferência sobre IA do mundo. A NVIDIA anuncia que o GTC, a principal conferência mundial sobre IA e computação acelerada, acontecerá de 16 a 19 de...

IA redefine futuro das empresas e marca nova era nos negócios

A Inteligência Artificial (IA) deixou de ser apenas uma ferramenta de apoio para assumir papel estratégico na transformação das empresas. A avaliação foi feita por executivos durante a 200ª edição do DoTheMATH, que debateu o tema “Da adaptação à ruptura: a...

O que muda nas métricas com as novas regras de privacidade das BigTechs?

Leia outras matérias desta editoria