- Google Developers Blog

15 DE OUTUBRO DE 2025 / AI

Apresentamos o Veo 3.1 e os novos recursos criativos na API Gemini

O Google está lançando o Veo 3.1 e o Veo 3.1 Fast, modelos atualizados de geração de vídeo, em versão de pré-lançamento paga por meio da API Gemini. Essa versão oferece áudio nativo mais rico, maior controle narrativo e recursos aprimorados de imagem para vídeo. Os novos recursos incluem orientação da geração com imagens de referência, extensão de vídeos existentes do Veo e geração de transições entre frames. Empresas como Promise Studios, Latitude e Whering já estão usando o Veo 3.1 para vários aplicativos.
15 DE AGOSTO DE 2025 / Google AI Studio

Anunciamos o Imagen 4 Fast e a disponibilidade geral da família Imagen 4 na API Gemini

O Google anuncia a disponibilidade geral do Imagen 4, seu avançado modelo de texto para imagem, na API Gemini e no Google AI Studio, trazendo melhorias significativas de renderização de texto. O novo modelo Imagen 4 Fast, projetado para velocidade e geração rápida de imagens, já está disponível juntamente com o Imagen 4 e o Imagen 4 Ultra, que também dão suporte à geração de imagens com resolução de até 2K.
31 DE JULHO DE 2025 / AI

Novos recursos de imagem para vídeo do Veo 3 Fast

O Google apresenta o Veo 3 Fast, um modelo otimizado para velocidade e preço, juntamente com novos recursos de imagem para vídeo no Veo 3 e no Veo 3 Fast, permitindo que os desenvolvedores criem, com eficiência, conteúdo de vídeo de alta qualidade a partir de textos ou imagens estáticas, com preços que variam com base no modelo e na inclusão de áudio. E ele já está disponível na API Gemini.
17 DE JULHO DE 2025 / Gemini

Crie com o Veo 3, já disponível na API Gemini

O Veo 3, o mais recente modelo de geração de vídeo por IA do Google, já está disponível na versão de pré-lançamento paga por meio da API Gemini e do Google AI Studio. Revelado no Google I/O 2025, o Veo 3 é capaz de gerar vídeos e áudios sincronizados, incluindo diálogos, sons de fundo e até ruídos de animais. Esse modelo oferece visuais realistas, física e iluminação natural, com sincronização labial precisa e sons correspondentes à ação na tela.
10 DE JULHO DE 2025 / Gemini

Anunciamos o GenAI Processors: crie aplicativos Gemini poderosos e flexíveis

O GenAI Processors é uma nova biblioteca Python de código aberto do Google DeepMind projetada para simplificar o desenvolvimento de aplicativos de IA, especialmente aqueles que lidam com entrada multimodal e exigem capacidade de resposta em tempo real, fornecendo uma interface "Processor" consistente para todas as etapas, desde o tratamento de entradas até as chamadas de modelos e o processamento da saída, para encadeamento contínuo e execução simultânea.
24 DE JUNHO DE 2025 / Gemini

O Imagen 4 já está disponível na API Gemini e no Google AI Studio

O Imagen 4, o avançado modelo de texto para imagem do Google, já está disponível na versão de pré-lançamento paga por meio da API Gemini e do Google AI Studio, oferecendo melhorias significativas de qualidade, especialmente para geração de texto dentro de imagens. A família Imagen 4 inclui o Imagen 4 para tarefas gerais e o Imagen 4 Ultra para resposta a prompts de alta precisão, com todas as imagens geradas apresentando uma marca d'água SynthID não visível.
24 DE JUNHO DE 2025 / Gemini

Gemini 2.5 para robótica e inteligência incorporada

O Gemini 2.5 Pro e o Gemini 2.5 Flash estão transformando a robótica ao melhorar a codificação, o raciocínio e os recursos multimodais, incluindo a compreensão espacial. Esses modelos são usados na compreensão semântica de cenas, na geração de código para controle de robôs e na criação de aplicativos interativos com a API Live, com forte ênfase em melhorias de segurança e aplicativos da comunidade.