- Google Developers Blog

15 DE OUTUBRO DE 2025 / AI

Introducing Veo 3.1 and new creative capabilities in the Gemini API

Google is releasing Veo 3.1 and Veo 3.1 Fast, an updated video generation model, in paid preview via the Gemini API. This version offers richer native audio, greater narrative control, and enhanced image-to-video capabilities. New features include guiding generation with reference images, extending existing Veo videos, and generating transitions between frames. Companies like Promise Studios, Latitude, and Whering are already using Veo 3.1 for various applications.

5 DE SETEMBRO DE 2025 / Mobile

Google AI Edge Gallery: agora com áudio e no Google Play

O Google AI Edge expandiu a versão de pré-lançamento do Gemma 3n para incluir o suporte a áudio. Os usuários podem brincar com ele em seus smartphones usando o Google AI Edge Gallery, já disponível na versão Beta aberta na Play Store.

4 DE SETEMBRO DE 2025 / Gemma

Apresentamos o EmbeddingGemma: o melhor modelo aberto da categoria para incorporações no dispositivo

Apresentamos o EmbeddingGemma: um novo modelo de incorporação do Google, projetado para aplicativos de IA eficientes no dispositivo. Esse modelo aberto é o modelo de incorporação multilíngue somente de texto com a mais alta classificação na categoria de até 500 milhões de parâmetros no comparativo de mercado MTEB. Ele habilita recursos avançados, como RAG e pesquisa semântica, diretamente em dispositivos móveis sem necessidade de conexão com a Internet.

15 DE AGOSTO DE 2025 / Google AI Studio

Anunciamos o Imagen 4 Fast e a disponibilidade geral da família Imagen 4 na API Gemini

O Google anuncia a disponibilidade geral do Imagen 4, seu avançado modelo de texto para imagem, na API Gemini e no Google AI Studio, trazendo melhorias significativas de renderização de texto. O novo modelo Imagen 4 Fast, projetado para velocidade e geração rápida de imagens, já está disponível juntamente com o Imagen 4 e o Imagen 4 Ultra, que também dão suporte à geração de imagens com resolução de até 2K.

Imagen 4 Fast and the generally availability of the Imagen 4 family in the Gemini API

31 DE JULHO DE 2025 / AI

Novos recursos de imagem para vídeo do Veo 3 Fast

O Google apresenta o Veo 3 Fast, um modelo otimizado para velocidade e preço, juntamente com novos recursos de imagem para vídeo no Veo 3 e no Veo 3 Fast, permitindo que os desenvolvedores criem, com eficiência, conteúdo de vídeo de alta qualidade a partir de textos ou imagens estáticas, com preços que variam com base no modelo e na inclusão de áudio. E ele já está disponível na API Gemini.

Build with Veo 3 Fast and new image-to-video capabilities, now available in the Gemini API

24 DE JULHO DE 2025 / Google Labs

Apresentamos o Opal: descreva, crie e compartilhe miniapps de IA

O Opal é uma nova ferramenta experimental do Google Labs que ajuda a elaborar prompts para criar miniapps dinâmicos com várias etapas com o uso de linguagem natural, eliminando a necessidade de código e permitindo que os usuários criem e implantem apps de IA compartilháveis com recursos avançados e integração total com as ferramentas existentes do Google.

17 DE JULHO DE 2025 / Gemini

Crie com o Veo 3, já disponível na API Gemini

O Veo 3, o mais recente modelo de geração de vídeo por IA do Google, já está disponível na versão de pré-lançamento paga por meio da API Gemini e do Google AI Studio. Revelado no Google I/O 2025, o Veo 3 é capaz de gerar vídeos e áudios sincronizados, incluindo diálogos, sons de fundo e até ruídos de animais. Esse modelo oferece visuais realistas, física e iluminação natural, com sincronização labial precisa e sons correspondentes à ação na tela.

Build with Veo 3, now available in the Gemini API and Google AI Studio

14 DE JULHO DE 2025 / Gemini

Gemini Embedding com disponibilidade geral na API Gemini

O modelo de texto Gemini Embedding já está geralmente disponível na API Gemini e na Vertex AI. Esse modelo versátil tem sido classificado consistentemente em primeiro lugar no placar Multilingual do MTEB desde seu lançamento experimental, em março. Ele dá suporte a mais de 100 idiomas, tem um comprimento máximo de token de entrada de 2048 e preço de US$ 0,15 por 1 milhão de tokens de entrada.

Gemini Embedding now generally available in the Gemini API

10 DE JULHO DE 2025 / Cloud

Avanço no desenvolvimento da IA agêntica com o Firebase Studio

As atualizações do Firebase Studio incluem novos modos de agente, suporte fundamental ao MCP (Model Context Protocol) e integração ao Gemini CLI, tudo projetado para redefinir o desenvolvimento assistido por IA, permitindo que os desenvolvedores criem aplicativos de pilha completa a partir de um único prompt e integrem recursos poderosos de IA diretamente a fluxos de trabalho.

Advancing agentic AI development with Firebase Studio

9 DE JULHO DE 2025 / Gemma

T5Gemma: uma nova coleção de modelos Gemma codificadores-decodificadores

O T5Gemma é uma nova família de LLMs codificadores-decodificadores desenvolvida por meio da conversão e adaptação de modelos somente decodificadores pré-treinados com base no framework do Gemma 2. Ele oferece desempenho e eficiência superiores em comparação com seus equivalentes somente decodificadores, em particular para tarefas que exigem compreensão profunda de entradas, como resumos e traduções.

Pesquisa

Tipo de conteúdo

Produto

Tecnologia