43 resultados
15 DE OUTUBRO DE 2025 / AI
Google is releasing Veo 3.1 and Veo 3.1 Fast, an updated video generation model, in paid preview via the Gemini API. This version offers richer native audio, greater narrative control, and enhanced image-to-video capabilities. New features include guiding generation with reference images, extending existing Veo videos, and generating transitions between frames. Companies like Promise Studios, Latitude, and Whering are already using Veo 3.1 for various applications.
5 DE SETEMBRO DE 2025 / Mobile
O Google AI Edge expandiu a versão de pré-lançamento do Gemma 3n para incluir o suporte a áudio. Os usuários podem brincar com ele em seus smartphones usando o Google AI Edge Gallery, já disponível na versão Beta aberta na Play Store.
4 DE SETEMBRO DE 2025 / Gemma
Apresentamos o EmbeddingGemma: um novo modelo de incorporação do Google, projetado para aplicativos de IA eficientes no dispositivo. Esse modelo aberto é o modelo de incorporação multilíngue somente de texto com a mais alta classificação na categoria de até 500 milhões de parâmetros no comparativo de mercado MTEB. Ele habilita recursos avançados, como RAG e pesquisa semântica, diretamente em dispositivos móveis sem necessidade de conexão com a Internet.
15 DE AGOSTO DE 2025 / Google AI Studio
O Google anuncia a disponibilidade geral do Imagen 4, seu avançado modelo de texto para imagem, na API Gemini e no Google AI Studio, trazendo melhorias significativas de renderização de texto. O novo modelo Imagen 4 Fast, projetado para velocidade e geração rápida de imagens, já está disponível juntamente com o Imagen 4 e o Imagen 4 Ultra, que também dão suporte à geração de imagens com resolução de até 2K.
31 DE JULHO DE 2025 / AI
O Google apresenta o Veo 3 Fast, um modelo otimizado para velocidade e preço, juntamente com novos recursos de imagem para vídeo no Veo 3 e no Veo 3 Fast, permitindo que os desenvolvedores criem, com eficiência, conteúdo de vídeo de alta qualidade a partir de textos ou imagens estáticas, com preços que variam com base no modelo e na inclusão de áudio. E ele já está disponível na API Gemini.
24 DE JULHO DE 2025 / Google Labs
O Opal é uma nova ferramenta experimental do Google Labs que ajuda a elaborar prompts para criar miniapps dinâmicos com várias etapas com o uso de linguagem natural, eliminando a necessidade de código e permitindo que os usuários criem e implantem apps de IA compartilháveis com recursos avançados e integração total com as ferramentas existentes do Google.
17 DE JULHO DE 2025 / Gemini
O Veo 3, o mais recente modelo de geração de vídeo por IA do Google, já está disponível na versão de pré-lançamento paga por meio da API Gemini e do Google AI Studio. Revelado no Google I/O 2025, o Veo 3 é capaz de gerar vídeos e áudios sincronizados, incluindo diálogos, sons de fundo e até ruídos de animais. Esse modelo oferece visuais realistas, física e iluminação natural, com sincronização labial precisa e sons correspondentes à ação na tela.
14 DE JULHO DE 2025 / Gemini
O modelo de texto Gemini Embedding já está geralmente disponível na API Gemini e na Vertex AI. Esse modelo versátil tem sido classificado consistentemente em primeiro lugar no placar Multilingual do MTEB desde seu lançamento experimental, em março. Ele dá suporte a mais de 100 idiomas, tem um comprimento máximo de token de entrada de 2048 e preço de US$ 0,15 por 1 milhão de tokens de entrada.
10 DE JULHO DE 2025 / Cloud
As atualizações do Firebase Studio incluem novos modos de agente, suporte fundamental ao MCP (Model Context Protocol) e integração ao Gemini CLI, tudo projetado para redefinir o desenvolvimento assistido por IA, permitindo que os desenvolvedores criem aplicativos de pilha completa a partir de um único prompt e integrem recursos poderosos de IA diretamente a fluxos de trabalho.
9 DE JULHO DE 2025 / Gemma
O T5Gemma é uma nova família de LLMs codificadores-decodificadores desenvolvida por meio da conversão e adaptação de modelos somente decodificadores pré-treinados com base no framework do Gemma 2. Ele oferece desempenho e eficiência superiores em comparação com seus equivalentes somente decodificadores, em particular para tarefas que exigem compreensão profunda de entradas, como resumos e traduções.