35 resultados
15 DE OUTUBRO DE 2025 / AI
Google is releasing Veo 3.1 and Veo 3.1 Fast, an updated video generation model, in paid preview via the Gemini API. This version offers richer native audio, greater narrative control, and enhanced image-to-video capabilities. New features include guiding generation with reference images, extending existing Veo videos, and generating transitions between frames. Companies like Promise Studios, Latitude, and Whering are already using Veo 3.1 for various applications.
15 DE AGOSTO DE 2025 / Google AI Studio
O Google anuncia a disponibilidade geral do Imagen 4, seu avançado modelo de texto para imagem, na API Gemini e no Google AI Studio, trazendo melhorias significativas de renderização de texto. O novo modelo Imagen 4 Fast, projetado para velocidade e geração rápida de imagens, já está disponível juntamente com o Imagen 4 e o Imagen 4 Ultra, que também dão suporte à geração de imagens com resolução de até 2K.
12 DE AGOSTO DE 2025 / Kaggle
Crie e treine um modelo GPT2 a partir do zero usando o JAX em TPUs do Google, com um notebook do Python completo para Colab ou Kaggle de nível gratuito. Saiba como definir uma malha de hardware, parâmetros de modelo de partição e dados de entrada para paralelismo de dados e como otimizar o processo de treinamento de modelos.
17 DE JULHO DE 2025 / Gemini
O Veo 3, o mais recente modelo de geração de vídeo por IA do Google, já está disponível na versão de pré-lançamento paga por meio da API Gemini e do Google AI Studio. Revelado no Google I/O 2025, o Veo 3 é capaz de gerar vídeos e áudios sincronizados, incluindo diálogos, sons de fundo e até ruídos de animais. Esse modelo oferece visuais realistas, física e iluminação natural, com sincronização labial precisa e sons correspondentes à ação na tela.
16 DE JULHO DE 2025 / Cloud
O objetivo do projeto Marin é expandir a definição da palavra "aberto" na área de IA para incluir todo o processo científico, e não apenas o modelo em si, ao tornar toda a jornada de desenvolvimento acessível e reproduzível. Esse esforço, habilitado pelo framework JAX e por sua ferramenta Levanter, permite escrutínio aprofundado, confiança e criação usando modelos de base para promover um futuro mais transparente na pesquisa de IA.
24 DE JUNHO DE 2025 / Gemini
O Imagen 4, o avançado modelo de texto para imagem do Google, já está disponível na versão de pré-lançamento paga por meio da API Gemini e do Google AI Studio, oferecendo melhorias significativas de qualidade, especialmente para geração de texto dentro de imagens. A família Imagen 4 inclui o Imagen 4 para tarefas gerais e o Imagen 4 Ultra para resposta a prompts de alta precisão, com todas as imagens geradas apresentando uma marca d'água SynthID não visível.
24 DE JUNHO DE 2025 / Gemini
O novo Google Colab com foco em IA aumenta a produtividade com melhorias promovidas por recursos como consulta iterativa para codificação conversacional, um Agente de ciência de dados de última geração para fluxos de trabalho autônomos e transformação de código sem esforço. Os usuários iniciais relatam um grande aumento de produtividade, projetos de ML acelerados, depuração de código mais rápida e criação de visualizações de alta qualidade sem esforço.
24 DE JUNHO DE 2025 / Kaggle
O KerasHub oferece aos usuários a capacidade de misturar e combinar arquiteturas e pesos de modelos em diferentes frameworks de aprendizado de máquina, permitindo que pontos de verificação de origens como o Hugging Face Hub (incluindo aqueles criados com o PyTorch) sejam carregados em modelos Keras para uso com JAX, PyTorch ou TensorFlow. Essa flexibilidade significa que você pode aproveitar uma vasta gama de modelos ajustados da comunidade, mantendo o controle total sobre o framework de back-end escolhido.
23 DE JUNHO DE 2025 / Kaggle
Os desenvolvedores adaptam LLMs como o Gemma para diversos idiomas e contextos culturais, demonstrando o potencial da IA para preencher lacunas de comunicação global ao lidar com desafios como tradução de textos antigos, localização de compreensão matemática e melhoria da sensibilidade cultural na tradução de letras de música.
17 DE JUNHO DE 2025 / Gemini
O Google está lançando atualizações na família de modelos Gemini 2.5, incluindo Gemini 2.5 Pro e Flash, disponíveis e estáveis, e os novos "modelos de pensamento" Gemini 2.5 Flash-Lite em pré-lançamento, oferecendo desempenho e acurácia aprimorados em uma opção de menor custo.