5 resultados
20 DE MAIO DE 2025 / Gemma
O Gemma 3n é um modelo aberto de última geração, projetado para oferecer experiências de IA multimodal, rápidas e com execução local. Ele combina desempenho otimizado e flexibilidade singular com uma arquitetura 2 em 1 e compreensão multimodal expandida de áudio, permitindo que desenvolvedores criem aplicações interativas em tempo real e experiências avançadas centradas em voz.
9 DE MAIO DE 2025 / DeepMind
O Gemini 2.5 marca um grande salto na compreensão de vídeo, alcançando desempenho de última geração nos principais comparativos de mercado em compreensão de vídeo e usando informações audiovisuais com código e outros formatos de dados.
30 DE ABRIL DE 2025 / Gemma
Os novos destaques do Gemma 3 incluem recursos de visão-linguagem e mudanças arquitetônicas para melhorar a eficiência da memória e o tratamento de contextos mais longos, em comparação com os modelos Gemma anteriores.
23 DE ABRIL DE 2025 / Gemini
Explore aplicativos do mundo real para a API Live para modelos Gemini, agora atualizada para incluir recursos avançados de processamento de áudio, vídeo e texto em tempo real, gerenciamento avançado de sessões, controle sobre interações e opções de saída mais completas.
20 DE NOVEMBRO DE 2024 / Gemini
A OpusClip utiliza os recursos multimodais do Gemini 1.5 Flash para melhorar a compreensão de vídeos e otimizar a criação de conteúdo, obtendo reduções de custos e aumentando o engajamento.