21 resultados
18 DE AGOSTO DE 2025 / Gemini
A ferramenta de contexto de URL da API Gemini já está disponível de forma geral, permitindo que os desenvolvedores façam o embasamento de prompts usando conteúdo da Web em vez de uploads manuais. Essa versão expande o suporte a PDFs e imagens.
15 DE AGOSTO DE 2025 / Google AI Studio
O Google anuncia a disponibilidade geral do Imagen 4, seu avançado modelo de texto para imagem, na API Gemini e no Google AI Studio, trazendo melhorias significativas de renderização de texto. O novo modelo Imagen 4 Fast, projetado para velocidade e geração rápida de imagens, já está disponível juntamente com o Imagen 4 e o Imagen 4 Ultra, que também dão suporte à geração de imagens com resolução de até 2K.
30 DE JULHO DE 2025 / Gemini
O LangExtract é uma nova biblioteca do Python de código aberto habilitada por modelos Gemini para extrair informações estruturadas de texto não estruturado, oferecendo embasamento preciso na fonte, saídas estruturadas confiáveis por meio da geração controlada, extração otimizada de contexto longo, visualização interativa e suporte flexível a back-ends de LLMs.
17 DE JULHO DE 2025 / Gemini
O Veo 3, o mais recente modelo de geração de vídeo por IA do Google, já está disponível na versão de pré-lançamento paga por meio da API Gemini e do Google AI Studio. Revelado no Google I/O 2025, o Veo 3 é capaz de gerar vídeos e áudios sincronizados, incluindo diálogos, sons de fundo e até ruídos de animais. Esse modelo oferece visuais realistas, física e iluminação natural, com sincronização labial precisa e sons correspondentes à ação na tela.
14 DE JULHO DE 2025 / Gemini
O modelo de texto Gemini Embedding já está geralmente disponível na API Gemini e na Vertex AI. Esse modelo versátil tem sido classificado consistentemente em primeiro lugar no placar Multilingual do MTEB desde seu lançamento experimental, em março. Ele dá suporte a mais de 100 idiomas, tem um comprimento máximo de token de entrada de 2048 e preço de US$ 0,15 por 1 milhão de tokens de entrada.
10 DE JULHO DE 2025 / Gemini
O GenAI Processors é uma nova biblioteca Python de código aberto do Google DeepMind projetada para simplificar o desenvolvimento de aplicativos de IA, especialmente aqueles que lidam com entrada multimodal e exigem capacidade de resposta em tempo real, fornecendo uma interface "Processor" consistente para todas as etapas, desde o tratamento de entradas até as chamadas de modelos e o processamento da saída, para encadeamento contínuo e execução simultânea.
7 DE JULHO DE 2025 / Gemini
O novo modo de lote na API Gemini foi projetado para cargas de trabalho de IA de alta capacidade de processamento e não críticas em relação à latência, simplificando jobs grandes ao lidar com o agendamento e processamento. Além disso, ele torna tarefas como análise de dados, criação de conteúdo em massa e avaliação de modelos mais econômicas e escalonáveis, para que os desenvolvedores possam processar grandes volumes de dados com eficiência.
24 DE JUNHO DE 2025 / Gemini
O Gemini 2.5 Pro e o Gemini 2.5 Flash estão transformando a robótica ao melhorar a codificação, o raciocínio e os recursos multimodais, incluindo a compreensão espacial. Esses modelos são usados na compreensão semântica de cenas, na geração de código para controle de robôs e na criação de aplicativos interativos com a API Live, com forte ênfase em melhorias de segurança e aplicativos da comunidade.
24 DE JUNHO DE 2025 / Gemini
O Imagen 4, o avançado modelo de texto para imagem do Google, já está disponível na versão de pré-lançamento paga por meio da API Gemini e do Google AI Studio, oferecendo melhorias significativas de qualidade, especialmente para geração de texto dentro de imagens. A família Imagen 4 inclui o Imagen 4 para tarefas gerais e o Imagen 4 Ultra para resposta a prompts de alta precisão, com todas as imagens geradas apresentando uma marca d'água SynthID não visível.
28 DE MAIO DE 2025 / Gemini
O projeto Magic Mirror utiliza a API Gemini, incluindo a API Live, a chamada de função e o Embasamento com a Pesquisa Google, para criar uma experiência interativa e dinâmica, demonstrando o poder dos modelos Gemini para gerar elementos visuais, contar histórias e fornecer informações em tempo real por meio de um objeto familiar.