24 resultados
18 DE AGOSTO DE 2025 / Gemini
A ferramenta de contexto de URL da API Gemini já está disponível de forma geral, permitindo que os desenvolvedores façam o embasamento de prompts usando conteúdo da Web em vez de uploads manuais. Essa versão expande o suporte a PDFs e imagens.
15 DE AGOSTO DE 2025 / Google AI Studio
O Google anuncia a disponibilidade geral do Imagen 4, seu avançado modelo de texto para imagem, na API Gemini e no Google AI Studio, trazendo melhorias significativas de renderização de texto. O novo modelo Imagen 4 Fast, projetado para velocidade e geração rápida de imagens, já está disponível juntamente com o Imagen 4 e o Imagen 4 Ultra, que também dão suporte à geração de imagens com resolução de até 2K.
31 DE JULHO DE 2025 / AI
O Google apresenta o Veo 3 Fast, um modelo otimizado para velocidade e preço, juntamente com novos recursos de imagem para vídeo no Veo 3 e no Veo 3 Fast, permitindo que os desenvolvedores criem, com eficiência, conteúdo de vídeo de alta qualidade a partir de textos ou imagens estáticas, com preços que variam com base no modelo e na inclusão de áudio. E ele já está disponível na API Gemini.
30 DE JULHO DE 2025 / Gemini
O LangExtract é uma nova biblioteca do Python de código aberto habilitada por modelos Gemini para extrair informações estruturadas de texto não estruturado, oferecendo embasamento preciso na fonte, saídas estruturadas confiáveis por meio da geração controlada, extração otimizada de contexto longo, visualização interativa e suporte flexível a back-ends de LLMs.
17 DE JULHO DE 2025 / Gemini
O Veo 3, o mais recente modelo de geração de vídeo por IA do Google, já está disponível na versão de pré-lançamento paga por meio da API Gemini e do Google AI Studio. Revelado no Google I/O 2025, o Veo 3 é capaz de gerar vídeos e áudios sincronizados, incluindo diálogos, sons de fundo e até ruídos de animais. Esse modelo oferece visuais realistas, física e iluminação natural, com sincronização labial precisa e sons correspondentes à ação na tela.
16 DE JULHO DE 2025 / AI
O recurso "logprobs" foi oficialmente introduzido na API Gemini na Vertex AI. Ele fornece insights sobre a tomada de decisões do modelo, mostrando pontuações de probabilidade para tokens escolhidos e alternativos. Este guia passo a passo mostra como ativar e interpretar esse recurso e aplicá-lo a casos de uso poderosos, como classificação confiável, preenchimento automático dinâmico e avaliação quantitativa de RAG.
14 DE JULHO DE 2025 / Gemini
O modelo de texto Gemini Embedding já está geralmente disponível na API Gemini e na Vertex AI. Esse modelo versátil tem sido classificado consistentemente em primeiro lugar no placar Multilingual do MTEB desde seu lançamento experimental, em março. Ele dá suporte a mais de 100 idiomas, tem um comprimento máximo de token de entrada de 2048 e preço de US$ 0,15 por 1 milhão de tokens de entrada.
10 DE JULHO DE 2025 / Gemini
O GenAI Processors é uma nova biblioteca Python de código aberto do Google DeepMind projetada para simplificar o desenvolvimento de aplicativos de IA, especialmente aqueles que lidam com entrada multimodal e exigem capacidade de resposta em tempo real, fornecendo uma interface "Processor" consistente para todas as etapas, desde o tratamento de entradas até as chamadas de modelos e o processamento da saída, para encadeamento contínuo e execução simultânea.
7 DE JULHO DE 2025 / Gemini
O novo modo de lote na API Gemini foi projetado para cargas de trabalho de IA de alta capacidade de processamento e não críticas em relação à latência, simplificando jobs grandes ao lidar com o agendamento e processamento. Além disso, ele torna tarefas como análise de dados, criação de conteúdo em massa e avaliação de modelos mais econômicas e escalonáveis, para que os desenvolvedores possam processar grandes volumes de dados com eficiência.
24 DE JUNHO DE 2025 / Gemini
O Gemini 2.5 Pro e o Gemini 2.5 Flash estão transformando a robótica ao melhorar a codificação, o raciocínio e os recursos multimodais, incluindo a compreensão espacial. Esses modelos são usados na compreensão semântica de cenas, na geração de código para controle de robôs e na criação de aplicativos interativos com a API Live, com forte ênfase em melhorias de segurança e aplicativos da comunidade.