A janela de contexto do Gemini 1.5 Pro 2M, os recursos de execução de código e o Gemma 2 são disponibilizados hoje

27 DE JUNHO DE 2024

Logan Kilpatrick Group Product Manager

Shrestha Basu Mallick Group Product Manager

Ronen Kofman Group Product Manager Gemini API

Hoje, estamos dando aos desenvolvedores o acesso à janela de contexto de 2 milhões para o Gemini 1.5 Pro e a recursos de execução de código na API Gemini e também adicionando o Gemma 2 ao Google AI Studio.

Contexto longo e armazenamento de contexto em cache

No Google I/O, anunciamos a lista de espera da janela de contexto mais longa existente, de 2 milhões de tokens no Gemini 1.5 Pro. Hoje, estamos abrindo o acesso à janela de contexto de 2 milhões de tokens no Gemini 1.5 Pro para todos os desenvolvedores.

À medida que a janela de contexto se expande, o mesmo acontece com o potencial do custo de entrada. Para ajudar os desenvolvedores a reduzir os custos de tarefas que usam os mesmos tokens em vários prompts, lançamos o armazenamento de contexto em cache na API Gemini para o Gemini 1.5 Pro e o 1.5 Flash.

Execução de código

Os LLMs sempre tiveram problemas com a matemática ou os problemas de lógica de dados. Gerar e executar código capaz de resolver esses problemas ajuda na acurácia. Para desbloquear esses recursos para os desenvolvedores, ativamos a execução de código para o Gemini 1.5 Pro e o 1.5 Flash. Uma vez ativado, o recurso de execução de código pode ser aproveitado dinamicamente pelo modelo para gerar e executar código do Python e aprender iterativamente a partir dos resultados até chegar a uma saída final desejada. O sandbox de execução não está conectado à Internet, é padrão em algumas bibliotecas numéricas e os desenvolvedores são simplesmente cobrados com base nos tokens de saída do modelo.

Este é nosso primeiro passo na execução de código como um recurso de modelo, e isso está disponível hoje por meio da API Gemini e no Google AI Studio, nas configurações avançadas.

Gemma 2 no Google AI Studio

Queremos tornar a IA acessível a todos os desenvolvedores, quer você queira integrar nossos modelos do Gemini por meio de uma chave de API ou usando nossos modelos abertos, como o Gemma 2. Para ajudar os desenvolvedores a usar o modelo Gemma 2, ele está sendo disponibilizado no Google AI Studio para experimentação.

Gemini 1.5 Flash em produção

O Gemini 1.5 Flash foi criado para atender às principais solicitações por velocidade e acessibilidade dos desenvolvedores. Continuamos entusiasmados com a forma como os desenvolvedores estão inovando com o Gemini 1.5 Flash e usando o modelo em produção:

O Envision capacita as pessoas cegas ou com baixa capacidade visual a entender melhor seu ambiente imediato por meio de um app ou de óculos inteligentes e fazer perguntas específicas. Ao aproveitarem a velocidade do Gemini 1.5 Flash, os usuários do Envision podem obter descrições em tempo real de seus arredores, o que é fundamental para sua experiência de navegação pelo mundo.

O Plural, uma plataforma automatizada de análise e monitoramento de políticas, usa o Gemini 1.5 Flash para resumir e compreender documentos legislativos complexos para ONGs e cidadãos interessados em políticas, para que eles possam ter um impacto na forma como as leis são aprovadas.

O Zapier aproveita os recursos de lógica de vídeo do Gemini 1.5 Flash para extrair detalhes específicos de imagens de vídeo brutas em tabelas do Zapier, criando novas oportunidades de automação para a edição de vídeo.

O Dot, uma IA projetada para crescer junto com o usuário e se tornar cada vez mais personalizada ao longo do tempo, aproveitou o Gemini 1.5 Flash em uma série de tarefas de compactação de informações que são fundamentais para seu sistema de memória agêntico de longo prazo. Para o Dot, o 1.5 Flash tem um desempenho semelhante ao dos modelos mais caros por menos de um décimo do custo para tarefas como resumo, filtragem e reclassificação.

Em linha com nosso anúncio no mês passado, estamos trabalhando duro para tornar o ajuste para o Gemini 1.5 Flash disponível para todos os desenvolvedores, a fim de ativar novos casos de uso, mais robustez na produção e mais confiabilidade. O ajuste de texto no 1.5 Flash agora está pronto para a aplicação com equipes vermelhas e será lançado gradualmente para os desenvolvedores a partir de hoje. Todos os desenvolvedores poderão acessar o ajuste Gemini 1.5 Flash por meio da API Gemini e no Google AI Studio até meados de julho.

Mal podemos esperar para ver como você vai usar esses novos recursos. Você pode participar da conversa em nosso fórum de desenvolvedores. Se você for um desenvolvedor corporativo, veja como estamos transformando a Vertex AI na melhor plataforma de IA generativa para empresas.

postado em: