Hoje, estamos dando aos desenvolvedores o acesso à janela de contexto de 2 milhões para o Gemini 1.5 Pro e a recursos de execução de código na API Gemini e também adicionando o Gemma 2 ao Google AI Studio.
No Google I/O, anunciamos a lista de espera da janela de contexto mais longa existente, de 2 milhões de tokens no Gemini 1.5 Pro. Hoje, estamos abrindo o acesso à janela de contexto de 2 milhões de tokens no Gemini 1.5 Pro para todos os desenvolvedores.
À medida que a janela de contexto se expande, o mesmo acontece com o potencial do custo de entrada. Para ajudar os desenvolvedores a reduzir os custos de tarefas que usam os mesmos tokens em vários prompts, lançamos o armazenamento de contexto em cache na API Gemini para o Gemini 1.5 Pro e o 1.5 Flash.
Os LLMs sempre tiveram problemas com a matemática ou os problemas de lógica de dados. Gerar e executar código capaz de resolver esses problemas ajuda na acurácia. Para desbloquear esses recursos para os desenvolvedores, ativamos a execução de código para o Gemini 1.5 Pro e o 1.5 Flash. Uma vez ativado, o recurso de execução de código pode ser aproveitado dinamicamente pelo modelo para gerar e executar código do Python e aprender iterativamente a partir dos resultados até chegar a uma saída final desejada. O sandbox de execução não está conectado à Internet, é padrão em algumas bibliotecas numéricas e os desenvolvedores são simplesmente cobrados com base nos tokens de saída do modelo.
Este é nosso primeiro passo na execução de código como um recurso de modelo, e isso está disponível hoje por meio da API Gemini e no Google AI Studio, nas configurações avançadas.
Queremos tornar a IA acessível a todos os desenvolvedores, quer você queira integrar nossos modelos do Gemini por meio de uma chave de API ou usando nossos modelos abertos, como o Gemma 2. Para ajudar os desenvolvedores a usar o modelo Gemma 2, ele está sendo disponibilizado no Google AI Studio para experimentação.
O Gemini 1.5 Flash foi criado para atender às principais solicitações por velocidade e acessibilidade dos desenvolvedores. Continuamos entusiasmados com a forma como os desenvolvedores estão inovando com o Gemini 1.5 Flash e usando o modelo em produção:
Em linha com nosso anúncio no mês passado, estamos trabalhando duro para tornar o ajuste para o Gemini 1.5 Flash disponível para todos os desenvolvedores, a fim de ativar novos casos de uso, mais robustez na produção e mais confiabilidade. O ajuste de texto no 1.5 Flash agora está pronto para a aplicação com equipes vermelhas e será lançado gradualmente para os desenvolvedores a partir de hoje. Todos os desenvolvedores poderão acessar o ajuste Gemini 1.5 Flash por meio da API Gemini e no Google AI Studio até meados de julho.
Mal podemos esperar para ver como você vai usar esses novos recursos. Você pode participar da conversa em nosso fórum de desenvolvedores. Se você for um desenvolvedor corporativo, veja como estamos transformando a Vertex AI na melhor plataforma de IA generativa para empresas.