Continuamos a trazer até você nossos modelos mais recentes, com uma versão aprimorada do Gemini 2.5 Flash e Flash-Lite

25 DE SETEMBRO DE 2025
Shrestha Basu Mallick Product Google DeepMind
Sid Lall Product Google DeepMind
Zach Gleicher Product Google DeepMind
Kate Olszewska Product Google DeepMind

Hoje, estamos lançando versões atualizadas do Gemini 2.5 Flash e 2.5 Flash-Lite, disponíveis no Google AI Studio e na Vertex AI, com o objetivo de continuar a oferecer uma qualidade mais alta e, ao mesmo tempo, aumentar a eficiência.

Intelligence vs End-to-End response time
Melhorias na qualidade e velocidade dos modelos Gemini 2.5 Flash e 2.5 Flash Lite de pré-lançamento em comparação com os modelos estáveis atuais
Output token efficiency
Redução de 50% em tokens de saída (e, portanto, de custo) para o Gemini 2.5 Flash-Lite e de 24% para o Gemini 2.5 Flash

Gemini 2.5 Flash-Lite atualizado

A versão mais recente do Gemini 2.5 Flash-Lite foi treinada e criada com base em três temas principais:

  • Melhoria da capacidade para seguir instruções: o modelo é significativamente melhor para seguir instruções complexas e prompts de sistema.

  • Redução da verbosidade: agora, ele produz respostas mais concisas, um fator fundamental para a redução da latência e dos custos de tokens para aplicativos com alta capacidade de processamento (veja os gráficos acima).

  • Recursos multimodais e de tradução mais sólidos: essa atualização oferece transcrição de áudio mais precisa, compreensão melhor de imagens e qualidade de tradução mais alta.


Você pode começar a testar essa versão hoje mesmo usando a seguinte string de modelo: gemini-2.5-flash-lite-preview-09-2025.


Gemini 2.5 Flash atualizado

O mais recente modelo 2.5 Flash traz melhorias em duas áreas principais sobre as quais recebemos feedbacks frequentes:

  • Uso melhor de ferramentas agênticas: melhoramos a forma como o modelo usa as ferramentas, levando a um desempenho mais alto em aplicativos agênticos e com várias etapas mais complexos. Esse modelo demonstra melhorias notáveis nos principais comparativos de mercado agênticos, incluindo um ganho de 5% no SWE-Bench Verified, em comparação com nossa versão anterior (48,9% → 54%).

  • Mais eficiência: com o pensamento ativado, o modelo agora é significativamente mais econômico e alcança saídas com qualidade mais alta usando menos tokens, o que reduz a latência e os custos (veja os gráficos acima).

Já estamos recebendo feedbacks positivos dos primeiros testadores. Como observou Yichao "Peak" Ji, cofundador e cientista-chefe do Manus, um agente de IA autônomo: "O novo modelo Gemini 2.5 Flash oferece uma combinação notável de velocidade e inteligência. Nossa avaliação em comparativos de mercado internos revelou um salto de 15% no desempenho para tarefas agênticas de horizonte longo. Sua excelente relação custo-benefício permite que o Manus atinja níveis sem precedentes, avançando nossa missão de estender o alcance humano."

Você pode começar a testar essa versão de pré-lançamento hoje mesmo usando a seguinte string de modelo: gemini-2.5-flash-preview-09-2025.


Comece a criar com o Gemini

Ao longo do último ano, notamos que o fornecimento de versões de pré-lançamento de nossos modelos permite que os desenvolvedores testem nossas mais recentes melhorias e inovações, forneçam feedback e criem experiências prontas para produção com o melhor do Gemini. Os lançamentos de hoje não se destinam a evoluir para uma nova versão estável, mas nos ajudarão a moldar nossos futuros lançamentos estáveis e nos permitirão continuar iterando e trazendo o melhor do Gemini para você.

Para facilitar ainda mais o acesso a nossos modelos mais recentes e, ao mesmo tempo, reduzir a necessidade de acompanhar os longos nomes de strings de modelos, também estamos introduzindo um alias -latest para cada família de modelos. Esse alias sempre aponta para nossas versões mais recentes, permitindo que você experimente novos recursos sem precisar atualizar o código para cada versão. Você pode acessar os novos pré-lançamentos usando:

  • gemini-flash-latest

  • gemini-flash-lite-latest


Para garantir que você tenha tempo para testar novos modelos, sempre daremos um aviso prévio de duas semanas (por e-mail) antes de fazer atualizações ou descontinuar uma versão específica marcada com o -latest. Esses são apenas aliases de modelo, portanto, os limites de taxa, custo e recursos disponíveis podem flutuar entre as versões.

Para aplicativos que requerem mais estabilidade, continue usando o gemini-2.5-flash e o gemini-2.5-flash-lite.

Continuamos ultrapassando as fronteiras do possível com o Gemini, e este lançamento é apenas mais um passo nessa direção. Teremos mais para compartilhar em breve, mas, enquanto isso... divirta-se programando!