향상된 Gemini 2.5 Flash 및 Flash-Lite 출시를 통해 계속해서 최신 모델 제공

2025년 9월 25일
Shrestha Basu Mallick Product Google DeepMind
Sid Lall Product Google DeepMind
Zach Gleicher Product Google DeepMind
Kate Olszewska Product Google DeepMind

오늘 Google은 Google AI StudioVertex AI에서 사용할 수 있는 Gemini 2.5 Flash와 2.5 Flash-Lite의 업데이트 버전을 출시합니다. 목표는 지속적으로 더 뛰어난 품질을 제공하는 동시에 효율성을 개선하는 것입니다.

Intelligence vs End-to-End response time
현재의 안정적인 모델과 비교해 Gemini 2.5 Flash 및 2.5 Flash Lite 미리보기 모델의 향상된 품질 및 속도
Output token efficiency
Gemini 2.5 Flash-Lite의 경우 출력 토큰 수 50% 감소(따라서 비용 절감), Gemini 2.5 Flash의 경우 24% 감소

업데이트된 Gemini 2.5 Flash-Lite

Gemini 2.5 Flash-Lite 최신 버전은 다음 세 가지 주요 테마를 기반으로 학습 및 개발되었습니다.

  • 더 나은 지시 준수: 이 모델은 복잡한 지시문과 시스템 프롬프트를 따르는 능력이 훨씬 더 향상되었습니다.

  • 세부정보 수준 감소: 이제 보다 간결한 답변을 생성합니다. 이는 처리량이 많은 애플리케이션의 토큰 비용과 지연 시간을 줄이는 핵심 요소입니다(위 차트 참조).

  • 더 강력한 멀티모달 및 번역 기능: 이 업데이트는 더 정확한 오디오 스크립트 작성, 더 나은 이미지 이해 능력, 향상된 번역 품질이 특징입니다.


오늘부터 gemini-2.5-flash-lite-preview-09-2025 모델 문자열을 사용하여 이 버전의 테스트를 시작할 수 있습니다.


업데이트된 Gemini 2.5 Flash

이 최신 2.5 Flash 모델은 저희가 꾸준히 개선 요청을 받았던 다음 두 가지 주요 영역을 개선했습니다.

  • 에이전트 도구 사용 개선: 모델의 도구 사용 방식을 개선하여 더 복잡하고 다단계적인 에이전트 애플리케이션에서 더 나은 성능을 발휘할 수 있도록 했습니다. 이 모델은 SWE-Bench Verified에서 수치가 5% 증가한 것을 포함해 지난 버전과 비교해 주요 에이전트 벤치마크에서 눈에 띄게 향상(48.9% → 54%) 되었습니다.

  • 효율성 향상: 사고 기능을 지원하는 이 모델은 이제 비용 효율성이 크게 개선되어 더 적은 토큰을 사용하면서도 더 높은 품질의 출력을 달성하고 지연 시간과 비용을 줄여줍니다(위 차트 참조).

초기 테스터들로부터 이미 긍정적인 의견을 받고 있습니다. 자율 AI 에이전트인 Manus의 공동 창업자 겸 수석 과학자인 Yichao ‘Peak’ Ji는 다음과 같이 말했습니다. “새로운 Gemini 2.5 Flash는 속도와 지능이 놀라운 조화를 이루는 모델입니다. 내부 벤치마크 평가 결과, 장기적인 에이전트 작업의 성능이 15% 향상된 것으로 나타났습니다. 탁월한 비용 효율성 덕분에 Manus는 전례 없던 수준으로 확장할 수 있어 인간의 역량 확대(Extend Human Reach)라는 우리의 사명에 더 가까이 다가갈 수 있게 되었습니다."

오늘부터 gemini-2.5-flash-preview-09-2025 모델 문자열을 사용하여 이 미리보기 버전의 테스트를 시작할 수 있습니다.


Gemini로 개발 시작하기

지난 한 해 동안 사용자가 저희 모델의 미리보기 버전을 통해 최신 개선 사항과 혁신을 테스트하고, 의견을 개진하며, 최고의 Gemini로 프로덕션 환경에 적합한 경험을 구축해 나가는 모습을 접했습니다. 오늘 출시되는 버전은 새롭고 안정적인 버전으로 전환될 예정은 아니지만, 향후 안정적인 버전을 만드는 데 도움을 줄 것이며 지속적인 개선을 통해 최고의 Gemini를 제공할 수 있도록 할 것입니다.

최신 모델에 더 쉽게 액세스할 수 있도록 하는 동시에 긴 모델 문자열 이름을 계속 추적할 필요성을 줄이기 위해, 각 모델 군을 위한 -latest 별칭도 도입합니다. 이 별칭은 항상 최신 모델 버전을 가리키므로 각 버전에 대한 코드를 업데이트할 필요 없이 새로운 기능을 시험해 볼 수 있습니다. 다음을 사용하여 새 미리보기에 액세스할 수 있습니다.

  • gemini-flash-latest

  • gemini-flash-lite-latest


새로운 모델을 테스트할 시간을 확보하기 위해, -latest로 제공되는 특정 버전을 업데이트하거나 지원 중단하기에 앞서 항상 2주 전에 미리 이메일로 공지할 예정입니다. 이들은 단지 모델 별칭일 뿐이므로 버전 간 속도 제한, 비용, 사용 가능한 기능은 변동될 수 있습니다.

안정성이 더 필요한 애플리케이션의 경우 gemini-2.5-flashgemini-2.5-flash-lite를 계속 사용하세요.

저희는 Gemini로 가능성의 범위를 끝없이 확장하고 있으며, 이번 버전은 그 방향으로 나아가는 또 다른 한 걸음에 불과합니다. 곧 더 많은 소식을 공유할 예정이니, 그동안 즐겁게 개발하세요!