Gemini 2.5 Flash-Lite, 안정화 단계 진입 및 정식 출시

2025년 7월 22일

Logan Kilpatrick Group Product Manager

Zach Gleicher Product Manager

오늘 저희는 Gemini 2.5 모델 제품군에서 가장 빠르고, 비용이 적은(백만 입력당 0.10달러, 백만 출력당 0.40달러) 모델인 Gemini 2.5 Flash-Lite 정식 버전을 출시합니다. 저희는 더 까다로운 사용 사례에 대하여 선택적으로 켤 수 있는 네이티브 추론 기능을 사용해 2.5 Flash-Lite를 구축하고 달러당 지능의 최전선을 확장하였습니다. 2.5 Pro 및 2.5 Flash의 모멘텀을 기반으로 개발된 이 모델은 확장된 프로덕션 사용을 위해 준비된 일련의 2.5 모델을 완성합니다.

현재 가장 비용 효율적이고 빠른 2.5 모델

Comparative table showing capabilities of Gemini 2.5 Flash-Lite, 2.5 Flash, and 2.5 Pro

Gemini 2.5 Flash-Lite는 성능과 비용 사이의 균형을 이루면서도 특히 번역과 분류 등 지연 시간에 민감한 작업에서 품질을 저해하지 않습니다.

이 모델의 장점은 다음과 같습니다.

동급 대비 최고의 속도: Gemini 2.5 Flash-Lite는 폭넓은 샘플 프롬프트에서 2.0 Flash-Lite 및 2.0 Flash보다 지연 시간이 짧습니다.

비용 효율성: 현재 가장 비용이 적은 2.5 모델로, 가격은 백만 입력 토큰당 0.10달러 및 백만 출력 토큰당 0.40달러입니다. 덕분에 대량의 요청을 적당한 비용으로 처리할 수 있습니다. 또한 오디오 입력 가격을 미리보기 버전 출시 때보다 40% 낮췄습니다.

스마트하고 작은 크기: 코딩, 수학, 과학, 추론 및 멀티모달 이해를 포함한 다양한 업계 기준치에서 2.0 Flash-Lite보다 전반적으로 보다 고품질을 보여줍니다.

완벽한 기능: 2.5 Flash-Lite로 개발하는 경우 백만 토큰 맥락 범위, 제어할 수 있는 사고 예산 및 Google 검색으로 그라운딩, 코드 실행, URL 컨텍스트 같은 Google의 모든 네이티브 도구에 대한 지원을 이용할 수 있습니다.

Gemini 2.5 Flash-Lite를 사용하는 모습

2.5 Flash-Lite를 출시한 이래 놀라울 정도로 성공적인 개발 사례를 이미 몇 차례나 확인할 수 있었습니다. 그중에서도 공유하고자 하는 사례는 다음과 같습니다.

Satlyt는 위성 데이터를 처리하고, 궤도 내 원격 측정 자료, 자율 작업 관리 및 위성 간 통신 파싱을 실시간으로 요약한 내용을 활용하는 방식을 바꿀 탈중앙화 우주 컴퓨팅 플랫폼을 개발하고 있습니다. 2.5 Flash-Lite의 속도 덕분에 주요 선내 진단에 대한 지연 시간을 45% 감축할 수 있었으며 기초 모델과 비교하여 전력 소비가 30% 감소했습니다.

HeyGen은 AI를 사용하여 동영상 콘텐츠용 아바타를 만들고 Gemini 2.5 Flash-Lite를 활용하여 동영상 계획을 자동화하고, 콘텐츠를 분석 및 최적화하며, 동영상을 180개 이상의 언어로 번역합니다. 이를 통해 전 세계 사용자를 위한 맞춤화된 경험을 제공할 수 있습니다.

DocsHound는 Gemini 2.5 Flash-Lite를 사용하여 짧은 지연 시간에 긴 동영상을 처리하고 수천 장의 스크린샷을 추출하여 제품 데모를 문서로 변환합니다. 이렇게 하면 동영상이 기존 방식보다 훨씬 빠르게 종합적인 문서 및 AI 에이전트를 위한 학습 데이터로 변환됩니다.

Evertune는 AI 모델 전반에서 브랜드가 어떻게 표현되는지 이해하는 것을 돕습니다. 분석 및 보고서 생성 속도를 극적으로 올려주는 Gemini 2.5 Flash-Lite는 판도를 바꿀 정도의 혁신을 불러왔습니다. 이 모델의 빠른 성능 덕분에 브랜드는 빠르게 대량의 모델 출력을 스캔하고 종합하여 고객에게 동적이고 시기적절한 유용한 정보를 제공할 수 있습니다.

코드에 “gemini-2.5-flash-lite”를 지정하여 2.5 Flash-Lite를 사용할 수 있습니다. 미리보기 버전을 사용하고 있는 경우 동일한 기본 모델인 “gemini-2.5-flash-lite”로 전환할 수 있습니다. Flash-Lite의 미리보기 별칭은 8월 25일에 삭제될 예정입니다.

개발할 준비가 되셨나요? 지금 Google AI Studio 및 Vertex AI에서 Gemini 2.5 Flash-Lite 정식 버전을 사용해 보세요.