Gemini 2.0: Flash, Flash-Lite, Pro

2025년 2월 5일

Shrestha Basu Mallick Product Google DeepMind

Logan Kilpatrick Group Product Manager

개발자를 위한 Gemini 2.0 제품군 확장

오늘 저희는 Gemini 2.0을 더 많은 개발자에게 제공하고 프로덕션 단계에서 사용할 수 있도록 하는 흥미로운 업데이트를 발표했습니다. 이제 Google AI Studio를 통해 Gemini API와 Vertex AI에서 다음 모델을 사용할 수 있습니다.

더 높은 속도 한도, 더 강력한 성능, 단순화된 요금제를 갖춘 Gemini 2.0 Flash가 이제 정식 출시됩니다.

역대 가장 비용 효율적인 모델로 손꼽히는 새로운 버전인 Gemini 2.0 Flash-Lite가 현재 공개 미리보기로 제공됩니다.

코딩과 복잡한 프롬프트를 위한 역대 최고 모델을 실험적으로 업데이트한 Gemini 2.0 Pro가 이용 가능합니다.

추론 후 답변하는 Flash 변이 버전으로 최근 출시된 Gemini 2.0 Flash Thinking Experimental과 함께, 이러한 새로운 모델 출시를 통해 광범위한 사용 사례와 애플리케이션에서 Gemini 2.0 기능을 사용할 수 있게 되었습니다.

모델의 특징

Gemini 2.0 Flash는 네이티브 도구 사용, 백만 개의 토큰 컨텍스트 윈도우, 멀티모달 입력을 포함한 포괄적인 기능을 제공합니다. 이 버전은 현재 텍스트 출력을 지원하는데, 향후 몇 달 내에 Multimodal Live API와 이미지 및 오디오 출력 기능을 정식 버전으로 출시될 계획입니다. Gemini 2.0 Flash-Lite는 대규모 텍스트 출력 사용 사례에 맞춰 비용이 최적화되어 있습니다.

Gemini features across models comparison table gemini 2.0 flash lite pro experimental

모델 성능

Gemini 2.0 모델은 다양한 업계 기준치에서 Gemini 1.5에 비해 상당히 향상된 성능을 보여줍니다.

The Gemini 2.0 models deliver significant performance improvements over Gemini 1.5 across a range of benchmarks.

이전 모델과 마찬가지로, Gemini 2.0 Flash는 간결한 스타일로 기본 설정되어 있어 사용하기 쉽고 비용도 절감할 수 있습니다. 또한 채팅 중심의 사용 사례에서 더 나은 결과를 생성할 수 있도록 보다 상세한 스타일을 사용하라는 요청을 받을 수도 있습니다.

Gemini 요금

Gemini 2.0 Flash 및 2.0 Flash-Lite로 비용을 지속적으로 절감하고 있습니다. 둘 다 입력 유형 당 단일 가격이 적용되므로 Gemini 1.5 Flash의 짧은 컨텍스트 요청과 긴 컨텍스트 요청 사이에 구분이 없어졌습니다. 즉, 2.0 Flash와 Flash-Lite는 둘 다 성능이 향상되었음에도 혼합 컨텍스트 워크로드를 처리하는 Gemini 1.5 Flash보다 오히려 비용이 적게 들 수 있습니다.

Gemini family pricing comparison 2.0 flash lite

각각의 링크를 따라가서 다양한 모달리티의 토큰 카운팅, Gemini Developer API 요금, Vertex AI 요금에 대해 자세히 알아보세요.

단 4줄의 코드로 최신 Gemini 모델을 사용한 개발 작업에 착수할 수 있으며, 이를 통해 업계 최고의 무료 티어와 속도 한도를 활용해 프로덕션 단계까지 확장할 수 있습니다. 개발자 여러분이 지금까지 일군 진전이 저희에게 큰 영감을 주었습니다. 여러분이 이런 최신 Gemini 모델을 또 어떻게 활용할지 정말 기대됩니다. 즐거운 개발하세요!