本日、Gemini 2.5 モデル ファミリーの中で最も高速かつ低価格(100 万入力トークンあたり 0.10 ドル、100 万出力トークンあたり 0.40 ドル)なモデルである Gemini 2.5 Flash-Lite の安定版をリリースいたします。2.5 Flash-Lite は、1 ドルあたりのインテリジェンスを最大限に高めることを目指して設計され、より高度なユースケース向けに必要に応じて有効化できるネイティブ推論機能も備えています。2.5 Pro や 2.5 Flash の勢いを受けて登場したこのモデルにより、スケーリングされた本番環境に対応する 2.5 モデルシリーズが完成しました。
最速かつ最もコスト効率に優れた 2.5 モデル
Gemini 2.5 Flash-Lite は、パフォーマンスとコストのバランスに優れ、特に翻訳や分類といったレイテンシの影響を受けやすいタスクにおいて、品質を損なうことなく高い成果を発揮します。
注目すべき特長は、次のとおりです。
- 最高水準の速度: Gemini 2.5 Flash-Lite は、広範なサンプル プロンプトで、2.0 Flash-Lite および 2.0 Flash よりも低いレイテンシを実現しています。
- 優れたコスト効率: 2.5 モデルの中で最も低価格で、100 万入力トークンあたり 0.10 ドル、出力トークンあたり 0.40 ドルに設定されています。大量のリクエストを手頃なコストで処理することが可能です。また、プレビュー版に比べ、音声入力の価格も 40% 引き下げられました。
- スマートでコンパクト: コーディング、数学、科学、推論、マルチモーダル理解といった幅広いベンチマークにおいて、2.0 Flash-Lite よりも高い品質を実現します。
- 豊富な機能: 2.5 Flash-Lite を使えば、100 万トークンのコンテキスト ウィンドウ、コントロール可能な思考予算、Google 検索によるグラウンディング、コード実行、URL コンテキストなどのネイティブ ツールが利用できます。
Gemini 2.5 Flash-Lite の活用事例
2.5 Flash-Lite のリリース以降、すでに数多くの成功事例が生まれています。その中から特に注目の事例をご紹介します。
- Satlyt は、衛星データの処理および活用方法を変革する宇宙向け分散型コンピューティング プラットフォームを構築しています。このプラットフォームは、軌道上テレメトリーのリアルタイム要約や自律的なタスク管理、衛星間通信の解析に活用されます。Satlyt では、2.5 Flash-Lite の高い処理速度により、ベースライン モデルと比較して、重要なオンボーディング診断のレイテンシを 45% 削減し、消費電力を 30% 削減することに成功しました。
- HeyGen は、AI を使って動画コンテンツ用のアバターを作成しているほか、Gemini 2.5 Flash-Lite を活用して、動画計画の自動化、コンテンツの分析と最適化、180 以上の言語への動画翻訳を行っています。これにより、ユーザーにグローバルかつパーソナライズされた体験を届けています。
- DocsHound は、Gemini 2.5 Flash-Lite を使って、長時間の動画を低レイテンシで処理し、数千枚のスクリーンショットを抽出することで、製品のデモをドキュメントに変換しています。これにより、従来の方法よりもはるかに迅速に、動画から包括的なドキュメントと AI エージェント向けのトレーニング データを生成できます。
- Evertune は、ブランドがさまざまな AI モデルにおいて、どのように認識されているかを把握するための支援を行っています。同社にとって Gemini 2.5 Flash-Lite は、分析とレポート生成を劇的に高速化できる革新的なソリューションです。その高速な処理能力により、膨大なモデル出力をすばやくスキャン、統合し、タイムリーかつ動的な分析情報をクライアントに届けることができます。
2.5 Flash-Lite を使用するには、コード内で「gemini-2.5-flash-lite」を指定してください。プレビュー版を使用している場合は、同じ基盤モデルである「gemini-2.5-flash-lite」に切り替えることができます。Flash-Lite のプレビュー エイリアスは、8 月 25 日に削除予定です。
Gemini 2.5 Flash-Lite の安定版は、Google AI Studio と Vertex AI で今すぐご利用いただけます。ぜひお試しください。