本日は、Gemini 2.5 モデル ファミリーの幅広いアップデートについてお知らせします。
Gemini 2.5 モデルは思考モデルです。応答する前に論理的に考えることができるので、パフォーマンスと精度が向上します。各モデルで思考予算を制御できるので、デベロッパーはモデルがいつどのくらい「思考」するかを、応答の生成前に選択できます。
本日より、2.5 モデル ファミリーの中で最も遅延とコストが低い 2.5 Flash-Lite をプレビュー版として導入します。これは、以前の 1.5 および 2.0 Flash モデルを費用対効果が高い形でアップグレードしたものです。ほとんどの評価基準でパフォーマンスが向上しているほか、最初のトークンが出力されるまでの時間が短縮され、1 秒あたりのトークンのデコード数が増加しています。このモデルは、大規模な分類や要約などの高スループット タスクに最適です。
Gemini 2.5 Flash-Lite 推論モデルは、API パラメータを使って思考予算を動的に制御できます。Flash-Lite はコストと速度で最適化されているため、他のモデルとは異なり、「思考」はデフォルトでオフになっています。2.5 Flash-Lite は、関数呼び出しに加えて、Google 検索によるグラウンディング、コード実行、URL コンテキストなど、すべてのネイティブ ツールもサポートしています。
この 1 年を通して、私たちの研究チームは、Flash モデルシリーズでコスト品質比の最適解を追求し続けてきました。2.5 Flash を最初に発表したとき、2.5 Flash-Lite の機能はまだ確定していませんでした。また、「思考」と「非思考」の価格設定を導入したため、デベロッパーの混乱を招きました。
そこで、驚異的なパフォーマンスを持つ Gemini 2.5 Flash の安定版リリース(Google I/O で公開した 05-20 モデル プレビュー版と同じもの)に合わせて、2.5 Flash の価格設定を改定します。
混乱を最小限にとどめるため、プレビュー版と安定版のリリースの間で一貫した価格を維持するよう努めていますが、これは Flash の優れた価値を反映するための特別な調整であり、コストあたりのインテリジェンスが最高であることに変わりはありません。
また、モデルのインテリジェンスをあまり必要とせず、コストと遅延が重要なユースケース向けに、(思考の有無によらず)さらに低コストな選択肢を Gemini 2.5 Flash-Liteで提供します。
Gemini 2.5 Flash Preview 04-17 をお使いの方は、2025 年 7 月 15 日に予定されているサポート終了まで、既存のプレビュー価格でご利用いただけます。モデルのエンドポイントは、サポート終了とともに利用できなくなります。一般提供版のモデル「gemini-2.5-flash」に移行するか、低コストな選択肢である 2.5 Flash-Lite Preview に切り替えてください。
Gemini 2.5 Pro は、これまでのモデルの中で最も急激に成長し、需要が拡大しています。本番環境向けにこのモデルで開発できる方を増やせるように、以前と同じ最適なコスト品質比で、06-05 バージョンのモデルを安定版とします。
Pro は、コーディングやエージェント型タスクなど、最高のインテリジェンスと機能が必要になるケースで真価を発揮します。Gemini 2.5 Pro は、多くの人に愛されているデベロッパー ツールの中核をなしています。
2.5 Pro Preview 05-06 は、2025 年 6 月 19 日まで利用できますが、それ以降は利用できなくなります。現在これをお使いの方は、モデル文字列を「gemini-2.5-pro」に更新するだけで済みます。
2.5 Pro のインテリジェンスがさらに多くの領域で活用されることを楽しみにしています。近い将来、Pro を超えた展開について詳しくお知らせできる日が待ちきれません。