Gemini 1.5 Flash-8B が本番環境で利用可能に

2024年10月3日

Logan Kilpatrick Group Product Manager

Shrestha Basu Mallick Product Google DeepMind

本日、最新の Flash バリアントである Gemini 1.5 Flash-8B が本番環境で利用できるようになりました。合わせて、以下の変更を行います。

50% の値下げ（1.5 Flash と比較して）

レート制限を 2 倍に緩和（1.5 Flash と比較して）

小さなプロンプトでのレイテンシの低下（1.5 Flash と比較して）

デベロッパーの皆さんは、Google AI Studio と Gemini API から、無料で gemini-1.5-flash-8b にアクセスできます。

さらに小さく高速になった軽量モデル

スピードと効率性に最適化した軽量モデルである Gemini 1.5 Flash は、I/O で発表されました。過去数か月で、Google DeepMind の作業は大きく進展しています。デベロッパーのフィードバックをもとに、可能性の限界をテストすることを通して、1.5 Flash をさらに改善しました。

先月には、Gemini 1.5 Flash-8B の試験運用版をリリースしました。これは、1.5 Flash をさらに小さく高速にしたバリアントです。そしてうれしいことに、これが本番環境向けに一般公開されました。Flash-8B は、多くのベンチマークで、5 月に公開された 1.5 Flash モデルとほぼ同じ性能となっており、チャット、音声文字変換、長文翻訳などのタスクで、特に優れたパフォーマンスを発揮します。

今回リリースされたこの最高水準の小規模モデルは、デベロッパーのフィードバックや、モデルを使ってできることをテストする独自の歩みによって、今後も進化し続けます。このモデルの可能性が一番発揮されると考えられるのは、大規模マルチモーダルユースケースや長文要約などのタスクです。