デベロッパーの皆さんは、Gemini 2.0 Flash モデル ファミリーのリリース以来、この非常に効率的なモデル ファミリーの新しいユースケースを発見し続けています。Gemini 2.0 Flash は、1.5 Flash と 1.5 Pro よりも優れたパフォーマンスを発揮します。さらに、価格設定がシンプルになったので、100 万トークン コンテキスト ウィンドウを気軽に利用できます。
本日、本番環境向け Gemini API で Gemini 2.0 Flash-Lite が一般提供され、Google AI Studio とエンタープライズ ユーザー向けの Vertex AI から利用できるようになりました。2.0 Flash-Lite は、推論、マルチモーダル、数学問題、事実問題のベンチマークで 1.5 Flash よりも高いパフォーマンスを発揮します。また、128K トークンを超えるプロンプトの価格設定がシンプルになっているので、長いコンテキスト ウィンドウが必要なプロジェクトで、さらに費用対効果の高いソリューションを実現できます。
デベロッパーの皆さんは、2.0 Flash ファミリーのスピード、効率、費用対効果を活用し、すでに信じられないようなアプリケーションを開発しています。いくつかの例を紹介しましょう。
実用的な会話型 AI、とりわけ音声アシスタントの開発には、スピードと精度の両立が必要です。速く自然に感じられる応答を実現するには、複雑な命令を処理し、関数呼び出しを通して他のシステムと通信する機能に加えて、最初のトークンが出力されるまでの時間(TTFT)を短縮することが不可欠です。
Daily は、Gemini 2.0 Flash-Lite を利用することで、デベロッパーが最先端の音声 AI エクスペリエンスを作れるようにしています。Daily は、ベンダーに依存しないオープンソースの Pipecat フレームワークを使って音声とマルチモーダルの会話エージェントを実現し、ボイスメール システムを確実に検出し、それに応じてメッセージを調整するシステム指示コードのデモを作成しました。
Dawn は、Gemini 2.0 Flash を使って深く有意義な知見を提供することで、エンジニアリング チームによる本番稼働中の AI プロダクトの監視作業に革命をもたらしています。Dawn の「セマンティック モニタリング」パイプラインを使うと、大量のユーザー インタラクション ストリームを即座に検索し、ユーザーの不満、会話の長さ、フィードバックなど、探している行動を見つけることができます。さらに、それを問題やトピックとして継続的に追跡し、本番環境の異常や隠れた問題を特定することもできます。
Dawn はモデルを切り替えて Gemini 2.0 Flash のシンプルな価格設定、信頼性の高い構造化出力、拡張コンテキスト機能を活用することで、検索時間を大幅に短縮(数時間からわずか 1 分未満に)し、コストを 90% 以上削減して、評価や本番環境監視の信頼性を向上させました。
Mosaic は、Gemini 2.0 Flash による新たなエージェント的パラダイムを活用することで、複雑で時間のかかる動画編集タスクを変革しています。このソリューションには、Gemini 2.0 Flash のロング コンテキスト機能を使ったマルチモーダル編集エージェントが組み込まれており、日常的な動画編集タスクを数時間から数秒に短縮できます。プロンプトを入力するだけで、長い動画の任意の部分から YouTube ショートを切り出すなどの操作を行うことができます。
Google AI Studio の Gemini 2.0 Flash は、100 万入力トークンあたり 0.10 ドルというシンプルかつ新しい価格設定が適用されます。巨大なコンテキスト ウィンドウが 33% お手頃な価格になっているので、AI 主導の動画編集ワークフローという新しい可能性が生まれます。
うれしいことに、Daily.co、Mosaic、Dawn などのデベロッパーが Gemini 2.0 Flash ファミリーのモデルを活用しています。音声アシスタントや動画編集ツールに取り組んでいる方や、まったく新しいものを作ろうとしている方が、Gemini 2.0 Flash ファミリーを使ってお手頃な価格で必要な機能を実現できることを願っています。さっそく Google AI Studio で開発を始めましょう。