Gemini 1.5 Pro の 2M コンテキストウィンドウ、コード実行機能、Gemma 2 を本日より公開

2024年6月27日

Logan Kilpatrick Group Product Manager

Shrestha Basu Mallick Product Google DeepMind

Ronen Kofman Group Product Manager Gemini API

本日よりデベロッパーの皆さんが、Gemini 1.5 Pro の 200 万コンテキストウィンドウ、Gemini API の コード実行機能、Google AI Studio の Gemma 2 にアクセスできるようになります。

ロングコンテキストとコンテキストキャッシュ

Gemini 1.5 Pro は、200 万トークンという史上最長のコンテキストウィンドウを持っています。I/O でお知らせしたように、この機能には、待機リスト経由でご案内しておりました。本日より、すべてのデベロッパーが Gemini 1.5 Pro の 200 万トークンのコンテキストウィンドウを利用できるようになります。

コンテキストウィンドウが大きくなると、入力コストが高くなる可能性も大きくなります。そこで、複数のプロンプトで同じトークンを使い回すタスクのコストを削減できるように、Gemini 1.5 Pro と 1.5 Flash の両方の Gemini API でコンテキストキャッシュを開始します。

コード実行

従来の LLM は、数学やデータ推論の問題が得意ではありませんでした。このような問題を推論できるコードを生成して実行できれば、精度向上につながります。デベロッパーがそのような機能を使えるようにするため、Gemini 1.5 Pro と 1.5 Flash の両方でコード実行を有効にしました。これをオンにすると、モデルはコード実行機能を動的に利用します。モデルは Python コードを生成して実行し、その結果から反復的に学習することで、望ましい最終出力を導き出します。実行サンドボックスはインターネットには未接続で、いくつかの数値ライブラリが標準で搭載されています。デベロッパーへの課金はシンプルで、モデルの出力トークンだけに基づきます。

これは、モデル機能としてのコード実行の最初のステップです。本日より、Gemini API と Google AI Studio の詳細設定から利用できます。

Google AI Studio の Gemma 2

私たちは、すべてのデベロッパーが AI を利用できるようにしたいと考えています。API キーを使って Gemini モデルを呼び出すことも、Gemma 2 などのオープンモデルを使うこともできます。デベロッパーの皆さんが実際に Gemma 2 モデルを試せるように、Google AI Studio で実験できるようにします。

Gemini 1.5 Flash 正式版

デベロッパーの皆さんから寄せられている最大の要望は、スピードと手頃な価格の両立です。Gemini 1.5 Flash は、その声に応えるために作られました。大変うれしいことに、皆さんは Gemini 1.5 Flash でイノベーションを起こし、モデルを実環境で利用してくださっています。

Envision は、目が不自由な方や弱視の方がアプリやスマートグラスを使ってすぐそばの環境を認識しやすくしたり、具体的な質問ができるようにしたりします。Gemini 1.5 Flash のスピードのおかげで、Envision ユーザーは周囲の環境をリアルタイムに説明してもらうことができます。弱視の方が世界を移動するうえで、このような体験は不可欠です。

Plural は、自動ポリシー分析およびモニタリングプラットフォームです。Gemini 1.5 Flash を使って、NGO や政策に関心のある市民向けに難解な法律文書を要約して説明することで、法案の可決に向けたサポートを行えるようにします。

Zapier は、Gemini 1.5 Flash の動画推論機能を活用して、未加工動画で起こっている詳しいできごとを Zapier テーブルに抽出します。これにより、新たな方法で動画編集を自動化するチャンスが生まれます。

Dot は、ユーザーとともに成長し、時間とともにパーソナライズが進む AI です。エージェント型長期記憶システムの鍵となる多くの情報圧縮タスクを実現するために、Gemini 1.5 Flash を活用しています。Dot は要約、フィルタリング、再ランキングなどのタスクに 1.5 Flash を使うことで、高価なモデルと同程度の機能を提供しつつ、コストを 10 分の 1 未満に抑えています。

先月お知らせしたように、すべてのデベロッパーが Gemini 1.5 Flash のチューニングを利用できるようにするための取り組みを懸命に行っています。これにより、新しいユースケース、本番環境での堅牢性の向上、高い信頼性が実現します。1.5 Flash のテキストチューニングは、レッドチームによるテストの準備が整い、本日よりデベロッパーへの段階的ロールアウトが始まります。すべてのデベロッパーは、7 月中旬までに Gemini API と Google AI Studio から Gemini 1.5 Flash をチューニングできるようになります。

ここで紹介した新機能を皆さんがどのように使うのか、それを見ることができるのを楽しみにしています。ぜひデベロッパーフォーラムの会話に参加してください。エンタープライズデベロッパーの皆さんは、企業に最適な生成 AI プラットフォームとして開発されている Vertex AI もご覧ください。

投稿先:

Gemini 1.5 Pro の 2M コンテキスト ウィンドウ、コード実行機能、Gemma 2 を本日より公開

ロング コンテキストとコンテキスト キャッシュ

コード実行

Google AI Studio の Gemma 2

Gemini 1.5 Flash 正式版

Gemini 1.5 Pro の 2M コンテキストウィンドウ、コード実行機能、Gemma 2 を本日より公開

ロングコンテキストとコンテキストキャッシュ