Gemini 1.5: 次世代モデルが Google AI Studio で限定公開プレビュー版として登場

2月 15, 2024
Jaclyn Konzelmann Google Labs
Wiktor Gworek Google Labs

先週、Gemini Advanced の Gemini 1.0 Ultra をリリースしました。Gemini Advanced サブスクリプションにサインアップすることで、今すぐ試すことができます。Gemini API からアクセスできる 1.0 Ultra モデルは多くの関心を集めており、Google AI Studio の一部のデベロッパーやパートナーへ展開を続けています。

本日は、新しい Mixture-of-Experts(MoE)アプローチを採用して効率を向上させた、次世代の Gemini 1.5 モデルをご紹介します。このモデルは、リクエストを小規模な「エキスパート」ニューラル ネットワークのグループにルーティングするため、レスポンスがより速く、より高品質になります。

デベロッパーは、Gemini 1.5 Pro の限定公開プレビュー版にサインアップできます。Gemini 1.5 Pro は、幅広いタスクにわたってスケーリングできるよう最適化された中規模のマルチモーダル モデルです。このモデルは、100 万トークンを処理できる新しい試験運用版のコンテキスト ウィンドウを備えており、Google AI Studio で試すことができます。Google AI Studio は、Gemini モデルを使用してビルドする最速の方法であり、デベロッパーは Gemini API をアプリケーションに簡単に統合できます。180 以上の国と地域で 38 の言語で利用可能です。

100 万トークン: デベロッパーのための新しいユースケースを実現

これまで、一般公開されている大規模言語モデルの世界最大のコンテキスト ウィンドウは 20 万トークンでしたが、これを大幅に増やすことができました。最大 100 万トークンを一貫して実行でき、大規模な基盤モデルの中で最長のコンテキスト ウィンドウを達成しました。Gemini 1.5 Pro には、デフォルトで 12 万 8,000 トークンのコンテキスト ウィンドウが搭載されていますが、今回の限定公開プレビュー版では、試験運用的に 100 万トークンのコンテキスト ウィンドウを利用できます。

Google は、大きくなったコンテキスト ウィンドウが実現する新しい可能性に大きな期待を寄せています。Google AI Studio では、大きな PDF、コード リポジトリ、あるいは長い動画をプロンプトとして直接アップロードできます。Gemini 1.5 Pro はモダリティを超えて推論し、テキストを出力します。

1)複数のファイルをアップロードして質問する
デベロッパーが PDF などの複数のファイルをアップロードし、Google AI Studio で質問できる機能を追加しました。コンテキスト ウィンドウが大きくなったことで、モデルはより多くの情報を取り込むことができ、より一貫性、関連性、有用性の高い出力ができるようになります。この 100 万トークンのコンテキスト ウィンドウを使用すると、一度に 70 万語以上のテキストを読み込むことが可能です。

Gemini 1.5 Pro は、Apollo 11 号の記録の PDF から特定の引用符を見つけて推論できます。\ r [デモ用にスピードアップされた動画]

2)コード リポジトリ全体にクエリを実行する

大きなコンテキスト ウィンドウでは、コードベース全体の詳細な分析も可能になり、Gemini モデルが複雑な関係、パターン、コードを理解するのに役立ちます。デベロッパーは自分のパソコンから直接、または Google ドライブ経由で新しいコードベースをアップロードし、モデルにより迅速にオンボーディングして、コードを理解できます。

Gemini 1.5 Pro は、デベロッパーが新しいコードベースを学習する際の生産性向上に有効です。 [デモ用にスピードアップされた動画]

3)動画全編を追加する

Gemini 1.5 Pro は、最大 1 時間の動画を推論することもできます。動画を添付すると、Google AI Studio はそれを何千ものフレーム(音声なし)に分割します。そして、Gemini モデルはマルチモーダルであるため、高度な推論と問題解決タスクを実行できます。

Gemini 1.5 Pro は、動画やその他の視覚的な入力で推論と問題解決のタスクを実行できます。 [デモ用にスピードアップされた動画]

Gemini モデルを使用したビルド方法をデベロッパーにより多く提供

最新のモデル イノベーションを提供するだけでなく、Gemini でのビルドがより簡単になりました。

  • 簡単なチューニング。例題を提供すると、Google AI Studio 内から数分で特定のニーズに合わせて Gemini をカスタマイズできます。この機能は数日中にリリースされます。 
  • 新しいデベロッパー向けサーフェス。Gemini API を統合すると、新しい Firebase ExtensionsProject IDX の開発ワークスペース全体、または新しくリリースされた Google AI Dart SDK を使用して、AI を活用した新しい機能を今すぐビルドできます。 
  • Gemini 1.0 Pro の料金を引き下げまた、多くの AI タスクに対して費用とパフォーマンスのバランスに優れた 1.0 Pro モデルも更新しています。現在の安定版の料金は、テキスト入力については 50%、出力については 25% も以前に発表したものよりも低くなっています。AI Studio の従量課金プランは近日公開予定です。

12 月以降、あらゆる規模のデベロッパーが Gemini モデルを使用してビルドしており、Google AI Studio の最先端の研究を初期のデベロッパー向けプロダクトに反映できることを嬉しく思います。大きなコンテキスト ウィンドウ機能は試験運用であるため、このプレビュー版ではレイテンシが発生する可能性がありますが、モデルのファイン チューニングを続け、皆様からのフィードバックを得ながら段階的に公開していけることを楽しみにしています。私たちと同じく、早い段階からお試しいただければ幸いです。