Gemini 1.5: 次世代モデルが Google AI Studio で限定公開プレビュー版として登場

2024年2月15日

Jaclyn Konzelmann Google Labs

Wiktor Gworek Google Labs

先週、Gemini Advanced の Gemini 1.0 Ultra をリリースしました。Gemini Advanced サブスクリプションにサインアップすることで、今すぐ試すことができます。Gemini API からアクセスできる 1.0 Ultra モデルは多くの関心を集めており、Google AI Studio の一部のデベロッパーやパートナーへ展開を続けています。

本日は、新しい Mixture-of-Experts（MoE）アプローチを採用して効率を向上させた、次世代の Gemini 1.5 モデルをご紹介します。このモデルは、リクエストを小規模な「エキスパート」ニューラルネットワークのグループにルーティングするため、レスポンスがより速く、より高品質になります。

デベロッパーは、Gemini 1.5 Pro の限定公開プレビュー版にサインアップできます。Gemini 1.5 Pro は、幅広いタスクにわたってスケーリングできるよう最適化された中規模のマルチモーダルモデルです。このモデルは、100 万トークンを処理できる新しい試験運用版のコンテキストウィンドウを備えており、Google AI Studio で試すことができます。Google AI Studio は、Gemini モデルを使用してビルドする最速の方法であり、デベロッパーは Gemini API をアプリケーションに簡単に統合できます。180 以上の国と地域で 38 の言語で利用可能です。

100 万トークン: デベロッパーのための新しいユースケースを実現

これまで、一般公開されている大規模言語モデルの世界最大のコンテキストウィンドウは 20 万トークンでしたが、これを大幅に増やすことができました。最大 100 万トークンを一貫して実行でき、大規模な基盤モデルの中で最長のコンテキストウィンドウを達成しました。Gemini 1.5 Pro には、デフォルトで 12 万 8,000 トークンのコンテキストウィンドウが搭載されていますが、今回の限定公開プレビュー版では、試験運用的に 100 万トークンのコンテキストウィンドウを利用できます。

Google は、大きくなったコンテキストウィンドウが実現する新しい可能性に大きな期待を寄せています。Google AI Studio では、大きな PDF、コードリポジトリ、あるいは長い動画をプロンプトとして直接アップロードできます。Gemini 1.5 Pro はモダリティを超えて推論し、テキストを出力します。

1）複数のファイルをアップロードして質問する
デベロッパーが PDF などの複数のファイルをアップロードし、Google AI Studio で質問できる機能を追加しました。コンテキストウィンドウが大きくなったことで、モデルはより多くの情報を取り込むことができ、より一貫性、関連性、有用性の高い出力ができるようになります。この 100 万トークンのコンテキストウィンドウを使用すると、一度に 70 万語以上のテキストを読み込むことが可能です。

Gemini 1.5 Pro は、Apollo 11 号の記録の PDF から特定の引用符を見つけて推論できます。\ r [デモ用にスピードアップされた動画]

2）コードリポジトリ全体にクエリを実行する

大きなコンテキストウィンドウでは、コードベース全体の詳細な分析も可能になり、Gemini モデルが複雑な関係、パターン、コードを理解するのに役立ちます。デベロッパーは自分のパソコンから直接、または Google ドライブ経由で新しいコードベースをアップロードし、モデルにより迅速にオンボーディングして、コードを理解できます。

Gemini 1.5 Pro は、デベロッパーが新しいコードベースを学習する際の生産性向上に有効です。 [デモ用にスピードアップされた動画]

3）動画全編を追加する

Gemini 1.5 Pro は、最大 1 時間の動画を推論することもできます。動画を添付すると、Google AI Studio はそれを何千ものフレーム（音声なし）に分割します。そして、Gemini モデルはマルチモーダルであるため、高度な推論と問題解決タスクを実行できます。

Gemini 1.5 Pro は、動画やその他の視覚的な入力で推論と問題解決のタスクを実行できます。 [デモ用にスピードアップされた動画]

Gemini モデルを使用したビルド方法をデベロッパーにより多く提供

最新のモデルイノベーションを提供するだけでなく、Gemini でのビルドがより簡単になりました。

簡単なチューニング。例題を提供すると、Google AI Studio 内から数分で特定のニーズに合わせて Gemini をカスタマイズできます。この機能は数日中にリリースされます。
新しいデベロッパー向けサーフェス。Gemini API を統合すると、新しい Firebase Extensions、Project IDX の開発ワークスペース全体、または新しくリリースされた Google AI Dart SDK を使用して、AI を活用した新しい機能を今すぐビルドできます。
Gemini 1.0 Pro の料金を引き下げ。また、多くの AI タスクに対して費用とパフォーマンスのバランスに優れた 1.0 Pro モデルも更新しています。現在の安定版の料金は、テキスト入力については 50%、出力については 25% も以前に発表したものよりも低くなっています。AI Studio の従量課金プランは近日公開予定です。

12 月以降、あらゆる規模のデベロッパーが Gemini モデルを使用してビルドしており、Google AI Studio の最先端の研究を初期のデベロッパー向けプロダクトに反映できることを嬉しく思います。大きなコンテキストウィンドウ機能は試験運用であるため、このプレビュー版ではレイテンシが発生する可能性がありますが、モデルのファインチューニングを続け、皆様からのフィードバックを得ながら段階的に公開していけることを楽しみにしています。私たちと同じく、早い段階からお試しいただければ幸いです。

投稿先:

Gemini 1.5: 次世代モデルが Google AI Studio で限定公開プレビュー版として登場

100 万トークン: デベロッパーのための新しいユースケースを実現

2）コード リポジトリ全体にクエリを実行する

3）動画全編を追加する

Gemini モデルを使用したビルド方法をデベロッパーにより多く提供

2）コードリポジトリ全体にクエリを実行する