先週、Gemini Advanced の Gemini 1.0 Ultra をリリースしました。Gemini Advanced サブスクリプションにサインアップすることで、今すぐ試すことができます。Gemini API からアクセスできる 1.0 Ultra モデルは多くの関心を集めており、Google AI Studio の一部のデベロッパーやパートナーへ展開を続けています。
本日は、新しい Mixture-of-Experts(MoE)アプローチを採用して効率を向上させた、次世代の Gemini 1.5 モデルをご紹介します。このモデルは、リクエストを小規模な「エキスパート」ニューラル ネットワークのグループにルーティングするため、レスポンスがより速く、より高品質になります。
デベロッパーは、Gemini 1.5 Pro の限定公開プレビュー版にサインアップできます。Gemini 1.5 Pro は、幅広いタスクにわたってスケーリングできるよう最適化された中規模のマルチモーダル モデルです。このモデルは、100 万トークンを処理できる新しい試験運用版のコンテキスト ウィンドウを備えており、Google AI Studio で試すことができます。Google AI Studio は、Gemini モデルを使用してビルドする最速の方法であり、デベロッパーは Gemini API をアプリケーションに簡単に統合できます。180 以上の国と地域で 38 の言語で利用可能です。
これまで、一般公開されている大規模言語モデルの世界最大のコンテキスト ウィンドウは 20 万トークンでしたが、これを大幅に増やすことができました。最大 100 万トークンを一貫して実行でき、大規模な基盤モデルの中で最長のコンテキスト ウィンドウを達成しました。Gemini 1.5 Pro には、デフォルトで 12 万 8,000 トークンのコンテキスト ウィンドウが搭載されていますが、今回の限定公開プレビュー版では、試験運用的に 100 万トークンのコンテキスト ウィンドウを利用できます。
Google は、大きくなったコンテキスト ウィンドウが実現する新しい可能性に大きな期待を寄せています。Google AI Studio では、大きな PDF、コード リポジトリ、あるいは長い動画をプロンプトとして直接アップロードできます。Gemini 1.5 Pro はモダリティを超えて推論し、テキストを出力します。
1)複数のファイルをアップロードして質問する
デベロッパーが PDF などの複数のファイルをアップロードし、Google AI Studio で質問できる機能を追加しました。コンテキスト ウィンドウが大きくなったことで、モデルはより多くの情報を取り込むことができ、より一貫性、関連性、有用性の高い出力ができるようになります。この 100 万トークンのコンテキスト ウィンドウを使用すると、一度に 70 万語以上のテキストを読み込むことが可能です。
大きなコンテキスト ウィンドウでは、コードベース全体の詳細な分析も可能になり、Gemini モデルが複雑な関係、パターン、コードを理解するのに役立ちます。デベロッパーは自分のパソコンから直接、または Google ドライブ経由で新しいコードベースをアップロードし、モデルにより迅速にオンボーディングして、コードを理解できます。
Gemini 1.5 Pro は、最大 1 時間の動画を推論することもできます。動画を添付すると、Google AI Studio はそれを何千ものフレーム(音声なし)に分割します。そして、Gemini モデルはマルチモーダルであるため、高度な推論と問題解決タスクを実行できます。
最新のモデル イノベーションを提供するだけでなく、Gemini でのビルドがより簡単になりました。
12 月以降、あらゆる規模のデベロッパーが Gemini モデルを使用してビルドしており、Google AI Studio の最先端の研究を初期のデベロッパー向けプロダクトに反映できることを嬉しく思います。大きなコンテキスト ウィンドウ機能は試験運用であるため、このプレビュー版ではレイテンシが発生する可能性がありますが、モデルのファイン チューニングを続け、皆様からのフィードバックを得ながら段階的に公開していけることを楽しみにしています。私たちと同じく、早い段階からお試しいただければ幸いです。