1 年前、私たちは Gemini を世界に向けて発表しました。この最先端のマルチモーダル モデル ファミリーは、主要な AI ベンチマークで最高水準の結果を打ち出し、新たな基準を設定することになりました。そしてこの 12 か月間で、ML のエキスパートやデベロッパーと協力しながら、この AI モデルを使ってすばらしいものを開発してきました。本日は、Gemini のリリース 1 周年を記念して、これまで皆さんと一緒に進めてきたことを振り返ってみましょう。
世界中の何百万人ものデベロッパーが、Google AI Studio や Gemini API を使ってイノベーションを起こし、画期的なアプリケーションを新しく公開したり、強力な AI 機能を使って既存のアプリケーションを強化したりしています。
特に印象に残っているのは、皆さんが ユーザーのために AI を活用している方法です。そしてたくさんの方が Gemini API デベロッパー コンペティションに参加し、インパクトのあるクリエイティブで便利なアプリを開発しました。最優秀賞を獲得した Jayu パーソナル アシスタントや、ピープルズ チョイス アワードを受賞した Vite Vere 自立支援アプリなどはその代表です。
Gemini の進化は、皆さんのフィードバックと、皆さんが開発したアプリケーションが直接もたらした結果です。Gemini 1.5 Pro では、圧倒的なパフォーマンスとロング コンテキスト ウィンドウを活用できますが、アプリ向けに高速で費用対効果の高い選択肢も必要であることを認識しました。そこで導入したのが、Gemini 1.5 Flash でした。これは、あっという間に一番人気のあるモデルになりました。また、皆さんに何が一番役立つかをすばやく知ることができるように、試験運用版モデルを継続的にリリースし、教訓を得るスピードを上げています。Gemini Nano のオンデバイス機能に対する反応は非常に好意的で、Chrome ハッカソンや Android プレビューには数千人もの方が参加しています。
デベロッパーができることを増やすため、モデルとツールの両方を改善しています。Gemini API には関数呼び出しと検索グラウンディングの機能が追加され、さらに強力なものになっています。また、Google AI Studio は、Gemma オープンモデルをすばやく評価する機能をはじめとして、多彩なモデルをサポートするようになっており、近日中にさらに機能を追加する予定です。
私たちは、すべての人が強力な AI を利用できるようにすることを目指しています。Gemini と同じ基盤を使って開発したオープンモデル ファミリー Gemma をリリースしたのはそのためです。さまざまなサイズの Gemma が公開されているので、独自のデータでモデルを自由にカスタマイズしたり、専用のハードウェアで実行したりできる柔軟性があります。Gemma 2 は、2B、9B、27B というパラメータのバージョンで利用でき、オープンでありながらも大型モデルを上回る性能を発揮します。2B モデルはモバイル デバイスでも動作します。Gemma モデルの利便性をさらに向上させる取り組みも進んでおり、DataGemma、GemmaScope、そしてつい先日発表された PaliGemma 2 など、新しい革新的な研究モデルがリリースされています。
Navarasa は、9 つのインド言語でチューニングしたコミュニティ Gemma バリアントです。こういったモデルにより、デベロッパーがユーザーの言語に特化したモデルを利用できるようになっています。
Link to Youtube Video (visible only when JS is disabled)
心強いことに、Gemma 言語モデルを中心に、活気に満ちたコミュニティが成長しています。Hugging Face では、5 万以上のバリエーションのモデルが公開されています。このコラボレーション精神が業界全体のイノベーションを推進します。とりわけうれしいのは、Gemma が言語の壁を打ち破るのに役立っていることです。世界の言語に向けてモデルをファインチューニングできるのは、Gemma トークナイザーがあるからです。そのおかげで、Kaggle コミュニティからグローバルな理解を促進する Gemma モデルが生まれています。
Gemini モデルや Gemma モデルには直接アクセスすることもできますが、デベロッパー ツール全般から Gemini と連携できるようにすることで、生産性を高めてアプリの質を向上できるようにしています。Gemini モデルをさまざまな方法で活用することで、Android Studio、Chrome Dev Tools、Colab、Firebase、Google Cloud、IDX のすべてで、高品質なコードの作成や質問への回答ができるようにしています。さらに、Gemini Code Assist を通して、お気に入りの IDE で Gemini を使うこともできます。GitHub CoPilot もその 1 つです。
また、AI の役割を拡大し、コード支援を超えて開発ライフサイクル全体をサポートできるようにしています。たとえば Android Studio の Gemini は、ルーチンタスクの自動化やボイラープレート コードの生成のみならず、潜在的なバグの予測までできます。
ソフトウェア開発における AI の未来は信じられないほど明るいものです。数日先、数週間先、数か月先には、さらなるイノベーションが起こるでしょう。今年の I/O で紹介した試験運用版データ サイエンス エージェントから、その未来を垣間見ることができます。その他の開発にも積極的に取り組んでいます。
私たちは、AI の可能性の限界を押し広げる作業に取り組んでいます。パイプラインでは興味深い開発も進行中で、近いうちに皆さんにお披露目するのが待ちきれません。