Google I/O 2024 のまとめ: AI をすべてのデベロッパーにとって身近で便利なものに

5月 14, 2024
Jeanine Banks Vice President & General Manager Developer X

今年の Google I/O にご参加いただきありがとうございます。AI は、私たちが作るものや、その作り方を根本から変えようとしています。私たちは、この新たな現実の中でイノベーションを起こすために必要なツールを提供することを通して、AI をすべてのデベロッパーにとって身近で便利なものにすることに取り組んでいます。ここでは、開発スタック全体でどのような取り組みを行っているかについて、詳しく説明します。


ジェネレーティブ AI

モデルと API を提供して、驚異的な AI 搭載アプリケーションを開発できるようにします。


200 万コンテキスト ウィンドウに対応した新しい Gemini 1.5 Flash と 1.5 Pro

1.5 Flash を使って、ワークフローを効率化し、AI 搭載アプリケーションを最適化しましょう。1.5 Flash は、Google AI Studio の Gemini API からアクセスできる高頻度タスク用のモデルです。Gemini 1.5 Flash と 1.5 Pro は、EEA(およびEU)、英国、スイスを含む 200 以上の国と地域で公開プレビュー版として利用できます。1.5 Pro の画期的な 200 万コンテキスト ウィンドウも試してみたいデベロッパーは、Google AI Studio の待機リストに登録してください。


コンテキスト キャッシュなどの新しい API 機能

Gemini API で、並列関数呼び出しと動画フレーム抽出をサポートしました。また、来月登場する新しいコンテキスト キャッシュ機能を使うと、頻繁に使用されるコンテキスト ファイルを低コストでキャッシュできるので、大きなプロンプトが必要なワークフローを効率化できます。この機能は、既存の作業に基づいてコンテンツのアイデアについてブレインストーミングしたり、複雑なドキュメントを分析したり、研究論文やトレーニング資料の要約を提供したりするといったシナリオに最適です。


オープンモデル ファミリーの Gemma

Gemini と同じリサーチとテクノロジーで構築されたオープンモデル、Gemma ファミリーに対するコミュニティからの反応は大変刺激的です。今年(ブログ投稿へのリンク)には、CodeGemma と RecurrentGemma を追加しました。そして本日は、マルチモーダル視覚言語タスク用に、PaliGemma を紹介します。また、公開前の Gemma 2 もこっそりとお披露目しました。27B のパラメータを持つこのモデルは、2 倍のサイズのモデルよりも優秀で、1 つの TPUv5e で実行できます。


オープン エコシステム

私たちのオープンなツール エコシステムなら、AI スタックのすべてのレイヤーで自由度と柔軟性を活用できます。Keras を使って TensorFlow や PyTorch、JAX でワークフローを実行することも、Colab で Keras と LoRA を使ってモデルを簡単にファイン チューニングすることも、OpenXLA を使ってトレーニング速度を向上させることも、RAPIDS cuDF を使って Colab のワークロードを高速化することもできます。


Google AI Edge

モバイルやウェブなどのエッジ環境に ML をデプロイしましょう。すぐに使える ML タスク、すべてオンデバイスで実行できる人気 LLM、独自のカスタムモデルやモデル パイプラインを導入できる機能など、Google AI Edge には効率的な一連のツールが用意されています。TensorFlow Lite のサポートが拡大され、モバイルユーザーに直接 PyTorch モデルを提供することもできます。また、Tensorflow Lite の改善により、これまで以上に簡単にデバイスに AI を導入できるようになっています。


Gemini API デベロッパー コンペティション

Gemini API デベロッパー コンペティションに参加し、Gemini API を使って画期的なアプリケーションを作成しましょう。1981 年のデロリアンのカスタム電気自動車など、特別な賞品を獲得できるチャンスです。皆さんのイノベーションあふれる Gemini API 活用法を見るのが楽しみです。AI の境界を再定義し、未来を明るいものにするようなアプリをお待ちしています。ポジティブなインパクトを生み出すアプリでも、実用的なソリューションを提供するアプリでも、創造性の限界を押し広げるアプリでも構いません。AI の展望に皆さんの足跡を残す絶好の機会です。


モバイル開発

Android で優れた AI 拡張エクスペリエンスを実現し、強力な API、ツール、ガイダンスでデベロッパーの生産性を向上させます。


Android Studio の Gemini

昨年は、Android 向けの AI コーディング コンパニオンとして、Studio Bot を導入しました。皆さんのフィードバックのおかげで、モデルを進化させ、200 以上の国と地域に拡大し、安定版をリリースすることができました。さらに先月には、Android Studio に Gemini を導入し、Gemini エコシステムにも加わることになりました。その目的は、高品質の Android アプリを短い時間で簡単に開発できるようにすることです。今年後半には、Android Studio の Gemini が Gemini 1.5 Pro によるマルチモーダル入力をサポートする予定です。


Gemini Nano と AICore

Gemini Nano は、最も効率がよく、ユーザーのモバイルデバイスで直接実行できるオンデバイス タスク用のモデルです。これを実行すれば、モバイル ネットワークの圏内かどうかに関係なく、低レイテンシで応答でき、強固なデータ プライバシーを実現できます。それを可能にするのが、AICore です。AICore は、オンデバイスの基本モデルを管理するシステム サービスで、これを使うことで、大規模言語モデルの配布を手動管理する必要はなくなります。Gemini Nano と AICore は、現在 Pixel 8 Pro と Samsung Galaxy S24 シリーズで利用できます。今年中に、さらに多くの対応デバイスが追加される予定です。


Androidの Kotlin マルチプラットフォーム(KMP)

プラットフォーム間でアプリのビジネス ロジックを共有し、KMP の新しい Android ファーストクラス サポートを活用することで、生産性を向上させましょう。現在は、DataStore や Room など、一部の Jetpack ライブラリがサポートされています。今年中に、さらに多くのライブラリをサポートする予定です。


Jetpack Compose

アダプティブで美しいユーザー エクスペリエンスの開発、パフォーマンスの最適化、シームレスなトランジションの作成を実現します。また、マテリアル ガイドをベースにした API を使えば、デバイス間で手間をかけずにレイアウトを調整できます。AI によるタッチペン手書き認識などの入力処理の効率化や、Jetpack Glance でカスタマイズ可能なウィジェットの作成も可能です。サイズ変更可能なエミュレータと Compose UI チェックモードなら、テストも安心です。Android 15 の生成済みプレビューで、ウィジェットを見つけやすくすることもできます。


ウェブ開発

開発の質を向上させ、これまで以上に簡単にウェブを強化します。


Chrome の Gemini Nano

WebGPU と WebAssembly、そして今回の Gemini Nano の導入によって、PC 版 Chrome で新しい内蔵 AI 機能が提供され、オンデバイス AI のパワーを活用できるようになります。幅広いデバイスを対象に開発できるので、スケーラビリティ、手頃さ、プライバシーが向上します。早期プレビュー プログラムに参加し、新しいウェブ API で AI 開発を身近にする未来を作りましょう。


推測ルール API

わずか数行のコードで実装できる新しい API を使えば、面倒なページ読み込みを扱うことなく、高速でシームレスなブラウジング エクスペリエンスを実現できます。この API は、バックグラウンドでのページのプリフェッチとプリレンダリングを行ってくれるので、ミリ秒単位でページを読み込めるようになります。AI を使ってナビゲーション パターンをインテリジェントに予測すれば、さらに最適化を進め、リソースのプリロードを最大限に効率化することもできます。


マルチページ サイト用のビュー トランジション API

Chrome Canary 126 では、マルチページ アプリ向けの大幅なアップグレードが行われています。これにより、さまざまなアーキテクチャのウェブサイトで、スムーズなナビゲーション エクスペリエンスを実現できます。推測ルールと AI を組み合わせたビュー トランジション API は、シームレスなページ トランジションをほぼ瞬時に実現できるので、あらゆるデベロッパーにとって、ウェブアプリとのインタラクションの可能性が広がります。


Chrome DevTools コンソールによる知見

Chrome DevTools コンソールで、AI による知見を得ることができます。DevTools のエラーと警告について、Gemini が説明と解決策を提供してくれるので、デバッグ プロセスを大幅に効率化できます。


フルスタック、マルチプラットフォーム開発

AI 対応のフルスタック アプリをビルド、テスト、公開し、ユーザーが必要とするすべてのプラットフォームで問題なく動作するようにします。


Project IDX オープンベータ版

AI を搭載したフルスタック、マルチプラットフォーム アプリ向けの効率的な開発エクスペリエンスを体験しましょう。待機リストはなくなり、誰でも利用できるようになっています。登録済みのテンプレートから簡単に始めることも、既存のプロジェクトをインポートすることも、ゼロから始めることもできます。IDX には、Chrome DevTools、Lighthouse、Cloud Run など、簡単にマルチリージョンにデプロイできるようにするために欠かせない機能が新たに組み込まれています。


Flutter、Dart の WASM、Impeller など

Flutter 3.22 と Dart 3.4 では、大きなグラフィックスとアプリのパフォーマンスが向上します。Android の Impeller では、ラスタライゼーションのパフォーマンスが最大 30% 向上します。WASM コンパイルがサポートされたことで、ウェブで美しいビジュアルや AI モデルの効率的な実行を提供できます。また、Dart デベロッパー エクスペリエンスの生産性をさらに向上させることを目的とした新しい試験運用版言語機能、Dart マクロもお試しいただけます。


最新の AI 搭載アプリ向けに進化する Firebase

Firebase Data Connect と CloudSQL を使えば、アプリを PostgreSQL データベースに接続できます。Google Cloud のセキュリティとスケーラビリティ、そして Firebase App Hosting による GitHub からの効率的なデプロイによって、最新のウェブアプリを短時間で公開しましょう。Gemini や Gemma のモデルを使って、すぐに動作する本番稼働可能な AI 機能を作成して監視するなら、Firebase Genkit をお試しください。また、NVIDIA とのコラボレーションにより、Gemma モデルでの推論パフォーマンスが最適化されているので、RTX GPU で Genkit をローカル実行し、Ollama と Gemma を動作させることで、パフォーマンスを向上させることができます。


Checks

Checks は、Google の AI 搭載コンプライアンス プラットフォームです。これを使うと、アプリのプライバシーとコンプライアンスのワークフローをシンプルにできます。Checks Code Compliance は、コードの作成中にコンプライアンスの問題を監視および検出し、アプリケーションの安全性と品質を確保します。iOS と Android のデベロッパーは、すぐに Checks を利用できます。


リソース

Google のリソース、トレーニング、スケールを最大限に活用して、デベロッパー エクスペリエンスを向上させましょう。


Google デベロッパー プログラム

無料で Gemini にアクセスできる、Google のドキュメントを学んだり、検索したり、チャットしたりできるなど、新しいプログラムのメリットをご覧ください。IDX ユーザーなら、3 つのワークスペースが追加されるので、合計 5 つのワークスペースを作成できます。また、Google Cloud Innovators コミュニティにも参加している方は、Google Cloud Skills Boost のインタラクティブ ラボの学習クレジットを取得できます。今すぐ登録しましょう


まだ始まったばかり

私たちが行っているミッションは、皆さんの大きな構想や既存のプロジェクトの実現をお手伝いすることです。ツールやプラットフォームでイノベーションを起こし続け、一緒に未来を作り上げてゆきましょう。

5 月 16 日午前 8 時(太平洋時間)より、150 以上のセッションと学習コンテンツがオンデマンド形式で公開されます。Google I/O の発表や最新情報は、すべてここから確認できます。Google I/O のマジックはまだまだ続きます。皆さんのお近くの町で開催される I/O Connect や I/O Extended イベントへの参加をお待ちしています。