Gemini を掘り下げる: AI Studio でスターター アプリを使ってみる

12月 18, 2024
Kat Kampf Product Manager Google AI Studio

Gemini 2.0 を使って開発を始める準備はできていますか?Google は、Gemini のコア機能を活用して、今後の AI プロジェクト用の強固な基盤を提供するように設計された一連のスターター アプリをリリースしました。これらのアプリは単純なデモではなく、飛躍のための出発点となるものです。また、オープンソースとして GitHub で公開されており、Google AI Studio とシームレスに統合されます。

デベロッパーは Google AI Studio 内でこれらスターター アプリをすでに活用して、すばらしいデモやプロトタイプを作成しています。Bilawal Sidhu 氏が Google AI Studio 内で動画アナライザー アプリを使用して、動画の要約デモをどのように作成したかをご覧ください。著名なデベロッパー兼ライターの Simon Willison 氏も、最近のブログ記事でこれらのアプリを取り上げ、迅速なプロトタイピングや実験に役立つことを強調しています。

これらスターター アプリが、特に効率化された Google AI Studio 環境内で何を提供するのか、そして開発ワークフローをどのように加速するのかについて詳しく説明しましょう。


1. 空間認識: このアプリで高度なシーン認識を可能にする

Google AI Studio で利用可能になった空間認識アプリを使用すると、洗練された視覚 AI を使用してアプリケーションを作成できます。このアプリは Gemini の画像分析能力を示すものであり、高度な 2D および 3D 境界ボックス機能などにより、基本的な物体認識を超えて、空間的な位置関係を細かく認識できるようにします。

  • 高度な空間的推論を使ってみる: Google AI Studio のユーザー フレンドリーなインターフェースを介して、画像内の物体間の空間的な位置関係を認識する Gemini の機能を試してみましょう。

  • 2D と 3D の境界ボックスを試す: 単純な物体検知を超えた機能を提供します。このアプリを使用すると、試験運用版 3D 境界ボックスなど、Gemini の高度な境界ボックス機能を活用して、物体の位置をより正確に特定できます。

  • 複雑なユースケースに即座に取り組む: ロボット工学、拡張現実、画像ベース検索、複雑な視覚データの自動分析などのアプリケーションに最適です。高度な空間的推論用の構成要素をすぐに使えます。

  • GitHub でコードをさらに掘り下げる: アプリをカスタマイズしたり、独自のプロジェクトに統合したいですか?ソースコード全体を GitHub で入手して、特定のニーズに合わせてカスタマイズすることができます。

Link to Youtube Video (visible only when JS is disabled)

2. 動画アナライザー: このフレームワークでインタラクティブな動画エクスペリエンスを構築する

Google AI Studio ですぐに使用できる動画アナライザー アプリは、高度な方法で動画コンテンツと連携するアプリケーションを作成するためのフレームワークを提供します。このインタラクティブな動画プレーヤーは、Gemini を使用して動画ストリームからさまざまなデータを抽出します。

  • 動画インタラクションのための迅速なプロトタイピング: Google AI Studio を使用して、要約、シーンの説明、テキスト抽出など、動画インタラクションのプロトタイプをすばやく作成できます。

  • 物体を検出して追跡する: 動画内の物体を識別して追跡する Gemini の機能を試してみましょう。

  • ニーズに合わせてカスタマイズする: コア機能を簡単に拡張して、カスタム動画検索ツール、コンテンツ自動タグ付けシステム、インタラクティブな教育プラットフォームなど、思いつくものは何でも作成できます。

  • GitHub でコード全体にアクセスする: 高度なカスタマイズと統合が必要な方は、GitHub でコードベース全体を入手できます。

Link to Youtube Video (visible only when JS is disabled)

3.マップ エクスプローラー: Gemini のインテリジェンスと Google Maps API を融合させて、ロケーションベースのイノベーションを実現する

新たに Google AI Studio に付属するようになったマップ エクスプローラー アプリは、インテリジェントな位置認識機能を備えたアプリケーションを作成するための入り口と言えます。Gemini の推論能力と Google Maps API のパワーをシームレスに統合します。

  • 会話型な位置発見: Gemini の会話型 AI は、自然言語によるクエリを通じて、位置を見つけることができるようにします。効率化された Google AI Studio インターフェース内で実際に試してみてください。

  • ロケーションベースのインタラクションを体験する: ロケーションベースのインタラクションのプロトタイプを作成し、Gemini と Google Maps API の組み合わせの可能性を探ります。

  • ロケーションベース サービスの基盤: 次世代の旅行計画ツール、ロケーションベースのゲーム、インテリジェントなレコメンデーション システムを構築しましょう。このアプリは、これらの構築に不可欠な土台を提供します。

  • GitHub でカスタマイズと拡張を行う: ソースコード全体は GitHub でも入手できるので、コア機能を基に構築して独自のプロジェクトに統合するといった柔軟性が実現します。


スターター アプリを使って実践的に学ぶ

これらのアプリですぐに貢献できる

アプリの使用を開始する際の大変な作業は完了していますので、最先端の AI エクスペリエンスをすぐに構築することができます。これらのスタータ アプリは単なるサンプルではありません。皆さん自身の革新的なプロジェクトの出発点になるように設計されています。

できること:

  • リポジトリのクローン: ソースコードに即座にアクセスして探索を開始する。

  • カスタマイズと拡張: 特定のニーズに合わせてアプリを調整したり、既存の機能に基づいて構築したりする。

  • プロジェクトに統合: これらの機能を既存のアプリケーションにシームレスに統合する。

  • コミュニティへの貢献: 全ユーザーのために、機能強化を共有して、Google がこれらのツールを改善できるようにする。

  • Google AI Studio でアプリを試す: Google AI Studio 内でアプリを直接使用して、プロトタイピングと実験を迅速に行う。

  • Gemini の可能性の限界を押し広げる準備はできていますか?アプリのクローン作成や開発を通して、創造できるものを世界にアピールしましょう!https://github.com/google-gemini/starter-applets


皆さんが作るものを見るのを楽しみにしています。プロジェクトやフィードバックをコメントやデベロッパー フォーラムで共有してください!