検索

7 結果

フィルタをクリアする
  • 2025年6月26日 / Gemma

    Introducing Gemma 3n: The developer guide

    The Gemma 3n model has been fully released, building on the success of previous Gemma models and bringing advanced on-device multimodal capabilities to edge devices with unprecedented performance. Explore Gemma 3n's innovations, including its mobile-first architecture, MatFormer technology, Per-Layer Embeddings, KV Cache Sharing, and new audio and MobileNet-V5 vision encoders, and how developers can start building with it today.

    Introducing Gemma 3n: The Developer Guide
  • 2025年6月24日 / Gemini

    ロボティクスと身体性知能(Embodied Intelligence)を実現する Gemini 2.5

    コーディング、推論、空間理解を含むマルチモーダル機能が強化された Gemini 2.5 Pro および Flash が、ロボティクスに変革を起こします。この 2 つのモデルは、安全性の向上とコミュニティ アプリケーションに重点を置いており、場面の意味の理解、ロボット制御コードの生成、Live API によるインタラクティブ アプリケーションの開発に役立てることができます。

    Gemini 2.5 for robotics and embodied intelligence
  • 2025年5月20日 / Gemma

    Gemma 3n プレビュー版のお知らせ: パワフルで効率的なモバイルファースト AI

    最先端のオープンモデル Gemma 3n は、オンデバイスで高速に動作するマルチモーダル AI として設計されています。最適化されたパフォーマンス、独自の 2-in-1 モデルによる柔軟性、オーディオによるマルチモーダル理解の強化といった特徴を持ち、インタラクティブなリアルタイム アプリケーションや洗練されたオーディオ中心のエクスペリエンスを開発できるようになっています。

    Gemma 3n
  • 2025年5月9日 / DeepMind

    Gemini 2.5 で動画理解の新たな地平を切り開く

    Gemini 2.5 は動画理解における大きな飛躍です。主要な動画理解ベンチマークで最高水準のパフォーマンスを達成しており、コードやその他のデータ形式で視聴覚情報をシームレスに使用することができます。

    2.5Pro_Metadata_VideoUnderstanding
  • 2025年4月30日 / Gemma

    Gemma 徹底解説: Gemma 3 の新機能

    Gemma 3 の新機能には、ビジョン言語機能やアーキテクチャの変更が含まれています。以前の Gemma モデルよりもメモリ効率が改善され、長いコンテキストを処理できるようになっています。

    What's new in Gemma-3
  • 2025年4月23日 / Gemini

    リアルタイム インタラクションの実現: Live API を使って開発する

    Gemini モデル向け Live API を使った実際のアプリケーションをご覧ください。オーディオ、動画、テキストのリアルタイム処理機能の強化、セッション管理の改善、インタラクションの制御、出力オプションの増加といったアップデートが行われています。

    gemini-live-api-meta
  • 2024年11月20日 / Gemini

    OpusClip が Gemini Flash による視覚描写処理でコストを 30% 削減

    OpusClip は、Gemini 1.5 Flash のマルチモーダル機能で動画認識機能を強化し、コンテンツ作成の効率化、コスト削減、エンゲージメントの向上を実現しました。

    OpusClip_metadata