検索

4 結果

フィルタをクリアする
  • 2025年5月9日 / DeepMind

    Gemini 2.5 で動画理解の新たな地平を切り開く

    Gemini 2.5 は動画理解における大きな飛躍です。主要な動画理解ベンチマークで最高水準のパフォーマンスを達成しており、コードやその他のデータ形式で視聴覚情報をシームレスに使用することができます。

    2.5Pro_Metadata_VideoUnderstanding
  • 2025年4月30日 / Gemma

    Gemma 徹底解説: Gemma 3 の新機能

    Gemma 3 の新機能には、ビジョン言語機能やアーキテクチャの変更が含まれています。以前の Gemma モデルよりもメモリ効率が改善され、長いコンテキストを処理できるようになっています。

    What's new in Gemma-3
  • 2025年4月23日 / Gemini

    リアルタイム インタラクションの実現: Live API を使って開発する

    Gemini モデル向け Live API を使った実際のアプリケーションをご覧ください。オーディオ、動画、テキストのリアルタイム処理機能の強化、セッション管理の改善、インタラクションの制御、出力オプションの増加といったアップデートが行われています。

    gemini-live-api-meta
  • 2024年11月20日 / Gemini

    OpusClip が Gemini Flash による視覚描写処理でコストを 30% 削減

    OpusClip は、Gemini 1.5 Flash のマルチモーダル機能で動画認識機能を強化し、コンテンツ作成の効率化、コスト削減、エンゲージメントの向上を実現しました。

    OpusClip_metadata