검색

5 결과

필터 지우기
  • 2025년 5월 20일 / Gemma

    Gemma 3n 미리보기 발표: 강력하고 효율적인 모바일 우선 AI

    Gemma 3n은 기기의 빠른 멀티모달 AI를 위해 설계된 최첨단 개방형 모델로, 최적화된 성능, 2-in-1 모델의 고유한 유연성, 오디오를 통한 확장된 멀티모달 이해 기능을 갖추고 있어 개발자가 양방향 라이브 애플리케이션과 정교한 오디오 중심 경험을 구축할 수 있도록 지원합니다.

    Gemma 3n
  • 2025년 5월 9일 / DeepMind

    Gemini 2.5를 통해 동영상 이해의 한계를 넓히기

    Gemini 2.5는 주요 동영상 이해 벤치마크에서 최첨단 성능을 달성하고 코드 및 기타 데이터 형식을 이용해 시청각 정보를 원활하게 활용하며 동영상 이해의 중대한 도약을 보여주었습니다.

    2.5Pro_Metadata_VideoUnderstanding
  • 2025년 4월 30일 / Gemma

    Gemma 설명: Gemma 3의 새로운 기능

    Gemma 3의 새로운 기능에는 이전 Gemma 모델에 비해 향상된 메모리 효율성과 더 긴 컨텍스트 처리를 위한 비전 언어 기능 및 아키텍처 변경 사항이 포함됩니다.

    What's new in Gemma-3
  • 2025년 4월 23일 / Gemini

    Achieve real-time interaction: Build with the Live API

    Explore real world applications for the Live API for Gemini models, now updated to include enhanced features for real-time audio, video, and text processing, improved session management, control over interactions, and richer output options.

    gemini-live-api-meta
  • 2024년 11월 20일 / Gemini

    Gemini Flash로 시각적 설명 처리에서 30% 비용 절감 달성한 OpusClip

    OpusClip은 Gemini 1.5 Flash의 멀티모달 기능을 활용해 동영상 이해도를 높이고 콘텐츠 제작 과정을 간소화했습니다. 이는 비용 절감과 참여도 증가라는 결과로 이어졌습니다.

    OpusClip_metadata