검색

7 결과

필터 지우기
  • 2025년 6월 26일 / Gemma

    Gemma 3n 소개: 개발자 가이드

    이전 Gemma 모델의 성공을 기반으로 정식 출시된 Gemma 3n 모델은 전례 없는 성능으로 에지 기기에 고급 온디바이스 멀티모달 기능을 제공합니다. 모바일 우선 아키텍처, MatFormer 기술, Per-Layer Embeddings, KV Cache Sharing, 새로운 오디오와 MobileNet-V5 비전 인코더 등 Gemma 3n의 다양한 혁신뿐만 아니라 개발자가 오늘부터 바로 Gemma 3n 모델을 사용하여 개발을 시작하는 방법을 살펴보세요.

    Introducing Gemma 3n: The Developer Guide
  • 2025년 6월 24일 / Gemini

    로봇 공학 및 체화 지능을 위한 Gemini 2.5

    Gemini 2.5 Pro 및 Flash는 코딩, 추론, 멀티모달 기능(공간 이해 능력 포함)을 강화하여 로봇 공학에 변화를 일으키고 있습니다. 해당 모델은 의미론적 장면 이해, 로봇 제어용 코드 생성, Live API를 통한 인터랙티브 애플리케이션 빌드를 위해 사용되며, 안전성을 개선하고 커뮤니티를 위해 기술을 활용하는 데 중점을 두고 있습니다.

    Gemini 2.5 for robotics and embodied intelligence
  • 2025년 5월 20일 / Gemma

    Gemma 3n 미리보기 발표: 강력하고 효율적인 모바일 우선 AI

    Gemma 3n은 기기의 빠른 멀티모달 AI를 위해 설계된 최첨단 개방형 모델로, 최적화된 성능, 2-in-1 모델의 고유한 유연성, 오디오를 통한 확장된 멀티모달 이해 기능을 갖추고 있어 개발자가 양방향 라이브 애플리케이션과 정교한 오디오 중심 경험을 구축할 수 있도록 지원합니다.

    Gemma 3n
  • 2025년 5월 9일 / DeepMind

    Gemini 2.5를 통해 동영상 이해의 한계를 넓히기

    Gemini 2.5는 주요 동영상 이해 벤치마크에서 최첨단 성능을 달성하고 코드 및 기타 데이터 형식을 이용해 시청각 정보를 원활하게 활용하며 동영상 이해의 중대한 도약을 보여주었습니다.

    2.5Pro_Metadata_VideoUnderstanding
  • 2025년 4월 30일 / Gemma

    Gemma 설명: Gemma 3의 새로운 기능

    Gemma 3의 새로운 기능에는 이전 Gemma 모델에 비해 향상된 메모리 효율성과 더 긴 컨텍스트 처리를 위한 비전 언어 기능 및 아키텍처 변경 사항이 포함됩니다.

    What's new in Gemma-3
  • 2025년 4월 23일 / Gemini

    Achieve real-time interaction: Build with the Live API

    Explore real world applications for the Live API for Gemini models, now updated to include enhanced features for real-time audio, video, and text processing, improved session management, control over interactions, and richer output options.

    gemini-live-api-meta
  • 2024년 11월 20일 / Gemini

    Gemini Flash로 시각적 설명 처리에서 30% 비용 절감 달성한 OpusClip

    OpusClip은 Gemini 1.5 Flash의 멀티모달 기능을 활용해 동영상 이해도를 높이고 콘텐츠 제작 과정을 간소화했습니다. 이는 비용 절감과 참여도 증가라는 결과로 이어졌습니다.

    OpusClip_metadata