- Google Developers Blog

2025년 10월 15일 / AI

Veo 3.1 및 Gemini API의 새로운 크리에이티브 기능 출시

Google은 업데이트된 동영상 생성 모델인 Veo 3.1 및 Veo 3.1 Fast를 Gemini API에서 유료 미리보기로 출시합니다. 이 버전은 더 풍부한 네이티브 오디오, 더 좋아진 내러티브 제어, 향상된 이미지-동영상 변환 기능을 제공합니다. 새로 추가된 기능에는 참조 이미지를 사용한 생성 안내, 기존 Veo 동영상 확장, 프레임 간 전환 효과 생성 등이 있습니다. Promise Studios, Latitude, Whering과 같은 기업들은 이미 다양한 애플리케이션에 Veo 3.1을 사용하고 있습니다.

2025년 9월 5일 / Mobile

Google AI Edge Gallery: 이제 오디오와 Google Play에서 사용 가능

Google AI Edge는 오디오 지원을 포함하도록 Gemma 3n 미리보기를 확장했습니다. 사용자는 Google AI Edge Gallery를 사용하여 자신의 휴대전화로 재생할 수 있습니다. 현재 Play 스토어의 공개 베타 버전으로 제공됩니다.

2025년 9월 4일 / Gemma

EmbeddingGemma 출시: 온디바이스 임베딩을 위한 동급 최고의 개방형 모델

EmbeddingGemma 출시: Google의 효율적인 온디바이스 AI 애플리케이션용으로 설계된 임베딩 모델이 새로 출시되었습니다. 이 개방형 모델은 MTEB 벤치마크에서 5억 개 미만의 매개변수를 기준으로 최고 순위를 기록한 텍스트 전용 다국어 임베딩 모델로, 인터넷 연결 없이 모바일 기기에서 직접 RAG 및 시맨틱 검색 같은 강력한 기능을 지원합니다.

2025년 8월 15일 / Google AI Studio

Gemini API에서 Imagen 4 제품군의 정식 버전 출시 및 Imagen 4 Fast 발표

Google은 Gemini API 및 Google AI Studio에서 Imagen 4의 정식 버전을 선보입니다. Imagen 4는 고급 텍스트-이미지 변환 모델로서 크게 향상된 텍스트 렌더링이 특징입니다. 속도와 빠른 이미지 생성을 위해 설계된 새로운 Imagen 4 Fast 모델은 Imagen 4 및 Imagen 4 Ultra와 함께 사용할 수 있습니다. Imagen 4와 Imagen 4 Ultra는 최대 2K 해상도의 이미지 생성도 지원합니다.

Imagen 4 Fast and the generally availability of the Imagen 4 family in the Gemini API

2025년 7월 31일 / AI

Veo 3 Fast와 새로운 이미지-동영상 변환 기능

Google은 속도와 가격을 최적화한 모델인 Veo 3 Fast와 더불어 Veo 3 및 Veo 3 Fast를 위한 새로운 이미지-동영상 변환 기능을 소개합니다. 이를 통해 개발자는 텍스트 또는 스틸 이미지에서 고품질의 동영상 콘텐츠를 효율적으로 제작할 수 있으며, 가격은 모델 종류와 오디오 포함 여부에 따라 달라집니다. 현재 Gemini API에서 이용 가능합니다.

Build with Veo 3 Fast and new image-to-video capabilities, now available in the Gemini API

2025년 7월 24일 / Google Labs

Opal 소개: 설명만으로 제작하고, 공유하는 AI 미니 앱

Opal은 Google Labs가 선보이는 새로운 실험용 도구로, 코드 없이 자연어만을 사용하여 프롬프트를 역동적인 다단계 미니 앱으로 변환할 수 있도록 지원합니다. 사용자는 강력한 기능은 물론 기존 Google 도구와 원활하게 통합하여 공유가 가능한 AI 앱을 제작하고 배포할 수 있습니다.

2025년 7월 17일 / Gemini

이제 Gemini API에서 사용할 수 있는 Veo 3로 개발하세요

Google의 최신 AI 동영상 생성 모델인 Veo 3가 현재 Gemini API 및 Google AI Studio를 통해 유료 미리보기로 제공됩니다. Google I/O 2025에서 공개된 Veo 3는 대화, 배경 소리, 동물 소리까지도 포함해, 동영상과 이에 동기화된 오디오를 모두 생성할 수 있습니다. 이 모델은 화면상의 동작과 일치하는 정확한 립 싱크 및 사운드로 사실적인 비주얼, 자연스러운 조명, 물리 표현을 제공합니다.

Build with Veo 3, now available in the Gemini API and Google AI Studio

2025년 7월 14일 / Gemini

Gemini API에서 Gemini Embedding 정식 출시

Gemini Embedding 텍스트 모델이 Gemini API 및 Vertex AI에서 정식 출시되었습니다. 이 다용도 모델은 3월에 시험 출시된 이후 MTEB 다국어 리더보드에 지속적으로 1위를 차지했으며, 100개 이상의 언어를 지원하고, 입력 토큰 길이가 최대 2,048입니다. 이 모델의 가격은 백만 입력 토큰당 0.15달러입니다.

Gemini Embedding now generally available in the Gemini API

2025년 7월 10일 / Cloud

Firebase Studio로 에이전트 AI 개발 진전

Firebase Studio의 업데이트에는 새로운 에이전트 모드, MCP(Model Context Protocol)에 대한 기본적인 지원, Gemini CLI 통합이 포함됩니다. 이 모든 것은 AI 지원 개발을 재정의하도록 설계되어 개발자가 단일 프롬프트에서 풀 스택 애플리케이션을 만들고 강력한 AI 기능을 워크플로에 직접 통합할 수 있도록 합니다.

Advancing agentic AI development with Firebase Studio

2025년 7월 9일 / Gemma

T5Gemma: 새로운 인코더-디코더 Gemma 모델 컬렉션

T5Gemma는 Gemma 2 프레임워크를 기반으로 사전 학습된 디코더 전용 모델을 변환 및 조정하여 개발된 새로운 인코더-디코더 LLM 제품군입니다. 특히 요약 및 번역같이 입력 데이터에 대한 심층적 이해가 필요한 작업을 할 때 디코더 전용 모델에 비해 뛰어난 성능과 효율성을 제공합니다.

검색

콘텐츠 유형

제품

기술