5 결과
2025년 7월 31일 / AI
Google은 속도와 가격을 최적화한 모델인 Veo 3 Fast와 더불어 Veo 3 및 Veo 3 Fast를 위한 새로운 이미지-동영상 변환 기능을 소개합니다. 이를 통해 개발자는 텍스트 또는 스틸 이미지에서 고품질의 동영상 콘텐츠를 효율적으로 제작할 수 있으며, 가격은 모델 종류와 오디오 포함 여부에 따라 달라집니다. 현재 Gemini API에서 이용 가능합니다.
2025년 7월 17일 / Gemini
Google의 최신 AI 동영상 생성 모델인 Veo 3가 현재 Gemini API 및 Google AI Studio를 통해 유료 미리보기로 제공됩니다. Google I/O 2025에서 공개된 Veo 3는 대화, 배경 소리, 동물 소리까지도 포함해, 동영상과 이에 동기화된 오디오를 모두 생성할 수 있습니다. 이 모델은 화면상의 동작과 일치하는 정확한 립 싱크 및 사운드로 사실적인 비주얼, 자연스러운 조명, 물리 표현을 제공합니다.
2025년 7월 10일 / Gemini
GenAI 프로세서는 Google DeepMind의 새로운 오픈소스 Python 라이브러리입니다. 원활한 체이닝과 동시 실행을 위해 입력 처리부터 모델 호출 및 출력 처리까지 모든 단계를 위한 일관된 'Processor' 인터페이스를 제공함으로써 AI 애플리케이션, 특히 멀티모달 입력을 처리하고 실시간 응답성을 요하는 애플리케이션 개발을 간소화할 수 있도록 설계되었습니다.
2025년 6월 24일 / Gemini
Google의 고급 텍스트-이미지 모델인 Imagen 4를 이제 Gemini API와 Google AI Studio에서 유료 미리보기로 사용할 수 있습니다. 특히 이미지 내 텍스트 생성에 대해 상당히 향상된 수준의 품질을 제공합니다. Imagen 4 제품군에는 일반 작업을 위한 Imagen 4와 고정밀 프롬프트 준수를 위한 Imagen 4 Ultra가 포함되어 있으며, 생성된 모든 이미지에는 보이지 않는 SynthID 워터마크가 있습니다.
2025년 6월 24일 / Gemini
Gemini 2.5 Pro 및 Flash는 코딩, 추론, 멀티모달 기능(공간 이해 능력 포함)을 강화하여 로봇 공학에 변화를 일으키고 있습니다. 해당 모델은 의미론적 장면 이해, 로봇 제어용 코드 생성, Live API를 통한 인터랙티브 애플리케이션 빌드를 위해 사용되며, 안전성을 개선하고 커뮤니티를 위해 기술을 활용하는 데 중점을 두고 있습니다.