검색

42 결과

필터 지우기
  • 2025년 9월 5일 / Mobile

    Google AI Edge Gallery: 이제 오디오와 Google Play에서 사용 가능

    Google AI Edge는 오디오 지원을 포함하도록 Gemma 3n 미리보기를 확장했습니다. 사용자는 Google AI Edge Gallery를 사용하여 자신의 휴대전화로 재생할 수 있습니다. 현재 Play 스토어의 공개 베타 버전으로 제공됩니다.

    google-ai-edge-gallery
  • 2025년 9월 4일 / Gemma

    EmbeddingGemma 출시: 온디바이스 임베딩을 위한 동급 최고의 개방형 모델

    EmbeddingGemma 출시: Google의 효율적인 온디바이스 AI 애플리케이션용으로 설계된 임베딩 모델이 새로 출시되었습니다. 이 개방형 모델은 MTEB 벤치마크에서 5억 개 미만의 매개변수를 기준으로 최고 순위를 기록한 텍스트 전용 다국어 임베딩 모델로, 인터넷 연결 없이 모바일 기기에서 직접 RAG 및 시맨틱 검색 같은 강력한 기능을 지원합니다.

    EmbeddingGemma_Metadata
  • 2025년 8월 15일 / Google AI Studio

    Gemini API에서 Imagen 4 제품군의 정식 버전 출시 및 Imagen 4 Fast 발표

    Google은 Gemini API 및 Google AI Studio에서 Imagen 4의 정식 버전을 선보입니다. Imagen 4는 고급 텍스트-이미지 변환 모델로서 크게 향상된 텍스트 렌더링이 특징입니다. 속도와 빠른 이미지 생성을 위해 설계된 새로운 Imagen 4 Fast 모델은 Imagen 4 및 Imagen 4 Ultra와 함께 사용할 수 있습니다. Imagen 4와 Imagen 4 Ultra는 최대 2K 해상도의 이미지 생성도 지원합니다.

    Imagen 4 Fast and the generally availability of the Imagen 4 family in the Gemini API
  • 2025년 7월 31일 / AI

    Veo 3 Fast와 새로운 이미지-동영상 변환 기능

    Google은 속도와 가격을 최적화한 모델인 Veo 3 Fast와 더불어 Veo 3 및 Veo 3 Fast를 위한 새로운 이미지-동영상 변환 기능을 소개합니다. 이를 통해 개발자는 텍스트 또는 스틸 이미지에서 고품질의 동영상 콘텐츠를 효율적으로 제작할 수 있으며, 가격은 모델 종류와 오디오 포함 여부에 따라 달라집니다. 현재 Gemini API에서 이용 가능합니다.

    Build with Veo 3 Fast and new image-to-video capabilities, now available in the Gemini API
  • 2025년 7월 24일 / Google Labs

    Opal 소개: 설명만으로 제작하고, 공유하는 AI 미니 앱

    Opal은 Google Labs가 선보이는 새로운 실험용 도구로, 코드 없이 자연어만을 사용하여 프롬프트를 역동적인 다단계 미니 앱으로 변환할 수 있도록 지원합니다. 사용자는 강력한 기능은 물론 기존 Google 도구와 원활하게 통합하여 공유가 가능한 AI 앱을 제작하고 배포할 수 있습니다.

    Opal Metadata card
  • 2025년 7월 17일 / Gemini

    이제 Gemini API에서 사용할 수 있는 Veo 3로 개발하세요

    Google의 최신 AI 동영상 생성 모델인 Veo 3가 현재 Gemini API 및 Google AI Studio를 통해 유료 미리보기로 제공됩니다. Google I/O 2025에서 공개된 Veo 3는 대화, 배경 소리, 동물 소리까지도 포함해, 동영상과 이에 동기화된 오디오를 모두 생성할 수 있습니다. 이 모델은 화면상의 동작과 일치하는 정확한 립 싱크 및 사운드로 사실적인 비주얼, 자연스러운 조명, 물리 표현을 제공합니다.

    Build with Veo 3, now available in the Gemini API and Google AI Studio
  • 2025년 7월 14일 / Gemini

    Gemini API에서 Gemini Embedding 정식 출시

    Gemini Embedding 텍스트 모델이 Gemini API 및 Vertex AI에서 정식 출시되었습니다. 이 다용도 모델은 3월에 시험 출시된 이후 MTEB 다국어 리더보드에 지속적으로 1위를 차지했으며, 100개 이상의 언어를 지원하고, 입력 토큰 길이가 최대 2,048입니다. 이 모델의 가격은 백만 입력 토큰당 0.15달러입니다.

    Gemini Embedding now generally available in the Gemini API
  • 2025년 7월 10일 / Cloud

    Firebase Studio로 에이전트 AI 개발 진전

    Firebase Studio의 업데이트에는 새로운 에이전트 모드, MCP(Model Context Protocol)에 대한 기본적인 지원, Gemini CLI 통합이 포함됩니다. 이 모든 것은 AI 지원 개발을 재정의하도록 설계되어 개발자가 단일 프롬프트에서 풀 스택 애플리케이션을 만들고 강력한 AI 기능을 워크플로에 직접 통합할 수 있도록 합니다.

    Advancing agentic AI development with Firebase Studio
  • 2025년 7월 9일 / Gemma

    T5Gemma: 새로운 인코더-디코더 Gemma 모델 컬렉션

    T5Gemma는 Gemma 2 프레임워크를 기반으로 사전 학습된 디코더 전용 모델을 변환 및 조정하여 개발된 새로운 인코더-디코더 LLM 제품군입니다. 특히 요약 및 번역같이 입력 데이터에 대한 심층적 이해가 필요한 작업을 할 때 디코더 전용 모델에 비해 뛰어난 성능과 효율성을 제공합니다.

    T5Gemma: A New Collection of Encoder-Decoder Gemma Models
  • 2025년 7월 7일 / Gemini

    Gemini API의 일괄 모드: 더욱 저렴한 가격으로 가능해지는 더 많은 작업

    Gemini API의 새로운 일괄 모드는 처리량이 많고 지연 시간이 중요하지 않은 AI 워크로드를 위해 설계되었습니다. 일괄 모드는 예약 및 처리를 수행하여 대규모 작업을 단순화하고 데이터 분석, 대규모 콘텐츠 생성, 모델 평가와 같은 작업을 한층 비용 효율적이고 확장 가능하게 만들어 개발자가 대량의 데이터를 효율적으로 처리할 수 있게 합니다.

    Scale your AI workloads with batch mode in the Gemini API