검색

118 결과

필터 지우기
  • 2025년 7월 21일 / Gemini

    Gemini 2.5의 대화형 이미지 분할 기능

    Gemini의 고급 기능인 대화형 이미지 분할 기능을 사용하면 복잡한 문구와 조건부 로직, 추상적인 개념을 파악하고, 개발자 경험을 간소화하며, 미디어 편집, 안전 모니터링 및 피해 평가를 위한 새로운 애플리케이션의 가능성을 열어 시각적 데이터와 직관적으로 상호작용을 할 수 있습니다.

    Conversational image segmentation with Gemini 2.5
  • 2025년 7월 17일 / Gemini

    이제 Gemini API에서 사용할 수 있는 Veo 3로 개발하세요

    Google의 최신 AI 동영상 생성 모델인 Veo 3가 현재 Gemini API 및 Google AI Studio를 통해 유료 미리보기로 제공됩니다. Google I/O 2025에서 공개된 Veo 3는 대화, 배경 소리, 동물 소리까지도 포함해, 동영상과 이에 동기화된 오디오를 모두 생성할 수 있습니다. 이 모델은 화면상의 동작과 일치하는 정확한 립 싱크 및 사운드로 사실적인 비주얼, 자연스러운 조명, 물리 표현을 제공합니다.

    Build with Veo 3, now available in the Gemini API and Google AI Studio
  • 2025년 7월 16일 / Gemini

    ADK 및 Gemini CLI로 에이전트의 '바이브 빌딩' 흐름 간소화

    업데이트된 ADK(에이전트 개발 키트)는 CLI에 ADK 프레임워크에 대한 심층적이고 비용 효율적인 이해를 제공함으로써 AI 에이전트 개발 프로세스를 간소화하고 가속화합니다. 덕분에 개발자는 대화형 프롬프트를 통해 신속하게 기능적인 에이전트에 대한 아이디어를 구상하고, 에이전트를 생성하고, 테스트하고, 개선할 수 있으며, 방해 요소를 없애고, 생산적인 작업의 '흐름(flow)' 상태를 유지할 수 있습니다.

    ADK + Gemini CLI: Supercharge Your Agent Building Vibe
  • 2025년 7월 14일 / Gemini

    Gemini API에서 Gemini Embedding 정식 출시

    Gemini Embedding 텍스트 모델이 Gemini API 및 Vertex AI에서 정식 출시되었습니다. 이 다용도 모델은 3월에 시험 출시된 이후 MTEB 다국어 리더보드에 지속적으로 1위를 차지했으며, 100개 이상의 언어를 지원하고, 입력 토큰 길이가 최대 2,048입니다. 이 모델의 가격은 백만 입력 토큰당 0.15달러입니다.

    Gemini Embedding now generally available in the Gemini API
  • 2025년 7월 10일 / Cloud

    Firebase Studio로 에이전트 AI 개발 진전

    Firebase Studio의 업데이트에는 새로운 에이전트 모드, MCP(Model Context Protocol)에 대한 기본적인 지원, Gemini CLI 통합이 포함됩니다. 이 모든 것은 AI 지원 개발을 재정의하도록 설계되어 개발자가 단일 프롬프트에서 풀 스택 애플리케이션을 만들고 강력한 AI 기능을 워크플로에 직접 통합할 수 있도록 합니다.

    Advancing agentic AI development with Firebase Studio
  • 2025년 7월 9일 / Gemma

    T5Gemma: 새로운 인코더-디코더 Gemma 모델 컬렉션

    T5Gemma는 Gemma 2 프레임워크를 기반으로 사전 학습된 디코더 전용 모델을 변환 및 조정하여 개발된 새로운 인코더-디코더 LLM 제품군입니다. 특히 요약 및 번역같이 입력 데이터에 대한 심층적 이해가 필요한 작업을 할 때 디코더 전용 모델에 비해 뛰어난 성능과 효율성을 제공합니다.

    T5Gemma: A New Collection of Encoder-Decoder Gemma Models
  • 2025년 7월 7일 / Gemini

    Gemini API의 일괄 모드: 더욱 저렴한 가격으로 가능해지는 더 많은 작업

    Gemini API의 새로운 일괄 모드는 처리량이 많고 지연 시간이 중요하지 않은 AI 워크로드를 위해 설계되었습니다. 일괄 모드는 예약 및 처리를 수행하여 대규모 작업을 단순화하고 데이터 분석, 대규모 콘텐츠 생성, 모델 평가와 같은 작업을 한층 비용 효율적이고 확장 가능하게 만들어 개발자가 대량의 데이터를 효율적으로 처리할 수 있게 합니다.

    Scale your AI workloads with batch mode in the Gemini API
  • 2025년 6월 26일 / Gemma

    Gemma 3n 소개: 개발자 가이드

    이전 Gemma 모델의 성공을 기반으로 정식 출시된 Gemma 3n 모델은 전례 없는 성능으로 에지 기기에 고급 온디바이스 멀티모달 기능을 제공합니다. 모바일 우선 아키텍처, MatFormer 기술, Per-Layer Embeddings, KV Cache Sharing, 새로운 오디오와 MobileNet-V5 비전 인코더 등 Gemma 3n의 다양한 혁신뿐만 아니라 개발자가 오늘부터 바로 Gemma 3n 모델을 사용하여 개발을 시작하는 방법을 살펴보세요.

    Introducing Gemma 3n: The Developer Guide
  • 2025년 6월 24일 / Gemini

    노트북 강화: 이제 누구나 새로운 AI 우선 Google Colab 사용 가능

    새로운 AI 우선 Google Colab은 대화형 코딩을 위한 반복 쿼리, 자율 워크플로를 위한 차세대 Data Science Agent, 손쉬운 코드 변환 같은 기능의 개선을 통해 생산성을 향상시킵니다. 얼리 어답터들은 ML 프로젝트를 가속화하고, 코드를 더 빠르게 디버깅하며, 고품질 시각화를 손쉽게 생성하는 등 생산성을 대폭 끌어올릴 수 있었다고 전합니다.

    Supercharge your notebooks: The new AI-first Google Colab is now available to everyone
  • 2025년 6월 24일 / Gemini

    Imagen 4, 이제 Gemini API와 Google AI Studio에서 사용 가능

    Google의 고급 텍스트-이미지 모델인 Imagen 4를 이제 Gemini API와 Google AI Studio에서 유료 미리보기로 사용할 수 있습니다. 특히 이미지 내 텍스트 생성에 대해 상당히 향상된 수준의 품질을 제공합니다. Imagen 4 제품군에는 일반 작업을 위한 Imagen 4와 고정밀 프롬프트 준수를 위한 Imagen 4 Ultra가 포함되어 있으며, 생성된 모든 이미지에는 보이지 않는 SynthID 워터마크가 있습니다.

    Imagen 4 is now available on Gemini API and Google AI Studio