검색

256 결과

필터 지우기
  • 2025년 7월 21일 / Gemini

    Gemini 2.5의 대화형 이미지 분할 기능

    Gemini의 고급 기능인 대화형 이미지 분할 기능을 사용하면 복잡한 문구와 조건부 로직, 추상적인 개념을 파악하고, 개발자 경험을 간소화하며, 미디어 편집, 안전 모니터링 및 피해 평가를 위한 새로운 애플리케이션의 가능성을 열어 시각적 데이터와 직관적으로 상호작용을 할 수 있습니다.

    Conversational image segmentation with Gemini 2.5
  • 2025년 7월 17일 / Gemini

    이제 Gemini API에서 사용할 수 있는 Veo 3로 개발하세요

    Google의 최신 AI 동영상 생성 모델인 Veo 3가 현재 Gemini API 및 Google AI Studio를 통해 유료 미리보기로 제공됩니다. Google I/O 2025에서 공개된 Veo 3는 대화, 배경 소리, 동물 소리까지도 포함해, 동영상과 이에 동기화된 오디오를 모두 생성할 수 있습니다. 이 모델은 화면상의 동작과 일치하는 정확한 립 싱크 및 사운드로 사실적인 비주얼, 자연스러운 조명, 물리 표현을 제공합니다.

    Build with Veo 3, now available in the Gemini API and Google AI Studio
  • 2025년 7월 16일 / AI

    Gemini의 추론 과정 이해하기: Vertex AI의 로그 확률에 대한 단계별 안내

    '로그 확률' 기능이 Vertex AI의 Gemini API에 공식적으로 도입되었습니다. 이 기능은 선택된 대체 토큰의 확률 점수를 표시하여 모델의 의사 결정에 대한 인사이트를 제공합니다. 이 단계별 안내에서는 이 기능을 활성화 및 해석하고 확실한 분류, 동적 자동 완성, 정량적 RAG 평가 등 다양한 사용 사례에 적용하는 방법을 소개합니다.

    logprobs_meta
  • 2025년 7월 16일 / Cloud

    Stanford의 Marin 파운데이션 모델: JAX를 사용하여 개발된 최초의 완전 개방형 모델

    Marin 프로젝트는 AI에서 ‘개방형(open)’의 개념을 단순히 모델 공유에 국한하지 않고, 전체 과학적 프로세스를 모두 접근 가능하고 재현 가능하게 만드는 것으로 확장하고자 합니다. 이러한 노력은 JAX 프레임워크와 그 Levanter 도구를 활용해, 파운데이션 모델을 깊이 있게 검토하고 신뢰하며 그를 토대로 새로운 작업을 구축할 수 있게 하여 AI 연구에 있어 보다 투명한 미래를 도모합니다.

    Stanford Marin project in JAX
  • 2025년 7월 16일 / Gemini

    ADK 및 Gemini CLI로 에이전트의 '바이브 빌딩' 흐름 간소화

    업데이트된 ADK(에이전트 개발 키트)는 CLI에 ADK 프레임워크에 대한 심층적이고 비용 효율적인 이해를 제공함으로써 AI 에이전트 개발 프로세스를 간소화하고 가속화합니다. 덕분에 개발자는 대화형 프롬프트를 통해 신속하게 기능적인 에이전트에 대한 아이디어를 구상하고, 에이전트를 생성하고, 테스트하고, 개선할 수 있으며, 방해 요소를 없애고, 생산적인 작업의 '흐름(flow)' 상태를 유지할 수 있습니다.

    ADK + Gemini CLI: Supercharge Your Agent Building Vibe
  • 2025년 7월 14일 / Cloud

    엔터프라이즈 신뢰성 실현: 강력한 개발자 포털의 기반이 되는 Apigee API 허브

    Apigee API 허브와 개발자 포털은 분리되어 있지만, Apigee 플랫폼과 상호 연결되어 다양한 상황에서 조직이 API를 파악하고 관리할 수 있게 도와주며, API의 잠재력을 극대화하여 혁신을 가속합니다.

    Enterprise Truth in Action: API hub Fueling Powerful Developer Portals
  • 2025년 7월 14일 / Gemini

    Gemini API에서 Gemini Embedding 정식 출시

    Gemini Embedding 텍스트 모델이 Gemini API 및 Vertex AI에서 정식 출시되었습니다. 이 다용도 모델은 3월에 시험 출시된 이후 MTEB 다국어 리더보드에 지속적으로 1위를 차지했으며, 100개 이상의 언어를 지원하고, 입력 토큰 길이가 최대 2,048입니다. 이 모델의 가격은 백만 입력 토큰당 0.15달러입니다.

    Gemini Embedding now generally available in the Gemini API
  • 2025년 7월 10일 / Gemini

    GenAI 프로세서 발표: 강력하고 유연한 Gemini 애플리케이션 개발

    GenAI 프로세서는 Google DeepMind의 새로운 오픈소스 Python 라이브러리입니다. 원활한 체이닝과 동시 실행을 위해 입력 처리부터 모델 호출 및 출력 처리까지 모든 단계를 위한 일관된 'Processor' 인터페이스를 제공함으로써 AI 애플리케이션, 특히 멀티모달 입력을 처리하고 실시간 응답성을 요하는 애플리케이션 개발을 간소화할 수 있도록 설계되었습니다.

    Announcing GenAI Processors: Streamline your Gemini application development
  • 2025년 7월 10일 / Cloud

    Firebase Studio로 에이전트 AI 개발 진전

    Firebase Studio의 업데이트에는 새로운 에이전트 모드, MCP(Model Context Protocol)에 대한 기본적인 지원, Gemini CLI 통합이 포함됩니다. 이 모든 것은 AI 지원 개발을 재정의하도록 설계되어 개발자가 단일 프롬프트에서 풀 스택 애플리케이션을 만들고 강력한 AI 기능을 워크플로에 직접 통합할 수 있도록 합니다.

    Advancing agentic AI development with Firebase Studio
  • 2025년 7월 9일 / Gemma

    T5Gemma: 새로운 인코더-디코더 Gemma 모델 컬렉션

    T5Gemma는 Gemma 2 프레임워크를 기반으로 사전 학습된 디코더 전용 모델을 변환 및 조정하여 개발된 새로운 인코더-디코더 LLM 제품군입니다. 특히 요약 및 번역같이 입력 데이터에 대한 심층적 이해가 필요한 작업을 할 때 디코더 전용 모델에 비해 뛰어난 성능과 효율성을 제공합니다.

    T5Gemma: A New Collection of Encoder-Decoder Gemma Models