검색

56 결과

필터 지우기
  • 2025년 10월 15일 / AI

    Coral NPU 소개: Edge AI를 위한 풀 스택 플랫폼

    Coral NPU는 성능, 단편화 및 사용자 신뢰 부족 문제를 해결하는 Edge AI용 풀 스택 플랫폼입니다. 이 플랫폼은 ML 행렬 엔진을 우선하는 AI 우선 아키텍처이며 통합된 개발자 경험을 제공합니다. 초저전력 상시 가동 AI를 위한 웨어러블 기기 및 IoT를 위해 설계된 Coral NPU는 하드웨어 기반의 프라이버시 보호를 통해 상황 인식, 오디오/이미지 처리, 사용자 상호작용을 지원합니다. Synaptics는 Coral NPU를 최초로 구현한 파트너사입니다.

    blogpost
  • 2025년 10월 15일 / AI

    Veo 3.1 및 Gemini API의 새로운 크리에이티브 기능 출시

    Google은 업데이트된 동영상 생성 모델인 Veo 3.1 및 Veo 3.1 Fast를 Gemini API에서 유료 미리보기로 출시합니다. 이 버전은 더 풍부한 네이티브 오디오, 더 좋아진 내러티브 제어, 향상된 이미지-동영상 변환 기능을 제공합니다. 새로 추가된 기능에는 참조 이미지를 사용한 생성 안내, 기존 Veo 동영상 확장, 프레임 간 전환 효과 생성 등이 있습니다. Promise Studios, Latitude, Whering과 같은 기업들은 이미 다양한 애플리케이션에 Veo 3.1을 사용하고 있습니다.

    Veo3.1_16x9_meta
  • 2025년 10월 8일 / Web

    나만의 AI: Gemma 3 270M을 파인 튜닝하고 온디바이스에서 실행하는 방법 알아보기

    이 가이드에서는 이모티콘 변환기 같은 사용자 설정 작업을 위해 Gemma 3 270M 모델을 파인 튜닝하는 방법을 설명합니다. 온디바이스 사용을 위해 모델을 양자화 및 변환하고, MediaPipe나 Transformers.js로 웹 앱에 모델을 배포하는 방법에 대해 알아보세요. 이를 통해 빠르고 개인적이며 오프라인에서 사용 가능한 사용자 경험을 구현할 수 있습니다.

    OYOAI_Metadata_RD2-V01
  • 2025년 10월 7일 / AI

    Grain 및 ArrayRecord를 사용하여 고성능 데이터 파이프라인 구축

    대규모 모델을 학습시킬 때 생길 수 있는 데이터 병목 현상을 방지하기 위해, 이 가이드는 고성능 데이터 파이프라인 구축을 위한 Grain과 ArrayRecord를 소개합니다.

    The Agentic experience: Is MCP the right tool for your AI future?
  • 2025년 10월 1일 / AI

    Gemini로 다중 스펙트럼 데이터 활용

    인간의 눈으로는 볼 수 없는 파장을 포착하는 다중 스펙트럼 이미지는 세상을 이해하는 '초인적' 방법을 제공합니다. Google의 Gemini 모델은 특화된 학습 없이도 이 방법을 손쉽게 활용할 수 있도록 지원합니다. 보이지 않는 대역을 RGB 채널에 매핑하고 프롬프트에서 컨텍스트를 제공함으로써 개발자는 환경 모니터링 및 농업 같은 분야의 다양한 작업에 Gemini의 힘을 활용할 수 있습니다.

    MultiSpectral-Metadatal_RD1-V01
  • 2025년 9월 25일 / AI

    Gemini Robotics-ER 1.5로 차세대 물리적 에이전트 개발

    현재 개발자가 사용할 수 있는 Gemini Robotics-ER 1.5는 로봇용으로 구현된 최첨단 추론 모델입니다. 이 모델은 시각 인식, 공간 이해, 작업 계획, 진행 상황 추정에서 탁월한 성능을 발휘하여 로봇이 복잡한 다단계 작업을 수행할 수 있도록 지원합니다.

    Robotics-ER 1.5_Metadatal_RD6-V01
  • 2025년 9월 24일 / AI

    Data Commons MCP(Model Context Protocol) 서버 출시: AI 개발자의 공공 데이터 액세스 간소화

    Data Commons는 MCP 서버의 출시를 발표했습니다. 이는 전 세계 AI 개발자가 Data Commons의 모든 방대한 공개 데이터 세트에 즉시 액세스하고 활용할 수 있도록 하는 주요한 이정표입니다.

    BLOG-HERO-A2
  • 2025년 9월 16일 / AI

    LangChain4j 통합을 통해 타사 언어 모델에도 개방되는 자바용 ADK

    최근 Google은 자바용 ADK(Agent Development Kit) 0.2.0 출시를 통해 LangChain4j LLM 프레임워크와의 통합을 추가했습니다. 이번 통합 덕분에...

    adk-langchain4j
  • 2025년 8월 12일 / Kaggle

    TPU에서 JAX를 사용한 GPT2 모델 무료 학습

    무료 요금제의 Colab 또는 Kaggle에서 실행 가능한 완벽한 Python 노트북으로 Google TPU에서 JAX를 사용해 GPT2 모델을 처음부터 개발하고 학습시키세요. 하드웨어 메시를 정의하고, 모델 매개변수와 입력 데이터를 데이터 병렬 처리에 맞게 분할하고, 모델 학습 프로세스를 최적화하는 방법을 알아보세요.

    Train a GPT2 model with JAX on TPU for free
  • 2025년 7월 21일 / Gemini

    Gemini 2.5의 대화형 이미지 분할 기능

    Gemini의 고급 기능인 대화형 이미지 분할 기능을 사용하면 복잡한 문구와 조건부 로직, 추상적인 개념을 파악하고, 개발자 경험을 간소화하며, 미디어 편집, 안전 모니터링 및 피해 평가를 위한 새로운 애플리케이션의 가능성을 열어 시각적 데이터와 직관적으로 상호작용을 할 수 있습니다.

    Conversational image segmentation with Gemini 2.5