Gemini API에서 Gemini Embedding 정식 출시

2025년 7월 14일
Min Choi Product Manager

이제 Gemini API 및 Vertex AI의 모든 개발자가 첫 번째 Gemini Embedding 텍스트 모델(gemini-embedding-001)을 사용할 수 있습니다.

이 임베딩 모델은 3월에 시험 출시된 이후 지속적으로 MTEB(Massive Text Embedding Benchmark) 다국어 리더보드에서 상위권을 차지했습니다.

저희의 이전 텍스트 모델과 타사 제품을 검색부터 분류까지 다양한 작업에서 능가한 gemini-embedding-001은 과학, 법률, 금융, 코딩 등 다양한 영역에서 통합된 최첨단 경험을 제공합니다. 다음은 Gemini Embedding이 상업적으로 이용 가능한 다른 독점 모델을 비교한 것입니다.

Embedings Chart
*기존 Google 모델은 세 Gemini API 및 VertexAI 모델, text-embedding-004, text-embedding-005 및 text-multilingual-embedding-002에서 가장 높은 점수를 조합한 결과물입니다.

자세한 결과는 Google의 기술 보고서에서 확인하실 수 있습니다*.


모델 세부 정보

놀라울 만큼 용도가 다양한 모델인 Gemini Embedding은 100개 이상의 언어를 지원하고 입력 토큰 길이가 최대 2,048입니다.

또한 MRL(Matryoshka Representation Learning) 기술을 활용하여 개발자가 출력 차원을 기존의 3072에서 축소할 수 있도록 합니다. 이러한 유연성을 통해 특정한 필요에 맞게 성능과 저장용량 비용을 최적화할 수 있습니다.


속도 제한 및 가격

저희는 Gemini API의 무료 플랜과 유료 플랜을 모두 제공합니다. 따라서 gemini-embedding-001을 무료로 경험하거나 생산 요구 사항에 맞게 훨씬 더 높은 제한으로 속도를 높일 수 있습니다.

Gemini Embedding 모델의 가격백만 입력 토큰당 0.15달러입니다.


Gemini Embedding으로 개발 시작하기

개발자는 이제 Google AI Studio에서 무료로 이용할 수 있는 Gemini API를 통해 Gemini Embedding 모델(gemini-embedding-001)에 액세스할 수 있습니다.

이 모델은 기존 embed_content 엔드포인트와 호환됩니다.

from google import genai
 
client = genai.Client()
 
result = client.models.embed_content(
        model="gemini-embedding-001",
        contents="What is the meaning of life?"
)
 
print(result.embeddings)
Python

시작하려면 다음 공식 개발자 문서와 설명서를 확인하세요.

시험용 gemini-embedding-exp-03-07을 이용 중이면 콘텐츠를 다시 임베드하지 않아도 되지만, 2025년 8월 14일부터 더 이상 Gemini API가 지원하지 않을 것입니다. 기존 모델 또한 다음 일정에 따라 지원이 중단될 예정입니다.

  • embedding-001: 2025년 8월 14일

  • text-embedding-004: 2026년 1월 14일

최대한 일찍 최신 모델에 프로젝트를 마이그레이션하도록 적극 권장합니다.

Gemini Embedding으로 이전에는 불가능했던 새로운 이용 사례를 실현할 모습이 기다려집니다. 또한 곧 Batch API에서 Gemini Embedding을 지원하여 더 낮은 비용으로 데이터를 비동기 처리할 수 있을 예정입니다.

더 폭넓은 모달리티와 능력을 탑재한 임베딩 모델과 관련한 향후 발표를 지켜봐 주세요!


*발표된 논문의 MTEB 벤치마크 결과는 2025년 3월에 출시된 Gemini Embedding의 시험용 버전을 반영합니다.