이제 Gemini API 및 Vertex AI의 모든 개발자가 첫 번째 Gemini Embedding 텍스트 모델(gemini-embedding-001
)을 사용할 수 있습니다.
이 임베딩 모델은 3월에 시험 출시된 이후 지속적으로 MTEB(Massive Text Embedding Benchmark) 다국어 리더보드에서 상위권을 차지했습니다.
저희의 이전 텍스트 모델과 타사 제품을 검색부터 분류까지 다양한 작업에서 능가한 gemini-embedding-001
은 과학, 법률, 금융, 코딩 등 다양한 영역에서 통합된 최첨단 경험을 제공합니다. 다음은 Gemini Embedding이 상업적으로 이용 가능한 다른 독점 모델을 비교한 것입니다.
자세한 결과는 Google의 기술 보고서에서 확인하실 수 있습니다*.
놀라울 만큼 용도가 다양한 모델인 Gemini Embedding은 100개 이상의 언어를 지원하고 입력 토큰 길이가 최대 2,048입니다.
또한 MRL(Matryoshka Representation Learning) 기술을 활용하여 개발자가 출력 차원을 기존의 3072에서 축소할 수 있도록 합니다. 이러한 유연성을 통해 특정한 필요에 맞게 성능과 저장용량 비용을 최적화할 수 있습니다.
저희는 Gemini API의 무료 플랜과 유료 플랜을 모두 제공합니다. 따라서 gemini-embedding-001
을 무료로 경험하거나 생산 요구 사항에 맞게 훨씬 더 높은 제한으로 속도를 높일 수 있습니다.
Gemini Embedding 모델의 가격은 백만 입력 토큰당 0.15달러입니다.
개발자는 이제 Google AI Studio에서 무료로 이용할 수 있는 Gemini API를 통해 Gemini Embedding 모델(gemini-embedding-001
)에 액세스할 수 있습니다.
이 모델은 기존 embed_content 엔드포인트와 호환됩니다.
from google import genai
client = genai.Client()
result = client.models.embed_content(
model="gemini-embedding-001",
contents="What is the meaning of life?"
)
print(result.embeddings)
시작하려면 다음 공식 개발자 문서와 설명서를 확인하세요.
시험용 gemini-embedding-exp-03-07을 이용 중이면 콘텐츠를 다시 임베드하지 않아도 되지만, 2025년 8월 14일부터 더 이상 Gemini API가 지원하지 않을 것입니다. 기존 모델 또한 다음 일정에 따라 지원이 중단될 예정입니다.
최대한 일찍 최신 모델에 프로젝트를 마이그레이션하도록 적극 권장합니다.
Gemini Embedding으로 이전에는 불가능했던 새로운 이용 사례를 실현할 모습이 기다려집니다. 또한 곧 Batch API에서 Gemini Embedding을 지원하여 더 낮은 비용으로 데이터를 비동기 처리할 수 있을 예정입니다.
더 폭넓은 모달리티와 능력을 탑재한 임베딩 모델과 관련한 향후 발표를 지켜봐 주세요!
*발표된 논문의 MTEB 벤치마크 결과는 2025년 3월에 출시된 Gemini Embedding의 시험용 버전을 반영합니다.