Gemini 2.0 Flash의 네이티브 이미지 생성 실험

3월 12, 2025
Kat Kampf Product Manager Google AI Studio
Nicole Brichtova Product Manager Google DeepMind

저희는 지난 12월에 신뢰할 수 있는 테스터들을 위해 Gemini 2.0 Flash에서 네이티브 이미지 출력을 처음 선보였습니다. 현재는 Google AI Studio에서 지원하는 모든 지역에서 이를 개발자 실험에 사용할 수 있도록 하고 있습니다. Google AI Studio에서 Gemini 2.0 Flash의 시험용 버전(gemini-2.0-flash-exp)과 Gemini API를 사용하여 이 새로운 기능을 테스트할 수 있습니다.

Gemini 2.0 Flash는 멀티모달 입력, 향상된 추론, 자연어 이해를 조합하여 이미지를 만듭니다.

다음은 2.0 Flash의 멀티모달 출력이 빛을 발하는 작업의 예시입니다.


1. 텍스트와 이미지를 함께

Gemini 2.0 Flash를 사용하여 스토리를 전달하면 그림과 함께 이야기를 설명할 수 있어서 캐릭터와 배경을 끝까지 일관되게 유지할 수 있습니다. 피드백을 주면 모델이 스토리를 재구성하거나 그림 스타일을 바꿀 것입니다.

Google AI Studio의 스토리 및 일러스트레이션 생성

2. 대화형 이미지 편집

Gemini 2.0 Flash는 자연어 대화를 여러 차례 주고받으며 이미지를 편집할 수 있도록 지원하며, 반복 과정을 거쳐 완벽한 이미지를 생성하거나 다양한 아이디어를 함께 탐색하는 데 적합합니다.

Google AI Studio에서 내내 컨텍스트를 유지하면서 대화를 주고받으며 완성되는 이미지 편집

3. 세계의 이해

다른 많은 이미지 생성 모델과 달리, Gemini 2.0 Flash는 세계에 대한 지식과 향상된 추론 능력을 활용하여 올바른 이미지를 만듭니다. 따라서 레시피 설명처럼 사실적인 세부 이미지를 만들기에 완벽한 선택입니다. 모든 언어 모델과 마찬가지로 정확성을 위해 노력하지만 2.0 Flash의 지식은 절대적이거나 완전하지 않고 광범위하고 일반적입니다.

Google AI Studio에서 레시피를 위해 텍스트와 이미지를 인터리브해 출력

4. 텍스트 렌더링

대부분의 이미지 생성 모델은 긴 텍스트 시퀀스를 정확하게 렌더링하는 데 어려움을 겪습니다. 이로 인해 서식이 잘못 지정되거나 판독 불가능한 문자 또는 맞춤법 오류가 발생하는 경우가 많습니다. 내부 벤치마크에 따르면 2.0 Flash는 주요 경쟁 모델에 비해 더 강력한 렌더링 성능을 자랑하고, 광고와 소셜 게시물 또는 초대장을 만드는 데 매우 적합합니다.

Google AI Studio에서 긴 텍스트 렌더링을 포함한 이미지 출력

지금 Gemini로 이미지를 만들어 보세요

Gemini API를 통해 Gemini 2.0 Flash를 시작하세요. 문서에서 이미지 생성에 대해 자세히 알아보세요.

from google import genai
from google.genai import types
 
client = genai.Client(api_key="GEMINI_API_KEY")
 
response = client.models.generate_content(
    model="gemini-2.0-flash-exp",
    contents=(
        "Generate a story about a cute baby turtle in a 3d digital art style. "
        "For each scene, generate an image."
    ),
    config=types.GenerateContentConfig(
        response_modalities=["Text", "Image"]
    ),
)

AI 에이전트를 만들든, 삽화와 스토리가 어우러진 아름다운 비주얼의 앱을 개발하든, 대화를 나누며 다양한 시각적 아이디어를 브레인스토밍하든 상관없이, Gemini 2.0 Flash를 사용하면 단일 모델로 텍스트 및 이미지 생성을 추가할 수 있습니다. 개발자 여러분이 네이티브 이미지 출력으로 무엇을 만들어내실지 한껏 기대하고 있으며 보내주시는 의견은 곧 프로덕션에 대비한 버전을 완성하는 데 큰 도움이 될 것입니다.