이제 새로운 가로세로 비율로 프로덕션에 사용할 준비를 마친 Gemini 2.5 Flash Image

2025년 10월 2일
Alisa Fortin Product Manager
Naina Raisinghani Product Manager GenAI Product
Seth Odoom Product Manager
Guillaume Vernade Gemini Developer Advocate
image7

전 세계의 상상력을 사로잡은 최첨단 이미지 생성 및 편집 모델인 Gemini 2.5 Flash Image 🍌가 이제 정식 출시되어 프로덕션 환경에 바로 사용할 수 있습니다. 또한 이미지 전용 출력을 지정할 수 있을 뿐만 아니라 더욱 폭넓은 범위의 가로세로 비율 등 새로운 기능도 제공합니다.

사용자는 Gemini 2.5 Flash Image를 사용해 여러 이미지를 매끄럽게 혼합하고, 캐릭터를 일관되게 유지해 풍부한 스토리텔링을 구현하며, 자연어를 이용해 특정 편집을 실행하고, Gemini의 광범위한 세상에 대한 지식을 활용해 이미지를 생성 및 수정할 수 있습니다. 기업용 Vertex AIGoogle AI StudioGemini API를 통해 이 모델에 액세스할 수 있습니다.

이 모델은 이제 10가지의 서로 다른 가로세로 비율을 지원해 창의력의 가능성을 더욱 확장합니다. 덕분에 영화관 스크린 같은 가로 모드부터 소셜 미디어 게시물용 세로 모드까지 다양한 형식으로 콘텐츠를 손쉽게 제작할 수 있습니다.

다음과 같은 비율이 지원됩니다.

  • 가로 모드: 21:9, 16:9, 4:3, 3:2
  • 정사각형 모드: 1:1
  • 세로 모드: 9:16, 3:4, 2:3
  • 유연 모드: 5:4, 4:5
image3
다양한 가로세로 비율로 생성된 이미지

현재 개발 중인 프로젝트

Cartwheel은 많은 이미지 생성기에서 흔히 볼 수 있는 '슬롯 머신 사용자 경험'을 뛰어넘어 AI를 통해 아티스트가 창의적인 비전을 직접 실현할 수 있도록 합니다. 이 개발팀은 몇 달 동안 'Pose Mode' 기능 개발에 매달린 끝에 다른 모델은 그 기능을 제공하지 못한다는 것을 알게 된 후, 마침내 Gemini 2.5 Flash Image에서 해결책을 찾았습니다. Cartwheel의 3D 포즈 도구와 Gemini 2.5 Flash Image를 결합하여 독보적인 캐릭터 제어 기능과 일관성을 제공하는 강력하고 새로운 이미지 생성 시스템을 만들었습니다.

다른 모델들은 임의의 카메라 앵글에서 캐릭터를 렌더링하거나 '세상에 대한 지식'을 유지하는 동시에 포즈의 정확성과 일관성을 확보하는 데 어려움을 겪습니다. 새로운 Gemini 2.5 Flash Image 모델은 두 가지를 모두 제공할 수 있는 첫 번째 모델이었습니다.” - Andrew Carr, Cartwheel 공동 설립자

Link to Youtube Video (visible only when JS is disabled)

AI 기반 던전 크롤러인 Wit's End의 제작사 Volley는 Gemini 2.5 Flash Image를 사용하여 세션 내에서 시각적 요소를 생성 및 편집합니다. 캐릭터의 사진, 동적 장면의 스틸컷, 다중 캐릭터 구성, 채팅이나 음성의 빠른 반복 편집 등이 가능합니다.

“이 모델은 미학적 지침에 대한 최신 수준의 규칙 준수 능력을 갖춘 동시에 지연 시간을 10초 미만으로 유지해 다양한 실시간 응용을 가능하게 합니다. 예를 들어, 플레이어가 여러 번의 대화형 반복 과정을 통해 스타일을 선택하고 출력물을 미세하게 다듬을 수 있도록 합니다.” - James Wilsterman, Volley CTO

Link to Youtube Video (visible only when JS is disabled)

최근 KaggleCerebral Valley와 함께 진행한 해커톤에서 커뮤니티의 놀라운 창의성을 확인할 수 있었습니다. 수백 개의 출품작이 쏟아지며 STEM 교육, 마케팅 자료, 실시간 증강 현실과 같은 다양한 분야에서 이 모델이 지닌 역량을 잘 보여주었습니다.

개발을 시작해 보세요

오늘부터 개발자는 Gemini 2.5 Flash Image를 사용해 개발을 시작할 수 있습니다. 다양해진 가로세로 비율과 이미지 전용 출력을 지정하는 기능 등 새로운 기능에 대한 가이드는 개발자 문서설명서를 참조하세요. 이 모델은 Gemini API를 통해 이용할 수 있으며 Google AI Studio에서 테스트할 수 있습니다.

Gemini 2.5 Flash Image는 Google AI Studio의 'build mode'를 통해 손쉽게 활용할 수 있습니다. "필터가 있는 이미지 편집 앱을 만들어 줘"와 같은 단 한 줄의 프롬프트로 AI 기반 맞춤형 앱을 즉시 만들고 리믹스할 수 있습니다. 준비가 되면 AI Studio에서 바로 창작물을 배포하거나 코드를 GitHub에 저장하세요. 모두 무료입니다. 다음 예시 앱을 사용하고 리믹스해 보세요.

  • Bananimate: 이미지와 프롬프트를 활용해 Nano Banana로 애니메이션 GIF를 만들어 보세요.
  • Enhance: 창의적인 업스케일러로 어떤 사진이든 무한대로 확대할 수 있습니다. 이스터 에그를 찾을 수 있는지 확인해 보세요(힌트: 🍌).
  • Fit check: 사용자 본인과 옷의 사진을 업로드하면 실제로 입지 않고도 착용 시 어떤 모습일지 확인할 수 있습니다. 즉, Nano Banana로 운영되는 가상의 피팅룸입니다.

Gemini 2.5 Flash Image의 가격은 이미지당 $0.039이며, 출력 토큰 1백만 개당 $30.00입니다. 다른 입력 및 출력 모달리티에 대한 가격은 표준 Gemini 2.5 Flash 가격과 동일합니다.

다음 샘플 코드를 활용해 시작해 보세요.

from google import genai
from google.genai import types
from PIL import Image
 
client = genai.Client()
 
prompt = "Create a photograph of the subject in this image as if they were living in the 1980s. The photograph should capture the distinct fashion, hairstyles, and overall atmosphere of that time period."
 
image = Image.open('/path/to/image.png')
 
response = client.models.generate_content(
    model="gemini-2.5-flash-image",
    contents=[prompt, image],
    config=types.GenerateContentConfig(
        response_modalities=["IMAGE"],
        image_config=types.ImageConfig(
            aspect_ratio="16:9",
        )
    )
)
 
for part in response.parts:
  if part.inline_data is not None:
    generated_image = part.as_image()
    generated_image.show()
Python

저희는 개발자 커뮤니티의 창의성에 끊임없이 놀라고 있습니다. 여러분이 다음에 또 무엇을 만들어 낼지 정말 기대됩니다!