Gemini 2.5 Flash Image が製品版に、新しいアスペクト比も追加

2025年10月2日
Alisa Fortin Product Manager
Naina Raisinghani Product Manager GenAI Product
Seth Odoom Product Manager
Guillaume Vernade Gemini Developer Advocate
image7

世界中の人々の想像力をかきたててきた Google の最先端の画像生成および編集モデル、Gemini 2.5 Flash Image 🍌 の一般提供が開始されました。本番環境に対応できるようになり、画像のみの出力を指定できるほか、幅広い種類のアスペクト比などの新機能も搭載されています。

Gemini 2.5 Flash Image を使うことで、複数の画像をシームレスに合成できます。キャラクターの一貫性を保つことによるストーリーテリングの向上、自然言語でのターゲットを絞った編集、Gemini の広範な現実世界の知識を活用した画像の生成と修正が可能です。このモデルには、Gemini API を介して Google AI Studio および、エンタープライズ向けには Vertex AI からアクセスできます。

アスペクト比の選択肢が 10 種類に増え、クリエイティブの可能性がさらに広がりました。これにより、横向きの映画のような画像から縦向きのソーシャル メディア投稿まで、さまざまな形式で簡単にコンテンツを作成できます。

サポートされている比率は次のとおりです。

  • 横向き: 21:9、16:9、4:3、3:2
  • 正方形: 1:1
  • 縦向き: 9:16、3:4、2:3
  • フレキシブル: 5:4、4:5
image3
さまざまなアスペクト比で作成した画像

デベロッパーの作成例

Cartwheel は AI を活用し、多くの画像生成ツールでの「スロットマシンのようなユーザー エクスペリエンス」を乗り越えました。アーティストは直接的なコントロール機能により創造的なビジョンを実現できます。同社のチームは何か月も「Pose Mode」機能の開発に取り組んでいましたが、他のモデルでは解決できなかったことを Gemini 2.5 Flash Image で達成できたのです。Cartwheel の 3D ポーズツールと Gemini 2.5 Flash Image を組み合わせることで、比類のないキャラクターのコントロールと整合性が得られる強力な新しい画像作成システムを生み出しました。

他のモデルは、「現実世界の知識」を犠牲にすることなく、任意のカメラアングルからキャラクターをレンダリングすることや、ポーズの忠実性を保つことができませんでした。新しい Gemini 2.5 Flash Image モデルは、それを両方ともかなえられる最初のモデルでした。」- Cartwheel の共同創業者、Andrew Carr 氏

Link to Youtube Video (visible only when JS is disabled)

Volley は、AI を搭載したダンジョン クローラー Wit's End を作成しました。Gemini 2.5 Flash Image を使用し、ビジュアルの生成と編集はセッション形式で、チャットや音声によりキャラクターのポートレートやダイナミックなシーンの静止画、マルチキャラクター コンポジションの作成、迅速な反復編集を行います。

「このモデルは、<10 秒未満のレイテンシを維持しながら、ビジュアルの指示に従って最高水準のルール再現力を実証し、ライブ アプリケーションの可能性を広げました。たとえば、プレーヤーがスタイルを選択し、マルチターン ループで出力を調整できます。」- Volley の最高技術責任者、James Wilsterman 氏

Link to Youtube Video (visible only when JS is disabled)

Kaggle および Cerebral Valley との最近のハッカソンでは、コミュニティがもつ創造性の高さに驚かされました。ハッカソンには STEM 教育、マーケティング資料、リアルタイム拡張現実などの多様な分野でのモデルの能力を披露する何百もの応募がありました。

開発を始めましょう

デベロッパーは今すぐ Gemini 2.5 Flash Image を使用して開発に着手できます。アスペクト比の種類追加や画像のみの出力を指定する機能など、新機能に関するガイドについては、デベロッパー向けドキュメントクックブックをご覧ください。このモデルの利用は Gemini API を介し、Google AI Studio でテストできます。

Gemini 2.5 Flash Image を使った開発は、Google AI Studio の「Build モード」で簡単に行えます。「フィルタ機能付きの画像編集アプリをビルドして」のような 1 つのプロンプトからすぐにカスタム AI 搭載アプリを作成、リミックスできます。アプリが完成したら、AI Studio から直接デプロイするか、コードを GitHub に保存します。すべて無料です。次に示す Google のサンプルアプリを試して、リミックスしてみてください。

  • Bananimate: Nano Banana を使用して、画像やプロンプトからアニメーション GIF を作成できます。
  • Enhance: あらゆる写真に無限大にズームインできるクリエイティブ アップスケーラーです。隠れキャラクターを見つけられるかお試しください(ヒント: 🍌)。
  • Fit Check: ご自身の写真と服装の写真をアップロードして自分に似合うか確認できます。Nano Banana を搭載したバーチャル フィッティング ルームです。

Gemini 2.5 Flash Image の料金は、画像あたり $0.039 で、100 万出力トークンあたり $30.00 です。その他の入力と出力の方式は Gemini 2.5 Flash の標準料金 に従います。

次のサンプルコードを使って、さっそく作成しましょう。

from google import genai
from google.genai import types
from PIL import Image
 
client = genai.Client()
 
prompt = "Create a photograph of the subject in this image as if they were living in the 1980s. The photograph should capture the distinct fashion, hairstyles, and overall atmosphere of that time period."
 
image = Image.open('/path/to/image.png')
 
response = client.models.generate_content(
    model="gemini-2.5-flash-image",
    contents=[prompt, image],
    config=types.GenerateContentConfig(
        response_modalities=["IMAGE"],
        image_config=types.ImageConfig(
            aspect_ratio="16:9",
        )
    )
)
 
for part in response.parts:
  if part.inline_data is not None:
    generated_image = part.as_image()
    generated_image.show()
Python

デベロッパー コミュニティの創造力には、いつも驚かされるばかりです。皆さんが次に開発するものを楽しみにしています。