Imagen 4 是我们迄今为止最出色的文本转图像模型,我们很高兴将其引入 Gemini API(付费预览)和 Google AI Studio(限时免费测试)。与我们之前的图像模型相比,Imagen 4 可显著改善文本渲染效果,进一步提升了文本转图像的生成质量。
我们引入了 Imagen 4 系列模型中的两种型号,旨在满足各种创意需求:
这是我们的旗舰版文本转图像模型,旨在处理各种图像生成任务,并显著提高生成质量,特别是在文本生成方面(以 Imagen 3 为基准)。Imagen 4 每输出一张图像需收费 0.04 美元。
如果您希望模型能够精准遵循指示生成图像,Imagen 4 Ultra 就是您的理想之选。它旨在生成与文本提示高度一致的输出,与其他领先的图像生成模型相比,可生成更加精准的结果。Imagen 4 Ultra 每输出一张图像需收费 0.06 美元。
我们将在未来几周内推出其他收费等级。在此期间,您可以要求提高 Imagen 4 和 4 Ultra 的速率限制。
为了让您一睹 Imagen 4 的强大功能,以下是一些可创建内容的示例。以下提示使用 Imagen 4 Ultra 来创建图像,展示了该模型足以覆盖各种风格和内容的多功能性。
提示:A 3-panel cosmic epic comic. Panel 1: Tiny 'Stardust' in nebula; radar shows anomaly (text 'ANOMALY DETECTED'), hull text 'stardust'. Pilot whispers. Panel 2: Bioluminescent leviathan emerges; console red text 'WARNING!. Panel 3: Leviathan chases ship through asteroids; console re text 'SHIELD CRITICAL!', screen text 'EVADE!'. Pilot screams, SFX 'CRUNCH!', 'ROOOOAAARR!'.
提示:Front of a vintage travel postcard for Kyoto: iconic pagoda under cherry blossoms, snow-capped mountains in distance, clear blue sky, vibrant colors.
提示:Photograph of an adventurous couple hiking on a mountain peak at sunrise, arms raised in triumph, epic panoramic view of valleys below, dramatic light.
提示:Avant-garde fashion editorial shot: a model in a voluminous, architectural gown standing on a shimmering, alien landscape under a binary sunset, surreal colors, high-concept, cinematic.
为帮助维持信任和透明度,Imagen 4 模型生成的所有图像将继续包含不可见的数字 SynthID 水印。要开始使用 Imagen 4,请查看官方文档和实战宝典:
我们很期待看到您通过 Gemini API 和 Google AI Studio 使用 Imagen 4 创建的内容,我们期望在未来几周内正式推出这些模型。