13 結果
2025年10月15日 / AI
Google is releasing Veo 3.1 and Veo 3.1 Fast, an updated video generation model, in paid preview via the Gemini API. This version offers richer native audio, greater narrative control, and enhanced image-to-video capabilities. New features include guiding generation with reference images, extending existing Veo videos, and generating transitions between frames. Companies like Promise Studios, Latitude, and Whering are already using Veo 3.1 for various applications.
2025年10月2日
世界中の人々の想像力をかきたててきた Google の最先端の画像生成および編集モデル、Gemini 2.5 Flash Image 🍌 の一般提供が開始されました。本番環境に対応できるようになり、画...
2025年9月8日 / AI
本日、Veo で 3 つの大きなアップデートをリリースします。縦型での出力(9:16 アスペクト比)、1080p の HD 出力のサポートのほか、新たに料金が引き下げられます。また、Veo 3 と V...
2025年8月28日 / AI
Detailed prompting techniques and best practices for various applications, including photorealistic scenes, stylized illustrations, product mockups, and more using Google's newly released Gemini 2.5 Flash Image; a natively multimodal model capable of generating, editing, and composing images using text, supporting capabilities like text-to-image, image editing, style transfer, and multi-image composition.
2025年8月26日 / Gemini
Gemini 2.5 Flash Image は最先端の画像生成および編集モデルです。Gemini の実世界の知識を活かして、複数の画像を合成し、人物の一貫性を維持し、自然言語でターゲットを絞った変換を行います。本モデルは現在、Gemini API、Google AI Studio、Vertex AI を通じて利用可能です。
2025年8月18日 / Gemini
Gemini API の URL コンテキスト ツールの一般提供が開始され、デベロッパーは手動アップロードの代わりにウェブ コンテンツを使用してプロンプトをグラウンディングできるようになりました。今回のリリースでは、PDF と画像へのサポートが追加されています。
2025年8月15日 / Google AI Studio
Google は、Gemini API と Google AI Studio での Imagen 4 の一般提供開始を発表しました。Imagen 4 は、テキスト レンダリングの大幅な改善を特徴とする、高度なテキスト画像変換モデルです。そしてこのたび、スピードと高速画像生成を重視して設計された新しい Imagen 4 Fast モデルが、Imagen 4 と Imagen 4 Ultra とともに利用可能になりました。Imagen 4 と Imagen 4 Ultra は、最大 2K の解像度の画像生成もサポートします。
2025年7月31日 / AI
Google は、スピードと価格を最適化したモデル Veo 3 Fast とともに、Veo 3 と Veo 3 Fast 両方の新たな画像動画変換機能を発表します。これにより、デベロッパーはテキストや静止画像から質の高い動画コンテンツを効率的に作成できるようになります。料金設定はモデルと音声の組み込みによって異なります。これは現在、Gemini API で利用できます。
2025年7月17日 / Gemini
Google の最新 AI 動画生成モデルである Veo 3 が、Gemini API と Google AI Studio を通じて有料プレビュー版で利用可能になりました。Google I/O 2025 で発表された Veo 3 は、会話や背景音、動物の鳴き声など、動画と同期した音声の生成にも対応しています。自然光の表現や物理的な動きを再現したリアルなビジュアルに加え、画面上の動きに同期した正確なリップシンクとサウンドも提供します。
2025年6月24日 / Gemini
Google の高度なテキスト画像変換モデル Imagen 4 が、Gemini API と Google AI Studio で有料プレビュー版として公開されました。このモデルでは、画像内テキスト生成の品質が大幅に向上しています。Imagen 4 ファミリーには、汎用タスク向けの Imagen 4、細かいところまでプロンプトに従うことができる Imagen 4 Ultra があり、すべての生成される画像に目に見えない SynthID 透かしが含まれています。