12 結果
2025年10月15日 / AI
Google はアップデートされた動画生成モデル Veo 3.1 と Veo 3.1 Fast を、Gemini API を通じて有料プレビュー版でリリースします。このバージョンでは、豊かなネイティブ音声と優れたナラティブ制御を向上させ、画像動画変換機能を強化しました。新機能には、参照画像を使用した生成ガイド、既存の Veo 動画の延長、フレーム間の遷移生成などがあります。Promise Studios、Latitude、Whering などの企業が、すでに Veo 3.1 をさまざまなアプリケーションに使用しています。
2025年9月8日 / AI
本日、Veo で 3 つの大きなアップデートをリリースします。縦型での出力(9:16 アスペクト比)、1080p の HD 出力のサポートのほか、新たに料金が引き下げられます。また、Veo 3 と V...
2025年8月28日 / AI
Detailed prompting techniques and best practices for various applications, including photorealistic scenes, stylized illustrations, product mockups, and more using Google's newly released Gemini 2.5 Flash Image; a natively multimodal model capable of generating, editing, and composing images using text, supporting capabilities like text-to-image, image editing, style transfer, and multi-image composition.
2025年8月26日 / Gemini
Gemini 2.5 Flash Image は最先端の画像生成および編集モデルです。Gemini の実世界の知識を活かして、複数の画像を合成し、人物の一貫性を維持し、自然言語でターゲットを絞った変換を行います。本モデルは現在、Gemini API、Google AI Studio、Vertex AI を通じて利用可能です。
2025年8月18日 / Gemini
Gemini API の URL コンテキスト ツールの一般提供が開始され、デベロッパーは手動アップロードの代わりにウェブ コンテンツを使用してプロンプトをグラウンディングできるようになりました。今回のリリースでは、PDF と画像へのサポートが追加されています。
2025年8月15日 / Google AI Studio
Google は、Gemini API と Google AI Studio での Imagen 4 の一般提供開始を発表しました。Imagen 4 は、テキスト レンダリングの大幅な改善を特徴とする、高度なテキスト画像変換モデルです。そしてこのたび、スピードと高速画像生成を重視して設計された新しい Imagen 4 Fast モデルが、Imagen 4 と Imagen 4 Ultra とともに利用可能になりました。Imagen 4 と Imagen 4 Ultra は、最大 2K の解像度の画像生成もサポートします。
2025年7月31日 / AI
Google は、スピードと価格を最適化したモデル Veo 3 Fast とともに、Veo 3 と Veo 3 Fast 両方の新たな画像動画変換機能を発表します。これにより、デベロッパーはテキストや静止画像から質の高い動画コンテンツを効率的に作成できるようになります。料金設定はモデルと音声の組み込みによって異なります。これは現在、Gemini API で利用できます。
2025年7月17日 / Gemini
Google の最新 AI 動画生成モデルである Veo 3 が、Gemini API と Google AI Studio を通じて有料プレビュー版で利用可能になりました。Google I/O 2025 で発表された Veo 3 は、会話や背景音、動物の鳴き声など、動画と同期した音声の生成にも対応しています。自然光の表現や物理的な動きを再現したリアルなビジュアルに加え、画面上の動きに同期した正確なリップシンクとサウンドも提供します。
2025年6月24日 / Gemini
Google の高度なテキスト画像変換モデル Imagen 4 が、Gemini API と Google AI Studio で有料プレビュー版として公開されました。このモデルでは、画像内テキスト生成の品質が大幅に向上しています。Imagen 4 ファミリーには、汎用タスク向けの Imagen 4、細かいところまでプロンプトに従うことができる Imagen 4 Ultra があり、すべての生成される画像に目に見えない SynthID 透かしが含まれています。
2025年5月23日 / Gemini
Gemini API に新機能と新たなモデルが登場しました。Gemini 2.5 Flash Preview では、推論性能と効率性が向上し、Gemini 2.5 Pro および Flash のテキスト読み上げ機能では複数の言語と話者に対応しています。また、Gemini 2.5 Flash は会話型 AI に対応したネイティブ オーディオ対話機能を提供します。