21 結果
2025年8月26日 / Gemini
Gemini 2.5 Flash Image は最先端の画像生成および編集モデルです。Gemini の実世界の知識を活かして、複数の画像を合成し、人物の一貫性を維持し、自然言語でターゲットを絞った変換を行います。本モデルは現在、Gemini API、Google AI Studio、Vertex AI を通じて利用可能です。
2025年8月15日 / Google AI Studio
Google は、Gemini API と Google AI Studio での Imagen 4 の一般提供開始を発表しました。Imagen 4 は、テキスト レンダリングの大幅な改善を特徴とする、高度なテキスト画像変換モデルです。そしてこのたび、スピードと高速画像生成を重視して設計された新しい Imagen 4 Fast モデルが、Imagen 4 と Imagen 4 Ultra とともに利用可能になりました。Imagen 4 と Imagen 4 Ultra は、最大 2K の解像度の画像生成もサポートします。
2025年7月17日 / Gemini
Google の最新 AI 動画生成モデルである Veo 3 が、Gemini API と Google AI Studio を通じて有料プレビュー版で利用可能になりました。Google I/O 2025 で発表された Veo 3 は、会話や背景音、動物の鳴き声など、動画と同期した音声の生成にも対応しています。自然光の表現や物理的な動きを再現したリアルなビジュアルに加え、画面上の動きに同期した正確なリップシンクとサウンドも提供します。
2025年7月14日 / Gemini
このたび、Gemini API と Vertex AI で Gemini エンベディング テキスト モデルの一般提供を開始しました。この汎用性の高いモデルは、3 月の試験運用版リリース以来、MTEB 多言語リーダーボードで一貫して 1 位の座を維持しており、100 以上の言語に対応、最大入力トークン長 2,048、料金は 100 万入力トークンあたり 0.15 ドルとなっています。
2025年6月24日 / Gemini
コーディング、推論、空間理解を含むマルチモーダル機能が強化された Gemini 2.5 Pro および Flash が、ロボティクスに変革を起こします。この 2 つのモデルは、安全性の向上とコミュニティ アプリケーションに重点を置いており、場面の意味の理解、ロボット制御コードの生成、Live API によるインタラクティブ アプリケーションの開発に役立てることができます。
2025年6月24日 / Gemini
Google の高度なテキスト画像変換モデル Imagen 4 が、Gemini API と Google AI Studio で有料プレビュー版として公開されました。このモデルでは、画像内テキスト生成の品質が大幅に向上しています。Imagen 4 ファミリーには、汎用タスク向けの Imagen 4、細かいところまでプロンプトに従うことができる Imagen 4 Ultra があり、すべての生成される画像に目に見えない SynthID 透かしが含まれています。
2025年5月23日 / Gemini
Gemini API に新機能と新たなモデルが登場しました。Gemini 2.5 Flash Preview では、推論性能と効率性が向上し、Gemini 2.5 Pro および Flash のテキスト読み上げ機能では複数の言語と話者に対応しています。また、Gemini 2.5 Flash は会話型 AI に対応したネイティブ オーディオ対話機能を提供します。
2025年5月21日 / Google AI Studio
Google AI Studio は、Gemini 2.5 Pro によるネイティブコード生成、エージェント ツール、強化されたマルチモーダル生成機能に加え、Build タブ、Live API、洗練された AI アプリケーションを構築するための改良されたツールなどの新機能を備え、デベロッパー エクスペリエンスを向上させるためにアップグレードされました。
2025年5月9日 / Cloud
今年の Games Developer Conference(GDC)での発表内容を振り返りましょう。Gemma と Gemini の両モデルがゲームにおける AI エクスペリエンスの構築にどのように役立つかを、Gemma 3 と Unity プラグインのリリース、そのサンプルゲームへの応用、Google Cloud での生成 AI によるゲームのスケーリングなどと併せて見ていきます。
2025年5月9日 / DeepMind
Gemini 2.5 は動画理解における大きな飛躍です。主要な動画理解ベンチマークで最高水準のパフォーマンスを達成しており、コードやその他のデータ形式で視聴覚情報をシームレスに使用することができます。