検索

20 結果

フィルタをクリアする
  • 2025年8月15日 / Google AI Studio

    Announcing Imagen 4 Fast and the general availability of the Imagen 4 family in the Gemini API

    Google announces the general availability of Imagen 4, its advanced text-to-image model, in the Gemini API and Google AI Studio, featuring significant improvements in text rendering. The new Imagen 4 Fast model, designed for speed and rapid image generation, is now available alongside Imagen 4 and Imagen 4 Ultra, with Imagen 4 and Imagen 4 Ultra also supporting up to 2K resolution image generation.

    Imagen 4 Fast and the generally availability of the Imagen 4 family in the Gemini API
  • 2025年7月17日 / Gemini

    Gemini API、Veo 3 でのビルドに対応開始

    Google の最新 AI 動画生成モデルである Veo 3 が、Gemini API と Google AI Studio を通じて有料プレビュー版で利用可能になりました。Google I/O 2025 で発表された Veo 3 は、会話や背景音、動物の鳴き声など、動画と同期した音声の生成にも対応しています。自然光の表現や物理的な動きを再現したリアルなビジュアルに加え、画面上の動きに同期した正確なリップシンクとサウンドも提供します。

    Build with Veo 3, now available in the Gemini API and Google AI Studio
  • 2025年7月14日 / Gemini

    Gemini API で Gemini エンベディングが一般公開に

    このたび、Gemini API と Vertex AI で Gemini エンベディング テキスト モデルの一般提供を開始しました。この汎用性の高いモデルは、3 月の試験運用版リリース以来、MTEB 多言語リーダーボードで一貫して 1 位の座を維持しており、100 以上の言語に対応、最大入力トークン長 2,048、料金は 100 万入力トークンあたり 0.15 ドルとなっています。

    Gemini Embedding now generally available in the Gemini API
  • 2025年6月24日 / Gemini

    ロボティクスと身体性知能(Embodied Intelligence)を実現する Gemini 2.5

    コーディング、推論、空間理解を含むマルチモーダル機能が強化された Gemini 2.5 Pro および Flash が、ロボティクスに変革を起こします。この 2 つのモデルは、安全性の向上とコミュニティ アプリケーションに重点を置いており、場面の意味の理解、ロボット制御コードの生成、Live API によるインタラクティブ アプリケーションの開発に役立てることができます。

    Gemini 2.5 for robotics and embodied intelligence
  • 2025年6月24日 / Gemini

    Gemini API と Google AI Studio で Imagen 4 を公開

    Google の高度なテキスト画像変換モデル Imagen 4 が、Gemini API と Google AI Studio で有料プレビュー版として公開されました。このモデルでは、画像内テキスト生成の品質が大幅に向上しています。Imagen 4 ファミリーには、汎用タスク向けの Imagen 4、細かいところまでプロンプトに従うことができる Imagen 4 Ultra があり、すべての生成される画像に目に見えない SynthID 透かしが含まれています。

    Imagen 4 is now available on Gemini API and Google AI Studio
  • 2025年5月23日 / Gemini

    Gemini API I/O の更新内容

    Gemini API に新機能と新たなモデルが登場しました。Gemini 2.5 Flash Preview では、推論性能と効率性が向上し、Gemini 2.5 Pro および Flash のテキスト読み上げ機能では複数の言語と話者に対応しています。また、Gemini 2.5 Flash は会話型 AI に対応したネイティブ オーディオ対話機能を提供します。

    Gemini_API_metadata
  • 2025年5月21日 / Google AI Studio

    Google AI Studio における開発エクスペリエンスのアップグレード

    Google AI Studio は、Gemini 2.5 Pro によるネイティブコード生成、エージェント ツール、強化されたマルチモーダル生成機能に加え、Build タブ、Live API、洗練された AI アプリケーションを構築するための改良されたツールなどの新機能を備え、デベロッパー エクスペリエンスを向上させるためにアップグレードされました。

    google-io-event-meta
  • 2025年5月9日 / Cloud

    ゲーム デベロッパー向け Google AI

    今年の Games Developer Conference(GDC)での発表内容を振り返りましょう。Gemma と Gemini の両モデルがゲームにおける AI エクスペリエンスの構築にどのように役立つかを、Gemma 3 と Unity プラグインのリリース、そのサンプルゲームへの応用、Google Cloud での生成 AI によるゲームのスケーリングなどと併せて見ていきます。

    Google AI for Game Developers
  • 2025年5月9日 / DeepMind

    Gemini 2.5 で動画理解の新たな地平を切り開く

    Gemini 2.5 は動画理解における大きな飛躍です。主要な動画理解ベンチマークで最高水準のパフォーマンスを達成しており、コードやその他のデータ形式で視聴覚情報をシームレスに使用することができます。

    2.5Pro_Metadata_VideoUnderstanding
  • 2025年5月8日 / Gemini

    Gemini 2.5 モデルが暗黙的キャッシュをサポート

    Gemini API の暗黙的キャッシュがロールアウトされます。これにより、既存の明示的キャッシュ API が拡張されて「常時オン」のキャッシュ システムが提供されるので、Gemini 2.5 モデルを利用するデベロッパーは自動的にコストを削減できます。確実に費用を削減できる明示的キャッシュ API も引き続き利用できます。

    Gemini 2.5 Models now support Implicit Caching