検索

25 結果

フィルタをクリアする
  • 2025年10月15日 / AI

    Introducing Veo 3.1 and new creative capabilities in the Gemini API

    Google is releasing Veo 3.1 and Veo 3.1 Fast, an updated video generation model, in paid preview via the Gemini API. This version offers richer native audio, greater narrative control, and enhanced image-to-video capabilities. New features include guiding generation with reference images, extending existing Veo videos, and generating transitions between frames. Companies like Promise Studios, Latitude, and Whering are already using Veo 3.1 for various applications.

    Veo3.1_16x9_meta
  • 2025年8月18日 / Gemini

    Gemini API の URL コンテキスト ツールが一般公開に

    Gemini API の URL コンテキスト ツールの一般提供が開始され、デベロッパーは手動アップロードの代わりにウェブ コンテンツを使用してプロンプトをグラウンディングできるようになりました。今回のリリースでは、PDF と画像へのサポートが追加されています。

    URL context tool for Gemini API now generally available
  • 2025年8月15日 / Google AI Studio

    Imagen 4 Fast のリリースと Gemini API での Imagen 4 ファミリーの一般提供開始のお知らせ

    Google は、Gemini API と Google AI Studio での Imagen 4 の一般提供開始を発表しました。Imagen 4 は、テキスト レンダリングの大幅な改善を特徴とする、高度なテキスト画像変換モデルです。そしてこのたび、スピードと高速画像生成を重視して設計された新しい Imagen 4 Fast モデルが、Imagen 4 と Imagen 4 Ultra とともに利用可能になりました。Imagen 4 と Imagen 4 Ultra は、最大 2K の解像度の画像生成もサポートします。

    Imagen 4 Fast and the generally availability of the Imagen 4 family in the Gemini API
  • 2025年7月31日 / AI

    Veo 3 Fast と新たな画像動画変換機能

    Google は、スピードと価格を最適化したモデル Veo 3 Fast とともに、Veo 3 と Veo 3 Fast 両方の新たな画像動画変換機能を発表します。これにより、デベロッパーはテキストや静止画像から質の高い動画コンテンツを効率的に作成できるようになります。料金設定はモデルと音声の組み込みによって異なります。これは現在、Gemini API で利用できます。

    Build with Veo 3 Fast and new image-to-video capabilities, now available in the Gemini API
  • 2025年7月30日 / Gemini

    LangExtract のご紹介: Gemini を活用した情報抽出ライブラリ

    LangExtract は非構造化テキストから情報を構造化して抽出する Gemini モデルを活用した、新しいオープンソース Python ライブラリです。正確なソース グラウンディング、制御付き生成を使用した信頼性が高く構造化された出力形式、最適化されたロングコンテキスト抽出、インタラクティブな視覚化、柔軟な LLM バックエンドのサポートを実現します。

    LangExtract_meta
  • 2025年7月17日 / Gemini

    Gemini API、Veo 3 でのビルドに対応開始

    Google の最新 AI 動画生成モデルである Veo 3 が、Gemini API と Google AI Studio を通じて有料プレビュー版で利用可能になりました。Google I/O 2025 で発表された Veo 3 は、会話や背景音、動物の鳴き声など、動画と同期した音声の生成にも対応しています。自然光の表現や物理的な動きを再現したリアルなビジュアルに加え、画面上の動きに同期した正確なリップシンクとサウンドも提供します。

    Build with Veo 3, now available in the Gemini API and Google AI Studio
  • 2025年7月16日 / AI

    Gemini の推論を活用する: Vertex AI での logprobs の手順ガイド

    Vertex AI の Gemini API に「logprobs」機能が正式に導入されました。選択したトークンと代替トークンの確率スコアを表示することで、モデルの意思決定に関する分析情報を提供します。この手順ガイドでは、この機能を有効にして解釈し、信頼度の高い分類、動的予測入力、定量的な RAG 評価などの優れたユースケースに適用する方法を説明します。

    logprobs_meta
  • 2025年7月14日 / Gemini

    Gemini API で Gemini エンベディングが一般公開に

    このたび、Gemini API と Vertex AI で Gemini エンベディング テキスト モデルの一般提供を開始しました。この汎用性の高いモデルは、3 月の試験運用版リリース以来、MTEB 多言語リーダーボードで一貫して 1 位の座を維持しており、100 以上の言語に対応、最大入力トークン長 2,048、料金は 100 万入力トークンあたり 0.15 ドルとなっています。

    Gemini Embedding now generally available in the Gemini API
  • 2025年7月10日 / Gemini

    「GenAI Processors」を発表: 強力で柔軟な Gemini アプリケーションをビルド

    GenAI Processors は、Google DeepMind の新しいオープンソース Python ライブラリです。入力処理からモデル呼び出しと出力処理までのすべてのステップに一貫した「Processor」インターフェースを提供することで、シームレスなチェーンと同時実行を実現します。特にマルチモーダル入力を処理し、リアルタイムの応答性を必要とする AI アプリケーションの開発を簡素化します。

    Announcing GenAI Processors: Streamline your Gemini application development
  • 2025年7月7日 / Gemini

    Gemini API のバッチモード: 高機能を低価格で

    Gemini API の新しいバッチモードは高スループット、遅延のない重大な AI ワークロード、スケジュールとプロセスの処理による大規模なジョブの簡素化のために設計されています。さらにデータ分析、バルク コンテンツの作成、よりコスト効率を高めてスケーラブルに行うモデル評価といったタスクの作成も可能で、デベロッパーは大容量のデータを効率的に処理できます。

    Scale your AI workloads with batch mode in the Gemini API