検索

23 結果

フィルタをクリアする
  • 2025年8月15日 / Google AI Studio

    Announcing Imagen 4 Fast and the general availability of the Imagen 4 family in the Gemini API

    Google announces the general availability of Imagen 4, its advanced text-to-image model, in the Gemini API and Google AI Studio, featuring significant improvements in text rendering. The new Imagen 4 Fast model, designed for speed and rapid image generation, is now available alongside Imagen 4 and Imagen 4 Ultra, with Imagen 4 and Imagen 4 Ultra also supporting up to 2K resolution image generation.

    Imagen 4 Fast and the generally availability of the Imagen 4 family in the Gemini API
  • 2025年7月31日 / AI

    Veo 3 Fast と新たな画像動画変換機能

    Google は、スピードと価格を最適化したモデル Veo 3 Fast とともに、Veo 3 と Veo 3 Fast 両方の新たな画像動画変換機能を発表します。これにより、デベロッパーはテキストや静止画像から質の高い動画コンテンツを効率的に作成できるようになります。料金設定はモデルと音声の組み込みによって異なります。これは現在、Gemini API で利用できます。

    Build with Veo 3 Fast and new image-to-video capabilities, now available in the Gemini API
  • 2025年7月30日 / Gemini

    LangExtract のご紹介: Gemini を活用した情報抽出ライブラリ

    LangExtract は非構造化テキストから情報を構造化して抽出する Gemini モデルを活用した、新しいオープンソース Python ライブラリです。正確なソース グラウンディング、制御付き生成を使用した信頼性が高く構造化された出力形式、最適化されたロングコンテキスト抽出、インタラクティブな視覚化、柔軟な LLM バックエンドのサポートを実現します。

    LangExtract_meta
  • 2025年7月17日 / Gemini

    Gemini API、Veo 3 でのビルドに対応開始

    Google の最新 AI 動画生成モデルである Veo 3 が、Gemini API と Google AI Studio を通じて有料プレビュー版で利用可能になりました。Google I/O 2025 で発表された Veo 3 は、会話や背景音、動物の鳴き声など、動画と同期した音声の生成にも対応しています。自然光の表現や物理的な動きを再現したリアルなビジュアルに加え、画面上の動きに同期した正確なリップシンクとサウンドも提供します。

    Build with Veo 3, now available in the Gemini API and Google AI Studio
  • 2025年7月16日 / AI

    Gemini の推論を活用する: Vertex AI での logprobs の手順ガイド

    Vertex AI の Gemini API に「logprobs」機能が正式に導入されました。選択したトークンと代替トークンの確率スコアを表示することで、モデルの意思決定に関する分析情報を提供します。この手順ガイドでは、この機能を有効にして解釈し、信頼度の高い分類、動的予測入力、定量的な RAG 評価などの優れたユースケースに適用する方法を説明します。

    logprobs_meta
  • 2025年7月14日 / Gemini

    Gemini API で Gemini エンベディングが一般公開に

    このたび、Gemini API と Vertex AI で Gemini エンベディング テキスト モデルの一般提供を開始しました。この汎用性の高いモデルは、3 月の試験運用版リリース以来、MTEB 多言語リーダーボードで一貫して 1 位の座を維持しており、100 以上の言語に対応、最大入力トークン長 2,048、料金は 100 万入力トークンあたり 0.15 ドルとなっています。

    Gemini Embedding now generally available in the Gemini API
  • 2025年7月10日 / Gemini

    「GenAI Processors」を発表: 強力で柔軟な Gemini アプリケーションをビルド

    GenAI Processors は、Google DeepMind の新しいオープンソース Python ライブラリです。入力処理からモデル呼び出しと出力処理までのすべてのステップに一貫した「Processor」インターフェースを提供することで、シームレスなチェーンと同時実行を実現します。特にマルチモーダル入力を処理し、リアルタイムの応答性を必要とする AI アプリケーションの開発を簡素化します。

    Announcing GenAI Processors: Streamline your Gemini application development
  • 2025年7月7日 / Gemini

    Gemini API のバッチモード: 高機能を低価格で

    Gemini API の新しいバッチモードは高スループット、遅延のない重大な AI ワークロード、スケジュールとプロセスの処理による大規模なジョブの簡素化のために設計されています。さらにデータ分析、バルク コンテンツの作成、よりコスト効率を高めてスケーラブルに行うモデル評価といったタスクの作成も可能で、デベロッパーは大容量のデータを効率的に処理できます。

    Scale your AI workloads with batch mode in the Gemini API
  • 2025年6月24日 / Gemini

    Gemini API と Google AI Studio で Imagen 4 を公開

    Google の高度なテキスト画像変換モデル Imagen 4 が、Gemini API と Google AI Studio で有料プレビュー版として公開されました。このモデルでは、画像内テキスト生成の品質が大幅に向上しています。Imagen 4 ファミリーには、汎用タスク向けの Imagen 4、細かいところまでプロンプトに従うことができる Imagen 4 Ultra があり、すべての生成される画像に目に見えない SynthID 透かしが含まれています。

    Imagen 4 is now available on Gemini API and Google AI Studio
  • 2025年6月24日 / Gemini

    ロボティクスと身体性知能(Embodied Intelligence)を実現する Gemini 2.5

    コーディング、推論、空間理解を含むマルチモーダル機能が強化された Gemini 2.5 Pro および Flash が、ロボティクスに変革を起こします。この 2 つのモデルは、安全性の向上とコミュニティ アプリケーションに重点を置いており、場面の意味の理解、ロボット制御コードの生成、Live API によるインタラクティブ アプリケーションの開発に役立てることができます。

    Gemini 2.5 for robotics and embodied intelligence