検索

256 結果

フィルタをクリアする
  • 2025年7月21日 / Gemini

    Gemini 2.5 を使用した会話型画像セグメンテーション

    Gemini の高度な会話型画像セグメンテーション機能を使うと、複雑なフレーズ、条件付きロジック、抽象概念を理解することで、視覚データの直感的な操作が可能になり、デベロッパーのエクスペリエンスが効率化されるとともに、メディア編集、安全モニタリング、損害査定などの新しい分野に応用できる可能性が生まれます。

    Conversational image segmentation with Gemini 2.5
  • 2025年7月17日 / Gemini

    Gemini API、Veo 3 でのビルドに対応開始

    Google の最新 AI 動画生成モデルである Veo 3 が、Gemini API と Google AI Studio を通じて有料プレビュー版で利用可能になりました。Google I/O 2025 で発表された Veo 3 は、会話や背景音、動物の鳴き声など、動画と同期した音声の生成にも対応しています。自然光の表現や物理的な動きを再現したリアルなビジュアルに加え、画面上の動きに同期した正確なリップシンクとサウンドも提供します。

    Build with Veo 3, now available in the Gemini API and Google AI Studio
  • 2025年7月16日 / AI

    Gemini の推論を活用する: Vertex AI での logprobs の手順ガイド

    Vertex AI の Gemini API に「logprobs」機能が正式に導入されました。選択したトークンと代替トークンの確率スコアを表示することで、モデルの意思決定に関する分析情報を提供します。この手順ガイドでは、この機能を有効にして解釈し、信頼度の高い分類、動的予測入力、定量的な RAG 評価などの優れたユースケースに適用する方法を説明します。

    logprobs_meta
  • 2025年7月16日 / Cloud

    スタンフォード大学の Marin 基盤モデル: JAX を使用して開発された初の完全オープンモデル

    Marin プロジェクトは、開発プロセス全体をアクセス可能で再現可能なものにすることで、AI における「オープン」の定義をモデル自体にとどまらず科学的プロセス全体にまで拡張することを目指しています。この取り組みは JAX フレームワークとその Levanter ツールを活用しており、基盤モデルの詳細な精査、信頼性の確保、そのうえでの構築を可能にすることで、より透明性の高い AI 研究の未来を育みます。

    Stanford Marin project in JAX
  • 2025年7月16日 / Gemini

    ADK と Gemini CLI でエージェントの「バイブ ビルディング」フローをシンプルに

    エージェント開発キット(ADK)がアップデートされました。CLI がコスト効率のよい形で ADK フレームワークを深く理解できるようになるので、AI エージェントの作成プロセスがシンプルかつ高速になります。デベロッパーは、実用的なエージェントのアイデア出し、生成、テスト、改善を会話型プロンプトからすばやく実施でき、手間を減らして、生産的な「フロー」状態を保つことができます。

    ADK + Gemini CLI: Supercharge Your Agent Building Vibe
  • 2025年7月14日 / Cloud

    エンタープライズ トゥルースの実践活用: Apigee API ハブで強力なデベロッパー ポータルを支援

    Apigee API ハブとデベロッパー ポータルは、Apigee プラットフォームの別個の部分でありながら相互に接続されており、組織がさまざまなペルソナ向けの API を発見して管理し、API の可能性を引き出し、イノベーションを加速するのに役立ちます。

    Enterprise Truth in Action: API hub Fueling Powerful Developer Portals
  • 2025年7月14日 / Gemini

    Gemini API で Gemini エンベディングが一般公開に

    このたび、Gemini API と Vertex AI で Gemini エンベディング テキスト モデルの一般提供を開始しました。この汎用性の高いモデルは、3 月の試験運用版リリース以来、MTEB 多言語リーダーボードで一貫して 1 位の座を維持しており、100 以上の言語に対応、最大入力トークン長 2,048、料金は 100 万入力トークンあたり 0.15 ドルとなっています。

    Gemini Embedding now generally available in the Gemini API
  • 2025年7月10日 / Gemini

    「GenAI Processors」を発表: 強力で柔軟な Gemini アプリケーションをビルド

    GenAI Processors は、Google DeepMind の新しいオープンソース Python ライブラリです。入力処理からモデル呼び出しと出力処理までのすべてのステップに一貫した「Processor」インターフェースを提供することで、シームレスなチェーンと同時実行を実現します。特にマルチモーダル入力を処理し、リアルタイムの応答性を必要とする AI アプリケーションの開発を簡素化します。

    Announcing GenAI Processors: Streamline your Gemini application development
  • 2025年7月10日 / Cloud

    Firebase Studio でエージェント AI 開発を推進

    Firebase Studio のアップデートには、新しく登場したエージェント モード、Model Context Protocol(MCP)の基本サポート、Gemini CLI 統合などが含まれています。こうしたすべての機能は AI を活用した開発を再定義するものであり、デベロッパーは単一のプロンプトからフルスタック アプリケーションを作成し、強力な AI 機能をワークフローに直接統合できます。

    Advancing agentic AI development with Firebase Studio
  • 2025年7月9日 / Gemma

    T5Gemma: エンコーダ-デコーダ Gemma モデルの新たなコレクション

    エンコーダ-デコーダ LLM の新しいファミリーである T5Gemma は、Gemma 2 フレームワークをベースに、事前トレーニング済みのデコーダのみのモデルを変換して適応させることによって開発されています。要約や翻訳など、入力を深く理解する必要があるタスクにおいて、デコーダのみのモデルよりも優れたパフォーマンスと効率を発揮します。

    T5Gemma: A New Collection of Encoder-Decoder Gemma Models