検索

40 結果

フィルタをクリアする
  • 2025年8月15日 / Google AI Studio

    Imagen 4 Fast のリリースと Gemini API での Imagen 4 ファミリーの一般提供開始のお知らせ

    Google は、Gemini API と Google AI Studio での Imagen 4 の一般提供開始を発表しました。Imagen 4 は、テキスト レンダリングの大幅な改善を特徴とする、高度なテキスト画像変換モデルです。そしてこのたび、スピードと高速画像生成を重視して設計された新しい Imagen 4 Fast モデルが、Imagen 4 と Imagen 4 Ultra とともに利用可能になりました。Imagen 4 と Imagen 4 Ultra は、最大 2K の解像度の画像生成もサポートします。

    Imagen 4 Fast and the generally availability of the Imagen 4 family in the Gemini API
  • 2025年7月31日 / AI

    Veo 3 Fast と新たな画像動画変換機能

    Google は、スピードと価格を最適化したモデル Veo 3 Fast とともに、Veo 3 と Veo 3 Fast 両方の新たな画像動画変換機能を発表します。これにより、デベロッパーはテキストや静止画像から質の高い動画コンテンツを効率的に作成できるようになります。料金設定はモデルと音声の組み込みによって異なります。これは現在、Gemini API で利用できます。

    Build with Veo 3 Fast and new image-to-video capabilities, now available in the Gemini API
  • 2025年7月24日 / Google Labs

    Opal のご紹介: AI ミニアプリの記述、作成、共有

    Opal は、Google Labs が提供する新しい試験運用版ツールです。コードは不要で、自然言語のプロンプトを使用して、マルチステップの動的なミニアプリを組み立てることができます。既存の Google ツールとシームレスに統合する、共有可能な高機能 AI アプリを構築、デプロイすることが可能です。

    Opal Metadata card
  • 2025年7月17日 / Gemini

    Gemini API、Veo 3 でのビルドに対応開始

    Google の最新 AI 動画生成モデルである Veo 3 が、Gemini API と Google AI Studio を通じて有料プレビュー版で利用可能になりました。Google I/O 2025 で発表された Veo 3 は、会話や背景音、動物の鳴き声など、動画と同期した音声の生成にも対応しています。自然光の表現や物理的な動きを再現したリアルなビジュアルに加え、画面上の動きに同期した正確なリップシンクとサウンドも提供します。

    Build with Veo 3, now available in the Gemini API and Google AI Studio
  • 2025年7月14日 / Gemini

    Gemini API で Gemini エンベディングが一般公開に

    このたび、Gemini API と Vertex AI で Gemini エンベディング テキスト モデルの一般提供を開始しました。この汎用性の高いモデルは、3 月の試験運用版リリース以来、MTEB 多言語リーダーボードで一貫して 1 位の座を維持しており、100 以上の言語に対応、最大入力トークン長 2,048、料金は 100 万入力トークンあたり 0.15 ドルとなっています。

    Gemini Embedding now generally available in the Gemini API
  • 2025年7月10日 / Cloud

    Firebase Studio でエージェント AI 開発を推進

    Firebase Studio のアップデートには、新しく登場したエージェント モード、Model Context Protocol(MCP)の基本サポート、Gemini CLI 統合などが含まれています。こうしたすべての機能は AI を活用した開発を再定義するものであり、デベロッパーは単一のプロンプトからフルスタック アプリケーションを作成し、強力な AI 機能をワークフローに直接統合できます。

    Advancing agentic AI development with Firebase Studio
  • 2025年7月9日 / Gemma

    T5Gemma: エンコーダ-デコーダ Gemma モデルの新たなコレクション

    エンコーダ-デコーダ LLM の新しいファミリーである T5Gemma は、Gemma 2 フレームワークをベースに、事前トレーニング済みのデコーダのみのモデルを変換して適応させることによって開発されています。要約や翻訳など、入力を深く理解する必要があるタスクにおいて、デコーダのみのモデルよりも優れたパフォーマンスと効率を発揮します。

    T5Gemma: A New Collection of Encoder-Decoder Gemma Models
  • 2025年7月7日 / Gemini

    Gemini API のバッチモード: 高機能を低価格で

    Gemini API の新しいバッチモードは高スループット、遅延のない重大な AI ワークロード、スケジュールとプロセスの処理による大規模なジョブの簡素化のために設計されています。さらにデータ分析、バルク コンテンツの作成、よりコスト効率を高めてスケーラブルに行うモデル評価といったタスクの作成も可能で、デベロッパーは大容量のデータを効率的に処理できます。

    Scale your AI workloads with batch mode in the Gemini API
  • 2025年6月26日 / Gemma

    Gemma 3n の紹介: デベロッパー ガイド

    これまでの Gemma モデルの成功をもとに、Gemma 3n モデルが完全リリースを迎えました。前例のないパフォーマンスを発揮する先進的なオンデバイス マルチモーダル機能を、エッジデバイスで利用できるようになります。モバイルファースト アーキテクチャ、MatFormer テクノロジー、Per-Layer Embeddings、KV キャッシュ共有、新しい音声エンコーダと MobileNet-V5 ビジョン エンコーダなど、Gemma 3n のイノベーションをご覧ください。デベロッパーが今すぐ開発を始める方法も紹介します。

    Introducing Gemma 3n: The Developer Guide
  • 2025年6月24日 / Gemini

    ロボティクスと身体性知能(Embodied Intelligence)を実現する Gemini 2.5

    コーディング、推論、空間理解を含むマルチモーダル機能が強化された Gemini 2.5 Pro および Flash が、ロボティクスに変革を起こします。この 2 つのモデルは、安全性の向上とコミュニティ アプリケーションに重点を置いており、場面の意味の理解、ロボット制御コードの生成、Live API によるインタラクティブ アプリケーションの開発に役立てることができます。

    Gemini 2.5 for robotics and embodied intelligence