搜索

56 结果

清除过滤器
  • 2025年10月15日 / AI

    隆重推出 Coral NPU:适用于边缘 AI 的全栈平台

    Coral NPU 是适用于边缘 AI 的全栈平台,用于解决性能、碎片化和用户信任缺失问题。该平台采用 AI 为先的架构,优先考虑机器学习矩阵引擎,并提供统一的开发者体验。专为可穿戴设备和 IoT 中的超低功耗、始终可用的 AI 而设计,可实现情境感知、音频/图像处理以及用户与硬件强制隐私的交互。Synaptics 是首个采用 Coral NPU 的合作伙伴。

    blogpost
  • 2025年10月15日 / AI

    隆重推出 Veo 3.1 和 Gemini API 中的全新创意功能

    Google 即将发布 Veo 3.1 和 Veo 3.1 Fast,这些是经过更新的视频生成模型,可通过 Gemini API 使用,当前处于付费预览阶段。3.1 版本提供更丰富的原生音频、更好的叙事控制和更强的图像转视频功能。新功能包括使用参考图像指导生成、扩展现有的 Veo 视频以及在帧之间生成过渡。Promise Studios、Latitude 和 Whering 等公司已经在各种应用场景中使用 Veo 3.1。

    Veo3.1_16x9_meta
  • 2025年10月8日 / Web

    拥有自己的 AI:学习如何微调 Gemma 3 270M 并在设备上运行

    本指南将介绍如何针对自定义任务(例如表情符号翻译器)微调 Gemma 3 270M 模型。您将学习如何对模型进行量化和转换,以便在设备端使用,并通过 MediaPipe 或 Transformers.js 将其部署到网页应用中,从而提供快速、私密且支持离线的用户体验。

    OYOAI_Metadata_RD2-V01
  • 2025年10月7日 / AI

    使用 Grain 和 ArrayRecord 构建高性能数据管道

    为了避免在训练大型模型时出现数据瓶颈,本指南介绍了用于构建高性能数据管道的 Grain 和 ArrayRecord。

    The Agentic experience: Is MCP the right tool for your AI future?
  • 2025年10月1日 / AI

    使用 Gemini 解锁多光谱数据

    多光谱图像可以捕捉超出人类视觉的波长,为理解世界提供了一种“超人”的方式,而谷歌的 Gemini 模型可以在不经过专门培训的情况下实现这一点。通过将不可见波段映射到 RGB 通道并在提示词中提供背景信息,开发人员可以利用 Gemini 的强大功能来完成环境监测和农业等领域的任务。

    MultiSpectral-Metadatal_RD1-V01
  • 2025年9月25日 / AI

    使用 Gemini Robotics-ER 1.5 构建新一代物理智能体

    Gemini Robotics-ER 1.5 现已向开发者开放,是一款适用于机器人的先进具身推理模型。它在视觉感知、空间理解、任务规划和进度评估方面表现出色,使机器人能够执行复杂的多步骤任务。

    Robotics-ER 1.5_Metadatal_RD6-V01
  • 2025年9月24日 / AI

    Data Commons 模型上下文协议 (MCP) 服务器简介:为 AI 开发者简化公共数据访问流程

    Data Commons 宣布推出 MCP 服务器,这是使全球 AI 开发者能够即时访问和操作所有 Data Commons 庞大的公共数据集的一个重要里程碑。

    BLOG-HERO-A2
  • 2025年9月16日 / AI

    ADK for Java 通过集成 LangChain4j 向第三方语言模型开放

    Google 近日发布的 Agent Development Kit (ADK) for Java 0.2.0 版本新增了与 LangChain4j 大语言模型 (LLM) 框架的集成。该集成使开发者...

    adk-langchain4j
  • 2025年8月12日 / Kaggle

    在 TPU 上免费使用 JAX 训练 GPT2 模型

    在 Google TPU 上使用 JAX 从头开始构建和训练 GPT2 模型,并在免费版 Colab 或 Kaggle 中使用完整的 Python 笔记本。了解如何定义硬件网格、如何划分模型参数和输入数据以实现数据并行,以及如何优化模型训练流程。

    Train a GPT2 model with JAX on TPU for free
  • 2025年7月21日 / Gemini

    使用 Gemini 2.5 进行对话式图像分割

    Gemini 先进的对话式图像分割能力,使其能够通过理解复杂的短语、条件逻辑和抽象概念,以直观的方式与视觉数据进行交互,从而简化开发体验,并为媒体编辑、安全监控和损伤评估等新应用打开大门。

    Conversational image segmentation with Gemini 2.5