56 结果
2025年10月15日 / AI
Coral NPU 是适用于边缘 AI 的全栈平台,用于解决性能、碎片化和用户信任缺失问题。该平台采用 AI 为先的架构,优先考虑机器学习矩阵引擎,并提供统一的开发者体验。专为可穿戴设备和 IoT 中的超低功耗、始终可用的 AI 而设计,可实现情境感知、音频/图像处理以及用户与硬件强制隐私的交互。Synaptics 是首个采用 Coral NPU 的合作伙伴。
2025年10月15日 / AI
Google 即将发布 Veo 3.1 和 Veo 3.1 Fast,这些是经过更新的视频生成模型,可通过 Gemini API 使用,当前处于付费预览阶段。3.1 版本提供更丰富的原生音频、更好的叙事控制和更强的图像转视频功能。新功能包括使用参考图像指导生成、扩展现有的 Veo 视频以及在帧之间生成过渡。Promise Studios、Latitude 和 Whering 等公司已经在各种应用场景中使用 Veo 3.1。
2025年10月8日 / Web
本指南将介绍如何针对自定义任务(例如表情符号翻译器)微调 Gemma 3 270M 模型。您将学习如何对模型进行量化和转换,以便在设备端使用,并通过 MediaPipe 或 Transformers.js 将其部署到网页应用中,从而提供快速、私密且支持离线的用户体验。
2025年10月7日 / AI
为了避免在训练大型模型时出现数据瓶颈,本指南介绍了用于构建高性能数据管道的 Grain 和 ArrayRecord。
2025年10月1日 / AI
多光谱图像可以捕捉超出人类视觉的波长,为理解世界提供了一种“超人”的方式,而谷歌的 Gemini 模型可以在不经过专门培训的情况下实现这一点。通过将不可见波段映射到 RGB 通道并在提示词中提供背景信息,开发人员可以利用 Gemini 的强大功能来完成环境监测和农业等领域的任务。
2025年9月25日 / AI
Gemini Robotics-ER 1.5 现已向开发者开放,是一款适用于机器人的先进具身推理模型。它在视觉感知、空间理解、任务规划和进度评估方面表现出色,使机器人能够执行复杂的多步骤任务。
2025年9月24日 / AI
Data Commons 宣布推出 MCP 服务器,这是使全球 AI 开发者能够即时访问和操作所有 Data Commons 庞大的公共数据集的一个重要里程碑。
2025年9月16日 / AI
Google 近日发布的 Agent Development Kit (ADK) for Java 0.2.0 版本新增了与 LangChain4j 大语言模型 (LLM) 框架的集成。该集成使开发者...
2025年8月12日 / Kaggle
在 Google TPU 上使用 JAX 从头开始构建和训练 GPT2 模型,并在免费版 Colab 或 Kaggle 中使用完整的 Python 笔记本。了解如何定义硬件网格、如何划分模型参数和输入数据以实现数据并行,以及如何优化模型训练流程。
2025年7月21日 / Gemini
Gemini 先进的对话式图像分割能力,使其能够通过理解复杂的短语、条件逻辑和抽象概念,以直观的方式与视觉数据进行交互,从而简化开发体验,并为媒体编辑、安全监控和损伤评估等新应用打开大门。