21 结果
2025年10月7日 / AI
为了避免在训练大型模型时出现数据瓶颈,本指南介绍了用于构建高性能数据管道的 Grain 和 ArrayRecord。
2025年9月16日 / AI
Google 近日发布的 Agent Development Kit (ADK) for Java 0.2.0 版本新增了与 LangChain4j 大语言模型 (LLM) 框架的集成。该集成使开发者...
2025年9月4日 / AI
了解如何结合使用 Google 的高效开源模型 EmbeddingGemma 与 Google Cloud Dataflow 和 AlloyDB 等向量数据库,从而构建可扩展的实时知识提取流水线。
2025年8月12日 / Kaggle
在 Google TPU 上使用 JAX 从头开始构建和训练 GPT2 模型,并在免费版 Colab 或 Kaggle 中使用完整的 Python 笔记本。了解如何定义硬件网格、如何划分模型参数和输入数据以实现数据并行,以及如何优化模型训练流程。
2025年7月17日 / AI
2025年7月16日 / AI
Vertex AI 现已为 Gemini API 正式推出 logprobs 功能。该功能通过展示模型所选 token 及其替代 token 的概率分数,深入揭示了模型的决策过程。本分步指南将详细介绍如何启用和解读此功能,并将其应用于强大的用例,例如:置信度分类、动态自动补全以及 RAG 的定量评估。
2025年6月24日 / Kaggle
KerasHub 使用户能够混合搭配不同机器学习框架的模型架构和权重,支持将来自 Hugging Face Hub 等来源的检查点(包括使用 PyTorch 创建的检查点)加载到 Keras 模型中,并与 JAX、PyTorch 或 TensorFlow 配合使用。这种灵活性意味着,您可以充分利用大量经过社区微调的模型,同时完全掌控您所选择的后端框架。
2025年1月15日 / AI
Vertex AI RAG Engine 是一项托管编排服务,可简化检索相关信息并将其提供给大型语言模型的过程。这使得开发人员能够构建强大、接地气的生成式人工智能应用程序,确保响应确实接地气。
2024年12月23日 / AI
Gemini 2.0 的多模态实时 API 可实现用户与计算机之间的实时多模态交互,并可用于构建实时虚拟助手和自适应教育工具。
2024年12月23日 / AI
了解如何使用 Google 的 Multimodal Embeddings API 构建可视化搜索工具,并探索如何将此技术应用于搜索图像、幻灯片等。