A2A 协议为智能体之间的通信提供了一种稳健且标准化的框架。同时,它也认识到‘一刀切’的方式并不适用于所有场景。这时就需要扩展程序。扩展程序允许开发者在其 A2A 服务器中添加针对特定领域的自定义功能与方法,从而突破核心协议的限制。此外,它还允许客户端添加远程智能体应支持的额外需求。当智能体需要提供特定功能时,这非常有用。
入门方法非常简单。这里有一个“helloworld”扩展程序,它能够在 A2A 框架中为消息和工件添加时间戳。一个智能体只需在其“智能体卡”(以 JSON 格式描述其能力的文件)中声明自己支持某个扩展程序即可。由于任何人都可以定义、发布和实现扩展(每个扩展都由唯一的 URI 标识),整个生态因此具有高度开放性和社区驱动的特点。这种方式确保了 A2A 协议始终保持高度的灵活性和适应性,从而使开发者能够构建出更强大、更专业化的多智能体系统。
随着 A2A 的广泛应用,我们见证了众多的扩展程序案例。
为了确保多样化的 AI 智能体能够可靠无误地协作,评估它们之间的通信至关重要。可追溯性扩展程序通过提供深入的可见性,使我们能够跟踪交互并有效诊断问题,从而助力实现这种评估。
ResponseTrace
此扩展程序的核心是 ResponseTrace
消息,这是一种结构化的日志,用于记录智能体执行的一系列操作。该消息经过轻量化设计,独立于主 A2A 协议,只专注于记录智能体发出的请求。
ResponseTrace
由一系列 Step
组成。每个 Step
代表一项操作,可以分为以下两种类型:
ToolInvocation
:调用特定工具,例如函数或 API。
2. AgentInvocation
:调用另一个智能体,这个智能体既可能是 A2A 智能体,也可能是其他类型。
关键在于,这些步骤是分层的。如果一个智能体调用了另一个同样支持可追溯性的智能体,那么第二个智能体的追踪可以嵌入到第一个智能体的追踪之中。这样就能提供一个完整的、端到端的流程视图。
如要了解更多信息,请点击此处查看详情。
Twilio 为 A2A 构建了一个具备延迟感知能力的扩展程序,用于支持其基于 Twilio ConversationRelay 的语音智能体的模型选择。这是领域专用功能的经典案例。智能体的延迟信息广播并不属于核心协议中对智能体卡的规范内容。然而,Twilio 专门构建了这样的扩展程序,以便帮助选择最适合的智能体,或实现平滑适配。
如要了解更多信息,请查看 Twilio 的文档。
Identity Machines 通过 A2A 扩展程序实现了智能体间调用的零信任握手。他们的实现展示了:智能体在接收任务之前,可以通过信任机制和独立的策略门控来把控,例如对任务目的、预算、能力、模型、PII 状态等自定义条件进行约束,从而确保任务委派安全可靠。
如要了解更多信息,请查看文档。
同样地,Ethereum 推出了 ERC-8004,其目标是为 AI 智能体创建一个信任层,使其能够跨越不同组织边界进行交互。该标准引入了链上的身份、声誉和验证注册表,从而实现来自不同生态系统的智能体之间安全且可互操作的通信。