1 结果
筛选条件
2025年8月27日 / Google Labs
实验性开发者工具 Stax 通过简化 LLM 评估生命周期,解决了当前“氛围测试”的不足。该工具允许开发者通过人工标注和可扩展的 LLM 即评判自动评分器,对 AI 技术栈进行严格测试,从而实现数据驱动的决策。