Agent Studio
真实世界流量,安全执行
沙箱回放历史工单、发票和请求——智能体在真实数据上训练,却不接触真实系统。
单元测试能捕获纯函数的回归。智能体则在无人列举的真实输入长尾上失败。沙箱是测试这条长尾的地方:安全、可回放、可共享。
回放如何工作
- 01
捕获真实流量
生产请求被连同输入、系统状态和结果一并捕获——自动、持续。
- 02
隔离回放
沙箱在封闭环境中用已捕获的工作回放新版本的智能体。真实工单不受影响。
- 03
比较并交付
新旧结果的差异被呈现以供审阅。回归会阻断部署。
核心能力
确定性种子
回放可重现——相同输入、相同输出——因此 bug 可调试,而非含糊不清。
默认脱敏
敏感字段在回放前脱敏。测试人员在贴近真实的数据上工作,却无原始 PII 足迹。
金丝雀人群
对流量切片(按租户、类别或分段)进行回放,以在全量发布前评估风险。
回归语料库
过去的 bug 转化为粘性回归用例。修复保持有效。