产品概述
Fabraix 是一个 AI 安全研究实验室,为 AI Agent 构建攻击性验证和运行时防御工具。其两个核心产品——Nyx 和 Arx——协同工作:Nyx 使用多轮次黑盒对抗策略自主探测 Agent 系统,发现真实漏洞;而 Arx 将这些发现转化为主动阻止威胁的运行时防护机制。Fabraix 的方法基于原创研究,包括对抗性利用成本 (ACE) 框架,该框架将 AI 安全从二元的通过/失败结果重新定义为可衡量、可部署的经济学模型。
主要功能
| 自主攻击型 Agent (Nyx) | Nyx 使用多轮次、纯黑盒对抗策略自主探测 AI Agent 系统,实时调整以发现人工红队测试可能遗漏的漏洞。 |
| 运行时防御层 (Arx) | Arx 注册 Agent 会话、记录事件并执行上下文内的行为检查,在运行时阻止提示词注入、目标偏离和记忆污染——直接基于 Nyx 发现的漏洞进行防御。 |
| 对抗性利用成本 (ACE) | 一个专有研究框架,以经济术语量化 AI 安全风险,使团队能够基于利用成本而非抽象的严重性评分来优先考虑防御措施。 |
| 可扩展的对抗性覆盖 | 数千种对抗策略并发运行,意味着覆盖范围随计算能力扩展而非人力——使全面的安全审计无需大量红队人员即可实现。 |
| 对抗性实验场 | 一个交互式环境,用于测试针对 AI Agent 的提示词注入抵御能力,适用于安全研究和开发者教育。 |
使用场景
- AI Agent 安全审计:安全团队可以部署 Nyx 对生产或测试环境中的 AI Agent 运行自动化对抗扫描,无需人工红队测试即可获得详细的漏洞报告。
- 运行时威胁防护:工程团队在其 Agent 管道中集成 Arx,以监控和阻止实时攻击——包括提示词注入和记忆污染——当 Agent 在生产环境中运行时。
- AI 风险量化:首席信息安全官和风险管理人员可以使用 ACE 框架将 AI Agent 漏洞转化为基于成本的指标,使安全投资决策更具说服力。
- 开发者安全测试:构建基于 LLM 应用的开发者可以使用 Fabraix Playground 在部署前对其提示词和 Agent 设计进行对抗性输入压力测试。
- 合规与威胁情报:运营受监管 AI 系统的组织可以利用 Fabraix 持续发现的漏洞作为持续性威胁情报,以支持审计和合规工作流程。
