产品概述
Resolve AI是一款前沿的AI生产工程师,专为自主处理告警、执行根因分析及解决复杂云和软件基础设施中的事件而设计。它会持续构建和更新生产环境的全面知识图谱,并无缝集成AWS、Kubernetes、GitHub、Slack等工具。通过模拟人类工程师的推理和运维流程,Resolve AI大幅缩短平均修复时间(MTTR),防止故障发生,让工程团队专注于创新而非救火。
主要功能
| 自主化事件管理 | 自动检测、调查并解决告警和事件,无需人工干预,将平均修复时间(MTTR)缩短高达80%。 |
| 动态知识图谱 | 持续映射并更新基础设施、代码、部署和依赖的详细模型,保持实时的态势感知。 |
| 深度集成DevOps工具 | 可直接操作云平台、可观测性工具、源码仓库和沟通渠道,执行复杂的运维任务。 |
| 多步推理Agentic AI | 采用多种专用AI Agent协作,分流问题、假设根因,并以类人的逻辑执行修复步骤。 |
| 主动事件预防 | 基于事件经验动态调整监控阈值和运行手册,减少告警噪音并防止未来问题发生。 |
| 企业级安全与合规 | 符合SOC2 Type 2等高安全标准,保障客户数据隐私和完整性。 |
使用场景
- 值班事件响应:通过自主管理告警和事件修复,减轻值班工程师负担,防止职业倦怠。
- 生产系统可靠性:通过快速诊断和解决云基础设施及应用的生产问题,提高系统可用性。
- 根因分析:以证据为基础,快速识别事件根因,并提供可执行的修复方案。
- 运维效率提升:标准化并自动化复杂运维流程,让团队更快、更有信心地交付新功能。
- 协作与知识共享:作为协作型AI队友,集成Slack等工具,协助工程师并记录事件复盘。

