### [Resolve AI](https://dkwy.com/) **Published:** 2026-05-06T10:40:55 **Author:** 蛋壳 **Excerpt:** Resolve AI是一款前沿的AI生产工程师,专为自主处理告警、执行根因分析及解决复杂云和软件基础设施中的事件而设计。它会持续构建和更新生产环境的全面知识图谱,并无缝集成AWS、Kubernetes、GitHub、Slack等工具。通过模拟人类工程师的推理和运维流程,Resolve AI大幅缩短平均修复时间(MTTR),防止故障发生,让工程团队专注于创新而非救火。 ## 产品概述 Resolve AI是一款前沿的AI生产工程师,专为自主处理告警、执行根因分析及解决复杂云和软件基础设施中的事件而设计。它会持续构建和更新生产环境的全面知识图谱,并无缝集成AWS、Kubernetes、GitHub、Slack等工具。通过模拟人类工程师的推理和运维流程,Resolve AI大幅缩短平均修复时间(MTTR),防止故障发生,让工程团队专注于创新而非救火。 ## 主要功能 | | | | --- | --- | | **自主化事件管理** | 自动检测、调查并解决告警和事件,无需人工干预,将平均修复时间(MTTR)缩短高达80%。 | | **动态知识图谱** | 持续映射并更新基础设施、代码、部署和依赖的详细模型,保持实时的态势感知。 | | **深度集成DevOps工具** | 可直接操作云平台、可观测性工具、源码仓库和沟通渠道,执行复杂的运维任务。 | | **多步推理Agentic AI** | 采用多种专用AI Agent协作,分流问题、假设根因,并以类人的逻辑执行修复步骤。 | | **主动事件预防** | 基于事件经验动态调整监控阈值和运行手册,减少告警噪音并防止未来问题发生。 | | **企业级安全与合规** | 符合SOC2 Type 2等高安全标准,保障客户数据隐私和完整性。 | ## 使用场景 - **值班事件响应:**通过自主管理告警和事件修复,减轻值班工程师负担,防止职业倦怠。 - **生产系统可靠性:**通过快速诊断和解决云基础设施及应用的生产问题,提高系统可用性。 - **根因分析:**以证据为基础,快速识别事件根因,并提供可执行的修复方案。 - **运维效率提升:**标准化并自动化复杂运维流程,让团队更快、更有信心地交付新功能。 - **协作与知识共享:**作为协作型AI队友,集成Slack等工具,协助工程师并记录事件复盘。 ---