产品概述
fixa是一个开源平台,旨在帮助开发者高效测试、监控和调试AI语音Agent。它通过可自定义的测试Agent和场景自动化端到端测试,并利用大语言模型(LLM)评估对话。平台跟踪关键指标如延迟、中断和准确性,帮助开发者快速定位幻觉或转写错误等问题。fixa集成了Twilio(呼叫发起)、Deepgram(转写)、Cartesia(文本转语音)和OpenAI(评估)等工具,为语音AI质量保障和可观测性提供全面工具包。
主要功能
| 自动化语音Agent测试 | 通过可自定义的测试Agent和场景,模拟真实电话呼叫您的语音Agent,验证其性能。 |
| LLM驱动评估 | 利用大语言模型(LLM)自动评估对话质量,检测误解或漏确认等失败情况。 |
| 全面可观测性 | 监控延迟指标(p50、p90、p95)、中断和转写准确率,深入洞察语音Agent行为。 |
| 开源且可扩展 | 完全开源的Python包,允许用户集成自选API并自定义测试与评估流程。 |
| 云端可视化平台 | 可选的云服务,支持音频回放、转写、失败定位及通过Slack推送告警等测试结果可视化。 |
| 灵活集成架构 | 基于Twilio、Deepgram、Cartesia和OpenAI构建,计划支持更多集成,适配多样化语音AI生态。 |
使用场景
- 语音Agent质量保障:运行自动化测试,确保AI语音助手在多种对话场景下表现可靠。
- 生产环境监控:实时分析通话,检测并诊断延迟突增、中断及错误响应等问题。
- Prompt与对话调试:定位幻觉、漏确认等失败根因,并获得可操作的Prompt优化建议。
- 开发与迭代:通过集成测试与评估至CI/CD流程,加速语音Agent开发周期。
- 团队协作与告警:利用Slack告警和云端看板,实时掌握语音Agent健康状况,快速响应问题。

