Layercode

产品概述

Layercode是一个云基础设施平台，使开发者能够构建生产就绪的语音AI Agent，而无需管理实时音频系统的复杂性。它处理完整的语音管道——包括语音转文本、文本转语音、对话轮换和音频流——并通过简单的webhook连接到您自己的后端逻辑。开发者完全控制其LLM、Agent逻辑和工具调用，而Layercode通过覆盖330多个位置的全球边缘网络提供语音层，实现低于50毫秒的音频处理。它支持跨Web、移动端和电话渠道的部署，采用基于使用量的定价，仅对活跃通话时间收费。

主要功能

托管语音管道	处理完整的实时音频技术栈——语音转文本、文本转语音、对话轮换和低延迟音频流——开发者只需专注于Agent逻辑。
基于Webhook的后端集成	通过单个webhook连接任何LLM、Agent框架或自定义后端逻辑。不绑定特定技术栈——可在任何地方部署后端。
全球边缘网络	音频在全球330多个边缘节点处理，为服务任何地区用户的语音Agent提供低于50毫秒的延迟。
多提供商语音模型支持	支持包括Deepgram、ElevenLabs、Cartesia和Rime在内的领先STT和TTS提供商，可在不更改代码的情况下热切换提供商。
CLI和SDK工具	单个CLI命令即可搭建完整的语音Agent项目，内置隧道、示例后端和仪表板配置。提供Node.js、Python、React和原生JS的SDK。
会话录制和分析	内置延迟分析、会话录制、对话回放和转录导出，用于调试、质量保证和性能监控。

使用场景

语音AI Agent开发：开发者可以快速原型设计并发布用于客户服务、虚拟助手或交互式应用的生产级语音Agent。
电话和呼叫自动化：将语音Agent连接到电话号码，自动化入站或出站呼叫工作流，无需构建自定义电话基础设施。
多语言语音应用：构建支持跨语言和地区用户的语音界面，利用边缘部署在全球范围内提供一致的低延迟性能。
基于LLM的对话产品：产品团队可以为现有的基于文本的LLM Agent或聊天机器人添加语音层，无需重建核心逻辑。
开发者工具和编程助手：像Layercode自己的Sled产品这样的工具展示了如何为编程Agent添加语音界面，实现免手操作、移动端可访问的工作流。

常见问题（FAQ）

Layercode实际处理什么，我需要自己构建什么？

Layercode处理整个语音基础设施：音频流、语音转文本、文本转语音和对话轮换。您构建并拥有Agent逻辑——LLM调用、提示和工具定义——并通过webhook公开。

我需要使用特定的LLM或Agent框架吗？

不需要。Layercode与LLM无关。您可以使用OpenAI、Anthropic或任何其他模型，并与LangChain等框架或完全自定义的后端集成。

如何开始使用？

在终端中运行 npx @layercode/cli init。它会搭建项目、设置本地隧道，并在几分钟内连接到Layercode的仪表板。

Layercode如何定价？

基于使用量计费，仅按活跃语音的秒数收费。静音时间不收费。

Layercode支持哪些语音提供商？

对于STT，目前支持Deepgram（包括Flux），更多提供商即将推出。对于TTS，提供ElevenLabs、Cartesia和Rime。您可以使用自己的API密钥或使用Layercode托管的凭据。

我可以将语音Agent部署到电话号码吗？

可以。Layercode支持Web、移动端和电话渠道，因此您可以直接将电话号码连接到语音Agent。

Layercode如何在全球范围内实现低延迟？

其云服务运行在330多个边缘节点上，无论终端用户的地理位置如何，都能在约50毫秒内处理音频。

我可以监控和调试语音Agent的性能吗？

可以。仪表板提供延迟分析、会话录制、对话回放、日志检查和转录下载。

发现好站？

Layercode

产品概述

主要功能

使用场景

常见问题（FAQ）