Tensorfuse
无服务器 GPU 运行环境,助力在私有云基础设施上无缝部署、微调及自动扩展 AI 模型。
Tensorfuse 是一款前沿平台,通过管理你自有云上的 Kubernetes 集群,简化生成式 AI 模型的运行。平台实现了无服务器 GPU 使用,支持按需自动扩缩容,闲置时可降至零。支持多种硬件(如 A10G、A100、H100 GPU,TPU,Trainium/Inferentia 芯片和 FPGA),灵活高效地部署模型。平台提供 OpenAI 兼容 API、无服务器训练任务及内置 LoRA、QLoRA 微调方法,帮助开发者专注于 AI 开发,无需关注复杂的基础设施管理,大幅降低云端 GPU 成本。