### [Modal](https://dkwy.com/)

**Published:** 2026-05-06T07:55:29

**Author:** 蛋壳

**Excerpt:** Modal是专为AI、机器学习和数据团队设计的云函数平台，支持运行计算密集型应用，无需管理底层基础设施。平台可实现Python代码的快速无服务器执行，并具备自动弹性扩展和GPU支持，帮助开发者无缝部署推理接口、批处理作业和定时任务。Modal通过直观的Python接口，抽象了容器环境、硬件需求和持久化存储的配置复杂度，仅按实际计算时间计费。与Oracle Cloud Infrastructure深度集成，为大规模AI工作负载提供高性能和高性价比保障。

## 产品概述

Modal是专为AI、机器学习和数据团队设计的云函数平台，支持运行计算密集型应用，无需管理底层基础设施。平台可实现Python代码的快速无服务器执行，并具备自动弹性扩展和GPU支持，帮助开发者无缝部署推理接口、批处理作业和定时任务。Modal通过直观的Python接口，抽象了容器环境、硬件需求和持久化存储的配置复杂度，仅按实际计算时间计费。与Oracle Cloud Infrastructure深度集成，为大规模AI工作负载提供高性能和高性价比保障。

## 主要功能

|     |     |
| --- | --- |
| **无服务器自动弹性扩展** | 可在几秒内自动将计算资源扩展至数百块GPU，也可缩减至零，确保资源高效利用并节省成本。 |
| **高资源上限** | 每个容器支持最高64核CPU、336GB内存和8块Nvidia H100 GPU，满足高强度AI与机器学习工作负载的执行需求。 |
| **以Python为核心的开发体验** | 开发者可通过代码定义基础设施，直接编写和部署Python函数，无需手动配置或编写YAML文件。 |
| **灵活的部署选项** | 函数可作为Web接口、定时任务或批处理任务运行，内置分布式计算支持。 |
| **GPU加速AI工作负载** | 针对AI模型推理、微调及批处理作业进行了优化，支持GPU容器的快速启动并集成高性能云端GPU资源。 |
| **按需计费** | 根据实际CPU、GPU和内存的使用秒数计费，闲置资源不产生费用。 |

## 使用场景

-   **AI模型推理与微调：**可在GPU上大规模运行模型推理或进行模型微调，部署快速，配置简单。
-   **数据管道与批处理：**可扩展地执行复杂数据流程、ETL作业及批量计算，计算资源自动弹性扩展。
-   **实时Web应用：**低延迟地为AI驱动的Web接口和API提供服务，支持实时WebSocket通信。
-   **定时任务与自动化：**无需管理基础设施，即可部署类cron定时任务，用于例行数据处理或模型再训练。
-   **机器学习研究与实验：**可快速原型开发并迭代ML模型，随时获取可扩展算力和持久化存储。


---