产品概述
书生通用大模型 是由上海 AI 实验室联合商汤科技及多所高校共同研发的综合性大语言模型系统。系统包含三大核心模型:书生通用大模型M(200 亿参数多模态模型)、书生通用大模型-Chat(支持 8K 上下文的语言模型)、书生通用大模型-XComposer(三维场景重建模型)。基于全链路开源架构,覆盖从数据处理、模型训练到推理部署的完整流程,便于研究者和开发者定制与集成。
主要功能
| 多模态理解 | 书生通用大模型M 具备处理文本、图像和视频的能力,拥有 200 亿参数,基于 80 亿多模态样本训练,支持 350 万语义标签,覆盖真实世界概念。 |
| 全链路开源 | 完整的开发生态系统,包括数据处理工具、训练框架、微调工具和部署方案,配套详尽文档与社区支持。 |
| 跨模态生成 | 具备不同模态间的高级转换能力,如以图生诗、文本生成图片等跨模态创作。 |
| 超长上下文支持 | 书生通用大模型-Chat 支持 8K 上下文长度,适用于长文本对话和文档处理,助力复杂推理与长对话。 |
| 交互式界面 | 支持光标点击与自然语言指令等直观交互方式,降低 AI 任务操作门槛,适合更广泛用户群体。 |
使用场景
- 科研与开发:学术研究者和 AI 开发者可利用开源框架进行定制化模型开发、实验和多模态 AI 前沿探索。
- 智能助手:开发者可构建具备多模态理解能力的智能对话机器人和虚拟助手,应用于客服、教育等场景。
- 内容生成:创意工作者可利用跨模态生成能力,进行文本生成图片、自动化内容创作等多媒体生产。
- 教育科技:教育机构可基于 书生通用大模型 实现智能辅导、自动批改和多模态互动学习体验。
- 企业应用:企业可将 书生通用大模型 集成到工作流中,实现文档处理、代码补全和自动化客服等定制化场景。

