MODEL GUIDE

模型部署与训练教程:MLOps实践

围绕模型训练教程、模型部署教程、模型发布流程、推理服务上线、MLOps和LLMOps治理组织内容,承接AI主学习路径中的模型工程化学习需求。

AI子学习路径聚焦训练到上线流程

学习路径

阶段一 · 模型训练基础理解训练任务、数据集、分布式训练和Checkpoint等基础。

阶段三 · 推理部署与性能优化学习大模型推理部署、vLLM、显存、并发和弹性伸缩。

按技术主题快速查找

按角色选择内容

常见问题

模型部署教程应该从哪里开始?

先理解训练产物如何进入版本管理和评估流程,再学习推理服务、GPU资源、弹性伸缩、监控和回滚。模型部署是工程链路,不只是启动一个接口。

模型训练和模型推理为什么放在一个子学习路径?

因为企业落地时训练产物最终要进入推理服务,训练数据、模型版本、发布审批、性能优化和线上观测是连续链路,拆开学习容易忽略交付边界。

更多学习路径