阶段一 · 模型训练基础
理解训练任务、数据集、分布式训练和Checkpoint等基础。
你将掌握
推荐先读AI训练数据集怎么管理?Kubernetes数据挂载与缓存实践从训练任务基础进入模型工程化学习。 - 理解训练任务、数据集和Checkpoint的关系
- 知道分布式训练和资源调度的基础要求
- 能把训练产物连接到后续发布流程
继续学习