容器技术

容器技术文章与主题归档

容器技术标签聚合 Docker、容器镜像、容器网络、容器存储、容器安全、容器编排和生产治理相关文章，适合按主题快速查找内容。

显示更多

这个页面定位为容器技术主题归档，主要承接已经发布的相关文章和成熟子主题入口；如果你希望按从入门到生产实践的顺序系统学习，可以进入容器技术学习路径页。

按学习路径系统学习容器技术内容

需要系统学习时，优先进入容器技术学习路径页
需要按主题查找时，可继续查看 Docker容器、容器镜像、容器网络、容器存储、容器安全等标签
当前页面保留文章归档属性，避免与学习路径页重复承担阶段式导航功能

页面定位

容器技术标签页用于聚合站内容器相关内容和成熟主题入口；学习路径、角色分流和阶段式阅读顺序已经由 /container-learning-path/ 页面承接。

K8s容器

K8s优雅终止配置：preStop与SIGTERM策略

滚动更新或缩容时偶发502、连接被重置，往往不是副本数不够，而是终止阶段没有给应用和入口层留出退出窗口。本篇从preStop、SIGTERM和宽限期入手，给出可核对的配置与验证路径。

2026年6月30日
00
K8s容器

K8s调度插件原理：Filter、Score到Bind

Pod Pending不一定是CPU或内存不够，很多问题藏在调度插件的过滤、打分、预留和绑定阶段。本篇用Filter、Score到Bind的链路解释kube-scheduler如何做决策，并给出排查事件、日志和配置的对应视角。

2026年6月8日
00
K8s容器

容器镜像预热-3类节点缓存策略

发布窗口里Pod卡在镜像拉取阶段时，容器镜像预热比单纯加带宽更可控。读完本篇内容，可以区分DaemonSet预拉取、节点池基础缓存和发布窗口预热的适用边界，并掌握版本一致、缓存命中和清理检查点。

2026年6月1日
01
K8s容器

Harbor镜像清理策略：保留规则与回收边界

Harbor镜像清理策略不能只看旧 Tag 数量。本篇围绕保留规则、Artifact 引用、垃圾回收和执行后验证，帮助团队先保护生产与回滚版本，再安全释放镜像仓库存储空间。

2026年5月26日
00
Docker与容器基础

什么是Sidecar容器？和Init容器有什么区别

Sidecar容器常用于日志采集、代理、配置同步和服务网格，但它不是普通业务容器，也不同于只在启动前执行的Init容器。本文用定义、例子、类比和对比表讲清它的作用边界。

2026年5月13日
00
Kubernetes部署与运维

CrashLoopBackOff排查：Pod反复重启的6步定位

CrashLoopBackOff不是一个单一错误，而是Pod中的容器不断启动失败后的状态结果。本文用6步排查法串起事件、日志、退出码、OOM、探针和依赖检查，帮助快速定位Pod反复重启原因。

2026年5月13日
00
云原生技术

统一算力调度架构怎么设计？跨中心与跨集群管理

这篇文章不把统一算力调度架构怎么设计？跨中心与跨集群管理当作孤立工具，而是放在平台标准化、运维协作和业务连续性之间分析。

2026年5月12日
00
云原生技术

算力资源如何池化？GPU、CPU与NPU统一管理

当平台进入多团队、多环境或规模化运行阶段，算力资源如何池化？GPU、CPU与NPU统一管理需要从能力、风险和运营闭环一起评估。

2026年5月12日
01
云原生技术

算力服务门户怎么建设？自助申请与动态配额管理

算力服务门户怎么建设？自助申请与动态配额管理会影响资源纳管、调度效率、服务SLA等关键环节，文章给出从架构判断到生产治理的分析路径。

2026年5月12日
00
云原生技术

多云管理平台是什么？如何统一纳管多云资源

这篇文章不把多云管理平台是什么？如何统一纳管多云资源当作孤立工具，而是放在平台标准化、运维协作和业务连续性之间分析。

2026年5月12日
00
云原生技术

数据预处理为什么更适合CPU？GPU与CPU任务分流方法

围绕算力与AI平台治理的真实落地场景，本文把资源池化、任务提交、调度执行、服务暴露串起来说明，帮助团队降低试错和排障成本。

2026年5月12日
00
云原生技术

智算云平台需要哪些能力？训推一体标准解读

智算云平台需要哪些能力？训推一体标准解读会影响组件健康、节点资源、镜像治理等关键环节，文章给出从架构判断到生产治理的分析路径。

2026年5月12日
00
云原生技术

智算平台是什么？AI训练与推理的云原生基础设施

面向正在建设异构资源纳管、模型服务部署、任务调度、成本核算、SLA保障和多团队自助使用的团队，本文拆解智算平台是什么？AI训练与推理的云原生基础设施的适用边界、落地步骤和治理重点。

2026年5月12日
00
云原生技术

AI时代混合云如何演进？智能混合云架构解析

这篇文章不把AI时代混合云如何演进？智能混合云架构解析当作孤立工具，而是放在平台标准化、运维协作和业务连续性之间分析。

2026年5月12日
00
云原生技术

异构算力如何协同？CPU、GPU与NPU统一调度

当平台进入多团队、多环境或规模化运行阶段，异构算力如何协同？CPU、GPU与NPU统一调度需要从能力、风险和运营闭环一起评估。

2026年5月12日
00
云原生技术

推理网关如何做智能路由与负载均衡？

围绕算力与AI平台治理的真实落地场景，本文把资源池化、任务提交、调度执行、服务暴露串起来说明，帮助团队降低试错和排障成本。

2026年5月12日
00
云原生技术

多卡GPU任务如何选择通信拓扑？拓扑感知调度方法

多卡GPU任务如何选择通信拓扑？拓扑感知调度方法会影响资源纳管、调度效率、服务SLA等关键环节，文章给出从架构判断到生产治理的分析路径。

2026年5月12日
01
云原生技术

算力互联网如何聚合资源？智能算力服务演进方向

面向正在建设异构资源纳管、模型服务部署、任务调度、成本核算、SLA保障和多团队自助使用的团队，本文拆解算力互联网如何聚合资源？智能算力服务演进方向的适用边界、落地步骤和治理重点。

2026年5月12日
00
云原生技术

多代理协调怎么做？AI代理协同复杂任务的方法

这篇文章不把多代理协调怎么做？AI代理协同复杂任务的方法当作孤立工具，而是放在平台标准化、运维协作和业务连续性之间分析。

2026年5月12日
00
云原生技术

大模型训练如何保障高可用？稳定运行的标准化路径

当平台进入多团队、多环境或规模化运行阶段，大模型训练如何保障高可用？稳定运行的标准化路径需要从能力、风险和运营闭环一起评估。

2026年5月12日
00