故障排查
-
微服务容灾怎么做?超时、重试、隔离与降级思路
微服务容灾不是只在异地建一套环境,而是把超时、重试、隔离和降级这些日常策略做成系统韧性。本文会从故障传播控制角度讲清楚。
-
链路追踪怎么做?微服务调用路径分析与排障实践
链路追踪的价值不只是把请求路径画出来,而是帮助团队在复杂调用关系里快速定位慢点和故障点。本文会从微服务排障视角讲清楚怎么建设和使用。
-
发布回滚怎么设计?版本管理、数据库变更与应急策略实践
发布回滚不是临时出问题时再想办法撤回,而是上线前就要设计好的失败路径。本文会从版本、数据库和应急流程三个关键点拆开讲清楚。