链路追踪
-
OpenTelemetry Collector怎么部署?采集管道配置清单
采集链路一旦接错,链路追踪、指标和日志都会出现缺口。本篇从最小部署目标切入,拆解 OpenTelemetry Collector 管道模型、Kubernetes 配置、验证方法和常见错误,让你按清单完成一次可复查的接入。
-
Prometheus告警降噪怎么做?路由检查方法
遇到重复通知、同源故障刷屏或无人响应时,Prometheus告警降噪要先区分规则噪声和通知链路问题。本篇按 group_by、抑制关系、静默策略和接收人路由梳理检查顺序。
-
异步链路追踪怎么做?消息队列断链排查
同步接口能看到 Trace,消息队列一异步就断链,是很多微服务排障的常见盲区。本篇从生产端、队列属性、消费者、重试和日志关联切入,梳理异步链路追踪的排查方法,帮助团队快速定位断点。
-
OpenTelemetry链路追踪怎么做?微服务排障接入实践
当一次请求跨越网关、服务、消息队列和数据库时,只看日志很难还原完整路径。本文用实践口径拆解 OpenTelemetry链路追踪的接入顺序、关键配置和排障方法,帮助团队建立可复制的追踪落地流程。
-
微服务可观测性怎么规划?日志、指标、链路与SLO实践
微服务系统的故障往往跨服务、跨团队、跨基础设施。本文从日志、指标、链路和 SLO 出发,说明如何把可观测性从工具部署变成排障能力。