高流量服务为了降低日志成本,常会做日志采样。但采样策略必须保证错误日志、慢请求日志和关键业务日志不被丢掉。

访问日志可以采样,错误日志应该全量保留。否则出了问题时,刚好缺证据。

if status >= 500 || cost > slowThreshold {
    logFull()
} else {
    logSampled()
}

采样比例要能动态调整。事故期间临时提高日志量,比重新发布代码更快。

分类: 部署与可观测性 标签: 性能 日志 可观测性

评论

-- 评论已关闭 --

全部评论