跳至主要內容
别再乱用 Prometheus 联邦了,分享一个 Prometheus 高可用新方案

别再乱用 Prometheus 联邦了,分享一个 Prometheus 高可用新方案

转载自:别再乱用 Prometheus 联邦了,分享一个 Prometheus 高可用新方案 | 云原生实验室

前言

  • 我看到很多人会这样使用联邦:联邦 prometheus 收集多个采集器的数据

  • 实在看不下下去了,很多小白还在乱用prometheus的联邦

  • 其实很多人是想实现 prometheus 数据的可用性,数据分片保存,有个统一的查询地方(小白中的联邦 prometheus)

  • 而且引入 m3db 等支持集群的 tsdb 可能比较重

  • 具体问题可以看我之前写的文章 m3db 资源开销,聚合降采样,查询限制等注意事项[1]

    • m3db-node oom 追踪和内存分配器代码查看[2]
  • 今天写篇文章分析下联邦的问题,并给出一个基于全部是 prometheus 的multi_remote_read方案


Clay大约 6 分钟监控prometheus