聊透监控体系
经济高速发展的今天,我们处于信息大爆炸的时代。随着经济发展,信息借助互联网的力量在全球自由地流动,于是就催生了各种各样的服务平台和软件系统。
由于业务的多样性,这些平台和系统也变得异常的复杂。如何对其进行监控和维护是我们 IT 人需要面对的重要问题。就在这样一个纷繁复杂地环境下,监控系统粉墨登场了。
今天,我们会对 IT 监控系统进行介绍,包括其功能,分类,分层;同时也会介绍几款流行的监控平台。
经济高速发展的今天,我们处于信息大爆炸的时代。随着经济发展,信息借助互联网的力量在全球自由地流动,于是就催生了各种各样的服务平台和软件系统。
由于业务的多样性,这些平台和系统也变得异常的复杂。如何对其进行监控和维护是我们 IT 人需要面对的重要问题。就在这样一个纷繁复杂地环境下,监控系统粉墨登场了。
今天,我们会对 IT 监控系统进行介绍,包括其功能,分类,分层;同时也会介绍几款流行的监控平台。
我看到很多人会这样使用联邦:联邦 prometheus 收集多个采集器的数据
实在看不下下去了,很多小白还在乱用prometheus
的联邦
其实很多人是想实现 prometheus 数据的可用性,数据分片保存,有个统一的查询地方(小白中的联邦 prometheus)
而且引入 m3db 等支持集群的 tsdb 可能比较重
具体问题可以看我之前写的文章 m3db 资源开销,聚合降采样,查询限制等注意事项[1]
今天写篇文章分析下联邦的问题,并给出一个基于全部是 prometheus 的multi_remote_read
方案
Prometheus在抓取container的CPU/Mem等metric的时候,发现metric上没有带Pod的label,这导致一个问题,无法通过自定义的label查看其下的所有metric资源。 例如下面的一个a-custom-project, 带了一个project: a-custom-project label
转载自: 公众号运维开发故事 | wanger
对经常维护网站的人来说,要经常跟https的证书打交道。一般https证书的有效期是一年,证书一旦过期,公司的损失会非常大。去年网易邮箱因为https证书忘记续期,导致大量用户无法正常使用邮箱就是个典型案例。什么时候想起来才去手动查一下也不现实,最好的方法是把过期时间监控起来,距离一定期限自动发送通知。
场景:因为使用了netstat -p参数。
权限问题,zabbix_agentd是zabbix用户启动的,默认不能执行netstat -p等命令,导致从服务器取到的自动发现脚本为空
(Not all processes could be identified, non-owned process info will not be shown, you would have to be root to see it all.) 解决方法 :
探索Zabbix4.4新功能
https://www.zabbix.com/cn/whats_new_4_4
新一代的Zabbix Agent
活动和告警功能升级:应用Webhooks和可编程逻辑
为Zabbix模板设置标准
我们为模板引入了一组标准和定义明确的 准则。 对于所有模板的创建者和维护者以及所有Zabbix用户来说,统一标准非常重要。
对XML/JSON文件的结构进行了极大的简化,仅使用文本编辑器即可手动编辑模板。大多数现有的模板都经过了改进以适应新的标准。
官方支持TimescaleDB
监控项和触发器的知识库
高级可视化功能
仪表板和相关的小工具在许多方面得到了改进,简化了创建和管理的过程, 增加了只需单击鼠标即可修改小工具参数的功能。现在仪表板网格尺寸极佳可支持超宽屏幕和大屏幕墙。
问题视图小工具增强支持聚合视图,并引入了一个新的小工具来显示图形原型。
此外,所有小工具现在都可以在无标题模式下显示。
条形图和聚合
官方支持更多新平台
请参阅下载 页面中的所有可用平台
云端一键部署
Zabbix容器或镜像已经上线以下国际主流云平台,国内版本即将依次上线:
Google Cloud Platform
安全的自动注册功能
预处理功能升级:高级JSONPath
用户宏的描述
更高效高级的数据收集
待整理链接有:
tomcat监控自动重启脚本:https://mp.weixin.qq.com/s?__biz=MzU2MDg5NzYzNA==&mid=2247483717&idx=1&sn=f3404f8b58d260cf29bb465525a0c391&chksm=fc004a48cb77c35e4a0646d82b015ea76ab5642c3dda935f75845de449fecb7ea64e8c501d0b&scene=21#wechat_redirect
tomcat,jmx监控:https://www.cnblogs.com/ssgeek/p/9299273.html,
zabbix旧版本可以用,新版本建议用官方模板
activemq 防火墙的添加还是有问题,先把防火墙给关了,它好像是后续会再产生一个随机端口,进行数据的传输
因为是基于JMX进行监控的
配置./apache-activemq-5.11.1/conf/activemq.xml
ansible-galaxy install dj-wasabi.zabbix-server