高级 Bash 脚本编程指南
本教程内容转载自:https://github.com/LinuxStory/Advanced-Bash-Scripting-Guide-in-Chinese
感谢开源翻译!!!
本教程内容转载自:https://github.com/LinuxStory/Advanced-Bash-Scripting-Guide-in-Chinese
感谢开源翻译!!!
博客地址 | 简介 |
---|---|
敖小剑的博客 | 资深码农,十九年软件开发经验,微服务专家,Service Mesh布道师,Servicemesher社区联合创始人,Dapr Maintainer |
骏马金龙 | 运维开发,Ansible专栏:一步到位玩透Ansible 作者 |
https://lework.github.io/ | |
杜屹东的博客 | 亚马逊解决方案架构师、前阿里工程师,全栈、devops |
苏易北 | 公有云从业者,坐标深圳。Go / Python / Shell / C,专注云计算、虚拟化领域相关实践 |
mrhope | 物理专业的大佬,vuepress-theme-hope 主题作者 |
二丫讲梵 | 博客朋友李启龙的博客,内容十分优质,国内最全的nexus 系列文档 |
willseecloud | 优秀的运维笔记 |
张种恩的技术小栈 | |
Java 全栈知识体系 | |
CTC的运维学习笔记 | |
Find the Best Programming Courses & Tutorials | |
经济高速发展的今天,我们处于信息大爆炸的时代。随着经济发展,信息借助互联网的力量在全球自由地流动,于是就催生了各种各样的服务平台和软件系统。
由于业务的多样性,这些平台和系统也变得异常的复杂。如何对其进行监控和维护是我们 IT 人需要面对的重要问题。就在这样一个纷繁复杂地环境下,监控系统粉墨登场了。
今天,我们会对 IT 监控系统进行介绍,包括其功能,分类,分层;同时也会介绍几款流行的监控平台。
运维,这里指互联网运维,通常属于技术部门,与研发、测试同为互联网产品技术支撑的3大部门,这个划分在国内和国外以及大小公司间都会多少有一些不同。
一个互联网产品的生成一般经历的过程是:项目立项、需求分析、研发部门开发、测试部门测试、运维部门部署发布以及长期的运行维护。
运维,本质上是对网络、服务器、服务的生命周期各个阶段的运营与维护,在成本、稳定性、效率上达成一致可接受的状态。
简单理解,研发、测试不干的活,小公司都可以归运维管。
💡 要指定学习路线,首先我们要搞情况 SRE 的工作职责。
SRE(Site Reliability Engineering)站点可靠性工程是一种结合软件工程和运维运营原则的角色和方法论,旨在在系统、服务或产品的设计、开发、部署和运维过程中,采取一系列措施来确保其持续稳定运行、可靠性和可用性。
SRE/稳定性保障具体措施包括但不限于:
上次发文 K8s 无备份,不运维,文章开篇,插入了一张 K8s 集群巡检的图片,好多小伙伴私信留言,问我要开源地址。由于其通用性不高,大多数公司需要结合自身的架构情况进行不同的巡检,所以我没有开源。
今天发现有小伙伴还在群里讨论,有没有类似的工具/平台,虽然没有开源,我把其关键的 巡检指标 和 后端核心伪代码 分享出来,供各位同行参考。