Skip to content
SRE运维进阶之路SRE运维进阶之路
github icon
  • kubernetes

    • Kubernetes 学习笔记
      • 集群搭建

        • 使用 ansible 快速搭建 k8s 集群
        • 常见应用安装配置

          • Harbor 安装配置(k8s)
            • Harbor 高可用搭建(docker-compose)
              • Rancher 安装配置
                • Helm 安装配置
                • 容器运行时

                  • k8s 适配 GPU
                    • Kata2 尝试
                    • 存储

                      • Longorn 安装配置
                        • 使用 Rook 快速搭建 Ceph 集群
                        • 服务发现与路由

                          • ingress-nginx 安装配置
                          • 集群网络

                            • CNI
                              • Calico
                              • 监控告警

                                • Prometheus Operator 安装配置
                                • 实用技巧

                                  • 运维手册

                                    • etcd 备份恢复
                                      • velero 备份恢复
                                        • k8s 开启审计日志
                                          • 内核版本升级
                                            • 使用 kubeadm 手动更新证书
                                              • 为 k8s node 配置资源预留
                                                • 利用LXCFS提升容器资源可见性
                                                • 最佳实践

                                                  • k8s node 配置资源预留
                                                    • 背景
                                                      • 具体操作步骤
                                                      • 性能压测指标及方法
                                                        • CPU 绑核
                                                        • 集群排障

                                                          • 如何更新Terminating状态的命名空间
                                                            • 卸载 rancher 导致 node 被清空
                                                              • lvs 健康检查 k8s apiserver
                                                                • k8s 更改apiserver使用强加密算法
                                                                • 教程|项目|博客|文章推荐
                                                                  • 附录

                                                                    • 快捷命令

                                                                  k8s node 配置资源预留

                                                                  author iconClaycalendar icon2022年1月26日category icon
                                                                  • 云原生
                                                                  tag icon
                                                                  • Kubernetes
                                                                  timer icon小于 1 分钟

                                                                  此页内容
                                                                  • 背景
                                                                  • 具体操作步骤

                                                                  # k8s node 配置资源预留

                                                                  # 背景

                                                                  如果某些pod 没有设置资源限制,导致 node 节点 负载过高,进而导入 kubelet 和 apiserver 的心跳出现问题,节点就会 Not Ready

                                                                  Not Ready 的 节点 开始驱逐应用,当没有资源限制的应用跑到其他 节点,其他节点也会产生连锁反应,load 高,心跳失败,Not Ready,进而导致整个集群的雪崩

                                                                  所以现在设置资源预留:防止 某些 pod 将 cpu 跑满,进而 kubelet 和 apiserver 心跳失败,出现 Not Ready 现象

                                                                  # 具体操作步骤

                                                                  在 kubelet yaml 文件中 追加以下内容,然后重启 kubelet

                                                                  /var/lib/kubelet/config.yaml

                                                                  enforceNodeAllocatable:  # 配置资源预留
                                                                  - pods
                                                                  kubeReserved:  # 配置 kube 资源预留
                                                                    cpu: 1000m
                                                                    memory: 1Gi
                                                                    ephemeral-storage: 8Gi
                                                                  systemReserved:  # 配置系统资源预留
                                                                    memory: 1Gi
                                                                  evictionHard:  # 配置硬驱逐阈值
                                                                    memory.available: "5%"
                                                                    nodefs.available: "10%"
                                                                  
                                                                  1
                                                                  2
                                                                  3
                                                                  4
                                                                  5
                                                                  6
                                                                  7
                                                                  8
                                                                  9
                                                                  10
                                                                  11
                                                                  systemctl restart kubelet
                                                                  
                                                                  1

                                                                  参考链接:

                                                                  • 资源预留 | 阳明open in new window
                                                                  edit icon编辑此页open in new window
                                                                  上次编辑于: 2022/9/15 10:31:37
                                                                  贡献者: clay-wangzhi
                                                                  下一页
                                                                  性能压测指标及方法
                                                                  备案号:冀ICP备2021007336号
                                                                  Copyright © 2023 Clay