Skip to content
SRE运维进阶之路SRE运维进阶之路
github icon
  • kubernetes

    • Kubernetes 学习笔记
      • 集群搭建

        • 使用 ansible 快速搭建 k8s 集群
        • 常见应用安装配置

          • Harbor 安装配置(k8s)
            • Harbor 高可用搭建(docker-compose)
              • Rancher 安装配置
                • Helm 安装配置
                • 容器运行时

                  • k8s 适配 GPU
                    • GPU 安装步骤
                      • nvidia-docker 2.0 安装步骤
                      • Kata2 尝试
                      • 存储

                        • Longorn 安装配置
                          • 使用 Rook 快速搭建 Ceph 集群
                          • 服务发现与路由

                            • ingress-nginx 安装配置
                            • 集群网络

                              • CNI
                                • Calico
                                • 监控告警

                                  • Prometheus Operator 安装配置
                                  • 实用技巧

                                    • 运维手册

                                      • etcd 备份恢复
                                        • velero 备份恢复
                                          • k8s 开启审计日志
                                            • 内核版本升级
                                              • 使用 kubeadm 手动更新证书
                                                • 为 k8s node 配置资源预留
                                                  • 利用LXCFS提升容器资源可见性
                                                  • 最佳实践

                                                    • k8s node 配置资源预留
                                                      • 性能压测指标及方法
                                                        • CPU 绑核
                                                        • 集群排障

                                                          • 如何更新Terminating状态的命名空间
                                                            • 卸载 rancher 导致 node 被清空
                                                              • lvs 健康检查 k8s apiserver
                                                                • k8s 更改apiserver使用强加密算法
                                                                • 教程|项目|博客|文章推荐
                                                                  • 附录

                                                                    • 快捷命令

                                                                  k8s 适配 GPU

                                                                  author iconClaycalendar icon2022年10月22日category icon
                                                                  • 云原生
                                                                  tag icon
                                                                  • Kubernetes
                                                                  timer icon大约 1 分钟

                                                                  此页内容
                                                                  • GPU 安装步骤
                                                                  • nvidia-docker 2.0 安装步骤

                                                                  # k8s 适配 GPU

                                                                  # GPU 安装步骤

                                                                  # centos7 内核升级后   GPU 安装步骤
                                                                  
                                                                  # 1.  加载 新 内核
                                                                  # 查看内核列表
                                                                  awk -F\' '$1=="menuentry " {print $2}' /etc/grub2.cfg
                                                                  # 指定新内核启动
                                                                  grub2-set-default 'CentOS Linux (5.4.186-1.el7.elrepo.x86_64) 7 (Core)'
                                                                  reboot
                                                                  
                                                                  # 2. 准备GPU驱动安装环境
                                                                  # 卸载原有内核的header与devel模块
                                                                  yum -y remove kernel-headers kernel-devel
                                                                  # 安装现有内核headers和devel模块(必须,显卡编译需要)
                                                                  yum --enablerepo=elrepo-kernel install -y kernel-lt-devel-$(uname -r) kernel-lt-headers-$(uname -r)
                                                                  # 卸载旧的安装包 cd 目录防止 当前目录有相关安装包,卸载不干净
                                                                  cd /opt
                                                                  yum -y remove nvidia*
                                                                  # 安装新版本 gcc ,并使用新版本gcc,注意需要当前会话操作,临时生效
                                                                  yum install centos-release-scl -y
                                                                  yum install devtoolset-8-gcc* -y
                                                                  scl enable devtoolset-8 bash
                                                                  # 安装相关依赖
                                                                  yum -y install libglvnd*
                                                                  
                                                                  # 3. 编译安装GPU驱动
                                                                  # 从官网下载 .run 文件,我放在了xxx /home/clay/NVIDIA-Linux-x86_64-510.54.run , 可以直接去服务器拿
                                                                  # 执行安装命令(/usr/src/kernels目录下文件需要安装kernel-devel包后才会出现),具体的安装包与内核路径根据实际情况填写
                                                                  ./NVIDIA-Linux-x86_64-510.54.run --kernel-source-path=/usr/src/kernels/5.4.186-1.el7.elrepo.x86_64 -k $(uname -r) -s
                                                                  # 查看显卡驱动是否安装成功
                                                                  nvidia-smi
                                                                  
                                                                  1
                                                                  2
                                                                  3
                                                                  4
                                                                  5
                                                                  6
                                                                  7
                                                                  8
                                                                  9
                                                                  10
                                                                  11
                                                                  12
                                                                  13
                                                                  14
                                                                  15
                                                                  16
                                                                  17
                                                                  18
                                                                  19
                                                                  20
                                                                  21
                                                                  22
                                                                  23
                                                                  24
                                                                  25
                                                                  26
                                                                  27
                                                                  28
                                                                  29
                                                                  30

                                                                  # nvidia-docker 2.0 安装步骤

                                                                  # nvidia-docker 2.0 安装步骤
                                                                  distribution=$(. /etc/os-release;echo $ID$VERSION_ID)    && curl -s -L https://nvidia.github.io/libnvidia-container/$distribution/libnvidia-container.repo | sudo tee /etc/yum.repos.d/nvidia-container-toolkit.repo
                                                                  yum-config-manager --enable libnvidia-container-experimental
                                                                  sudo yum clean expire-cache
                                                                  sudo yum install -y nvidia-docker2
                                                                  sudo systemctl restart docker
                                                                  sudo docker run --rm --gpus all nvidia/cuda:11.0-base nvidia-smi
                                                                  
                                                                  1
                                                                  2
                                                                  3
                                                                  4
                                                                  5
                                                                  6
                                                                  7
                                                                  edit icon编辑此页open in new window
                                                                  上次编辑于: 2022/10/22 05:03:44
                                                                  贡献者: clay-wangzhi
                                                                  下一页
                                                                  Kata2 尝试
                                                                  备案号:冀ICP备2021007336号
                                                                  Copyright © 2023 Clay