云原生思维导图

从保稳、降本、增效三个方向出发

稳定性就是不出故障，围绕着故障周期，进行梳理。

事前--->事中--->事后

降发生：事前/事后，将异常风险左移

降发生事前：高可用、持续风险治理、持续巡检、持续故障演练（演练库、预案库）、全链路压测、支持灰度发布和快速回滚

Clay小于 1 分钟

云原生业界对标 & 落地实践

Clay、腾讯、字节、美团、滴滴、Vivo等各大公司云原生落地实践整理汇总

Clay^[1]

企业落地云原生的目的

一句话概括：在保证稳定性的前提下，降本增效

云原生能力全景图

推广方法论

1）项目立项，确定目标，从上到下，从下到上，一同发力。

Clay大约 14 分钟

高并发下报错 "java.net.UnknownHostException" 案例分析

流量走向

错误日志

Client 报错

应用的报错日志为：java.net.UnknownHostException:

代理服务报错

Clay原创大约 2 分钟

CNI 概述

转载自：理解CNI和CNI插件 | 阿里云原生

CNI 概述

CNI 是什么

CNI，它的全称是 Container Network Interface，即容器网络的 API 接口。

Clay大约 3 分钟

6 张图带你深入了解 kube-scheduler

本文目录：

kube-scheduler 用途
Scheduler Pod 调度流程
源码调用链路
Scheduler Framework
如何扩展

kube-scheduler 用途

顾名思义：负责将 Pod 调度到 Node 上。

Clay原创大约 6 分钟

从0开始装一套 KubeVirt 1.2.1

KubeVirt 架构

架构

virt-api : 负责提供一些 KubeVirt 特有的 api，像是 console, vnc, startvm, stopvm 等。
virt-controller : 管理和监控 VMI 对象及其关联的 Pod，对其状态进行更新。
virt-hander : 以 DaemonSet 运行在每一个节点上，监听 VMI 的状态向上汇报，管理 VMI 的生命周期。
virt-launcher : 以 Pod 方式运行，每个 VMI Object 都会对应一个 virt-launcher Pod，容器内有单独的 libvirtd，用于启动和管理虚拟机。

Clay原创大约 6 分钟

将 oVirt 虚拟机迁移到 KubeVirt

上篇，我们从0开始装一套 KubeVirt 1.2.1

Clay原创大约 4 分钟

故障排查之单点登录跳转失败(Ingress 相关)

故障现象

单点登录失败，但是其他接口正常

根因分析

问题要点是：单点登录失败，看代码是 request 和 response 的 RedirectUri 不一样导致的。

目前的南北流量架构为：

Clay原创大约 2 分钟

K8s 负载感知调度实践（koordinator & crane）

上篇 “深入了解 kube-scheduler” ，已经知道 kube-scheduler 的工作流程，以及如何实现自定义插件。koordinator 和 crane 都是基于Scheduler Framework 进行实现的负载感知插件。本文不再赘述，感兴趣可以看上篇文章。

背景

原生 Kubernetes 调度器仅基于资源的 Request 进行调度，在生产环境资源的真实使用率和申请率往往相差巨大，造成资源浪费的同时也会造成节点的负载不均衡。

Clay原创大约 3 分钟

K8s 集群巡检

上次发文 K8s 无备份，不运维，文章开篇，插入了一张 K8s 集群巡检的图片，好多小伙伴私信留言，问我要开源地址。由于其通用性不高，大多数公司需要结合自身的架构情况进行不同的巡检，所以我没有开源。

今天发现有小伙伴还在群里讨论，有没有类似的工具/平台，虽然没有开源，我把其关键的 巡检指标 和 后端核心伪代码 分享出来，供各位同行参考。

Clay原创大约 11 分钟

跳转到:

云原生思维导图

云原生业界对标 & 落地实践

Clay[1]

企业落地云原生的目的

云原生能力全景图

推广方法论

高并发下报错 "java.net.UnknownHostException" 案例分析

流量走向

错误日志

CNI 概述

CNI 是什么

6 张图带你深入了解 kube-scheduler

kube-scheduler 用途

从0开始装一套 KubeVirt 1.2.1

KubeVirt 架构

将 oVirt 虚拟机迁移到 KubeVirt

故障排查 之 单点登录跳转失败(Ingress 相关)

故障现象

根因分析

K8s 负载感知调度实践（koordinator & crane）

背景

K8s 集群巡检

Clay^[1]

故障排查之单点登录跳转失败(Ingress 相关)