Liarlee's Notebook

发表于2022-10-11|更新于2025-05-10|Linux

完全隔离CPU，并排空CPU所有的进程，分配指定的任务到CPU上。当前的情况下，我有CPU 0 - 3，我希望隔离出CPU3 来进行指定的任务运行（方法是传递内核参数并重启） vim /etc/default/grub GRUB_CMDLINE_LINUX='................isolcpu=3 nohz_full=3' grub2-mkconfig -o /boot/grub2/grub.cfg sync && systemctl reboot 重启之后，CPU3 就已经从CFS的调度列表上面拿掉了，可以通过如下的参数证明。 # 查看设置是否已经正确的生效，分离的CPU会表示为序号，一般是： 0-2 ， 3 。这两种表示方式。 cat /sys/devices/system/cpu/isolated 3 cat /sys/devices/system/cpu/nohz_full 3 关于nohz_full这个参数，需要编译内核的时候就启用这个功能。 # 需要启用的参数如下： CONFIG_NO_HZ_COMMON=y CONFIG_NO_HZ_FULL=y CONFIG_NO_HZ=y 这部分的内容还包括的Kernel的Tickless等等知识，这个部分的内容我在Redhat的文档中有看到。但是文档比较旧了，这个设置是基于Redhat 7 版本的说明，可能现在有更好的方法，我不太确定。重启之后， CPU3上面已经完全不会有用户空间的进程被调度上去了，同时，由于已经配置了NOHZ的参数，CPU3 上面也不会有Kernel Timer Interrept触发，因此也少了一部分中断。 Redhat的文档中定义了如下的方式进行验证，我直接抄下面的内容了。关于如何验证Cpu隔离的文档： https://access.redhat.com/solutions/3875421配置隔离CPU的方法已经确认功能是否激活的方法：https://access.redhat.com/documentation/en-us/red_hat_enterprise_linux/8/html/monitoring_and_managing_system_status_and_performance/index perf stat -C 1 -e irq_vectors:local_timer_entry taskset -c 3 sleep 3 先记录这么多吧，这个功能用到的地方实在是有限，基本上不怎么需要。并且需要知道是现在已经不怎么需要使用这个工具进行调优了， Redhat有 Tuned 守护进程，可以通过默认的profile对OS进行调优。

Cilium 踩坑总结

发表于2022-08-19|更新于2025-05-10|Kubernetes

测试环境 KVM - hayden@HaydenArchDesktop ~> virsh version Compiled against library: libvirt 8.6.0 Using library: libvirt 8.6.0 Using API: QEMU 8.6.0 Running hypervisor: QEMU 7.0.0 VM OS： root@fedora ~# cat /etc/os-release NAME=”Fedora Linux” VERSION=”36 (Thirty Six)” ID=fedora VERSION_ID=36 KVM 虚拟机两台 Master： hostname: fedora Node： hostname: knode1 kubernetes 版本： v1.24.3 kubernetes 安装方式： kubeadm docker版本: docker://20.10.17 NOTE: (尝试使用Containerd，但是翻车了，控制平面的Pod启动不了，所以放弃了，遂使用CRI-Dockerd，配置了Docker runtime， Containerd使用默认的参数无法正常的启动，看起来即使真的升级到了1.24 迁移还是一个问题) Kernel Version: 5.17.5-300.fc36.x86_64 Helm参数如果是在KVM启动的虚拟机，可以通过这个安装参数来开启更多功能，但是受限于我的KVM虚拟网卡驱动不能attach xdp 程序，所以。。。。xdp 加速无法启用，但是其他的高级特性均可开启，集群状态正常。 helm upgrade -i cilium cilium/cilium \ --namespace kube-system \ --set tunnel=disabled \ --set autoDirectNodeRoutes=true \ --set loadBalancer.mode=dsr \ --set kubeProxyReplacement=strict \ --set enableIPv4Masquerade=false \ --set loadBalancer.algorithm=maglev \ --set devices=enp1s0 \ --set k8sServiceHost=192.168.31.100 \ --set k8sServicePort=6443 \ --set hubble.relay.enabled=true \ --set hubble.ui.enabled=true Cilium Clitouch ./install_cilium_cli.sh CILIUM_CLI_VERSION=$(curl -s https://raw.githubusercontent.com/cilium/cilium-cli/main/stable.txt) CLI_ARCH=amd64 if [ "$(uname -m)" = "aarch64" ]; then CLI_ARCH=arm64; fi curl -L --fail --remote-name-all https://github.com/cilium/cilium-cli/releases/download/${CILIUM_CLI_VERSION}/cilium-linux-${CLI_ARCH}.tar.gz{,.sha256sum} sha256sum --check cilium-linux-${CLI_ARCH}.tar.gz.sha256sum sudo tar xzvfC cilium-linux-${CLI_ARCH}.tar.gz /usr/local/bin rm cilium-linux-${CLI_ARCH}.tar.gz{,.sha256sum} Hubble Clitouch ./install_hubble_client.sh HUBBLE_VERSION=$(curl -s https://raw.githubusercontent.com/cilium/hubble/master/stable.txt) HUBBLE_ARCH=amd64 if [ "$(uname -m)" = "aarch64" ]; then HUBBLE_ARCH=arm64; fi curl -L --fail --remote-name-all https://github.com/cilium/hubble/releases/download/$HUBBLE_VERSION/hubble-linux-${HUBBLE_ARCH}.tar.gz{,.sha256sum} sha256sum --check hubble-linux-${HUBBLE_ARCH}.tar.gz.sha256sum sudo tar xzvfC hubble-linux-${HUBBLE_ARCH}.tar.gz /usr/local/bin rm hubble-linux-${HUBBLE_ARCH}.tar.gz{,.sha256sum} Cilium Cli 安装插件命令cilium upgrade # 原地升级 # 安装并直接替换kubeproxy cilium install --version 1.14.1 --set kubeProxyReplacement=true --set=ipam.operator.clusterPoolIPv4PodCIDRList="10.42.0.0/16" --set k8sServiceHost=kube3s.liarlee.site --set k8sServicePort=6443 # 升级 hayden@arch ~> cilium upgrade 🔮 Auto-detected Kubernetes kind: K3s ℹ️ Using Cilium version 1.14.2 🔮 Auto-detected cluster name: default # 看状态 cilium status # 使用hubble cilium hubble port-forward & cilium hubble enable --ui hubble observe --since=1m -t l7 - 特性以及状态检查默认的安装完成之后开启特性如下： Kubeproxy Bypass Iptables Bypass LoadBalancer 算法： Meglav LoadBalancer 特性： DSR 报文Masquerade 封装： Disabled Hubble ： Enable 隧道封包： Disabled 下面是 CIlium Status的命令返回结果： root@fedora ~# cilium status /¯¯\ /¯¯\__/¯¯\ Cilium: OK \__/¯¯\__/ Operator: OK /¯¯\__/¯¯\ Hubble: OK \__/¯¯\__/ ClusterMesh: disabled \__/ Deployment cilium-operator Desired: 2, Ready: 2/2, Available: 2/2 Deployment hubble-relay Desired: 1, Ready: 1/1, Available: 1/1 DaemonSet cilium Desired: 2, Ready: 2/2, Available: 2/2 Deployment hubble-ui Desired: 1, Ready: 1/1, Available: 1/1 Containers: hubble-relay Running: 1 hubble-ui Running: 1 cilium Running: 2 cilium-operator Running: 2 Cluster Pods: 14/14 managed by Cilium Image versions hubble-ui quay.io/cilium/hubble-ui:v0.9.0@sha256:0ef04e9a29212925da6bdfd0ba5b581765e41a01f1cc30563cef9b30b457fea0: 1 hubble-ui quay.io/cilium/hubble-ui-backend:v0.9.0@sha256:000df6b76719f607a9edefb9af94dfd1811a6f1b6a8a9c537cba90bf12df474b: 1 cilium quay.io/cilium/cilium:v1.12.0@sha256:079baa4fa1b9fe638f96084f4e0297c84dd4fb215d29d2321dcbe54273f63ade: 2 cilium-operator quay.io/cilium/operator-generic:v1.12.0@sha256:bb2a42eda766e5d4a87ee8a5433f089db81b72dd04acf6b59fcbb445a95f9410: 2 hubble-relay quay.io/cilium/hubble-relay:v1.12.0@sha256:ca8033ea8a3112d838f958862fa76c8d895e3c8d0f5590de849b91745af5ac4d: 1 ds/cilium 中的命令返回结果： root@fedora:/home/cilium# cilium status KVStore: Ok Disabled Kubernetes: Ok 1.24 (v1.24.3) [linux/amd64] Kubernetes APIs: ["cilium/v2::CiliumClusterwideNetworkPolicy", "cilium/v2::CiliumEndpoint", "cilium/v2::CiliumNetworkPolicy", "cilium/v2::CiliumNode", "core/v1::Namespace", "core/v1::Node", "core/v1::Pods", "core/ ...

如何配置kubelet的节点自动回收资源

发表于2022-04-19|更新于2025-05-10|Kubernetes

配置Node节点按照磁盘阈值回收空间 https://aws.amazon.com/cn/premiumsupport/knowledge-center/eks-worker-nodes-image-cache/ 修改Kubelet参数 Kubelet默认提供了GC的参数 --image-gc-high-threshold 参数用于定义触发映像垃圾收集的磁盘使用百分比。默认值为 85%。 --image-gc-low-threshold 参数用于定义映像垃圾收集尝试释放的磁盘使用百分比。默认值为 80%。如果是自己管理的Node，最好的方式是直接配置kubelet命令行的参数，将上面的参数指定需要的阈值，然后重启kubelet即可。配置文件一般在： /etc/kubernetes/kubelet.config"imageGCHighThresholdPercent": 70, "imageGCLowThresholdPercent": 50,

由 CPU Steal Time 指标解释