移除所有失败的pod

kubectl delete pod --field-selector="status.phase==Failed"

查看证书信息

查看 AWS LoadBalancer 证书的信息,检查证书的有效期:

kubectl get validatingwebhookconfigurations.admissionregistration.k8s.io aws-load-balancer-webhook -ojsonpath={.webhooks[0].clientConfig.caBundle}  | base64 -d  | openssl x509 -noout -text

使用 Debug 容器

# 给特定的容器附加一个Sidecar, 并启动shell。
kubectl debug -it --image=public.ecr.aws/amazonlinux/amazonlinux:latest aws-node-cpmck
# netshoot容器, 比较方便的用来进行网络部分的调试。
# 项目仓库地址: https://github.com/nicolaka/netshoot
kubectl debug mypod -it --image=nicolaka/netshoot

查看EKS集群插件的兼容范围

aws eks describe-addon-versions --kubernetes-version 1.25 --addon-name vpc-cni | grep addonVersion

列出节点上所有容器的镜像名称

# ssh 到节点上面执行
nerdctl inspect $(nerdctl ps -a -q) | grep -i "image.:"  | sort -f

# 清理节点上未使用的镜像,不仅仅是 dangling image
nerdctl image prune -af

# 设置 nerdctl 命令的自动补全
nerdctl completion bash > /etc/bash_completion.d/nerdctl

Nsenter 进入容器

[[EKS_nsenter_into_container]]

nerdctl inspect 02182f3e9137 | grep -i pid
                "Pid": 10306,
nsenter -t 10306 -n

给系统加上一点点压力

nerdctl run -ti --rm reg.liarlee.site/docker.io/polinux/stress-ng:latest --help
nerdctl run -ti --rm reg.liarlee.site/docker.io/polinux/stress-ng:latest --cpu 1

强制删除 Pod

kubectl delete pod/applications-7c5f67d6bd-72jcf --force --grace-period=0
当然也可以删除什么其他的资源, 都可以, 实在不行就是 Finalizer 的影响, 需要删除 finalizer 了; 还有另一个问题是 pdb 可能会阻止一部分资源的删除, 也是需要查的.