Kubernetes
•
•
By Hank
K8s 故障排查 SOP:從 Pod CrashLoopBackOff 到節點 NotReady
排查流程 SOP
當 Pod 進入 CrashLoopBackOff 或 Pending 狀態時,請依照以下順序執行:
- 查看狀態:
kubectl get pods -o wide確認所在節點。 - 檢視事件:
kubectl describe pod <pod-name>查看 Events,通常能發現 Image Pull Error 或資源不足。 - 查看 Log:
kubectl logs <pod-name> --previous查看崩潰前的最後日誌。 - 節點層級:若 Node 異常,使用
kubectl debug node/<node-name> -it --image=busybox或直接 SSH 進入,檢查journalctl -u kubelet。
小技巧:善用 nsenter 直接進入 Host Namespace 進行網路除錯。