Kubernetes By Hank

K8s 故障排查 SOP:從 Pod CrashLoopBackOff 到節點 NotReady

排查流程 SOP

當 Pod 進入 CrashLoopBackOffPending 狀態時,請依照以下順序執行:

  1. 查看狀態kubectl get pods -o wide 確認所在節點。
  2. 檢視事件kubectl describe pod <pod-name> 查看 Events,通常能發現 Image Pull Error 或資源不足。
  3. 查看 Logkubectl logs <pod-name> --previous 查看崩潰前的最後日誌。
  4. 節點層級:若 Node 異常,使用 kubectl debug node/<node-name> -it --image=busybox 或直接 SSH 進入,檢查 journalctl -u kubelet

小技巧:善用 nsenter 直接進入 Host Namespace 進行網路除錯。