DevOps By Hank

Prometheus AlertManager 分組策略

避免告警轟炸 (Alert Fatigue)

設定 group_bygroup_wait
當某個 Cluster 網路斷線,數百個 Pod 同時發出 Alert 時,AlertManager 應將其合併為一封通知,而不是發送數百封 Email 轟炸維運人員。