RockyLinux9 By SystemArch_Alex

Rocky Linux 9 基礎教學 (26):硬體資訊查詢與系統除錯實務

深入了解你的伺服器底層

無論是在實體機還是虛擬化環境中,精確掌握硬體資訊是進行效能調優與故障排除的前提。當系統出現異常重啟或磁碟效能下降時,工程師需要透過一系列工具來「診斷」硬體狀態。Rocky Linux 9 提供了多種內建工具,讓我們能從 CPU 規格到硬碟序號都一覽無遺。

1. CPU 與處理器資訊 (lscpu)

當你需要確認伺服器的核心數、線程數以及是否支援虛擬化技術 (VT-x/AMD-V) 時,lscpu 是最快的方式:

lscpu

特別注意 cpu op-mode(s),它會顯示處理器是 32 位元還是 64 位元,以及 flags 欄位中是否包含 vmxsvm,這決定了該機器是否能運行 K8s 或虛擬機。

2. 磁碟與儲存裝置 (lsblk, smartctl)

查看磁碟分區結構與掛載點,lsblk 是最直觀的工具:

lsblk -fp

若要檢查硬碟的物理健康狀況,則需要安裝 smartmontools

sudo dnf install smartmontools -y
sudo smartctl -a /dev/sda

觀察 reallocated_sector_ct 數值,若大於 0,代表硬碟可能即將損壞,應盡快備份資料。

3. 記憶體與插槽資訊 (dmidecode)

如果你需要知道主機板上有幾個記憶體插槽,以及目前插了幾條、頻率是多少,而不想拆開機殼,可以使用 dmidecode

sudo dmidecode -t memory

此指令還能查詢伺服器的序列號 (Serial Number),這在向廠商報修時非常有用:

sudo dmidecode -s system-serial-number
4. PCI 與 USB 裝置 (lspci, lsusb)

當你新插了一張網卡或 GPU 但系統沒偵測到時,可以用這些工具確認硬體是否已被核心識別:

lspci | grep -i ethernet
lsusb
5. 維運心得:建立硬體資產清單

資深工程師應養成在系統上線初期就將這些資訊匯出成文字檔的習慣。例如執行 sudo dmidecode > hardware_info.txt。當未來發生故障時,這份清單能幫助你快速比對硬體變動。在 Rocky Linux 9 中,結合 journalctl -k (核心日誌),你可以精確定位是哪個硬體驅動程式導致了系統崩潰。