在 OMS 檢視 Agent 的健全程度

您可以透過 Agent Health 方案來監測在 OMS 中 Windows 或 Linux 伺服器的 agent。您可以利用 agent heartbeat 事件來監測 agent 的性能、可用性、和地理位置。若您已經有 SCOM agent 或是 direct agent 連結到 OMS,它將會自動產生並收集這些 agent 的 heartbeat 事件。最重要的是,它不會計入您的數據量中。

首先,前往記錄搜尋(Log Search),並輸入 Type=Heartbeat:

現在你可以看到有安裝 Windows 或 Linux agent 的電腦或伺服器清單。包含下列項目:

項目 簡介
Category Direct agent, SCOM agent, SCOM management Server
Computer 電腦名稱
OSType Windows 或 Linux。
OSMajorVersion 作業系統的主要版本。
OSMinorVersion 作業系統的次要版本。
Version OMS/SCOM agent 的版本。
SCAgentChannel Direct agent 或 SCOM management Server。
IsGatewayInstalled Gateway 是否有安裝。
ComputerIP 電腦的 IP 位址。
RemoteIPCountry 電腦的地理位置。
ManagementGroupName SCOM 管理群組的名稱。
SourceComputerId 電腦的特定 ID。
RemoteIPLongitude 電腦地理位置的經度。
RemoteIPLatitude 電腦地理位置的緯度。

視覺化的 Heartbeat 事件

利用 View Designer,您可以建立一個 Agent Health 的方案來使這些結果視覺化。你也可以深入查看一些您關心的關鍵項目,像是隨時間的 agent 分佈或是 agent heartbeat。

打開 View Designer,利用下列指令來填充各個方塊。此範例中,我將我的總覽方塊填入我環境中的 agent 總數和 24小時內沒有任何回應的 agent 數量。

在總覽的部分,利用以下查詢指令來填入環境中的 agent 總數和 24小時內沒有任何回應的 agent 數量:

  • Type=Heartbeat | distinct Computer
  • Type=Heartbeat | measure max(TimeGenerated) as LastCall by Computer | where LastCall < NOW-24HOURS

在 Agent Count over Time 方塊,利用以下查詢指令來計算 agent 數量的趨勢:

Type=Heartbeat | measure countdistinct(Computer) by OSType

利用以下查詢指令在 All List 中列出環境中所有的電腦:

Type=Heartbeat | Distinct Computer

其他參考指令:

 

最後完成的範例:

 

建立提醒來追蹤 Agent Heartbeating

除了Agent heartbeat 事件之外,您也可以建立提醒規則來通知何時有 agent 超過24小時無回應。您可以在建立搜尋紀錄並選取 Alert 按鈕來建立並配置提醒。

利用以下查詢指令:

Type=Heartbeat | measure max(TimeGenerated) as LastCall by Computer | where LastCall < NOW-24HOURS

這是提醒規則的樣子:

按下[Save],您的提醒便開始運作。想知道更多有關在OMS中建立提醒的資訊,請參考:Log Analytics 中的警示