系統監控與管理的極致應用

本文作者王寧疆,現任職資策會數位教育研究所 台北訓練中心 。


摘要

管理複雜的資訊系統環境隨著資訊系統的日益複雜,管理工作的困難度也隨之升高,欲有效率地管理執行關鍵任務的資訊系統,需要更妥善的規畫與工具的協助,才能馭繁於簡,以系統化,組織化的方式管理支援企業營運的關鍵資訊系統。

系統管理的福音 - Microsoft Azure Operational Insights

針對企業中愈來愈龐大,愈來愈不容易管理的資訊系統,Microsoft提供了一個劃時代的雲端服務,支援利用雲端的科技,輕鬆彙總跨越電腦界限的多種系統資訊,包括事件記錄、設定資訊、系統更新建議、容量規畫、惡意軟體監控、系統設定變更追蹤、SQL Server健康與危機檢視、以及System Center Operations Manager警示等功能,未來將會加入更多的管理套件,例如:目錄服務管理套件和安全與稽核套件等等。

透過Microsoft Azure Operational Insights雲端服務提供的系統管理套件管理企業的關鍵資訊系統,將可以得到以下的六大好處:

  1. 支援跨越電腦界限,搜集來自多部電腦,包括電腦的執行狀態及相關的資料。
  2. 根據Microsoft的知識庫提供系統設定與更新的最佳建議,包括資訊系統容量規畫,系統更新建議,以及防禦軟體保護設定建議等等。
  3. 支援利用瀏覽器快速檢視系統管理需要的資訊,。
  4. 支援將系統狀態與資訊匯出至Excel,方便建立報表或是進行樞鈕分析。
  5. 支援自訂監控主控台,以最方便,最有效率的方式檢視系統管理資訊。
  6. 針對不同的伺服器,提供專家級的系統設定建議,協助系統管理員達成最佳化的系統管理成效。

管理資訊系統的系統管理員可以利用Microsoft Azure Operational Insights提供的單一主控台檢視複雜資料系統的目前狀態與相關資訊,免除自行搜集多部電腦執行狀態與Log記錄的工作,提高管理資訊系統的時效。

 

Microsoft Azure Operational Insights 對系統安裝與設定的建議

系統管理員只要啟動System Center Operations Manager提供的Operations Console工具,執行[系統管理 | System Center Advisor | Advisor連線 | 加入電腦/群組]功能,註冊欲管理的電腦或群組,就可以將所註冊的電腦的相關資訊記錄到Microsoft Azure Operational Insights雲端服務,讓系統管理員能夠利用瀏覽器進行檢視與分析,以發掘系統執行面臨的問題。

圖1:加入欲監控的電腦的畫面

 

點選[加入電腦/群組]連結之後,您就會看到如圖2所示的畫面,請按下[搜尋]鍵,搜尋Operations Manager管理的所有電腦,看到Operations Manager管理的所有電腦清單之後,就可以點選欲管理的電腦,按下[新增]鍵,將欲管理的電腦加入到[選取的物件]清單中,做好之後請按下[確定]鍵,即可完成使用Microsoft Azure Operational Insights雲端服務管理指定的電腦的工作。

圖2:選擇Microsoft Azure Operational Insights雲端服務管理的電腦的畫面

[ 說明]

Microsoft Azure Operational Insights雲端服務支援管理的伺服器與元件包羅萬象,包括:Lync Server,SharePoint Server、SQL Server、Exchange Server:Windows Server Active Directory、Microsoft Hyper-V Server、以及Virtual Machine Manager等等。

系統管理員可以利用Microsoft Azure Operational Insights雲端服務記錄的資訊,分析資訊系統的安裝與設定是否正確,並提供給系統管理員最佳的設定與修補建議,讓系統管理員可以很輕鬆地對資訊系統套用最佳化設定,有效降低系統停機時間,並提升系統執行效率。

完成指定欲監控的伺服器之後,就可以啟動瀏覽器瀏覽至網址:https://www.opinsights.azure.com/,等待指定的電腦的資料傳送至Microsoft Azure Operational Insights雲端服務之後,就可以透過瀏覽器檢視分析系統的設定建議與相關的資訊。

圖3:利用瀏覽器瀏覽Microsoft Azure Operational Insights雲端服務記錄的資訊的畫面

 

檢視Microsoft Azure Operational Insights 的設定建議與知識庫

系統管理員可以點選圖3畫面中的[Configuration Assessment]區塊,檢視系統警示、知識庫建議、以及伺服器與工作負擔分析,如圖4所示。

圖4:檢視系統警示、知識庫建議、以及伺服器與工作負擔分析的畫面

系統管理員可以從圖4顯示的資訊通盤了解資訊系統的執行狀態,並點選圖4畫面中提供的連結以深入了解詳細的資訊。例如系統管理員可以點選[Knowledge Recommendations]區域提供的知識庫建議下方的[SEE ALL…]連結,檢視完整的資訊,並透過現成的知識庫文件的連結,快速找到解決系統運作問題的解答,讓系統管理員透過Microsoft官方知識庫的幫助,搖身一變成為系統管理專家。

 

圖5:檢視電腦設定建議的知識庫的畫面

例如系統管理員在檢視[KB Article Recommendations]項目提供的知識庫說明時,如果SQL Server資料庫伺服器的最大工作執行序設定不當,您將會看到一條標題為[Changing the 'max worker threads' configuration of SQL Server]的知識庫建議,如果不明白知識庫建議的意涵,系統管理員可以直接點選知識庫連結右方的[View]連結,例如:KBLink:https://support.microsoft.com/kb/2157129[View]

就可以直接檢視發佈於Microsoft官方網站的知識庫說明,例如圖6所示即為有關如何變更SQL Server最大工作執行緒設定的做法。

 

圖6:Microsoft官方有關變更SQL Server最大工作執行緒設定的說明網頁

如果要借助於Microsoft功能強大的商業智慧分析工具 – Power BI,對Microsoft Azure Operational Insights雲端服務收集的資訊進行統計分析,可以點選圖5畫面下方的[匯出]鍵,將欲分析的資訊匯出成Excel文件,再透過Microsoft BI支援的Power Pivot、Power Query、Power View、或是Power Map進行分析,從大量的資訊中取得管理資訊系統所需要的關鍵資訊。 

圖7:利用Excel 2013分析Microsoft Azure Operational Insights雲端服務收集的資訊的畫面

 

如果系統管理員想要定時以電子郵件的方式收取資訊系統的營運報告,可於檢視Configuration Assessment相關資訊時點選右上角的[設定]圖示,如圖8所示。

圖8:設定定時收取系統營運報告的電子郵件的畫面

進入到設定畫面之後,您只要勾選[Receive email notifications of new Azure Operational Insights Alerts]項目,再按下[Save]鍵儲存所做的設定,如圖9所示。就可以每週定時收到一封有關系統執行狀態的電子郵件報告。

 

圖9:設定收取有關系統執行狀態的電子郵件報告的畫面

 

Microsoft Azure Operational Insights雲端服務提供的電子郵件報告包含警示與未回報的伺服器兩項資訊,如圖10所示。系統管理員可以透過所收到的電子郵件內容檢視警示項目中了解伺服器所有的嚴重警示和新增的警示。

圖10:Microsoft Azure Operational Insights雲端服務提供的電子郵件報告內容