Leo Yeh's Blog

SAS 系統管理 (33)

教學目標

初步了解 SAS Environment Manager 如何進行監控和稽核管理。

重點概念

監控和稽核

在 SAS 9.4 平台中 SAS Environment Manager 主要有兩項關鍵的管理任務,分別為監控和稽核。所謂監控主要是在某段期間內觀察與檢查程序的品質,在 SAS 9.4 台中包括許多 SAS 產品,SAS 產品是有許多元件所組成,所以將會有數百個獨立元件同時運作,此時要如何有效進行監控,以利當系統發生異常時快速提供決策和行動。因此監控將會非常大的議題,然而通常卻僅應用於持續監控某些事,確保功能正常,若被監控的系統很龐大和複雜,監控將會變的相對複雜,此時主要任務需要過濾所有可用的資訊,以及嘗試降低管理的層級,以利達到近乎即時的觀察。所謂稽核主要是檢驗帳號和記錄,尤其是財務資訊,並且透過稽核評估的方式有效改善系統,讓系統更安全和更有效率,同時檢視資源在任何期間的使用情況,以利更有效率的分配這些資源和事先找出潛在的問題。稽核最主要的概念為允許管理者分析過往的系統中資源使用效能,更進一步達成長期資源管理和規劃,然而監控最主要的概念為每日的故障排除的工作,以利維護伺服器正常運作,所以監控則是檢驗現在發生什麼事情,稽核則是尋找過去發生什麼事情。

監控計劃

接著許多監控計劃在任何平台安裝時將會是非常關鍵的部份,除非該平台非常的簡單,否則我們在設定監控環境時將會面臨幾個問題需要先進行回答。

  1. 誰有責任監控和處理問題?
  2. 什麼資源是需要被確認和多久處理?
  3. 哪一個資源非常關鍵?
  4. 哪一個指標非常實用?
  5. 當議題或問題產生時將會發生什麼事情?
  6. 是否有排程工作或例行性工作需要進行確認?
  7. 什麼報表最能夠有效識別趨勢和潛在的問題?

除了來自於上述問題的回答可以被使用至監控計劃中,同時也會根據需求進行修改。SAS 管理員開發監控計劃,主要評估需要監控哪些資源,來自於監控活動的結果將會被 SAS 管理員和第三方管理單位進行評估,若有需要則評估結果將會有助於調整監控計劃。

監控資源

再來我們主要監控的資源主要有三種類型,分別為平台、伺服器和服務。所謂平台是指作業系統、整台機器或整個 SAS 安裝,伺服器是指執行在機器上的處理程序,一般是由許多元件和服務所組成可以執行許多功能,服務是指執行特定功能的軟體程序。除了資源之外,我們還會常看到事件、警告和指標,所謂事件是指唯一發生於計算環境需要被查看和記錄,警告是指由於特定的行為產生事件時,將會給管理員警告訊息,指標是指量測資源的使用狀態。系統管理者主要是關注所有硬體和軟體平台與系統是否正常運作,SAS 管理員主要是關心所有依賴於平台與系統上 SAS 元件是否正常運作,以及 SAS 程序的內容和結果是否正確,為了讓 SAS 管理員快速了解所關心的事項,所以在 SAS 環境中有許多非常關鍵項目資訊。

  1. 如何確認 SAS 中繼資料伺服器的健康狀態和回應情況?
  2. 如何確認使用者能夠正常使用中間層的伺服器服務?
  3. 什麼預儲程序已經執行,同時已經執行多久?
  4. 什麼是 SAS 工作區的狀態?
  5. 什麼是 SAS 計算伺服器的需求?
  6. 什麼工作必須執行,同時確保結果合理?
  7. 什麼資源指標可以讓我們監控更簡單?

最後對於管理者來說,則是需要回答二大類型的問題,分別為每日維護和故障排除和長期規劃和稽核的問題。

每日維護和故障的問題

長期規劃和稽核的問題

總結 SAS 9.4 平台中 SAS Environment Manager 主要有稽核和監控兩項關鍵的管理任務,並且我們將能夠透過 SAS Environment Manager 回答每日維護、管理和故障排除和長期規劃和稽核的問題。

相關資源

⬅️ Go back