Leo Yeh's Blog

SAS Viya (64)

教學目標

初步了解部署 SAS Viya 至公有雲中的基本概念。

重點概念

首先 SAS Viya 除了部署在企業內部環境之外,更能夠部署於在 AWS Cloud、Google Cloud 和 Microsoft Azure 等雲端平台中,而當我們選擇硬體基礎架構來執行 SAS 應用程式時,為了滿足執行的效能我們需要充分了解 SAS 基礎架構的所有元件,但若是根據 SAS 客戶的要求將 SAS Viya 進行大量部署規劃,則所花費的價格可能會不比本地託管便宜,主要原因在於 I/O 輸出量。此外我們也需要對於 SAS 工作負載要求有充分理解,以及選擇滿足服務等級協議 (Service Level Agreement, SLA) 所需要的硬體基礎設施,特別是完成關鍵任務的時間,此時我們能夠透過以下問題進行檢查,分別為:

  1. 確認 SAS 作業是否在特定時間範圍內執行?
  2. 確認 SAS 作業所需檔案系統的 I/O 輸出量?
  3. 確認 SAS 作業所需資料來源在何處?
  4. 確認 SAS 作業所需資料移動至公有雲的時間?
  5. 確認 SAS 作業所需什麼身份驗證和安全控管?

接著我們需要充分了解相關問題和事實調查的答案,以利從公有雲中選擇正確的硬體和儲存,有許多不同的硬體和儲存類型,理解 SAS Viya 工作負載設定檔案,以利確保正確的選擇硬體和儲存獲得最佳效能。而我們主要需要考慮以下因素確保設定公共雲中的硬體基礎架構能夠最佳化的執行,分別為:

  1. 用於 SAS Viya 伺服器實體類型?
  2. 用於 SAS Viya 持久儲存和非持久儲存類型?
  3. 用於 SAS Viya 暫存資料夾和資料資料夾位置?
  4. 用於 SAS Viya 客戶端位置和身份驗證工具位置?
  5. 用於 SAS Viya 需要高可用性和安全性?

再來在 SAS Viya 基礎架構中每個 SAS 伺服器類型和用途皆有不同 CPU,I/O 輸出量和記憶體設定的特定要求,此時我們需要列出每個 SAS 伺服器輸入並且討論其輸出要求,而在設定伺服器實體時,建議 SAS 所有伺服器實體的基礎設施位於同一個公有雲中,避免導致額外的嚴重影響網路連線的效能,而針對 SAS Viya 我們主要會考量 CAS 節點至少需要三個,並且伺服器需要快速的 CPU 來處理資料,以及足夠的實體記憶體來容納所有資料檔案,以及強大的 I/O 輸出量,特別是 CAS_Disk_Cache,若我們不確定在任何給定時間將存取多少資料,但是我們知道 SAS 使用者存取大小為 100 GB 的檔案,則建議每個物理核心數配置 64 GB 的記憶體核心,以利大型檔案駐留在記憶體中提高 SAS Viya 存取效能。微服務節點的伺服器不需要高運算的速度執行所有 SAS Viya 產品至少需要 68 GB 的記憶體。SAS 程式執行環境節點主要根據應用程式執行 SAS 9 程式碼,此伺服器需要快速的 CPU 進行資料處理,每個實體核心數至少需要 16 GB 的記憶體和強大的 I/O 輸出量,特別是 SAS WORK 和 SAS UTILLOC。

最後我們為了獲得最佳效能,則需要將 SAS 基礎架構的所有元件放入相同的公有雲區域中,主要包括客戶端、SAS 檔案、SAS 中間層、資料來源和身份驗證工具等,若我們沒有放置所有元件在相同公有雲,則會影響 SAS 執行的效能。其中 SAS 客戶端主要有 SAS Enterprise Guide,SAS Data Integration Studio 和 SAS Studio (網頁瀏覽器) 建議在公有雲基礎架構內的 Windows 伺服器虛擬桌面遠端連線進行操作。此外若 SAS 應用程式與身份驗證工具進行互動以獲得權限的頻率很高,則建議將身份驗證工具和相關資料導入相同公有雲中執行,以利滿足在公有雲中部署 SAS Viya 之服務等級協議的要求。

相關資源

⬅️ Go back