SAS Viya (25)

教學目標

初步了解 Cloud Analytics Services (CAS) 伺服器的基本概念。

重點概念

首先 SAS Cloud Analytics Services (CAS) 伺服器主要是針對資料管理和分析提供以雲端為基礎的執行環境。在 CAS 伺服器中主要有三個角色,分別為:

  1. Controller
  2. Backup Controller
  3. Worker

接著 Controller 角色則是當伺服器啟動時被啟動,同時接受來自於客戶端的連線,在 CAS 伺服器中必須被指定。Backup Controller 角色則是提供 Controller 的容錯管理,其僅被使用在分散式的伺服器架構中,並且 Backup Controller 是非必要,但若要部署則 CAS 僅支援一個 Backup Controller。Worker 角色則是當 CAS 伺服器執行在大量平行處理 (Massively Parallel Processing,MPP) 模式,除了 一台機器為 Controller 角色之外,伺服器則會有許多機器同時被指定為 Worker 角色,並且由 Controller 角色派送工作至每一個 Worker 角色節點,每一個 Worker 角色節點主要將計算之後的結果傳回 Controller 角色。

再來 CAS 可以聯合叢集的 Hadoop 機器,以利達到適用分析大量資料集的大量平行處理架構,此時分析處理主要會在已載入可用的伺服器中,或者根據需求被收集或被建立至伺服器的資料表中。簡單來說,分散式的 CAS 伺服器將會形成分析叢集以利進行大數據的分析。

最後當使用者透過客戶端連線至伺服器之後,伺服器將會啟動使用者工作階段程序,以利客戶端透過工作階段程序進行溝通。此外 CAS 伺服器主要有兩種模式,分別為對稱多處理 (Symmetric Multiprocessing,SMP) 模式和大量平行處理 (Massively Parallel Processing,MPP) 模式。其中所謂 SMP 模式主要僅由 Controller 所組成,伺服器僅會啟動 Controller 的工作階段程序以利針對資料進行分析。至於 MPP 模式主要是在叢集中的每台機器建立工作階段處理程序以利針對資料進行大規模的分析。

總結 SAS Viya 平台中主要是透過 SAS Cloud Analytics Services (CAS) 伺服器進行資料的分析。

相關資源