SAS 基本介紹 (3)

基本介紹

教學目標

初步了解 SAS LASR 分析伺服器如何在記憶體中進行資料分析。

重點概念

SAS LASR 分析伺服器是一個分析平台,主要讓多個使用者安全且並行存取被載入至記憶體中的資料,最大優勢在於分散式運算的環境,並且在多台機器上的負載會執行大量的並行處理。主要提供兩種方式進行進行小資料集和大數據的分析,當進行分析時主要會讀取資料表至記憶體中進行高效能的處理。

  1. 從 Tables 和 Data Sets 中讀取資料。
  2. 從 Co-located Data Provider 或 HDFS 中讀取資料。

此外還能夠整合不同資料來源的資料倉儲,像是 Teradata ,主要會將資料轉換成 SAS 資料集之後再轉入至記憶體中,以及更新 HDFS 中相關的 SAS 資料集 (HDFS 不支援 APPEND),而當 LASR Analytic Server 掛點時重開之後則可從 HDFS 或 SAS 資料集進行還原,至於與 SAS Visual Analytics 有關的高層次架構,請參考下圖。

SAS Visual Analytics 高層次架構

最後透過 SAS LASR Monitor 服務 (Grid Monitor) 即可用來監控伺服器的狀態,若當發現伺服器執行異常或損毀時,則按照以下六個步驟還原 SAS LASR 分析伺服器。

  1. 停止 SAS LASR 分析伺服器和 SAS LASR Monitor 服務。
  2. 尋找 TKGrid 的 Session (ps -ef | grep TKgrid)。
  3. 刪除 TKGrid 的 Session (kill -9 [pid])。
  4. 重新啟動 SAS LASR Monitor 服務。
  5. 重新啟動 SAS LASR 伺服器。
  6. 重新載入資料至記憶體中。

相關資源