Leo Yeh's Blog

SAS 資料管理 (11)

教學目標

初步了解 SAS 大數據程式和載入考試的基本介紹。

重點概念

首先今天早上前往考場參與 SAS 大數據程式和載入的考試,考試代碼為 A00-221,運氣好一點很順利以 80 幾分通過考試。此考試我主要是線上學習「SAS Academy for Data Science」中的「Big Data Programming and Loading」的課程,主要有四門課程,分別為:

  1. Introduction to SAS and Hadoop: Essentials
  2. Hadoop Data Management With Hive, Pig and SAS
  3. DS2 Programming Essentials With Hadoop
  4. Getting Started With SAS In-Memory Statistics

接著「Introduction to SAS and Hadoop: Essentials」課程主要是教導我們如何使用 SAS 撰寫程式的方法來讀取、寫入和操作 Hadoop 資料。此外「Hadoop Data Management With Hive, Pig and SAS」課程主要是教導我們如何使用處理方法為分析準備結構化和非結構化的大數據,其中主要學習 Hive 和 Pig 整合 SAS 平台的資料管理應用。

再來「DS2 Programming Essentials With Hadoop」課程主要是教導我們如何透過 DS2 程式語言撰寫平行處理和儲存巨量資料的程式,並且其是類似物件導向的程式語言,所以能夠支援可重複使用的方法和套件。

最後「Getting Started With SAS In-Memory Statistics」課程主要是教導我們如何存取 SAS LASR 分析伺服器上的資料,以利進行探索性分析和準備,我們主要會透過 IMSTAT 產生新的臨時資料表和永久資料表,並且計算匯總統計的資訊,以及建立記憶體資料的過濾器和連結應用。

總結若是想要有系統的了解在 SAS 平台中如何進行大數據的程式開發和資料載入,則建議可先以「A00-221 SAS® Big Data Programming and Loading Exam」為目標進行有系統的學習,雖然只考一個考試科目,但要完成四門課程還真的有點多…,此外可以考試題型可以參考官方提供的範例考題,建議先了解這十題考試可能會考幾題唷。

相關資源

⬅️ Go back