SAS 基本介紹 (7)

基本介紹

教學目標

初步了解 SAS 視覺化分析之實務應用和相關分析生命週期。

重點概念

SAS Visual Analytics 針對報表自主設計有很完善的流程,首先我們可以透過 SAS VA Hub 入口網站進行喜好設定,並且依照不同的權限顯示適合的動作區和功能區,此外針對報表內容可分為個人用途和公用用途。接著藉由 SAS VA Explorer 工具進行資料瀏覽,使用者只需將資料區中的類別和量值拖拉至視覺化分析區即可產生基礎的統計分析報表,並且透過屬性區和功能區進行進階的設定,再來只需透過 SAS VA Designer 工具進行資料匯出和資料匯入工作。

然而報表自主設計有很完善的流程,也就是所謂的分析生命週期主要有八個階段,分別為:

  1. 定義問題
  2. 資料準備
  3. 報表設計
  4. 轉換選擇
  5. 分析塑模
  6. 驗證模型
  7. 部署模型
  8. 監測績效

其中 IT 人員主要是進行資料準備工作,例如: 首先從 Teradata 將資料載入至 HDFS 中,接著再將資料載入至 SAS LASR 分析伺服器的記憶體中,或者直接從 Teradata 將資料載入至 SAS LASR 分析伺服器的記憶體中,以利進行資料勘查、報表設計和監測績效等相關作業。

接著根據不同部門建議透過故事的方式,了解呈現報表的目前,以及報表需要哪些資訊,接著再討論需要哪些相關資料表欄位和結構才能夠呈現報表,最後報表的目標群眾是誰呢? 更重要的是如何讓他們能夠在最短時間內獲得有利於分析的資訊。

案例一
針對客戶經營需要的報表目的主要為全行客戶組成、全行產品滲透率、單一產品持有比例和全行平均產品持有數,相關資料表主要有客戶基本資料等欄位資訊。為了產生上述報表則需要全行客戶分群註記和產品類別等相關類別型變數協助分析,其中客戶分群註記需要可以自訂類別。再來量值型變數主要有滲透率、戶數和戶數比例。

案例二
針對業務控管需要的報表目的主要為分行撥款管理和分行餘額管理,相關資料表主要有分行產品目標表、分行主管目標表、帳戶撥款和帳戶餘額,透過上述資料表連接產生出業務控管撥款資料表和業務控管餘額資料表。為了呈現相關報表則需要通路副總、通路區域、通路分行別、日期時間別、產品等類別型變數協助分析,其中通路資訊會需要進行鑽探階層的應用,以及針對日期時間別要能夠進行篩選。再來量值型變數主要有餘額、開戶數、撥款金額,其中餘額會需要進行達成率、成長絕對值和成長率的計算,以及撥款金額會需要進行成長絕對值和成長率的計算。

最後 SAS Visual Analytics 除了製作多維度分析報表之外,更提供預測模型概念之應用,包括決策樹、簡單線性迴歸、折線圖預測,以及網路流程圖、盒形圖、熱圖、相關矩陣和文字雲等其它進階分析之應用。

相關資源