Leo Yeh's Blog

SAS 自主分析 (4)

基本介紹

教學目標

初步了解 SAS Visual Analytics 中資料分析的基本類型。

重點概念

我們可以在 SAS Visual Analytics 執行資料分析,主要有二種基本類型,分別為:

  1. 相關分析:主要為識別量測值彼此之間的關係。
  2. 預測分析:主要為根據統計趨勢評估資料未來預測值。

首先相關分析主要為識別量測值彼此之間的關係,其強度值會介於 -1 和 1 之間的數值,接近 -1 代表很強負相關,接近 0 代表稍微沒有相關, 1 代表很強正相關。若我們要在 SAS Visual Analytics 執行相關分析, 則會採用熱圖和散佈圖的視覺效果。

接著透過最適線條將能夠繪製量測值彼此之間的模型,主要有下述五種類型,分別為:

  1. 最適大小:主要為自動選取最適當的模型,主要透過回溯變數選取顯著最高的模型。
  2. 線性:主要為使用線性迴歸演算法建立線性模型,簡單來說就是量測值之間的直線關係。
  3. 二次:主要為使用單一曲線演算法建立二次模型,簡單來說就是量測值之間的拋物線關係。
  4. 三次:主要為使用兩個曲線演算法建立三次模型,簡單來說就是量測值之間的 S 型曲線關係。
  5. PSpline:主要為使用多變化曲線演算法建立 Pspline 模型,簡單來說就是量測值之間的多變化複雜曲線關係。

若我們要在 SAS Visual Analytics 執行最適線條, 則會先採用熱圖和散佈圖的視覺效果,接著套用最適線條。

再來預測分析主要是根據統計趨勢評估資料未來預測值,預測會將線條和預測值新增至視覺效果中,以及呈現信賴區間,所謂信賴區間是百分比代表預測模型對於未來預測值的可靠性達多少百分比的資料範圍,像是 95% 信賴區間就代表預測模型對於未來預測值的可靠性達 95% 的資料範圍。若我們要在 SAS Visual Analytics 執行預測分析,則僅可以使用包括日期或時間資料項目的折線圖,同時 SAS Visual Analytics 將會自動針對資料產生多個預測模型,然後選取最佳模型,預測模型的種類主要有下述六種類型,分別為:

  1. 減緩趨勢指數平滑法
  2. 線性指數平滑法
  3. 季節性指數平滑法
  4. 簡易指數平滑法
  5. Winters 方法 (加法)
  6. Winters 方法 (相乘)

最後透過情境分析將能夠讓我們指定針對預測值一個或多個關鍵因子,更進一步預設假設情境。同時除了情境之外,我們更進一步設定目標搜尋,目標搜尋將能夠讓我們指定預測值的目標,以利確定能夠達成預測值目標的關鍵因子值,一般來說情境分析和目標搜尋會使用在相同預測分析中

總結在 SAS Visual Analytics 中主要有兩種資料分析的類型,分別為相關分析和預測分析,當我們進行相關分析時,則會搭配最適線條更深入了解量測值之間的關係,當我們進行預測分析時,則會搭配情境分析和目標搜尋更深入了解若要達到預測值目標將會需要如何調整關鍵因子值。因此我們僅需要透過 SAS Visual Analytics 網頁快速進行自主分析中的資料分析應用。

相關資源

⬅️ Go back