Leo Yeh's Blog

SAS 預測分析 (3)

教學目標

初步了解 SAS Visual Forecasting 預測分析的基本概念。

重點概念

首先當我們透過 SAS Visual Forecasting 建立預測類型的新專案,選擇自動預測的範本,此時在新專案中會產生自動預測的管線,管線主要由資料、自動預測、模型比較和輸出,
其包含預測分析中的基本步驟,分別為:

  1. 資料 (Data):將資料累積到時間序列中。
  2. 自動預測 (Auto-forecast):自動識別,估計和選擇時間序列的預測模型。
  3. 模型比較 (Model Comparison):評估預測結果。
  4. 輸出 (Output):發佈在管線之外使用的結果。

其中自動預測節點主要會根據選擇的模型,像是 ARIMAX、ESM、UCM、…等模型為每個時間序列進行建模,針對於每個時間序列,自動預測節點執行以下任務,分別為:

  1. 診斷時間序列的統計特徵。
  2. 產生適當時間序列模型的列表。
  3. 選擇時間序列預測模型
  4. 產生預測結果。

請注意若建立預測模型的資料是分層排列時,識別、估計和預設預測管線中的選擇步驟是在時間序列中完成層次結構的基本級別。

接著預測模型主要有五種類型,分別為 ESM 模型、ARIMAX 模型、UCM 模型、簡單回歸模型和簡單模型,其中所謂 ESM 模型主要過去價值的加權平均值產生對未來的良好預測,權重應該強調最新資料,並且預測應該只需要幾個參數,以及預測方程式應簡單執行。所謂 ARIMAX模型主要是具有外生效應變數的自動迴歸整合為移動平均線,其主要可以分為幾個部份,分別為 AR、I、MA 和 X,AR 自回歸主要是針對時間序列過去的函數,I 整合主要是連續時間點之間的差異值,其可以是建模之後,回傳到無差異測量標準,MA 移動平均線主要是時間序列是過去震蕩的函數,像是偏差、創新、錯誤、…等,X 外生效應變數主要是時間序列受外部因素的影響。所謂 UCM 又稱為結構時間序列模型,其主要將時間序列分解為元件,分別為趨勢、季節性、循環、不規則和回歸量,其通用格式為趨勢 + 季節性 + 週期 + 回歸量,每個元件皆有本身的模型和錯誤來源,而趨勢、季節性和週期的係數是動態的,其係數是可測試的,並且每個元件都有自己的預測。

再來簡單回歸模型主要會預定義趨勢元件,像是線性、二次、三次、指數、…等等,以及預定義的季節性虛擬值,其包括一個或多個簡單預定義元件的組合,而簡單模型主要以平均值和隨機散步建立預測模型,進行預測沒有效能問題,而 ESM 模型則可以快速輕鬆的進行預測,所以其總是有很好的表現,而 ARIMAX 模型需要比起簡單模型或指數平滑模型需要更多的運算資源,因此會有些近似和快捷方式用來提高效能,而 UCM 模型則非常耗費運算資源,通常只能在試用資料集或個別時間序列。

最後當自動預測節點運行成功時,其有一個綠色標記,表示狀態為成功,此時我們能夠按右鍵單擊節點,然後選擇「結果」以查看節點的輸出,結果顯示建模策略的摘要和輸出資料,其中摘要主要包括 MAPE 分佈的直方圖結果,其主要診斷說明包含在基準水平的時間序列預測模型之擬合資料層次,而我們主要透過 MAPE 比較不同預測模型的準確性,通常較小的 MAPE 值代表著預測模型的結果更佳準確。此外對於每個時間序列,預設情況下會考慮兩個時間序列模型系列,分別為 ESM 模型或 ARIMAX 模型,自動預測模型主要根據均方根誤差 (Root Mean Square Error, RMSE) 選擇均方根誤差越小的時間序列模型,而模型比較主要是根據加權平均值絕對百分比誤差 (Weighted Mean Absolute Percentage Error, WMAPE),當然我們也能夠變更其它選取準則。

相關資源

⬅️ Go back