Leo Yeh's Blog

SAS 預測分析 (4)

教學目標

初步了解 SAS Visual Forecasting 預測分析的基本概念。

重點概念

首先我們主要使用管線為專案建立可執行的流程,每個管線皆包含一組節點,這些節點在專案中按照順序執行,因此管線主要是結構化分析的工作流程,並且透過範本實作快速開發和可重複的結果,同時我們能夠自行定義,並且進行分享。然而在 SAS Visual Forecast 主要有四種預測管線範本可供使用,分別為:

  1. 自動預測 (Auto Forecasting):主要會根據選擇的模型為每個時間序列進行建模和評估
  2. 基礎預測 (Base Forecasting):主要提供建立自定義管線的基礎,其在預設情況下只包含資料節點。
  3. 外部預測 (External Forecasting):主要包含適應模型外部產生預測。
  4. 分層預測 (Hierarchical Forecasting) :主要適用於在於分層安排時間序列資料的預測分析。

接著自動預測、基礎預測、外部預測和分層預測皆屬於一般目的管線範本,範本適用於使用時間序列資料來源的任何預測專案,並且簡單地使用單個資料節點建立管線,而我們僅需要增加至少一個建模策略來完成管線。此外在 SAS Visual Forecasting 中管線範本除了一般目的管線範本之外,更有提供細分範本 (Segmentation Templates) 和需求分類範本 (Demand Classification templates),所謂細分範本主要用於預測包含已建立的細分定義的專案,而當建立新專案時無法使用這些範本,所謂需求分類範本主要用於已根據時間序列中的需求模式進行細分的資料,因此我們需要比較不同的範本和不同的建模策略,以利找到最適合資料的預測範本。

再來時間序列分析與統計一樣,主要可以分為兩大類,分別為基於推理的分析 (Inference-based Analysis) 和預測分析 (Prediction Analysis)。而對於需要預測未來主要將資料分為擬合樣本和保持樣本,但是與其他形式的預測建模不同,其中保持樣本是來自原始資料的隨機或分層樣本即保持樣本,而保留樣本用於評估效果如何,以及擬合樣本用於推導預測模型,至於誠實評估主要有以下步驟,分別為:

  1. 將時間序列資料分為擬合樣本用於推導預測模型和保持樣本用於評估預測準確性。
  2. 導出一組候選模型,像是 ECM 模型、ARIMAX 模型和 UCM 模型。
  3. 計算每個模型的所選模型準確度統計量,並且透過使用擬合樣本來預測保持樣本。
  4. 選擇具有最佳準確度統計量的模型。
  5. 使用最佳模型,產生 n 個未來期間的預測。

請注意我們需要選擇足夠的時間點以涵蓋整個季節性時期,像是對於每月數據,請至少保留 12 個觀察值,保持樣本始終位於時間序列的末尾,並且建議保持樣本應該很少包含超過 25%的時間序列,若在保持樣本中發生唯一行為,請不要使用保持樣本,而我們主要使用保持樣本來判斷準確性被稱為誠實評估,因為它模擬擬合和部署一個模型,然後判斷現場環境的準確性。

最後在 SAS Visual Forecasting 中的預設模型選取準則是 MAPE,這在專案建立期間或專案創立之後是可以進行改變,而所謂 MAPE 和 MAE 皆是模型擬合最常見測量,當我們選擇候選模型,則 MAPE 或 MAE 值最低的模型是最適合的模型。請注意兩個統計資訊皆採用觀察值的絕對值減去預測值,在數學上這是必要的,但其可能會省略關於模型合適的重要資訊,像是一個模型可能具有非常低的 MAPE 或 MAE,但是其總是不合適。此外 RMSE 通常用於工業、經濟和科學的預測,作為選取準則,則選擇模型 RMSE 的最小值,至於要如何判斷準確度的方法。

相關資源

⬅️ Go back