Leo Yeh's Blog

SAS 預測分析 (8)

教學目標

初步了解 SAS Visual Forecasting 進行階層預測的基本概念。

重點概念

首先大規模的預測分析主要有 80% 會進行自動化調整,10% 需要額外負擔和 10% 無法準確進行預測,並且在大規模的預測分析中將會有許多序列資料,序列資料需要有完整的結構進行適應,適應主要針對資料進行累積和聚合,以利進行階層式統計預測,然而因為建立資料無法直接用於階層式統計預測,需要進行調整產生階層,此時我們就能夠透過 SAS Visual Forecasting 將時間序列資料集轉換為用於階層統計預測的資料集,並且能夠透過管線中的資料節點針對時間序列和交易資料進行處理。

接著在 SAS Visual Forecasting 中進行階層式統計預測之前會先進行資料建立,主要有兩種方式,分別為:

  1. 資料累積:主要從序列資料的底部階層開始產生資料。
  2. 資料聚合:主要行序列資料的中間階層開始產生資料。

針對所有階層的序列資料產生統計預測,統計預測所需的資料主要以不同的方式進行累積和聚合計算,像是加總、平均、中位數、最小值、最大值、第一個值、最後一個值以及基於摘要統計的計算,以及聚合產生的序列資料主要會根據 BY 群組從中間階層開始聚合。

再來在 SAS Visual Forecasting 中進行階層式統計預測之後會進行預測調和,主要有三種方式,分別為:

  1. 由上至下:除了最頂階層的序列資料無法調整之外,其它序列資料皆能夠進行調整。
  2. 由下至上:除了最底階層的序列資料無法調整之外,其它序列資料皆能夠進行調整。
  3. 由中間開始:除了中間階層的序列資料無法調整之外,其它序列資料皆能夠進行調整。

如果階層中有許多中間層,則建議選取由中間開始調和,並且當我們使用資料聚合進行資料建立,則最頂階層的序列資料通常會很稀疏,若使用資料累積進行資料建立,則最底階層的序列資料通常會很有很多噪聲。此外季節和趨勢模式通常很容易識別資料進行聚合,但是預測訊號可能會被消除,因此需要慎選調和策略,預設調和方式為由中間開始調和。

最後在 SAS Visual Forecasting 主要透過選項設定自動建立合併模型,相關處理步驟流程,分別為:

  1. 預測候選測試:主要針對季節性和間歇性進行測試,將會移除任何預測模型中無法適用於目標預測變數。
  2. 預測遺漏值測試:主要設定遺漏值的門檻值百分比,將會移除任何預測模型中大於門檻值百分比的遺漏值。
  3. 預測冗餘資訊測試:主要進行成對迭代式測試,將會移除任何預測模型中冗餘的資訊。
  4. 預測權重估計:主要在執行所有測試之後,指定基於合併模型的預測權重。
  5. 預測合併:主要進行預測權重的合併。
  6. 預測權重平均:主要使用模型中預測的權重平均計算預測值。

至於不論是階層預測模型或合併預測模型皆會以樣本資料集進行驗證,並且基於準確率進行模型選取,以及模型評估結果主要包括 MAPE 加權值、 MAPE 分佈和模型類型等資訊。

相關資源

⬅️ Go back