Leo Yeh's Blog

SAS 時間序列 (12)

教學目標

初步了解 SAS 時間序列的基本概念。(此篇主要為準備考試的心得筆記)

重點概念

首先當我們能夠在 SAS Visual Forecasting 中直覺操作組合多個時間序列的預測模型進行組合預測分析,能夠透過比較產生預測結果更佳的組合預測之模型,並且我們透過選項將能夠控制時間序列候選預測模型的組合方式,以及使用適當的建立步驟產生組合模型用於時間序列的預測分析,其中組合模型預測預設主要是在節點中生成的各個模型的預測平均值。

接著當我們在 SAS Visual Forecasting 中建立組合預測的時間序列模型時,則主要會有六個步驟,分別為:

  1. 預測候選模型測試:主要透過季節性和間歇性測試刪除集合中任何不適合目標預測模型的變數,像是時間序列目標是季節性,但是若模型不是季節性,則將進行刪除。
  2. 預測遺漏值測試:主要指定遺漏值百分比的門檻值和估計區域,若是模型有太多的遺漏值,則將進行刪除。
  3. 包含檢定:主要在成對迭代中針對排在後面的候選排名預測模型進行測試,若是模型包含冗餘資訊,則將進行刪除。(註:此步驟可選擇)
  4. 權重估算:主要在產生預測分配權重之後執行包含檢定,其中權重是根據組合模型列表的資訊進行分配。
  5. 預測組合:主要進行預測模型的加權組合。
  6. 加權平均值:主要使用加權平均值計算預測,此時有遺漏值的模型不包含在預測組合中,至於這些遺漏值,則建議透過動態重新縮放為非遺漏預測的權重,或者由組合預測產生權重。

當執行完成上述步驟之後,就會產生組合預測的的結果,其中主要包括殘差,標準誤差以及上下置信度間隔區間等重要資訊。

再來我們也能夠在 SAS Visual Forecasting 中根據時間序列的資料自動生成組合模型,主要會從每個時間序列的診斷中產生時間序列的模型,像是針對分層結構的時間序列預測分析就能夠透過組合模型的選項產生組合模型,其中選項主要有六大項目,分別為:

  1. 組合的方法
  2. 用於包含檢定的統計值
  3. 遺漏值解釋
  4. 計算預測誤差變異數的方法
  5. 最大允許的遺漏樣本內資料百分比
  6. 最大允許的範圍中遺漏預測值百分比

主要組合的方法主要有平均、使用 AICC 值的 Akaike 加權、非負最小平方、排名加權、最小絕對差、普通最小平方、等式限制非負最小平方、等式限制最小平方和縮放 RMSE 加權。用於包含檢定的統計值則主要有 HLN 和 OLS,HLS 主要使用 Harvey-Leybourne-Newbold(HLN)來進行候選預測之間的成對包含檢定,而 OLS 主要使用 使用基於 OLS 的回歸測試來進行候選預測之間的成對包含檢定。遺漏值解釋主要有重新縮放和遺漏,其中重新縮放主要在每個時間索引處重新調整非遺漏值的組合權重,使其總和為 1,而遺漏則是在每個時間索引處產生遺漏的組合預測,其中包含一個或多個遺漏值。計算預測誤差變異數的方法主要有 DIAG 和 ESTCORR,DIAG 主要透過假設時間 t 不相關的預測誤差值來計算預測誤差變異數,這是計算預測誤差變異數的預設方法,ESTCORR 主要透過使用 rho 的估計值來計算預測誤差變異數。

最後針對所建立組合預測的模型,我們會保留樣本進行驗證,又稱為 Honest Assessment,而基本的想法主要是將組合預測的模型應用於新的資料,透過此方法將能夠清楚了解每個模型中推斷出時間序列中的系統變異,並且透過新選擇的資料將能夠更有效評估組合預測的模型之準確度,避免發生過度擬合的問題,此外根據經驗法則是針對季節性的擬合資料選擇 25% 擬合範圍為保留樣本,其中至少一個完整的季節性週期,也就是保留資料主要是在擬合資料中以每四個觀察取出一個觀察進行取樣,以利進行組合預測的模型驗證。

相關資源

⬅️ Go back