SAS 時間序列 (5)

教學目標

初步了解 SAS 時間序列的基本概念。(此篇主要為準備考試的心得筆記)

重點概念

首先 Box-Jenkins 建模方法論不僅添加了 I 至 ARMA 模型,建立 ARIMA 模型,同時也還有統計分析方法,從初始調查到實際使用模型實施的時間序列的資料,主要有三個階段,分別為:

  1. 識別 (IDENTIFY)
  2. 估算 (ESTIMATE)
  3. 預測 (FORECAST)

其中識別主要估計和評估診斷特徵、趨勢和季節性元件,並且選擇輸入變數並確定與目標變數的動態關係。估算主要導出模型參數的估計值,並且評估估計值和擬合優度統計量。預測主要推導確定性輸入預測、非非確定性輸入預測和目標變數預測。

接著針對準確度 (Accuracy) 與適合度 (Goodness of Fit) ,當我們使用準確度評估預測模型,所謂誠實評估主要以保留樣本計算的統計資料,準確度統計資料是無偏見的估計實施準確性,即預測時實際經歷的準確性模型已部署,樂觀原則為擬合優度統計傾向於給出樂觀的估計準確度。使用相同樣本計算的診斷統計量用於擬合模型的是擬合優度統計量資訊標準公式越小越好,主要有二個資訊評估公式,分別為 AIC 和 SBC 通用公式是資訊評估 (IC) = 準確率 (Accuracy) + 處罰 (Penalty),準確率估計為 -2log(L),其中 log 是自然對數,L 代表估計可能性,處罰則 AIC 為 2k,而 SBC 為 log(n)k,若使用其它方法,則精度值的近似值不同,這些精確度測量用於評估模型的相對擬合度,具有較小值 (或在某些情況下具有更多負值) 的模型是更好的擬合模型。

再來 ARIMA 模型有統計假設,其關注該模型的錯誤,又稱殘差也就是實際值和預測值之間的差異,在每個時間點可用於評估這些假設,特別是有白噪聲假設錯誤,使用直方圖和分位數,殘差圖是最常見用來評估正態性。我們使用 Ljung-Box 測試檢查殘差的自動相關性,以獲得白噪聲,此外要檢查 p 值,我們可能還需要檢查各個自動相關估計值,確保沒有一個可疑的高價值,並且透過檢查白噪聲相關圖進行分析。

最後白噪聲相關圖分析主要有 ACF、PACF、IACF 和 White Noise Prob,隨著滯後的增加,自動相關函數 (ACF) 圖顯示出逐漸下降的自動相關模式。部份自動相關函數 (PACF) 圖給出了真實自動回歸順序的更清晰的圖像,因為它消除了鄰近效應,第一個滯後是唯一明顯顯著的滯後,這意代表自回歸順序為 1。反自動相關函數 (IACF) 的模型是純粹的自動回歸模型,那麼反自動相關函數就是一個與純移動平均模型相對應的 ACF,其急劇下降當滯後大於 p 時,此行為類似於部份自動相關函數 (PACF)。

相關資源