Leo Yeh's Blog

SAS 時間序列 (4)

教學目標

初步了解 SAS 時間序列的基本概念。(此篇主要為準備考試的心得筆記)

重點概念

首先什麼是 ARIMA?ARIMA 中的「I」代表整合,主要告知我們以什麼順序將資料轉換為差異,就是一個穩定的過程,穩定過程主要使用 ARMA 模型建立時間序列。而非穩定過程使用 ARIMA 模型建立時間序列。ARIMA 中 AR 就是自動回歸 (Auto Regressive) 目前值與過去值相關,I 就是整合 (Integrated) 連續的時間點兩者之間的差異值可以用於建模,MA 就是移動平均線 (Moving Average) 當前值與過去的估計誤差有關。

接著穩定的時間序列被定義為具有常數的平均值和變異,以及任何相鄰術語之間在所有時間區段的自動相關是不變,非穩定時間序列沒有常數平均值和變異,往往表現出可辨別出跨越時間的資料模式,具有長期趨勢或季節性的時間序列,因為代表的元件非穩定,所以時間序列取決於該值觀察到的時間。ARIMA 和 ARMA 模型遵循非常相似的方法,主要差別在於 ARMA 模型主要是當時間序列在其原始比例上穩定時使用,也就是將不需要整合的模型,其需要穩定的時間序列產生可靠的預測,若資料不是穩定的,則必須進行轉換時間序列讓其穩定,通常透過轉換時間序列來完成或採取序列值平方根,若該時間序列在其元件上非固定規模,並且需要轉換為整合建立一個穩定的時間序列,此時就會使用 ARIMA 模型。

再來資料似乎徘徊在一個穩定的平均值周圍並表現出穩定的變異,並且未顯示任何明顯的資料趨勢,季節性和趨勢資料可以快速識別為非穩定的,所謂隱定過程主要為一個時間序列時似乎在所有時間段內表現出固定平均值和變異,並且在 ARMA 建模發生之前必要過,以及非穩定序列之後的結果為差異。ARMA 模型的初始流程主要從穩定序列開始,檢查 ACF 並且執行白噪聲的正式測試,下一步是否為序列白噪聲?若是,則其沒有系統變異的時間序列,最好的猜測是時間序列的平均值,若否,則這個序列不是白色噪聲,在資料中可以使用系統變異,此時 ARMA 模型是合適的。

最後自動回歸與移動平均模型,第一順位自動回歸模型 AR(1) 是前一個值的函數加上一些錯誤,第一順位移動平均線 MA(1) 是其前一次衝擊加上的錯誤,所謂衝擊是外顯的,像是競爭對手的固定時期促銷活動、廣告活動、積極或消極的媒體報導、… 等。所謂自動回歸主要確認序列是靜止的而不是白色噪聲,並且確定哪些滯後值與當前值相關調整所有低階滯後的自動相關,此時我們能夠透過部分自動相關函數圖識別時間序列中最重要的自動回歸。所謂移動平均主要是由加權平均值產生隨機擾動的回歸期間,若誤差項為白噪聲,通常以零平均值分佈,此外與自動回歸過程不同,移動平均過程具有短期的和有限的記憶,其主要用於模擬短期或在資料中更突然的模式。

相關資源

⬅️ Go back