SAS 時間序列 (10)

教學目標

初步了解 SAS 時間序列的基本概念。(此篇主要為準備考試的心得筆記)

重點概念

首先量化方法主要是以過去歷史資料透過數學統計方法,找出資料之間的因果關係,更進一步進行預測,並且針對需求變化關係進行量化擬合。需求變化主要存在趨勢性變化、季節性變化和周期性變化,以及外部因素導致因果關係的變化,此時我們可透過數學公式來表達預測,也就是預測 = 趨勢 + 季節性 + 週期性 + 不規則因果變化 + 非解釋性誤差,目的則是找到適合的數學模型,做得公式所預測的準確度最高,且非解釋性誤佳最小,至於量化預測方法可分為時間序列預測方法和因果關係預測方法。

接著所謂時間序列預測方法根據時間序列反應的過程和規律進行預測,而加權平均是一種簡單的用於 ESM 模型的時間序列預測方法,在加權平均中權重應用於此類中的過去值預測序列中下一個時間點的價值的方式,這些權重的值主要是基於確定這些過去觀察在確定中的重要性而選擇未來,其主要有兩種常用的加權平均值樣式,分別為簡單移動平均 (Simple Moving Average) 和隨機遊走 (Random Walk)。其中簡單移動平均預測主要是指所有權重是相同的平均,對前面 N 個觀察中的每一個進行相等的權重,在計算下一個時間序列值的預測時,在此應用 (1 / N) 的權重,對於所有剩餘的觀測值為 0,而隨機遊走預測是加權平均數所有權重平均為 0,除了最近的是 1,因此在隨機遊走中下一個時間點僅與之前的位置相關。雖然簡單移動平均相較於隨機遊走簡單,但有些缺點主要為隨著要求 N 項產生加權平均值,這不能適用於第一項時間序列 ( N - 1 ),除非應用超出資料之外,另一個缺點是簡單移動平均線與極端值相同的問題皆是平均值,正如平均值不是對異常值具有強建性,極端值會影響簡單的移動平均值,以及在使用簡單移動平均線產生預測時,需要保留最近的 N 個觀察產生預測值。至於針對簡單移動平均的缺點,我們能夠使用加權移動平均 (Weighted Moving Average),其中平均值是加權的平均,並且非全部權重是一樣的,以及當我們使用加權移動平均線時,不要求先前 N 個權重觀察是平等相關,因此權重可以在先前的觀察中變化在建立預測值。

再來所謂因果關係預測方法根據事件發展的因果關係來預測事物發展的趨勢,主要會使用 ARIMAX 模型和 UCM 模型進行預測,因果關係預測方法的基本前提主要是未來預測值要與其它變數的變化有密切相關,像是需求與價值、廣告、促銷活動之間有密切相關的關係,此時我們可以先透過一元回歸建立預測和單一變數之間的相關性,或者透過多元回歸建立預測和多個變數之間的相關性。此外因果關係預測方法能夠分析出因素對於預測的影響,因此適合針對企業成長期的產品進行預測,因為成長期的產品市場定位趨於穩定,並且有豐富的歷史資料有明顯勢性、季節性和週期性等特徵,此時因果關係預測方法因為對於企業內部因素和市場外部因素的反應較為快速,像是 ARIMAX 模型主要就能夠針對需求根本有明顯勢性、季節性和週期性等特徵之外,同時又會受價格、促銷等外部因素影響進行預測,並且從透過一元回歸或多元歸找出影響預測的關鍵因素。

最後有關時間序列預測方法和因果關係預測方法的比較,請參考下表。

時間序列預測方法 因果關係預測方法
優點 適合短期穩定歷史資料的時間序列,可以排除較小的隨機波動,易於理解和使用。 適合長期或中期不穩定歷史資料的時間序列,能夠支援情境分析,改變影響因子以利探討對於預測結果的影響。
缺點 對於因素和事件的影響反應不佳,歷史資料波動大時,則預測預差較大,分析人員需要大量時間和經驗擬合模型和估計參數。 預測精準度依賴於因果變數之間關係的持續性,對於自變數的準確評估有很高的要求,分析人員需要大量時間和統計學知識進行建模和維護模型。

請注意量化預測方法的精準度也與預測單位的週期相關,通常預測單位越大準確度越高,像是年預測會比月預測準確度高,而月預測會比週預測準確度高,週預測會比日預測準確度高,至於要用什麼預測單位週期,則取決定業務的需求,而企業通常在進行預測規劃時會按月或週進行預測。

相關資源