SAS 時間序列 (1)

教學目標

初步了解 SAS 時間序列的基本概念。(此篇主要為準備考試的心得筆記)

重點概念

首先當我們在進行時間序列分析之前的預測時,觀察原始序列必須累積和解釋形成一個時間序列,其過程主要是將帶時間戳的資料轉換為時間序列資料,也就是時間戳資料經過累積步驟將會產生累積時間序列資料,再經過遺漏價值、零價值和解釋步驟就會產生時間序列資料。而所謂交易分析主要是給定時間戳資料集,每次觀察可以為資料集分配觀察值原始指數,主要有時間指數和季節指數,並且基於這些索引的時間戳資料集應用於計數分析和頻率分析,這些指數中的每一個都不依賴於正在分析中資料,這些索引只用於構成後續分析的資料。

接著間隔選擇和累積方法是應用時間序列建模的關鍵考慮因素,當進行選擇時建模者會建立用於分析的資料,不同累積選擇可以強調資料在於不同系統特徵和影響模型實用性與準確性,像是考慮將時間戳資料傳送至呼叫中心,累積資料至每小時一次使用總和累積法給分析師,若有足夠的資料就能夠很好地了解每小時的資訊,更能夠提供在 24 小時週期中相關的峰值和谷值直接資訊,將有助於日常人員進行決策,但是按小時間隔累積的時間序列可能不是理解和理解的最佳時間序列,此時量化資料中可能存在的長期趨勢和月份週期,每月間隔時間序列將會有每個間隔或分箱之觀察,並且時間戳資料每月累積方法主要有平均值、最大值和總計,而每月間隔和平均積累法為更好理解和量化的替代方案。

再來時間序列資料的變化主要有兩個主要部分,分別為信號和噪音,其中信號主要包括以下元件,分別為:

  1. 水平 (Level)
  2. 季節性 (Seasonality)
  3. 趨勢 (Trend)
  4. 不規則 (Irregular)
  5. 外因 (Exogenous)
  6. 週期性 (Cycle)

其中外因又稱為解釋變數效應,至於週期性和季節性或經常混淆,季節性時間序列分析是指一個規律且重複的循環, 而像是住房價格普遍上漲相對於任何長期趨勢,隨後減少,但是有時增加 比其他時間落後於降幅更遠,這將被建模為一個週期性時間序列分析,也可能有季節性時間序列分析,簡單來說,季節性時間序列組成部分中的模式總是在固定且已知的期間重現,週期性時間序列的模式也可能再發生,但是可能會有所不同,並且通常不是已知的或預先定義的,因此週期性時間序列不是季節性時間序列,並且顯示的模式不是固定的期間。

最後良好預測的必要條件,主要有四項分別為:

  1. 識別出的信號將持續到未來。
  2. 預測模型的複雜性應該足夠擷取信號元件。
  3. 預測模型不應過於復雜。
  4. 最佳預測模型是擷取模型,並且推斷出最多信號和忽略了噪訊。

此外該時間序列必須包含等間隔 (週、月、年、… 等) 沒有遺漏資料,若資料遺漏,則請考慮累積到更高的時間間隔 (從一天一次到每週一次)或遺漏觀察值,總之良好時間序列預測的間隔資料必須等距間隔並且沒有遺失資料。

相關資源