Leo Yeh's Blog

SAS 預測分析 (2)

教學目標

初步了解 SAS Visual Forecasting 預測分析的基本概念。

重點概念

首先 SAS Visual Forecasting 主要提供自動化和複雜性的時間序列分析,所謂時間序列主要是等距數字的索引集,可以在營運業務所需的時間內生成數百萬個預測,預測人員可以使用視覺化流程圖或管線建立專案,管線會在同一資料集上運行多個模型,並且根據結果選擇冠軍模型。而 SAS Visual Forecasting 主要是建立在 SAS Viya 平台,因此其主要是透過高度平行處理和分散式架構有效地模擬和預測大規模的時間序列,同時也是為建立模型和產生數百萬個時間序列的預測所需的速度和可擴展性的一個平台。

接著交易資料不是根據時間間隔進行組織,當在時間序列模型量化系統變化之前必須等距或索引,間隔或索引包含在其中,而資料累積主要或轉換交易資料至指定間間隔資料的過程,在進行時間序列分析和預測之前,觀察(原始)序列必須被累積和解釋以形成時間序列。其中間隔選擇和累積方法是應用時間序列建模的關鍵考慮因素,進行這些選擇時,建模者會建立用於分析的資料,不同累積的選擇可以強調資料的不同系統特徵和影響模型的有用性和精確性。但是按小時間隔累積的時間序列可能不是理解的最佳時間序列,量化資料中可能存在的長期趨勢和月份週期,而一個更好的理解和量化較長執行模式的替代方案可能是每月間隔和平均積累方法。

再來自相關只是代表著時間序列 (Y t) 中的當前值與之前的相關值,當前值與緊接在前或滯後的值 (Y t-1) 之間的相關性稱為一階自相關,若相關性擴展至兩個時間點的值,且在當前值(Y t-2)之前稱為二階自相關,依此類推。而自相關可以是正的也可以是負的,範圍在 -1 和 1 之間。若一個時間序列包含趨勢,季節性或兩者,則包含自相關。即便是時間序列沒有包含趨勢或季節性也可以包含自相關,請注意檢測自相關最多是困難的,最壞的情況下可能會產生誤導,最好關注特定的自相關圖和診斷,以評估其存在時間序列中的自相關。

最後時間序列數據的變化主要有兩個部分,分別為噪音和信號,僅由噪聲組成的時間序列通常被稱為白噪聲序列,白噪聲序列是一系列獨立的相同分佈(i.i.d.)隨機變數,每個發行具有 0 的平均值和相同有限的變異,白噪聲序列包含無信號,這個時間序列的預測值,在任何時間點不會改變,通常計算為 0,若沒有信號的地方就沒有的模式有助於產生比這更好的預測,至於信號主要可以分解為幾種類型,分別為:

  1. 水平 (Level):主要被認為是任何時間點的基準水平,其不限於價值 0。
  2. 趨勢 (Trend):主要被認為是時間序列平均值的長期模式,其可以是線性,二次或更複雜的多項式,趨勢的概念通常涉及時間序列的水平,類似於線性回歸模型中線性趨勢 的斜率 (Slope) 。
  3. 季節性 (Season):主要被認為是時間序列可預測偏差模式與趨勢,其偏差的模式有一個固定的時期。
  4. 週期 (Cycle):主要被認為是一個規則的重複循環,同時是沒有規律的時期。
  5. 外生效應 (Exogenous):主要被認為不是該時間序列的真正組成部分,但是其是變異的來源,其可能與另一時間序列的價值相關,同時也被稱為解釋性影響,這種關係可能會延遲或併發。
  6. 不規則 (Irregular):主要是所有其他效果和模式之後的剩餘元件,元件被考慮在內。這是剩餘的變化,不規則組分可以是白色的噪音,但這不是必需的,並且殘差中可以存在局部的可預測模式,像是自相關和移動平均線。

請注意週期和季節性經常混淆,所謂季節性是指一個規律且重複的循環,而周期是指一個非規律重複的循環。

相關資源

⬅️ Go back