Leo Yeh's Blog

SAS 預測分析 (1)

教學目標

初步了解 SAS Visual Forecasting 預測分析的基本概念。

重點概念

首先 SAS Visual Forecasting 主要是進行大規模自動化的時間序列預測進階分析,其主要是基於 SAS Viya 平台,由 CAS 提供平行處理的開放式架構,同時支援第三方應用程式介面。而 SAS Visual Forecasting 提供了許多不同的介面能夠讓我們產生預測模型,像是 Model Studio 和 SAS Studo,除了提供現代化的 HTML5 網站界面,更支援開放源始碼的程式語言以及 REST APIs。

接著 SAS Visual Forecasting 提供時間序列預測的新方法,其主要是物件導向設定概念,分別為:

  1. 效率 (Efficient):簡化建模和預測的流程。
  2. 動態 (Dynamic):客製程式中的預測工作流程。
  3. 彈性 (Flexible):使用現有元件靈活強健壯的進行建模工作流程。

其中最重要的設計概念和功能就是套件、物件、腳本語言和 CAS 程序,而 SAS Visual Forecasting 的軟體元件主要會被組織至套件和物件,所謂套件主要是基於特定時間序列函數之物件群組的集合,而物件主要被用於建立程式主要元件或區塊,並且彼此物件之間透過方法進行互動,以及擷取和控制建模和預測程序的狀態。

再來套件主要解決時間序列的分析問題,當我們撰寫自定義的 SAS 程式碼時,則可以使用這些專用物件和函數,以利存取最先進的資料分析工具加快程式碼開發速度,並且提高程式碼品質,至於常見的套件,請參考下表。

縮寫 套件名稱 說明
ATSM Automatic time series analysis and forecasting 主要使用各種模型系列自動建模和預測時間序列的工具,像是 ESM、ARIMA、UCM、IDM、… 等。
MOTIF Time series motif discovery 主要用於在時間序列中發現頻繁模式或重複子序列的工具。
SFS Simple forecast service 主要透過簡單易用的界面,以及僅使用 ARIMA 模型自動預測時間序列的工具。
SSA Singular spectrum analysis 主要用於將時間序列分解為附加組件,並且根據其貢獻的大小對這些元件進行分類的工具
TIMFIL Time filters 主要用於過濾和聚合時間序列的工具。
TFA Time frequency analysis 主要用於在時間領域和頻率領域中有效分析時間序列的工具。
TSA Time series analysis 主要用於時間序列的有效統計分析的工具,像是轉換,分解,間歇性,季節性,平穩性、預測偏差的統計測試、…等。
TSM Time series model 主要用於高效時間序列建模和預測的工具。
UTL Utility 主要用於對實際和預測時間序列對進行基本統計計算的工具。

最後 SAS Visual Forecasting 如何進行預測主要有五個步驟,分別為:

  1. 診斷 (Diagnose):診斷時間序列資料。
  2. 選擇 (Select):選擇適合的模型。
  3. 調適 (Fit):調適參數。
  4. 預測 (Forecast):預測最佳模型。
  5. 調和 (Reconcile):在層次結構中向上/向下調合預測結果。

請注意在 SAS Visual Forecasting 進行預測的實際資料主要是在 CAS 伺服器上進行處理,在 CAS 伺服器的分散式環境中,主要是基於 BY 變數的值不同組合來描繪和洗牌時間序列,時間序列資料平行處理,其寫在每個 CAS Worker 節點上的 CAS 資料表中,此外在每個 CAS Worker 節點上使用執行緒來處理同時加載至節點上的時間序列向量。

相關資源

⬅️ Go back