SAS Viya (70)

教學目標

初步了解 SAS Viya 自動化模型管理的基本概念。

重點概念

首先 SAS Model Manager 主要能夠讓我們透過網站管理介面針對分析模型註冊、修改、追蹤、評分、發布和產生報告,並且儲存模型至資料夾和專案中,以及開發和驗證候選模型,然後評估候選模型以進行冠軍模型的選擇,針對選擇冠軍模型進行發布和持續監控。因此所有模型開發和維護相關人員,包括資料建模人員,驗證測試人員,模型評分人員和模型分析人員,皆能夠在企業內部環境或公有雲環境使用 SAS Model Manager 進行自動化模型管理,更重要的是 SAS Model Manager 主要是以雲原生的 SAS Viya 平台為基礎架構,所以能夠支援 Kubernetes 和 Docker 等容器管理的方式,不僅達到高擴展性,更能夠達到高可用性。

接著 SAS Model Manager 主要有三大特點,分別為:

  1. 自動化管理分析模型:我們能夠為不同的模型類型定義工作流程 (Workflow),並且提供 ETL 資料處理、主管覆核和稽核軌跡的內建功能,整合企業內部流程讓所有模型開發和維護相關人員能夠針對分析模型註冊、修改、追蹤、評分、發布和產生報告,以利達到模型治理的願景。
  2. 持續監控和最佳化模型:我們能夠針對 Python、R 和 SAS 所撰寫的模型透過網站管理介面輕鬆測試和比較不同類型的分析模型,並且產生成效能基準的評測報告或警報,以便於持續監控模型,隨著分析模型在不同部門之間透過網路服務 (REST API) 針對不同的應用程式應用最適合的冠軍模型,此時我們將會需要產成了大量的追蹤、驗證和稽核報告,以利確定何時需要重新訓練模型或讓模型淘汰,以利達到模型管理的策略。
  3. 確保可被信任和合規性模型:我們能夠透過集中式的模型儲存庫、生命週期範本和版本控制功能提供對於分析流程的可視性,確保完全可被追蹤和稽核,以符合企業內部治理和外部法規的要求,像是巴塞爾協議 II 的風險模型驗證報告透過評估內部信用風險評量系統的健全性,追蹤異常情況和回應監管機構的查詢需求。此外無論何時建立新的版本,皆會獲取模型屬性的快照,以利確保全面的版本控制,並且模型版本歷史記錄被鎖定和保留,無法隨意進行變更,以利達到模型應用的落實。

再來每個組織都有自己的模型管理生命週期,模型皆可以由一個人管理,或者由企業組織中不同部門進行覆核允許或拒絕,過程中我們可能會直接根據模型的類型手動進行修改,卻忽略了提供稽核軌跡的重要性,以及大多數模型管理的生命週期皆包含以下階段,分別為:

  1. 建立註冊
  2. 測試比較
  3. 允許
  4. 發佈
  5. 監控
  6. 重新訓練

此時模型管理生命週期要如何整合企業內部流程,以利達到模型管理自動化的流程,同時提供修改流程的稽核軌跡呢?此時我們就能夠搭配 SAS Viya 平台架構的核心工作流程服務 SAS Workflow Manager,其允許建立符合業務流程模型和標記法 (Business Process Model and Notation,BPMN) 標準的工作流程定義,並且將工作流程作為獨立服務進行執行,獨立執行的工作流程服務將能夠減少應用程式之間的關聯性,以利針對 SAS Model Manager 模型管理生命週期所有相關的工作流程進行全面性的管理,並且提供完整的稽核軌跡和版本控管,更重要的是我們更能夠整合資料準備的 ETL 工作流程這對於模型管理所需要的測試資料持續監控和重新訓練是非常重要的關鍵工作,因此若沒有工作流程的內建功能將無法達到自動化模型管理。

最後我們能夠將模型發佈至 CAS、SAS Micro Analytic Service、Hadoop 和 Teradata,以利企業客戶透過 SAS Viya 平台所提供的應用程式介面,像是 REST API、Java、Python、Android SDK、iOS SDK 、… 等整合企業內部的應用程式,同時自動化使用適當的分析模型進行更多有關機器學習、預測分析、優化分析、文件分析、影像分析、… 等的實務應用。

總結 SAS Viya 平台不僅能夠部署至企業內部雲原生環境達到高可擴展性和高可用性之外,更能夠整合企業內部流程達到自動化的模型管理生命週期,同時滿足資安政策和遵循法規規範,更重要的是 SAS Viya 是非常開放的平台能夠讓程式開發者和資料科學家以可被信任的分析模型管理為基礎協同合作,以利為企業提供更高價值的分析應用。

相關資源