Leo Yeh's Blog

SAS Viya (89)

教學目標

初步了解 SAS Viya 分析生命週期整合應用的基本概念。

重點概念

首先分析生命週期開始於一個問題,我們的企業組織可能擁有通過各種業務流程收集的大量資料,但是卻無法有效應用為企業組織帶來價值,由於這些資料可以來自任意的來源,此時我們能夠透過使用 SAS Viya 平台準備資料進行分析,其中準備工作可能涉及將來自於多個來源的資料連接至單個資料來源表,並且進行資料清理、資料擴充、資料分區、…等資料相關作業。當準備好資料之後,我們就能夠使用 SAS Visual Analytics 開始探索和視覺化資料,我們能夠檢查和了解資料中的模式、趨勢和關係,並且應用各種預測分析模型和視覺化呈現,以利獲得有價值的見解。然後我們可以取得在 SAS Visual Analytics 中創建的模型,並且在 SAS Visual Data Mining and Machine Learning 中建立分析管線,我們能夠使用其它模型擴充分析管線,並且不斷調整和比較它們,直到我們為資料構建最佳模型。

接著我們能夠將模型直接發佈到包含要評分資料的位置,從 SAS Visual Data Mining and Machine Learning 選擇其中一個作為冠軍模型部署,同時在 SAS Model Manager 中註冊模型,以利用模型版本控制和治理,並且透過 SAS Model Manager,我們能夠將模型部署到 SAS Event Stream Processing 中,以利對各種類型的串流資料進行評分,包括物聯網邊緣設備,同時隨著資料的發展,我們能夠使用 SAS Model Manager 監控模型的效能,以利我們決定是否應該重建模型,如果我們注意到模型中的退化,則需要決定重新訓練模型,此時就會回到分析生命週期的開始。

再來當我們將冠軍模型部署到 SAS Event Stream Processing,以利我們使用該模型即時評估串流資料,主要有四個步驟,分別為:

  1. 註冊模型
  2. 準備模型
  3. 構建專案
  4. 部署專案

其中我們主要會先將 SAS Visual Data Mining and Machine Learning 模型註冊到 SAS Model Manager 讓我們能夠與其他分析模型一起儲存在通用模型庫中,透過儲存模型,我們將能夠比較不同的模型,並且針對模型運行測試,發布模型,監控模型效能以及為業務流程建立自定義的工作流程。我們能夠使用公共模型儲存庫來分離專案和模型內容,以及為存儲庫中的物件設定權限,像是我們能夠為測試和正式環境或不同的組織提供不同的儲存庫,像是 SAS Visual Data Mining and Machine Learning 的預設模型儲存庫為 DMRepository。然後當我們需要將模型部署到 SAS Event Stream Processing 中時,則能夠直接將模型從 SAS Model Manager 匯入至 SAS Event Stream Processing Studio 專案中,並且 SAS Event Stream Processing Studio 主要由一個或多個連續查詢組成。在專案中建立預設的連續查詢,此時我們會在連續查詢中增加計算視窗匯入儲存在 SAS Model Manager 中的模型,再來我們會透過 SAS Event Stream Manager 將 SAS Event Stream Processing 專案部署到 SAS Event Stream Processing 中,並且當發佈 SAS Event Stream Processing 專案中的版本時,已發布的版本就能夠用於在 SAS Event Stream Manager 中進行部署,此外如果我們的環境中沒有 SAS Model Manager,我們仍然可以將 SAS Visual Data Mining and Machine Learning 模型部署到 SAS Event Stream Processing 中,但必須將計算視窗變更為模型讀取視窗,並且指定模型評分程式碼檔案 (ASTORE) 的位置。

最後 SAS Visual Data Mining and Machine Learning 模型除了部署至 SAS Event Stream Processing 中進行即時串流分析之外,更能夠部署至其它環境中,像是我們能夠將所有模型發佈到不同的目標類型,像是 Hadoop、Teradata、SAS Cloud Analytic Services 和 SAS Micro Analytic Service 中,而在發布模型之前,我們必須為所需的目標類型定義一個或多個發佈目標,並且僅有具有管理權限的使用者可以創建發佈目標,請注意僅有安裝 SAS Model Manager,才能發佈到 SAS Micro Analytic Service 中,至於對於所有其它發佈目標,每個唯一目標都需要一個全域範圍的 CAS 資料館,並且必須具有 CAS 資料館所需的授權,此時若要要發佈至 Teradata 或 Hadoop 時,我們則必須建立一個包含資料庫連接資訊全域範圍的 CAS 資料館。此外 SAS Visual Data Mining and Machine Learning 更有提供 RESTful API,能夠讓我們直接在 Model Studio 中針對模型針對資料進行評分。

總結在 SAS Viya 平台中能夠讓我們非常輕鬆地管理分析生命週期,我們能夠在 SAS Visual Data Mining and Machine Learning 中快速建立模型,以及透過 SAS Model Manager 管理模型,並且將它們部署到環境中的任意位置,像是部署 SAS Event Stream Processing 中進行即時串流分析。

相關資源

⬅️ Go back