Leo Yeh's Blog

SAS 基本介紹 (10)

教學目標

初步了解 SAS 資料管理解決方案的應用、功能和活動。

重點概念

DataFlux 基本介紹

首先 DataFlux Data Management Server 主要提供可擴展性的伺服器環境,能夠讓我們進行排程工作、資料檔案和即時服務。當我們上傳排程工作和即時服務至伺服器中之後,使用者透過 DataFlux Data Management Server 中的授權伺服器進行授權之後就能夠執行相關任務。

QKB 基本介紹

接著當我們透過 SAS 軟體產品執行資料操作時,將會參考 QKB,所謂 QKB 全名為 SAS Quality Knowledge Base 主要是收集儲存資料檔案和定義資料管理的維運邏輯,因此 QKB 主要是由檔案和定義項目所組成。 QKB 可以分為兩大類,分別為 QKB for Contact Information (CI) 和 QKB for Product Data (PD)。

資料管理應用

再來我們可以使用 DataFlux Data Management Studio 客制化 QKB 修改定義,或者根據商業資料建立新的定義。所謂 DataFlux Data Management Studio 主要是資料管理套件,主要是組合資料品質、資料整合和主數據管理。同時其也提供流程和技術框架交付單一、準確和一致性的企業資料視圖,簡單來說,我們將會透過 DataFlux Data Management Studio 執行下述七項應用。

  1. 合併客戶、產品或其它企業資料。
  2. 匯整透過多種資料整合方式產生的分散資料,像是批次、即時和虛擬。
  3. 驗證和完成地址資訊。
  4. 整合分散資料集和確保資料品質。
  5. 轉換和標準化產品代碼。
  6. 監控資料符合法規規範,不論批次或即時。
  7. 管理中繼資料層級和可見程度。

資料管理功能

此外 DataFlux Data Management Studio 允許我們建立有效的資料治理平台,強大的功能主要有:

  1. 中繼資料分析:了解我們擁有和擷取什麼資料資源,以及來自於任何來源和企業中的任何地方的中繼資料。
  2. 資料輪廓:執行完整評估組織中的資料,檢驗資訊資產的結構、完整、合適和關係。
  3. 資料品質:更正資料問題,標準化跨來源的資料,以及建立組織資訊整合視圖。
  4. 資料整合:透過 ETL 或 ELT 的方法從資料結構中整合和升級資料,以及虛擬或即時資料整合。
  5. 資料監控:針對品質建立商業規則,主要提供持續、高客制化資料治理計劃的基礎。
  6. 地址標準化:標準化和驗證全世界 240 個國家的地址資訊。
  7. 資料豐富化:增加新的資料元素至客戶和產品的資料,以利符合組織的需求。
  8. 主數據管理:使用結構和彈性流程定義和處理主數據記錄、針對特定資源放置最佳可能性的記錄,像是客戶或產品,以及從所有來源系統中可能包含資源的參考。

資料管理活動

最後 DataFlux 方法中有三個主要活動皆會搭配 DataFlux Data Management Server、DataFlux Data Management Studio、 SAS Quality Knowledge Base 、… 等元件進行操作與應用,分別為:

  1. 規劃:識別資料的模式和問題。
  2. 行動:建立流程以利改善資料品質和資料整合。
  3. 監控:監控資料品質和資料整合的流程。

總結本篇主要先初步了解 SAS 資料管理解決方案的應用、功能和活動。

相關資源

⬅️ Go back