Leo Yeh's Blog

Cognos 報表應用 (7)

基本介紹

教學目標

初步了解 IBM Cognos BI 如何應用於 CRISP-DM 資料探勘標準流程步驟中,讓使用者能夠進行自主報表和儀表板。

重點概念

報表是一種按照特定用將資訊以方便理解的方式進行展現的交流工具,若報表與業務相關稱之為業務報表,業務報表為商業智慧中最重要組成部份,目的為提高管理決策水平。若從決策者的角度來看,則決策者需要資訊做出精確和即時的決策,其中資訊的本質是情境化數據,並且在大數據時代中資訊則會以報表的方式提供,因此報表就是一種按照容易理解的形式組織,在任何時間和任何地點向任何人傳遞特定資訊的溝通工具,主要以敘述、表格和圖形的方式進行組織、並且週期性的進行準備,或者根據查詢產生特定的時間區間的事件和主題。接著報表常見的功能主要有確認各個部門都在正常作業、提供資訊、提供分析結果、說服他人行動和建立組織記憶,然而業務報表是一個包含業務相關資訊的文件,主要為優化企業決策與知識管理的核心部分,其中用於建立報表的基礎主要是來自於企業內部和外部的資料來源,同時業務報表的建立會涉及與資料倉儲互動的 ETL 轉換步驟,也就是擷取、轉換和載入,再來才會使用一個或多個商業智慧報表平台來呈現,根據 Gartner 研究機構在 2016 年針對商業智慧和分析平台的研究報告顯示 Tableau 和 Microsoft 為領先地位者,而 SAS 和 IBM 則為遠見卓識者。

在了解報表基本定義之後,時間回到 1996 年當時由 SPSS 和 NCR 等企業聯盟提出了跨產業資料探勘標準作業流程 (Cross Industry Standard Process for Data Mining,CRISP-DM) 為應用最廣泛的標準化資料探勘流程,主要有六大步驟以資料為中心不斷循環,當有需要時可以返回,分別為:

  1. 業務理解
  2. 資料理解
  3. 資料準備
  4. 建立模型
  5. 測試評估
  6. 計劃部署

首先業務理解主要由業務單位人員負責,接著資料理解主要由分析單位人員負責,再來資料準備主要由資訊訊單位人員負責,主要可以細分五個步驟,分別為選擇資料、清理資料、建構資料、整合資料和格式化資料。此時最普遍應用於準備資料的方式為 SQL 結構化查詢語言,但是若有商業智慧報表平台,像是 IBM Cognos Workspace Advanced,就能夠透過篩選清單的方式查詢資料,相較於撰寫 SQL 語言使用者只需要透過直覺拖拉操作就能夠建立查詢報表,同時進行篩選資料、標題文字、呈現樣式、統一格式、等直覺拖拉操作,然而當資料量龐大時,則清單就已經無法呈現數據所代表的含義,因此我們就必須要聚焦資料,簡單來說就是轉換角度看數據的技巧,這時就會進行統計函數、自訂群組、排序資料、條件化格式和匯出 Excel 檔案等直覺拖拉操作,當我們在製作清單時最好遵守以下基本的規則,分別為標題要在最先看到的位置、盡量減少格線、統一文字的格式、註明單位、透過項目的排列來組織架構和用顏色代表有意義的數據。

至於建立模型主要由分析單位人員負責,必須要有資料探勘的工具才能夠進行,像是 IBM SPSS Modeler,雖然測試評估主要由分析單位人員負責,但是若有商業智慧報表平台,像是 IBM Cognos Workspace Advanced,就能夠先透過分類資料表和視覺化圖表針對資料探勘的目標與業務單位人員和資訊單位人員進行整體的解析。此時最普遍應用於準備資料的方式為 Excel 樞紐分析表進行資料摘要和分析,但是若我們擁有商業智慧報表平台,像是 IBM Cognos Workspace Advanced,就能夠在最短的時間內將大數據產生交叉資料表和視覺化圖表的自主報表,此時我們除了可以針對交叉資料表進行匯總之外,我們更能夠透過視覺化思考產生視覺化圖表,當我們要開始進行視覺化思考,先考慮你視覺化的性質是為概念性或者數據驅動,以及目的是敘述或者探索?然而目前 IBM Cognos Workspace Advanced 視覺化主要是以數據驅動為主,可再細分視覺化發現和每日數據視覺化。其中以探索為主的視覺化發現主要是針對複雜和動態類型的大數據進行分析,又可再分為視覺化證實和視覺化探索兩種,當沒有搭配 IBM SPSS Modeler 的工具時,理論上僅能夠做到視覺化證實,簡單來說就是當我們懷疑事情是否是真的嗎?或者是否可以描述這個想法,此時資料必須在可以控制的範圍,並且使用最基本的視覺化圖表,包括了圓餅圖、長條圖、折線圖、泡泡圖、熱力圖、樹狀結構圖和壓縮泡泡圖,這時重點在於能夠快速反覆進行視覺化圖表,例如:當行銷人員認為一天當中某些時段,會有更多客戶在行動裝置上購買商品,此時為了證實此假設,就能夠嘗試用視覺化圖表中的折線圖,以不同維度和測量值的搭配不斷重複嘗試,為了證實最初的假設。然而視覺化圖表最主要的挑戰在於針對龐大、複雜、高維度和多測量值的資料以直觀的方式呈現,尤其當資料來自於資料倉儲時,最少也有高維度和多測量值的大數據,因此才有所謂的視覺化分析,通常視覺化圖表主要回答發生了什麼事情和正在發生什麼事情,但是視覺化分析主要回答為什麼事情會發生和將來可能會發生什麼事情,像是 SAS Visual Analytics 就提供高效能的視覺化分析。

反之以敘述為主的每日數據視覺化主要是針對簡單和少量類型的小數據,在正式會議進行簡報,此時的設計主要會以說故事的設計為主,事實上進行資料分析的人都要會講故事,故事最好簡單、真實、詳細且以數據為基礎。然而當在沒有業務背景的情況下呈現事實和數據對於主管們是沒有共鳴的方式,此時我們需要用證故事的方法準備報表,向主們解釋戰略和結果,其中不僅要說明故事的背景,也就是事實和數據,還要說明清楚誰發生什麼事情,為什麼會發生該事情,以及那又怎麼樣呢?以利將數據轉化為聽眾能夠理解的形式,此時聽眾將能夠更有效率的理解、整理各個事實,同時更容易記住重點進行應用。此外若故事能夠提供互動的方式將能夠讓聽眾感覺與這件事情的關聯,同時有置身其中的感覺,透過下述的最佳實務將能更有效率的發現數據中所代表的故事,分別為將分析構思成一篇故事、故事要真實、讓聽眾能夠在腦海中看到影像、故事盡量簡單和互動討論,像是 Tableau 和 Microsoft 就提供以故事為基礎架構匯整報表的功能。最後計劃部署則可以透過 IBM Cognos Workspace 以故事為架構設計整合儀表板,包括故事頁籤、版面配置和動態篩選,產生自主儀表板,並且將整合儀表板設為商業慧智平台的個人化首頁。

總結目前若只有導入 IBM Cognos BI 平台卻沒有搭配 IBM SPSS Modeler 的工具時,則僅能進行跨產業資料探勘標準作業流程中的三個步驟,分別為資料準備、測試評估和更新部署,但是對於自主報表和自主儀表板的應用則為自主分析重要的第一步。

相關資源

⬅️ Go back