Visual Analytics

SAS 自主分析 (8)

基本介紹

教學目標

初步了解 SAS Visual Analytics 中設計報表最佳實務。

重點概念

如何設計一個具有視覺吸引力又易於理解的報表,創造出令人信服的資料故事這背後有非常多的學問,然而我們可以先參考 SAS 官方提供製作漂亮報表最佳實務一步一步慢慢從中學習設計報表,主要有三個關鍵重點,分別為:

  1. 限制頁面
  2. 限制物件
  3. 增加空白

限制頁面

我們需要先專注於每份報表 1 ~ 7 頁,因為報表中的頁數可能會在觀看報表之前影響觀眾的看法,若是頁面較少則代表這是一份快速而易於理解報表,反之頁面較多則代表需 要學習相關領域知識才能夠理解複雜報表。請注意若我們資料故事需要 6 ~ 7 頁以上的內容,建議請建立多個報表,同時根據需要將主要報表連接至多個次要報表,以利獲取更多的詳細資訊。例如:關於銷售和行銷的報表可以包括有關於行銷工作與其對銷售業績影響的頁面,主要報表將會連結兩個次要報表,一個報表主要包括銷售目標群眾的資訊,而另一個報表為行銷團隊的資訊,通常我們會使用相同的技術從高層級的報表連結至具有詳細內容的目標報表。

在報表中的多個頁面上傳遞資料,同時在每一頁聚焦在溝通一個重點,或者僅回答單一問題,以利觀眾了解資料故事背後所代表的意義。請注意,當觀眾閱讀報表,請不要要求觀眾記得上一頁的內容,而是可以透過提供標題協助了解正在查看的內容。此外較少頁面的報表可以在行動網路上下載更快速,而且開啟速度也更快速,同時報表中的連結顯示詳當資料,以及觀眾只能下載適用的目標報表,以利節省下載時間和儲存空間。

限制物件

限制頁面上的物件數量,建議每頁 2 ~ 6 個物件,將能夠改善觀眾關注資料的能力,同時提高觀眾對於資料的理解能力。當頁面上的物件越多,則看起來會越不相關,因此我們透過限制物件數量和增加物件周圍的空白空間,以利加強資料視覺化效果的可見性,以及使用者不會想一次看到所有可能的報表物件,反而使用者更傾向於只看到幾個支援他們正在調查具體問題的報表物件。

但是我們要如何決定以哪一種報表物件呈現呢?第一件事我們可以先確定我們觀眾的具體問題所要講述的故事內容,第二件事我們可以使用能夠有效回答觀眾問題的最高優先權的報表物件設計頁面。此外我們可以透過使用堆疊容器,透過堆疊容器允許我們的觀眾一次僅查看一個物件,同時為使用者提供快速存取該頁面上其它物件彈性。

然而其中圖表若越大,觀眾將會花費更多的時間進行研究,以及觀眾通常只會瀏覽相對較小的圖表,當圖表需要更多細節請採用更大的圖表,以利觀眾輕鬆學習和了解詳細資訊和資料。請注意避免為了減少幾個物件的大小,而將物件堆放在頁面上,如此一來將會導致物件和資料難以辨認,相反,請仔細地識別比較重要的物件,並且將這些物件放在同一頁面上,同時將剩下的物件移至另一個頁面或報表。

此外當我們降低每個頁面的物件,也就代表降低視覺複雜度,此時內容更能夠適合平板電腦,並且無需滾動瀏覽。將內容限制於一個螢幕中時將能夠簡化物件之間的互動之外,更能夠在頁面上進行物件之間的視覺化分析比較。請注意報表的設計中物件越多則開啟和呈現報表所需要的時間就會越多。

增加空白

所謂空白是代表報表中不包含內容的區域,同時報表中物件之間的空格也被認為是空白,即使背景顏色不是白色。但是我們為何要使用空格呢?第一點在空白處建立一個視覺框架,以利觀眾能夠輕鬆了解報表的內容和組織。第二點緊密間隔的內容需要額外的時間和精力才能夠讓觀眾了解。第三點沒有雜亂無章的白色空間報表更具視覺吸引力和更為優雅。請注意許多報表設計者會試圖透過內容和裝飾填充頁面的每個像素,但請不要將空白視為浪費空間。

接著空白能夠提供視覺化的組織,在報表中的空白區域會建立組織內容的視覺網格,網格上的視覺對齊將有助於連結和分離的內容,例如若在同一行中並排的報表物件將能夠被直觀地理解為相關的物件,請注意避免在內容周圍加上邊框,白色空間就能夠分離物件達到視覺化的效果,並且不會造成頁面的雜亂。

再來在許多設計原則中會建議我們在頁面和報表物件之間包含大量的邊距和填充,同時為了實現平衡設計,請確保報表頁面上的每個物件之邊距和填充一致,請注意雖然我們可以調整邊距和填充,但是精確的佈局不能很好的適用於較小的螢幕中,也就是在行動裝置上通常無法正常瀏覽。

最後建立焦點主要是吸引觀眾關注的物件,以利提供頁面內容的起點,若我們要建立一個物件作為焦點,將其放置在頁面頂部或左側,若觀眾是從右到左讀取則是右側。其中物件應該是頁面上最的物件,通常填充頁面寬度或高度大於 50% 以上。請注意對於報表中的每個頁面,若是存在互動的物件,則該物件應該是焦點,避免有多個物件競爭觀眾的焦點,請省略報表中任何不需要的圖形或影像。

總結我們參考 SAS 官方提供製作漂亮報表最佳實務一步一步慢慢從中學習限制頁面、限制物件和增加空白三個最佳實務的概念與重點,理應就能夠透過 SAS Visual Analytics 自主分析的應用有效設計出具有視覺化效果與表達資料故事的報表。

相關資源

SAS 自主分析 (7)

基本介紹

教學目標

初步了解 SAS Visual Analytics 中匯入 SAS 資料集和共用與分享報表的方式。

重點概念

首先我們使用 SAS Visual Analytics 匯入 SAS 資料集,主要可以從伺服器和本機端,當匯入 SAS 資料集時,我們可以改變欄位的屬性,雖然 SAS 平台是以中繼資料伺服器為基礎進行資料的處理,然而在 SAS Visual Analytics 匯入 SAS 資料集時不需要在中繼資料中註冊也可使用,此外當我們從本機匯入 SAS 資料集時將能夠預覽 SAS 資料集的內容

接著我們是如何在伺服器上的匯入 SAS 資料集呢?主要是會透過 SAS Web Application Server 中的自助元件觸發 Job Execution Service (JES) 將 SAS 資料集透過 SAS Workspace Server 中的 DATA STEP 程式載入至 SAS LASR Analytic Server 上的記憶體中,當然我們也可以指定 SAS Workspace Server 存取伺服器上的 FTP 檔案系統,請注意一定要先透過 SAS Visual Analytics 管理者應用程式啟動 SAS LASR Analytic Server。在 讓 SAS Visual Analytics 管理者應用程式中啟動 SAS LASR Analytic Server,主要有六個步驟,分別為:

  1. 管理者透過 SAS Visual Analytics 管理者應用程式啟動 SAS LASR Analytic Server。
  2. SAS Visual Analytics 管理者應用程式會產生要求的程式碼傳送給 Job Execution Service (JES) ,接著在 SAS Visual Analytics 根目錄中執行。
  3. 在 SAS Visual Analytics 根目錄中 Job Execution Service (JES) 會觸發 SAS Object Spawner。
  4. SAS Object Spawner 初始化 SAS Workspace Server 工作階段。
  5. 客戶端建立 Job Execution Service (JES和 SAS Workspace Server 之間的工作階段連線。
  6. 當 SAS LASR Analytic Server 啟動程式碼被執行時, SAS LASR Analytic Server 實體將會被建立,這個實體將會從 SAS Workspace Server 工作階段被獨立,在 SAS LASR Analytic Server 啟動程式執行之後, SAS Workspace Server 工作階段和客戶端連線將會關閉,但是 SAS LASR Analytic Server 實體仍然持續執行直到管理者停止。

再來我們可以在 SAS Visual Analytics 中共用匯出報表,簡單來說,使用者可以將報表的連結傳送給其它人,但是必需要登入至 SAS 才能夠瀏覽報表,若是沒有帳號則可以按下「來賓」以訪客的方式登入,請注意共用報表時僅能以連結、報表和 PDF 檔進行瀏覽。除此之外,我們還能夠匯出以定位鍵分隔值 (.tsv) 或逗號分隔值 (.csv) 的資料檔案至 Excel 試算表軟體中使用,以及匯出影像檔 (*.png) 至 PowerPoint 簡單軟體中使用。

最後我們可以在 SAS Visual Analytics 中分送匯出報表,分送報表主要會自動將更新之後的內容傳送給使用者,我們可以一次性或週期性分送報表,像是每天、每星期或每月,此外還可以建立時間事件,避免在非尖峰時間產生報表,請注意 SAS Management Console 中的排程管理員與報表工作會不相容。一般來說,在 SAS Visual Analytics 中分送報表時將對被視為工作所有者,分送報表主要有三個步驟,第一步驟為定義報表工作,其中包括一份或多份報表清單和一個至多個收件者清單,其中報表工作所有者和收件者都必須註冊在中繼資料內儲存的電子郵件址址,因為需要資料存取權限。第二步驟為建立分送,其中包括報表工作和時間事件,所謂時間事件為指定分送發生的時間和頻率,同時執行分送將會建立歷史記錄。第三步驟收件者將會收到一則以 PDF 檔案的方式附加一份或多份報表的電子郵件訊息,其中也包含報表的連結。

總結在 SAS Visual Analytics 中我們可以先匯入 SAS 資料集,接著進行資料探索,再來產生視覺效果的報表,最後共用和分送匯出報表,同時這也就是最自主分析的基本操作流程。

相關資源

SAS 自主分析 (6)

基本介紹

教學目標

初步了解 SAS Visual Analytics 中資料互動式視覺呈現的方式。

重點概念

首先所謂視覺效果就是資料互動式視覺呈現的方式,在 SAS Visual Analytics 中我們會透過視覺效果顯示資料,同時會根據資料項目自動選取圖表類型,像是不連續的資料項目會產生長條圖,而連續的資料項目會產生折線圖,此外若透過自動功能產生的折線圖,當進行情境分析將無法增加測量值至資料角色中。所謂資料角色主要是說明特定資料項目在報表物件中的使用方式,每個報表中的物件都具有資料角色,其中包括基本必要和其它選用兩種資料角色,像是折線圖基本資料角色為類別和量測值,其它資料角色為群組、斜格紋欄、斜格紋列、資料提示值和動畫,舉例來說,若我們要進行產品品牌的分析時則會將交易月份指定至類別基本資料角色中,接著將利潤、成本和銷售指定至量測值基本資料角色中,最指定產品類別至斜格紋列其它資料角色中,就能夠有效進行產品品牌分析**。

接著我們經常會需要檢驗兩個量測值之間的關係,此時就會建議採用熱圖報表物件,熱圖主要使用彩色儲存格的顯示表格中兩個資料項目的關係,一般來說,熱圖的基本資料角色將會設定 X 座標軸、Y 座標軸和顏色,其中若顏色不指定量測值,則代表資料項目的交集次數,此外在熱圖中可以更進一步套用相關分析的應用,請注意若是熱圖中包含類別或階層時,則無法使用最適線條。

再來我們經常會碰到無法透過圖表視覺化呈現的資料,此時就會透過交叉資料表的視覺效果呈現資料,交叉資料表的基本資料角色為欄、列和量測值,我們可以將單一階層或多個類別指定至每一個欄和列的角色中,若要建立階層僅需在類別標題上按右鍵選取「建立階層」,當階層建立完成之後即可進行展開的操作,若是類別前方是「+」則代表還未至階層中的最下層。此外交叉資料表更可以設定縮排、顯示欄小計、顯示欄總計、顯示列小計、顯示列總計、總計位置、…等屬性,其中總計位置主要有兩種,指定「之前」代表將總計和小計放在軸標題之前,指定「之後」代表將總計和小計放在軸標題之後,請注意若採用縮排版本配置,則會固定在座標軸標題之前放置總計。

最後顯示規則主要針對所有類型的報表物件提供醒目的提示效果,顯示規則主要有許多類型,同時可以讓所有物件共同條件,但不非所示顯示規則皆能套用至所有類型的報表物件,像是我們可以建立顯示規則套用至交叉資料表中,此時交叉資料表中符合規則的個別儲存格將會以顏色的方式提供醒目的提示,此時若我們也可以將此顯示規則套用至直條圖中,此時直條圖中符合規則的項目將會以顏色的方式提供醒目的提示。

總結在 SAS Visual Analytics 中我們會透過視覺效果顯示資料,若無法透過視覺化圖表自動呈現時,則會根據分析目的採用適當的視覺化圖表手動呈現,接著若遇到複雜的資料無法透過視覺化圖表呈現時,則會透過交叉資料表進行呈現,以及搭配顯示規則提供醒目的提示效果,所以 SAS Visual Analytics 解決方案將可以滿足不同使用者自主分析的需求。

相關資源

SAS 自主分析 (5)

基本介紹

教學目標

初步了解 SAS Visual Analytics 中設定階層類別欄位以利進行下鑽操作。

重點概念

所謂階層就是以父子關係為基礎的類別欄位,在 SAS Visual Analytics 中階層層級的排列方式為一般資訊放至上方,特定資訊放至下方,像是建立日期和時間階層的類別欄位時,最上層是年、下一層是季、下一層是月,最下層是日

接著若在 SAS Visual Analytics 中建立階層欄位,則可讓我們下鑽操作存取報表中的資料,像是建立地理地圖視覺化時,設定地圖樣式屬性為座標,此時若搭配地理階層資料指定給地圖物件將能夠針對座標點進行下鑽操作,此外為了方便使用者進行操作所以在報表上方會有一組階層連結返回階層層級。

此外對於日期和時間的資料項目,在 SAS Visual Analytics 中將會自動衍生階層,僅需在資料窗格的資料項目上按右鍵選擇「建立日期階層」、「建立時間階層」和「建立日期和時間階層」,日期階層主要包括年、季、月和日層級,時間階層主要包括時、分和秒層級,日期和時間階層主要包括年、季、月和日層級,請注意此衍生階層無法建立部份層級。

最後我們在 SAS Visual Analytics 中可以從樹狀圖、交叉資料表或網路流程圖中建立階層,像是我們可以在交叉資料表的類別標題上按右鍵選取「建立階層」,此時就會以新的階層取代類別,並且最外層新的類別名稱後方會有階層二字。

總結當我們透過 SAS Visual Analytics 進行自主性分析或視覺化資料探索時,常常會遇到大量的資料項目很難有效率的準備資料,此時就會透過階層設定使得報表具備下鑽效果,這功能對於展示報表給長官時非常實用,同時透過階層的方式,將能夠讓我們一層一層進行自主性分析或視覺化資料探索,說不定會有意想不到的發現。

相關資源

SAS 自主分析 (4)

基本介紹

教學目標

初步了解 SAS Visual Analytics 中資料分析的基本類型。

重點概念

我們可以在 SAS Visual Analytics 執行資料分析,主要有二種基本類型,分別為:

  1. 相關分析:主要為識別量測值彼此之間的關係。
  2. 預測分析:主要為根據統計趨勢評估資料未來預測值。

首先相關分析主要為識別量測值彼此之間的關係,其強度值會介於 -1 和 1 之間的數值,接近 -1 代表很強負相關,接近 0 代表稍微沒有相關, 1 代表很強正相關。若我們要在 SAS Visual Analytics 執行相關分析, 則會採用熱圖和散佈圖的視覺效果。

接著透過最適線條將能夠繪製量測值彼此之間的模型,主要有下述五種類型,分別為:

  1. 最適大小:主要為自動選取最適當的模型,主要透過回溯變數選取顯著最高的模型。
  2. 線性:主要為使用線性迴歸演算法建立線性模型,簡單來說就是量測值之間的直線關係。
  3. 二次:主要為使用單一曲線演算法建立二次模型,簡單來說就是量測值之間的拋物線關係。
  4. 三次:主要為使用兩個曲線演算法建立三次模型,簡單來說就是量測值之間的 S 型曲線關係。
  5. PSpline:主要為使用多變化曲線演算法建立 Pspline 模型,簡單來說就是量測值之間的多變化複雜曲線關係。

若我們要在 SAS Visual Analytics 執行最適線條, 則會先採用熱圖和散佈圖的視覺效果,接著套用最適線條。

再來預測分析主要是根據統計趨勢評估資料未來預測值,預測會將線條和預測值新增至視覺效果中,以及呈現信賴區間,所謂信賴區間是百分比代表預測模型對於未來預測值的可靠性達多少百分比的資料範圍,像是 95% 信賴區間就代表預測模型對於未來預測值的可靠性達 95% 的資料範圍。若我們要在 SAS Visual Analytics 執行預測分析,則僅可以使用包括日期或時間資料項目的折線圖,同時 SAS Visual Analytics 將會自動針對資料產生多個預測模型,然後選取最佳模型,預測模型的種類主要有下述六種類型,分別為:

  1. 減緩趨勢指數平滑法
  2. 線性指數平滑法
  3. 季節性指數平滑法
  4. 簡易指數平滑法
  5. Winters 方法 (加法)
  6. Winters 方法 (相乘)

最後透過情境分析將能夠讓我們指定針對預測值一個或多個關鍵因子,更進一步預設假設情境。同時除了情境之外,我們更進一步設定目標搜尋,目標搜尋將能夠讓我們指定預測值的目標,以利確定能夠達成預測值目標的關鍵因子值,一般來說情境分析和目標搜尋會使用在相同預測分析中

總結在 SAS Visual Analytics 中主要有兩種資料分析的類型,分別為相關分析和預測分析,當我們進行相關分析時,則會搭配最適線條更深入了解量測值之間的關係,當我們進行預測分析時,則會搭配情境分析和目標搜尋更深入了解若要達到預測值目標將會需要如何調整關鍵因子值。因此我們僅需要透過 SAS Visual Analytics 網頁快速進行自主分析中的資料分析應用。

相關資源