Chart

資料分析 Chart & Visualization (3)

基本介紹

教學目標

初步圖表和視覺化的歷史源由與實務應用。

重點概念

首先圖表最早源自於 18 世紀 1786 年由 William Playfair 出版商業和政地圖集 (Commercial and Political Atlas) 中描述經濟數據及人口變化,主要以 43 個長條圖、橫條圖和折線圖的方式呈現,以及在 1801 年又出版統計摘要 (Statistical Breviary) 中描述土耳其帝國於亞洲、非洲和歐洲面積,主要以圓餅圖的方式呈現。接著在 1858 年 Florence Nightingale 出版影響英國軍隊健康、效率和醫院行政的筆記 (Matters Affecting the Health, Efficiency and Hospital Administration of the British Army) 描述 1854 年和 1855 年克里米亞戰爭中士兵死亡的情形,主要以圓餅圖的方式呈現,但是卻有些不同,所以又稱南丁格爾玫瑰圖,之後就演變成目前的雷達圖。並且統計學之父 Karl Pearson 更稱她為應用統計發展中的女先知,此外 Karl Pearson 在 1892 年則發明了直方圖,主要用於呈現連續型資料的次數分佈圖,反之呈現非連續型資料的次數分佈圖,則會使用長條圖,其中連續型資料中間是沒有空隙的,但是非連續型資料中間必須留有間隔。此外 Ronald Aylmer Fisher 在 1925 年出版研究者的統計方法 (Statistical Methods for Research Workers) 中透過散佈圖解釋統計方法的應用,之後就演變成目前的泡泡圖。小結 William Playfair 在 1786 年至 1801 年所應用的長條圖、橫條圖、折線圖和圓餅圖為現今最常應用的圖表,其中長條圖、橫條圖、折線圖和圓餅圖基本皆為一個類別型變數和量值型變數,所謂類別型變數就是維度、量值型變數就是量測值,同時一般來說維度也就是文字資料,量測值也就是數值資料,所以我們只要有一組文字資料對應數值資料就能夠產生基本的圖表,但重點則是如何有效傳達資訊。

接著視覺化最早源自於 19 世紀 Charles Joseph Minard 在 1861 年以資訊圖表的方式描繪了 1812 年拿破侖軍隊在俄國戰役中蒙受的損失,透過資訊圖表同時傳達多個資料維度,包括了規模、方向、地理、溫度、… 等資訊。接著視覺化量化資訊的先驅 Edward Tufte 則評論該圖說:「這是至今為止最好的統計圖。」,同時他出版的數量資訊的視覺呈現 (The Visual Display of Quantitative Information) 提出了 ChartJunk 和 Data-ink Ratio 兩大視覺化應用的重點,所謂 ChartJunk 代表無效的圖表,也就是不要將時間浪費在沒有意義的圖形表達上,以及所謂 Data-ink Ratio 代表資料墨水比例,也就是強調盡量精簡圖表,以利突顯出核心資訊的理念,至於更多偉大的視覺化作品皆有記載於 Tufte 的個人網站中。

再來進入了 21 世紀,網際網路成為了新的視覺化媒體,產生了許多新的技術和新的功能,並且能夠大量的傳播影響廣大的受眾,同時能夠與視覺化圖表進行即時的動態互動。此外現代視覺化專家 Stephen Few 在出版的現在看到了吧?量化分析視覺化訣竅 (Now You See It, Simple Visualization Techniques for Quantitative Analysis) 書籍中提到:「身為『以數量指出企業訊息』的提供者,我們的責任不只要篩選數據並且要傳遞下去,還必須幫助我們的讀者獲得其中的見解。我們必須用一種帶領讀者踏上探索旅程的方式設計訊息滿確保重要的事件清楚地看到並且明白。數字裡有很重要的故事要說,得依告你賦予他們清楚又有說服力的聲音。」,也就是說未來視覺化將會以故事的方式解釋數字背後所代表的意義。

最後視覺化主要為用圖表呈現資料,以及視覺化呈現最主要的作用,是以清晰易懂的方式直指重點。此外 Cole Nussbaumer Knaflic 在 2015 年出版 Google 必修的圖表簡報術 (Storytelling with Data: A Data Visualization Guide for Business Professionals) 中提到選對有效的視覺元素,像是點型圖看分佈、線型圖看關聯、條狀圖比多少、區域圖看差異、盡量別用圓餅圖和向立體圖說不等建議在於視覺化圖表的分析應用時將會非常實用。

相關資源

Cognos 報表應用 (8)

基本介紹

教學目標

初步了解 IBM Cognos BI 如何有效應用視覺化圖表傳達重要的資訊。

重點概念

在 IBM Cognos BI 平台中提供了視覺化的工具,能夠讓我們更容易產生視覺化圖表,然而文件中只教我們如何操作卻沒有教我們如何應用,此時要如何開始呢?若只是將數據轉換為圖表真的能夠有效傳達資訊嗎?此我們就需要了解圖表的基礎應用概念。首先圖表基本上可以先分為四大類型,分別為數量、推移、排序和內容,簡單來說我們會透過直條圖呈現比較連續數量的大小;透過折線圖呈現變化的推移;透過橫條圖呈現項目的排名;透過圓餅圖呈現詳細的內容。首先直條圖主要呈現連續且特定的數量,縱軸設為數量,橫軸設為時間或變化的要素,數量的基準點最好從 0 開始,像是年月季等連續時間軸搭配銷售數據以呈現時間序列下的銷售情況。接著折線圖主要呈現事件變化的走勢,縱軸設為比較項目的數值,橫軸設為時間順序,數值的基準點不一定要從 0 開始,且單位可以是百分比,主要目的在於呈現變化的程度。再來橫條圖主要呈現相同屬性的項目排序進行比較,縱軸設為比較項目,橫軸設為呈現排序和比較結果的數值,數值的基準點不一定要從 0 開始,最後圓餅圖主要為表示詳細內容,透過面積呈現不同內容的佔比,不適用於走勢比較。

接著圖表盡量放大呈現,若是圖表做得太小也是一種干擾,因為圖表主要是藉由面積和形狀來呈現數據重點的工具,此時要注意圖例的位置,刪除不需要標註也看得懂的縱軸或橫軸名稱,刻度的表示,像是當數字大到出現好幾位數時,就以千元為單位,因為圖表主要是呈現數量與變化的趨勢,而非呈現精確的數值,以及當需要特別強調數量與變化的趨勢時,設定不同的刻度,呈現出來的面積與趨勢也會跟著改變。然而上述四大類型的圖表無法呈現數據的分佈與相關性,此時就可以透過散佈圖或泡泡圖呈現,此時縱軸與橫軸的刻度間距最好一致等距,至於要如何設定縱軸和橫軸,基本上我們會將變化的項目 A 設為橫軸,然後將隨著變化的項目而發生變化的項目 B 設為縱軸,像是信用額度與消費金額的關係,此時信用額度的變化會影響消費金額,因此橫軸為信用額度和縱軸為消費金額。此外在泡泡圖中透過泡泡的位置和大小最能吸引人們的視線,若巧妙設定座標軸的單位,將會使得差距變的更明顯,並且放大泡泡,呈現壓倒性的大小和出人意料之外的位置,都能加強資訊的說服力。

再來針對不同的視角該如何選擇圖表,首先要有效呈現數量的遞減,此時就能採用瀑布圖,主要能夠呈現兩個時間點前後的數量變化,強調狀態變化的過程,找出變化的多個起因,像是實施各式各樣的策略之後,要以視覺效果呈現哪些策略有助於提升業績或利潤。接著當數量單位完全不同時請設成左右兩軸,也就是組合圖表,以柏拉圖最為普遍應用,主要將項目的數量由多到少以直條圖排列,再針對右軸畫出累積百分比的折線圖,此時就能夠看出比較項目造成的影響成效,簡單來說若數據是數量與百分比的組合請優先考慮組合圖表。再來若當折線圖無法有效傳達出重點時,則可以嘗試轉換為面積圖,主要能夠以折線表現變化,且以面積表現數量、更能夠以堆疊表現每一段縱軸的比率,同時傳達三種資訊的圖表。最後當我們需要透過圖表呈現綜合能力時,可以採用雷達圖,主要進行能力比較,讓人能一眼看清楚能力強弱的圖表,此外當為圓形時則代表完整能力的圖表,但若有不足之地方,則可進行改善以利取得平衡,簡單來說若比較的對象達三種以上時,容易導致重疊而呈現不清楚時,建議採用雷達圖呈現進行比較。

總結除了基本的四大類型圖表包括長條圖、折線圖、直條圖和圓餅圖之外,針對數據的分佈與相關性會選擇散佈圖和泡泡圖,以及針對不同的視角會選擇瀑布圖、柏拉圖、面積圖和雷達圖等進階圖表應用,可是當我們針對大數據的分析應用時上述圖表真的能夠的清楚呈現資訊嗎?此時我們就能夠透過熱力圖、樹狀結構圖、壓縮泡泡圖、文字雲和網絡圖等進階圖表呈現大數據所要傳達的資訊,至於圖表設計最好能夠以最小的對比傳達最大的力量,原則就是簡化與聚焦,再搭配 2013 年開始流行的扁平化設計將能回到原點思考如何以簡單、直接的方式呈現要傳達的訊息,此時再透過 IBM Cognos BI 平台應用視覺化的工具以數據為基礎產生視覺化圖表將能夠更清楚傳達重要的資訊。

相關資源

資料分析 Chart & Visualization (2)

基本介紹

教學目標

初步比較 SAS Visual Analytics Designer 和 IBM Cognos Workspace Advanced 圖表視覺化。

重點概念

首先 SAS Visual Analytics Designer 中有部份圖表是隱藏起來,需要顯示才可以應用,此外 IBM Cognos Workspace Advanced 中的視覺化需要上網下載匯入才可以應用。

圖表視覺化 SAS Visual Analytics Designer IBM Cognos Workspace Advanced
直條圖 「圖形」→「長條圖」 「圖表」→「直條圖」
長條圖 「圖形」→「長條圖」→「屬性」→「方向」→「水平」 「圖表」→「直條圖」
目標直條圖 「圖形」→「目標長條圖」 「圖表」→「長條圖」→「內容」→「數字基準線」
目標長條圖 「圖形」→「目標長條圖」→「屬性」→「方向」→「水平」 「圖表」→「長條圖」→ 「內容」→「數字基準線」
瀑布圖 「圖形」→「瀑布圖」 「圖表」→「漸進」
折線圖 「圖形」→「折線圖」 「圖表」→「折線圖」
區域圖 「圖形」→「折線圖」→「屬性」→「群組樣式」→「堆疊已填滿」 「圖表」→「區域圖」
圓餅圖 「圖形」→「圓形圖」 「圖表」→「圓餅圖」
散布圖 「圖形」→「散布圖」 「圖表」→「散佈圖」
時間序列圖 「圖形」→「時間序列圖」 「圖表」→「折線圖」
泡泡圖 「圖形」→「氣泡圖」 「圖表」→「泡泡圖」
樹狀結構圖 「圖形」→「樹狀圖」 「視覺化」→「Treemap」
群組直條圖 「圖形」→「雙座標軸長條圖」 「圖表」→「叢集直條圖」
群組長條圖 「圖形」→「雙座標軸長條圖」→「屬性」→「方向」→「水平」 「圖表」→「叢集長條圖」
群組折線圖 「圖形」→「雙座標軸折線圖」 「圖表」→「叢集折線圖」
組合圖 「圖形」→「雙座標軸條線圖」 「視覺化」→「組合圖」
雙座標軸時間序列圖 「圖形」→「雙座標軸時間序列圖」 「圖表」→「叢集折線圖」
甘特圖 「圖形」→「排程圖」 「視覺化」→「甘特圖」
數值序列圖 「圖形」→「數值序列圖」 「圖表」→「折線圖」
階梯圖 「圖形」→「階梯圖」 「圖表」→「叢集階梯分點式線圖」
點圖 「圖形」→「點圖」 「圖表」→「點」
旋風圖 「圖形」→「碟型圖」 「視覺化」→「旋風圖」
相對時間序列圖 「圖形」→「相對時間序列圖」 「圖表」→「折線圖」
地圖 「其它」→「地圖」 「視覺化」→「地圖」
測量儀器 「其它」→「測量儀器」 「圖表」→「項目符號」
文字雲 「其它」→「文字雲」 「視覺化」→「標籤雲」
柏拉圖 「圖形」→「雙座標軸條線圖」 「圖表」→「Pareto」
向量圖 「圖形」→「向量圖」
針狀圖 「圖形」→「針狀圖」
股票高低圖 「圖形」→「股票高低圖」
股票交易量和波動圖 「圖形」→「股票交易量和波動圖」
氣泡變化圖 「圖形」→「氣泡變化圖」
網路圖 「視覺化」→「網路圖」
雷達圖 「視覺化」→「雷達圖」
熱力圖 「視覺化」→「熱力圖」
壓縮泡泡圖 「視覺化」→「壓縮泡泡圖」
量表 「視覺化」→「量表畫面」
弦圖 「視覺化」→「弦」

相關資源

資料分析 Chart & Visualization (1)

基本介紹

教學目標

初步了解如何選擇適當圖表類型進行資料視覺化。

重點概念

所謂資料分析對於公司、部門和團隊來說,就是在決定下一個行動時,為得出指標性的結果而進行的分析。數字是死的,我們則要知道如何活用。主要有兩個重點需要注意,一是看資料時最好從均衡和關聯性等不同的角度,思考各種資料代表的意義,準備不同的指標,以利產生更多的選項。二是經由資料分析得出指標,要決定接下來的企劃時,不要一看到數字,就立刻做決定,先以數字為基準,思考眼前所見數字的背景和現實之後,再進行決定。然而若只看「結果」就會有盲點,此時我們就可以透過圖表進行資料視覺化讓原因現形,找出數字背後的真正問題。

首先我們除了透過次數分配表進行統計分析之外,其實還能夠透過基本圖表針對業務部門提出有說服力的促銷方案,為了找出並確認銷售最好的部門、商品和店家,主要會採用長條圖統計產品銷售數字由高至低排列,接著搭配折線圖根據產品的「營收成長率」找出銷售最好的產品,此外我們也可以透過柏拉圖將產品進行等級的分類,找出前 80% 的產品列為重點產品,接著針對行銷部門提出會賺錢的商品企劃,為了找出銷售不佳的類別,推出新商品,主要會散佈圖進行迴歸分析找出正負相關性以利確認最適當的價格和影響銷量的原因,此外我們也可以透過泡泡圖進行產品組合管理分析,找出賣的好與賣不好的產品。

接著我們最好了解四種基本圖表的差別,分別為直條圖、長條圖、折線圖和圓餅圖,當我們要呈現持續而固定的量值,並且起點為零時通常會採用直條圖,像是每個月的產品銷售數量。接著當我們要呈現事件變化的傾向,起點不一定為零時通常會採用折線,像是每年度的銷售成長率,與直條圖最大的差別在於折線圖主要是強調維度之間的差異或急劇成長,此外也可以使用區域圖同時呈現變化與量值更具說服力。再來當我們要呈現維度之間的順序與差異,並且起點不一定為零時通常會採用長條圖,像是不同特店的銷售數量。最後當我們要呈現比例時,通常會採用圓餅圖,但是圓餅圖並不適合比較變化,因此我們可以採用堆疊直條圖一次比較整體與各比例的量,或者活用百分比堆疊直條圖,以面積呈現比例與量值更具說服力。

再來我們除了依據經驗活動基本圖表之外,其實更能夠以資料為主進行分類,則可以分成維度資料和數值資料,當主要呈現為維度資料時,則建議採用長條圖和圓餅圖,通常對應的表格內容結構為第一欄為維度名稱,第二欄為個數、數量和百分比,不建議呈現兩個以上的維度資料進行呈現。若當呈現為數值資料時,則建議採用長條圖和折線圖,通常對應的表格內容結構為第一欄為分組數值資料、時間,第二欄為次數和單位,當呈現兩個數值資料時則採用散布圖了解分佈情況,當呈現三個數值資料時則採用泡泡圖了解分布情況和進行比較分析。

此外為了當定義問題時我們能夠確保該問題可以透過量化分析的方式進行回答,理應能夠將問題先對應至七大類別中,分別為順序(排名)、組成、分布、評估(趨勢)、關係、剖析以及例外(警訊),順序(排名)、組成和分布主要進行資料點的比較,常見的圖表則為長條圖、圓餅圖和直方圖,所謂直方圖是代表連續型的類別資料,像是使用者在不同年齡層的購買次數,主要步驟則為先找出最小值與最大值,接著計算全距,再來計算組數與組距,最後決定每組的次數與分配就能夠產生直方圖。評估(趨勢)、關係、剖析主要進行資料減量的分析,常見的圖表則為折線圖、散布圖和群組直條圖,所謂群組直條圖主要能夠比較複數對象的量值。最後例外(警訊)則是進行數據驅動的分析,主要應用於大數據分析領域快速找出 最關鍵的資料點,並沒有限於特定圖表類型。

總結透過適當的圖表類型以資料視覺化的方式解讀數字,將夠讓決策更精準和具說服力。

相關資源