Leo Yeh's Blog

SAS 視覺分析 (8)

教學目標

初步了解 SAS Visual Analytics 7.4 散佈圖、散佈矩陣圖和泡泡圖的基本概念。

重點概念

首先若我們要檢查測量值資料項目之間的關係,則建議使用散佈圖,若是兩個測量值分配給散佈圖,則會將一個測量值繪製在水平軸和一個測量值繪製於垂直軸上,但若是分配了兩個以上的測量值,則將會顯示一個矩陣,並且顯示所有測量值之間的關係。此外我們還能夠在散佈圖中增加一條擬合線來描述測量值之間的關係。

接著若資料太多,則系統將會提示我們將視覺化圖表轉換為可以更好處理大量資料的另一種類型,或是建議我們新增過濾器以利減少顯示值的數量,像是散佈圖將會轉換為熱圖,而散佈圖矩陣將會轉換為相關矩陣。

再來每個視覺化圖表皆會有一個資料門檻值,主要控制視覺化圖表能夠處理大量資料,當我們達到或超過該資料門檻值時,我們將會收到提示警告,若按下「是」,則還是會進行顯示資料在視覺化圖表中,但若按下「右」,則會不顯示資料在視覺化圖表中。其中包含大量唯一資料值的資料項目,我們稱為高基數資料,像是身份證編號、出生日期、電子郵件、… 等,反之若是有限數量的唯一資料值的資料項目,我們稱為低基數資料,請注意非不得已不建議修改資料門檻值,因為可能會因此降低效能。

視覺化圖表 測量值數量 基數
散佈圖 兩個 低基數
散佈圖矩陣 三個以上 低基數
熱圖 兩個 高基數
相關矩陣 三個以上 高基數

最後我們還能夠透過泡泡圖呈現三個測量值之間的關係,其中有兩個測量值主要是確定泡泡的位置,第三個測量值則是確定泡泡的大小。此外我們還能夠新增日時間值,以利建立隨著時間變化關系呈現的動畫效果。

(註:此篇所介紹的 SAS Visual Analytics 是 7.4 版本)

相關資源

⬅️ Go back