Leo Yeh's Blog

SAS 視覺分析 (9)

教學目標

初步了解 SAS Visual Analytics 7.4 網路圖、山齊熱流圖、直方圖和盒型圖的基本概念。

重點概念

首先在 SAS Visual Analytics 中視覺化圖表除了有自動化圖表、表格、交叉表、長條圖、折線圖、散佈圖和泡泡圖
七種視覺化圖表之外,我們還能夠當準備資料時應用用於以特定方式產生不同類型的視覺化圖表,以利進行後續的優化,其中包括網路圖、山齊熱流圖、直方圖、盒型圖、熱圖、地理地圖、樹狀圖、相關矩陣、文字雲、…等不同類型的視覺化圖表。

接著網路圖主要是透過一系列連結節點呈現類別值之間的關係為,其中主要有兩種不同類型的網路圖,分別為未分組和分層。所謂未分組的網路圖,其中包括來源值的資料項目和目標值的資料項目主要應用於建立網路圖連接節點的結構。所謂分層網路圖中,其中包層次結構或一組類別定義的資料項目,並且針對每個層級皆會建立不同值的節點,通常應用於分析不同區域的銷售與獲利之間的關係,以利進行市場行銷。

再來山齊熱流圖主要是進行路徑分析,將路徑資料從一個事件呈現至另一個事件中。山齊熱流圖中的路徑表示一系列不同的事件,其中每個路徑皆是由一個或多個事件所組成,所謂事件是指一系列與特定標識符號值相關聯的事件,通常應用於查看網站存取,每個路徑皆代表特定人員存取特定頁面的順序,以利分析使用者為達到特定目標而採取的路徑,其目標可能會是購買產品。此外若是目標的路徑非常復雜,那可能代表著著我們需要針對網站進行簡化。

最後我們還能夠透過統計的呈現方式更加了解資料,像是若我們想要了解資料項目在哪一個範圍內或分佈情況,則建議使用直方圖,以利在建立統計模型時,確認資料是否適當分佈。此外若我們想要了解有關資料變異數和極端值的資訊時,則建議使用盒型圖,以利獲取更多有關資料的描述性資訊,其中框的大小位置表示第二十五和第七十五百分位之間的值範圍,至於盒子中間的線主要顯示中間值,鑽石顯示平均值,此外我們還能夠選擇盒子外顯示極端值或異常值,所謂異常值是指在四分位距離中位數的一點五偏差之外的任何值,其中四分位的間距是第七十五百分位減第二十五百分位。

(註:此篇所介紹的 SAS Visual Analytics 是 7.4 版本)

相關資源

⬅️ Go back