Leo Yeh's Blog

SAS 視覺分析 (5)

教學目標

初步了解 SAS Visual Analytics 7.4 視覺化操作的基本概念。

重點概念

首先當我們選擇資料來源之後,資料項目就會被載入至資料窗格中,資料窗格主要顯示資料來源中所有的資料項目列表,指定的每個資料項目類型的圖示,以及針對類別和日期資料項目不同值將會有頻率計數。其中資料項目主要是按照分類屬性進行分組,像是類別、度量和聚合度量的分組,並且按照字母順序進行排序,並且每資料項目皆會被分類至特定的資料類型,像是類別、測量值、地理位置或階層結構。

接著類別資料項目主要能夠應用於視覺化中針對測量值進行分組和匯總,像是字母、數字或日期與時間值,並且我們也可以計算新的類別資料項目,以及使用自定義群組進行建立,不同資料值的頻率將會顯示在類別資料項目的資料窗格中,其中測量資料項目主要是應用於計算或匯總的資料值,地理資料項目主要是對應至地理區域的資料值,階層結構資料項目主要是透過類別資料項目或地理資料項目有意義的結構導航路徑。

再來每個資料項目皆有屬性,在資料窗格下方的資料屬性表格主要顯示所選取的資料項目屬性,像是名稱、分類、格式、聚合和模型類型。我們能夠透過資料屬性表格編輯其中的屬性。此外為了實現視覺化中的視覺一致性,我們將會需要為類別資料項目的特定值分配顏色,主要是在資料窗格中的資料項目按右鍵選擇顏色然後針相關值進行顏色分配,通常若有分配顏色將有助於視覺化比較資料項目。

此外資料選項主要有四個區塊,分別為:

  1. 資料來源相關工作。
  2. 建立新的資料項目。
  3. 取得更多相關資訊。
  4. 改變資料窗格外觀,

其中取得更多相關資訊主要則有三個選項,分別為資料屬性、測量值詳細資訊和資料來源詳細資訊。所謂資料屬性視窗主要顯示資料來源中的所有資料項目屬性,並且我們能夠針對資料屬性進行多項修改,並且一次全部套用,像是分類、格式、聚合和模型類型。所謂測量值詳細資訊視窗主要顯示資料來源中所有測量值資料項目的描述性統計資訊,像是最小值、最大值、平均值和總和,並且我們更能夠個別查看特定測量值的資訊,像是標準偏差、不同計數、缺失值數量、偏值、…等,此外還會顯示直方圖顯示該測量值的資料分佈。所謂資料來源詳細資訊視窗主要顯示有關資料來源中的相關資訊,像是觀察值總數、傳回觀察值數和顯示欄位數,並且我們能夠建立或修改資料來源過濾器以利控制探索中傳回和使用的資料數。

最後我們更能夠建立自定義的類別,以特定的方式針對資料進行分組,並且透過表達式計算資料項目,透過聚合測量值聚合資料項目,以及透過衍生資料項目建立特殊類型的聚合測量值,像是總數的百分比、與上一期間的差異百分比、…等。此外我們也能夠複製資料項目,以利比較具有不同格式或預設聚合的測量值有何不同,請注意有些視覺化類型將會需要專門的資料項目,像是地理地圖將會需要地理資料項目,文字雲進行文字分析時將會需要文件集合和唯一資料列識別碼。

(註:此篇所介紹的 SAS Visual Analytics 是 7.4 版本)

相關資源

⬅️ Go back