SAS Visual Analytics

SAS 視覺分析 (15)

教學目標

初步了解 SAS Visual Analytics 7.4 報表過濾器的基本概念。

重點概念

首先在 SAS Visual Analytics 中針對詳細報表主要有三種類型的過濾器,分別為:

  1. 基本過濾:主要針對單一資料項目進行過濾。
  2. 進階過濾:主要針對多個資料項目進行過濾。
  3. 資料來源過濾:主要針對來源資料在其它過濾之前進行過濾,並且能夠針對多個資料項目。

此外過濾器除了有針對詳細報表的過濾器之外,還有針對聚合之後報表的過濾器,其主要針對聚合值的資料項目進行過濾,請注意僅能使用於測量值的資料項目。同時不論是哪一種過濾器其目的皆是縮少資料使用的範圍。

接著基本過濾或進階過濾主要有兩個過濾的範圍,分別為全域範圍和本地範圍,我們更能夠的複製本地過濾至不同視覺化圖表中,以及連結全域過濾至其它資料來源:

  1. 全域範圍:主要針對所有視覺化圖表,其位於右方窗格中過濾頁籤的上方。(Filter on data-source)
  2. 本地範圍:主要針對目前視覺化圖表,其位於右方窗格中過濾頁籤的下方。(Filter on Visualization)

此外在報表中主要有兩種互動方式,分別為過濾器和資料筆刷,所謂過濾器主要是限制從查詢傳回資料來源的資料,其主要是一個集合指定圖表主要會依據子集的規則或條件呈現資料,並且目標僅顯示我們需要查看以利進行分析的資料。所謂再來除了資料過濾之外我們還能夠透過資料筆刷允許我們選擇在視覺化圖表中的資料值,並且標示在其它圖表中的相關值,請注意我們不能從時間序列圖或詳細資訊的報表建立互動資料。

最後我們通常會使用串聯提示 (Cascading Prompts) 進行過濾器的互動,所謂串聯提示主要是單方向的一對多關係。以及我們通常會使用漸進式過濾進行資料筆刷的互動,所謂漸進式過濾主要是雙方向的一對多關係。

互動類型 操作方式 方向 關係
過濾 串聯提示 單方向 一對多關係
資料筆刷 串聯提示 單方向 多對多關係

(註:此篇所介紹的 SAS Visual Analytics 是 7.4 版本)

相關資源

SAS 視覺分析 (14)

教學目標

初步了解 SAS Visual Analytics 7.4 配置和匯出探索與報表的基本概念。

重點概念

首先當我們開始在 SAS Visual Analytics Explorer 中建立多個視覺化圖表時,若是有需要則能夠相關圖表一次顯示在工作空間中,以利我們輕鬆進行比較,並且工作空間主要提供了一個網格配置,以利我們輕鬆安排視覺化圖表的配置。

接著在 SAS Visual Analytics Explorer 中主要有兩種不同類型的評論可以增加到探索中,分別為視覺化評論主要是針對視覺化圖表進行評論,探索評論主要是針對整個探索進行評論,主要透過功能表查看和新增這些類型的評論。請注意若我們需要查看和添加評論,則需要有設定適當的角色。

再來在我們建立探索完成之後,我們將能夠與其它使用者分享探索的資訊,此時我們能夠將探索匯出 PDF 檔,並且將探索匯出為報表,或者透過電子郵件發送探索連結。請注意為非所有視覺化類型皆能夠進行匯出。此外作為報表匯出的探索能夠在 SAS Visual Analytics Designer 中打開和編輯,以及從 Visual Analytics Viewer 或 Mobile BI 應用程式中進行查看。此外接收電子郵件的人必須能夠登錄到 Visual Analytics,並且具備探索資料的適當功能,才能夠存取該探索。

最後我們還能夠匯出視覺化的 PNG 圖片檔,或者匯出應用於建立視覺化檔案的資料 CSV 資料檔。請注意在 SAS Visual Analytics Explorer 只會匯出聚合資料,並且無法進行視覺化互動,以及顯示在行動裝置上,而 SAS Visual Analytics Designer 則可以透過選項匯出所有列、所有欄、選擇的列或選擇的欄,但是無法像是探索產生自動圖,至於查看與匯出功能比較請參考以下資訊。

SAS Visual Analytics Explorer

探索

  1. 透過 SAS Visual Analytics Explorer 網路存取
  2. 匯出報表
  3. 匯出 PDF 檔案
  4. EMAIL 連結

視覺化

  1. 匯出圖表為 PNG 檔
  2. 匯出資料為 CSV 檔

SAS Visual Analytics Designer

報表

  1. 透過 SAS Visual Analytics Viewer 網路存取
  2. 行動裝置
  3. 列印至 PDF 檔案
  4. EMAIL 連結
  5. 發佈報表
  6. 區域化報表

視覺化

  1. 匯出圖表為 PNG 檔
  2. 匯出資料為 CSV 檔
  3. 儲存資料為 TSV 檔案
  4. 匯出資料為 Excel 檔案

(註:此篇所介紹的 SAS Visual Analytics 是 7.4 版本)

相關資源

SAS 視覺分析 (13)

教學目標

初步了解 SAS Visual Analytics 7.4 資料分析的基本概念。

重點概念

首先在 SAS Visual Analytics 中主要允許我們進行四種類型的資料分析,分別為:

  1. 相關性
  2. 擬合線
  3. 預測
  4. 文字分析

接著相關性分析主要是確定多個測量值之間的統計關係,或者這些測量值是如何一起移動,其中相關強度主要被描述為介於 -1 和 1 之間的數值,越接近 -1 和 1 的值表示強關係,而接近 0 的值代表弱關係,並且代表這些測量值根本不可能相關。以及若我們想要更進一步探索測量值之間的關係,則能夠透過擬合線繪製了測量值之間關係的模型,其中擬合線分析可以是線性,二次方,立方體或 PS 線,所謂線性擬合線會生成一條直線,二次擬合線會生成一條具有單條曲線的線,而三次擬合線會生成一條包含兩條曲線的線。此外我們還能夠查看詳細資訊窗格中的分析選項頁籤以獲取有關擬合線的其它資訊,其中包括模型類型,模型描述,R平方值以及生成擬合線的函數,請注意若是線性擬合線增加至視覺化圖表中,則就會自動顯示相關資訊。

再來預測則是會根據資料的歷史趨勢預測未來值,我們更能夠新增加可能有助於改進預測並執行針對未來值的情境分析或者針對目標值的目標搜尋潛在因素,以利進行預測。請注意若是發現潛在因素可以改善預測時,則其將用於預測模型中,反之若是潛在因素不能改善預測,則不會用於預測模型。至於情境分析主要能夠讓我們變更潛在因素的未來值,以利了解其如何影響預測,像是我們可以改變產品品質的未來值,查看其如何影響銷售預測,但是目標搜尋所追求的事情則相反,其主要是透過變更衡量指標的預測值, 以利追求目標,並且了解潛在因素需要如何改變以利達到最高的效益。此外文字分析主要確定經常出現在一起的單詞主題並分析其相關性,當然我們也能夠分析情緒,以利確定哪些評論是消極的,中立的或積極的。

最後 SAS Visual Statistics 則主要提供了一些進階分析的視覺化圖表,其能夠應用於 SAS Visual Analytics 中,其中包括增強型決策樹模型、線性回歸模型、邏輯回歸模型、廣義線性模型、分群模型、模型比較、…等進階分析的視覺化圖表。

(註:此篇所介紹的 SAS Visual Analytics 是 7.4 版本)

相關資源

SAS 視覺分析 (12)

教學目標

初步了解 SAS Visual Analytics 7.4 熱圖、相關矩陣、 樹狀圖和層次結構的基本概念。

重點概念

首先熱圖主要能夠呈現兩個類別資料項目或兩個測量值之間的關係,此外還能夠增加擬合線以利了解資料項目之間關係,適用於高基數的資料項目。至於相關矩陣主要能夠呈現多個測量值之間的統計相關性,所謂相關性主要是描述測量值之間的關係,其值介於 1 與 -1 之間,適用於高基數的資料項目,但請注意一個相關矩陣僅能夠呈現六十個資料項目之間的關係。

接著樹狀圖主要能夠將資料項目呈現為矩形切片,每個圖塊的大小可以代表測量值的加總或觀測值的數量,非常適合在緊湊的空間中顯示大量資訊。此外我們還能夠在樹狀圖中增加層次結構,以利我們能夠更深入查看有關選取圖塊的更多資訊。所謂層次結構主要能夠應用於許多不同的視覺化物件中,以利透過定義的資料啟用導航路徑的功能,像是樹狀圖。

再來層次結構通常基於父子關係,其中層次是從頂部最常用的資訊到最底層的最具體資訊,像是日期層次結構可能包含頂部年份一般資訊,然後繼續顯示季度具體資訊和月份具體資訊。

最後當交叉表的同一維中有多個類別數據項時,我們可以立即建立層次結構,而無需進行大量的預先設定,只需右鍵點選建立層次結構就能夠立即完成,並且將層次結構將添加到資料窗格中,以利其它可視化圖表進行使用,並自動應用層次結構到交叉表。若當我們在交叉表中使用層次結構時,您可以展開不同部分或向下鑽取以專注於特定級別進行比較分析。

(註:此篇所介紹的 SAS Visual Analytics 是 7.4 版本)

相關資源

SAS 視覺分析 (11)

教學目標

初步了解 SAS Visual Analytics 7.4 文字雲的基本概念。

重點概念

首先文字雲主要是呈現來自於字元資料項目的一組單詞,其有兩種不同的類型的文定雲,分別為:

  1. 文字分析
  2. 使用類別值

接著文字分析的文字雲主要是分析非結構化的內容,以利產生主題或經常出現在一起的單詞,其中每個單詞的大小代表與該主題的相關性。此外我們還能夠針對文字分析進行情緒分析,針對主題分析情緒,主要包含了愉快,中立和不滿意的情緒。請注意使用文字分析的文字需需要一個文件集合,其中包括要分析的單詞的類別資料項目。此外若要建立文件集合,則我們還會需要一個唯一的行標識符號或唯一標識每個值的資料項目。

再來使用類別值的文字雲主要是將類別中的每個值分析為單個內容字串,其中單詞的大小和顏色可以代表不同的測量值量,像是我們以夠分析不同類型的產品,其中更大的單詞代表那些購買的產品最多,同時透過顏色了解哪些產品帶來更高的價值。此外文件檔中的每個單詞皆會與停止列表進行比較,所謂停止列表主要是在文字分析的過程中被忽略的常用詞庫表,以利建立主題和確定相關性。

最後若我們要建立文字雲的視覺化圖表,建議先搭配第三方網站爬蟲程式以利取得更多相關資料,以利進行文字分析,或者找出相關類別主題。

(註:此篇所介紹的 SAS Visual Analytics 是 7.4 版本)

相關資源