Leo Yeh's Blog

SAS 視覺分析 (4)

教學目標

初步了解 SAS Visual Analytics 7.4 探索資料的基本概念。

重點概念

首先 SAS Visual Analytics Explorer 主要允許我們探索已經載入至 LASR 分析伺服器記憶體內的資料表,以及能夠讓我們管理資料屬性、更改聚合、計算新資料項目以及透過各種方式過濾資料,以利進行資料的處理。此外我們更能夠使用圖表和表格了解資料,以及透過決策樹、網路圖、山齊熱流圖和文字雲建立更進階的資料分析,同時查看有關分析的資訊和結果的描述,以及若我們有 SAS Visual Statistics 授權則能夠執行統計建模任務,像是建立線性和邏輯回歸,或者進行分群分析。

接著在 SAS Visual Analytics Explorer 介面的中有許多的元件,分別為:

  1. 應用程式列
  2. 功能表列
  3. 工具列
  4. 資料窗格
  5. 資料屬性表格
  6. 工作區
  7. 底部窗格
  8. 右方窗格

其中我們能夠透過應用程式列返回首頁或輕鬆切換項目。透過功能表列存取常見的任務和線上協助,當我們建立探索時非常的方便。透過工作列探索各種的視覺化的圖標,總共 22 個,請注意,工具列上的每一種視覺化類型皆有一個單獨的工具。透過資料窗格列出所選資料來源中的所有資料項目,我們能夠使用資料窗格管理視覺化中使用的資料,一旦在資料窗格中選擇特定資料項目,資料屬性列表就會顯示該資料項目的屬性,像是名稱、分類、格式和聚合,當然我們還能夠使用資料屬性表格來編輯資料項目的屬性。透過工作區在網格配置中顯示所有活動的視覺化,這將會是我們建立和使用視覺化的地方。透過底部窗格列出所有不活動或最小化的視覺化物件。透過右方窗格中的選項指定視覺化的相關資訊,像是屬性、過濾器和角色。

再來探索主要是針對一個中繼資料物件存取一個或多個記憶體中的資料表,其中包括一個或多個資料視覺化。因此,我們能夠將探索視為一個容器,該容器主要包括資料來源的資訊,以及針對新資料項目的現有或新增的修改每個視覺化和任何定義設定。此外我們主要會透過視覺化建立應用於探索資料的圖表,像是我們能夠建立地理圖表顯示探地區或交雨資料表的品質與銷售情況,以利顯示每個產品線和季度的繼產資訊,當然我們還能夠建立長條圖衡量每個產品線的目標銷售金額是否達標。

最後探索資料的第一步驟就是存取資料,若是我們在不參考現有探索的情況下存取 SAS Visual Analytics Explorer 時將會出現視窗提示我們開啟現有的探索或選擇一個資料來源建立新的探索。若我們選擇建立新的探索時,將會出現一個顯示可用資料來源的新視窗,其中會列出每個來自於 LASR 伺服器或記憶體資料表的資料來源,請注意在探索任何資料之前皆需要載入至 LASR 伺服器中。此外若我們具有適當的角色功能,我譬也能夠匯入本機檔案、伺服器資料、 Hadoop 資料或者社群網站資料,其中匯入本地資料主要是儲存至本機的檔案,其有三種不同的類型,分別為 Microsoft Excel 檔案、本機檔案或 SAS 資料集,並且我針對每種類型的本機檔案需要指定各種選項,並且在執行導入之前預覽結果,以及資料將會被讀取和匯入至 LASR 分析伺服器中才能夠開始進行探索。

(註:此篇所介紹的 SAS Visual Analytics 是 7.4 版本)

相關資源

⬅️ Go back