Microsoft

資料分析 Business Intelligence (1)

基本介紹

教學目標

初步了解商業智慧的起源歷史、系統架構和最佳實務應用。

重點概念

早在 1971 年管理資訊系統 (Management Information System,MIS) 概念被提出,主要是提供靜態二維報表,所以不具有分析功能,接著在 1980 年主管資訊系統 (Executive Information Systems,EIS) 概念被提出,主要是提供動態多維報表,所以具有分析等功能,直到 1989 年 Gartner 顧問機構提出商業智慧 (Business Intelligence,BI) 的概念,之後才有許多應用於商業智慧系統架構的解決方案陸陸續續被提出。

然而在 2003 年美國資料倉儲研究院(The Data Warehousing Institute,TDWI)定義商業智慧系統架構主要分為兩大部份:

  1. 資料倉儲環境
    以技術團隊為主的資料倉儲環境,主要進行擷取、清理、塑模、轉換、傳輸和讀取等處理。

  2. 分析環境
    以企業使用者為主的分析環境,主要進行查詢、報表、分析、探歁、視覺化和採取行動等應用。

因此雖然各家廠商對於商業智慧的應用非常多元化,匯整如下表所示,皆能對應至上述的商業智慧系統架構。

廠商 應用
Microsoft 讓員工利用全新好用的分析工具,將現有企業資料、外部資料和非結構化海量資料完美結合,進而制定有見地的決策。
IBM 兼具查詢、產生報告、分析、儀表板、規劃、情境建模、即時監視與預測等功能的軟體。
SAS 能在適當時機,提供所需格式的資訊。透過整合企業中的巨量資料並自主分析,可以減少 IT 人員在回應要求上所花的時間,以及商業使用者尋找資訊上所花的時間。同時也能全面提供 SAS Analytics 功能的整合、健全及彈性特色,包括統計資料、預測分析、資料採礦、文字採礦、預測及最佳化,協助您制定更好、更快的決策。

最後根據 Gartner 在 2015 年針對商業智慧的評比中 Tableau 商業智慧軟體位居領先者的地位,這軟體主要的應用為只需幾次點擊,任何人均可透過它連接到資料,然後再點擊幾次,就能觀察並創建互動、可供分享的儀表板,它非常簡單,任何 Excel 使用者都能學會,同時又功能強大,足以應對最為複雜的分析問題,與別人分享發現結果只需幾秒鐘,為需要的人確實找到問題的答案,其實也就是商業智慧最佳實務應用。

相關資源

資料分析 Data Science & Machine Learning (1)

基本介紹

教學目標

初步了解如何透過 edX 網站學習資料科學和機器學習。

重點概念

資料科學簡介

資料科學是有關使用資料進行決策進而採取行動。

處理過程主要包括五個步驟:

  1. 尋找資料 (資料選擇)
  2. 獲取資料 (前置處理)
  3. 清理和轉換資料 (資料轉換)
  4. 了解資料關係 (資料探勘)
  5. 透過資料傳遞價值 (解釋與評估)

資料科學理論

相關理論主要有五個應用:

  1. 機器學習 (Machine Learning)
  2. 迴歸 (Regression)
  3. 分類 (Classification)
  4. 分群 (Clustering)
  5. 推薦 (Recommendation)

實際操作應用

首先學習如何透過 Azure ML 進行資料處理,其中會搭配使用 R 、 Python 和 SQL ,包括資料獲取、資料取樣、資料量化,資料清理和資料轉換。

接著學習如何進行資料探勘和視覺化呈現,更重要透過 Azure ML 進行建模與評估,以及迴歸、分類和分群等實作操作。

最後則是完成推薦應用,以及如何透過建立好的模型進行預測分析,主要有兩種方式提供預測分析的網路服務:

  • Request-Response Service
    為了單一或多個資料列進行同步預測分析。
  • Batch Execution Service
    為了巨量整批資料進行非同步預測分析。

課程總共五堂課,每堂課有五題測驗 (單複選題,有兩次機會) 佔 50% ,以及期末考有二十題測驗 (單複選題,只有一次機會) 佔 50% ,合計總分達 70% ,題目中等不會太難基本上有看影片和重點整理就能夠通過,接著付 49 美元等待身份驗證之後,即可取得證書

相關資源

SQL Server 整合服務 (1)

基本介紹

教學目標

初步了解 SQL Server 整合服務。

重點概念

首先 SSIS 全名為 SQL Server Integration Service 主要是個用於建立高效能的資料整合方案的平台,像是資料倉儲的擷取、轉換和載入 (ETL)、執行工作流程功能,像是讀取 TXT 檔案、執行 SQL 陳述式和
傳送電子郵件訊息等。

接著 SSIS 有完整架構處理搭配套件進行控制流程與管理,以及進行資料的移動與轉換,主要可以分成兩個主要的引擎定義:

  1. 執行引擎 (Run-time) :工作流程、執行除錯、記錄狀況、事件處理、資料庫連線和相關變數設定等等。
  2. 資料流程引擎 (Data Flow) :資料倉儲的擷取、轉換和載入 (ETL)。

以及 SSIS 在於流程設計主要提供三種機制:

  1. 容器 (Container):迴圈、循序、結構化流程控制…等。
  2. 工作 (Task):讀取 TXT 檔案、執行 SQL 陳述式、傳送電子郵件訊息…等。
  3. 優先順序條件約束 (Precedence Contraint):設定工作之間的執行順序與相依關係。

最後 SSIS 主要是透過 Visual Studio 整合開境進行操作、設計、除錯、安裝和部署等整合應用,相較於一般程式開發更有利於更改流程和處理錯誤。

相關資源

SQL Server 建立伺服器 (1)

基本介紹

教學目標

學習如何透過 Windows Azure 快速建立 SQL 伺服器 ,並且進行資料庫遠端連線管理。

重點概念

SQL Server 主要是微軟所開發的資料庫管理系統,更是一個功能強大的資料平台,提供企業進行資料分析和管理等應用。

新建伺服器

  1. 開啟 Windows Azure 雲端服務的管理入口,透過 Microsoft 帳號和密碼登入管理入口網站進行操作。
  2. 選擇左下方的「+ 新增」按鈕,選擇「計算」->「虛擬機器」->「從組件庫」,如圖一所示。
  3. 選擇最適合的資料庫伺服器映像版本,主要版本為企業版、商業智慧版和標準版。

圖一、在 Azure 雲端服務中新建 SQL 伺服器

設定伺服器

  1. 首先進行虛擬機器名稱、虛擬機器的層次大小,一開始建議建採用標準層次
  2. 基於安全性的考量,請輸入新的使用者名稱和密碼,接著根據需求設定 DNS 名稱、區域和存取端點等進階項目,如圖二所示。
  3. 確認設定項目滿足需求之後即可開始建立伺服器,等待伺服器啟動和佈建。

圖二、在 Azure 雲端服務中設定 SQL 伺服器

管理伺服器

  1. 選擇虛擬機器的「執行個體」,接著點選「連接」下載 RDP 檔案,開啟輸入使用者帳號和密碼進行遠端連線。
  2. 等待伺服器登入,再點選「開始功能表」開啟「SQL Server 2014 Management Studio」工具軟體。
  3. 最後進行登入,即可以透過整合式環境管理 SQL 伺服器,如圖三所示。

圖三、在 Azure 雲端服務中管理 SQL 伺服器

(註: 若是採用 Mac OS 則建議使用 「Microsoft Remote Desktop」進行遠端連線。)

相關資源

2013Q1 工作心得 (2)

AD RMS 基本介紹

要如何防止資料外洩呢? 解決方案皆是資料如何能不外洩,那若不小心外洩呢? 難道就無法保護了嗎? 微軟提出 Active Directory Rights Management Services (AD RMS) 的服務來確保機敏文件持續保護。

AD RMS 是提供使用業界安全性技術 (包含加密、憑證及驗證) 之管理與開發工具的伺服器角色,可以協助組織建立可靠的資訊保護解決方案。主要可以讓使用者與系統管理員透過資訊版權管理 (IRM) 原則指定文件、活頁簿及簡報的存取權限。這有助於防止未經授權的使用者列印、轉寄或複製機密資訊。使用 IRM 限制檔案的使用權限後,無論資訊位於何處,都會強制執行存取權與使用限制,因為檔案的使用權限是儲存在文件檔案本身。

且在實際應用時 AD RMS 支援的 IRM 解決方案有下列好處:

  1. 持續的使用原則,無論資訊移動、傳送或轉寄到何處,都會隨資訊存在。
  2. 保護機密資訊 (例如,財務報表、產品規格、客戶資料及機密電子郵件) 的額外隱私防護層,防止機密資訊經人為故意或意外地落入未授權者手中。
  3. 防止受限內容的獲授權收件者轉寄、複製、修改、列印、傳真或張貼內容以用於未授權之用途
  4. 防止利用 Microsoft Windows 中的 Print Screen 功能複製受限制的內容
  5. 支援檔案到期原則,在指定的一段時間過後就無法再檢視文件中的內容
  6. 在公司內強制執行控管內容之使用和散佈的公司原則

AD RMS 伺服器設定

參考資源

測試實驗室指南:部署 AD RMS 叢集

  • Windows Server Active Directory Rights Management Services 逐步指南

AD RMS 客戶端設定

Windows 8 + Office 2013

  1. 登入網域使用者 (請先確認該使用者在 Active Directory 伺服器的使用者與群組管理中有正確設定 Email ,不然 IRM 將無法正常使用)。
  2. 接著必須先透過網際網路選項設定,將從 AD RMS 伺服器取得憑證的 URL 設置在近端內部網路安全性區域。
  3. 開啟 Office 2013 的文書軟體 (Word) ,接著選擇「檔案」→「資訊」→「保護文件」→「限制存取」中選擇「連線至版權管理伺服器」。
  4. 為了要取得憑證,所以需要再次進行網域使用者,登入進行確認。
  5. 最後就能正常使用資訊版權管理 (IRM) 的功能。
  6. 但若不能正常執行,請檢查工作排程中「Microsft」→「Windows」→「Active Directory Rights Management Services Client」是否能正常執行,再根據工作排程項目之上次執行的結果進行故障排除囉!

Windows 7 + Office 2010

  1. Windows 7 預設不支援 ADRMS 使用2048 bits長度加密,所以必須先安裝 hotfix 。
  2. 登入網域使用者 (請先確認該使用者在 Active Directory 伺服器的使用者與群組管理中有正確設定 Email ,不然 IRM 將無法正常使用)。
  3. 接著必須先透過網際網路選項設定,將從 AD RMS 伺服器取得憑證的 URL 設置在近端內部網路安全性區域。
  4. 開啟 Office 2010 的文書軟體 (Word) ,接著選擇「檔案」→「資訊」→「保護文件」→「限制存取」中選擇「連線至版權管理伺服器」。
  5. 為了要取得憑證,所以需要再次進行網域使用者,登入進行確認。
  6. 最後就能正常使用資訊版權管理 (IRM) 的功能。
  7. 但若不能正常執行,請檢查工作排程中「Microsft」→「Windows」→「Active Directory Rights Management Services Client」是否能正常執行,再根據工作排程項目之上次執行的結果進行故障排除囉!