Regression

SAS 證照考試 (15)

教學目標

初步了解如何免費學習與 SAS 9 邏輯斯模型建置設計師認證考試相關商業分析的概念與實作。

重點概念

首先 SAS 官方網站有提供免費 「Statistics I: Introduction to ANOVA, Regression, and Logistic Regression」 課程,主要有六個章節課程,分別為:

  1. 統計基本概念
  2. 變異數分析 (ANOVA)
  3. 迴歸模型
  4. 推論模型後續調整
  5. 類別資料分析
  6. 預測評分和模型建立

接著 SAS 官方網站也有針對 R 使用者提供免費 「SAS Programming for R Users」 課程,主要有三大部份,分別為:

  1. 基本概念
  2. 統計程序
  3. 矩陣運算

其中基本概念的重點在於資料處理與統計圖表,接著統計程序的重點在於資料探索和推論建模,最後矩陣運算重點在於矩陣應用和 SAS 與 R 整合應用。其中對於 SAS 9 邏輯斯模型建置設計師認證考試最相關的為第六章節,其內容為透過推論程序分析資料,主要學習重點為線性模型、廣義線性模型和混合模型。

總結我們將能夠透過 「Statistics I: Introduction to ANOVA, Regression, and Logistic Regression」 和 「Programming for R Users」 免費課程了解 SAS 9 邏輯斯模型建置設計師認證考試相關商業分析的概念與實作。

相關資源

SAS 證照考試 (14)

教學目標

初步了解 SAS 9 邏輯斯模型建置設計師認證考試的重點。

重點概念

最近剛考過 SAS 9 基礎程式設計師認證考試,接著預計開始準備 SAS 9 邏輯斯模型建置設計師認證考試,所以先整理出主要學習目標與方向,期望在六個月內考過,主要有五大類,其中包括二十二主要學習目標。

變異數分析 (ANOVA)

  • 驗證變異數分析的假設。
  • 使用 GLM 和 TTEST 程序分析母體平均之間的差異。
  • 進行變異數分析事後檢測以利評估成效。
  • 檢測和分析因素之間的交互作用。

線性迴歸

  • 使用 REG 和 GLM 程序建立多元線性迴歸模型。
  • 分析 REG、PLM 和 GLM 程序輸出結果,以利評估線性迴歸模型的選擇。
  • 使用 REG 或 GLMSELECT 程序執行模型的選擇。
  • 透過診斷和殘差分析確認給定之迴歸模型的有效性。

邏輯斯迴歸

  • 使用 LOGISTIC 程序進行邏輯迴歸。
  • 透過輸入選項優化模型成效。
  • 解釋 LOGISTIC 程序輸出的結果。
  • 使用 LOGISTIC 和 PLM 程序計算新的資料集。

準備預測模型成效的輸入資料

  • 當準備模型的輸入資料時識別潛在的挑戰。
  • 使用資料步驟中的迴圈、陣列、函數和條件敘述處理資料。
  • 改善分類輸入的預測成效。
  • 使用 CORR 程序查看非相關和非線性關聯的變數。
  • 使用 Empirical Logit 圖查看非線性的變數。

測量模型成效

  • 套用評估原則進行模型成效的測量。
  • 使用混淆矩陣評估分類器的成效。
  • 使用訓練和驗證資料進行模型的選擇和驗證。
  • 建立和解釋圖表,以利進行模型比較和選擇。
  • 建立有效的決策截止值,以利進行評分。

相關資源

資料分析 Data Science & Machine Learning (1)

基本介紹

教學目標

初步了解如何透過 edX 網站學習資料科學和機器學習。

重點概念

資料科學簡介

資料科學是有關使用資料進行決策進而採取行動。

處理過程主要包括五個步驟:

  1. 尋找資料 (資料選擇)
  2. 獲取資料 (前置處理)
  3. 清理和轉換資料 (資料轉換)
  4. 了解資料關係 (資料探勘)
  5. 透過資料傳遞價值 (解釋與評估)

資料科學理論

相關理論主要有五個應用:

  1. 機器學習 (Machine Learning)
  2. 迴歸 (Regression)
  3. 分類 (Classification)
  4. 分群 (Clustering)
  5. 推薦 (Recommendation)

實際操作應用

首先學習如何透過 Azure ML 進行資料處理,其中會搭配使用 R 、 Python 和 SQL ,包括資料獲取、資料取樣、資料量化,資料清理和資料轉換。

接著學習如何進行資料探勘和視覺化呈現,更重要透過 Azure ML 進行建模與評估,以及迴歸、分類和分群等實作操作。

最後則是完成推薦應用,以及如何透過建立好的模型進行預測分析,主要有兩種方式提供預測分析的網路服務:

  • Request-Response Service
    為了單一或多個資料列進行同步預測分析。
  • Batch Execution Service
    為了巨量整批資料進行非同步預測分析。

課程總共五堂課,每堂課有五題測驗 (單複選題,有兩次機會) 佔 50% ,以及期末考有二十題測驗 (單複選題,只有一次機會) 佔 50% ,合計總分達 70% ,題目中等不會太難基本上有看影片和重點整理就能夠通過,接著付 49 美元等待身份驗證之後,即可取得證書

相關資源