資料科學 Cognitive Class (1)

教學目標

初步了解決 Cognitive Class 網站所提供一系列免費的資料科學相關課程。

重點概念

首先 Cognitive Class 網站主要提供一系列免費的資料科學相關課程,同時每上完任何一門課程皆可以獲得結業証書,並且由 IBM 頒發不同等級的徽章 (Badge),請注意徽章必須滿足多項課程的要求才能夠取得不同等級的徽章。

接著建議先取得下述資料科學相關的徽章,我個人在去年和今年陸續完成下述資料科學相關的徽章,真心推薦初學者學習,分別為:

  1. 大數據基礎概念:Big Data Foundations - Level 2
  2. Hadoop 基礎概念:Hadoop Foundations - Level 2
  3. 資料科學基礎概念:Data Science Foundations - Level 2
  4. 資料科學商業應用:Data Science for Business - Level 2

再來每個徽章皆有許多對應的課程需要完成,以上述四個個徽章為例我們將簡單說明相關的課程重點。

大數據基礎概念

所謂 Big Data Foundations - Level 2 徽章的課程重點在於了解 Big Data、Hadoop 和 Spark 的基礎概念。

Hadoop 基礎概念

所謂 Hadoop Foundations - Level 2 徽章的課程重點在於 MapReduce 和 YARN 的基礎概念、如何將資料轉移至 Hadoop 中以及如何透過 Hive 存取 Hadoop 上的資料。

資料科學基礎概念

所謂 Data Science Foundations - Level 2 徽章的課程重點在於資料科學方法論、R 語言基本介紹以及利用開放源碼工具進行資料科學動手實作。

資料科學商業應用

所謂 Data Science for Business - Level 2 徽章的課程重點在於資料隱私、數位分析和預測建模的基礎概念。

最後在上述課程內容中提到執行資料科學的方法主要有五個階段,分別為:

  1. 從問題到方法
  2. 從需求到收集
  3. 從理解到預測
  4. 從模型到評估
  5. 從部署到反饋

至於資料科學家若要執行資料科學的方法,並且協同合作,則建議使用 Jupyter Notebooks (前身為 iPython Notebooks) 免費工作平台執行 Python 或 R 的程式語言。

總結 Cognitive Class 網站提供許多資料科學相關的免費系列課程之外,更有提供深度學習課程,完成全部課程專屬的 IBM 深度學習徽章,若是上述課程太過簡單,則建議可以花些時間學習深度學習相關課程。

相關資源