Leo Yeh's Blog

R 專業證照 (1)

教學目標

初步了解使用 Microsoft R 分析巨量資料證照,此篇為學習筆記。

重點概念

首先最近才剛取得 MCSA SQL 2016 Devolpment 專業證照,正在準備下一個考試科目時,發現只要再考取「使用 Microsoft R 分析巨量資料」專業證照的科目,就能夠同時取得 MCSE Data Management and Analytics 專業證照 (今年設定完成的目標之一),且最近有些折扣第一次考試折扣只要 93.75 美金,居然比edX 線上課程「Analyzing Big Data with Microsoft R」取得認證 99 美金還便宜,好像能夠投資一下自己取得 R 專業證照,更進一步複習 R 語言,雖然很久沒有撰寫 R 語言,都在撰寫 Python 語言。

接著使用 Microsoft R 分析巨量資料考試的主要有四個主題,分別為:

  1. 閱讀和探索巨量資料。
  2. 處理巨量資料。
  3. 使用 ScaleR 構建預測模型。
  4. 在不同的環境中使用 R Server。

再來不同的主題針對不同的任務,像是匯總資料、可視化資料、處理資料、管理資料、線性模型、… 等皆有許多函數,請參考下表:

函數名稱 功能說明
rxCrossTabs 計算交叉資料表統計資訊。
rxCube 計算交叉資料表統計資訊。
rxSummary 檢視及彙總資料資訊。
rxQuantile 計算近似分位數。
rxHistogram 繪製直方圖。
rxLinePlot 繪製折線圖。
rxDataStep 處理的資料區塊。
rxSort 針對資料進行排序。
rxMerge 針對重複資料進行合併並刪除。
rxLinMod 產生線性模型。
rxLogit 產生線性邏輯回歸模型。
rxGlm 產生廣義線性回歸模型。
rxTweedie 產生廣義線性回歸模型。
rxDTree 建立分類和回歸決策樹模型。
rxDForest 建立分類和回歸決策森林模型。
rxBTrees 建立隨機 Gradient Boosted 決策樹模型。
rxPredict 計算預測值。
rxExec 執行平行計算。
rxHadoopMR 建立使用 Hadoop 叢集的計算。
rxSpark 建立使用 Spark 叢集的計算。
rxLocalseq 循序建立本機計算內容的物件。
rxLocalParrallel 平行建立本機計算內容的物件。

最後每個函數要如何使用呢? 官方有提供準備考試的影片,感覺還不錯,可以花一個小時觀看,理應會加深印象有所幫助。

相關資源

⬅️ Go back