Leo Yeh's Blog

SAS 實驗設計 (1)

教學目標

初步了解 SAS 實驗設計的基本概念。(此篇主要為準備考試的心得筆記)

重點概念

首先統計模型可以回答問題,正如在擬合模型在設計實驗時理解主題領域非常重要,資料科學家可以回答很多問題,主要包括:

  1. 我們是否擁有執行分析的資料,並且回答這個問題?
  2. 我們是否考慮了控制中,並且無法控制變數的類型?

而我們的問題是否代表著需要進行比較?或者我們有做過實驗嗎?所謂實驗主要是了解某項事情進行一系列的科學測試行動和仔細觀察其影響,以作為測試完成的事情,並且了解我們要做的事情有多好或有多糟糕。此外實驗與觀察資料不同,我們可以從中得出的結論類型。

接著相關並不代表著因果關係,透過實驗使我們能夠識別因果驅動因素,與預測建模相比,實驗的優勢是回答了因果關係的問題。我們更聰明的工作和進行實驗,為了得出關於一個變數是否影響另一個變數的因果推斷,有必要使用一個實驗。此外我們還需要考慮下下問題,分別為:

  1. 我們想回答的問題是什麼?
  2. 我們想要答案之母體是多少?
  3. 我們想要比較什麼類型的東西是可以控制嗎?
  4. 我們如何衡量結果?
  5. 我們無法控制影響的衡量結果有哪些?

請注意在分析結果實驗時,若使用滋擾變數進行建模將會有可能增加誤差變異,而大量樣本、隨機分配樣本和因素之間的相互作用通常會減少誤差變異。

再來我們會啟用小規模部署實驗,實驗主要是在受控制的條件下進行的系統程序或控制以發現未知的效果影響,並且在分析業務流程時,實驗是通常用於評估哪些輸入對輸出有重大影響,以及這些輸入應該是為了達到預期的效果。我們能夠透過許多不同的方式設計實驗來收集此資訊,應該對許多業務決策進行事實檢查評估是否有預期的後果,小規模測試許多可能的情境使我們能夠比較哪個是最有利可圖,成功的小規模實驗將使其變得更容易向利益相關者傳達價值,並且實驗回答因果關係的問題。

最後實驗設計涉及多個屬性,我們可以透過推論母體、母體實驗單位和感興趣回應變數定義來設置實驗的屬性,此外我們還必須做到確定實驗中將使用哪些因子和因子水平,指定對將要做出的決策有意義的效果的大小以及指定檢測有意義效果的能力。至於我們必須決定使用哪種方法 (因子和水平的組合),每次所需的複製次數,重要的平衡和正交性實驗設計的整體效率以及我們經常要在資源限制內獲得最多資訊妥協選擇。

相關資源

⬅️ Go back