Leo Yeh's Blog

SAS 實驗設計 (2)

教學目標

初步了解 SAS 實驗設計的基本概念。(此篇主要為準備考試的心得筆記)

重點概念

首先實驗設計涉及十個屬性,分別為:

  1. 回應 (Response):回應主要是依變數或目標變數在預測建模中這被稱為目標,選擇適當的回應用於特定目的進行實驗,在分析實驗中收集的資料時,可以使用多個回應變數。
  2. 因子 (Factor):因子主要是一個潛在的獨立變數,回應測量變化來源,因子是可由我們控制的特定的屬性之一。
  3. 因子水平 (Factor Level):因子水平主要是因子的特定值或設定,因為一個因素在研究者的控制之下,所以可以選擇和使用在實驗中不同的值或水平。
  4. 影響 (Effect):效果主要是測量關係因子水平和回應指標之間的變化,其主要是因子不同水平回應值的差異。
  5. 權力 (Power):權力主要是我們檢測效果的機率。
  6. 實驗單位 (Experimental Unit):實驗單位主要是最小可以應用實驗的單位。
  7. 實驗 (Treatment):實驗主要是所有因素的組合,每個因素在一個層面和典型的行銷背景下,一個實驗方法構成一個獨特的優惠。
  8. 正交 (Orthogonality):正交主要是至少有代數解釋、幾何解釋和統計解釋三種方式來考慮重要性
  9. 複本 (Replication):複本主要是發生於當多個實驗單位接受同樣的實驗,因此實驗設計需要針對個別因素進行複本。
  10. 平衡 (Balance):平衡主要確保了因子實驗的正交性,雖然有可能不平衡的設計是正交的,所有平衡因子設計都是正交的。

其中實驗是所有因素的組合,每個因素在一個層面,若我們會有三個因素 (Factors),每個因素分為兩個層次 (Levels),則會有八種可能的實驗方法 (Treatments)。適當的實驗單元取決於實驗的目的,實驗通常針對個人或家庭,網站實驗單位,實驗設計通常是存取,因為識別回訪者的問題使其變得困難或不可能識別個人。儘管考慮什麼是有幫助的,為了獲得足夠的資訊,應該為我們的實驗提供適當數量的觀察結果檢測因素的影響,諮詢統計專家可以幫助進行這些計算。

接著通常與實驗設計相關的另外兩個術語是區塊 (Blocks) 和協同變異 (Covariates),所謂區塊是實驗單元組,在某種程度上通常是同質的,其代表干擾變異,像是地區、學校和公司,所謂協同變異是實驗單位的特徵,被測量但是不能分配或強加的在他們之上,其代表干擾變異,像是年齡,性別和收入。此外有時會處理區塊和協同變異可以互換,並且區別並不總是很清楚,區塊通常是分類的,可以被認為是作為一組實驗單位,區塊通常是在模型中用作隨機效應,而協同變異可以是連續的或分類的個別實驗單位的特徵,協同變異是被測量實驗單位的特徵,但不能分配或強加的在他們之上,阻止限制隨機化,協同變異可以是連續的或分類的固定預測變數。

再來根據觀點和技術,效率對不同的人代表著不同的知識,在這種情況下,效率由與成本相關的大量資訊代表實驗,但是資訊量可以有不同的含義和成本實驗可能意味著不同的事情,無論一個人的觀點如何,效率越高越好,若分子增加或分母減少,或兩者都有效,則可以提高效率。像是市場行銷執行副總裁可能會考慮測試項目的數量和總的財務成本,統計學家可能會將資訊量量化為誤差範圍估計的影響,較小的誤差範圍意味著更多的資訊,財務成本的主要驅動力是總樣本量,效率被定義為按總樣本量測試的項目數量。

最後資料科學家使用不同類型的實驗回答問題,其中最常見的實驗類型就是 A / B 測試,所謂 A / B 測試,或稱冠軍挑戰者測試其是非常簡單的設計,常用於網站設計和電子商務,在這些設計中有許多不同的因素,隨機分配為實驗中進行不同特徵的因子設計的效果比較許多替代方案,直到挑選出最適合的冠軍方案,與任何設計一樣 A/B 測試也有缺點,其最關心的是我們不能確定冠軍的哪個特徵 (與挑戰者或挑戰者相比),使其更受歡迎,這使得很難將發現推廣到其他設計專案,但是在快速市場反應電子商務的測試環境,能夠針對每一個新問題都不需要更複雜的實驗設計而獲得經驗客戶偏好的速度。

相關資源

⬅️ Go back