Leo Yeh's Blog

SAS 實驗設計 (3)

教學目標

初步了解 SAS 實驗設計中有關增量回應模型的基本概念。(此篇主要為準備考試的心得筆記)

重點概念

首先我們主要會遵循科學方法根據資料來獲得很重要的準確結果,資料科學實驗可以證明某些事情是否成功,並且找出影響最有效的方法,當我們能夠衡量所採取的行動的價值時,評估模型部署就能夠進行真實的測試,並且透過提升值選擇正確的模型,以及決定如何應用模型的結果,在資料庫行銷應用中,這需要透過控制組根據各種模型評分仔細追踪客戶的回應,像是將實際結果與預期進行比較,挑戰者比較冠軍的結果,找到了適合的模型。當我們在考慮設計實驗來評估結果時,需要確保隨機選擇任何測試組並獲得相同的處理過程,透過實驗使我們可以評估識別關鍵的許多因素互動,這些實驗基於資料能夠讓資料科學家仔細控制因素,以利模擬類似實驗室環境。此外資料科學實驗室可以透過許多實驗來豐富嘗試小規模的想法,成功的實驗可以導致企業營運方式的變化,請注意也有可能會產生意外的後果,像是產品推薦產生新銷售的計劃,將會造成銷售另一種產品之淨利潤損失的後果。

接著使用傳統預測模型的直接行銷活動針對所有可能購買的客戶,這種方法都會導致他們購買的商品會浪費金錢,然而使用訓練資料集 (實驗和控制) 的增量回應模型測量增量直接影響行銷的有效性,這些模型尋找可能購買或積極回應的客戶行銷活動,此時產生的收入主要稱為增量收入。因此我們應該選擇哪些客戶進行促銷提供最大化淨利潤,行銷建模工具專注於總體回應的機率最高的預測客戶,針對增量回應建模背後的想法是比較兩者之間回應率的差異,對照組 (未應用行銷活動) 和實驗組 (應用行銷活動),其衡量所採取行動的真實效果的指標,並且在沒有行動的情況下,附加值不會意識到,而最常見的增量應用回應建模是針對性行銷活動,增量回應模型用於識別誰需要進行促銷優惠,也就是僅在促銷時預測誰將購買產品,以利透過識別正確的目標來節省行銷成本,請注意雖然我們假設存在增量回應,但是卻不知道有哪些增量客戶。

再來 SAS Enterprise Miner 中的增量回應節點具有用於變數選擇的內建工具,這個工具基於衡量資訊價值的差異,在每個潛在輸入變數的對照組和實驗組之間,稱為淨資訊價值,淨資訊價值主要測量資訊值之間控制組和實驗組的差異,因此增量回應模型變數選擇的最佳測量為淨資訊價值,其中重要的是因為增量回應建模是依靠雙重計算,計算公式為增量效應 = 實驗結果 - 控制結果,而淨資訊價值方法為直觀、易於實施和靈活,修改證據權重的概念和資訊價值。至於選擇變數表顯示按淨資訊值排名的前 50% 的輸入變數,淨資訊價值評分代表與模型回應具有最強相關性的變數是每個輸入的實驗組和對照組之間資訊值的差異變數,因此淨資訊價值主要用於對輸入變數進行排名。此外在 SAS Enterprise Miner 中使用驗證資料集,則自動使用懲罰淨資訊價值,所謂懲罰淨資訊價值 = 淨資訊價值 - 處罰,處罰訓練之間淨證據權重的差異和驗證資料,以及選擇可提高模型穩定性的變數。然而增量回應節點基於逐步回歸模型,這代表著我們可以選擇一些標準自動變數選擇技術之間向前、向後和逐步回歸,預設情況下不執行變數選擇,也就是說使用所有候選輸入變數,在回歸模型中要為模型選擇變數,請使用以下模型選擇標準提供 AIC,SBC,驗證錯誤和交叉驗證錯誤,至於針對增量模型診斷,主要在於最高十分位數的高增量率,底部十分位數應該是低增量率,並且在所有十分位數,預測和預測之間的差異觀察到的增量反應率應該很小。

最後有關增量銷售分析預設設定是從模型中為每個客戶估算預期收入,我們可以透過指定每個觀察應使用一個固定收入進行設定,並在屬性收益中指定常量收入回應,屬性成指定行銷活動的成本為每個客戶聯繫,若增量收入大於直接成本,則表示客戶有利可圖,屬性成本的預設值為 0,而若沒有回應主要是因為未觀察目標選擇的偏差,此時我們將能夠透過 Heckman 的兩階段選擇模型進行修正。

相關資源

⬅️ Go back