資料分析 Methodology (1)

教學目標

初步了解針對不同的商業問題,需要使用哪種方法進行分析。

重點概念

首先解決問題的框架雖然能夠有系統的解決商業問題,但是我們且體還是不知道要用哪種方法進行解決,此時我們需要決定該用哪一種分析方法解決商業問題。

接著我們第一步就是要確定商業問題是否需要預測一個數值,若我們對於業務和資料有深入的了解將能夠回答此問題,此時我們可以將問題先分為預測分析和非預測分析。一般來說,很多的問題透過非預測分析就已經足夠,非預測分析主要可以分為四種類型,分別為:

  1. 描述:主要提供資料樣本簡單概述。
  2. 聚合:主要計算跟群組或維度資料。
  3. 區隔:主要將資料進行分組的過程。
  4. 地理:主要基於地理位置推導結論。

再來若我們要進行預測分析,則第一步就是要調查已經存在的資訊是否足夠解決問題,此時若不足夠則代表資料不足,但是若足夠則代表資料豐富。當資料不足時,我們就會需要設置一個實驗協助我們得到想要的資料,此時若給特定商業情境的實驗通常是指 A/B 測試。當資料足夠時,我們就會需要了解預測結果是數值或非數值的結果,若是數值結果那就會採用回歸模型進行預測分析,反之,若是非數值結果那就會採用分類模型進行預測分析。

最後若我們已經具資料已經足夠時,要如何決定適當的分析模型,並且進行評估呢?例如:一家銀行突然有一批新用戶申請貸款,此時我們想預測每個貸款申請人是否可能拖欠款,以利確認哪些貸款申請人值得信任,此時就會採用二元分類模型進行預測與成效評估。

總結當我們進行資料分析時,建議根據商業問題具體的情境,選擇最適當的分析方法。

相關資源