Leo Yeh's Blog

SAS 詐欺分析 (1)

教學目標

初步了解如何透過 SAS 解決方案以詐欺分析技術偵測和調查詐欺行為的基本概念。

重點概念

首先詐欺行為通常始於身份盜用,並且透過合成身份進行詐欺已經使銀行損失高達數十億美元,並且追查不到不存在的詐欺犯,至於身份識別的詐欺方式主要能夠分為三種主要類型,分別為身份盜用、身份操作和合成身份,在這三種類型中綜合身份通常是最具挑戰性的識別,檢測和預防,因為合成身份是由各種來源偽造的組合而成,或者透過編輯或變更資料而建立用於詐欺的合成身份。當建立合成身份之後,就能夠透過多種方法進行詐欺,一開始需要先通過信用資料或記錄,主要常見有三個方法,分別為:

  1. 申請信貸 (Applying for credit):主要利用合成身份申請信用卡服務,此時商家、金融機構或其他實體提交合成身份資訊給徵信機構,如果徵信機構有該身份的檔案,則就會給債權人一個分數,但是如果沒有可比記錄,則徵信機構就會建立一個檔案,並且記錄查詢,不論初始請求是否已經批准或拒絕,但至少已經有合法的身份記錄,因此我們需要在申請信貸時針對未知的身份進行調查。
  2. 增加授權使用者 (Adding an authorized user):主要將新身份增加為授權使用者,使用者能夠使用現有的信用文件、另一個合成身份或真實身份證文件,此時可能會因勾結詐欺者,而利用其詐欺行為獲得回扣的人之信用身份,透過關聯新授權的使用者進行原始帳戶信用評分,然後拆分為一個單獨的貸方文件,因此我們需要透過授權使用者的關係調查出詐欺行為。
  3. 業務相互勾結關係 (Bringing a business entity in collusion):主要也稱為資料提供者,這方法很有可能涉及到有詐欺的商業組織,該組織主要會建立用於合成身份的假信用帳戶,然後將每月記錄提交給徵信機構,以利合成身份的帳戶持續付款,代表真實,值得信賴的人,所以詐欺者主要會利用信用服務建立可被信任之身份,因此我們需要透過網路關聯圖調查出已被信任之身份的詐欺行為。

接著我們要如何在在數位應用程式中進行多個層次驗證身份,以利判斷申請人身份是真實,而非合成身份,此時有關深度盡責調查主要有兩個方法,分別為:

  1. 身份驗證 (Identity verification):主要將申請人的詳細資訊與歷史信用記錄進行對應,並且透過不容易偽造的資訊確保申請人是所聲稱的真實身份,以利驗證身份並非用於詐欺行為。
  2. 裝置驗證 (Device verification):主要將裝置的詳細資訊根過去的經驗和資訊進行比較,以利判斷過去是由哪個身份使用過此裝置設備,以利驗證裝置並非用於詐欺行為。

除了進行多個層次驗證身份之外,我們更需要針對應用程式中的資料進行詐欺偵測和調查,此時企業組織就會需要收集來自於大量內部和外部資料的線索,而有效收集資料的方法主要有三個方法,分別為:

  1. 監視應用程式資料 (Monitor application data):主要監視應用程式中的資料,將能夠幫助發現合成身份,並且發現跨多個資的重複使用的身份,或者重複使用同一台裝置來創建和管理多個無關的身份。
  2. 分析網路 (Analyze the network):主要分析網路來理解申請人、設備、帳戶和應用程式的資料,像是一個帳戶是否有未授權的使用者?家庭成員?多個應用程式是否具有相同的貸方文件?透過網路連結視覺化的方式偵查和調查潛在的詐欺行為。
  3. 評估過去的經驗 (Assess past experience):主要評估申請人過去在應用程式上的經驗是什麼?是否包含相同的資料元素,像是相同的裝置設備?是否因原因或詐欺而關閉帳戶?負面資訊將能夠促進更進一步的盡職調查,以利了解申請人與帳號之間的關係,若是缺乏全面的身份資訊將很有可能會發生詐欺行為的風險。

再來針對詐欺行為進行分析,主要有四個分析方法,分別為:

  1. 描述性分析 (Descriptive analytics):主要從資料中了解現在正在發生的事情或過去發生了什麼事,產生了多少警報,每個警報需要花費幾個小時進行調查?這些關鍵績效指標對於企業營運非常重要。
  2. 診斷性分析 (Diagnostic analytics):主要解釋為什麼發生了某些事情,查找統計異常值,指出根本原因的相關性和分類為何?這種診斷見解的方式主要能夠改善計劃,以利管理詐欺風險。
  3. 預測性分析 (Predictive analytics):主要憑藉預測性分析的見解,以利管理詐欺風險的分析的團隊了解未來詐欺的趨勢和結果。
  4. 指示性分析 (Prescriptive analytics):主要透過優化研究確定最佳結果或方案,其目的主要是透過修改滿足業務限制條件的決策變數,以利滿足最大化或最小化某些目標。

此外與基於規則的系統不同,對於犯罪分子而言,基於規則的系統相當容易測試和規避,此時機器學習用於偵測詐欺行為,主要會從過去的經驗中學到的場景可用作無監督或有監督機器學習的輸入,演算法主要會從資料模式進行學習,與假設驅動的分析不同,機器學習將能夠發現我們不知道要尋找的內容,以利偵測出更多的詐欺行為,甚至是不遵循常見模式的罕見事件,因此機器學習透過自動化來適應人口中不斷變化的行為模式,以利自動建立適應行為模式的分析模型,至於正確的機器學習偵測方法取決於輸入變數、訓練模型和目標變數,主要有兩種機器學習的模型,分別為:

  1. 監督學習 (Supervised learning):模型主要會為演算法提供樣本輸入和相關輸出,其目標主要是設計一個對應輸入的通用規則輸出,我們主要訓練監督模型,以利進行詐欺檢測,其中主要使用詐欺和合法活動相關的記錄,以及了解新資料應用時如何預測詐欺的存在。
  2. 無監督學習 (Unsupervised learning):模型主要不會為演算法提供任何標籤,該演算法將會自行查找結構或資料中的隱藏模式,由於我們不知道哪些資料代表詐欺行為,所以期望模型建立描述函數結構的函數資料,將不符合標準的內容標記為異常,然後應用掌握全新的和看不見的資料。

但是若要使用機器學習演算法的分析模型應用於詐欺偵測,則需要大量資料,以利機器學習具有大量且良好的分類知識,以利從大量資料中查找模式和建立高度準確的模型,此時更多資料代表著更好的模式識別和更準確的詐欺檢測,雖然用最少的人工干預來定義模型,但是最終分析模型大部份像黑盒子,因此很難針對機器學習模型的結果進行解釋。

最後 SAS Detection and Investigation for Banking 解決方案將能夠解決身份盜用、身份操作和合成身份等問題,並且識別和減少應用程式中的詐欺行為,此解決方案主要針對銀行的偵測和調查詐欺行為提供一個單一端到端的整合分析平台,將能夠更好地進行詐欺偵測,並且在多個通道和產品上實現更高的營運效率。搭配獨特的混合分析方法使用多種進階分析和機器學習技術,像是自動業務規則、預測模型、文字探勘、資料庫搜尋、異常報告、網路連接分析、… 等,以利更準確地發現更多可疑活動,以及強大的詐欺分析引擎將內建人工智慧和機器學習技術與傳統的偵測方法整合使用時,將能夠以即時或批次的方式處理所有資料,而不僅僅是樣本資料,以利發現更多詐欺行為,並且減少誤報率。此外基於風險和價值的評分模型,在警報發送給調查人員之前,對警報進行準確的評分和優先級排序,以利在節省時間的情況下,研究人員可以以更高的效率處理更多案件,並專注於產生更高投資報酬率的高價值網路,更準確的評分也代表著更少的誤報,從而減少了客戶的不便,以利提高了客戶滿意度,更進一步還能夠透過識別由合成身份導致的銀行欺詐損失來提高收款流程的效率,因為這些損失幾乎沒有收回的機會。

相關資源

⬅️ Go back