在現金貸業務中,主要面臨兩種風險:信用風險和欺詐風險.
信用風險主要是對借款人還款能力和還款意願進行評估,從而決定放款金額的大小(也可以決定放款利率的大小),
而反欺詐直接面臨的是欺詐用戶,這種用戶沒有其他目的,就是為了騙錢不還(包括開始想還,後面不還).
如果直接用規則去做反欺詐,有三種局限性:
1.策略比較強,命中直接拒絕,無法考慮策略之間深層次的關系;
2.無法給出用戶的欺詐風險有多大;
3.沒有考慮用戶從信用風險向欺詐風險的轉移.
反欺詐模型就是為了通過機器學習來完善現在僅僅靠規則來拒人的不足.
二、實施方案:
欺詐有兩種,壹種是直接欺詐,壹種是信用風險向欺詐風險轉移(用戶原本有微弱的還款意願,隨著時間的推移,微弱的還款意願沒了
,還有壹種是有還款意願沒有還款能力,所以在選擇特征和標簽的時候圍繞著這幾個方向去考慮
反欺詐評分卡種類:
壹:小額度
貸前(主要是以貸前能拿到特征訓練)
貸中(主要加入了在我們平臺上生命周期產生的有欺詐嫌疑的數據)
二:大額度
貸前(主要是以貸前能拿到特征訓練)
貸中(主要加入了在我們平臺上生命周期產生的有欺詐嫌疑的數據)
1. 反欺詐評分給每壹個用戶設置350-970的分數
a). 低於300分直接認為欺詐用戶,線上直接拒絕
b). 500分於700分之間有欺詐嫌疑但是我們不確定是不是完全欺詐,這部分用戶小部分會進入人工審核,大部分會再進入其他反欺詐模型
c). 700分用戶直接讓入,之後進其他策略和信用模型
2. 特征選擇分為以下幾個部分:
壹:團夥相關欺詐特征
a). 結合設備相關特征(比如設備關聯多少個手機號,設備關聯多少個身份證,手機關聯多少個設備等等)
b). ip行為相關(ip是否是異常ip,登陸ip數)
c). 團夥相關(比如團夥中有多少個預期,壹度聯系人裏面有多少個預期,二度聯系人有多少預期,壹度聯系人裏面黑名單數量,二度聯系人黑名單數,團夥中是否命中中介)
二:個人相關欺詐特征
1. 詳單數據(比如0點通話次數,壹個月和直接聯系人通話次數,等等)
2. 決策流裏面反欺詐策略中的風險因子(比如命中法院執行名單,命中三方黑名單,等等)
3. 三方欺詐數據(比如同盾風險分等)
4. 行為數據(這部分只適用於貸中反欺詐,用戶預期次數等等)
5.異常檢測產生的數據
3. Label 選擇:
a). 貸後人工標記用戶
b). 貸前人工標記用戶
c). 策略因反欺詐直接拒絕用戶
d). 分期產品首單逾期大於14天( 首單,首期 )
e). 分期和單期產品逾期最大天數30天
f). 黑名單用戶
4. 數據融合
如果數據不好融合的情況下,考慮把這種不好融合的數據做成子模型,把子模型分數帶入到主模型,作為主模型特征