通過數據預處理,整理出以下顯著特征:
1.交易中整體欺詐率在2%-3%。
2.交易詐騙大多由非持卡人發起,短時間內大量用卡,涉及金額較大。
3.120-150交易的商戶欺詐率達到50%。隨著交易筆數的增加,尤其是2000筆及以上交易的商戶,商戶欺詐的可能性降低,交易量小於150筆的商戶要進行監控。
4.在給定的數據中,仍有少數商家交易筆數達到幾千筆,欺詐交易筆數達到1000+,說明目前的欺詐檢測手段還不夠成熟,無法及時發現可疑商家。
5.從欺詐率來看,交易越少的商家欺詐率越高,越容易欺詐。
基於以上數據,top image智能分析平臺已經導出了幾千個維度的重要特征,按照壹定比例劃分訓練和驗證數據集,使用合適的機器學習模型,使模型的AUC(曲線下面積)達到0.75以上。然後對模型訓練的數據進行調整,在進入模型訓練前對樣本進行采樣調整,實現了當準確率達到90%以上時,可以覆蓋70%的欺詐交易。
經過模型訓練,最終選擇預測排名靠前的數據作為最終的預測列表,達到了非常高的命中率。頂級的圖像智能分析平臺涵蓋了數據傳輸、數據存儲、數據管理、數據ETL、AI建模等功能,可以大大降低企業使用人工智能技術的門檻。企業只需提供相關數據,即可實現數據ETL、建模等所有操作,通過離線調度、實時分析決策,加速數據的分析應用,加速企業對最新AI技術的應用。