CN112001785A - 一种基于图像识别的网贷欺诈识别方法及系统 - Google Patents
一种基于图像识别的网贷欺诈识别方法及系统 Download PDFInfo
- Publication number
- CN112001785A CN112001785A CN202010704049.0A CN202010704049A CN112001785A CN 112001785 A CN112001785 A CN 112001785A CN 202010704049 A CN202010704049 A CN 202010704049A CN 112001785 A CN112001785 A CN 112001785A
- Authority
- CN
- China
- Prior art keywords
- fraud
- image
- threshold
- applicant
- credit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000013135 deep learning Methods 0.000 claims abstract description 17
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 13
- 238000012549 training Methods 0.000 claims abstract description 13
- 238000000605 extraction Methods 0.000 claims abstract description 11
- 238000011176 pooling Methods 0.000 claims description 8
- 230000004913 activation Effects 0.000 claims description 7
- 230000006870 function Effects 0.000 claims description 6
- 238000013528 artificial neural network Methods 0.000 claims description 5
- 239000000203 mixture Substances 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 4
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims description 3
- 230000004044 response Effects 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 238000001727 in vivo Methods 0.000 claims description 2
- 230000008569 process Effects 0.000 claims 2
- 238000012795 verification Methods 0.000 description 4
- 241001464837 Viridiplantae Species 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000013475 authorization Methods 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007596 consolidation process Methods 0.000 description 1
- 238000005260 corrosion Methods 0.000 description 1
- 230000007797 corrosion Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 235000021384 green leafy vegetables Nutrition 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
- G06T5/30—Erosion or dilatation, e.g. thinning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/60—Analysis of geometric attributes
- G06T7/62—Analysis of geometric attributes of area, perimeter, diameter or volume
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
- G06T2207/30201—Face
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Accounting & Taxation (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Finance (AREA)
- Technology Law (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Geometry (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种基于图像识别的网贷欺诈识别方法及系统,方法包括:数据获取步骤:读取与网贷相关的图像;样本与特征提取步骤:将黑名单客户提取为样本,通过深度学习提取其与网贷相关的图像特征,作为欺诈参考特征;基于深度学习的欺诈预测步骤:利用提取的样本,基于欺诈参考特征,运用卷积神经网络算法训练得到预测模型,利用训练得到的预测模型预测得到申请人实时的欺诈可能概率。
Description
技术领域
本发明涉及网络领域、数据处理领域以及金融领域,具体涉及一种基于图像识别的网贷欺诈识别方法及系统。
背景技术
网贷是指通过网络平台申请的贷款,包括个体通过互联网平台向机构、组织借款,也包括个人和个人之间通过互联网平台实现的借贷。而随着网贷门槛的降低,越来越多的用户采用网贷来解决短期资金问题。随之而来的是,网贷欺诈也越来越普遍。
目前,还没有很高效的自动识别网贷欺诈的方法。尤其是,反欺诈数据源基本上都是文字和数据,而关于图像类数据的反欺诈数据源基本未被用于反欺诈。
发明内容
本发明所要解决的技术问题是针对现有技术中存在上述缺陷,提供一种能够弥补反欺诈数据源关于图像类数据的空白,提供新的角度来识别欺诈的高效网贷欺诈识别方法。
根据本发明,提供了一种基于图像识别的网贷欺诈识别方法,包括:
数据获取步骤:读取与网贷相关的图像;
样本与特征提取步骤:将黑名单客户提取为样本,通过深度学习提取其与网贷相关的图像的图像特征,作为欺诈参考特征;
基于深度学习的欺诈预测步骤:利用提取的样本,基于欺诈参考特征,运用卷积神经网络算法训练得到预测模型,利用训练得到的模型预测申请人实时的欺诈可能概率。
优选地,数据获取步骤包括:利用客户端通过嵌入在手机的应用程序中的软件开发工具包,将手机屏幕画面的图像读取为与网贷相关的图像。
优选地,黑名单客户包括:包含视频攻击的申请人和/或具有预定背景资料类别的申请人和/或其与网贷相关的图像存在认为篡改的申请人。
优选地,在基于深度学习的欺诈预测步骤中,设置第一阈值和第二阈值,其中第一阈值小于第二阈值,对于欺诈可能概率小于第一阈值的判断为低风险,处理为安全申请人,实施授信;对于欺诈可能概率大于第二阈值的申请人,判断为高风险申请人,拒绝授信。
优选地,第一阈值和第二阈值分别为大于等于0.5和小于等于0.8。
优选地,基于图像识别的网贷欺诈识别方法还包括:根据业务经验的欺诈特征识别步骤,其中包括根据已经识别出的网贷欺诈,提取这些网贷欺诈的与网贷相关的图像并利用OpenCV实现图像识别以提取图像特征作为参考欺诈特征;随后对于概率处于第一阈值和第二阈值之间的申请人,基于参考欺诈特征分析申请人的与网贷相关的图像。
优选地,在根据业务经验的欺诈特征识别步骤,提取概率处于第一阈值和第二阈值之间的申请人的与网贷相关的图像中的参考欺诈特征,计算提取出的每个参考欺诈特征的IV值和KS值,设置第一IV阈值和第二IV阈值、KS阈值,舍弃IV值小于第一IV阈值的特征变量;将对于IV值大于第二IV阈值的特征变量加入决策规则集。
优选地,其中第一IV阈值和第二IV阈值为大于等于0.02并且小于等于0.1,而KS阈值小于0.06。
根据本发明,还提供了一种基于图像识别的网贷欺诈识别系统,包括:
数据获取模块,用于截取用户使用智能设备进行活体验证时的正面识别屏幕,以图片格式传输给图像识别模块,用于图像分析;
样本与特征提取模块,用于将黑名单及零还款的用户提取为坏样本,正常还款客户作为正向用户,通过深度学习训练模型提取其与网贷相关的图像特征,作为欺诈参考特征。
优选地,样本与特征提取模块执行下述处理:
基于深度学习的欺诈预测处理:利用提取的样本,基于欺诈参考特征,运用卷积神经网络算法训练得到预测模型,利用训练得到的预测模型预测得到申请人实时的欺诈可能概率;其中利用卷积运算自定义神经网络结构,进行图像模型训练,包括:
在卷积层进行仿射变换,将图像X作为输入层,设定卷积核为Y,则:
其中:m表示图像的像素行,h表示图像的像素列,S为输入层X的卷积结果;
通过一个非线性的激活函数,来承接卷积层并行计算多个卷积得到的线性激活响应;
在池化层降采样,选择最大池化方法来提高网络计算效率。
优选地,样本与特征提取模块执行下述处理:
计算申请人的与网贷相关的图像中人像面积占比;其中,运用OpenCV中的人脸级联分类器检测人脸,识别出人脸后画边框标记,计算标记的人脸框面积与整张图像面积之比:R=S[人]/S[图],其中S[人]表示图像中人像框的面积,S[图]表示申请人图像的面积。
其中,轮廓线包含n个顶点,Ai表示第i个顶点对应的像素中心点的面积;
计算申请人的与网贷相关的图像中色彩部分面积占比;其中,根据上诉识别的人像轮廓,截取人像下边框以上部分,调用OpenCV接口中的高斯混合模型,提取人像前景,加以剔除;计算背景颜色种类及各色彩所占比例。
本发明提供了一种能够弥补反欺诈数据源关于图像类数据的空白,提供新的角度来识别欺诈的高效网贷欺诈识别方法和系统。
附图说明
结合附图,并通过参考下面的详细描述,将会更容易地对本发明有更完整的理解并且更容易地理解其伴随的优点和特征,其中:
图1示意性地示出了根据本发明优选实施例的基于图像识别的网贷欺诈识别方法的流程图。
需要说明的是,附图用于说明本发明,而非限制本发明。注意,表示结构的附图可能并非按比例绘制。并且,附图中,相同或者类似的元件标有相同或者类似的标号。
具体实施方式
为了使本发明的内容更加清楚和易懂,下面结合具体实施例和附图对本发明的内容进行详细描述。
<方法示例>
图1示意性地示出了根据本发明优选实施例的基于图像识别的网贷欺诈识别方法的流程图。
如图1所示,根据本发明优选实施例的基于图像识别的网贷欺诈识别方法包括:
数据获取步骤:读取与网贷相关的图像;
具体地,例如,数据获取步骤包括:利用客户端通过嵌入在手机的应用程序中的软件开发工具包,(例如在申请人授权的情况下)在申请人进行活体校验时截图手机屏幕画面,将手机屏幕画面的图像读取为与网贷相关的图像。
样本与特征提取步骤:将黑名单客户提取为样本,通过深度学习提取其与网贷相关的图像的图像特征,作为欺诈参考特征;
具体地,例如,黑名单客户包括:包含视频攻击的申请人和/或具有预定背景资料类别的申请人和/或其与网贷相关的图像存在认为篡改(例如经过图像PS)的申请人等。
基于深度学习的欺诈预测步骤:利用提取的样本,基于欺诈参考特征,运用卷积神经网络算法训练得到预测模型,利用训练得到的预测模型预测得到申请人实时的欺诈可能概率;
卷积神经网络(ConvolutionalNeuralNetwork,CNN)作为图像识别领域的核心算法之一,多次成为ImageNet大规模视觉识别竞赛的优胜算法,卷积神经网络通过卷积来模拟特征区分,并且通过卷积的权值共享及池化,来降低网络参数的数量级,最后通过传统神经网络完成分类等任务;利用训练后的模型预测得到单个申请人实时可能的欺诈概率;通过设置阈值,将申请人分为高风险和低风险,例如设置0.5<=阈值<=0.8;具体地,例如设置两个阈值(第一阈值Threshold1和第二阈值Threshold2,其中第一阈值Threshold1小于第二阈值Threshold2),对于欺诈可能概率小于第一阈值Threshold1的判断为低风险,处理为安全申请人,实施授信;对于欺诈可能概率大于第二阈值Threshold2的申请人,判断为高风险申请人,拒绝授信;对于欺诈可能概率处于第一阈值Threshold1和第二阈值Threshold2之间的申请人,则需结合其他特征做进一步核实判断。
根据业务经验的欺诈特征识别步骤:根据已经识别出的网贷欺诈,提取这些网贷欺诈的与网贷相关的图像并利用OpenCV实现图像识别以提取图像特征作为参考欺诈特征;随后对于概率处于第一阈值Threshold1和第二阈值Threshold2之间的申请人,基于参考欺诈特征分析申请人的与网贷相关的图像;
整理业务经验提供关于图像类欺诈案例,明确欺诈特征。运用OpenCV实现图像识别,对此类特征进行提取,作为单一特征进行分析。图像识别是人工智能的重要领域,而OpenCV作为一个基于BSD许可发行的跨平台计算机视觉库,其较之于其他主流视觉函数库有更高效快速的性能。
提取概率处于第一阈值Threshold1和第二阈值Threshold2之间的申请人的与网贷相关的图像中的参考欺诈特征,将提取到的特征分别分析,计算其IV值(信息值)、KS(用于衡量正负样本比例差程度大小的评估指标)值,根据结果判断此特征的进一步用途;设置第一IV阈值Threshold_iv1和第二IV阈值Threshold_iv2、KS阈值Threshold_ks,其中0.02<=Threshold_iv1<=0.1,0.02<=Threshold_iv2<=0.1,而且Threshold_iv1<Threshold_iv2,而且Threshold_ks<0.06;舍弃IV值小于第一IV阈值Threshold_iv1的特征变量;对于IV值大于第二IV阈值Threshold_iv2的特征变量,(例如在分析其贷后表现)加入决策规则集;对于处于Threshold_iv1和Threshold_iv2之间且大于KS阈值Threshold_ks的特征,可结合其他外部特征训练机器学习模型。
作为参考欺诈特征的示例,可执行下述获取步骤。
计算申请人的与网贷相关的图像中人像面积占比;
例如,运用OpenCV中的人脸级联分类器检测人脸,识别出人脸后画边框标记,计算标记的人脸框面积与整张图像面积之比:R=S[人]/S[图],其中S[人]表示图像中人像框的面积,S[图]表示申请人图像的面积。
计算申请人的与网贷相关的图像中纯色部分面积占比;
例如,根据人像面积占比,截取人像下边框以上部分,调用OpenCV接口中的高斯混合模型,提取人像前景,加以剔除。计算背景颜色种类及各色彩所占比例,根据业务经验,申请人图像为纯白底色的PS痕迹较重,欺诈风险较高,着重处理。
总而言之,本发明的上述实施例提供了一种能够弥补反欺诈数据源关于图像类数据的空白,提供新的角度来识别欺诈的高效网贷欺诈识别方法。
<系统示例>
例如,根据本实施例的基于图像识别的网贷欺诈识别系统主要分为两大部分,分别由以下几个模块组成:
1.数据获取模块:在现有网络小贷模式下,活体校验是用户申请网络贷款的必要步骤之一,主要负责对用户进行活体检测。例如在用户授权的情况下,截取用户使用智能设备进行活体验证时的正面识别屏幕,以图片格式(例如以JPG格式)作为入参,传输给图像识别模块,用于接下来的图像分析。
2.样本与特征提取模块:将黑名单及零还款的用户提取为坏样本,正常还款客户作为正向用户,通过深度学习训练模型提取其与网贷相关的图像特征,作为欺诈参考特征;
具体地,例如,黑名单客户包括:包含视频攻击的申请人、具有预定背景资料类别的申请人、其与网贷相关的图像存在认为篡改(例如经过图像PS)的申请人等。
第一部分:
基于深度学习的欺诈预测步骤:利用提取的样本,基于欺诈参考特征,运用卷积神经网络算法训练得到预测模型,利用训练得到的预测模型预测得到申请人实时的欺诈可能概率;
卷积神经网络(ConvolutionalNeuralNetwork,CNN)作为图像识别领域的核心算法之一,多次成为ImageNet大规模视觉识别竞赛的优胜算法,卷积神经网络通过卷积来模拟特征区分,并且通过卷积的权值共享及池化,来降低网络参数的数量级,最后通过传统神经网络完成分类等任务;
因此,本发明运用卷积运算来代替一般的矩阵乘法运算自定义神经网络结构,进行图像模型训练;其中详细如下:
a).在卷积层进行仿射变换,将图像X作为输入层,设定卷积核为Y,则:
其中:m表示图像的像素行,h表示图像的像素列,S为输入层X的卷积结果。
b).通过一个非线性的激活函数,如整流线性激活函数来承接卷积层并行计算多个卷积得到的线性激活响应。
c).在池化层降采样,选择最大池化方法来提高网络计算效率。
需要注意的是:因为在对图像进行卷积操作时,其角落或边缘的像素点被使用的次数相对较少的。但在实际场景中,用户的图像边缘信息对于团伙欺诈等一系列需要背景比对的欺诈场景有着至关重要的作用。因此本发明中对输入图像X周围进行2层填充,以确保运算获取到足够的边缘信息点。
利用训练后的模型预测得到单用户实时可能的欺诈概率;
通过设置阈值,将申请人分为高风险和低风险,例如设置0.5<=阈值<=0.8;具体地,例如设置两个阈值(第一阈值Threshold1和第二阈值Threshold2,其中第一阈值Threshold1小于第二阈值Threshold2),对于欺诈可能概率小于第一阈值Threshold1的判断为低风险,处理为安全申请人,实施授信;对于欺诈可能概率大于第二阈值Threshold2的申请人,判断为高风险申请人,拒绝授信;对于欺诈可能概率处于第一阈值Threshold1和第二阈值Threshold2之间的申请人归为灰度用户,则需结合其他特征做进一步核实判断。
第二部分:
根据业务经验的欺诈特征识别步骤:根据长时间的暗调等业务经验总结的欺诈特征,做针对性的特征识别。将标记案例的申请图像作为入参,利用OpenCV实现图像识别以提取图像特征作为参考欺诈特征;随后对于概率处于第一阈值Threshold1和第二阈值Threshold2之间的申请人,基于参考欺诈特征分析申请人的与网贷相关的图像;
整理业务经验提供关于图像类欺诈案例(如背景有绿植的公司团伙欺诈),明确欺诈特征。运用OpenCV实现图像识别,对此类特征进行提取,作为单一特征进行分析。图像识别是人工智能的重要领域,而OpenCV作为一个基于BSD许可发行的跨平台计算机视觉库,其较之于其他主流视觉函数库有更高效快速的性能。
提取各特征概率处于第一阈值Threshold1和第二阈值Threshold2之间的申请人的与网贷相关的图像中的参考欺诈特征,将提取到的特征分别分析,计算其IV值(信息值)、KS(用于衡量正负样本比例差程度大小的评估指标)值,根据结果判断此特征的进一步用途;设置第一IV阈值Threshold_iv1和第二IV阈值Threshold_iv2、KS阈值Threshold_ks,其中0.02<=Threshold_iv1<=0.1,0.02<=Threshold_iv2<=0.1,而且Threshold_iv1<Threshold_iv2,而且Threshold_ks<0.06;舍弃IV值小于第一IV阈值Threshold_iv1的特征变量;对于IV值大于第二IV阈值Threshold_iv2的特征变量,(例如在分析其贷后表现)加入决策规则集;对于处于Threshold_iv1和Threshold_iv2之间且大于KS阈值Threshold_ks的特征,可结合其他外部特征训练机器学习模型。
作为参考欺诈特征的示例,可执行下述获取步骤。
计算申请人的与网贷相关的图像中人像面积占比;
例如,运用OpenCV中的人脸级联分类器检测人脸,识别出人脸后画边框标记,计算标记的人脸框面积与整张图像面积之比:R=S[人]/S[图],其中S[人]表示图像中人像框的面积,S[图]表示申请人图像的面积。
其中,轮廓线包含n个顶点,Ai表示第i个顶点对应的像素中心点的面积。
在正常的案例中,申请人需在指定的画框内完成活体识别操作,因此这一比值存在固定的区间范围,设定阈值外的申请人为灰度用户,需额外核验。
申请图像中的绿植背景,应用上诉方法获取,其中,因绿植分布较分散且茎叶面积占比较小,故在图像轮廓的标记中需实现图像形态的闭运算,对识别的图像先进行膨胀算法再做形态腐蚀操作,以去除图像噪声,得到更精准的计算比例。
计算申请人的与网贷相关的图像中色彩部分面积占比;
例如,根据上诉识别的人像轮廓,截取人像下边框以上部分,调用OpenCV接口中的高斯混合模型,提取人像前景,加以剔除。计算背景颜色种类及各色彩所占比例,根据业务经验,申请人图像色彩单一或为纯白底色则疑似PS痕迹较重,欺诈风险较高,需标记为灰度申请人处理。
总而言之,本发明的该实施例旨在通过深度学习算法,提取更多图像上的信息点,提供了一种能够弥补反欺诈数据源关于图像类数据的空白,提供新的角度来识别欺诈的高效网贷欺诈识别系统。
需要说明的是,方法示例和系统示例中的特征可以相互结合,方法示例中的特征可用于系统示例,系统示例中的特征可用于方法示例。
需要说明的是,除非特别指出,否则说明书中的术语“第一”、“第二”、“第三”等描述仅仅用于区分说明书中的各个组件、元素、步骤等,而不是用于表示各个组件、元素、步骤之间的逻辑关系或者顺序关系等。
可以理解的是,虽然本发明已以较佳实施例披露如上,然而上述实施例并非用以限定本发明。对于任何熟悉本领域的技术人员而言,在不脱离本发明技术方案范围情况下,都可利用上述揭示的技术内容对本发明技术方案作出许多可能的变动和修饰,或修改为等同变化的等效实施例。因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何简单修改、等同变化及修饰,均仍属于本发明技术方案保护的范围内。
Claims (9)
1.一种基于图像识别的网贷欺诈识别方法,其特征在于包括:
数据获取步骤:读取与网贷相关的图像;
样本与特征提取步骤:将黑名单客户提取为样本,通过深度学习提取其与网贷相关的图像特征,作为欺诈参考特征;
基于深度学习的欺诈预测步骤:利用提取的样本,基于欺诈参考特征,运用卷积神经网络算法训练得到预测模型,利用训练得到的预测模型预测得到申请人实时的欺诈可能概率。
2.根据权利要求1所述的基于图像识别的网贷欺诈识别方法,其特征在于,数据获取步骤包括:利用客户端通过嵌入在手机的应用程序中的软件开发工具包,将手机屏幕画面的图像读取为与网贷相关的图像。
3.根据权利要求1或2所述的基于图像识别的网贷欺诈识别方法,其特征在于,在基于深度学习的欺诈预测步骤中,设置第一阈值和第二阈值,其中第一阈值小于第二阈值,对于欺诈可能概率小于第一阈值的判断为低风险,处理为安全申请人,实施授信;对于欺诈可能概率大于第二阈值的申请人,判断为高风险申请人,拒绝授信。
4.根据权利要求1或2所述的基于图像识别的网贷欺诈识别方法,其特征在于,基于图像识别的网贷欺诈识别方法还包括:根据业务经验的欺诈特征识别步骤,其中根据已经识别出的网贷欺诈用户,提取这些网贷欺诈用户的与网贷相关的图像并利用OpenCV实现图像识别以提取图像特征作为参考欺诈特征;随后对于概率处于第一阈值和第二阈值之间的申请人,基于参考欺诈特征分析申请人的与网贷相关的图像。
5.根据权利要求4所述的基于图像识别的网贷欺诈识别方法,其特征在于,根据业务经验的欺诈特征识别步骤,提取概率处于第一阈值和第二阈值之间的申请人的与网贷相关图像中的参考欺诈特征,计算提取出的每个参考欺诈特征的IV值和KS值,设置第一IV阈值和第二IV阈值、KS阈值,舍弃IV值小于第一IV阈值的特征变量;将对于IV值大于第二IV阈值的特征变量加入决策规则集,组合具有区分力的规则。
6.根据权利要求5所述的基于图像识别的网贷欺诈识别方法,其特征在于,其中第一IV阈值和第二IV阈值分别为大于等于0.02并且小于等于0.1,其中KS阈值小于0.06。
7.一种基于图像识别的网贷欺诈识别系统,其特征在于包括:
数据获取模块,用于截取用户使用智能设备进行活体验证时的正面识别屏幕,以图片格式传输给图像识别模块,用于图像分析;
样本与特征提取模块,用于将黑名单及零还款的用户提取为坏样本,正常还款客户作为正向用户,通过深度学习训练模型提取其与网贷相关的图像特征,作为欺诈参考特征。
9.根据权利要求7所述的基于图像识别的网贷欺诈识别系统,其特征在于,样本与特征提取模块执行下述处理:
计算申请人的与网贷相关的图像中人像面积占比;其中,运用OpenCV中的人脸级联分类器检测人脸,识别出人脸后画边框标记,计算标记的人脸框面积与整张图像面积之比:R=S[人]/S[图],其中S[人]表示图像中人像框的面积,S[图]表示申请人图像的面积。
其中,轮廓线包含n个顶点,Ai表示第i个顶点对应的像素中心点的面积;
计算申请人的与网贷相关的图像中色彩部分面积占比;其中,根据上诉识别的人像轮廓,截取人像下边框以上部分,调用OpenCV接口中的高斯混合模型,提取人像前景,加以剔除;计算背景颜色种类及各色彩所占比例。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010704049.0A CN112001785A (zh) | 2020-07-21 | 2020-07-21 | 一种基于图像识别的网贷欺诈识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010704049.0A CN112001785A (zh) | 2020-07-21 | 2020-07-21 | 一种基于图像识别的网贷欺诈识别方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112001785A true CN112001785A (zh) | 2020-11-27 |
Family
ID=73467810
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010704049.0A Pending CN112001785A (zh) | 2020-07-21 | 2020-07-21 | 一种基于图像识别的网贷欺诈识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112001785A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113298118A (zh) * | 2021-04-28 | 2021-08-24 | 上海淇玥信息技术有限公司 | 一种基于神经网络的智能反欺诈方法、装置及电子设备 |
CN113989857A (zh) * | 2021-12-27 | 2022-01-28 | 四川新网银行股份有限公司 | 一种基于深度学习的人像照片内容解析方法及系统 |
CN113298118B (zh) * | 2021-04-28 | 2024-06-07 | 上海淇玥信息技术有限公司 | 一种基于神经网络的智能反欺诈方法、装置及电子设备 |
Citations (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105405054A (zh) * | 2015-12-11 | 2016-03-16 | 平安科技(深圳)有限公司 | 基于理赔照片深度学习实现保险理赔反欺诈的方法及服务器 |
CN106157135A (zh) * | 2016-07-14 | 2016-11-23 | 微额速达(上海)金融信息服务有限公司 | 基于声纹识别性别年龄的防欺诈系统及方法 |
CN107491757A (zh) * | 2017-08-18 | 2017-12-19 | 上海二三四五金融科技有限公司 | 一种基于活体特征的防欺诈系统及控制方法 |
CN108038456A (zh) * | 2017-12-19 | 2018-05-15 | 中科视拓(北京)科技有限公司 | 一种人脸识别系统中的防欺骗方法 |
CN108734570A (zh) * | 2018-05-22 | 2018-11-02 | 深圳壹账通智能科技有限公司 | 一种风险预测方法、存储介质和服务器 |
CN108764058A (zh) * | 2018-05-04 | 2018-11-06 | 吉林大学 | 一种基于热成像效应的双摄像头人脸活体检测方法 |
CN108765131A (zh) * | 2018-05-18 | 2018-11-06 | 深圳壹账通智能科技有限公司 | 基于微表情的信贷审核方法、装置、终端及可读存储介质 |
CN109492455A (zh) * | 2017-09-12 | 2019-03-19 | 中国移动通信有限公司研究院 | 活体对象检测及身份认证方法、介质、系统和相关装置 |
CN109919624A (zh) * | 2019-02-28 | 2019-06-21 | 杭州师范大学 | 一种基于时空集中性的网贷欺诈团伙识别与预警方法 |
CN110008942A (zh) * | 2019-01-15 | 2019-07-12 | 阿里巴巴集团控股有限公司 | 证件验证方法、装置、服务器及存储介质 |
CN110020573A (zh) * | 2018-01-08 | 2019-07-16 | 上海聚虹光电科技有限公司 | 活体检测系统 |
CN110084135A (zh) * | 2019-04-03 | 2019-08-02 | 平安科技(深圳)有限公司 | 人脸识别方法、装置、计算机设备及存储介质 |
CN110084603A (zh) * | 2018-01-26 | 2019-08-02 | 阿里巴巴集团控股有限公司 | 训练欺诈交易检测模型的方法、检测方法以及对应装置 |
CN110223165A (zh) * | 2019-06-14 | 2019-09-10 | 哈尔滨哈银消费金融有限责任公司 | 一种基于关联网络的反欺诈和信用风险预测方法和系统 |
CN110222554A (zh) * | 2019-04-16 | 2019-09-10 | 深圳壹账通智能科技有限公司 | 欺诈识别方法、装置、电子设备及存储介质 |
CN110348519A (zh) * | 2019-07-12 | 2019-10-18 | 深圳众赢维融科技有限公司 | 金融产品欺诈团伙的识别方法和装置 |
CN110414437A (zh) * | 2019-07-30 | 2019-11-05 | 上海交通大学 | 基于卷积神经网络模型融合篡改人脸检测分析方法和系统 |
CN110458185A (zh) * | 2019-06-26 | 2019-11-15 | 平安科技(深圳)有限公司 | 图像识别方法及装置、存储介质、计算机设备 |
CN111275338A (zh) * | 2020-01-20 | 2020-06-12 | 深圳微众税银信息服务有限公司 | 一种企业欺诈行为的判定方法、装置、设备及存储介质 |
CN111368738A (zh) * | 2020-03-05 | 2020-07-03 | 苏宁金融科技(南京)有限公司 | 一种骗贷风险识别方法、系统及设备 |
-
2020
- 2020-07-21 CN CN202010704049.0A patent/CN112001785A/zh active Pending
Patent Citations (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105405054A (zh) * | 2015-12-11 | 2016-03-16 | 平安科技(深圳)有限公司 | 基于理赔照片深度学习实现保险理赔反欺诈的方法及服务器 |
CN106157135A (zh) * | 2016-07-14 | 2016-11-23 | 微额速达(上海)金融信息服务有限公司 | 基于声纹识别性别年龄的防欺诈系统及方法 |
CN107491757A (zh) * | 2017-08-18 | 2017-12-19 | 上海二三四五金融科技有限公司 | 一种基于活体特征的防欺诈系统及控制方法 |
CN109492455A (zh) * | 2017-09-12 | 2019-03-19 | 中国移动通信有限公司研究院 | 活体对象检测及身份认证方法、介质、系统和相关装置 |
CN108038456A (zh) * | 2017-12-19 | 2018-05-15 | 中科视拓(北京)科技有限公司 | 一种人脸识别系统中的防欺骗方法 |
CN110020573A (zh) * | 2018-01-08 | 2019-07-16 | 上海聚虹光电科技有限公司 | 活体检测系统 |
CN110084603A (zh) * | 2018-01-26 | 2019-08-02 | 阿里巴巴集团控股有限公司 | 训练欺诈交易检测模型的方法、检测方法以及对应装置 |
CN108764058A (zh) * | 2018-05-04 | 2018-11-06 | 吉林大学 | 一种基于热成像效应的双摄像头人脸活体检测方法 |
CN108765131A (zh) * | 2018-05-18 | 2018-11-06 | 深圳壹账通智能科技有限公司 | 基于微表情的信贷审核方法、装置、终端及可读存储介质 |
CN108734570A (zh) * | 2018-05-22 | 2018-11-02 | 深圳壹账通智能科技有限公司 | 一种风险预测方法、存储介质和服务器 |
CN110008942A (zh) * | 2019-01-15 | 2019-07-12 | 阿里巴巴集团控股有限公司 | 证件验证方法、装置、服务器及存储介质 |
CN109919624A (zh) * | 2019-02-28 | 2019-06-21 | 杭州师范大学 | 一种基于时空集中性的网贷欺诈团伙识别与预警方法 |
CN110084135A (zh) * | 2019-04-03 | 2019-08-02 | 平安科技(深圳)有限公司 | 人脸识别方法、装置、计算机设备及存储介质 |
CN110222554A (zh) * | 2019-04-16 | 2019-09-10 | 深圳壹账通智能科技有限公司 | 欺诈识别方法、装置、电子设备及存储介质 |
CN110223165A (zh) * | 2019-06-14 | 2019-09-10 | 哈尔滨哈银消费金融有限责任公司 | 一种基于关联网络的反欺诈和信用风险预测方法和系统 |
CN110458185A (zh) * | 2019-06-26 | 2019-11-15 | 平安科技(深圳)有限公司 | 图像识别方法及装置、存储介质、计算机设备 |
CN110348519A (zh) * | 2019-07-12 | 2019-10-18 | 深圳众赢维融科技有限公司 | 金融产品欺诈团伙的识别方法和装置 |
CN110414437A (zh) * | 2019-07-30 | 2019-11-05 | 上海交通大学 | 基于卷积神经网络模型融合篡改人脸检测分析方法和系统 |
CN111275338A (zh) * | 2020-01-20 | 2020-06-12 | 深圳微众税银信息服务有限公司 | 一种企业欺诈行为的判定方法、装置、设备及存储介质 |
CN111368738A (zh) * | 2020-03-05 | 2020-07-03 | 苏宁金融科技(南京)有限公司 | 一种骗贷风险识别方法、系统及设备 |
Non-Patent Citations (1)
Title |
---|
朱迪: "银行对公客户贷款逾期预测模型的研究与实现", 中国优秀硕士学位论文全文数据库基础科学辑, no. 6, 15 June 2020 (2020-06-15), pages 002 - 126 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113298118A (zh) * | 2021-04-28 | 2021-08-24 | 上海淇玥信息技术有限公司 | 一种基于神经网络的智能反欺诈方法、装置及电子设备 |
CN113298118B (zh) * | 2021-04-28 | 2024-06-07 | 上海淇玥信息技术有限公司 | 一种基于神经网络的智能反欺诈方法、装置及电子设备 |
CN113989857A (zh) * | 2021-12-27 | 2022-01-28 | 四川新网银行股份有限公司 | 一种基于深度学习的人像照片内容解析方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3916627A1 (en) | Living body detection method based on facial recognition, and electronic device and storage medium | |
CN101142584B (zh) | 面部特征检测的方法 | |
CN112434578B (zh) | 口罩佩戴规范性检测方法、装置、计算机设备和存储介质 | |
CN112215180B (zh) | 一种活体检测方法及装置 | |
CN109948566B (zh) | 一种基于权重融合与特征选择的双流人脸反欺诈检测方法 | |
CN104992148A (zh) | 基于随机森林的atm终端部分遮挡人脸关键点检测方法 | |
CN109871845B (zh) | 证件图像提取方法及终端设备 | |
CN107832684A (zh) | 一种具有自主学习能力的智能静脉认证方法和系统 | |
CN107808358A (zh) | 图像水印自动检测方法 | |
CN111696080B (zh) | 一种基于静态纹理的人脸欺诈检测方法、系统及存储介质 | |
CN109977887A (zh) | 一种抗年龄干扰的人脸识别方法 | |
CN106650670A (zh) | 活体人脸视频的检测方法及装置 | |
CN108537143B (zh) | 一种基于重点区域特征比对的人脸识别方法与系统 | |
CN107316029A (zh) | 一种活体验证方法及设备 | |
CN110378254B (zh) | 车损图像修改痕迹的识别方法、系统、电子设备及存储介质 | |
CN111784658B (zh) | 一种用于人脸图像的质量分析方法和系统 | |
CN111860369A (zh) | 一种欺诈识别方法、装置以及存储介质 | |
CN111428701B (zh) | 小面积指纹图像特征提取方法、系统、终端及存储介质 | |
CN111476727B (zh) | 一种面向换脸视频检测的视频运动增强方法 | |
CN113221655A (zh) | 基于特征空间约束的人脸欺骗检测方法 | |
Sakthimohan et al. | Detection and Recognition of Face Using Deep Learning | |
CN112001785A (zh) | 一种基于图像识别的网贷欺诈识别方法及系统 | |
CN112818899A (zh) | 人脸图像处理方法、装置、计算机设备和存储介质 | |
CN116229528A (zh) | 一种活体掌静脉检测方法、装置、设备及存储介质 | |
CN114429584A (zh) | 一种基于类别损失和差值检测的多目标小物体识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |