CN112232971A - 反欺诈检测方法、装置、计算机设备和存储介质 - Google Patents
反欺诈检测方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN112232971A CN112232971A CN202011095456.2A CN202011095456A CN112232971A CN 112232971 A CN112232971 A CN 112232971A CN 202011095456 A CN202011095456 A CN 202011095456A CN 112232971 A CN112232971 A CN 112232971A
- Authority
- CN
- China
- Prior art keywords
- processed
- image
- target
- images
- case
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 61
- 239000013598 vector Substances 0.000 claims abstract description 218
- 238000000034 method Methods 0.000 claims abstract description 33
- 238000000605 extraction Methods 0.000 claims description 49
- 230000011218 segmentation Effects 0.000 claims description 41
- 238000012545 processing Methods 0.000 claims description 29
- 238000004590 computer program Methods 0.000 claims description 24
- 238000003709 image segmentation Methods 0.000 claims description 23
- 230000015654 memory Effects 0.000 claims description 18
- 230000004927 fusion Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 17
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000012216 screening Methods 0.000 description 7
- 238000013527 convolutional neural network Methods 0.000 description 6
- 238000012549 training Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 230000002265 prevention Effects 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000012550 audit Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及一种保险理赔案件的反欺诈检测方法、装置、计算机设备和存储介质。所述方法包括:获取多个待处理图像、每个待处理图像对应的图像特征向量和案件关联参数;确定互为相似图像的两两目标待处理图像;根据每个目标待处理图像的案件关联参数,生成对应的文本特征向量;融合每个目标待处理图像对应的图像特征向量和文本特征向量,得到目标特征向量;根据两两目标待处理图像的目标特征向量,确定理赔案件是否为欺诈案件。本方法基于图像间的相似度自动筛选得到相似图像,基于相似图像判断欺诈案件,提高了理赔案件的检测效率;结合相似图像的案件关联参数特征和图像特征检测理赔案件是否为欺诈案件,提高了理赔案件的检测精度。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种保险理赔案件的反欺诈检测方法、装置、计算机设备和存储介质。
背景技术
随着社会经济的不断发展和人民生活水平的持续提高,机动车辆保有量迅猛增长。机动车辆的快速增长,促使了汽车保险行业的发展。汽车保险(简称车险),是指对机动车辆由于自然灾害或意外事故所造成的人身伤亡或财产损失负赔偿责任的一种商业保险。
在车险理赔业务上,针对同一地点的事故,可能会接收到几起理赔申请,存在保险欺诈的风险。相关技术中,筛选这种欺诈行为通常是在车险理赔审核时,由审核人员根据案件的事故现场图片进行高相似案件排查。而由于不同的案件会随机发放给不同审核人员进行审核,因此,通过人工审核图片的方式判断案件是否是同一事故现场,进而判断是否有欺诈嫌疑,存在不够准确的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高保险理赔欺诈案件检测准确率的保险理赔案件的反欺诈检测方法、装置、计算机设备和存储介质。
第一方面,本申请实施例提供了一种保险理赔案件的反欺诈检测方法,包括:
获取多个待处理图像、对每个待处理图像进行特征提取得到的图像特征向量以及每个待处理图像对应的案件关联参数;
遍历多个待处理图像,确定两两待处理图像之间的相似度;
根据相似度确定互为相似图像的两两目标待处理图像,两两目标待处理图像所属的理赔案件不同;
根据每个目标待处理图像的案件关联参数,生成对应的文本特征向量;
融合每个目标待处理图像对应的图像特征向量和文本特征向量,得到每个目标待处理图像的目标特征向量;
根据两两目标待处理图像的目标特征向量,确定两两目标待处理图像所属的理赔案件是否为欺诈案件。
在其中一个实施例中,在获取多个待处理图像、对每个待处理图像进行特征提取得到的图像特征向量以及每个待处理图像对应的案件关联参数之前,还包括:
定时获取原始图像以及原始图像对应的案件关联参数;
通过目标检测模型对原始图像进行检测,在检测原始图像中存在目标对象时,得到目标对象区域;
通过图像分割模型对目标对象区域和除目标对象区域外的背景区域进行分割,获取背景区域;
对目标对象区域进行填充,得到待处理图像;
通过图像特征提取模型对待处理图像进行特征提取,得到待处理图像对应的图像特征向量;
将待处理图像、待处理图像对应的图像特征向量和案件关联参数保存至图像数据库中。
在其中一个实施例中,获取背景区域,包括:
获取目标对象区域和背景区域分别对应的分割结果;
根据背景区域的尺寸和原始图像的尺寸,确定背景区域所占比例;
获取背景区域所占比例大于阈值的目标原始图像;
根据分割结果,对目标原始图像中的目标对象区域进行抠图处理,得到背景区域。
在其中一个实施例中,目标对象为车辆和行人中的至少一种。
在其中一个实施例中,案件关联参数包括地点文本信息;根据每个目标待处理图像的案件关联参数,生成对应的文本特征向量,包括:
对每个目标待处理图像的地点文本信息进行分词处理,得到多个分词单元;
在预先生成的词向量表中查找与每个分词单元对应的词向量,得到地点文本信息对应的词向量序列;
根据地点文本信息对应的词向量序列生成每个目标待处理图像对应的文本特征向量。
在其中一个实施例中,根据地点文本信息对应的词向量序列生成每个目标待处理图像对应的文本特征向量,包括:
通过句向量模型对词向量序列进行处理,生成每个目标待处理图像对应的文本特征向量。
在其中一个实施例中,根据两两目标待处理图像的目标特征向量,确定两两目标待处理图像所属的理赔案件是否为欺诈案件,包括:
通过全连接网络对两两目标待处理图像的目标特征向量进行识别,确定两两目标待处理图像所属的理赔案件是否为欺诈案件。
第二方面,本申请实施例提供了一种保险理赔案件的反欺诈检测装置,包括:
获取模块,用于获取多个待处理图像、对每个待处理图像进行特征提取得到的图像特征向量以及每个待处理图像对应的案件关联参数;
相似度确定模块,用于遍历多个待处理图像,确定两两待处理图像之间的相似度;
相似图像确定模块,用于根据相似度确定互为相似图像的两两目标待处理图像,两两目标待处理图像所属的理赔案件不同;
文本特征向量生成模块,用于根据每个目标待处理图像的案件关联参数,生成对应的文本特征向量;
融合模块,用于根据融合每个目标待处理图像对应的图像特征向量和文本特征向量,得到每个目标待处理图像的目标特征向量;
结果生成模块,用于根据两两目标待处理图像的目标特征向量,确定两两目标待处理图像所属的理赔案件是否为欺诈案件。
第三方面,本申请实施例提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述第一方面任一项实施例所述的保险理赔案件的反欺诈检测方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面任一项实施例所述的保险理赔案件的反欺诈检测方法。
上述保险理赔案件的反欺诈检测方法、装置、计算机设备和存储介质,在获取多个待处理图像、对每个待处理图像进行特征提取得到的图像特征向量以及每个待处理图像对应的案件关联参数后,确定多个待处理图像中互为相似图像的两两目标待处理图像;根据每个目标待处理图像的案件关联参数,生成对应的文本特征向量;融合每个目标待处理图像对应的图像特征向量和文本特征向量,得到每个目标待处理图像的目标特征向量;根据两两目标待处理图像的目标特征向量,确定两两目标待处理图像所属的理赔案件是否为欺诈案件。通过图像间的相似度自动筛选得到不同理赔案件之间的相似图像,基于得到的相似图像判断理赔案件是否欺诈案件,提高了理赔案件的检测效率;通过结合相似图像的案件关联参数特征和图像特征检测理赔案件是否为欺诈案件,可以提高理赔案件的检测精度,降低遗漏欺诈案件的风险。
附图说明
图1为一个实施例中保险理赔案件的反欺诈检测方法的应用环境图;
图2为一个实施例中保险理赔案件的反欺诈检测方法的流程示意图;
图3为一个实施例中图像预处理步骤的流程示意图;
图4为一个实施例中获取背景区域步骤的流程示意图;
图5为一个实施例中生成文本特征向量步骤的流程示意图;
图6为一个实施例中生成文本特征向量的示意图;
图7为一个实施例中保险理赔案件的反欺诈检测方法的流程示意图;
图8为一个实施例中采用目标检测模型对原始图像进行筛选的示意图;
图9为一个实施例中根据背景区域对原始图像进行筛选的示意图;
图10为一个实施中生成图像特征向量的示意图;
图11为一个实施中对待处理图像进行两两比对的示意图;
图12为一个实施中得到互为相似的两两目标待处理图像的示意图;
图13为一个实施中检测是否为欺诈案件的示意图;
图14为一个实施例中保险理赔案件的反欺诈检测装置的结构框图;
图15为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的保险理赔案件的反欺诈检测方法,可以应用于如图1所示的应用环境中。其中,终端110通过网络与服务器120进行通信。用户可以通过终端110或者其他远程终端上传理赔案件的待处理图像;通过终端110的显示界面读取理赔案件的案件相关信息、读取理赔案件的反欺诈检测结果等。服务器120预先部署有相似图像的检测策略以及多个深度学习模型。该多个深度学习模型不限于用于执行目标检测、图像分割、特征提取等。具体地,服务器120获取多个待处理图像、对每个待处理图像进行特征提取得到的图像特征向量以及每个待处理图像对应的案件关联参数;遍历多个待处理图像,确定两两待处理图像之间的相似度;根据相似度确定互为相似图像的两两目标待处理图像,两两目标待处理图像所属的理赔案件不同;根据每个目标待处理图像的案件关联参数,生成对应的文本特征向量;融合每个目标待处理图像对应的图像特征向量和文本特征向量,得到每个目标待处理图像的目标特征向量;根据两两目标待处理图像的目标特征向量,确定两两目标待处理图像所属的理赔案件是否为欺诈案件。其中,终端110可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种保险理赔案件的反欺诈检测方法,以该方法应用于图1中的服务器120为例进行说明,包括以下步骤:
步骤S210,获取多个待处理图像、对每个待处理图像进行特征提取得到的图像特征向量以及每个待处理图像对应的案件关联参数。
其中,待处理图像为已产生的理赔案件的图像,不限于包括事故现场图像、证件照片、受损汽车零部件图像等。理赔案件不限于是车险理赔案件、寿险理赔案件等。理赔案件可以是已处理过的案件,也可以是还未处理的案件。案件关联参数是指与理赔案件相关的参数,不限于包括理赔案件标识、案件发生时的地点文本信息、联系人、联系方式等。案件关联参数可以是创建理赔案件时输入的,也可以是从理赔案件的图像中提取得到的。图像数据库中存储有多个理赔案件的待处理图像、对每个待处理图像进行特征提取得到的图像特征向量以及每个待处理图像对应的案件关联参数。当存在新理赔案件产生时,可以对新理赔案件的待处理图像进行特征提取,得到对应的图像特征向量,并将新理赔案件的待处理图像、图像特征向量和案件关联参数上传至图像数据库,从而对图像数据库中的数据进行实时更新。
具体地,服务器对保险理赔案件进行反欺诈检测可以是在接收到用户实时触发的检测指令后执行的,也可以是自行检测当前已满足预先配置的启动条件后执行的。服务器获取图像数据库中的待处理图像、预先对每个待处理图像进行特征提取得到的图像特征向量,以及每个待处理图像对应的案件关联参数。
步骤S220,遍历多个待处理图像,确定两两待处理图像之间的相似度。
其中,相似度不限于使用余弦距离、欧氏距离、汉明距离等表征。具体地,服务器在获取图像数据库中的多个待处理图像后,将多个待处理图像进行两两比对,采用预先配置的算法计算每两个待处理图像之间的相似度。相似度可以使用多种方式得到。例如,可以基于深度学习理论得到,或者采用哈希算法得到,在此不做限定。在一个可能性实施例中,相似度可以基于待处理图像的图像特征向量得到。例如,计算两两待处理图像的图像特征向量之间的余弦距离、欧式距离、马氏距离、明氏距离等。
步骤S230,根据相似度确定互为相似图像的两两目标待处理图像,两两目标待处理图像所属的理赔案件不同。
具体地,服务器在获取每个待处理图像和其他待处理图像之间的相似度之后,针对每个待处理图像,将每个待处理图像与其他待处理图像之间的相似度按照数值大小进行排序。从中选取预设数量的相似度最高的其他待处理图像,作为每个待处理图像的相似图像。预设数量可以依实际情况而定,例如5个或者10个。在确定每个待处理图像对应的相似图像后,服务器从每个待处理图像对应的相似图像中获取互为相似的两两目标待处理图像。示例性地,若待处理图像1的相似图像包括待处理图像2、待处理图像3、待处理图像4,待处理图像4的相似图像包括待处理图像5、待处理图像1、待处理图像6,且待处理图像1和待处理图像4是属于不同理赔案件的图像,则待处理图像1和待处理图像4为互为相似图像的两两目标待处理图像。
步骤S240,根据每个目标待处理图像的案件关联参数,生成对应的文本特征向量。
具体地,针对一组互为相似图像的两两目标待处理图像,服务器获取每个目标待处理图像的案件关联参数。通过预先配置的文本特征提取模型对案件关联参数进行处理,得到对应的文本特征向量。文本特征提取模型可以是词向量特征提取模型,例如,Word2Vec(一群用来产生词向量的相关模型),也可以是句向量特征提取模型,例如BiLSTM(Bi-directional Long Short-Term Memory,双向长短记忆网络)。
步骤S250,融合每个目标待处理图像对应的图像特征向量和文本特征向量,得到每个目标待处理图像的目标特征向量。
步骤S260,根据两两目标待处理图像的目标特征向量,确定两两目标待处理图像所属的理赔案件是否为欺诈案件。
具体地,服务器将每个目标待处理图像对应的图像特征向量和文本特征向量进行融合,生成对应的目标特征向量。将所得到的目标特征向量输入至预先训练的分类网络,得到理赔案件是否为欺诈案件的分类识别结果。分类网络可以是任一种可用于进行分类的深度学习网络,例如,全连接分类网络。
进一步地,服务器可以将互为相似图像的两两目标待处理图像、两两目标待处理图像的相似度、案件关联参数以及分类识别结果等信息发送至终端。终端通过显示界面展示所获取的信息,以使用户能够通过终端的显示界面读取检测结果,并结合理赔案件的其他信息进一步判断两两目标待处理图像所对应的理赔案件是否为欺诈案件。
上述保险理赔案件的反欺诈检测方法中,在获取多个待处理图像、对每个待处理图像进行特征提取得到的图像特征向量以及每个待处理图像对应的案件关联参数后,确定多个待处理图像中互为相似图像的两两目标待处理图像;根据每个目标待处理图像的案件关联参数,生成对应的文本特征向量;融合每个目标待处理图像对应的图像特征向量和文本特征向量,得到每个目标待处理图像的目标特征向量;根据两两目标待处理图像的目标特征向量,确定两两目标待处理图像所属的理赔案件是否为欺诈案件。通过图像间的相似度自动筛选得到不同理赔案件之间的相似图像,基于得到的相似图像判断理赔案件是否欺诈案件,提高了理赔案件的检测效率;通过结合相似图像的案件关联参数特征和图像特征检测理赔案件是否为欺诈案件,可以提高理赔案件的检测精度,降低遗漏欺诈案件的风险。
在一个实施例中,如图3所示,在获取多个待处理图像、对每个待处理图像进行特征提取得到的图像特征向量以及每个待处理图像对应的案件关联参数之前,还包括以下步骤:
步骤S310,定时获取原始图像以及原始图像对应的案件关联参数。
其中,原始图像是指还未经任何处理的图像。每个理赔案件通常包含多张原始图像,例如,事故现场图像、证件照片、受损汽车零部件图像等。而其中的部分原始图像对反欺诈检测的作用较小,若将所有原始图像都保存至图像数据库中进行检测,对检测效率会有所影响。因此,在获取理赔案件的原始图像后,服务器对原始图像进行预处理,生成包含有效信息的图像作为待处理图像。
在本实施例中,服务器对保险理赔案件进行反欺诈检测是在检测当前满足预先配置的启动条件后执行的。预先配置的启动条件不限于是周期性进行。当服务器检测当前时刻到达周期时刻时,获取原始图像以及原始图像对应的案件关联参数。
步骤S320,通过目标检测模型对原始图像进行检测,在检测原始图像中存在目标对象时,得到目标对象区域。
其中,目标检测模型不限于是SSD(Single Shot MultiBox Detector,一种目标检测模型)、R-CNN(Region-CNN,一种基于卷积神经网络的目标检测模型)、YOLO(You OnlyLook Once,一种目标检测模型)。目标对象是指需要检测的对象,针对不同的理赔案件类型,可以设置不同的目标对象。例如,对于车险理赔案件可以设置车辆和行人中的至少一个作为目标对象。
具体地,服务器在获取原始图像后,通过预先训练的目标检测模型对原始图像进行检测。若检测原始图像中不存在目标对象,则判断该原始图像是对反欺诈检测作用较小的图像,则放弃该原始图像;若检测原始图像中存在目标对象,则继续步骤S330。
步骤S330,通过图像分割模型对目标对象区域和除目标对象区域外的背景区域进行分割,获取背景区域。
步骤S340,对目标对象区域进行填充,得到待处理图像。
其中,图像分割模型不限于是FCN(Fully Convolution Networks,全卷积网络)、SegNet(Sementic Segmentation,语义分割网络)、DeepLabv3+(Encoder-Decoder withAtrous Separable Convolution for Semantic Image Segmentation,一种带有空洞可分离卷积的编解码结构语义分割模型)。背景区域是目标对象区域的一个相对概念,背景区域是指原始图像中除去目标对象区域外的其他区域。背景区域通常包含道路、树木、房屋等公共环境。
具体地,服务器获取包含目标对象区域的原始图像后,采用预先训练好的图像分割模型对包含目标对象区域的原始图像进行图像分割,得到每张原始图像对应的目标对象区域和背景区域的图像分割结果。服务器根据图像分割结果,对原始图像中的目标对象区域进行抠图处理,得到只包含背景区域的原始图像。对该只包含背景区域的原始图像中的目标对象区域以预设的像素值进行填充,将填充后的原始图像作为待处理图像。
步骤S350,通过图像特征提取模型对待处理图像进行特征提取,得到待处理图像对应的图像特征向量。
步骤S360,将待处理图像、待处理图像对应的图像特征向量和案件关联参数保存至图像数据库中。
在本实施中,图像特征提取模型包括依次连接的骨干网络和全连接层。其中,骨干网络可以是基于CNN(Convolutional Neural Network,卷积神经网络)的特征提取网络,不限于是VGGNet(Visual Geometry Group Networks,一种深度卷积神经网络)、GoogLeNet(一种神经网络)、ResNet(Residual Networks,一种深度残差网络)等。优选地,骨干网络采用残差网络ResNet。不同于一般CNN网络在深层网络能够收敛的前提下,随着网络深度的增加,正确率开始饱和甚至下降,出现网络的退化的问题。ResNet将部分原始输入的信息不经过矩阵乘法和非线性变换,直接传输到下一层。ResNet通过改变学习目标,即不再学习完整的输出,而是学习残差,解决了传统卷积层或全连接层在进行信息传递时存在的丢失、损耗等问题。通过直接将信息从输入绕道传输到输出,一定程度上保护了信息的完整性。同时,由于学习的目标是残差,简化了学习的难度。
具体地,在生成待处理图像后,将待处理图像输入至预先训练好的图像特征提取模型。通过图像特征提取模型中的骨干网络对待处理图像进行特征提取,得到中间向量。将该中间向量输入至图像特征提取模型中的全连接层,通过该全连接层将中间向量映射至预设维度,得到待处理图像对应的特征向量。预设维度可以依实际需求而定,例如512维。服务器将所得到的待处理图像、待处理图像对应的图像特征向量以及案件关联参数保存至图像数据中。
本实施例中,通过对包含目标对象区域的原始图像进行图像分割和填充处理,生成待处理图像,使得理赔案件的反欺诈检测主要针对背景区域进行,从而可以有效地对发生在同一地点的不同的理赔案件进行反欺诈检测,提高了检测的准确率;通过筛选得到包含目标对象的原始图像,可以提高理赔案件的反欺诈检测效率且减轻了服务器的运行压力。
在一个实施例中,对获取背景区域的一个实施方式进行说明。如图4所示,可以通过以下步骤实现:
步骤S331,获取目标对象区域和背景区域分别对应的分割结果。
步骤S332,根据背景区域的尺寸和原始图像的尺寸,确定背景区域所占比例。
步骤S333,获取背景区域所占比例大于阈值的目标原始图像。
步骤S334,根据分割结果,对目标原始图像中的目标对象区域进行抠图处理,得到背景区域。
具体地,在获取包含目标对象区域的原始图像的图像分割结果后,根据目标对象区域和背景区域的图像分割结果,计算得到目标对象区域和背景区域的尺寸信息。将背景区域或者目标区域的尺寸与原始图像的尺寸进行比较,得到背景区域所占原始图像的比例。将背景区域所占原始图像的比例与阈值进行比较,从中筛选出比例大于阈值的目标原始图像。阈值可以是60%。然后,对目标原始图像中的目标对象区域进行抠图处理,得到目标原始图像的背景区域。
本实施例中,通过对包含目标对象区域的原始图像进行进一步筛选,得到背景区域所占比例较大的目标原始图像,并针对目标原始图像依次进行抠图和填充处理,可以提高检测准确率和检测效率。
在一个实施例中,如图5所示,步骤S240,案件关联参数包括地点文本信息;根据每个目标待处理图像的案件关联参数,生成对应的文本特征向量,可以通过以下步骤实现:
步骤S241,对每个目标待处理图像的地点文本信息进行分词处理,得到多个分词单元。
步骤S242,在预先生成的词向量表中查找与每个分词单元对应的词向量,得到地点文本信息对应的词向量序列。
步骤S243,根据地点文本信息对应的词向量序列生成每个目标待处理图像对应的文本特征向量。
其中,地点文本信息是指理赔案件发生时地点的文本信息。地点文本信息可以从用户的输入信息中获取,例如,将字段“案件发生地点”对应的信息作为地点文本信息;也可以从理赔案件对应的图像中提取得到,例如,从理赔客户上传的文件资料图像中提取得到。词向量表可以通过词向量模型预先训练得到。例如,对历史出险地点的地点文本信息进行分词,通过词向量模型(例如Word2Vec)训练出地点文本集的词向量,生成词向量表。
具体地,服务器确定互为相似图像的两两目标待处理图像后,针对每组两两目标待处理图像,获取每个目标待处理图像对应的地点文本信息。通过分词算法对每个目标待处理图像的地点文本信息进行分词处理,得到每个目标待处理图像对应的多个分词单元。分词算法可以采用基于词表的分词算法、基于统计模型的分析算法、基于序列标注的分词算法等中的任一种。服务器从预先生成的词向量表中查找与每个分词单元对应的词向量,得到地点文本信息对应的词向量序列。进而对所获取的词向量序列进行拼接等处理,生成每个目标待处理图像对应的文本特征向量。
本实施例中,通过结合理赔案件发生时的地点文本信息进行反欺诈检测,判断互为相似图像的两两目标待处理图像对应的出险地点是否相同,可以提高理赔案件的反欺诈检测精度,降低遗漏欺诈案件的风险。
在一个实施例中,步骤S243,根据地点文本信息对应的词向量序列生成每个目标待处理图像对应的文本特征向量,包括:通过句向量模型对词向量序列进行处理,生成每个目标待处理图像对应的文本特征向量。
具体地,由于不同理赔案件的地点文本信息长度不一,在获取地点文本信息对应的词向量序列后,可以采用预先训练的句向量模型对词向量序列进行处理,得到维度相同的文本特征向量。图6示意性示出了一个实施例中生成文本特征向量的示意图。如图6所示,句向量模型由BiLSTM和全连接层(Dense Layer)构成。在得到每个目标待处理图像对应的词向量序列后,将词向量序列依次输入至BiLSTM和全连接层,输出预设维度的文本特征向量。预设维度可以是128维。
本实施例中,通过采用句向量模型将不同目标待处理图像所对应的词向量序列处理至相同维度,使得所得到的文本特征向量能够直接与图像特征向量进行融合处理,从而可以提高检测效率。
在一个实施例中,步骤S260,根据两两目标待处理图像的目标特征向量,确定两两目标待处理图像所属的理赔案件是否为欺诈案件,包括:通过全连接网络对两两目标待处理图像的目标特征向量进行识别,确定两两目标待处理图像所属的理赔案件是否为欺诈案件。
具体地,分类网络为全连接网络,由至少一层全连接层构成。服务器将互为相似图像的两两目标待处理图像的目标特征向量输入至全连接网。对全连接网络的输出结果进行归一化处理(softmax),得到是欺诈案件的概率值以及非欺诈案件的概率值。进而根据所得到的概率值确定理赔案件是否为欺诈案件。
在一个实施例中,通过一个具体的实施例说明保险理赔案件的反欺诈检测方法。以保险理赔案件为车险理赔案件为例进行说明,如图7所示,包括以下步骤:
步骤S701,定时获取原始图像以及原始图像对应的案件关联参数。其中,可以定期将需处理的理赔案件的原始图像存放至指定服务器的文件目录。服务器中的图像处理系统定时检测文件目录下的原始图像。
步骤S702,通过目标检测模型对原始图像进行检测,在检测原始图像中存在车辆和行人区域时,得到包含车辆和行人区域的原始图像。
图8示出了通过目标检测模型对原始图像进行筛选的示意图。其中,目标检测模型采用YOLO系列模型,例如YOLO V3(YOLO系列的第三版)。YOLO V3相比之前版本的模型精度有显著地提升,尤其是针对小目标检测。具体地,服务器将原始图像输入至已训练的YOLO模型,通过YOLO模型对原始图像进行检测。YOLO模型输出原始图像的车辆和行人的类别得分和位置信息。若车辆或行人的类别得分大于阈值,则认为原始图像中存在车辆或行人。阈值可以是60。当服务器获取原始图像中存在车辆和行人时,则对该原始图像进行标识,例如标识为“有车辆和行人”。
步骤S703,通过图像分割模型对目标对象区域和除目标对象区域外的背景区域进行分割,获取背景区域。
具体地,可以将标识有“有车辆和行人”的原始图像输入至预训练的图像分割模型。通过图像分割模型对原始图像中的车辆区域、行人区域和背景区域进行分割,得到车辆区域、行人区域和背景区域的图像分割结果。根据图像分割结果计算得到背景区域的尺寸和原始图像的尺寸。进而根据背景区域的尺寸和原始图像的尺寸得到背景区域占原始图像的比例。可以根据以下公式计算背景区域尺寸占原始图像的比例:
比例=背景区域尺寸/原始图像尺寸。
获取背景区域所占比例大于阈值的目标原始图像。阈值可以是60%。图9示例性示出了根据背景区域对原始图像进行筛选的示意图。其中原始图像①②⑤的背景区域小于60%,则原始图像①②⑤不进行下一步处理;原始图像③④的背景区域大于60%,则原始图像③④继续进行步骤S704。
步骤S704,对目标原始图像中的车辆和行人区域进行抠图处理,并使用预设像素值对车辆和行人区域进行填充,得到待处理图像。预设像素值为0。
步骤S705,通过图像特征提取模型对待处理图像进行特征提取,得到待处理图像对应的图像特征向量。
图10示例性示出了对待处理图像进行特征提取的示意图。如图10所示,在得到待处理图像后,将待处理图像输入至图像特征提取模型。通过图像特征提取模型中的骨干网络和全连接网络处理后输出预设维度的图像特征向量。预设维度可以是512维。将图像特征向量、与图像特征向量对应的待处理图像和原始图像保存至图像数据库中。在本实施例中,为了提高特征提取的精度,在将待处理图像输入至图像特征提取模型前,可以将待处理图像的分辨率调整至固定值,例如448x448。
以下对图像特征提取模型的训练生成过程进行说明。首先,获取多张真实车险理赔图像样本;对发生在同一地点的车险理赔图像样本进行标注,得到训练集;将每张车险理赔图像样本的分辨率调整至固定值,例如448x448;将训练集输入至待训练的图像特征提取模型,使用损失函数(损失函数可以使用ArcMargin loss)对待训练的图像特征提取模型进行迭代训练,直至达到预设停止条件。预设停止条件可以为到达一定的迭代次数,或者损失值趋于平稳。最后,选取鲁棒性最好或者准确率最高的图像特征提取模型的参数,生成本实施中所使用的图像特征提取模型。
步骤S706,遍历多个待处理图像,根据待处理图像的图像特征向量生成两两待处理图像之间的余弦距离。图11示出了一个实施例中将图像数据库中的待处理图像进行两两比对的示意图。
步骤S707,根据余弦距离确定互为相似图像的两两目标待处理图像。
具体地,可以对每个待处理图像对应的余弦距离进行排序,选取余弦距离最大的预设数量(例如5个)的待处理图像,作为每个待处理图像的相似图像。参照图12,若获取待处理图像1对应的相似图像包含待处理图像4,而待处理图像4对应的相似图像包括待处理图像1,且待处理图像1和待处理图像4所属的理赔案件不同,则待处理图像1和待处理图像4是互为相似图像的两两目标待处理图像。进一步地,服务器可以将两两目标待处理图像对应的原始图像进行拼接并保存至图像数据库中,从而便于用户能够快速查找进行比对。
步骤S708,针对每组两两目标待处理图像,根据案件关联参数中的地点文本信息,生成对应的文本特征向量。生成文本特征向量的具体方式可以参照上述实施例说明,在此不做具体阐述。
步骤S709,融合每个目标待处理图像对应的图像特征向量和文本特征向量,得到每个目标待处理图像的目标特征向量。其中,融合处理可以采用concact(用于连接两个或多个数组)方法。
步骤S710,通过全连接网络对两两目标待处理图像的目标特征向量进行识别,确定两两目标待处理图像所属的理赔案件是否为欺诈案件。
具体地,关于步骤S708~步骤S710的具体实现方式,可以参照上述实施例说明以及图13示出的示意图,在此不做具体阐述。
应该理解的是,虽然上述流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图14所示,提供了一种保险理赔案件的反欺诈检测装置1400,包括:获取模块1401、相似度确定模块1402、相似图像确定模块1403、文本特征向量生成模块1404、融合模块1405和结果生成模块1406,其中:
获取模块1401,用于获取多个待处理图像、对每个待处理图像进行特征提取得到的图像特征向量以及每个待处理图像对应的案件关联参数;相似度确定模块1402,用于遍历多个待处理图像,确定两两待处理图像之间的相似度;相似图像确定模块1403,用于根据相似度确定互为相似图像的两两目标待处理图像,两两目标待处理图像所属的理赔案件不同;文本特征向量生成模块1404,用于根据每个目标待处理图像的案件关联参数,生成对应的文本特征向量;融合模块1405,用于根据融合每个目标待处理图像对应的图像特征向量和文本特征向量,得到每个目标待处理图像的目标特征向量;结果生成模块1406,用于根据两两目标待处理图像的目标特征向量,确定两两目标待处理图像所属的理赔案件是否为欺诈案件。
在一个实施例中,所述装置1400还包括:定时获取模块,用于定时获取原始图像以及原始图像对应的案件关联参数;目标检测模块,用于通过目标检测模型对原始图像进行检测,在检测原始图像中存在目标对象时,得到目标对象区域;图像分割模块,用于通过图像分割模型对目标对象区域和除目标对象区域外的背景区域进行分割,获取背景区域;图像填充模块,用于对目标对象区域进行填充,得到待处理图像;特征提取模块,用于通过图像特征提取模型对待处理图像进行特征提取,得到待处理图像对应的图像特征向量;保存模块,用于将待处理图像、待处理图像对应的图像特征向量和案件关联参数保存至图像数据库中。
在一个实施例中,图像分割模块,包括:获取单元,用于获取目标对象区域和背景区域分别对应的分割结果;比例计算单元,用于根据背景区域的尺寸和原始图像的尺寸,确定背景区域所占比例;比较单元,用于获取背景区域所占比例大于阈值的目标原始图像;抠图单元,用于根据分割结果,对目标原始图像中的目标对象区域进行抠图处理,得到背景区域。
在一个实施例中,目标对象为车辆和行人中的至少一种。
在一个实施例中,文本特征向量生成模块1404,包括:分词处理单元,用于对每个目标待处理图像的地点文本信息进行分词处理,得到多个分词单元;查找单元,用于在预先生成的词向量表中查找与每个分词单元对应的词向量,得到地点文本信息对应的词向量序列;文本特征向量生成单元,用于根据地点文本信息对应的词向量序列生成每个目标待处理图像对应的文本特征向量。
在一个实施例中,文本特征向量生成单元,用于通过句向量模型对词向量序列进行处理,生成每个目标待处理图像对应的文本特征向量。
在一个实施例中,结果生成模块1406,用于通过全连接网络对两两目标待处理图像的目标特征向量进行识别,确定两两目标待处理图像所属的理赔案件是否为欺诈案件。
关于保险理赔案件的反欺诈检测装置的具体限定可以参见上文中对于保险理赔案件的反欺诈检测方法的限定,在此不再赘述。上述保险理赔案件的反欺诈检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图15所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储多个案件的图像,图像间的相似度、每个图像对应的图像特征向量和案件关联参数等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种保险理赔案件的反欺诈检测方法。
本领域技术人员可以理解,图15中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取多个待处理图像、对每个待处理图像进行特征提取得到的图像特征向量以及每个待处理图像对应的案件关联参数;遍历多个待处理图像,确定两两待处理图像之间的相似度;根据相似度确定互为相似图像的两两目标待处理图像,两两目标待处理图像所属的理赔案件不同;根据每个目标待处理图像的案件关联参数,生成对应的文本特征向量;融合每个目标待处理图像对应的图像特征向量和文本特征向量,得到每个目标待处理图像的目标特征向量;根据两两目标待处理图像的目标特征向量,确定两两目标待处理图像所属的理赔案件是否为欺诈案件。
在一个实施例中,处理器执行计算机程序时实现以下步骤:
定时获取原始图像以及原始图像对应的案件关联参数;通过目标检测模型对原始图像进行检测,在检测原始图像中存在目标对象时,得到目标对象区域;通过图像分割模型对目标对象区域和除目标对象区域外的背景区域进行分割,获取背景区域;对目标对象区域进行填充,得到待处理图像;通过图像特征提取模型对待处理图像进行特征提取,得到待处理图像对应的图像特征向量;将待处理图像、待处理图像对应的图像特征向量和案件关联参数保存至图像数据库中。
在一个实施例中,处理器执行计算机程序时实现以下步骤:
获取目标对象区域和背景区域分别对应的分割结果;根据背景区域的尺寸和原始图像的尺寸,确定背景区域所占比例;获取背景区域所占比例大于阈值的目标原始图像;根据分割结果,对目标原始图像中的目标对象区域进行抠图处理,得到背景区域。
在一个实施例中,目标对象为车辆和行人中的至少一种。
在一个实施例中,处理器执行计算机程序时实现以下步骤:
对每个目标待处理图像的地点文本信息进行分词处理,得到多个分词单元;在预先生成的词向量表中查找与每个分词单元对应的词向量,得到地点文本信息对应的词向量序列;根据地点文本信息对应的词向量序列生成每个目标待处理图像对应的文本特征向量。
在一个实施例中,处理器执行计算机程序时实现以下步骤:
通过句向量模型对词向量序列进行处理,生成每个目标待处理图像对应的文本特征向量。
在一个实施例中,处理器执行计算机程序时实现以下步骤:
通过全连接网络对两两目标待处理图像的目标特征向量进行识别,确定两两目标待处理图像所属的理赔案件是否为欺诈案件。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取多个待处理图像、对每个待处理图像进行特征提取得到的图像特征向量以及每个待处理图像对应的案件关联参数;遍历多个待处理图像,确定两两待处理图像之间的相似度;根据相似度确定互为相似图像的两两目标待处理图像,两两目标待处理图像所属的理赔案件不同;根据每个目标待处理图像的案件关联参数,生成对应的文本特征向量;融合每个目标待处理图像对应的图像特征向量和文本特征向量,得到每个目标待处理图像的目标特征向量;根据两两目标待处理图像的目标特征向量,确定两两目标待处理图像所属的理赔案件是否为欺诈案件。
在一个实施例中,计算机程序被处理器执行时实现以下步骤:
定时获取原始图像以及原始图像对应的案件关联参数;通过目标检测模型对原始图像进行检测,在检测原始图像中存在目标对象时,得到目标对象区域;通过图像分割模型对目标对象区域和除目标对象区域外的背景区域进行分割,获取背景区域;对目标对象区域进行填充,得到待处理图像;通过图像特征提取模型对待处理图像进行特征提取,得到待处理图像对应的图像特征向量;将待处理图像、待处理图像对应的图像特征向量和案件关联参数保存至图像数据库中。
在一个实施例中,计算机程序被处理器执行时实现以下步骤:
获取目标对象区域和背景区域分别对应的分割结果;根据背景区域的尺寸和原始图像的尺寸,确定背景区域所占比例;获取背景区域所占比例大于阈值的目标原始图像;根据分割结果,对目标原始图像中的目标对象区域进行抠图处理,得到背景区域。
在一个实施例中,目标对象为车辆和行人中的至少一种。
在一个实施例中,计算机程序被处理器执行时实现以下步骤:
对每个目标待处理图像的地点文本信息进行分词处理,得到多个分词单元;在预先生成的词向量表中查找与每个分词单元对应的词向量,得到地点文本信息对应的词向量序列;根据地点文本信息对应的词向量序列生成每个目标待处理图像对应的文本特征向量。
在一个实施例中,计算机程序被处理器执行时实现以下步骤:
通过句向量模型对词向量序列进行处理,生成每个目标待处理图像对应的文本特征向量。
在一个实施例中,计算机程序被处理器执行时实现以下步骤:
通过全连接网络对两两目标待处理图像的目标特征向量进行识别,确定两两目标待处理图像所属的理赔案件是否为欺诈案件。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种保险理赔案件的反欺诈检测方法,其特征在于,所述方法包括:
获取多个待处理图像、对每个待处理图像进行特征提取得到的图像特征向量以及所述每个待处理图像对应的案件关联参数;
遍历所述多个待处理图像,确定两两待处理图像之间的相似度;
根据所述相似度确定互为相似图像的两两目标待处理图像,所述两两目标待处理图像所属的理赔案件不同;
根据每个目标待处理图像的案件关联参数,生成对应的文本特征向量;
融合所述每个目标待处理图像对应的图像特征向量和文本特征向量,得到所述每个目标待处理图像的目标特征向量;
根据所述两两目标待处理图像的目标特征向量,确定所述两两目标待处理图像所属的理赔案件是否为欺诈案件。
2.根据权利要求1所述的方法,其特征在于,在所述获取多个待处理图像、对每个待处理图像进行特征提取得到的图像特征向量以及所述每个待处理图像对应的案件关联参数之前,还包括:
定时获取原始图像以及所述原始图像对应的案件关联参数;
通过目标检测模型对所述原始图像进行检测,在检测所述原始图像中存在目标对象时,得到目标对象区域;
通过图像分割模型对所述目标对象区域和除所述目标对象区域外的背景区域进行分割,获取背景区域;
对所述目标对象区域进行填充,得到所述待处理图像;
通过图像特征提取模型对所述待处理图像进行特征提取,得到所述待处理图像对应的图像特征向量;
将所述待处理图像、所述待处理图像对应的图像特征向量和案件关联参数保存至图像数据库中。
3.根据权利要求2所述的方法,其特征在于,所述获取背景区域,包括:
获取所述目标对象区域和所述背景区域分别对应的分割结果;
根据所述背景区域的尺寸和所述原始图像的尺寸,确定背景区域所占比例;
获取背景区域所占比例大于阈值的目标原始图像;
根据所述分割结果,对所述目标原始图像中的目标对象区域进行抠图处理,得到所述背景区域。
4.根据权利要求2或3所述的方法,其特征在于,所述目标对象为车辆和行人中的至少一种。
5.根据权利要求1所述的方法,其特征在于,所述案件关联参数包括地点文本信息;所述根据每个目标待处理图像的案件关联参数,生成对应的文本特征向量,包括:
对所述每个目标待处理图像的地点文本信息进行分词处理,得到多个分词单元;
在预先生成的词向量表中查找与每个分词单元对应的词向量,得到所述地点文本信息对应的词向量序列;
根据所述地点文本信息对应的词向量序列生成所述每个目标待处理图像对应的文本特征向量。
6.根据权利要求5所述的方法,其特征在于,所述根据所述地点文本信息对应的词向量序列生成所述每个目标待处理图像对应的文本特征向量,包括:
通过句向量模型对所述词向量序列进行处理,生成所述每个目标待处理图像对应的文本特征向量。
7.根据权利要求1所述的方法,其特征在于,所述根据所述两两目标待处理图像的目标特征向量,确定所述两两目标待处理图像所属的理赔案件是否为欺诈案件,包括:
通过全连接网络对所述两两目标待处理图像的目标特征向量进行识别,确定所述两两目标待处理图像所属的理赔案件是否为欺诈案件。
8.一种保险理赔案件的反欺诈检测装置,其特征在于,所述装置包括:
获取模块,用于获取多个待处理图像、对每个待处理图像进行特征提取得到的图像特征向量以及所述每个待处理图像对应的案件关联参数;
相似度确定模块,用于遍历所述多个待处理图像,确定两两待处理图像之间的相似度;
相似图像确定模块,用于根据所述相似度确定互为相似图像的两两目标待处理图像,所述两两目标待处理图像所属的理赔案件不同;
文本特征向量生成模块,用于根据每个目标待处理图像的案件关联参数,生成对应的文本特征向量;
融合模块,用于根据融合所述每个目标待处理图像对应的图像特征向量和文本特征向量,得到所述每个目标待处理图像的目标特征向量;
结果生成模块,用于根据所述两两目标待处理图像的目标特征向量,确定所述两两目标待处理图像所属的理赔案件是否为欺诈案件。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011095456.2A CN112232971A (zh) | 2020-10-14 | 2020-10-14 | 反欺诈检测方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011095456.2A CN112232971A (zh) | 2020-10-14 | 2020-10-14 | 反欺诈检测方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112232971A true CN112232971A (zh) | 2021-01-15 |
Family
ID=74112794
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011095456.2A Pending CN112232971A (zh) | 2020-10-14 | 2020-10-14 | 反欺诈检测方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112232971A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114332954A (zh) * | 2022-03-10 | 2022-04-12 | 太平金融科技服务(上海)有限公司深圳分公司 | 车险欺诈分析方法、装置、计算机设备和存储介质 |
CN114357225A (zh) * | 2021-12-09 | 2022-04-15 | 之江实验室 | 基于跨案件图像比对的车险理赔欺诈风险识别方法和系统 |
CN114418780A (zh) * | 2022-03-11 | 2022-04-29 | 太平金融科技服务(上海)有限公司深圳分公司 | 欺诈团伙识别方法、装置、计算机设备和存储介质 |
CN116150341A (zh) * | 2023-04-23 | 2023-05-23 | 之江实验室 | 理赔事件检测方法、计算机设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108573286A (zh) * | 2018-05-10 | 2018-09-25 | 阿里巴巴集团控股有限公司 | 一种理赔业务的数据处理方法、装置、设备及服务器 |
CN110569698A (zh) * | 2018-08-31 | 2019-12-13 | 阿里巴巴集团控股有限公司 | 一种图像目标检测及语义分割方法和装置 |
CN111242315A (zh) * | 2020-01-08 | 2020-06-05 | 中保车服科技服务股份有限公司 | 车险人伤反欺诈方法、装置、计算机设备及存储介质 |
CN111652200A (zh) * | 2020-08-05 | 2020-09-11 | 爱保科技有限公司 | 车险案件中从图片区分多车的处理方法、装置及设备 |
-
2020
- 2020-10-14 CN CN202011095456.2A patent/CN112232971A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108573286A (zh) * | 2018-05-10 | 2018-09-25 | 阿里巴巴集团控股有限公司 | 一种理赔业务的数据处理方法、装置、设备及服务器 |
CN110569698A (zh) * | 2018-08-31 | 2019-12-13 | 阿里巴巴集团控股有限公司 | 一种图像目标检测及语义分割方法和装置 |
CN111242315A (zh) * | 2020-01-08 | 2020-06-05 | 中保车服科技服务股份有限公司 | 车险人伤反欺诈方法、装置、计算机设备及存储介质 |
CN111652200A (zh) * | 2020-08-05 | 2020-09-11 | 爱保科技有限公司 | 车险案件中从图片区分多车的处理方法、装置及设备 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114357225A (zh) * | 2021-12-09 | 2022-04-15 | 之江实验室 | 基于跨案件图像比对的车险理赔欺诈风险识别方法和系统 |
CN114357225B (zh) * | 2021-12-09 | 2024-05-24 | 之江实验室 | 基于跨案件图像比对的车险理赔欺诈风险识别方法和系统 |
CN114332954A (zh) * | 2022-03-10 | 2022-04-12 | 太平金融科技服务(上海)有限公司深圳分公司 | 车险欺诈分析方法、装置、计算机设备和存储介质 |
CN114418780A (zh) * | 2022-03-11 | 2022-04-29 | 太平金融科技服务(上海)有限公司深圳分公司 | 欺诈团伙识别方法、装置、计算机设备和存储介质 |
CN114418780B (zh) * | 2022-03-11 | 2022-08-09 | 太平金融科技服务(上海)有限公司深圳分公司 | 欺诈团伙识别方法、装置、计算机设备和存储介质 |
CN116150341A (zh) * | 2023-04-23 | 2023-05-23 | 之江实验室 | 理赔事件检测方法、计算机设备和存储介质 |
CN116150341B (zh) * | 2023-04-23 | 2023-07-18 | 之江实验室 | 理赔事件检测方法、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110569721B (zh) | 识别模型训练方法、图像识别方法、装置、设备及介质 | |
US11403876B2 (en) | Image processing method and apparatus, facial recognition method and apparatus, and computer device | |
CN112232971A (zh) | 反欺诈检测方法、装置、计算机设备和存储介质 | |
CN111950329A (zh) | 目标检测及模型训练方法、装置、计算机设备和存储介质 | |
CN111291264B (zh) | 基于机器学习的访问对象预测方法、装置和计算机设备 | |
CN109949154B (zh) | 客户信息分类方法、装置、计算机设备和存储介质 | |
CN109034086B (zh) | 车辆重识别方法、装置及系统 | |
CN109063921B (zh) | 客户风险预警的优化处理方法、装置、计算机设备和介质 | |
CN108681746A (zh) | 一种图像识别方法、装置、电子设备和计算机可读介质 | |
CN112926616B (zh) | 图像匹配方法和装置、电子设备、计算机可读存储介质 | |
CN109271957B (zh) | 人脸性别识别方法以及装置 | |
CN113254687B (zh) | 图像检索、图像量化模型训练方法、装置和存储介质 | |
CN112733652B (zh) | 图像目标识别方法、装置、计算机设备及可读存储介质 | |
CN116167010A (zh) | 具有智能迁移学习能力的电力系统异常事件快速识别方法 | |
CN113537206A (zh) | 推送数据检测方法、装置、计算机设备和存储介质 | |
CN110766075A (zh) | 轮胎区域图像比对方法、装置、计算机设备和存储介质 | |
CN116722992A (zh) | 一种基于多模态融合的诈骗网站识别方法及装置 | |
CN115797291B (zh) | 回路端子的识别方法、装置、计算机设备和存储介质 | |
CN110489592B (zh) | 视频分类方法、装置、计算机设备和存储介质 | |
CN114220078A (zh) | 一种目标重识别方法、装置和计算机可读存储介质 | |
CN110942179A (zh) | 一种自动驾驶路线规划方法、装置及车辆 | |
CN114880517B (zh) | 用于视频检索的方法及装置 | |
CN116959064B (zh) | 一种证件验证方法、装置、计算机设备和存储介质 | |
CN118608753B (zh) | 面向半监督旋转目标检测的密集伪标签方法、装置和设备 | |
CN118447620A (zh) | 货币识别方法、装置、电子设备、计算机可读存储介质和计算机程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |