CN116226430B - 一种增量式高精度图像过滤方法及系统 - Google Patents
一种增量式高精度图像过滤方法及系统 Download PDFInfo
- Publication number
- CN116226430B CN116226430B CN202310507111.0A CN202310507111A CN116226430B CN 116226430 B CN116226430 B CN 116226430B CN 202310507111 A CN202310507111 A CN 202310507111A CN 116226430 B CN116226430 B CN 116226430B
- Authority
- CN
- China
- Prior art keywords
- picture
- result
- information
- feature
- application
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/535—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/761—Proximity, similarity or dissimilarity measures
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Finance (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Accounting & Taxation (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种增量式高精度图像过滤方法及系统,应用于数据处理技术领域,该方法包括:通过接收客户端上传的理赔申请信息。通过第一增量学习模型进行特征提取,获取图片背景特征和图片标的特征,基于内嵌于服务器端的第二增量学习模型进行相似图片匹配,获取相似图片筛选结果。当相似图片筛选结果的背景相似度大于或等于第一相似度阈值,且标的相似度大于或等于第二相似度阈值时,利用第三增量学习模型进行复核。当生成复核通过指令,生成继续理赔指令执行后续流程,当生成异常确认指令,生成驳回理赔信息作为申请审核结果发送至客户端的显示界面。解决了现有技术中保险理赔案件存在理赔重复申请的识别效率低,识别准确率低的技术问题。
Description
技术领域
本发明涉及数据处理领域,尤其涉及一种增量式高精度图像过滤方法及系统。
背景技术
在现有技术中保险理赔案件仅需要投保人员提供图片信息,导致客户利用重复图像进行多次理赔申请的情况,而传统的人工审核时审核效率低,难以发现理赔申请异常,对于重复申请理赔案件的识别准确率低。
因此,在现有技术中保险理赔案件存在理赔重复申请的识别效率低,识别准确率低的技术问题。
发明内容
本申请通过提供一种增量式高精度图像过滤方法及系统,解决了在现有技术中保险理赔案件存在理赔重复申请的识别效率低,识别准确率低的技术问题。
本申请提供一种增量式高精度图像过滤方法,应用于服务器端,包括:接收客户端上传的理赔申请信息,所述理赔申请信息包括理赔申请书和理赔申请图片信息,所述理赔申请书为pdf格式;对所述理赔申请图片信息基于内嵌于所述服务器端的第一增量学习模型进行特征提取,获取图片背景特征和图片标的特征;将所述图片背景特征和所述图片标的特征输入客户端所属用户的已处理申请图片库,基于内嵌于所述服务器端的第二增量学习模型进行相似图片匹配,获取相似图片筛选结果;当所述相似图片筛选结果的背景相似度大于或等于第一相似度阈值,且所述相似图片筛选结果的标的相似度大于或等于第二相似度阈值时,根据所述相似图片筛选结果、所述理赔申请书和所述理赔申请图片信息生成异常申请信息发送给内嵌于所述服务器端的第三增量学习模型进行复核;当生成复核通过指令,生成继续理赔指令执行后续流程,当生成异常确认指令,生成驳回理赔信息作为申请审核结果发送至所述客户端的显示界面。
本申请还提供了一种增量式高精度图像过滤系统,包括:信息获取模块,用于接收客户端上传的理赔申请信息,所述理赔申请信息包括理赔申请书和理赔申请图片信息,所述理赔申请书为pdf格式;特征提取模块,用于对所述理赔申请图片信息基于内嵌于服务器端的第一增量学习模型进行特征提取,获取图片背景特征和图片标的特征;图片筛选模块,用于将所述图片背景特征和所述图片标的特征输入客户端所属用户的已处理申请图片库,基于内嵌于所述服务器端的第二增量学习模型进行相似图片匹配,获取相似图片筛选结果;识别复核模块,用于当所述相似图片筛选结果的背景相似度大于或等于第一相似度阈值,且所述相似图片筛选结果的标的相似度大于或等于第二相似度阈值时,根据所述相似图片筛选结果、所述理赔申请书和所述理赔申请图片信息生成异常申请信息发送给内嵌于所述服务器端的第三增量学习模型进行复核;显示发送模块,用于当生成复核通过指令,生成继续理赔指令执行后续流程,当生成异常确认指令,生成驳回理赔信息作为申请审核结果发送至所述客户端的显示界面。
本申请还提供了一种电子设备,包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现本申请提供的一种增量式高精度图像过滤方法。
本申请提供一种计算机可读存储介质,存储有计算机程序,该程序被处理器执行时,实现本申请提供的一种增量式高精度图像过滤方法。
拟通过本申请提出的一种增量式高精度图像过滤方法及系统,通过接收客户端上传的理赔申请信息。通过第一增量学习模型进行特征提取,获取图片背景特征和图片标的特征,基于内嵌于所述服务器端的第二增量学习模型进行相似图片匹配,获取相似图片筛选结果。当所述相似图片筛选结果的背景相似度大于或等于第一相似度阈值,且所述相似图片筛选结果的标的相似度大于或等于第二相似度阈值时,利用第三增量学习模型进行复核。当生成复核通过指令,生成继续理赔指令执行后续流程,当生成异常确认指令,生成驳回理赔信息作为申请审核结果发送至所述客户端的显示界面。解决了现有技术中保险理赔案件存在理赔重复申请的识别效率低,识别准确率低的技术问题。通过对图像特征以及理赔申请书中记载内容的识别提取,提高了保险理赔案件中理赔重复申请异常行为的获取效率,并提高了理赔异常行为判断的准确性。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对本公开实施例的附图作简单地介绍。明显地,下面描述中的附图仅仅涉及本公开的一些实施例,而非对本公开的限制。
图1为本申请实施例提供的一种增量式高精度图像过滤方法的流程示意图;
图2为本申请实施例提供的一种增量式高精度图像过滤方法生成图片背景特征的流程示意图;
图3为本申请实施例提供的一种增量式高精度图像过滤方法获取复核结果信息的流程示意图;
图4为本申请实施例提供的一种增量式高精度图像过滤方法的系统的结构示意图;
图5为本发明实施例提供的一种增量式高精度图像过滤方法的系统电子设备的结构示意图。
附图标记说明:信息获取模块11,特征提取模块12,图片筛选模块13,识别复核模块14,显示发送模块15,处理器31,存储器32,输入装置33,输出装置34。
具体实施方式
在一种优选的实施方式中,为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
在以下的描述中,所涉及的术语“第一\第二\第三”仅仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的。
虽然本申请对根据本申请的实施例的系统中的某些模块做出了各种引用,然而,任何数量的不同模块可以被使用并运行在用户终端和/或服务器上,所述模块仅是说明性的,并且所述系统和方法的不同方面可以使用不同模块。
本申请中使用了流程图来说明根据本申请的实施例的系统所执行的操作。应当理解的是,前面或下面操作不一定按照顺序来精确地执行。相反,根据需要,可以按照倒序或同时处理各种步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
如图1所示,本申请实施例提供了一种增量式高精度图像过滤方法,应用于服务器端,所述方法包括:
S10:接收客户端上传的理赔申请信息,所述理赔申请信息包括理赔申请书和理赔申请图片信息,所述理赔申请书为pdf格式;
S20:对所述理赔申请图片信息基于内嵌于所述服务器端的第一增量学习模型进行特征提取,获取图片背景特征和图片标的特征;
S30:将所述图片背景特征和所述图片标的特征输入客户端所属用户的已处理申请图片库,基于内嵌于所述服务器端的第二增量学习模型进行相似图片匹配,获取相似图片筛选结果;
具体的,在现有技术中无人查勘由于仅需要提供图片信息,导致客户利用重复图像进行多次理赔申请的情况,而传统的人工审核时审核效率低,难以发现理赔申请异常,对于重复申请理赔案件的识别准确率低。通过接收客户端上传的理赔申请信息,所述理赔申请信息包括理赔申请书和理赔申请图片信息,所述理赔申请书为pdf格式,在理赔申请书中包含具体的理赔类别、理赔金额等相关信息。随后,对理赔申请图片信息基于内嵌于所述服务器端的第一增量学习模型进行特征提取,获取图片背景特征和图片标的特征,其中图片背景特征为理赔申请图片信息中除理赔标的外的特征。图片标的特征为理赔申请图片信息中理赔标的具体的特征。进一步,将图片背景特征和所述图片标的特征输入客户端所属用户的已处理申请图片库,即对应客户已经处理过的理赔申请的图片库,基于内嵌于所述服务器端的第二增量学习模型进行相似图片匹配,获取相似图片筛选结果。其中,第二增量学习模型用于进行图像的相似匹配,筛选其中相似的图片,避免用户重复提出理赔申请。
如图2所示,本申请实施例提供的方法S20还包括:
S21:所述第一增量学习模型包括背景特征提取子构件和标的特征提取子构件;
S22:获取申请理赔保险编号匹配理赔标的类型,结合所述理赔申请图片信息输入所述标的特征提取子构件,获取所述图片标的特征;
S23:将所述理赔申请图片信息输入所述第一增量学习模型的所述背景特征提取子构件,获取初始背景特征信息;
S24:将所述图片标的特征从所述初始背景特征信息筛除,生成所述图片背景特征。
具体的,所述第一增量学习模型包括背景特征提取子构件和标的特征提取子构件。其中,增量学习模型中每一个子构件都是独立的功能单元,执行自己对应的功能,缺少部分子构件,仍不影响服务器工作,同一个增量学习模型中的子构件可以互相结合,形成新的功能模块,也可以根据需求功能增加新的子构件。背景特征提取子构件和标的特征提取子构件分别为独立的功能单元,背景特征提取子构件用于进行背景特征提取以及背景类别提取,标的特征提取子构件用于提取保险的标的即理赔对象。进一步,获取申请理赔保险编号匹配理赔标的类型,其中,理赔标的类型为具体的险种类别,如车险、财险等其他险种,结合所述理赔申请图片信息输入所述标的特征提取子构件,获取所述图片标的特征。将所述理赔申请图片信息输入所述第一增量学习模型的所述背景特征提取子构件,获取初始背景特征信息。最后,将所述图片标的特征从所述初始背景特征信息筛除,进而获取更为准确的背景特征信息,生成所述图片背景特征。
本申请实施例提供的方法S21还包括:
S211:构建第一特征提取规则,对图片集进行处理,获取多组特征标识结果;
S212:根据所述图片集和所述多组特征标识结果进行有监督训练,生成所述背景特征提取子构件;
S213:根据所述图片集、所述图片集的任意一张图片的包含物的属性信息和所述图片集的任意一张图片的包含物的特征标识结果进行有监督训练,生成所述标的特征提取子构件。
具体的,构建第一特征提取规则,对图片集进行处理,获取多组特征标识结果。根据获取的图片集和所述多组特征标识结果对神经网络模型进行有监督训练,直至模型的输出结果满足预设准确率时,生成所述背景特征提取子构件。进一步,对图片集合中的包含物的属性信息进行标识,获取图片集包含物的属性信息对应的特征标识结果。根据所述图片集、所述图片集的任意一张图片的包含物的属性信息即图片中包含的物品类型数据和所述图片集的任意一张图片的包含物的特征标识结果即对应物品类型的特征数据对神经网络模型进行有监督训练,其中,图片集合中的包含物的属性信息与图片集的包含物的特征标识结果存在对应关系。直至模型的输出结果满足预设准确率时,生成所述标的特征提取子构件。
本申请实施例提供的方法S21还包括:
S214:构建所述第一特征提取规则,包括,
获取特征框选窗口,所述特征框选窗口的尺寸与图片尺寸具有第一预设比例,且所述特征框选窗口的中心点与任意一个图片像素点重合;
S215:基于ORB算法,构建特征提取模块,包括,
S216:基于Harris角点检测算法,构建特征点检测子模块;以及
S217:基于Rotated BRIEF特征点描述算法,构建特征点描述子模块;
S218:对所述图片集进行处理,获取所述多组特征标识结果,包括,
根据所述特征框选窗口对所述图片集的任意一张进行框选,将框选结果输入所述特征提取模块的所述特征点检测子模块,获取特征点识别结果,所述特征点识别结果包括角点区域或平坦区域或边缘区域;
S219:当所述框选结果属于所述角点区域时,将所述框选结果的中心点所在像素点设为特征点,将所述框选结果输入所述特征点描述子模块,获取特征点描述子;
S2191:将所述特征点和所述特征点描述子关联存储后添加进所述图片集的任意一张的特征标识结果,添加进所述多组特征标识结果。
具体的,构建第一特征提取规则,包括,获取特征框选窗口,其中特征框选窗口用于对图像中特征进行框选,所述特征框选窗口的尺寸与图片尺寸具有第一预设比例,且所述特征框选窗口的中心点与任意一个图片像素点重合。随后,基于ORB算法,构建特征提取模块,基于Harris角点检测算法,构建特征点检测子模块。进一步,基于Rotated BRIEF特征点描述算法,构建特征点描述子模块。即通过Harris角点检测算法构建特征点检测子模块从而完成图像特征点检测。通过所述特征框选窗口对所述图片集中的任意一张进行框选,将框选结果输入所述特征提取模块的所述特征点检测子模块,获取特征点识别结果,所述特征点识别结果包括角点区域或平坦区域或边缘区域。当所述框选结果属于所述角点区域时,将所述框选结果的中心点所在像素点设为特征点,将所述框选结果输入所述特征点描述子模块,即当框选结果属于所述角点区域时通过将框选结果输入特征点描述子模块,利用Rotated BRIEF特征点描述算法,进而获取特征点描述子。最后,将所述特征点和所述特征点描述子关联存储后添加进所述图片集的任意一张的特征标识结果,添加进所述多组特征标识结果。
本申请实施例提供的方法S30还包括:
S31:所述第二增量学习模型包括汉明距离计算子构件和相似图片筛选子构件;
S32:获取所述已处理申请图片库的任意一张图片的背景记录特征和标的记录特征,基于所述汉明距离计算子构件对所述背景记录特征与所述图片背景特征进行汉明距离计算,获取第一计算结果,对所述标的记录特征与所述图片标的特征进行汉明距离计算,获取第二计算结果;
S33:将所述已处理申请图片库的图片按照所述第一计算结果自大到小进行排序,获取第一排序结果;
S34:将所述已处理申请图片库的图片按照所述第二计算结果自大到小进行排序,获取第二排序结果;
S35:将所述第一排序结果和所述第二排序结果输入所述相似图片筛选子构件,获取所述相似图片筛选结果,其中,所述相似图片筛选子构件用于筛选所述第一排序结果和所述第二排序结果的交集排序图片的自首至尾的N张图片,1≤N≤6,N为整数。
具体的,所述第二增量学习模型包括汉明距离计算子构件和相似图片筛选子构件,其中汉明距离计算时比较向量的每一位是否相同,若不同则汉明距离加1,这样即可得到汉明距离。向量相似度越高,对应的汉明距离越小。由于基于ORB算法,构建特征提取模块,获取的特征结果均为都是二进制数字,对应的相似度计算效率较高,从而可以快速对相似的图片进行计算筛选。
在具体获取筛选结果时,通过特征提取模块获取所述已处理申请图片库的任意一张图片的背景记录特征和标的记录特征,基于所述汉明距离计算子构件对所述背景记录特征与所述图片背景特征进行汉明距离计算,获取第一计算结果,对所述标的记录特征与所述图片标的特征进行汉明距离计算,获取第二计算结果。获取已处理申请图片库中所有图片的第一计算结果与第二计算结果,并将所述已处理申请图片库的图片按照所述第一计算结果自大到小进行排序,获取第一排序结果。将所述已处理申请图片库的图片按照所述第二计算结果自大到小进行排序,获取第二排序结果。最后,将所述第一排序结果和所述第二排序结果输入所述相似图片筛选子构件,通过相似图片筛选子构件获取所述相似图片筛选结果,其中,所述相似图片筛选子构件用于筛选所述第一排序结果和所述第二排序结果的交集排序图片的自首至尾的N张图片,1≤N≤6,N为整数。在获取交集排序图片的自首至尾的N张图片时,通过获取在第一排序结果和第二排序结果中存在对应关系的排序图片组,在排序图片组中包含第一排序结果中的图片以及第二排序结果中的图片,分别计算各排序图片组中的总汉明距离,根据总汉明距离进行排序,获取其中自首至尾的N张图片,即交集排序图片的自首至尾的N张图片。
S40:当所述相似图片筛选结果的背景相似度大于或等于第一相似度阈值,且所述相似图片筛选结果的标的相似度大于或等于第二相似度阈值时,根据所述相似图片筛选结果、所述理赔申请书和所述理赔申请图片信息生成异常申请信息发送给内嵌于所述服务器端的第三增量学习模型进行复核;
S50:当生成复核通过指令,生成继续理赔指令执行后续流程,当生成异常确认指令,生成驳回理赔信息作为申请审核结果发送至所述客户端的显示界面。
具体的,设置第一相似度阈值、第二相似度阈值,其中第一相似度阈值为背景相似度阈值,第二相似度阈值为标的相似度阈值,当背景相似度阈值大于或等于第一相似度阈值时此时图像背景相似度较高,随后,判断所述相似图片筛选结果的标的相似度是否大于或等于第二相似度阈值,当大于或等于第二相似度阈值,此时图片相似度较高。根据所述相似图片筛选结果、所述理赔申请书和所述理赔申请图片信息生成异常申请信息发送给内嵌于所述服务器端的第三增量学习模型进行复核。当生成复核通过指令,生成继续理赔指令执行后续流程,当生成异常确认指令,生成驳回理赔信息作为申请审核结果发送至所述客户端的显示界面。通过对图像特征以及理赔申请书中记载内容的识别提取,提高了保险理赔案件中理赔重复申请异常行为的获取效率,并提高了理赔异常行为判断的准确性。
如图3所示,本申请实施例提供的方法S40还包括:
S41:所述第三增量学习模型包括OCR文字提取子构件和异常复核子构件;
S42:将所述理赔申请书输入所述OCR文字提取子构件,获取OCR文字提取结果,所述OCR文字提取结果包括申请理赔标的物类型信息;
S43:将所述申请理赔标的物类型信息输入所述异常复核子构件,获取复核结果信息,其中,所述异常复核子构件用于判断所述申请理赔标的物类型信息是否属于所述相似图片筛选结果的标的:
S44:若属于,生成所述异常确认指令作为所述复核结果信息,若不属于,生成所述复核通过指令作为所述复核结果信息。
具体的,第三增量学习模型包括OCR文字提取子构件和异常复核子构件。其中OCR文字提取子构件用于提取pdf格式中的文字,将所述理赔申请书输入所述OCR文字提取子构件,获取OCR文字提取结果,所述OCR文字提取结果包括申请理赔标的物类型信息。随后,将所述申请理赔标的物类型信息输入所述异常复核子构件,获取复核结果信息,其中,所述异常复核子构件用于判断所述申请理赔标的物类型信息是否属于所述相似图片筛选结果的标的,即获取相似图片筛选结果中记录的标的与申请理赔标的物类型信息比较,判断二者是否一致。若属于,则历史理赔结果中相似图片筛选结果与申请理赔标的物类型信息一致,则存在异常理赔情况,生成所述异常确认指令作为所述复核结果信息。若不属于,则历史理赔结果中相似图片筛选结果与申请理赔标的物类型信息不一致,则不存在异常理赔情况,对应生成所述复核通过指令作为所述复核结果信息。
本申请实施例提供的方法S50还包括:
S51;当满足预设增量周期时,获取预设增量构件信息;
S52:根据所述预设增量构件信息对所述服务器端进行增量学习。
具体的,设置预设增量周期,即增量模型更新周期,当满足预设增量周期时,获取预设增量构件信息,对第一、第二、第三增量学习模型进行构件新增,比如增加特征提取的图片细化筛选等其他具体的构件。最后,根据所述预设增量构件信息对所述服务器端进行增量学习,从而实现对增量学习模型的更新。
本发明实施例所提供的技术方案,通过接收客户端上传的理赔申请信息。通过第一增量学习模型进行特征提取,获取图片背景特征和图片标的特征,基于内嵌于服务器端的第二增量学习模型进行相似图片匹配,获取相似图片筛选结果。当相似图片筛选结果的背景相似度大于或等于第一相似度阈值,且标的相似度大于或等于第二相似度阈值时,利用第三增量学习模型进行复核。当生成复核通过指令,生成继续理赔指令执行后续流程,当生成异常确认指令,生成驳回理赔信息作为申请审核结果发送至客户端的显示界面。实现了对图像特征以及理赔申请书中记载内容的识别提取,提高了保险理赔案件中理赔重复申请异常行为的获取效率,并提高了理赔异常行为判断的准确性。解决了现有技术中保险理赔案件存在理赔重复申请的识别效率低,识别准确率低的技术问题。
在一种优选的实施方式中,基于与前述实施方式中一种增量式高精度图像过滤方法同样发明构思,本发明还提供了一种增量式高精度图像过滤方法的系统,系统可以由硬件和/或软件的方式来实现,一般可集成于电子设备中,用于执行本发明任意实施例所提供的方法。如图4所示,所述系统包括:
信息获取模块11,用于接收客户端上传的理赔申请信息,所述理赔申请信息包括理赔申请书和理赔申请图片信息,所述理赔申请书为pdf格式;
特征提取模块12,用于对所述理赔申请图片信息基于内嵌于服务器端的第一增量学习模型进行特征提取,获取图片背景特征和图片标的特征;
图片筛选模块13,用于将所述图片背景特征和所述图片标的特征输入客户端所属用户的已处理申请图片库,基于内嵌于所述服务器端的第二增量学习模型进行相似图片匹配,获取相似图片筛选结果;
识别复核模块14,用于当所述相似图片筛选结果的背景相似度大于或等于第一相似度阈值,且所述相似图片筛选结果的标的相似度大于或等于第二相似度阈值时,根据所述相似图片筛选结果、所述理赔申请书和所述理赔申请图片信息生成异常申请信息发送给内嵌于所述服务器端的第三增量学习模型进行复核;
显示发送模块15,用于当生成复核通过指令,生成继续理赔指令执行后续流程,当生成异常确认指令,生成驳回理赔信息作为申请审核结果发送至所述客户端的显示界面。
进一步地,所述特征提取模块12还用于:
所述第一增量学习模型包括背景特征提取子构件和标的特征提取子构件;
获取申请理赔保险编号匹配理赔标的类型,结合所述理赔申请图片信息输入所述标的特征提取子构件,获取所述图片标的特征;
将所述理赔申请图片信息输入所述特征提取构件的所述背景特征提取子构件,获取初始背景特征信息;
将所述图片标的特征从所述初始背景特征信息筛除,生成所述图片背景特征。
进一步地,所述特征提取模块12还用于:
构建第一特征提取规则,对图片集进行处理,获取多组特征标识结果;
根据所述图片集和所述多组特征标识结果进行有监督训练,生成所述背景特征提取子构件;
根据所述图片集、所述图片集的任意一张图片的包含物的属性信息和所述图片集的任意一张图片的包含物的特征标识结果进行有监督训练,生成所述标的特征提取子构件。
进一步地,所述特征提取模块12还用于:
构建所述第一特征提取规则,包括,
获取特征框选窗口,所述特征框选窗口的尺寸与图片尺寸具有第一预设比例,且所述特征框选窗口的中心点与任意一个图片像素点重合;
基于ORB算法,构建特征提取模块,包括,
基于Harris角点检测算法,构建特征点检测子模块;以及
基于Rotated BRIEF特征点描述算法,构建特征点描述子模块;
对所述图片集进行处理,获取所述多组特征标识结果,包括,
根据所述特征框选窗口对所述图片集的任意一张进行框选,将框选结果输入所述特征提取模块的所述特征点检测子模块,获取特征点识别结果,所述特征点识别结果包括角点区域或平坦区域或边缘区域;
当所述框选结果属于所述角点区域时,将所述框选结果的中心点所在像素点设为特征点,将所述框选结果输入所述特征点描述子模块,获取特征点描述子;
将所述特征点和所述特征点描述子关联存储后添加进所述图片集的任意一张的特征标识结果,添加进所述多组特征标识结果。
进一步地,所述图片筛选模块13还用于:
所述第二增量学习模型包括汉明距离计算子构件和相似图片筛选子构件;
获取所述已处理申请图片库的任意一张图片的背景记录特征和标的记录特征,基于所述汉明距离计算子构件对所述背景记录特征与所述图片背景特征进行汉明距离计算,获取第一计算结果,对所述标的记录特征与所述图片标的特征进行汉明距离计算,获取第二计算结果;
将所述已处理申请图片库的图片按照所述第一计算结果自大到小进行排序,获取第一排序结果;
将所述已处理申请图片库的图片按照所述第二计算结果自大到小进行排序,获取第二排序结果;
将所述第一排序结果和所述第二排序结果输入所述相似图片筛选子构件,获取所述相似图片筛选结果,其中,所述相似图片筛选子构件用于筛选所述第一排序结果和所述第二排序结果的交集排序图片的自首至尾的N张图片,1≤N≤6,N为整数。
进一步地,所述识别复核模块14还用于:
所述第三增量学习模型包括OCR文字提取子构件和异常复核子构件;
将所述理赔申请书输入所述OCR文字提取子构件,获取OCR文字提取结果,所述OCR文字提取结果包括申请理赔标的物类型信息;
将所述申请理赔标的物类型信息输入所述异常复核子构件,获取复核结果信息,其中,所述异常复核子构件用于判断所述申请理赔标的物类型信息是否属于所述相似图片筛选结果的标的:
若属于,生成所述异常确认指令作为所述复核结果信息,若不属于,生成所述复核通过指令作为所述复核结果信息。
进一步地,所述显示发送模块15还用于:
当满足预设增量周期时,获取预设增量构件信息;
根据所述预设增量构件信息对所述服务器端进行增量学习。
所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
在一种优选的实施方式中,图5为本发明提供的电子设备的结构示意图,示出了适于用来实现本发明实施方式的示例性电子设备的框图。图5显示的电子设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。如图5所示,该电子设备包括处理器31、存储器32、输入装置33及输出装置34;电子设备中处理器31的数量可以是一个或多个,图5中以一个处理器31为例,电子设备中的处理器31、存储器32、输入装置33及输出装置34可以通过总线或其他方式连接,图5中以通过总线连接为例。
存储器32作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的一种增量式高精度图像过滤方法对应的程序指令/模块。处理器31通过运行存储在存储器32中的软件程序、指令以及模块,从而执行计算机设备的各种功能应用以及数据处理,即实现上述一种增量式高精度图像过滤方法。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (5)
1.一种增量式高精度图像过滤方法,其特征在于,应用于服务器端,包括:
接收客户端上传的理赔申请信息,所述理赔申请信息包括理赔申请书和理赔申请图片信息,所述理赔申请书为pdf格式;
对所述理赔申请图片信息基于内嵌于所述服务器端的第一增量学习模型进行特征提取,获取图片背景特征和图片标的特征包括:
所述第一增量学习模型包括背景特征提取子构件和标的特征提取子构件,包括:
构建第一特征提取规则,对图片集进行处理,获取多组特征标识结果,包括:
构建所述第一特征提取规则,包括,
获取特征框选窗口,所述特征框选窗口的尺寸与图片尺寸具有第一预设比例,且所述特征框选窗口的中心点与任意一个图片像素点重合;
基于ORB算法,构建特征提取模块,包括,
基于Harris角点检测算法,构建特征点检测子模块;以及
基于Rotated BRIEF特征点描述算法,构建特征点描述子模块;
对所述图片集进行处理,获取所述多组特征标识结果,包括,
根据所述特征框选窗口对所述图片集的任意一张进行框选,将框选结果输入所述特征提取模块的所述特征点检测子模块,获取特征点识别结果,所述特征点识别结果包括角点区域或平坦区域或边缘区域;
当所述框选结果属于所述角点区域时,将所述框选结果的中心点所在像素点设为特征点,将所述框选结果输入所述特征点描述子模块,获取特征点描述子;
将所述特征点和所述特征点描述子关联存储后添加进所述图片集的任意一张的特征标识结果,添加进所述多组特征标识结果;
根据所述图片集和所述多组特征标识结果进行有监督训练,生成所述背景特征提取子构件;
根据所述图片集、所述图片集的任意一张图片的包含物的属性信息和所述图片集的任意一张图片的包含物的特征标识结果进行有监督训练,生成所述标的特征提取子构件;
获取申请理赔保险编号匹配理赔标的类型,结合所述理赔申请图片信息输入所述标的特征提取子构件,获取所述图片标的特征;
将所述理赔申请图片信息输入所述第一增量学习模型的所述背景特征提取子构件,获取初始背景特征信息;
将所述图片标的特征从所述初始背景特征信息筛除,生成所述图片背景特征;
将所述图片背景特征和所述图片标的特征输入客户端所属用户的已处理申请图片库,基于内嵌于所述服务器端的第二增量学习模型进行相似图片匹配,获取相似图片筛选结果,包括:
所述第二增量学习模型包括汉明距离计算子构件和相似图片筛选子构件;
获取所述已处理申请图片库的任意一张图片的背景记录特征和标的记录特征,基于所述汉明距离计算子构件对所述背景记录特征与所述图片背景特征进行汉明距离计算,获取第一计算结果,对所述标的记录特征与所述图片标的特征进行汉明距离计算,获取第二计算结果;
将所述已处理申请图片库的图片按照所述第一计算结果自大到小进行排序,获取第一排序结果;
将所述已处理申请图片库的图片按照所述第二计算结果自大到小进行排序,获取第二排序结果;
将所述第一排序结果和所述第二排序结果输入所述相似图片筛选子构件,获取所述相似图片筛选结果,其中,所述相似图片筛选子构件用于筛选所述第一排序结果和所述第二排序结果的交集排序图片的自首至尾的N张图片,1≤N≤6,N为整数;
当所述相似图片筛选结果的背景相似度大于或等于第一相似度阈值,且所述相似图片筛选结果的标的相似度大于或等于第二相似度阈值时,根据所述相似图片筛选结果、所述理赔申请书和所述理赔申请图片信息生成异常申请信息发送给内嵌于所述服务器端的第三增量学习模型进行复核,包括:
所述第三增量学习模型包括OCR文字提取子构件和异常复核子构件;
将所述理赔申请书输入所述OCR文字提取子构件,获取OCR文字提取结果,所述OCR文字提取结果包括申请理赔标的物类型信息;
将所述申请理赔标的物类型信息输入所述异常复核子构件,获取复核结果信息,其中,所述异常复核子构件用于判断所述申请理赔标的物类型信息是否属于所述相似图片筛选结果的标的:
若属于,生成异常确认指令作为所述复核结果信息,若不属于,生成所述复核通过指令作为所述复核结果信息;
当生成复核通过指令,生成继续理赔指令执行后续流程,当生成异常确认指令,生成驳回理赔信息作为申请审核结果发送至所述客户端的显示界面。
2.如权利要求1所述的方法,其特征在于,还包括:
当满足预设增量周期时,获取预设增量构件信息;
根据所述预设增量构件信息对所述服务器端进行增量学习。
3.一种增量式高精度图像过滤系统,其特征在于,包括:
信息获取模块,用于接收客户端上传的理赔申请信息,所述理赔申请信息包括理赔申请书和理赔申请图片信息,所述理赔申请书为pdf格式;
特征提取模块,用于对所述理赔申请图片信息基于内嵌于服务器端的第一增量学习模型进行特征提取,获取图片背景特征和图片标的特征,包括:
所述第一增量学习模型包括背景特征提取子构件和标的特征提取子构件,包括:
构建第一特征提取规则,对图片集进行处理,获取多组特征标识结果,包括:
构建所述第一特征提取规则,包括,
获取特征框选窗口,所述特征框选窗口的尺寸与图片尺寸具有第一预设比例,且所述特征框选窗口的中心点与任意一个图片像素点重合;
基于ORB算法,构建特征提取模块,包括,
基于Harris角点检测算法,构建特征点检测子模块;以及
基于Rotated BRIEF特征点描述算法,构建特征点描述子模块;
对所述图片集进行处理,获取所述多组特征标识结果,包括,
根据所述特征框选窗口对所述图片集的任意一张进行框选,将框选结果输入所述特征提取模块的所述特征点检测子模块,获取特征点识别结果,所述特征点识别结果包括角点区域或平坦区域或边缘区域;
当所述框选结果属于所述角点区域时,将所述框选结果的中心点所在像素点设为特征点,将所述框选结果输入所述特征点描述子模块,获取特征点描述子;
将所述特征点和所述特征点描述子关联存储后添加进所述图片集的任意一张的特征标识结果,添加进所述多组特征标识结果;
根据所述图片集和所述多组特征标识结果进行有监督训练,生成所述背景特征提取子构件;
根据所述图片集、所述图片集的任意一张图片的包含物的属性信息和所述图片集的任意一张图片的包含物的特征标识结果进行有监督训练,生成所述标的特征提取子构件;
获取申请理赔保险编号匹配理赔标的类型,结合所述理赔申请图片信息输入所述标的特征提取子构件,获取所述图片标的特征;
将所述理赔申请图片信息输入所述第一增量学习模型的所述背景特征提取子构件,获取初始背景特征信息;
将所述图片标的特征从所述初始背景特征信息筛除,生成所述图片背景特征;
图片筛选模块,用于将所述图片背景特征和所述图片标的特征输入客户端所属用户的已处理申请图片库,基于内嵌于所述服务器端的第二增量学习模型进行相似图片匹配,获取相似图片筛选结果,包括:
所述第二增量学习模型包括汉明距离计算子构件和相似图片筛选子构件;
获取所述已处理申请图片库的任意一张图片的背景记录特征和标的记录特征,基于所述汉明距离计算子构件对所述背景记录特征与所述图片背景特征进行汉明距离计算,获取第一计算结果,对所述标的记录特征与所述图片标的特征进行汉明距离计算,获取第二计算结果;
将所述已处理申请图片库的图片按照所述第一计算结果自大到小进行排序,获取第一排序结果;
将所述已处理申请图片库的图片按照所述第二计算结果自大到小进行排序,获取第二排序结果;
将所述第一排序结果和所述第二排序结果输入所述相似图片筛选子构件,获取所述相似图片筛选结果,其中,所述相似图片筛选子构件用于筛选所述第一排序结果和所述第二排序结果的交集排序图片的自首至尾的N张图片,1≤N≤6,N为整数;
识别复核模块,用于当所述相似图片筛选结果的背景相似度大于或等于第一相似度阈值,且所述相似图片筛选结果的标的相似度大于或等于第二相似度阈值时,根据所述相似图片筛选结果、所述理赔申请书和所述理赔申请图片信息生成异常申请信息发送给内嵌于所述服务器端的第三增量学习模型进行复核,包括:
所述第三增量学习模型包括OCR文字提取子构件和异常复核子构件;
将所述理赔申请书输入所述OCR文字提取子构件,获取OCR文字提取结果,所述OCR文字提取结果包括申请理赔标的物类型信息;
将所述申请理赔标的物类型信息输入所述异常复核子构件,获取复核结果信息,其中,所述异常复核子构件用于判断所述申请理赔标的物类型信息是否属于所述相似图片筛选结果的标的:
若属于,生成异常确认指令作为所述复核结果信息,若不属于,生成所述复核通过指令作为所述复核结果信息;
显示发送模块,用于当生成复核通过指令,生成继续理赔指令执行后续流程,当生成异常确认指令,生成驳回理赔信息作为申请审核结果发送至所述客户端的显示界面。
4.一种电子设备,其特征在于,所述电子设备包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现权利要求1至2任一项所述的一种增量式高精度图像过滤方法。
5.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-2中任一所述的一种增量式高精度图像过滤方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310507111.0A CN116226430B (zh) | 2023-05-08 | 2023-05-08 | 一种增量式高精度图像过滤方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310507111.0A CN116226430B (zh) | 2023-05-08 | 2023-05-08 | 一种增量式高精度图像过滤方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116226430A CN116226430A (zh) | 2023-06-06 |
CN116226430B true CN116226430B (zh) | 2023-07-07 |
Family
ID=86575363
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310507111.0A Active CN116226430B (zh) | 2023-05-08 | 2023-05-08 | 一种增量式高精度图像过滤方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116226430B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019214308A1 (zh) * | 2018-05-10 | 2019-11-14 | 阿里巴巴集团控股有限公司 | 一种理赔业务的数据处理方法、装置、设备及服务器 |
CN110569837A (zh) * | 2018-08-31 | 2019-12-13 | 阿里巴巴集团控股有限公司 | 优化损伤检测结果的方法及装置 |
CN112348686A (zh) * | 2020-11-24 | 2021-02-09 | 德联易控科技(北京)有限公司 | 理赔图片的采集方法、装置及通讯设备 |
CN115511645A (zh) * | 2022-09-23 | 2022-12-23 | 中国平安财产保险股份有限公司 | 理赔图片的检测方法、装置、设备及存储介质 |
-
2023
- 2023-05-08 CN CN202310507111.0A patent/CN116226430B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019214308A1 (zh) * | 2018-05-10 | 2019-11-14 | 阿里巴巴集团控股有限公司 | 一种理赔业务的数据处理方法、装置、设备及服务器 |
CN110569837A (zh) * | 2018-08-31 | 2019-12-13 | 阿里巴巴集团控股有限公司 | 优化损伤检测结果的方法及装置 |
CN112348686A (zh) * | 2020-11-24 | 2021-02-09 | 德联易控科技(北京)有限公司 | 理赔图片的采集方法、装置及通讯设备 |
CN115511645A (zh) * | 2022-09-23 | 2022-12-23 | 中国平安财产保险股份有限公司 | 理赔图片的检测方法、装置、设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
基于神经网络算法的保险理赔应用研究;张旭升;;考试周刊(02);200-201 * |
Also Published As
Publication number | Publication date |
---|---|
CN116226430A (zh) | 2023-06-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Veres et al. | Choosing the Method of Finding Similar Images in the Reverse Search System. | |
CN110796210A (zh) | 一种标签信息的识别方法及装置 | |
CN111680680B (zh) | 一种目标码定位方法、装置、电子设备及存储介质 | |
CN112381458A (zh) | 项目评审方法、项目评审装置、设备及存储介质 | |
CN112232336A (zh) | 一种证件识别方法、装置、设备及存储介质 | |
CN114386013A (zh) | 学籍自动认证方法、装置、计算机设备及存储介质 | |
CN112508000B (zh) | 一种用于ocr图像识别模型训练数据生成的方法及设备 | |
CN114120377A (zh) | 一种空间金字塔指纹精准识别的印控仪应用方法及系统 | |
CN117275005B (zh) | 文本检测、文本检测模型优化、数据标注的方法、装置 | |
CN111476090B (zh) | 水印识别方法和装置 | |
CN116071625B (zh) | 深度学习模型的训练方法、目标检测方法及装置 | |
CN116226430B (zh) | 一种增量式高精度图像过滤方法及系统 | |
CN116994267A (zh) | 一种铭牌vin码识别方法、装置、存储介质及设备 | |
CN111507420A (zh) | 轮胎信息获取方法、装置、计算机设备和存储介质 | |
CN114612919B (zh) | 一种票据信息处理系统及方法、装置 | |
CN116343221A (zh) | 证件信息自动录入方法和装置、电子设备及存储介质 | |
CN113936286B (zh) | 图像文本识别方法、装置、计算机设备及存储介质 | |
CN113837129B (zh) | 手写签名错别字识别方法、装置、设备及存储介质 | |
CN115984588A (zh) | 图像背景相似度分析方法、装置、电子设备及存储介质 | |
CN115618019A (zh) | 知识图谱构建方法、装置及终端设备 | |
CN111695441B (zh) | 图像文档处理方法、装置及计算机可读存储介质 | |
CN114049686A (zh) | 签名识别模型训练方法、装置及电子设备 | |
CN112183520A (zh) | 数据信息智能处理方法、装置、电子设备及存储介质 | |
CN112580505A (zh) | 网点开关门状态识别方法、装置、电子设备及存储介质 | |
CN113033170A (zh) | 表格标准化处理方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |