CN116453229A

CN116453229A - 一种基于多层复合模型的进件质检方法及系统

Info

Publication number: CN116453229A
Application number: CN202310343298.5A
Authority: CN
Inventors: 陈晓铭; 冉佳; 陈文�
Original assignee: China Citic Bank Corp Ltd
Current assignee: China Citic Bank Corp Ltd
Priority date: 2023-03-31
Filing date: 2023-03-31
Publication date: 2023-07-18

Abstract

本发明涉及一种基于多层复合模型的进件质检方法及系统，依次使用多层模型对进件材料执行带有逻辑性的质检过程并反馈质检结果，特别是可以基于空域特征和噪声特征的端到端图像分类网络来对身份证进行质检，噪声特征可以有效地帮助网络识别出图像中是否被篡改过，与此同时，端到端的图像分类网络可以有效避免太多个模块进行质量检测所产生的误差累积，并且减少了工程复杂度；此外，本发明还通过多层次模型对其他进件图像进行合影检测，从而检测出进件图像资料中是否包含客户经理与客户的合影图像，以适配进件质检需求。

Description

一种基于多层复合模型的进件质检方法及系统

技术领域

本发明涉及金融信息安全管理和深度学习技术领域，尤其涉及一种基于多层复合模型的进件质检方法及系统。

背景技术

在信息技术的高速发展社会背景下，居民的线上消费规模日益增长。对应的，信用卡的办卡需求也出现显著增加，信用卡业务安全管理愈发重要。

目前信用卡线上欺诈攻击已经渗透到了信用卡线上经营的各个环节，而商业银行受限于自身的智能校验能力不足，无法精准识别客户信息的准确性和真实性。另外，不法分子会通过包装身份信息和连续进件的方式反复试探各商业银行的客户风险管控模型，从而找寻模型漏洞以进行攻击。

传统的风险管理方法中，通常采用人工审核进件材料的方式确保材料合法性以及审核办卡申请是否合规。这种方式难以应对大量增加的进件量审核需要，容易出现审核资源“挤兑”造成业务处理效率答复下降等问题，且人工审核过于依赖审核人员个人经验，容易出现审核疏漏。

为了解决这一问题，现有技术也从计算机辅助处理的方法帮助审核人员处理进件审核工作。例如，申请号202010357043，名称为“证件图像质量自动检查方法及系统”的发明专利申请公开了一种证件图像质量自动检查方法，首先在证件图像中定位出证件区域；然后通过透视变换对证件区域图像进行校正；对校正后证件图像的内容进行可识别性判定，如可识别，输出识别内容后进行下一步；如不可识别,直接输出质量检查结果；根据不同质量检查指标并根据指标真假值判断，对校正后证件图像进行质量检查指标分类并输出二分类结果；输出证件图像质量检查结果。通过该方法能够自动化审核证件图像质量，特别是能够辅助判断证件图像是否存在伪造、变造等风险问题，能够用于辅助审核人员检查进件材料。

但是，上述方法虽然能用于检测证件图像的质量，但其本质属于一种多阶段序列的检测方式，最终检测结果高度依赖于各不同检测阶段的准确性，因此容易受到某个检测阶段的准确度所干扰，进而影响到整个检测模型的检测效果。由于整体方法需要涉及包括证件区域定位、证件图像透视变换、校正后身份证图像质量指标二分类等一系列处理步骤，前一个步骤产生的偏差可能影响后一个步骤，从而造成误差的累积，因此最终的检测结果容易受到某个步骤的准确度所干扰。另一方面，用于执行各不同步骤的具体训练目标不同，这样训练出来的模型容易形成各个模块局部最优，而整体很难达到最佳性能。此外，这类方法包含的图像仿射变换等操作可能会使图像丢失部分原始信息，而且这种仅基于空域特征对证件图像进行质量检查指标的二分类，容易被篡改图像误导，从而产生错误的分类结果。

由此可知，在现有证件图像质检模型的实际使用中，有很多因素可能会影响到质检模型的准确性，从而影响线上进件审核的效率和安全性。

发明内容

为解决现有技术的不足，本发明提出一种基于多层复合模型的进件质检方法及系统，基于空域特征和噪声特征的端到端图像分类网络来对身份证进行质检，噪声特征可以有效地帮助网络识别出图像中是否被篡改过，与此同时，端到端的图像分类网络可以有效避免太多个模块进行质量检测所产生的误差累积，并且减少了工程复杂度；此外，本发明还通过多层次模型对其他进件图像进行合影检测，从而检测出进件图像资料中是否包含客户经理与客户的合影图像，以适配进件质检需求。

为实现以上目的，本发明所采用的技术方案包括：

一种基于多层复合模型的进件质检方法，其特征在于，包括：

S1、获取进件图像集合，使用第一模型判断进件图像集合中是否同时包括证件图像和合影图像，当判断进件图像集合中不同时包括证件图像和合影图像时，停止质检流程并输出第一质检不合格信息；

S2、当判断进件图像集合中同时包括证件图像和合影图像时，进一步使用第二模型判断证件图像是否满足预设质量要求，当判断证件图像不满足预设质量要求时，停止质检流程并输出第二质检不合格信息；

S3、当判断进件图像集合中同时包括证件图像和合影图像时，进一步使用第三模型判断合影图像是否能够匹配预设的指定人员人脸信息，当判断合影图像不能够匹配预设的指定人员人脸信息时，停止质检流程并输出第三质检不合格信息；

S4、当判断合影图像能够匹配预设的指定人员人脸信息时，进一步识别合影图像中指定人员人脸信息之外的用户人脸信息；

S5、当判断证件图像满足预设质量要求，且合影图像能够匹配预设的指定人员人脸信息时，进一步判断用户人脸信息是否匹配证件图像，当判断用户人脸信息不匹配证件图像时，停止质检流程并输出第四质检不合格信息；

S6、当判断用户人脸信息匹配证件图像时，输出质检合格信息。

进一步地，所述步骤S2还包括：

对获取到的证件图像执行格式校验，将证件图像转换为RGB三通道图像，并调整至预设尺寸。

进一步地，所述第二模型包括基于空域特征和噪声特征的端到端图像分类网络模型。

进一步地，所述使用第二模型判断证件图像是否满足预设质量要求包括：

使用约束卷积层对证件图像执行动态预处理，并使用卷积神经网络学习噪声特征，获得对应的噪声图像；

使用全局注意力加权模块对证件图像和噪声图像执行注意力加权处理，得到RGB特征和噪声特征；

拼接RGB特征和噪声特征并输入ResNet网络获得输出特征；

使用多尺度特征融合层组合输出特征，再通过分类层判断证件图像是否满足预设质量要求。

进一步地，所述第一模型包括指定图像特征检测模型；所述第三模型包括人脸特征比对模型。

进一步地，所述步骤S4包括：

识别合影图像中的人脸坐标和人脸数量。

本发明还涉及一种基于多层复合模型的进件质检系统，其特征在于，包括：

进件处理模块，用于使用第一模型判断进件图像集合中是否同时包括证件图像和合影图像；

证件图像质检模块，用于使用第二模型判断证件图像是否满足预设质量要求；

合影图像质检模块，用于使用第三模型判断合影图像是否能够匹配预设的指定人员人脸信息；

人脸识别模块，用于识别合影图像中指定人员人脸信息之外的用户人脸信息；

联合质检模块，用于判断用户人脸信息是否匹配证件图像。

本发明还涉及一种计算机可读存储介质，其特征在于，所述存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现上述的方法。

本发明还涉及一种电子设备，其特征在于，包括处理器和存储器；

所述存储器，用于存储进件图像集合和指定人员人脸信息；

所述处理器，用于通过调用进件图像集合和指定人员人脸信息，执行上述的方法。

本发明还涉及一种计算机程序产品，包括计算机程序和/或指令，其特征在于，该计算机程序和/或指令被处理器执行时实现上述方法的步骤。

本发明的有益效果为：

采用本发明所述基于多层复合模型的进件质检方法及系统，基于空域特征和噪声特征的端到端图像分类网络来对身份证进行质检，噪声特征可以有效地帮助网络识别出图像中是否被篡改过，为模型提供了更多维度的原始信息，与此同时使用了多尺度特征融合模块结合了深层特征和浅层特征，提高了模型对身份证图像的不同质量检查指标分类的准确率，减少了模型对篡改图像的误检率；与此同时，端到端的图像分类网络相对于现有技术增强了身份证图像特征的丰富性，并通过端到端的方式减少了多个模块间的累积误差，从而可以有效提高身份证图像质检分类的准确性，并且减少了工程复杂度；此外，本发明还通过多层次模型对其他进件图像进行合影检测，从而检测出进件图像资料中是否包含客户经理与客户的合影图像，以适配进件质检需求。

附图说明

图1为本发明基于多层复合模型的进件质检方法流程示意图。

图2为本发明基于多层复合模型的进件质检系统结构示意图。

具体实施方式

为了更清楚的理解本发明的内容，将结合附图和实施例详细说明。

本发明第一方面涉及一种步骤流程如图1所示的基于多层复合模型的进件质检方法，包括：

S1、获取进件图像集合，使用第一模型判断进件图像集合中是否同时包括证件图像和合影图像，当判断进件图像集合中不同时包括证件图像和合影图像时，停止质检流程并输出第一质检不合格信息。

其中，第一模型优选为指定图像特征检测模型，用于初步检测进件图像集合是否包含必要的证件图像和合影图像，但无需对具体图像质量进行判断。

S2、当判断进件图像集合中同时包括证件图像和合影图像时，进一步使用第二模型判断证件图像是否满足预设质量要求，当判断证件图像不满足预设质量要求时，停止质检流程并输出第二质检不合格信息。

优选的，对证件图像应先进行预处理，包括对获取到的证件图像执行格式校验，将证件图像转换为RGB三通道图像，并调整至预设尺寸。

例如，输入的证件图像可能为PNG格式，而PNG格式的图像为四通道，所以需要先将输入的证件图像转换为RGB三通道图像，接着对证件图像进行resize操作，将其缩放为256×256大小的图像。

所述第二模型包括基于空域特征和噪声特征的端到端图像分类网络模型。具体的，在得到预处理后的证件图像之后，首先使用约束卷积层(或采用适合的SRM滤波器)对预处理后的图像执行动态预处理，使得卷积神经网络可以自适应地学习噪声特征以获得噪声图像，然后将RGB图像和噪声图像分别通过全局注意力加权模块，以获得注意力增强后的RGB特征和噪声特征，接着将两个特征拼接到一起，输入到ResNet网络中，再通过多尺度特征融合层将不同ResBlock输出的特征组合到一起，最后通过分类层将输入的证件图像分类为翻拍图像、正常图像、缺角图像、遮挡图像和模糊图像。

S3、当判断进件图像集合中同时包括证件图像和合影图像时，进一步使用第三模型判断合影图像是否能够匹配预设的指定人员人脸信息，当判断合影图像不能够匹配预设的指定人员人脸信息时，停止质检流程并输出第三质检不合格信息。

优选的，第三模型包括人脸特征比对模型，用于将合影图像中识别获得的人脸与预设的指定人员人脸信息进行比较匹配，例如与负责业务办理的客户经理预存人脸信息进行比较。

实际执行中，步骤S2与步骤S3可以是顺序依次执行的，也可以是同步互不相关的各自独立执行的。

S4、当判断合影图像能够匹配预设的指定人员人脸信息时，进一步识别合影图像中指定人员人脸信息之外的用户人脸信息，包括识别合影图像中的人脸坐标和人脸数量。

具体的，可以将输入图像进行格式校验和图像去噪等预处理操作，然后将预处理后的图像输入主干网络以提取图像特征，再通过多尺度特征融合层将高层的语义信息和浅层的语义信息结合到一起，以保留更多的特征原始信息，从而生成多尺度特征，最后将多尺度特征输入到预测层以获得输入图像中的人脸坐标和人脸数。

识别所获得的用户人脸信息应能够与证件图像提供的对象人脸进行对应匹配，以保证进件的合规性。

本发明另一方面还涉及一种基于多层复合模型的进件质检系统，其结构如图2所示，包括：

联合质检模块，用于判断用户人脸信息是否匹配证件图像。

通过使用该系统，能够执行上述的运算处理方法并实现对应的技术效果。

本发明的实施例还提供能够实现上述实施例中的方法中全部步骤的一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述实施例中的方法的全部步骤。

本发明的实施例还提供一种用于执行上述方法的电子设备，作为该方法的实现装置，所述电子设备至少具备有处理器和存储器，特别是该存储器上存储有执行方法所需的数据和相关的计算机程序，例如进件图像集合和指定人员人脸信息等，并通过由处理器调用存储器中的数据、程序执行实现方法的全部步骤，并获得对应的技术效果。

优选的，该电子设备可以包含有总线架构，总线可以包括任意数量的互联的总线和桥，总线将包括由一个或多个处理器和存储器的各种电路链接在一起。总线还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起，这些都是本领域所公知的，因此，本文不再对其进行进一步描述。总线接口在总线和接收器和发送器之间提供接口。接收器和发送器可以是同一个元件，即收发机，提供用于在传输介质上与各种其他系统通信的单元。处理器负责管理总线和通常的处理，而存储器可以被用于存储处理器在执行操作时所使用的数据。

额外的，所述电子设备还可以进一步包括通信模块、输入单元、音频处理器、显示器、电源等部件。其所采用的处理器(或称为控制器、操作控件)可以包括微处理器或其他处理器装置和/或逻辑装置，该处理器接收输入并控制电子设备的各个部件的操作；存储器可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种，可储存上述有关的数据信息，此外还可存储执行有关信息的程序，并且处理器可执行该存储器存储的该程序，以实现信息存储或处理等；输入单元用于向处理器提供输入，例如可以为按键或触摸输入装置；电源用于向电子设备提供电力；显示器用于进行图像和文字等显示对象的显示，例如可为LCD显示器。通信模块即为经由天线发送和接收信号的发送机/接收机。通信模块(发送机/接收机)耦合到处理器，以提供输入信号和接收输出信号，这可以和常规移动通信终端的情况相同。基于不同的通信技术，在同一电子设备中，可以设置有多个通信模块，如蜂窝网络模块、蓝牙模块和/或无线局域网模块等。通信模块(发送机/接收机)还经由音频处理器耦合到扬声器和麦克风，以经由扬声器提供音频输出，并接收来自麦克风的音频输入，从而实现通常的电信功能。音频处理器可以包括任何合适的缓冲器、解码器、放大器等。另外，音频处理器还耦合到中央处理器，从而使得可以通过麦克风能够在本机上录音，且使得可以通过扬声器来播放本机上存储的声音。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的系统。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令系统的制造品，该指令系统实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

以上所述仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换等都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求书的保护范围为准。

Claims

1.一种基于多层复合模型的进件质检方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，所述步骤S2还包括：

3.如权利要求2所述的方法，其特征在于，所述第二模型包括基于空域特征和噪声特征的端到端图像分类网络模型。

4.如权利要求3所述的方法，其特征在于，所述使用第二模型判断证件图像是否满足预设质量要求包括：

拼接RGB特征和噪声特征并输入ResNet网络获得输出特征；

5.如权利要求1所述的方法，其特征在于，所述第一模型包括指定图像特征检测模型；所述第三模型包括人脸特征比对模型。

6.如权利要求1所述的方法，其特征在于，所述步骤S4包括：

识别合影图像中的人脸坐标和人脸数量。

7.一种基于多层复合模型的进件质检系统，其特征在于，包括：

联合质检模块，用于判断用户人脸信息是否匹配证件图像。

8.一种计算机可读存储介质，其特征在于，所述存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法。

9.一种电子设备，其特征在于，包括处理器和存储器；

所述存储器，用于存储进件图像集合和指定人员人脸信息；

所述处理器，用于通过调用进件图像集合和指定人员人脸信息，执行权利要求1至6中任一项所述的方法。

10.一种计算机程序产品，包括计算机程序和/或指令，其特征在于，该计算机程序和/或指令被处理器执行时实现权利要求1至6中任一项所述方法的步骤。