CN113837310A

CN113837310A - 多尺度融合的证件翻拍识别方法、装置、电子设备和介质

Info

Publication number: CN113837310A
Application number: CN202111157418.XA
Authority: CN
Inventors: 王博
Original assignee: Sichuan XW Bank Co Ltd
Current assignee: Sichuan XW Bank Co Ltd
Priority date: 2021-09-30
Filing date: 2021-09-30
Publication date: 2021-12-24
Anticipated expiration: 2041-09-30
Also published as: CN113837310B

Abstract

本发明公开了一种多尺度融合的证件翻拍识别方法、装置、电子设备及介质，涉及计算机图像识别技术领域，其技术方案要点是：将待识别的证件图像缩放为大尺度图像和小尺度图像，对大尺度图像等分图像块后，逐一利用离散余弦变换进行频域变换，获得频域图像组；利用自注意力机制卷积组对频域图像组进行处理，获得动态选择的频域特征图，利用特征提取卷积组对小尺度图像提取浅层特征，获得空域特征图，组合频域特征图和空域特征图获得混合浅层特征图；利用深层卷积神经网络提取混合浅层特征图的深层特征，用于计算全连接层；本发明能接收更大尺度图像作为输入，实现多尺度、多特征融合，提升翻拍识别的准确率。

Description

多尺度融合的证件翻拍识别方法、装置、电子设备和介质

技术领域

本发明涉及计算机图像识别技术领域，更具体地说，它涉及一种多尺度融合的证件翻拍识别方法、装置、电子设备和介质。

背景技术

随着银行业务的数字化转型以及监管层对于金融风险的精细化防控，大数据智能风控已被视为金融科技的核心驱动力，面对每天大量的身份证、营业执照等证件图像，如何快速、精准的识别出证件照是否合规更是必不可少的一环。证件照合规审查除了需要联网核查用户身份证号等结构化信息外，对于图像本身也需识别是否存在翻拍情况，以避免他人盗用证件照片进行资金转账、贷款申请等操作给用户带来资产损失。

常用的证件翻拍识别方法都是根据原始图像以及证件区域裁剪图像的空域(即RGB颜色通道)直接进行特征学习，这种方式是能有效应对复印件等颜色敏感的翻拍图像类型，但是对于高清摄像头翻拍的证件照片判断还有优化空间；后来逐渐引入频域学习的方式，通过颜色通道和频域单通道联合进行特征学习，加强模型对于摩尔纹特征的判断。

相关技术中通过对原始图像进行快速傅里叶变换得到频域单通道图像，利用卷积神经网络分别对空域及频域图像进行特征学习，在多个网络层级融合两种特征，实现证件图像的翻拍识别。

但是，相关技术中虽然引入频域学习的方式，使模型训练过程中，针对性的对摩尔纹等频域敏感的翻拍特征进行学习，但是其采用的频域单通道是根据缩放到模型输入尺寸的空域图像进行快速傅里叶变换得到的，变换前后的图像宽高一致，内部频域信息存在冗余，且在图像缩放过程中对于频域特征造成一定损失。

因此，针对上述技术问题，如何研究设计一种新的证件翻拍识别方法是目前亟需解决的问题。

发明内容

本发明针对上述技术问题，本发明的目的是提供多尺度融合的证件翻拍识别方法、装置、电子设备和介质，本发明采用结合自注意力机制的动态频域特征变换结构，对转换到频域的图像块以自注意力机制的方式实现对频域图像块的动态选择，本发明能接收更大尺度图像作为输入，实现多尺度、多特征融合，提升翻拍识别的准确率。

本发明的上述技术目的是通过以下技术方案得以实现的：

第一方面，本发明提供了一种多尺度融合的证件翻拍识别方法，方法包括以下步骤：

步骤S1，获取待识别的证件图像，对证件图像进行缩放处理获取大尺度图像与小尺度图像；

步骤S2，对大尺度图像进行等分图像处理获取大尺度图像的等分图像块，采用离散余弦变换对等分图像块进行频域变换，获取频域图像组；

步骤S3，采用自注意力机制卷积组对频域图像组进行处理，获取动态选择的频域特征图，采用特征提取卷积组对小尺度图像提取浅层特征，获取空域特征图，将频域特征图与空域特征图进行组合，获取混合浅层特征图；

步骤S4，采用深层卷积神经网络提取所述混合浅层特征图的深层特征，获取混合浅层特征图的特征向量，采用全连接层对特征向量进行计算，获取证件图像翻拍识别结果。

本发明考虑到现有技术中频域特征学习仅是根据小尺度图像学习而来，在图像缩放过程中对于频域特征造成一定损失，而且没有进行有效的特征选择，内部频域信息存在冗余。因此，本发明采用结合自注意力机制的动态频域特征变换结构，对转换到频域的图像块以自注意力机制的方式实现对频域图像块的动态选择，本发明能接收更大尺度图像作为输入，实现多尺度、多特征融合，提升翻拍识别的准确率。

进一步的，步骤S1中，采用等比例缩小的方式对证件图像进行缩放处理，将大尺度图像的颜色通道由RGB转换为YCbCr格式。

进一步的，步骤S2中，将格式为YcbCr的大尺度图像按照n×n进行图像分块处理，在通道维度对图像块进行合并，对每个图像块进行离散余弦变换获取若干个频域图像组。

进一步的，步骤S3中，获取动态选择的频域特征图具体实现如下：

对频域图像组进行全局池化提取每张频域图像组的特征响应均值，得到池化后的特征图；

采用全连接层学习池化后的特征图的权重值，将权重值乘以对应通道维度的频域图像组，获取自注意力机制处理后的注意力特征图；

将注意力特征图通过卷积层进行通道维度的特征动态选择，获取动态选择的频域特征图。

进一步的，步骤S3中，获取小尺度图像的空域特征图具体实现如下：

采用卷积层对小尺度图像进行卷积处理，获取小尺度图像的浅层特征图；

采用最大池化层对所述小尺度图像的浅层特征图进行特征选择，获取小尺度图像的空域特征图。

进一步的，步骤S3中，频域特征图和空域特征图在通道维度进行合并，获取混合浅层特征图。

进一步的，步骤S4中，利用深层卷积神经网络实现对所述混合浅层特征图的深层特征进行提取学习，利用深层卷积神经网络输出所述混合浅层特征图的特征向量，并利用全连接层对特征向量进行处理，根据全连接层的计算结果判断待识别的证件图像是否为翻拍图像，并输出判断结果；其中，深层卷积神经网络去除第一层卷积层、最大池化层以及最后一层全连接层。

第二方面，本发明提供了一种证件图像翻拍识别装置，用以实现第一方面提供的所述的多尺度融合的证件翻拍识别方法，装置包括：

图像获取模块，用于获取待识别的证件图像，对证件图像进行缩放处理获取大尺度图像与小尺度图像；

频域图像获取模块，用于对大尺度图像进行等分图像处理获取大尺度图像的等分图像块，采用离散余弦变换对等分图像块进行频域变换，获取频域图像组；

特征获取模块，用于采用自注意力机制卷积组对频域图像组进行处理，获取动态选择的频域特征图，采用特征提取卷积组对小尺度图像提取浅层特征，获取空域特征图，将频域特征图与空域特征图进行组合，获取混合浅层特征图；

证件翻拍判断模块，用于采用深层卷积神经网络提取所述混合浅层特征图的深层特征，获取混合浅层特征图的特征向量，采用全连接层对特征向量进行计算，获取证件图像翻拍识别结果。

第三方面，本发明提供了一种电子设备，包括：处理器、通信接口、存储器和通信总线，其中，处理器、通信接口和存储器通过通信总线完成相互间的通信；所述存储器，用于存储计算机程序；所述处理器，用于执行所述存储器中所存储的程序，实现第一方面提供的所述多尺度融合的证件翻拍识别方法。

第四方面，本发明提供了一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时实现第一方面提供的所述多尺度融合的证件翻拍识别方法。

与现有技术相比，本发明具有以下有益效果：

本发明通过结合自注意力机制的动态频域特征变换结构，在计算量可控的前提下，保留更多的有效频域特征，实现了频域和空域特征的多尺度、多特征融合，提升了翻拍识别模型的准确率。

附图说明

此处所说明的附图用来提供对本发明实施例的进一步理解，构成本申请的一部分，并不构成对本发明实施例的限定。在附图中：

图1为本发明一实施例提供的证件翻拍识别方法流程图；

图2为本发明一实施例提供的证件翻拍识别方法的频域特征图的流程图；

图3为本发明一实施例提供的证件翻拍识别方法的空域特征图的流程图；

图4为本发明一实施例提供的证件图像翻拍识别装置的结构图；

图5为本发明一实施例提供的电子设备的结构图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白，下面结合实施例和附图，对本发明作进一步的详细说明，本发明的示意性实施方式及其说明仅用于解释本发明，并不作为对本发明的限定。

需说明的是，当部件被称为“固定于”或“设置于”另一个部件，它可以直接在另一个部件上或者间接在该另一个部件上。当一个部件被称为是“连接于”另一个部件，它可以是直接或者间接连接至该另一个部件上。

需要理解的是，术语“长度”、“宽度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。

实施例一

本申请实施例一提供了一种多尺度融合的证件翻拍识别方法，该方法可以应用于任意一种形式的电子设备中，如终端或服务器中。如图1所示，该多尺度融合的证件图像翻拍识别方法，方法包括以下步骤：

具体的，在步骤S1中，待识别的证件图像可以是用户在相应输入框内上传获得的，也可以是在相应的网页中获得。当然，也可以直接采集获得该待识别的证件图像，需要理解的是翻拍的图像包括屏幕翻拍图像和彩印翻拍图像。

在步骤S2中，对缩放处理后的大尺度图像与小尺度图像进行等分，并采用离散余弦变换进行频域变换，得到频域图像组，离散余弦变换(Discrete Cosine Transform)本质上也是离散傅里叶变换(Discrete Fourier Transform)，但是只有实数部分。离散余弦变换实际上就是将输入信号限定为实偶信号的离散傅里叶变换，由于计算复杂度较高，故需对图像进行分块后再进行频域变换，结合步骤S3可实现频域部分的大尺度输入，保留更多的频域特征。

在步骤S3中，结合自注意力机制的动态频域特征变换结构，通过对大尺度图像的频域图像块以自注意力机制的方式动态选择，保留了更多的有效频域特征，最后结合特征提取卷积组对小尺度图像提取浅层特征，获取空域特征图，将频域特征图与空域特征图在通道维度进行结合，得到待识别证件图像的混合浅层特征图。

在步骤S4中，通过深层卷积神经网络模型中的网络层级逐步提取待识别的证件图像的混合浅层特征图的深层特征，利用卷积神经网络实现对提取学习深层特征的特征向量，采用全连接层对特征向量进行计算，得到证件图像翻拍识别结果，进而基于证件图像翻拍识别结果判断待识别的证件图像是否为翻拍图像。

本实施例一中，结合自注意力机制的动态频域特征变换结构，通过对大尺度图像的频域图像块以自注意力机制的方式动态选择，保留了更多的有效频域特征，实现了多尺度、多特征融合，获得了更优的翻拍识别性能。

优选地，步骤S1中，采用等比例缩小的方式对证件图像进行缩放处理，将大尺度图像的颜色通道由RGB转换为YCbCr格式。原始图像的形状为(1080,1080,3)，分别利用尺寸等比例缩小的方式缩放至大尺度图像A(896,896,3)和小尺度图像B(224,224,3)，RGB图像转为YCbCr图像，可利用下式实现：

式中，R、G、B、Y、Cb、Cr分别代表图像中各自通道的像素值。

优选地，步骤S2中，将格式为YcbCr的大尺度图像按照n×n进行图像分块处理，在通道维度对图像块进行合并，对每个图像块进行离散余弦变换获取若干个频域图像组。

具体的，转换后的YCbCr图像的尺寸为(896,896,3)，按照8×8分块，即每个图像块尺寸为(112,112)，共计8×8×3＝192个单通道图像块，即合并后的形状为(112,112,192)，而离散余弦变换实际上就是将输入信号限定为实偶信号的离散傅里叶变换，由于计算复杂度较高，故一般对其按照8×8或16×16分块再进行频域变换，在此值得一提的是，常规处理做法是按照分块变换后，再将图像块拼接成原图尺寸，即保持图像形状(896,896,3)不变，而本实施例一中采用在通道维度合并，即变换后的频域图像组形状为(112,112,192)，结合下述步骤3可实现频域部分的大尺度输入，保留更多的频域特征。

优选地，步骤S3中，如图2所示，获取动态选择的频域特征图具体实现如下：

具体的，对频域图像组(112,112,192)进行全局池化提取每张频域特征图的特征响应均值，得到池化后特征图(1,1,192),再利用全连接层学习192个频域特征图的权重值，利用学习得到的权重值乘以对应通道的频域图像组，获得自注意力机制选择后的注意力特征图(112,112,192)，最后再通过一个卷积层进行通道维度的特征动态选择，其参数为卷积核32个、核尺寸3、步长2、边界填充1，获得动态选择的频域特征图(56,56,32)。

其中，需要说明的是，特征图计算公式为：输出尺寸＝[(输入尺寸+2X边界填充-核尺寸)/步长]+1。

优选地，步骤S3中，如图3所示，获取小尺度图像的空域特征图具体实现如下：

具体的，对于小尺度图像(224,224,3)进行卷积操作，卷积层参数为卷积核32个、核尺寸7、步长2、边界填充3，得到浅层特征图(112,112,32)，再利用一个最大池化层实现浅层特征图空间特征的选择，其参数为核尺寸3、步长2、边界填充1，获得空域特征图(56,56,32)。

优选地，步骤S3中，频域特征图和空域特征图在通道维度进行合并，获取混合浅层特征图。

具体的，将频域特征图和空域特征图在通道维度进行合并，获得混合浅层特征图(56,56,64)。

优选地，步骤S4中，利用深层卷积神经网络实现对所述混合浅层特征图的深层特征进行提取学习，利用深层卷积神经网络输出所述混合浅层特征图的特征向量，并利用全连接层对特征向量进行处理，根据全连接层的计算结果判断待识别的证件图像是否为翻拍图像，并输出判断结果；其中，深层卷积神经网络去除第一层卷积层、最大池化层以及最后一层全连接层。

具体的，深层卷积神经网络可以采用ResNet50卷积神经网络，并去除第一层卷积层、最大池化层以及最后一层全连接层，其输入尺寸为(56,56,64)，利用该卷积神经网络可以实现深层特征的提取学习，最后利用全连接层计算卷积神经网络输出的特征向量。

实施例二

基于同一构思，本申请实施例二中提供了一种证件图像翻拍识别装置，该装置的具体实施可参见方法实施例一部分的描述，重复之处不再赘述，如图4所示，该装置包括：

图像获取模块110，用于获取待识别的证件图像，对证件图像进行缩放处理获取大尺度图像与小尺度图像；

频域图像获取模块120，用于对大尺度图像进行等分图像处理获取大尺度图像的等分图像块，采用离散余弦变换对等分图像块进行频域变换，获取频域图像组；

特征获取模块130，用于采用自注意力机制卷积组对频域图像组进行处理，获取动态选择的频域特征图，采用特征提取卷积组对小尺度图像提取浅层特征，获取空域特征图，将频域特征图与空域特征图进行组合，获取混合浅层特征图；

证件翻拍判断模块140，用于采用深层卷积神经网络提取所述混合浅层特征图的深层特征，获取混合浅层特征图的特征向量，采用全连接层对特征向量进行计算，获取证件图像翻拍识别结果。

优选地，图像获取模块110具体还包括：缩放处理模块用于采用等比例缩小的方式对证件图像进行缩放处理；

格式转换模块用于将大尺度图像的颜色通道由RGB转换为YCbCr格式。

优选地，频域图像获取模块120具体还包括：图像分块模块用于将格式为YcbCr的大尺度图像按照n×n进行图像分块处理，并在通道维度对图像块进行合并；

图像变换模块用于对每个图像块进行离散余弦变换获取若干个频域图像组。

优选地，特征获取模块130具体还包括：第一获取子模块用于对频域图像组进行全局池化提取每张频域图像组的特征响应均值，得到池化后的特征图；

第二获取子模块用于采用全连接层学习池化后的特征图的权重值，将权重值乘以对应通道维度的频域图像组，获取自注意力机制处理后的注意力特征图；

第三获取子模块用于将注意力特征图通过卷积层进行通道维度的特征动态选择，获取动态选择的频域特征图。

优选地，特征获取模块130具体还包括：

第四获取子模块用于采用卷积层对小尺度图像进行卷积处理，获取小尺度图像的浅层特征图；

第五获取子模块用于采用最大池化层对所述小尺度图像的浅层特征图进行特征选择，获取小尺度图像的空域特征图。

优选地，特征获取模块130具体还包括：第五获取子模块用于将频域特征图和空域特征图在通道维度进行合并，获取混合浅层特征图。

优选地，证件翻拍判断模块140具体还包括：提取模块用于利用深层卷积神经网络实现对所述混合浅层特征图的深层特征进行提取学习，利用深层卷积神经网络输出所述混合浅层特征图的特征向量，并利用全连接层对特征向量进行处理，其中，深层卷积神经网络去除第一层卷积层、最大池化层以及最后一层全连接层；

判断模块用于根据全连接层的计算结果判断待识别的证件图像是否为翻拍图像，并输出判断结果。

实施例三

基于同一构思，本申请实施例三中提供了一种电子设备，如图5所示，该电子设备主要包括：处理器310、通信接口320、存储器330和通信总线340，其中，处理器310、通信接口320和存储器330通过通信总线340完成相互间的通信。其中，存储器330中存储有可被至处理器310执行的程序，处理器310执行存储器330中存储的程序，实现如下步骤：步骤S1，获取待识别的证件图像，对证件图像进行缩放处理获取大尺度图像与小尺度图像；步骤S2，对大尺度图像进行等分图像处理获取大尺度图像的等分图像块，采用离散余弦变换对等分图像块进行频域变换，获取频域图像组；步骤S3，采用自注意力机制卷积组对频域图像组进行处理，获取动态选择的频域特征图，采用特征提取卷积组对小尺度图像提取浅层特征，获取空域特征图，将频域特征图与空域特征图进行组合，获取混合浅层特征图；步骤S4，采用深层卷积神经网络提取所述混合浅层特征图的深层特征，获取混合浅层特征图的特征向量，采用全连接层对特征向量进行计算，获取证件图像翻拍识别结果。

上述电子设备中提到的通信总线340可以是外设部件互连标准(PeripheralComponentInterconnect，简称PCI)总线或扩展工业标准结构(ExtendedIndustryStandardArchitecture，简称EISA)总线等。该通信总线340可以分为地址总线、数据总线、控制总线等。

通信接口320用于上述电子设备与其他设备之间的通信。存储器330可以包括随机存取存储器(RandomAccessMemory，简称RAM)，也可以包括非易失性存储器(non-volatilememory)，例如至少一个磁盘存储器。可选地，存储器还可以是至少一个位于远离前述处理器310的存储装置。上述的处理器310可以是通用处理器，包括中央处理器(CentralProcessingUnit，简称CPU)、网络处理器(NetworkProcessor，简称NP)等，还可以是数字信号处理器(DigitalSignalProcessing，简称DSP)、专用集成电路(ApplicationSpecificIntegratedCircuit，简称ASIC)、现场可编程门阵列(Field-ProgrammableGateArray，简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本申请实施例三的又一实施例中，还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有计算机程序，当该计算机程序在计算机上运行时，使得计算机执行上述实施例中所描述的证件图像翻拍识别方法。在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机指令时，全部或部分地产生按照本申请实施例所述的流程或功能。该计算机可以时通用计算机、专用计算机、计算机网络或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，计算机指令从一个网站站点、计算机、服务器或者数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、微波等)方式向另外一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质(例如软盘、硬盘、磁带等)、光介质(例如DVD)或者半导体介质(例如固态硬盘)等

以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种多尺度融合的证件翻拍识别方法，其特征在于，方法包括以下步骤：

2.根据权利要求1所述的多尺度融合的证件翻拍识别方法，其特征在于，步骤S1中，采用等比例缩小的方式对证件图像进行缩放处理，将大尺度图像的颜色通道由RGB转换为YCbCr格式。

3.根据权利要求1所述的多尺度融合的证件翻拍识别方法，其特征在于，步骤S2中，将格式为YcbCr的大尺度图像按照n×n进行图像分块处理，在通道维度对图像块进行合并，对每个图像块进行离散余弦变换获取若干个频域图像组。

4.根据权利要求1所述的多尺度融合的证件翻拍识别方法，其特征在于，步骤S3中，获取动态选择的频域特征图具体实现如下：

5.根据权利要求1所述的多尺度融合的证件翻拍识别方法，其特征在于，步骤S3中，获取小尺度图像的空域特征图具体实现如下：

6.根据权利要求1所述的多尺度融合的证件翻拍识别方法，其特征在于，步骤S3中，频域特征图和空域特征图在通道维度进行合并，获取混合浅层特征图。

7.根据权利要求1所述的多尺度融合的证件翻拍识别方法，其特征在于，步骤S4中，利用深层卷积神经网络实现对所述混合浅层特征图的深层特征进行提取学习，利用深层卷积神经网络输出所述混合浅层特征图的特征向量，并利用全连接层对特征向量进行处理，根据全连接层的计算结果判断待识别的证件图像是否为翻拍图像，并输出判断结果；其中，深层卷积神经网络去除第一层卷积层、最大池化层以及最后一层全连接层。

8.一种证件图像翻拍识别装置，其特征在于，用以实现权利要求1-7任一项所述的多尺度融合的证件翻拍识别方法，装置包括：

9.一种电子设备，其特征在于，包括：处理器、通信接口、存储器和通信总线，其中，处理器、通信接口和存储器通过通信总线完成相互间的通信；所述存储器，用于存储计算机程序；所述处理器，用于执行所述存储器中所存储的程序，实现权利要求1-7任一项所述的多尺度融合的证件翻拍识别方法。

10.一种计算机可读存储介质，存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1-7任一项所述的多尺度融合的证件翻拍识别方法。