CN116503721B

CN116503721B - 身份证篡改检测方法、装置、设备及存储介质

Info

Publication number: CN116503721B
Application number: CN202310782407.3A
Authority: CN
Inventors: 余仲慰; 朱威; 潘伟; 钟佳
Original assignee: China Post Consumer Finance Co ltd
Current assignee: China Post Consumer Finance Co ltd
Priority date: 2023-06-29
Filing date: 2023-06-29
Publication date: 2023-10-13
Anticipated expiration: 2043-06-29
Also published as: CN116503721A

Abstract

本发明涉及图像检测技术领域，并公开了一种身份证篡改检测方法、装置、设备及存储介质，该方法包括：对用户上传的原始身份证图像进行语义分割和仿射变换，得到第一身份证图像；使用预设质量检测模型对第一身份证图像进行图像质量检测，并基于检测结果确定第二身份证图像；将第二身份证图像输入至DCT‑CFNet网络架构，得到篡改预测值；基于篡改预测值判断原始身份证图像是否为篡改身份证图像。相比于现有技术通过人工审核来实现篡改检测，由于本发明通过预设模型对用户上传的原始身份证图像进行语义分割和质量检测，并基于DCT‑CFNet网络架构对通过质量检测的图像进行篡改检测，从而能够快速准确地得到篡改检测结果。

Description

身份证篡改检测方法、装置、设备及存储介质

技术领域

本发明涉及图像检测技术领域，尤其涉及一种身份证篡改检测方法、装置、设备及存储介质。

背景技术

如今，图像篡改技术日益进步，从早期的PS到如今的深度神经网络生成虚假图像，篡改合成的图像内容越来越难以识别，图像的真实性和原始性面临严峻挑战，这给个人、企业和社会带来了严重的负面影响。因此，利用计算机视觉技术识别和检测图像是否经过篡改成为学术和工业界研究的重点。

传统的图像篡改检测方法通常是通过审核人员进行人工审核的方式来实现篡改检测，然而这种方法仅适用于一些简单的场景，在某些复杂的场景中，采用这种方法所得出的检测结果受人为主观因素（如审核人员误判、漏判等）的负面影响较大，因此可信度不高。例如在金融行业中，往往会涉及到对身份证图像进行篡改检测的场景。而在这种场景中，由于身份证图像数量繁多，图中包含的信息又五花八门，此时如果仍采用人工审核的方式对身份证图像进行篡改检测，不仅检测效率低下，而且检测结果的可信度不高。

上述内容仅用于辅助理解本发明的技术方案，并不代表承认上述内容是现有技术。

发明内容

本发明的主要目的在于提供了一种身份证篡改检测方法、装置、设备及存储介质，旨在解决现有技术无法快速准确地对身份证图像进行篡改检测的技术问题。

为实现上述目的，本发明提供了一种身份证篡改检测方法，所述方法包括以下步骤：

通过预设语义分割模型对用户上传的原始身份证图像进行语义分割，并对经过语义分割后的原始身份证图像进行仿射变换，得到第一身份证图像，所述预设语义分割模型通过对DeeplabV3+模型进行训练后获得；

使用预设质量检测模型对所述第一身份证图像进行图像质量检测，并基于检测结果确定第二身份证图像，所述预设质量检测模型通过对MobileNetV3-large模型进行训练后获得；

将所述第二身份证图像输入至DCT-CFNet网络架构，得到所述第二身份证图像中各像素点对应的篡改预测值，所述DCT-CFNet网络架构基于RGB分支、DCT分支和CFM分支构建；

基于所述篡改预测值判断所述原始身份证图像是否为篡改身份证图像。

可选地，所述通过预设语义分割模型对用户上传的原始身份证图像进行语义分割，并对经过语义分割后的原始身份证图像进行仿射变换，得到第一身份证图像的步骤，包括：

通过预设语义分割模型对用户上传的原始身份证图像进行语义分割，得到身份证阈值图，所述身份证阈值图中身份证相关区域的像素值为1，非身份证相关区域的像素值为0；

通过OpenCV函数库中的findContours函数获取所述身份证阈值图的轮廓；

对所述身份证阈值图的轮廓进行多边形拟合，得到预设数量的身份证角点；

以所述身份证角点为基准对所述身份证阈值图进行仿射变换，得到第一身份证图像。

可选地，所述通过预设语义分割模型对用户上传的原始身份证图像进行语义分割，并对经过语义分割后的原始身份证图像进行仿射变换，得到第一身份证图像的步骤之前，还包括：

基于残差网络结构构建DeeplabV3+模型，所述DeeplabV3+模型的权重通过在COCO数据集上训练得到；

对人工标注的卡证分割数据集中的数据进行数据增强，得到数据增强后的卡证分割数据集；

以所述数据增强后的卡证分割数据集作为训练数据集，对所述DeeplabV3+模型进行训练，得到预设语义分割模型。

可选地，所述使用预设质量检测模型对所述第一身份证图像进行图像质量检测，并基于检测结果确定第二身份证图像的步骤，包括：

基于人工筛选的不合格图像数据集对MobileNetV3-large模型进行训练，以修改所述MobileNetV3-large模型的分类头，得到预设质量检测模型；

通过所述预设质量检测模型对所述第一身份证图像进行分类，并基于分类结果判断所述第一身份证图像是否达到质量阈值要求；

若是，则将所述第一身份证图像确定为第二身份证图像；

若否，则将所述第一身份证图像退回，并基于所述分类结果向用户反馈退回日志，以使用户按照所述退回日志重新上传身份证图像。

可选地，所述将所述第二身份证图像输入至DCT-CFNet网络架构，得到所述第二身份证图像中各像素点对应的篡改预测值的步骤，包括：

将所述第二身份证图像以RGB图像的形式分别输入至DCT-CFNet网络架构中的RGB分支、DCT分支和CFM分支，并分别输出RGB分支特征、DCT分支特征和CFM分支特征；

在所述CFM分支中通过上下文信息融合模块对所述RGB分支特征、所述DCT分支特征和所述CFM分支特征进行融合处理，得到所述第二身份证图像中各像素点对应的篡改预测值；

其中，所述将所述第二身份证图像以RGB图像的形式输入至DCT-CFNet网络架构中的CFM分支，并输出CFM分支特征的步骤，包括：

在DCT-CFNet网络架构中的CFM分支中，采用若干卷积块对所述第二身份证图像对应的RGB图像进行下采样，得到CFM分支特征，所述卷积块使用3×3卷积-批归一化-ReLU激活函数的设置。

可选地，所述在所述CFM分支中通过上下文信息融合模块对所述RGB分支特征、所述DCT分支特征和所述CFM分支特征进行融合处理，得到所述第二身份证图像中各像素点对应的篡改预测值的步骤，包括：

通过Sigmoid函数对所述DCT分支特征进行激活，得到激活特征，所述DCT分支特征为DCT分支输出的特定分辨率特征；

将所述激活特征与所述RGB分支特征相乘，得到第一图像特征，所述RGB分支特征为所述RGB分支中相同分辨率的特征；

将所述激活特征与所述CFM分支特征相乘，得到第二图像特征，所述CFM分支特征为所述CFM分支中相同分辨率的特征；

使用双线性插值及卷积的组合操作对所述CFM分支最终高维特征进行上采样，以使所述CFM分支最终高维特征的通道数量减半且分辨率增加一倍，得到第三图像特征；

对所述第一图像特征、所述第二图像特征和所述第三图像特征进行特征拼接，并使用卷积块再次进行特征提取，得到融合特征；

基于所述融合特征得到所述第二身份证图像中各像素点对应的篡改预测值。

可选地，所述基于所述篡改预测值判断所述原始身份证图像是否为篡改身份证图像的步骤，包括：

计算所述第二身份证图像中第一篡改区域的面积，所述第一篡改区域为所述第二身份证图像中各像素点对应的篡改预测值大于第一阈值的区域；

计算所述第二身份证图像中第二篡改区域的面积，所述第二篡改区域为所述第二身份证图像中各像素点对应的篡改预测值大于第二阈值的区域；

基于所述第一篡改区域的面积和所述第二篡改区域的面积判断所述原始身份证图像是否为篡改身份证图像。

此外，为实现上述目的，本发明还提出一种身份证篡改检测装置，所述身份证篡改检测装置包括：

语义分割模块，用于通过预设语义分割模型对用户上传的原始身份证图像进行语义分割，并对经过语义分割后的原始身份证图像进行仿射变换，得到第一身份证图像，所述预设语义分割模型通过对DeeplabV3+模型进行训练后获得；

质量检测模块，用于使用预设质量检测模型对所述第一身份证图像进行图像质量检测，并基于检测结果确定第二身份证图像，所述预设质量检测模型通过对MobileNetV3-large模型进行训练后获得；

数据预测模块，用于将所述第二身份证图像输入至DCT-CFNet网络架构，得到所述第二身份证图像中各像素点对应的篡改预测值，所述DCT-CFNet网络架构基于DCT技术分支、CFM分支和RGB分支构建；

数据判断模块，用于基于所述篡改预测值判断所述原始身份证图像是否为篡改身份证图像。

此外，为实现上述目的，本发明还提出一种身份证篡改检测设备，所述设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的身份证篡改检测程序，所述身份证篡改检测程序配置为实现如上文所述的身份证篡改检测方法的步骤。

此外，为实现上述目的，本发明还提出一种存储介质，所述存储介质上存储有身份证篡改检测程序，所述身份证篡改检测程序被处理器执行时实现如上文所述的身份证篡改检测方法的步骤。

本发明通过预设语义分割模型对用户上传的原始身份证图像进行语义分割，并对经过语义分割后的原始身份证图像进行仿射变换，得到第一身份证图像，预设语义分割模型通过对DeeplabV3+模型进行训练后获得；使用预设质量检测模型对第一身份证图像进行图像质量检测，并基于检测结果确定第二身份证图像，预设质量检测模型通过对MobileNetV3-large模型进行训练后获得；将第二身份证图像输入至DCT-CFNet网络架构，得到第二身份证图像中各像素点对应的篡改预测值，DCT-CFNet网络架构基于RGB分支、DCT分支和CFM分支构建；基于篡改预测值判断原始身份证图像是否为篡改身份证图像。相比于现有技术通过审核人员进行人工审核的方式来实现篡改检测，由于本发明上述方法通过预设模型对用户上传的原始身份证图像进行语义分割和质量检测，然后基于DCT-CFNet网络架构获取通过检测的图像中各像素点对应的篡改预测值，并根据篡改检测值判断原始身份证图像是否为篡改身份证图像，从而避免了现有的图像篡改检测方法受人为主观因素的负面影响较大，进而能够快速准确地对身份证图像进行篡改检测。

附图说明

图1为本发明实施例方案涉及的硬件运行环境的身份证篡改检测设备的结构示意图；

图2为本发明身份证篡改检测方法第一实施例的流程示意图；

图3为本发明身份证篡改检测方法第二实施例的流程示意图；

图4为本发明身份证篡改检测方法第三实施例的流程示意图；

图5为本发明身份证篡改检测装置第一实施例的结构框图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

参照图1，图1为本发明实施例方案涉及的硬件运行环境的身份证篡改检测设备结构示意图。

如图1所示，该身份证篡改检测设备可以包括：处理器1001，例如中央处理器（Central Processing Unit，CPU），通信总线1002、用户接口1003，网络接口1004，存储器1005。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏（Display）、输入单元比如键盘（Keyboard），可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口（如无线保真（Wireless-Fidelity，Wi-Fi）接口）。存储器1005可以是高速的随机存取存储器（RandomAccess Memory，RAM），也可以是稳定的非易失性存储器（Non-Volatile Memory，NVM），例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图1中示出的结构并不构成对身份证篡改检测设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及身份证篡改检测程序。

在图1所示的身份证篡改检测设备中，网络接口1004主要用于与网络服务器进行数据通信；用户接口1003主要用于与用户进行数据交互；本发明身份证篡改检测设备中的处理器1001、存储器1005可以设置在身份证篡改检测设备中，所述身份证篡改检测设备通过处理器1001调用存储器1005中存储的身份证篡改检测程序，并执行本发明实施例提供的身份证篡改检测方法。

本发明实施例提供了一种身份证篡改检测方法，参照图2，图2为本发明身份证篡改检测方法第一实施例的流程示意图。

本实施例中，所述身份证篡改检测方法包括以下步骤：

步骤S10：通过预设语义分割模型对用户上传的原始身份证图像进行语义分割，并对经过语义分割后的原始身份证图像进行仿射变换，得到第一身份证图像，所述预设语义分割模型通过对DeeplabV3+模型进行训练后获得。

需要说明的是，本实施例方法的执行主体可以是具有数据处理、网络通讯以及程序运行功能的计算服务设备，例如手机、平板电脑、个人电脑等，还可以是能够实现相同或相似功能的其他电子设备，本实施例对此不加以限制。此处将以身份证篡改检测设备（下文简称检测设备）为例对本发明身份证篡改检测方法的各项实施例进行说明。

可理解的是，上述预设语义分割模型为DeeplabV3+模型经过训练后得到的模型，上述DeeplabV3+模型是一种基于卷积神经网络的图像分割模型，其主要特点是采用了空洞卷积和多尺度金字塔池化等技术来提高分割效果。

应理解的是，语义分割可以是一种计算机视觉任务，是将一张图像中的每个像素进行分类的过程。具体地，在本实施例中，可以通过语义分割的方式来将上述用户上传的原始身份证图像分割为身份证区域和非身份证区域，从而避免非身份证区域对篡改检测结果的负面影响。

应理解的是，上述仿射变换是用于计算机视觉和图形学中的一种线性变换，它能够对输入图像进行平移、旋转、缩放等操作而不改变其形状。在本实施例中，可以通过仿射变换来对上述语义分割后的原始身份证图像进行矫正，从而得到更为准确的第一身份证图像。

步骤S20：使用预设质量检测模型对所述第一身份证图像进行图像质量检测，并基于检测结果确定第二身份证图像，所述预设质量检测模型通过对MobileNetV3-large模型进行训练后获得。

需要说明的是，上述MobileNetV3-large模型是一种基于轻量级深度神经网络的图像分类模型，其采用了轻量化设计和网络剪枝等技术，使得模型具有更小的计算量和更高的运行速度。

在具体实现中，可以通过获取上述第一身份证图像的相关参数来对图像欠曝、过曝、反光、模糊、不完整等异常进行初步分类判断来实现对第一身份证图像的图像质量检测。

步骤S30：将所述第二身份证图像输入至DCT-CFNet网络架构，得到所述第二身份证图像中各像素点对应的篡改预测值，所述DCT-CFNet网络架构基于RGB（Red Green Blue，红绿蓝）分支、DCT（Discrete Cosine Transform，离散余弦变换）分支和CFM（ContextFusion Module，上下文融合模块）分支构建。

需要说明的是，上述DCT-CFNet网络架构是一种三分支网络架构，三分支即RGB分支、DCT分支和CFM分支。

应理解的是，上述篡改预测值可以是第二身份证图像中各像素点为篡改像素点的概率值。

在具体实现中，可将图像分解为多个8x8的小块并进行DCT变换，由于图像篡改会导致DCT系数的局部跳变，因此可以通过卷积神经网络学习DCT系数的变化来确定图像是否被篡改。CFM分支使用上下文信息融合模块完成上下文特征融合，通过各分支的跳跃连接和拼接操作让网络更好地学习关注细微的文字篡改区域。融合特征最终经过上采样和分割头，输出各像素的篡改预测值。

步骤S40：基于所述篡改预测值判断所述原始身份证图像是否为篡改身份证图像。

在具体实现中，可以通过对比上述篡改预测值与某一阈值的大小来判断上述原始身份证图像是否为篡改身份证图像。

进一步地，在本实施例中，为了避免逐一对第二身份证图像中的所有像素点进行对比，从而提升身份证篡改检测的检测效率，所述步骤S40，可以包括：

步骤S401：计算所述第二身份证图像中第一篡改区域的面积，所述第一篡改区域为所述第二身份证图像中各像素点对应的篡改预测值大于第一阈值的区域。

步骤S402：计算所述第二身份证图像中第二篡改区域的面积，所述第二篡改区域为所述第二身份证图像中各像素点对应的篡改预测值大于第二阈值的区域。

步骤S403：基于所述第一篡改区域的面积和所述第二篡改区域的面积判断所述原始身份证图像是否为篡改身份证图像。

在具体实现中，由于逐一对第二身份证图像中的所有像素点进行对比需要耗费的时间过长。因此本实施例通过将第一篡改区域的面积和上述第二篡改区域的面积进行运算，从而得到篡改得分，并根据篡改得分与预设得分的数值大小来判断上述原始身份证图像是否为篡改身份证图像。示例性地，假设上述第一阈值为0.5，第二阈值为0.8，预设得分为S0，篡改得分为第一篡改区域的面积与第二篡改区域的面积的比值。则上述第一篡改区域的面积为第二身份证图像中各像素点对应的篡改预测值大于0.5的区域面积S1，上述第二篡改区域的面积为第二身份证图像中各像素点对应的篡改预测值大于0.8的区域面积S2。因此，最终对应的篡改得分为S1/S2。若S1/S2大于或等于S0，则表明此时第二身份证图像对应的原始身份证图像为篡改身份证图像；若S1/S2小于S0，则表明此时第二身份证图像对应的原始身份证图像不是篡改身份证图像。

本发明通过预设语义分割模型对用户上传的原始身份证图像进行语义分割，并对经过语义分割后的原始身份证图像进行仿射变换，得到第一身份证图像，预设语义分割模型通过对DeeplabV3+模型进行训练后获得；使用预设质量检测模型对第一身份证图像进行图像质量检测，并基于检测结果确定第二身份证图像，预设质量检测模型通过对MobileNetV3-large模型进行训练后获得；将第二身份证图像输入至DCT-CFNet网络架构，得到第二身份证图像中各像素点对应的篡改预测值，DCT-CFNet网络架构基于RGB分支、DCT分支和CFM分支构建；计算第二身份证图像中第一篡改区域的面积，第一篡改区域为第二身份证图像中各像素点对应的篡改预测值大于第一阈值的区域；计算第二身份证图像中第二篡改区域的面积，第二篡改区域为第二身份证图像中各像素点对应的篡改预测值大于第二阈值的区域；基于第一篡改区域的面积和第二篡改区域的面积判断原始身份证图像是否为篡改身份证图像。相比于现有技术通过审核人员进行人工审核的方式来实现篡改检测，由于本发明上述方法通过预设模型对用户上传的原始身份证图像进行语义分割和质量检测，然后基于DCT-CFNet网络架构获取通过检测的图像中各像素点对应的篡改预测值，并根据篡改检测值判断原始身份证图像是否为篡改身份证图像，从而避免了现有的图像篡改检测方法受人为主观因素的负面影响较大，进而能够快速准确地对身份证图像进行篡改检测。

参考图3，图3为本发明身份证篡改检测方法第二实施例的流程示意图。

基于上述第一实施例，在本实施例中，为了更为准确地获得第一身份证图像，从而提升篡改检测结果的准确性，所述步骤S10，可包括：

步骤S101：通过预设语义分割模型对用户上传的原始身份证图像进行语义分割，得到身份证阈值图，所述身份证阈值图中身份证相关区域的像素值为1，非身份证相关区域的像素值为0。

需要说明的是，上述身份证阈值图的形状大小与上述用户上传的原始身份证图像一致，且身份证阈值图在经过上述预设语义分割模型的二值化处理后，每个像素点的值表示其所属的物体类别或背景的概率。例如，像素点A的像素值为1，即表明像素点A为身份证部分的像素；像素点B的像素值为0，即表明像素点B为非身份证部分的像素。

步骤S102：通过OpenCV函数库中的findContours函数获取所述身份证阈值图的轮廓。

需要说明的是，上述OpenCV函数库是一种开源的计算机视觉函数库，其中findContours函数是一种用于查找图像轮廓的函数。

在具体实现中，可以通过findContours函数来遍历上述身份证阈值图的每个像素，并查找与身份证阈值图边缘相连的像素，从而获得身份证阈值图的轮廓。

步骤S103：对所述身份证阈值图的轮廓进行多边形拟合，得到预设数量的身份证角点。

需要说明的是，上述多边形拟合是一种图像处理技术，用于近似描述图像中的形状，上述身份证角点可以是身份证四个角对应的点。

在具体实现中，可以基于上述身份证阈值图的轮廓近似提取出一系列线段组成的多边形，从而得到预设数量的身份证角点。

步骤S104：以所述身份证角点为基准对所述身份证阈值图进行仿射变换，得到第一身份证图像。

进一步地，在本实施例中，为了提高语义分割的精度，所述步骤S10之前，还可以包括：

步骤S1：基于残差网络结构构建DeeplabV3+模型，所述DeeplabV3+模型的权重通过在COCO数据集上训练得到。

需要说明的是，上述残差网络结构（Residual Network，简称ResNet）是一种深度卷积神经网络结构，它包含多个残差块，每个残差块由多个卷积层和shortcut connection组成，每个残差块内部的卷积层有相同的卷积核大小和数量，同时每个残差块的输入和输出的通道数是相同的。

步骤S2：对人工标注的卡证分割数据集中的数据进行数据增强，得到数据增强后的卡证分割数据集。

需要说明的是，上述人工标注的卡证分割数据集可以是包含了若干不同场景下（如不同背景、不同像素、不同尺寸等）区分了身份证区域与非身份证区域的图像数据集。

在具体实现中，可以通过同等概率的随机裁剪、随机旋转、随机缩放、色彩变换、对比度增强等手段来实现对人工标注的卡证分割数据集中的数据进行数据增强，从而得到数据增强后的卡证分割数据集。

步骤S3：以所述数据增强后的卡证分割数据集作为训练数据集，对所述DeeplabV3+模型进行训练，得到预设语义分割模型。

在具体实现中，由于上述预设语义分割模型为DeeplabV3+模型经过了训练后得到的模型，因此预设语义分割模型的泛化能力和预测精度相较于DeeplabV3+模型有了较大的提升。

基于上述第一实施例，在本实施例中，为了避免对用户上传的不合格身份证图像进行篡改检测，从而导致无效检测的情况发生，所述步骤S20，可包括：

步骤S201：基于人工筛选的不合格图像数据集对MobileNetV3-large模型进行训练，以修改所述MobileNetV3-large模型的分类头，得到预设质量检测模型。

需要说明的是，上述人工筛选的不合格图像数据集可以是包含了欠曝、过曝、反光、模糊、不完整等异常情形图像的数据集。特别地，上述预设质量检测模型还可以基于ResNet、ShuffleNet等其他网络构建，本实施例对此不加以限制。

步骤S202：通过所述预设质量检测模型对所述第一身份证图像进行分类，并基于分类结果判断所述第一身份证图像是否达到质量阈值要求。

在具体实现中，上述预设质量检测模型可以包含全局平均池化层、线性层、损失函数。具体地，可以在提取完图像特征并经过全局平均池化层后，使用多个不同的线性层连接全局平均池化层，代表多个不同标签的分类，损失函数使用各类别的交叉熵损失之和，从而实现基于分类结果判断上述第一身份证图像是否达到质量阈值要求。

步骤S203：若是，则将所述第一身份证图像确定为第二身份证图像。

应理解的是，若上述分类结果中不包含异常图形（即过曝、反光、模糊、不完整等异常情形）类，则可以判断当前的第一身份证图像达到质量阈值要求。

步骤S204：若否，则将所述第一身份证图像退回，并基于所述分类结果向用户反馈退回日志，以使用户按照所述退回日志重新上传身份证图像。

应理解的是，若上述分类结果中包含异常图形类，则可以判断当前的第一身份证图像未达到质量阈值要求。因此需要告知用户该图像属于不合格图像，并提醒用户重新上传身份证图像，然后再通过上述预设质量检测模型对重新上传的身份证图像进行质量检测，直至达到质量阈值要求。

本实施例基于残差网络结构构建DeeplabV3+模型，DeeplabV3+模型的权重通过在COCO数据集上训练得到；对人工标注的卡证分割数据集中的数据进行数据增强，得到数据增强后的卡证分割数据集；以数据增强后的卡证分割数据集作为训练数据集，对DeeplabV3+模型进行训练，得到预设语义分割模型；通过预设语义分割模型对用户上传的原始身份证图像进行语义分割，得到身份证阈值图，身份证阈值图中身份证相关区域的像素值为1，非身份证相关区域的像素值为0；通过OpenCV函数库中的findContours函数获取身份证阈值图的轮廓；对身份证阈值图的轮廓进行多边形拟合，得到预设数量的身份证角点；以身份证角点为基准对身份证阈值图进行仿射变换，得到第一身份证图像；基于人工筛选的不合格图像数据集对MobileNetV3-large模型进行训练，以修改MobileNetV3-large模型的分类头，得到预设质量检测模型；通过预设质量检测模型对第一身份证图像进行分类，并基于分类结果判断第一身份证图像是否达到质量阈值要求；若是，则将第一身份证图像确定为第二身份证图像；若否，则将第一身份证图像退回，并基于分类结果向用户反馈退回日志，以使用户按照退回日志重新上传身份证图像。相较于现有技术，本实施例上述方法通过构建预设语义分割模型和预设质量检测模型，并基于预设语义分割模型和预设质量检测模型对身份证图像进行语义分割和质量检测，从而能够避免对不合格的身份证图像进行无效检测的情况，进而提升了身份证图像的篡改检测效率。

参考图4，图4为本发明身份证篡改检测方法第三实施例的流程示意图。

基于上述各实施例，在本实施例中，为了更为准确地得到篡改预测值，从而提高本实施例篡改检测的可信度，所述步骤S30，可包括：

步骤S301：将所述第二身份证图像以RGB图像的形式分别输入至DCT-CFNet网络架构中的RGB分支、DCT分支和CFM分支，并分别输出RGB分支特征、DCT分支特征和CFM分支特征。

应理解的是，以CFM分支为例，上述输出CFM分支特征的步骤，可以包括：

在DCT-CFNet网络架构中的CFM分支中，采用若干卷积块对上述第二身份证图像对应的RGB图像进行下采样，得到CFM分支特征。其中，上述卷积块使用3×3卷积-批归一化-ReLU激活函数的设置。

在具体实现中，上述RGB分支、DCT分支和CFM分支均采用了Encoder-Decoder设计，Eecoder部分采用多个卷积块对第二身份证图像进行下采样，卷积块使用3×3卷积-批归一化-ReLU（Rectified Linear Unit，线性整流函数）激活函数的设置。其中，三个分支均以第二身份证图像对应的RGB图像作为输入图像，可以给定像素为512×512的输入图像，使用堆叠的卷积块将特征下采样到128×128，64×64，32×32，16×16四个维度，四个维度的特征通道数分别为32，64，160，256。在Decoder阶段，以RGB分支为例，使用双线性插值及卷积的组合操作将特征进行上采样，此过程同时将输入的通道数减半并将分辨率增加一倍，与经过跳跃连接的Encoder中同等分辨率尺度的输出结合，随后通过两个卷积块，卷积块的设置与 Encoder 中的一致，输出R1特征。重复进行上采样、跳跃连接、拼接、卷积的操作并将特征恢复到与输入相同的大小，并逐步依次降低通道数，输出R2、R3、R4特征，上述R1、R2、R3、R4特征即为上述RGB分支特征。对于DCT分支，首先将图像分解为多个8x8的小块，使用OpenCV提供的变换函数进行DCT变换，类似的，使用堆叠的卷积块对DCT系数进行特征提取，将特征下采样到128×128，64×64，32×32，16×16四个维度，四个维度的特征通道数分别为32，64，160，256。在Decoder阶段，采用与RGB分支类似的方式输出特征。特别地，上述卷积块可以替换为Transformer块，上述Transformer块是一种基于注意力机制的神经网络模块，由多头注意力机制和前馈神经网络组成。

步骤S302：在所述CFM分支中通过上下文信息融合模块对所述RGB分支特征、所述DCT分支特征和所述CFM分支特征进行融合处理，得到所述第二身份证图像中各像素点对应的篡改预测值。

在具体实现中，可以使用Focal Loss和Cross Entropy Loss作为损失函数来指导DCT-CFNet网络架构的训练，其中，DCT-CFNet网络架构对应的训练数据集可以是开源图像篡改数据集。从而基于训练好的DCT-CFNet网络架构获取上述第二身份证图像中各像素点对应的篡改预测值。

进一步地，在本实施例中，为了更为准确地得到篡改预测值，从而提升身份证篡改检测的检测结果的可信度，可以使用上下文信息融合模块对所述RGB分支特征、所述DCT分支特征和所述CFM分支特征进行融合，所述步骤S302，可以包括：

步骤S3021：通过Sigmoid函数对所述DCT分支特征进行激活，得到激活特征，所述DCT分支特征为DCT分支输出的特定分辨率特征。

需要说明的是，上述Sigmoid函数可以是一种用作中间层神经元的激活函数，它可以通过将输入归一化到[0,1]的范围内，来控制神经元的输出值，并将该值传递给下一层网络，从而实现对上述DCT分支特征的激活。

步骤S3022：将所述激活特征与所述RGB分支特征相乘，得到第一图像特征，所述RGB分支特征为所述RGB分支中相同分辨率的特征。

步骤S3023：将所述激活特征与所述CFM分支特征相乘，得到第二图像特征，所述CFM分支特征为所述CFM分支中相同分辨率的特征。

步骤S3024：使用双线性插值及卷积的组合操作对所述CFM分支最终高维特征进行上采样，以使所述CFM分支最终高维特征的通道数量减半且分辨率增加一倍，得到第三图像特征。

应理解的是，上述双线性插值操作可以通过对原始图像的像素进行采样，并在新的像素之间进行插值来实现，从而将原始图像缩放到另一个尺寸。本实施例采用双线性插值操作可以保留原始特征中的细节，并在缩放后产生更平滑的特征。

步骤S3025：对所述第一图像特征、所述第二图像特征和所述第三图像特征进行特征拼接，并使用卷积块再次进行特征提取，得到融合特征。

在具体实现中，上述卷积块可以使用3×3卷积-批归一化-ReLU激活函数的设置。

步骤S3026：基于所述融合特征得到所述第二身份证图像中各像素点对应的篡改预测值。

本实施例通过将第二身份证图像以RGB图像的形式分别输入至DCT-CFNet网络架构中的RGB分支、DCT分支和CFM分支，并分别输出RGB分支特征、DCT分支特征和CFM分支特征；通过Sigmoid函数对DCT分支特征进行激活，得到激活特征，DCT分支特征为DCT分支输出的特定分辨率特征；将激活特征与RGB分支特征相乘，得到第一图像特征，RGB分支特征为RGB分支中相同分辨率的特征；将激活特征与CFM分支特征相乘，得到第二图像特征，CFM分支特征为CFM分支中相同分辨率的特征；使用双线性插值及卷积的组合操作对CFM分支最终高维特征进行上采样，以使CFM分支最终高维特征的通道数量减半且分辨率增加一倍，得到第三图像特征；对第一图像特征、第二图像特征和第三图像特征进行特征拼接，并使用卷积块再次进行特征提取，得到融合特征；基于融合特征的迭代运算得到第二身份证图像中各像素点对应的篡改预测值。相比于现有技术通过审核人员进行人工审核的方式来实现篡改检测，由于本发明上述方法基于DCT-CFNet网络架构获取通过检测的图像中各像素点对应的篡改预测值，并根据篡改检测值判断原始身份证图像是否为篡改身份证图像，从而避免了现有的图像篡改检测方法受人为主观因素的负面影响较大，进而能够快速准确地对身份证图像进行篡改检测。

此外，本发明实施例还提出一种存储介质，所述存储介质上存储有身份证篡改检测程序，所述身份证篡改检测程序被处理器执行时实现如上文所述的身份证篡改检测方法的步骤。

参照图5，图5为本发明身份证篡改检测装置第一实施例的结构框图。

如图5所示，本发明实施例提出的身份证篡改检测装置包括：

语义分割模块501，用于通过预设语义分割模型对用户上传的原始身份证图像进行语义分割，并对经过语义分割后的原始身份证图像进行仿射变换，得到第一身份证图像，所述预设语义分割模型通过对DeeplabV3+模型进行训练后获得；

质量检测模块502，用于使用预设质量检测模型对所述第一身份证图像进行图像质量检测，并基于检测结果确定第二身份证图像，所述预设质量检测模型通过对MobileNetV3-large模型进行训练后获得；

数据预测模块503，用于将所述第二身份证图像输入至DCT-CFNet网络架构，得到所述第二身份证图像中各像素点对应的篡改预测值，所述DCT-CFNet网络架构基于DCT技术分支、CFM分支和RGB分支构建；

数据判断模块504，用于基于所述篡改预测值判断所述原始身份证图像是否为篡改身份证图像。

基于本发明上述身份证篡改检测装置的第一实施例，提出本发明身份证篡改检测装置的第二实施例。

在本实施例中，所述语义分割模块501，还用于通过预设语义分割模型对用户上传的原始身份证图像进行语义分割，得到身份证阈值图，所述身份证阈值图中身份证相关区域的像素值为1，非身份证相关区域的像素值为0；通过OpenCV函数库中的findContours函数获取所述身份证阈值图的轮廓；对所述身份证阈值图的轮廓进行多边形拟合，得到预设数量的身份证角点；以所述身份证角点为基准对所述身份证阈值图进行仿射变换，得到第一身份证图像。

进一步地，所述语义分割模块501，还用于基于残差网络结构构建DeeplabV3+模型，所述DeeplabV3+模型的权重通过在COCO数据集上训练得到；对人工标注的卡证分割数据集中的数据进行数据增强，得到数据增强后的卡证分割数据集；以所述数据增强后的卡证分割数据集作为训练数据集，对所述DeeplabV3+模型进行训练，得到预设语义分割模型。

进一步地，所述质量检测模块502，还用于基于人工筛选的不合格图像数据集对MobileNetV3-large模型进行训练，以修改所述MobileNetV3-large模型的分类头，得到预设质量检测模型；通过所述预设质量检测模型对所述第一身份证图像进行分类，并基于分类结果判断所述第一身份证图像是否达到质量阈值要求；若是，则将所述第一身份证图像确定为第二身份证图像；若否，则将所述第一身份证图像退回，并基于所述分类结果向用户反馈退回日志，以使用户按照所述退回日志重新上传身份证图像。

进一步地，所述数据预测模块503，还用于将所述第二身份证图像以RGB图像的形式分别输入至DCT-CFNet网络架构中的RGB分支、DCT分支和CFM分支，并分别输出RGB分支特征、DCT分支特征和CFM分支特征；在所述CFM分支中通过上下文信息融合模块对所述RGB分支特征、所述DCT分支特征和所述CFM分支特征进行融合处理，得到所述第二身份证图像中各像素点对应的篡改预测值。

进一步地，所述数据预测模块503，还用于通过Sigmoid函数对所述DCT分支特征进行激活，得到激活特征，所述DCT分支特征为DCT分支输出的特定分辨率特征；将所述激活特征与所述RGB分支特征相乘，得到第一图像特征，所述RGB分支特征为所述RGB分支中相同分辨率的特征；将所述激活特征与所述CFM分支特征相乘，得到第二图像特征，所述CFM分支特征为所述CFM分支中相同分辨率的特征；对所述第一图像特征、所述第二图像特征和所述第三图像特征进行特征拼接，并使用卷积块再次进行特征提取，得到融合特征；基于所述融合特征得到所述第二身份证图像中各像素点对应的篡改预测值。

进一步地，所述数据判断模块504，还用于计算所述第二身份证图像中第一篡改区域的面积，所述第一篡改区域为所述第二身份证图像中各像素点对应的篡改预测值大于第一阈值的区域；计算所述第二身份证图像中第二篡改区域的面积，所述第二篡改区域为所述第二身份证图像中各像素点对应的篡改预测值大于第二阈值的区域；基于所述第一篡改区域的面积和所述第二篡改区域的面积判断所述原始身份证图像是否为篡改身份证图像。

本发明身份证篡改检测装置的其他实施例或具体实现方式可参照上述各方法实施例，此处不再赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质（如只读存储器/随机存取存储器、磁碟、光盘）中，包括若干指令用以使得一台终端设备（可以是手机，计算机，服务器，或者网络设备等）执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种身份证篡改检测方法，其特征在于，所述方法包括以下步骤：

基于所述篡改预测值判断所述原始身份证图像是否为篡改身份证图像；

其中，所述将所述第二身份证图像输入至DCT-CFNet网络架构，得到所述第二身份证图像中各像素点对应的篡改预测值的步骤，包括：

在DCT-CFNet网络架构中的CFM分支中，采用若干卷积块对所述第二身份证图像对应的RGB图像进行下采样，得到CFM分支特征，所述卷积块使用3×3卷积-批归一化-ReLU激活函数的设置；

所述在所述CFM分支中通过上下文信息融合模块对所述RGB分支特征、所述DCT分支特征和所述CFM分支特征进行融合处理，得到所述第二身份证图像中各像素点对应的篡改预测值的步骤，包括：

2.如权利要求1所述的身份证篡改检测方法，其特征在于，所述通过预设语义分割模型对用户上传的原始身份证图像进行语义分割，并对经过语义分割后的原始身份证图像进行仿射变换，得到第一身份证图像的步骤，包括：

3.如权利要求2所述的身份证篡改检测方法，其特征在于，所述通过预设语义分割模型对用户上传的原始身份证图像进行语义分割，并对经过语义分割后的原始身份证图像进行仿射变换，得到第一身份证图像的步骤之前，还包括：

4.如权利要求1所述的身份证篡改检测方法，其特征在于，所述使用预设质量检测模型对所述第一身份证图像进行图像质量检测，并基于检测结果确定第二身份证图像的步骤，包括：

若是，则将所述第一身份证图像确定为第二身份证图像；

5.如权利要求1所述的身份证篡改检测方法，其特征在于，所述基于所述篡改预测值判断所述原始身份证图像是否为篡改身份证图像的步骤，包括：

6.一种身份证篡改检测装置，其特征在于，所述身份证篡改检测装置包括：

数据判断模块，用于基于所述篡改预测值判断所述原始身份证图像是否为篡改身份证图像；

其中，所述数据预测模块，还用于：

7.一种身份证篡改检测设备，其特征在于，所述设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的身份证篡改检测程序，所述身份证篡改检测程序配置为实现如权利要求1至5中任一项所述的身份证篡改检测方法的步骤。

8.一种存储介质，其特征在于，所述存储介质上存储有身份证篡改检测程序，所述身份证篡改检测程序被处理器执行时实现如权利要求1至5中任一项所述的身份证篡改检测方法的步骤。