CN117934254A - 水印处理模型训练方法、水印处理方法、装置和设备 - Google Patents
水印处理模型训练方法、水印处理方法、装置和设备 Download PDFInfo
- Publication number
- CN117934254A CN117934254A CN202410120000.9A CN202410120000A CN117934254A CN 117934254 A CN117934254 A CN 117934254A CN 202410120000 A CN202410120000 A CN 202410120000A CN 117934254 A CN117934254 A CN 117934254A
- Authority
- CN
- China
- Prior art keywords
- watermark
- document image
- sample
- processing model
- watermark information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 title claims abstract description 382
- 238000012549 training Methods 0.000 title claims abstract description 128
- 238000000034 method Methods 0.000 title claims abstract description 80
- 238000003672 processing method Methods 0.000 title description 4
- 238000004590 computer program Methods 0.000 claims abstract description 30
- 230000004927 fusion Effects 0.000 claims description 81
- 238000000605 extraction Methods 0.000 claims description 76
- 238000007499 fusion processing Methods 0.000 claims description 30
- 230000009467 reduction Effects 0.000 claims description 28
- 230000009191 jumping Effects 0.000 claims description 6
- 230000008569 process Effects 0.000 description 13
- 238000012360 testing method Methods 0.000 description 12
- 230000004913 activation Effects 0.000 description 9
- 238000004088 simulation Methods 0.000 description 4
- 238000011282 treatment Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/0021—Image watermarking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2201/00—General purpose image data processing
- G06T2201/005—Image watermarking
- G06T2201/0065—Extraction of an embedded watermark; Reliable detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Multimedia (AREA)
- Editing Of Facsimile Originals (AREA)
- Image Processing (AREA)
Abstract
本申请涉及一种水印处理模型训练方法、水印处理方法、装置、计算机设备、存储介质和计算机程序产品,涉及计算机技术领域,可用于金融科技领域或其他相关领域。该方法包括:获取样本文档图像和样本水印信息;将样本文档图像和样本水印信息,输入至待训练的水印处理模型中,得到已嵌水印文档图像;通过待训练的水印处理模型,对已嵌水印文档图像进行模拟失真处理,得到失真文档图像,对失真文档图像进行水印提取处理,得到预测水印信息;根据样本文档图像和已嵌水印文档图像之间的差异,以及样本水印信息和预测水印信息之间的差异,对待训练的水印处理模型进行迭代训练,得到训练完成的水印处理模型。采用本方法,能够提高水印的处理准确率。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种水印处理模型训练方法、水印处理方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
随着金融科技技术的发展,为了提高与金融业务相关的文档图像的安全性,通常会对文档图像进行水印处理。
传统技术中,在对文档图像进行水印处理时,主要是通过在文档图像的DCT(Discrete Cosine Transform,离散余弦变换)域中执行水印嵌入操作;但是,这种方式对于常见的信号处理操作(如压缩、滤波等)和恶意攻击(如裁剪、旋转等)的鲁棒性较差,容易造成水印被严重损坏或丢失,导致提取出的水印的准确率较低,从而导致水印的处理准确率较低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高水印的处理准确率的水印处理模型训练方法、水印处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种水印处理模型训练方法,包括:
获取样本文档图像和样本水印信息;所述样本文档图像为与金融业务关联的文档图像;
将所述样本文档图像和所述样本水印信息,输入至待训练的水印处理模型中,得到已嵌水印文档图像;所述已嵌水印文档图像中嵌入有所述样本水印信息;
通过所述待训练的水印处理模型,对所述已嵌水印文档图像进行模拟失真处理,得到失真文档图像,对所述失真文档图像进行水印提取处理,得到预测水印信息;
根据所述样本文档图像和所述已嵌水印文档图像之间的差异,以及所述样本水印信息和所述预测水印信息之间的差异,对所述待训练的水印处理模型进行迭代训练,得到训练完成的水印处理模型。
在其中一个实施例中,所述将所述样本文档图像和所述样本水印信息,输入至待训练的水印处理模型中,得到已嵌水印文档图像,包括:
将所述样本文档图像和所述样本水印信息,输入至待训练的水印处理模型中,得到所述样本文档图像对应的掩模图像;
根据所述待训练的水印处理模型的水印嵌入强度,对所述样本文档图像和所述掩模图像进行融合处理,得到已嵌水印文档图像。
在其中一个实施例中,所述将所述样本文档图像和所述样本水印信息,输入至待训练的水印处理模型中,得到所述样本文档图像对应的掩模图像,包括:
通过待训练的水印处理模型,对所述样本文档图像和所述样本水印信息进行第一特征提取处理,得到与所述样本文档图像和所述样本水印信息对应的底层特征;
对所述底层特征进行多次融合处理,得到所述底层特征对应的目标融合特征;
对所述目标融合特征进行第二特征提取处理,得到所述掩模图像。
在其中一个实施例中,所述对所述底层特征进行多次融合处理,得到所述底层特征对应的目标融合特征,包括:
对所述底层特征进行局部特征提取处理,得到局部特征;
对所述局部特征和所述底层特征进行融合处理,得到融合特征;
将所述融合特征作为新的底层特征,并跳转至所述对所述底层特征进行局部特征提取处理,得到局部特征的步骤,直到得到的融合特征满足预设条件;
将满足所述预设条件的融合特征,作为所述底层特征对应的目标融合特征。
在其中一个实施例中,所述对所述失真文档图像进行水印提取处理,得到预测水印信息,包括:
对所述失真文档图像进行第三特征提取处理,得到失真文档图像特征;
对所述失真文档图像特征进行特征降维处理,得到所述失真文档图像特征对应的降维特征;
对所述降维特征进行转换处理,得到预测水印信息。
在其中一个实施例中,所述根据所述样本文档图像和所述已嵌水印文档图像之间的差异,以及所述样本水印信息和所述预测水印信息之间的差异,对所述待训练的水印处理模型进行迭代训练,得到训练完成的水印处理模型,包括:
根据所述样本文档图像和所述已嵌水印文档图像之间的差异,得到第一损失值,以及根据所述样本水印信息和所述预测水印信息之间的差异,得到第二损失值;
将所述第一损失值和所述第二损失值进行融合处理,得到目标损失值;
根据所述目标损失值,对所述待训练的水印处理模型进行迭代训练,直到满足预设结束条件;
将满足所述预设结束条件的水印处理模型,作为训练完成的水印处理模型。
在其中一个实施例中,在根据所述样本文档图像和所述已嵌水印文档图像之间的差异,以及所述样本水印信息和所述预测水印信息之间的差异,对所述待训练的水印处理模型进行迭代训练,得到训练完成的水印处理模型之后,还包括:
将待测试文档图像和待测试水印信息,输入至所述训练完成的水印处理模型,得到所述待测试水印信息对应的预测水印信息;
根据所述待测试水印信息和所述待测试水印信息对应的预测水印信息,确定所述训练完成的水印处理模型的预测准确率;
在所述预测准确率符合预设准确率的情况下,将所述训练完成的水印处理模型,作为目标水印处理模型。
第二方面,本申请提供了一种水印处理方法,包括:
获取待处理文档图像和待处理水印信息;所述待处理文档图像为与金融业务关联的文档图像;
将所述待处理文档图像和所述待处理水印信息,输入至训练完成的水印处理模型中,得到目标已嵌水印文档图像;所述目标已嵌水印文档图像中嵌入有所述待处理水印信息;所述训练完成的水印处理模型通过水印处理模型训练方法训练得到;
通过所述训练完成的水印处理模型,对所述目标已嵌水印文档图像进行模拟失真处理,得到目标失真文档图像,对所述目标失真文档图像进行水印提取处理,得到目标水印信息。
第三方面,本申请还提供了一种水印处理模型训练装置,包括:
样本获取模块,用于获取样本文档图像和样本水印信息;所述样本文档图像为与金融业务关联的文档图像;
图像生成模块,用于将所述样本文档图像和所述样本水印信息,输入至待训练的水印处理模型中,得到已嵌水印文档图像;所述已嵌水印文档图像中嵌入有所述样本水印信息;
水印预测模块,用于通过所述待训练的水印处理模型,对所述已嵌水印文档图像进行模拟失真处理,得到失真文档图像,对所述失真文档图像进行水印提取处理,得到预测水印信息;
模型训练模块,用于根据所述样本文档图像和所述已嵌水印文档图像之间的差异,以及所述样本水印信息和所述预测水印信息之间的差异,对所述待训练的水印处理模型进行迭代训练,得到训练完成的水印处理模型。
第四方面,本申请还提供了一种水印处理装置,包括:
数据获取模块,用于获取待处理文档图像和待处理水印信息;所述待处理文档图像为与金融业务关联的文档图像;
目标生成模块,用于将所述待处理文档图像和所述待处理水印信息,输入至训练完成的水印处理模型中,得到目标已嵌水印文档图像;所述目标已嵌水印文档图像中嵌入有所述待处理水印信息;所述训练完成的水印处理模型通过水印处理模型训练方法训练得到;
水印获取模块,用于通过所述训练完成的水印处理模型,对所述目标已嵌水印文档图像进行模拟失真处理,得到目标失真文档图像,对所述目标失真文档图像进行水印提取处理,得到目标水印信息。
第五方面,本申请还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取样本文档图像和样本水印信息;所述样本文档图像为与金融业务关联的文档图像;
将所述样本文档图像和所述样本水印信息,输入至待训练的水印处理模型中,得到已嵌水印文档图像;所述已嵌水印文档图像中嵌入有所述样本水印信息;
通过所述待训练的水印处理模型,对所述已嵌水印文档图像进行模拟失真处理,得到失真文档图像,对所述失真文档图像进行水印提取处理,得到预测水印信息;
根据所述样本文档图像和所述已嵌水印文档图像之间的差异,以及所述样本水印信息和所述预测水印信息之间的差异,对所述待训练的水印处理模型进行迭代训练,得到训练完成的水印处理模型。
第六方面,本申请还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取待处理文档图像和待处理水印信息;所述待处理文档图像为与金融业务关联的文档图像;
将所述待处理文档图像和所述待处理水印信息,输入至训练完成的水印处理模型中,得到目标已嵌水印文档图像;所述目标已嵌水印文档图像中嵌入有所述待处理水印信息;所述训练完成的水印处理模型通过水印处理模型训练方法训练得到;
通过所述训练完成的水印处理模型,对所述目标已嵌水印文档图像进行模拟失真处理,得到目标失真文档图像,对所述目标失真文档图像进行水印提取处理,得到目标水印信息。
第七方面,本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取样本文档图像和样本水印信息;所述样本文档图像为与金融业务关联的文档图像;
将所述样本文档图像和所述样本水印信息,输入至待训练的水印处理模型中,得到已嵌水印文档图像;所述已嵌水印文档图像中嵌入有所述样本水印信息;
通过所述待训练的水印处理模型,对所述已嵌水印文档图像进行模拟失真处理,得到失真文档图像,对所述失真文档图像进行水印提取处理,得到预测水印信息;
根据所述样本文档图像和所述已嵌水印文档图像之间的差异,以及所述样本水印信息和所述预测水印信息之间的差异,对所述待训练的水印处理模型进行迭代训练,得到训练完成的水印处理模型。
第八方面,本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取待处理文档图像和待处理水印信息;所述待处理文档图像为与金融业务关联的文档图像;
将所述待处理文档图像和所述待处理水印信息,输入至训练完成的水印处理模型中,得到目标已嵌水印文档图像;所述目标已嵌水印文档图像中嵌入有所述待处理水印信息;所述训练完成的水印处理模型通过水印处理模型训练方法训练得到;
通过所述训练完成的水印处理模型,对所述目标已嵌水印文档图像进行模拟失真处理,得到目标失真文档图像,对所述目标失真文档图像进行水印提取处理,得到目标水印信息。
第九方面,本申请还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取样本文档图像和样本水印信息;所述样本文档图像为与金融业务关联的文档图像;
将所述样本文档图像和所述样本水印信息,输入至待训练的水印处理模型中,得到已嵌水印文档图像;所述已嵌水印文档图像中嵌入有所述样本水印信息;
通过所述待训练的水印处理模型,对所述已嵌水印文档图像进行模拟失真处理,得到失真文档图像,对所述失真文档图像进行水印提取处理,得到预测水印信息;
根据所述样本文档图像和所述已嵌水印文档图像之间的差异,以及所述样本水印信息和所述预测水印信息之间的差异,对所述待训练的水印处理模型进行迭代训练,得到训练完成的水印处理模型。
第十方面,本申请还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取待处理文档图像和待处理水印信息;所述待处理文档图像为与金融业务关联的文档图像;
将所述待处理文档图像和所述待处理水印信息,输入至训练完成的水印处理模型中,得到目标已嵌水印文档图像;所述目标已嵌水印文档图像中嵌入有所述待处理水印信息;所述训练完成的水印处理模型通过水印处理模型训练方法训练得到;
通过所述训练完成的水印处理模型,对所述目标已嵌水印文档图像进行模拟失真处理,得到目标失真文档图像,对所述目标失真文档图像进行水印提取处理,得到目标水印信息。
上述水印处理模型训练方法、水印处理方法、装置、计算机设备、存储介质和计算机程序产品,先获取样本文档图像和样本水印信息,再将样本文档图像和样本水印信息,输入至待训练的水印处理模型中,得到嵌入有样本水印信息的已嵌水印文档图像,然后通过待训练的水印处理模型,对已嵌水印文档图像进行模拟失真处理,得到失真文档图像,对失真文档图像进行水印提取处理,得到预测水印信息,最后根据样本文档图像和已嵌水印文档图像之间的差异,以及样本水印信息和预测水印信息之间的差异,对待训练的水印处理模型进行迭代训练,得到训练完成的水印处理模型。这样,在进行水印处理时,通过将样本文档图像和样本水印信息作为输入值输入到待训练的水印处理模型中,再将水印处理模型输出的已嵌水印文档图像和预测水印信息作为输出值,并根据输入值和输出值之间的差异,对待训练的水印处理模型进行迭代训练,得到训练完成的水印处理模型,使得水印处理模型能够更好地适应不同类型的文档图像和水印信息,有利于提高水印嵌入和提取的准确性,进而提高了水印的处理准确率。
附图说明
为了更清楚地说明本申请实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一个实施例中水印处理模型训练方法的流程示意图;
图2为一个实施例中得到已嵌水印文档图像的步骤的流程示意图;
图3为另一个实施例中得到已嵌水印文档图像的步骤的流程示意图;
图4为一个实施例中得到样本文档图像对应的掩模图像的步骤的流程示意图;
图5为一个实施例中得到底层特征对应的目标融合特征的步骤的流程示意图;
图6为一个实施例中得到预测水印信息的步骤的流程示意图;
图7为另一个实施例中得到预测水印信息的步骤的流程示意图;
图8为一个实施例中训练完成的水印处理模型的步骤的流程示意图;
图9为一个实施例中水印处理方法的流程示意图;
图10为另一个实施例中水印处理模型训练方法的流程示意图;
图11为一个实施例中水印处理模型训练装置的结构框图;
图12为一个实施例中水印处理装置的结构框图;
图13为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要符合相关规定。
在一个示例性的实施例中,如图1所示,提供了一种水印处理模型训练方法,本实施例以该方法应用于服务器进行举例说明;可以理解的是,该方法也可以应用于终端,还可以应用于包括终端和服务器的系统,并通过终端和服务器之间的交互实现。其中,终端可以但不限于是各种个人计算机、笔记本电脑、智能手机和平板电脑;服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。本实施例中,该方法包括以下步骤:
步骤S101,获取样本文档图像和样本水印信息;样本文档图像为与金融业务关联的文档图像。
其中,文档图像是指包含文本信息的图像。需要说明的是,文档图像的大小可以是128*128像素。
其中,样本文档图像是指用于训练水印处理模型的文档图像。
其中,水印信息是指用于嵌入文档图像的数字水印。需要说明的是,水印信息的嵌入容量可以是50比特。
其中,样本水印信息是指用于训练水印处理模型的水印信息。
示例性地,服务器响应于针对水印处理模型的模型训练指令,从金融数据库中获取文档图像和水印信息,并从文档图像中,筛选出与该模型训练指令对应的文档图像,作为样本文档图像,从水印信息中,筛选出与该模型训练指令对应的水印信息,作为样本水印信息。
步骤S102,将样本文档图像和样本水印信息,输入至待训练的水印处理模型中,得到已嵌水印文档图像;已嵌水印文档图像中嵌入有样本水印信息。
其中,水印处理模型是指能够用于嵌入和提取水印信息的网络模型。
其中,已嵌水印文档图像是指已嵌入水印信息的文档图像。
示例性地,服务器将样本文档图像和样本水印信息,输入至待训练的水印处理模型中,通过待训练的水印处理模型,得到样本文档图像对应的掩模图像;接着,服务器对样本文档图像与样本文档图像对应的掩模图像进行融合处理,得到嵌入有样本水印信息的已嵌水印文档图像。
步骤S103,通过待训练的水印处理模型,对已嵌水印文档图像进行模拟失真处理,得到失真文档图像,对失真文档图像进行水印提取处理,得到预测水印信息。
其中,模拟失真处理是指将已嵌水印文档图像转换为失真文档图像的处理过程,例如对已嵌水印文档图像进行屏幕拍摄失真的模拟过程、对已嵌水印文档图像中引入高斯噪声、对已嵌水印文档图像应用高斯核来模拟离焦模糊、对已嵌水印文档图像应用直线模糊核来模拟运动模糊、对已嵌水印文档图像应用随机颜色变换来近似像素扭曲。
进一步地,对已嵌水印文档图像进行屏幕拍摄失真的模拟过程,可以通过下述方式实现:在对已嵌水印文档图像进行实际拍摄的过程中,将已嵌水印文档图像的四个角(左上角、右上角、左下角和右下角的四个位置)在预设像素范围(如±30像素)内进行随机扰动处理,然后利用透视变换将处理后的已嵌水印文档图像变换到新的位置。
其中,失真文档图像是指模拟失真处理后的已嵌水印文档图像。
其中,水印提取处理是指从失真文档图像中提取水印信息的处理过程。
其中,预测水印信息是指对失真文档图像进行水印提取处理得到的水印信息预测值。
示例性地,服务器通过待训练的水印处理模型,对已嵌水印文档图像进行模拟失真处理,得到模拟失真处理后的已嵌水印文档图像,作为失真文档图像;接着,服务器通过待训练的水印处理模型,对失真文档图像进行特征提取处理,得到失真文档图像对应的失真文档图像特征,并根据失真文档图像对应的失真文档图像特征,得到失真文档图像对应的水印信息,作为预测水印信息。
步骤S104,根据样本文档图像和已嵌水印文档图像之间的差异,以及样本水印信息和预测水印信息之间的差异,对待训练的水印处理模型进行迭代训练,得到训练完成的水印处理模型。
示例性地,服务器根据样本文档图像和已嵌水印文档图像之间的差异,得到第一损失值,并根据样本水印信息和预测水印信息之间的差异,得到第二损失值;接着,服务器根据第一损失值和第二损失值,对待训练的水印处理模型进行迭代训练,得到训练完成的水印处理模型。
上述水印处理模型训练方法中,先获取样本文档图像和样本水印信息,再将样本文档图像和样本水印信息,输入至待训练的水印处理模型中,得到嵌入有样本水印信息的已嵌水印文档图像,然后通过待训练的水印处理模型,对已嵌水印文档图像进行模拟失真处理,得到失真文档图像,对失真文档图像进行水印提取处理,得到预测水印信息,最后根据样本文档图像和已嵌水印文档图像之间的差异,以及样本水印信息和预测水印信息之间的差异,对待训练的水印处理模型进行迭代训练,得到训练完成的水印处理模型。这样,在进行水印处理时,通过将样本文档图像和样本水印信息作为输入值输入到待训练的水印处理模型中,再将水印处理模型输出的已嵌水印文档图像和预测水印信息作为输出值,并根据输入值和输出值之间的差异,对待训练的水印处理模型进行迭代训练,得到训练完成的水印处理模型,使得水印处理模型能够更好地适应不同类型的文档图像和水印信息,有利于提高水印嵌入和提取的准确性,进而提高了水印的处理准确率。
在一个示例性的实施例中,如图2所示,上述步骤S102,将样本文档图像和样本水印信息,输入至待训练的水印处理模型中,得到已嵌水印文档图像,具体包括如下步骤:
步骤S201,将样本文档图像和样本水印信息,输入至待训练的水印处理模型中,得到样本文档图像对应的掩模图像。
步骤S202,根据待训练的水印处理模型的水印嵌入强度,对样本文档图像和掩模图像进行融合处理,得到已嵌水印文档图像。
其中,掩模图像是指经过掩模处理后的样本文档图像。
其中,水印嵌入强度是指样本水印信息嵌入样本文档图像对应的嵌入系数,比如0.6。
其中,融合处理是指将样本文档图像和掩模图像转换为已嵌水印文档图像的处理过程。
示例性地,服务器将样本文档图像和样本水印信息,输入至待训练的水印处理模型中,通过待训练的水印处理模型,对样本文档图像和样本水印信息进行特征提取处理,得到与样本文档图像和样本水印信息对应的底层特征,并根据该底层特征,得到样本文档图像对应的掩模图像;接着,服务器获取待训练的水印处理模型的水印嵌入强度,并根据待训练的水印处理模型的水印嵌入强度,对样本文档图像和掩模图像进行融合处理,得到融合处理后的文档图像,作为已嵌水印文档图像。
举例说明,服务器可以通过下述公式计算得到已嵌水印文档图像:
,式(1)
其中,是指已嵌水印文档图像,是指样本文档图像,是指掩模图像,是指水
印嵌入强度。
本实施例中,通过得到样本文档图像对应的掩模图像,有利于对样本文档图像进行过滤,以便后续水印信息的嵌入;而且,根据待训练的水印处理模型的水印嵌入强度,可以对样本文档图像和掩模图像进行融合处理,以得到具有特定水印嵌入强度的已嵌水印文档图像,便于后续可以灵活调整样本水印信息的可见性和鲁棒性。
在一个示例性的实施例中,如图4所示,上述步骤S201,将样本文档图像和样本水印信息,输入至待训练的水印处理模型中,得到样本文档图像对应的掩模图像,具体包括如下步骤:
步骤S401,通过待训练的水印处理模型,对样本文档图像和样本水印信息进行第一特征提取处理,得到与样本文档图像和样本水印信息对应的底层特征。
步骤S402,对底层特征进行多次融合处理,得到底层特征对应的目标融合特征。
步骤S403,对目标融合特征进行第二特征提取处理,得到掩模图像。
其中,第一特征提取处理是指提取样本文档图像和样本水印信息对应的底层特征的过程。
其中,底层特征是指样本文档图像和样本水印信息对应的低级特征,比如轮廓、边缘等。
其中,目标融合特征是指对底层特征进行多次融合处理得到的融合特征。
其中,第二特征提取处理是指对目标融合特征进行特征提取得到掩模图像的过程。
示例性地,服务器通过待训练的水印处理模型,对样本文档图像和样本水印信息进行第一特征提取处理,得到处理后的底层特征,作为与样本文档图像和样本水印信息对应的底层特征;接着,服务器通过待训练的水印处理模型,对底层特征进行多次融合处理,得到处理后的融合特征,作为底层特征对应的目标融合特征;然后,服务器通过待训练的水印处理模型,对目标融合特征进行第二特征提取处理,得到样本文档图像对应的掩模图像。
举例说明,参考图3,服务器通过待训练的水印处理模型,对样本文档图像和样本水印信息进行卷积处理,得到与样本文档图像和样本水印信息对应的底层特征;接着,该底层特征通过3个相同的含短路连接的卷积层,得到底层特征对应的目标融合特征;然后,该目标融合特征通过卷积层和激活层,得到样本文档图像对应的掩模图像。
本实施例中,通过第一特征提取处理、多次融合处理以及第二特征提取处理,得到样本文档图像对应的掩模图像,有利于将样本水印信息更好地融合到样本文档图像中;而且,整个过程为自动化处理,无需人工干预,避免了人工处理容易耗费大量时间,进而提高了水印的处理效率。
在一个示例性的实施例中,如图5所示,上述步骤S402,对底层特征进行多次融合处理,得到底层特征对应的目标融合特征,具体包括如下步骤:
步骤S501,对底层特征进行局部特征提取处理,得到局部特征。
步骤S502,对局部特征和底层特征进行融合处理,得到融合特征。
步骤S503,将融合特征作为新的底层特征,并跳转至对底层特征进行局部特征提取处理,得到局部特征的步骤,直到得到的融合特征满足预设条件。
步骤S504,将满足预设条件的融合特征,作为底层特征对应的目标融合特征。
其中,局部特征提取处理是指提取底层特征的局部特征对应的处理过程。
其中,局部特征是指用于表征底层特征的部分区别特征。
其中,融合特征是指对局部特征和底层特征进行融合处理得到的特征信息。
其中,预设条件是指预先设定的条件,比如预设数量,用于对得到的融合特征进行判断。在实际场景中,若得到的融合特征满足预设条件,即得到的融合特征满足预设数量,比如得到的融合特征为第3个融合特征,则将得到的融合特征作为目标融合特征;若得到的融合特征不满足预设条件,即得到的融合特征不满足预设数量,比如得到的融合特征不是第3个融合特征,则将融合特征作为新的底层特征,并跳转至对底层特征进行局部特征提取处理,得到局部特征的步骤,直到得到的融合特征满足预设条件。
示例性地,服务器通过待训练的水印处理模型,对底层特征进行局部特征提取处理,得到处理后的底层特征,作为底层特征对应的局部特征,再对局部特征和底层特征进行融合处理,得到局部特征和底层特征对应的融合特征;接着,服务器根据预设条件,对得到的融合特征进行判断;若得到的融合特征满足预设条件,则将得到的融合特征作为目标融合特征;若得到的融合特征不满足预设条件,则将融合特征作为新的底层特征,并跳转至对底层特征进行局部特征提取处理,得到局部特征的步骤,直到得到的融合特征满足预设条件;最后,服务器将满足预设条件的融合特征,作为底层特征对应的目标融合特征。
举例说明,参考图3,服务器通过待训练的水印处理模型,将底层特征输入卷积层,进行局部特征提取处理,得到处理后的底层特征,作为底层特征对应的局部特征,再对局部特征和底层特征进行融合处理,得到局部特征和底层特征对应的融合特征,重复上述操作,直到得到的融合特征为第3个融合特征,将满足预设条件的融合特征,作为底层特征对应的目标融合特征。
本实施例中,通过多次局部特征和底层特征,对两种模态的特征相互补充和增强,有利于综合利用这两种模态的特征,使得融合后的目标融合特征更加全面和丰富,从而提高目标融合特征的表达能力。
在一个示例性的实施例中,如图6所示,上述步骤S103,对失真文档图像进行水印提取处理,得到预测水印信息,具体包括如下步骤:
步骤S601,对失真文档图像进行第三特征提取处理,得到失真文档图像特征。
步骤S602,对失真文档图像特征进行特征降维处理,得到失真文档图像特征对应的降维特征。
步骤S603,对降维特征进行转换处理,得到预测水印信息。
其中,第三特征提取处理是指提取失真文档图像对应的失真文档图像特征的处理过程。
其中,失真文档图像特征是指失真文档图像对应的特征信息。
其中,特征降维处理是指对失真文档图像特征进行降维处理的过程。
其中,失真文档图像特征对应的降维特征是指对失真文档图像特征进行特征降维处理得到的特征信息。
其中,转换处理是指将降维特征转换为预测水印信息对应的过程。
示例性地,服务器通过待训练的水印处理模型,对失真文档图像进行第三特征提取处理,得到处理后的文档图像特征,作为失真文档图像对应的失真文档图像特征;接着,服务器通过待训练的水印处理模型,对失真文档图像特征进行特征降维处理,得到降维处理后的特征信息,作为失真文档图像特征对应的降维特征;然后,服务器对降维特征进行转换处理,得到处理后的水印信息,作为预测水印信息。
举例说明,参考图7,服务器通过待训练的水印处理模型,对失真文档图像进行7次卷积处理,得失真文档图像对应的失真文档图像特征;接着,服务器将失真文档图像特征通过全连接层进行分类处理,得到失真文档图像特征对应的降维特征,即样本水印信息中各子样本水印信息对应的预测概率,比如子样本水印信息为1或0的的预测概率;然后,服务器将降维特征通过激活层,得到预测水印信息,比如根据子样本水印信息对应的预测值为1或0的的预测概率,将预测概率大于50%对应的预测值作为子样本水印信息对应的实际提取值,并将子样本水印信息对应的实际提取值进行组合,得到预测水印信息。
本实施例中,通过对失真文档图像进行第三特征提取和特征降维处理,有利于减少失真文档图像中的冗余信息,提取出更具有代表性和区分性的特征;而且,通过激活层得到预测水印信息,便于后续根据样本水印信息和预测水印信息之间的差异,确定对应的损失值,对水印处理模型的训练过程提供数据基础。
在一个示例性的实施例中,如图8所示,上述步骤S104,根据样本文档图像和已嵌水印文档图像之间的差异,以及样本水印信息和预测水印信息之间的差异,对待训练的水印处理模型进行迭代训练,得到训练完成的水印处理模型,具体包括如下步骤:
步骤S801,根据样本文档图像和已嵌水印文档图像之间的差异,得到第一损失值,以及根据样本水印信息和预测水印信息之间的差异,得到第二损失值。
步骤S802,将第一损失值和第二损失值进行融合处理,得到目标损失值。
步骤S803,根据目标损失值,对待训练的水印处理模型进行迭代训练,直到满足预设结束条件。
步骤S804,将满足预设结束条件的水印处理模型,作为训练完成的水印处理模型。
其中,第一损失值是指样本文档图像和已嵌水印文档图像之间的图像损失值。
其中,第二损失值是指样本水印信息和预测水印信息之间的水印损失值。
其中,目标损失值是指将第一损失值和第二损失值进行融合处理得到的损失值。
其中,预设结束条件是指预先设定的结束条件,比如预设损失值,用于对目标损失值进行判断。在实际场景中,若目标损失值满足预设结束条件,即目标损失值小于预设损失值,则说明水印处理模型满足预设结束条件;若目标损失值还未满足预设结束条件,即目标损失值大于或等于预设损失值,则说明水印处理模型还未满足预设结束条件。
示例性地,服务器根据样本文档图像和已嵌水印文档图像之间的差异,得到第一损失值,以及根据样本水印信息和预测水印信息之间的差异,得到第二损失值;接着,服务器将第一损失值和第二损失值进行融合处理,得到目标损失值;例如服务器将第一损失值和第二损失值进行加权求和处理,得到目标损失值;然后,服务器根据目标损失值,调整水印处理模型的模型参数,并对模型参数调整后的水印处理模型进行再次训练,直到水印处理模型满足预设结束条件;例如,水印处理模型得到的目标损失值小于预设损失值,则停止训练,并将该预设结束条件的水印处理模型,作为训练完成的水印处理模型。
举例说明,服务器可以通过下述公式计算得到第一损失值:
,式(2)
其中,是指第一损失值,是指样本文档图像,是指已嵌水印文档图像,𝛿是值
损失参数。
举例说明,服务器可以通过下述公式计算得到第二损失值:
,式(3)
其中,是指第二损失值,是指样本水印信息的数目,是指样本水印信息,
是指预测水印信息。
举例说明,服务器可以通过下述公式计算得到目标损失值:
,式(4)
其中,是指目标损失值,是第一损失值和第二损失值权重系数,是指第
一损失值,是指第二损失值。在实际场景中,和初始值均为0,在前10000次迭代时
线性增加到1.5和2.0,为了加快模型训练的收敛,学习速率设置为0.0001,并使用优化器对
模型参数进行优化。
本实施例中,通过两种不同的损失值得到目标损失值,从而可以综合考虑样本文档图像和样本水印信息之间的差异,有利于更准确地反映水印处理模型的性能;而且,根据目标损失值对待训练的水印处理模型进行迭代训练,使得水印处理模型的参数可以不断进行优化,有利于提高水印处理模型性能。
在一个示例性的实施例中,在根据样本文档图像和已嵌水印文档图像之间的差异,以及样本水印信息和预测水印信息之间的差异,对待训练的水印处理模型进行迭代训练,得到训练完成的水印处理模型之后,还包括:将待测试文档图像和待测试水印信息,输入至训练完成的水印处理模型,得到待测试水印信息对应的预测水印信息;根据待测试水印信息和待测试水印信息对应的预测水印信息,确定训练完成的水印处理模型的预测准确率;在预测准确率符合预设准确率的情况下,将训练完成的水印处理模型,作为目标水印处理模型。
其中,待测试文档图像是指测试集中的文档图像。
其中,待测试水印信息是指测试集中的水印信息。
其中,待测试水印信息对应的预测水印信息是指待测试水印信息对应的水印信息预测值。
其中,预测准确率用于表征水印处理模型的预测性能。在实际场景中,预测准确率是指测试集中提取水印信息完全正确的样本数与总测试集中的样本数之间的比值。
其中,预设准确率是指预先设定的准确率,比如90%,用于对预测准确率进行判断。在实际场景中,若预测准确率符合预设准确率,即预测准确率大于预设准确率,比如预测准确率大于90%,则将训练完成的水印处理模型,作为目标水印处理模型;若预测准确率不符合预设准确率,即预测准确率小于或等于预设准确率,比如预测准确率小于或等于90%,则该水印处理模型未符合预设准确率。
其中,目标水印处理模型是指预测准确率符合预设准确率的水印处理模型。
示例性地,服务器从测试集中获取待测试文档图像和待测试水印信息,并将待测试文档图像和待测试水印信息,输入至训练完成的水印处理模型,通过训练完成的水印处理模型,得到待测试水印信息对应的预测水印信息;接着,服务器根据待测试水印信息和待测试水印信息对应的预测水印信息,获取待测试水印信息与预测水印信息之间的匹配度,根据该匹配度,确定训练完成的水印处理模型的预测准确率,并对该预测准确率进行判断;在预测准确率符合预设准确率的情况下,将训练完成的水印处理模型,作为目标水印处理模型。
本实施例中,通过测试集中的待测试文档图像和待测试水印信息,得到确定训练完成的水印处理模型的预测准确率,从而可以保证该模型在实际应用中的准确性和可靠性,为并水印处理模型的优化和改进提供指导,进而提高了水印处理模型的预测准确率。
在一个示例性的实施例中,如图9所示,提供了一种水印处理方法,以该方法应用于服务器为例进行说明,具体包括以下步骤:
步骤S901,获取待处理文档图像和待处理水印信息;待处理文档图像为与金融业务关联的文档图像。
步骤S902,将待处理文档图像和待处理水印信息,输入至训练完成的水印处理模型中,得到目标已嵌水印文档图像;目标已嵌水印文档图像中嵌入有待处理水印信息;训练完成的水印处理模型通过水印处理模型训练方法训练得到。
步骤S903,通过训练完成的水印处理模型,对目标已嵌水印文档图像进行模拟失真处理,得到目标失真文档图像,对目标失真文档图像进行水印提取处理,得到目标水印信息。
其中,待处理文档图像是指需要进行处理的文档图像。
其中,待处理水印信息是指需要进行处理的水印信息。
其中,目标已嵌水印文档图像是指嵌入有待处理水印信息的文档图像。
其中,目标失真文档图像是指模拟失真处理后的目标已嵌水印文档图像。
其中,目标水印信息是指对目标失真文档图像进行水印提取处理后得到的水印信息。
示例性地,服务器响应于水印处理指令,从金融数据库中获取待处理文档图像和待处理水印信息;接着,服务器将待处理文档图像和待处理水印信息,输入至训练完成的水印处理模型中,通过训练完成的水印处理模型,得到嵌入有待处理水印信息的目标已嵌水印文档图像,然后,服务器通过训练完成的水印处理模型,对目标已嵌水印文档图像进行模拟失真处理,得到模拟失真处理后的文档图像,作为目标失真文档图像,对目标失真文档图像进行水印提取处理,得到目标失真文档图像对应的目标水印信息。
进一步地,服务器可以直接获取目标失真文档图像,并对目标失真文档图像进行水印提取处理,得到目标失真文档图像对应的目标水印信息。
本实施例中,通过训练完成的水印处理模型,实现了对与金融业务关联的文档图像的水印处理,为金融业务的安全性提供了保障;而且,整个处理过程可以自动进行,无需人工干预,避免了人工处理容易出错导致水印的处理准确率较低的缺陷,进而提高了水印的处理准确率。
在一个示例性的实施例中,如图10所示,提供了另一种任务处理模型训练方法,以该方法应用于服务器为例进行说明,包括以下步骤:
步骤S1001,获取样本文档图像和样本水印信息;样本文档图像为与金融业务关联的文档图像。
步骤S1002,将样本文档图像和样本水印信息,输入至待训练的水印处理模型中,通过待训练的水印处理模型,对样本文档图像和样本水印信息进行第一特征提取处理,得到与样本文档图像和样本水印信息对应的底层特征。
步骤S1003,通过待训练的水印处理模型,对底层特征进行局部特征提取处理,得到局部特征;对局部特征和底层特征进行融合处理,得到融合特征;将融合特征作为新的底层特征,并跳转至对底层特征进行局部特征提取处理,得到局部特征的步骤,直到得到的融合特征满足预设条件;将满足预设条件的融合特征,作为底层特征对应的目标融合特征。
步骤S1004,通过待训练的水印处理模型,对目标融合特征进行第二特征提取处理,得到掩模图像。
步骤S1005,通过待训练的水印处理模型,根据待训练的水印处理模型的水印嵌入强度,对样本文档图像和掩模图像进行融合处理,得到已嵌水印文档图像。
步骤S1006,通过待训练的水印处理模型,对已嵌水印文档图像进行模拟失真处理,得到失真文档图像。
步骤S1007,通过待训练的水印处理模型,对失真文档图像进行第三特征提取处理,得到失真文档图像特征;对失真文档图像特征进行特征降维处理,得到失真文档图像特征对应的降维特征;对降维特征进行转换处理,得到预测水印信息。
步骤S1008,根据样本文档图像和已嵌水印文档图像之间的差异,得到第一损失值,以及根据样本水印信息和预测水印信息之间的差异,得到第二损失值;将第一损失值和第二损失值进行融合处理,得到目标损失值;根据目标损失值,对待训练的水印处理模型进行迭代训练,直到满足预设结束条件;将满足预设结束条件的水印处理模型,作为训练完成的水印处理模型。
上述水印处理模型训练方法中,在进行水印处理时,通过将样本文档图像和样本水印信息作为输入值输入到待训练的水印处理模型中,再将水印处理模型输出的已嵌水印文档图像和预测水印信息作为输出值,并根据输入值和输出值之间的差异,对待训练的水印处理模型进行迭代训练,得到训练完成的水印处理模型,使得水印处理模型能够更好地适应不同类型的文档图像和水印信息,有利于提高水印嵌入和提取的准确性,进而提高了水印的处理准确率。
在一个示例性的实施例中,为了更清晰阐明本申请实施例提供的水印处理模型训练方法,以下以一个具体的实施例对该水印处理模型训练方法进行具体说明。在一个实施例中,本申请还提供了一种端到端的可抗屏摄文档图像水印方法,在进行水印处理时,先获取样本文档图像和样本水印信息,再将样本文档图像和样本水印信息,输入至待训练的水印处理模型中,得到嵌入有样本水印信息的已嵌水印文档图像,然后通过待训练的水印处理模型,对已嵌水印文档图像进行模拟失真处理,得到失真文档图像,对失真文档图像进行水印提取处理,得到预测水印信息,最后根据样本文档图像和已嵌水印文档图像之间的差异,以及样本水印信息和预测水印信息之间的差异,对待训练的水印处理模型进行迭代训练,得到训练完成的水印处理模型。具体包括如下内容:
1、构建训练集和测试集。
将文档样本划分为训练集和测试集。从训练集中随机选择100,000个文档图像作为训练集,从测试集中随机选择100个文档图像作为测试集。其中,图像的大小为128*128像素,水印的嵌入容量为50比特。
2、将训练集中的文档图像与随机生成的水印信息一起输入至编码器中,生成已嵌入水印的文档图像。
其中,编码器具体流程如下:
(1)为保证编码器生成的已嵌入水印文档图像大小与输入的文档图像大小相同,该网络被设计为一个全卷积神经网络。首先将原始文档图像与随机生成的水印信息一起被输入进两个卷积层(卷积核大小为9*9、3*3)和一个激活函数,以提取底层特征。
(2)利用3个相同的含短路连接的模块学习多通道特征。模块由一个卷积层(卷积核大小为3*3),一个批量归一化层和一个激活层构成。同时,本发明在每个模块之后放置了短路连接,这些连接将每个相邻模块的激活层输出进行拼接,这样做增强了特征重用。
(3)为了提取全局的特征,在3个相同的模块串联之后又接着一个卷积层(卷积核大小为3*3)和一个激活层,之后,本发明采用一个卷积层(卷积核大小为1*1)进行特征降维和跨通道特征整合,一个激活层和一个卷积层(卷积核大小为1*9*9)紧随其后,并采用激活层进行规范化生成掩图。
(4)最后将原始文档图像添加到最后输出的掩图中,得到最终嵌入水印后的文档图像。
3、将步骤2中生成的嵌入水印后的文档图像输入至失真层中进行屏幕拍摄失真的模拟。
本发明在失真层中应用高斯噪声模拟电子元件在照片成像过程中引入的噪声;应用高斯核模拟离焦模糊;应用直线模糊核模拟运动模糊;应用随机颜色变换近似像素扭曲。
4、之后将攻击后的图像输入至解码器中,进行水印提取。解码器由7个卷积层和一个全连接层组成,将二维图像提取特征后降维转换为一维信息。最后,通过激活层得到水印位是1还是0的概率,取概率大于50%的为实际提取值,从而达到水印提取的目的。
5、对模型进行端到端的训练,训练方法为梯度下降法。损失函数包括图像损失和水印损失。
6、从测试集中随机抽取文档图像,输入至训练好的端到端的水印模型中,对编码器输出的图像进行手机拍摄攻击,再将拍摄后的图像输入至训练好的解码器中,进行水印提取,计算水印信息提取的准确率。
上述实施例,在进行水印处理时,通过将样本文档图像和样本水印信息作为输入值输入到待训练的水印处理模型中,再将水印处理模型输出的已嵌水印文档图像和预测水印信息作为输出值,并根据输入值和输出值之间的差异,对待训练的水印处理模型进行迭代训练,得到训练完成的水印处理模型,使得水印处理模型能够更好地适应不同类型的文档图像和水印信息,有利于提高水印嵌入和提取的准确性,进而提高了水印的处理准确率。同时,针对现有文档图像水印嵌入后不可感知性和鲁棒性无法兼顾的问题,提出一种基于自编码器的网络模型,由编码器、失真层、解码器构成,有利于提升水印提取的准确率以及不可察觉性。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的水印处理模型训练方法的水印处理模型训练装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个水印处理模型训练装置实施例中的具体限定可以参见上文中对于水印处理模型训练方法的限定,在此不再赘述。
在一个示例性的实施例中,如图11所示,提供了一种水印处理模型训练装置,包括:样本获取模块1101、图像生成模块1102、水印预测模块1103和模型训练模块1104,其中:
样本获取模块1101,用于获取样本文档图像和样本水印信息;样本文档图像为与金融业务关联的文档图像;
图像生成模块1102,用于将样本文档图像和样本水印信息,输入至待训练的水印处理模型中,得到已嵌水印文档图像;已嵌水印文档图像中嵌入有样本水印信息;
水印预测模块1103,用于通过待训练的水印处理模型,对已嵌水印文档图像进行模拟失真处理,得到失真文档图像,对失真文档图像进行水印提取处理,得到预测水印信息;
模型训练模块1104,用于根据样本文档图像和已嵌水印文档图像之间的差异,以及样本水印信息和预测水印信息之间的差异,对待训练的水印处理模型进行迭代训练,得到训练完成的水印处理模型。
在一个示例性的实施例中,图像生成模块1102,还用于将样本文档图像和样本水印信息,输入至待训练的水印处理模型中,得到样本文档图像对应的掩模图像;根据待训练的水印处理模型的水印嵌入强度,对样本文档图像和掩模图像进行融合处理,得到已嵌水印文档图像。
在一个示例性的实施例中,图像生成模块1102,还用于通过待训练的水印处理模型,对样本文档图像和样本水印信息进行第一特征提取处理,得到与样本文档图像和样本水印信息对应的底层特征;对底层特征进行多次融合处理,得到底层特征对应的目标融合特征;对目标融合特征进行第二特征提取处理,得到掩模图像。
在一个示例性的实施例中,图像生成模块1102,还用于对底层特征进行局部特征提取处理,得到局部特征;对局部特征和底层特征进行融合处理,得到融合特征;将融合特征作为新的底层特征,并跳转至对底层特征进行局部特征提取处理,得到局部特征的步骤,直到得到的融合特征满足预设条件;将满足预设条件的融合特征,作为底层特征对应的目标融合特征。
在一个示例性的实施例中,水印预测模块1103,还用于对失真文档图像进行第三特征提取处理,得到失真文档图像特征;对失真文档图像特征进行特征降维处理,得到失真文档图像特征对应的降维特征;对降维特征进行转换处理,得到预测水印信息。
在一个示例性的实施例中,模型训练模块1104,还用于根据样本文档图像和已嵌水印文档图像之间的差异,得到第一损失值,以及根据样本水印信息和预测水印信息之间的差异,得到第二损失值;将第一损失值和第二损失值进行融合处理,得到目标损失值;根据目标损失值,对待训练的水印处理模型进行迭代训练,直到满足预设结束条件;将满足预设结束条件的水印处理模型,作为训练完成的水印处理模型。
在一个示例性的实施例中,该水印处理模型训练装置还包括模型测试模块,用于将待测试文档图像和待测试水印信息,输入至训练完成的水印处理模型,得到待测试水印信息对应的预测水印信息;根据待测试水印信息和待测试水印信息对应的预测水印信息,确定训练完成的水印处理模型的预测准确率;在预测准确率符合预设准确率的情况下,将训练完成的水印处理模型,作为目标水印处理模型。
上述水印处理模型训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的水印处理方法的水印处理装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个水印处理装置实施例中的具体限定可以参见上文中对于水印处理方法的限定,在此不再赘述。
在一个示例性的实施例中,如图12所示,提供了一种水印处理装置,包括:数据获取模块1201、目标生成模块1202和水印获取模块1203,其中:
数据获取模块1201,用于获取待处理文档图像和待处理水印信息;待处理文档图像为与金融业务关联的文档图像;
目标生成模块1202,用于将待处理文档图像和待处理水印信息,输入至训练完成的水印处理模型中,得到目标已嵌水印文档图像;目标已嵌水印文档图像中嵌入有待处理水印信息;训练完成的水印处理模型通过水印处理模型训练方法训练得到;
水印获取模块1203,用于通过训练完成的水印处理模型,对目标已嵌水印文档图像进行模拟失真处理,得到目标失真文档图像,对目标失真文档图像进行水印提取处理,得到目标水印信息。
上述水印处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个示例性的实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图13所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储样本文档图像和样本水印信息等数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种水印处理模型训练方法。
本领域技术人员可以理解,图13中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个示例性的实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个示例性的实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个示例性的实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (13)
1.一种水印处理模型训练方法,其特征在于,所述方法包括:
获取样本文档图像和样本水印信息;所述样本文档图像为与金融业务关联的文档图像;
将所述样本文档图像和所述样本水印信息,输入至待训练的水印处理模型中,得到已嵌水印文档图像;所述已嵌水印文档图像中嵌入有所述样本水印信息;
通过所述待训练的水印处理模型,对所述已嵌水印文档图像进行模拟失真处理,得到失真文档图像,对所述失真文档图像进行水印提取处理,得到预测水印信息;
根据所述样本文档图像和所述已嵌水印文档图像之间的差异,以及所述样本水印信息和所述预测水印信息之间的差异,对所述待训练的水印处理模型进行迭代训练,得到训练完成的水印处理模型。
2.根据权利要求1所述的方法,其特征在于,所述将所述样本文档图像和所述样本水印信息,输入至待训练的水印处理模型中,得到已嵌水印文档图像,包括:
将所述样本文档图像和所述样本水印信息,输入至待训练的水印处理模型中,得到所述样本文档图像对应的掩模图像;
根据所述待训练的水印处理模型的水印嵌入强度,对所述样本文档图像和所述掩模图像进行融合处理,得到已嵌水印文档图像。
3.根据权利要求2所述的方法,其特征在于,所述将所述样本文档图像和所述样本水印信息,输入至待训练的水印处理模型中,得到所述样本文档图像对应的掩模图像,包括:
通过待训练的水印处理模型,对所述样本文档图像和所述样本水印信息进行第一特征提取处理,得到与所述样本文档图像和所述样本水印信息对应的底层特征;
对所述底层特征进行多次融合处理,得到所述底层特征对应的目标融合特征;
对所述目标融合特征进行第二特征提取处理,得到所述掩模图像。
4.根据权利要求3所述的方法,其特征在于,所述对所述底层特征进行多次融合处理,得到所述底层特征对应的目标融合特征,包括:
对所述底层特征进行局部特征提取处理,得到局部特征;
对所述局部特征和所述底层特征进行融合处理,得到融合特征;
将所述融合特征作为新的底层特征,并跳转至所述对所述底层特征进行局部特征提取处理,得到局部特征的步骤,直到得到的融合特征满足预设条件;
将满足所述预设条件的融合特征,作为所述底层特征对应的目标融合特征。
5.根据权利要求1所述的方法,其特征在于,所述对所述失真文档图像进行水印提取处理,得到预测水印信息,包括:
对所述失真文档图像进行第三特征提取处理,得到失真文档图像特征;
对所述失真文档图像特征进行特征降维处理,得到所述失真文档图像特征对应的降维特征;
对所述降维特征进行转换处理,得到预测水印信息。
6.根据权利要求1所述的方法,其特征在于,所述根据所述样本文档图像和所述已嵌水印文档图像之间的差异,以及所述样本水印信息和所述预测水印信息之间的差异,对所述待训练的水印处理模型进行迭代训练,得到训练完成的水印处理模型,包括:
根据所述样本文档图像和所述已嵌水印文档图像之间的差异,得到第一损失值,以及根据所述样本水印信息和所述预测水印信息之间的差异,得到第二损失值;
将所述第一损失值和所述第二损失值进行融合处理,得到目标损失值;
根据所述目标损失值,对所述待训练的水印处理模型进行迭代训练,直到满足预设结束条件;
将满足所述预设结束条件的水印处理模型,作为训练完成的水印处理模型。
7.根据权利要求1至6任一项所述的方法,其特征在于,在根据所述样本文档图像和所述已嵌水印文档图像之间的差异,以及所述样本水印信息和所述预测水印信息之间的差异,对所述待训练的水印处理模型进行迭代训练,得到训练完成的水印处理模型之后,还包括:
将待测试文档图像和待测试水印信息,输入至所述训练完成的水印处理模型,得到所述待测试水印信息对应的预测水印信息;
根据所述待测试水印信息和所述待测试水印信息对应的预测水印信息,确定所述训练完成的水印处理模型的预测准确率;
在所述预测准确率符合预设准确率的情况下,将所述训练完成的水印处理模型,作为目标水印处理模型。
8.一种水印处理方法,其特征在于,所述方法包括:
获取待处理文档图像和待处理水印信息;所述待处理文档图像为与金融业务关联的文档图像;
将所述待处理文档图像和所述待处理水印信息,输入至训练完成的水印处理模型中,得到目标已嵌水印文档图像;所述目标已嵌水印文档图像中嵌入有所述待处理水印信息;所述训练完成的水印处理模型通过权利要求1至7任一项所述的方法训练得到;
通过所述训练完成的水印处理模型,对所述目标已嵌水印文档图像进行模拟失真处理,得到目标失真文档图像,对所述目标失真文档图像进行水印提取处理,得到目标水印信息。
9.一种水印处理模型训练装置,其特征在于,所述装置包括:
样本获取模块,用于获取样本文档图像和样本水印信息;所述样本文档图像为与金融业务关联的文档图像;
图像生成模块,用于将所述样本文档图像和所述样本水印信息,输入至待训练的水印处理模型中,得到已嵌水印文档图像;所述已嵌水印文档图像中嵌入有所述样本水印信息;
水印预测模块,用于通过所述待训练的水印处理模型,对所述已嵌水印文档图像进行模拟失真处理,得到失真文档图像,对所述失真文档图像进行水印提取处理,得到预测水印信息;
模型训练模块,用于根据所述样本文档图像和所述已嵌水印文档图像之间的差异,以及所述样本水印信息和所述预测水印信息之间的差异,对所述待训练的水印处理模型进行迭代训练,得到训练完成的水印处理模型。
10.一种水印处理装置,其特征在于,所述装置包括:
数据获取模块,用于获取待处理文档图像和待处理水印信息;所述待处理文档图像为与金融业务关联的文档图像;
目标生成模块,用于将所述待处理文档图像和所述待处理水印信息,输入至训练完成的水印处理模型中,得到目标已嵌水印文档图像;所述目标已嵌水印文档图像中嵌入有所述待处理水印信息;所述训练完成的水印处理模型通过权利要求1至7任一项所述的方法训练得到;
水印获取模块,用于通过所述训练完成的水印处理模型,对所述目标已嵌水印文档图像进行模拟失真处理,得到目标失真文档图像,对所述目标失真文档图像进行水印提取处理,得到目标水印信息。
11.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述的方法的步骤。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。
13.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410120000.9A CN117934254A (zh) | 2024-01-29 | 2024-01-29 | 水印处理模型训练方法、水印处理方法、装置和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410120000.9A CN117934254A (zh) | 2024-01-29 | 2024-01-29 | 水印处理模型训练方法、水印处理方法、装置和设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117934254A true CN117934254A (zh) | 2024-04-26 |
Family
ID=90768313
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410120000.9A Pending CN117934254A (zh) | 2024-01-29 | 2024-01-29 | 水印处理模型训练方法、水印处理方法、装置和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117934254A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118135594A (zh) * | 2024-05-10 | 2024-06-04 | 深圳前海量子云码科技有限公司 | 一种复印产品的检测方法、装置、设备及介质 |
-
2024
- 2024-01-29 CN CN202410120000.9A patent/CN117934254A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118135594A (zh) * | 2024-05-10 | 2024-06-04 | 深圳前海量子云码科技有限公司 | 一种复印产品的检测方法、装置、设备及介质 |
CN118135594B (zh) * | 2024-05-10 | 2024-07-26 | 深圳前海量子云码科技有限公司 | 一种复印产品的检测方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113673530B (zh) | 遥感图像语义分割方法、装置、计算机设备和存储介质 | |
CN111476719A (zh) | 图像处理方法、装置、计算机设备及存储介质 | |
CN117934254A (zh) | 水印处理模型训练方法、水印处理方法、装置和设备 | |
CN114549913A (zh) | 一种语义分割方法、装置、计算机设备和存储介质 | |
Dengpan et al. | Faster and transferable deep learning steganalysis on GPU | |
Beijing et al. | A Quaternion Two‐Stream R‐CNN Network for Pixel‐Level Color Image Splicing Localization | |
CN116071279A (zh) | 图像处理方法、装置、计算机设备和存储介质 | |
Chen et al. | Image steganalysis with multi-scale residual network | |
Hu et al. | Fast source camera identification using matching signs between query and reference fingerprints | |
Darwish et al. | Improved color image watermarking using logistic maps and quaternion Legendre-Fourier moments | |
Fang et al. | Learning explicit smoothing kernels for joint image filtering | |
Lai et al. | Generative focused feedback residual networks for image steganalysis and hidden information reconstruction | |
CN116977336A (zh) | 摄像头缺陷检测方法、装置、计算机设备及存储介质 | |
CN115797291B (zh) | 回路端子的识别方法、装置、计算机设备和存储介质 | |
Fan et al. | SNENet: An adaptive stego noise extraction network using parallel dilated convolution for JPEG image steganalysis | |
CN115810152A (zh) | 基于图卷积的遥感图像变化检测方法、装置和计算机设备 | |
CN115496654A (zh) | 基于自注意力机制的图像超分辨率重建方法、设备及介质 | |
Alherbawi et al. | JPEG image classification in digital forensic via DCT coefficient analysis | |
CN115393756A (zh) | 一种基于视觉图像的水印识别方法、装置、设备及介质 | |
CN115239590A (zh) | 样本图像的生成方法、装置、设备、介质及程序产品 | |
CN112465092B (zh) | 一种二维码样本的生成方法、装置、服务器和存储介质 | |
Jia et al. | Learning rich information for quad bayer remosaicing and denoising | |
Zhang et al. | Image super‐resolution with parallel convolution attention network | |
CN116612474B (zh) | 对象检测方法、装置、计算机设备及计算机可读存储介质 | |
CN115880249B (zh) | 基于图像的对象分割方法、装置、设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |