采用A、B两种文档进行交叉水印加密的文档
技术领域
发明属于图像识别技术领域,具体是指采用A、B两种文档进行交叉水印加密的文档。
背景技术
数字图像水印技术是指将水印信息嵌入到宿主图像中,同时保证嵌入的水印具有不可感知性,安全性和一定的鲁棒性;而传统意义的文本水印,是指将特定信息加载到原始文本中,要求文本水印具有一定的可感知性,而对原始文本具有一定程度的破坏,以增加对文本的阅读障碍,目前已经提出了很多种文本水印,但是传统的基于图像的文本水印嵌入强度无法进行自适应的调整,传统的文本水印也很容易利用Photoshop等软件进行修改。
发明内容
(一)要解决的技术问题
为解决现有技术的上述问题,本发明提供采用A、B两种文档进行交叉水印加密的文档,其目的在于解决:
(1)传统的基于图像的文本水印嵌入强度无法进行自适应的调整;
(2)传统的基于图像的文本水印容易使用制图软件轻松修改;
(3)传统方法在进行嵌入文本水印时占用内存大,消耗时间长,且不能实时对嵌入过程中的中间结果进行实时观察;
(4)传统的基于图像的文本水印难以验证图像是否被修改。
(二)技术方案
为了达到上述目的,本发明采用的一种技术方案为:采用A、B两种文档进行交叉水印加密的文档,包括原始文本A、原始文本B、图像文本P、图像文本C、文本图像预处理模块、Queena网络模型、文本A内容损失函数计算模块、文本B内容损失计算模块模型、总内容损失计算模块、反向传播优化模块和融合输出模块,原始文本A是待加入水印的文本,原始文本B是作为水印的文本,图像文本C是将原始文本B嵌入到原始文本A后得到的最终水印文本,由于PDF格式是最为普遍的交流和传播的文本格式,因此原始文本A和原始文本B均采用PDF格式。
(1)文本图像预处理模块对PDF格式的原始文本进行分页、格式转换、图像锐化和增加图像对比度,将原始的PDF文本转化为图像并进行图像增强从而进行后续处理。
(2)Queena网络模型包括抽取深度特征、通道合并、上采样、尺度压缩、尺度缩减和组合卷积;所述抽取深度特征包括特征搜集、特征采集和特征提取,搭建Queena网络模型的具体步骤如下:
1)将图像依次经过特征搜集、特征采集和特征提取分别得到尺寸为40×40×512、20×20×256和尺寸为10×10×256的特征图像,分别记为特征图像P0、特征图像P1和特征图像P2,特征图像P0、P1和P2为三种不同深度的特征图像;
2)将特征图像P2进行上采样操作,得到尺寸为20×20×256的特征图像P3,此时特征图像P3和特征图像P1具有相同的图像宽度和图像高度,将特征图像P1与特征图像P3进行通道合并操作,得到尺寸为20×20×512的特征图像P4;
3)对特征图像P4进行尺度压缩操作,得到尺寸为2×2×128的特征图像P5,对特征图像P2进行尺度缩减操作,得到尺寸为2×2×128的特征图像P6;
4)将特征图像P5和特征图像P6进行通道合并得到尺寸为2×2×256的特征图像P7;
5)对特征图像P7进行组合卷积操作得到尺寸为2×2×128的特征图像P8;
所述特征搜集包含卷积和C3特征提取两种操作,所述卷积包含一次图像卷积、一次正则化和一次函数激活;所述C3特征提取包含卷积、BottleNeck和通道合并,其中BottleNeck本质为一种残差结构。
(3)文本A内容损失函数计算模块,图像文本A与嵌入水印之后的图像本文C在内容上应尽可能保持一致,那么在图像文本A与图像文本C经过Queena网络模型后得到的特征图像也具有一致性,这种一致程度使用一个函数L contentA来表达,图像文本A内容损失值将每层特征图像的每个像素之间的差异转化为一个实数来表达。
(4)文本B内容损失计算模块模型,图像文本B与嵌入水印之后的图像本文C在内容上应尽可能保持一致,那么在图像文本B与图像文本C经过Queena网络模型后得到的特征图像也具有一致性,这种一致程度使用函数L contentB来表达,图像文本B内容损失值将每层特征图像的每个像素之间的差异转化为一个实数来表达。
(5)总内容损失计算模块,用于计算总的内容损失L all,计算公式如下:
上式中L all为总的内容损失值,m为计算L contentA时使用的特征图像的层数,n为计算L contentB时使用的特征图像的层数,α和β代表加权系数。
(6)反向传播优化模块,求出总的损失值L all相对于图像文本P的梯度,利用梯度下降算法对输入到Queena网络模型的图像文本P进行迭代更新得到最终的图像文本P_out。
(7)融合输出模块,对图像文本A进行归一化操作得到图像文本P_norm,将图像文本P_norm与图像文本P_out所对应的矩阵加权求和,得到最终输出结果图像文本C。
具体使用步骤如下:
S1、将待处理的原始文本A和原始文本B分别经过文本图像预处理模块进行处理,分别得到图像文本A和图像文本B,将文本转换为一张一张的文本图像,将经过文本图像预处理模块处理后的图像文本A加入高斯噪声得到图像文本P;
S2、将图像文本A、图像文本P和图像文本B输入到Queena网络模型中,反向传播优化模块将总内容损失计算模块计算的总的容损失L all对图像文本P进行迭代更新,最终得到图像文本P_out;
S3、对图像文本A进行归一化处理得到图像文本P_norm;
S4、将图像文本P_out和图像文本P_norm加权求和得到最终图像文本C;
S5、在进行水印修改判断时需将待检测的图像文本输入到Queena网络模型,并计算出总的损失值L all,若L all为大于设定阈值T,则表明图像文本已被修改,若Lall小于设定阈值T,则表明文本图像未被修改。
(三)有益效果
(1)通过调整Queena网络模型中的超参数(权重系数)α和β,以及通过调整融合输出模块的加权系数µ和ξ,可以自行调整水印嵌入强度。
(2)通过Queena网络模型对文本图像的调整是通过卷积的反向传播实现的,所以水印的加入是全局的,使用Photoshop等制图软件很难将水印去除。
(3)Queena网络模型可方便的部署在CPU和GPU设备上,同时方便的利用Tensorflow的API接口使算法运行在多台设备上,采用分布式计算快速得到水印文本。
(4)由于采用迭代更新的方式,嵌入过程中的中间结果(每次迭代的结果)可以进行实时观察,当满足预期要求时即可终止运算。
(5)在验证图像是否被修改时,只需再次计算出总的损失值L all是否大于给定阈值T,即可快速判断出图像是否被修改;若L all为大于设定阈值T,则表明文本图像已被修改,若Lall小于等于设定阈值T,则表明文本图像未被修改。
附图说明
图1为本发明提出的采用A、B两种文档进行交叉水印加密的文档的计算流程图;
图2为本发明提出的Queena网络模型的结构示意图;
图3为利用Queena网络模型对图像文本P进行迭代更新的示意图;
图4为图2中特征搜集的流程图;
图5为图2中特征采集的流程图;
图6为图2中特征提取的流程图;
图7为图2中C3特征提取的流程图;
图8为特征采集中的SPPF的流程图;
图9为图2中上采样的流程图;
图10为图2中尺度压缩的流程图;
图11为图2中尺度缩减的流程图;
图12为图2中组合卷积的流程图。
其中,1、原始文本A,2、原始文本B,3、文本图像预处理模块,4、图像文本A,5、图像文本B,6、图像文本P,7、Queena网络模型,8、图像文本P_norm,9、图像文本P_out,10、图像文本C,11、抽取深度特征,12、通道合并,13、上采样,14、尺度压缩,15、尺度缩减,16、组合卷积,17、特征搜集,18、特征采集,19、特征提取,20、C3特征提取,21、SPPF。
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
具体实施方式
本发明,采用A、B两种文档进行交叉水印加密的文档,包括原始文本A、原始文本B、图像文本P、图像文本C、文本图像预处理模块、Queena网络模型、文本A内容损失函数计算模块、文本B内容损失计算模块模型、总内容损失计算模块、反向传播优化模块和融合输出模块,原始文本A是待加入水印的文本,原始文本B是作为水印的文本,图像文本C是将原始文本B嵌入到原始文本A后得到的最终水印文本,由于PDF格式是最为普遍的交流和传播的文本格式,因此原始文本A和原始文本B均采用PDF格式。
(1)文本图像预处理模块对PDF格式的原始文本进行分页、格式转换、图像锐化和增加图像对比度,将原始文本转化为图像并进行图像增强从而进行后续处理。
(2)Queena网络模型包括抽取深度特征、通道合并、上采样、尺度压缩、尺度缩减和组合卷积;所述抽取深度特征包括特征搜集、特征采集和特征提取,搭建Queena网络模型的具体步骤如下:
1)将图像依次经过特征搜集、特征采集和特征提取分别得到尺寸为40×40×512、20×20×256和尺寸为10×10×256的特征图像,分别记为特征图像P0、特征图像P1和特征图像P2,特征图像P0、P1和P2为三种不同深度的特征图像;
2)将特征图像P2进行上采样操作,得到尺寸为20×20×256的特征图像P3,此时特征图像P3和特征图像P1具有相同的图像宽度和图像高度,将特征图像P1与特征图像P3进行通道合并操作,得到尺寸为20×20×512的特征图像P4;
3)对特征图像P4进行尺度压缩操作,得到尺寸为2×2×128的特征图像P5,对特征图像P2进行尺度缩减操作,得到尺寸为2×2×128的特征图像P6;
4)将特征图像P5和特征图像P6进行通道合并得到尺寸为2×2×256的特征图像P7;
5)对特征图像P7进行组合卷积操作得到尺寸为2×2×128的特征图像P8;
所述特征搜集包含卷积和C3特征提取两种操作,所述卷积包含一次图像卷积、一次正则化和一次函数激活,以卷积核大小为5×5为例说明深度图像的卷积计算公式:
上式中,卷积核的通道数与原图像的通道数相等,Q(x,y)代表卷积后新图像在坐标x和y处的像素值,P(x,y,z)代表z通道处原图像在坐标(x,y)处的值,K(x,y,z)代表在z通道处卷积核在坐标(x,y)处的值,n代表原图像的总通道个数;
所述C3特征提取包含卷积、BottleNeck和通道合并,其中BottleNeck本质为一种残差结构,计算公式为:
上式中,X表示输入到BottleNeck中的特征图像,Q 1(X)表示1×1卷积,对应的卷积核的通道数目与X的通道数目一致;Q 3(X)表示将3×3卷积,对应的卷积核的通道数目与输入图像X的通道数目一致,Q(X)表示BottleNeck的输出图像。
(3)文本A内容损失函数计算模块,图像文本A与嵌入水印之后的图像本文C在内容上尽可能保持一致,那么在图像文本A与图像文本C经过Queena网络模型后得到的特征图像也应具有一致性,这种一致程度使用函数L contentA表达,具体表达式为:
上式中,E l 表示图像文本A输入到Queena网络模型中的第l层特征图像,P l 表示图像文本A输入到Queena网络模型中的第l层图像,i和j分别表示像素所在的行与列,m表示共选取n层特征图像计算总的内容损失,L contentA表示图像文本A内容损失值,图像文本A内容损失值将每层特征图像的每个像素之间的差异转化为一个实数来表达。
(4)文本B内容损失计算模块模型,图像文本B与嵌入水印之后的本文C在内容上尽可能保持一致,那么在图像文本B与图像文本C经过Queena网络模型后得到的特征图像也应具有一致性,这种一致程度使用函数L contentB来表达,具体表达式为:
上式中,F l 表示图像文本B输入到Queena网络模型中的第l层特征图像,P l 表示图像文本A输入到Queena网络模型中的第l层图像,i和j分别表示像素所在的行与列,n表示共选取n层特征图像计算总的内容损失,L contentB表示图像文本B内容损失值,图像文本B内容损失值将每层特征图像的每个像素之间的差异转化为一个实数来表达。
(5)总内容损失计算模块,用于计算总的内容损失L all,计算公式如下:
上式中L all为总的内容损失值,m为计算L contentA时使用的特征图像的层数,n为计算L contentB时使用的特征图像的层数,α和β代表加权系数。
(6)反向传播优化模块,求出总的损失值L all相对于图像文本P的梯度,利用梯度下降算法对输入到Queena网络模型的图像文本P进行迭代更新得到图像文本P_out,具体计算公式为:
上式中,P i,j,z表示图像文本P对应图像的在通道为z、横坐标为x纵坐标为y处的像素值,λ为学习率。
(7)融合输出模块,对图像文本A进行归一化操作得到图像文本P_norm,将图像文本P_norm与图像文本P_out所对应的矩阵加权求和,得到最终输出结果图像文本C,具体公式如下:
上式中,µ和ξ为加权系数,C表示图像文本C。
具体使用步骤如下:
S1、将待处理的原始文本A和原始文本B分别经过文本图像预处理模块进行处理,分别得到图像文本A和图像文本B,将原始的PDF文本转换为一张一张的文本图像,将经过文本图像预处理模块处理后的图像文本A加入高斯噪声得到图像文本P;
S2、将图像文本A、图像文本P和图像文本B输入到Queena网络模型中,反向传播优化模块将总内容损失计算模块计算的总的容损失值L all对图像文本P进行迭代更新,最终得到图像文本P_out;
S3、对图像文本A进行归一化处理得到图像文本P_norm;
S4、将图像文本P_out和图像文本P_norm加权求和得到最终图像文本C;
S5、在进行水印修改判断时需将待检测的文本输入到Queena网络模型,并计算出
总的损失值L all,若L all为大于设定阈值T,则表明文本图像已被修改,若Lall小于等于设定阈值T,则表明文本图像未被修改。
以上便是本发明具体的工作流程,下次使用时重复此步骤即可。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
以上对本发明及其实施方式进行了描述,这种描述没有限制性,附图中所示的也只是本发明的实施方式之一,实际的结构并不局限于此。总而言之如果本领域的普通技术人员受其启示,在不脱离本发明创造宗旨的情况下,不经创造性的设计出与该技术方案相似的结构方式及实施例,均应属于本发明的保护范围。