CN111223034B - 基于深度学习的大容量抗打印/拍摄盲水印系统及方法 - Google Patents

基于深度学习的大容量抗打印/拍摄盲水印系统及方法 Download PDF

Info

Publication number
CN111223034B
CN111223034B CN201911115397.8A CN201911115397A CN111223034B CN 111223034 B CN111223034 B CN 111223034B CN 201911115397 A CN201911115397 A CN 201911115397A CN 111223034 B CN111223034 B CN 111223034B
Authority
CN
China
Prior art keywords
image
watermark
network
blocks
processed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911115397.8A
Other languages
English (en)
Other versions
CN111223034A (zh
Inventor
谢吉松
倪江群
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen University
Original Assignee
Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Yat Sen University filed Critical Sun Yat Sen University
Priority to CN201911115397.8A priority Critical patent/CN111223034B/zh
Publication of CN111223034A publication Critical patent/CN111223034A/zh
Application granted granted Critical
Publication of CN111223034B publication Critical patent/CN111223034B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/0021Image watermarking
    • G06T1/005Robust watermarking, e.g. average attack or collusion attack resistant
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0061Embedding of the watermark in each block of the image, e.g. segmented watermarking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0065Extraction of an embedded watermark; Reliable detection

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Processing (AREA)

Abstract

本发明提供的基于深度学习的大容量抗打印/拍摄盲水印方法,包括编码步骤和解码步骤,待处理图像由编码器进行分块将水印嵌入图像分块后,由编码器进行还原拼接,并对还原后的图像进行图像视觉保真;采用检测步骤对含水印图像进行检测;解码器则将含有水印信息的图像恢复为未保真状态;并对未保真状态的图像进行分块;解码器使用GPU并行对图像分块进行水印信息提取,得到二进制比特序列,进而解析出水印信息;一方面充分利用了每块图像的冗余空间进行水印信息的嵌入,提高整体的嵌入容量;另一方面减小图像尺寸,并行地对所有分块图像进行神经网络的计算,充分利用GPU的并行加速能力,从而提高运行速度,并且提高了水印检测的鲁棒性和实时性。

Description

基于深度学习的大容量抗打印/拍摄盲水印系统及方法
技术领域
本发明涉及多媒体内容安全技术领域,更具体的,涉及一种基于深度学习的大容量抗打印/拍摄盲水印系统及方法。
背景技术
在现有的抗打印拍摄盲水印方法采用的产品主要为StegaStamp,该方法主要包括编码器和解码器两部分,编码器和解码器均由卷积神经网络构成。但该方法可嵌入信息容量较小,在保证较好视觉质量的前提下,容量只有100比特。同时StegaStamp是对整张图进行嵌入,因此神经网络倾向于在全图搜索可嵌入水印的地方,而为了抵抗打印拍摄过程中较强的噪声和失真,会倾向于在多个区域嵌入重复信息以保证鲁棒性,导致一定程度上增加了过多的冗余信息,压缩了有效信息的空间,虽然鲁棒性得到了保证,但是容量空间却受到了压缩。
其次,水印嵌入和提取速度还有进步的空间。StegaStamp是对整张图进行水印嵌入和提取的,而图片越大,神经网络的计算就越耗时,成为影响水印嵌入和提取效率的主要因素。
最后,含水印图像检测方法不具备较好的实时性和鲁棒性。StegaStamp使用了语义分割网络的方法来对含水印图像进行检测和定位,该种方法在移动端不具备实时性,且检测效果不理想。神经网络的计算量较大,导致其实时性通常较差,即使在PC端可以利用性能较强的GPU进行加速从而达到实时性,但是往往在移动端依然无法满足实时性要求。另外,由于盲水印需要具有较强的视觉不可感知性,且经过打印和拍摄的高噪声和高失真干扰,因此含水印图像看上去与普通图像无异。语义分割是像素级分类方法,使用语义分割检测含水印图像即是对像素进行分类,这种分割方法没有使用含水印图像边缘等先验条件,因此检测效果一般,实际应用时会有较高的漏检率。
发明内容
本发明为克服现有抗打印拍摄盲水印方法存在低容量、低效率的技术缺陷,提供一种基于深度学习的大容量抗打印/拍摄盲水印系统及方法。
为解决上述技术问题,本发明的技术方案如下:
基于深度学习的大容量抗打印/拍摄盲水印系统,包括编码器和解码器,所述编码器中设置有水印嵌入网络和视觉保真网络;所述解码器中设置有水印恢复网络和水印提取网络;其中:
所述编码器将待处理图像进行分块后由水印嵌入网络把水印嵌入图像分块中;
所述编码器将嵌有水印的图像分块进行还原拼接后,由所述视觉保真网络进行图像视觉保真;
所述解码器通过所述水印恢复网络将待处理图像恢复为未保真状态并对未保真状态的图像进行分块,由所述水印提取网络进行水印提取。
其中,所述水印嵌入网络包括下采样卷积模块、上采样卷积模块和全连接层;所述下采样卷积模块用于对图像分块进行下采样卷积计算,提取图像特征,再由所述上采样卷积模块进行上采样卷积计算,得到与待处理图像原图像大小一致的一系列残差图像;最后由全连接层将一系列残差图像分别加上对应的原图像块,得到含水印信息的图像块。
其中,所述视觉保真网络为若干个Dense块组成的卷积神经网络;所述的Dense块包括四个卷积块,所述的卷积块由一个1x1卷积层和一个3x3卷积层组成;所述卷积块间通过密集连接,实现了对含水印信息的图像的图像视觉保真。
其中,所述水印恢复网络与所述视觉保真网络结构相同,通过优化训练去除待处理图像的噪声和失真,再将图像恢复为未保真状态,并对未保真状态的图像进行分块处理;所述水印提取网络将输入的图像分块进行解码,得到每一块分块对应的比特序列,再按照顺序进行拼接,得到最终的二进制比特序列,再从中提取出水印信息,完成图像水印提取。
其中,基于深度学习的大容量抗打印/拍摄盲水印系统还包括含水印图像检测模块,所述含水印图像检测模块采用Canny边缘检测算法、轮廓查找算法和多边形近似算法,完成含水印图像的检测。
基于深度学习的大容量抗打印/拍摄盲水印方法,包括编码步骤和解码步骤,所述编码步骤具体包括:
A1:将待处理图像输入编码器中,由编码器将待处理图像进行分块将水印嵌入图像分块中;
A2:编码器将嵌有水印的图像分块进行还原拼接,并对还原后的图像进行图像视觉保真,完成对待处理图像的水印嵌入;
所述解码步骤具体包括:
B1:将待处理图像输入解码器中,由解码器将待处理图像恢复为未保真状态;并对未保真状态的图像进行分块;
B2:解码器使用GPU并行对图像分块进行水印信息提取,得到二进制比特序列,进而解析出水印信息。
其中,在所述步骤A1中,所述编码器通过水印嵌入网络把水印嵌入图像分块中;所述水印嵌入网络先对图像分块进行下采样卷积计算,提取图像特征,再进行上采样卷积计算,得到与待处理图像原图像大小一致的一系列残差图像;最后将一系列残差图像分别加上对应的原图像块,得到含水印信息的图像块,完成水印的嵌入。
其中,在所述步骤A2中,所述编码器通过视觉保真网络进行图像视觉保真;所述视觉保真网络为若干个Dense块组成的卷积神经网络,Dense块包括四个卷积块,每一个卷积块由一个1x1卷积层和一个3x3卷积层组成;卷积块间通过密集连接,共同实现对含水印信息的图像的图像视觉保真。
其中,在所述步骤B1中,所述解码器通过水印恢复网络将待处理图像恢复为未保真状态并对未保真状态的图像进行分块;所述水印恢复网络与所述视觉保真网络结构相同,通过优化训练去除待处理图像的噪声和失真,再将图像恢复为未保真状态,并对未保真状态的图像进行分块处理。
其中,在所述步骤B2中,所述解码器通过水印提取网络对待处理图像进行水印提取;所述水印提取网络将输入的图像分块进行解码,得到每一块分块对应的比特序列,再按照顺序进行拼接,得到最终的二进制比特序列,再从中提取出水印信息,完成图像水印提取。
其中,基于深度学习的大容量抗打印/拍摄盲水印方法还包括含水印图像检测步骤,将检测含水印的图像由解码器进行水印提取,具体包括以下步骤:
C1:使用Canny边缘检测算法,得到图像的边缘图像;
C2:使用轮廓查找算法对图像的边缘图像进行处理,得到边缘轮廓;
C3:由边缘轮廓筛除面积较小的轮廓,使用多边形近似算法,得到近似多边形;
C4:保留近似多边形为四边形的轮廓,完成含水印图像的检测。
上述方案中,使用了基于边缘检测的检测方法,主要用到边缘检测、轮廓查找和多边形近似等算法,相比较神经网络的方法而言,该方法计算量较小,因此实时性较高,能满足移动端的实时性要求。而且,利用了多种有效的先验知识,提高了检测的准确性和鲁棒性。
与现有技术相比,本发明技术方案的有益效果是:
本发明提供的基于深度学习的大容量抗打印/拍摄盲水印系统及方法,采用了分块嵌入和分开提取的方法,在每个图像分开中嵌入水印信息时只会局限于该分块内,不致于在其他区域嵌入过多的重复信息,有利于控制嵌入信息的冗余度,保留更多的有效信息空间,充分利用了每一块图像的冗余空间进行水印信息的嵌入,提高整体的嵌入容量;同时,减小了图像的尺寸,并行地对所有分块图像进行神经网络的计算,充分利用GPU的并行加速能力,从而提高运行速度;其次,本发明引入了视觉保真网络和水印恢复网络,从而形成了一个发明的盲水印嵌入与提取框架,在编码器中,水印嵌入网络进行分块信息嵌入,视觉保真网络用于增强水印的不可感知性,改善视觉效果;而在解码器中,水印恢复网络试图去除打印拍摄过程中的噪声和失真,并且恢复分块的水印信息,水印提取网络则分块进行信息的提取;整个系统的神经网络实现了分阶段目标细化,变得更有层次,有利于神经网络的训练和收敛。
附图说明
图1为本发明所述系统结构示意图;
图2为水印嵌入网络结构示意图;
图3为视觉保真网络结构示意图;
图4为水印提取网络结构示意图;
图5为本发明所述方法流程示意图;
图6为critic损失网络结构图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
下面结合附图和实施例对本发明的技术方案做进一步的说明。
实施例1
如图1所示,基于深度学习的大容量抗打印/拍摄盲水印系统,包括编码器和解码器,所述编码器中设置有水印嵌入网络和视觉保真网络;所述解码器中设置有水印恢复网络和水印提取网络;其中:
所述编码器将待处理图像进行分块后由水印嵌入网络把水印嵌入图像分块中;
所述编码器将嵌有水印的图像分块进行还原拼接后,由所述视觉保真网络进行图像视觉保真;
所述解码器通过所述水印恢复网络将待处理图像恢复为未保真状态并对未保真状态的图像进行分块,由所述水印提取网络进行水印提取。
在具体实施过程中,针对低容量和低速度的特点,本发明主要对图像采用了分块嵌入和提取的思路,并自然形成了分阶段的范式,从而构成一种新的水印嵌入和提取系统,具体为:对输入的图像,首先进行横向和纵向的均匀切分,如分成3x3、4x4、5x5等。假设图像分为N块,每块可隐藏容量为C比特,则整张图的可嵌入信息容量为N·C比特;使用GPU并行地对分块进行水印嵌入,再按照每个分块在原图中的位置重新拼接,得到与原图大小相同的嵌入水印后的图像。由于分块是独立进行水印嵌入的,因此重新拼接后会显得不均匀,视觉效果即水印的不可感知性受影响。因此,本发明增加了第二阶段的处理,即对重新拼接后的整图进行视觉保真度增强。第二阶段输入为嵌入水印后重新拼接的整图,输出为改善了视觉效果的最终含水印图像。因此编码器分成了两个阶段,第一阶段进行水印嵌入,为水印嵌入网络,第二阶段主要是增强水印图像的视觉不可感知性,即视觉保真网络。
在具体实施过程中,解码器同样使用了分块处理的思路,由于分块嵌入的含水印图像块经过视觉保真网络的整体加强,以及打印拍摄过程中的高噪声干扰,因此解码器的第一阶段需要对图像块的水印信息进行去噪和恢复,使用水印恢复网络,然后在第二阶段则使用水印提取网络进行分块提取。
在具体实施过程中,这种分块操作一方面可以约束水印嵌入空间,充分利用每个图像分块的冗余空间,从而增大整体的嵌入容量,另一方面,通过分块减小了图片尺寸,从而可以获得GPU并行处理的加速效果,提高水印嵌入和提取的效率。另外,由于图像分块处理所导致的图像视觉效果不佳的问题,引入了视觉保真网络和水印恢复网络,使编码器和解码器形成了分阶段的范式,从而构成了一种新的水印嵌入和提取的系统,有效分解了训练目标,有助于提高神经网络训练的稳定性和熟练速度。
实施例2
更具体的,所述水印嵌入网络包括下采样卷积模块、上采样卷积模块和全连接层;所述下采样卷积模块用于对图像分块进行下采样卷积计算,提取图像特征,再由所述上采样卷积模块进行上采样卷积计算,得到与待处理图像原图像块大小一致的一系列残差图像;最后由全连接层将一系列残差图像分别加上对应的原图像块,得到含水印信息的图像块。
更具体的,如图3所示,所述视觉保真网络为若干个Dense块组成的卷积神经网络;所述的Dense块包括四个卷积块,所述的卷积块由一个1x1卷积层和一个3x3卷积层组成;所述卷积块间通过密集连接,实现了对含水印信息的图像的图像视觉保真。
在具体实施过程中,假设编码器输入的图像为400x400大小的3通道RGB图像,图像分块为16块,信息序列长度为800比特,即输出也为400x400大小的3通道RGB图像,即嵌入水印后的图像。编码器分为两个阶段,第一阶段先对图像分块使用水印嵌入网络嵌入水印,第二阶段再将图像分块按照待处理图像原图中的位置进行拼接,再经过视觉保真网络,加强整体水印的不可感知性。水印嵌入网络结构如图2所示,先对图像进行下采样卷积运算,提取图像特征,然后再进行上采样卷积运算,最终得到与待测图像原图一样大小的输出残差图像,残差图像加上原图像则得到含水印图像。全连接层的数字表示神经元的个数,卷积层的数字表示通道数,stride表示卷积核的步长。
在具体实施过程中,输入图像首先被进行4x4的分块,每一分块大小为100x100,800比特的二进制信息序列也按顺序均分为16段,每一段为50比特,每一段比特序列被隐藏进对应的图像块中。图像块和比特序列是一整批并行送进该网络的,利用GPU的并行加速能力,因此嵌入效率较高。网络输出每一块图像块和每一段比特序列所对应的残差图,这些残差图分别加上对应的原图像块,即得到含水印信息的图像块,图像块的大小和数量与输入相同。
在具体实施过程中,视觉保真网络的结构如图3所示,是由3个Dense块组成的卷积神经网络,输入与输出都是400x400大小的3通道RGB图像。一个1x1卷积层和一个3x3卷积层组成的一个卷积块,四个卷积块再构成一个Dense块,Dense块的连接方式为密集连接,参考自DenseNet。卷积层的数字表达通道数,N x N表示卷积核大小,卷积块表示所包含的卷积层的通道数。第一阶段的含水印信息图像块按在原图位置重新拼接,形成与输入图像大小相同的含水印图像,由于是分块嵌入水印,因此重新拼接后会显得不均匀,影响了水印的不可感知性,因此视觉保真网络是用来加强水印的不可感知性,输出视觉效果更好的含水印图像。水印嵌入网络和视觉保真网络以及中间的分块和拼接操作,共同构成了编码器网络,实现了输入一张图像和一串比特序列,输出一张含水印图像的目标。
更具体的,所述水印恢复网络与所述视觉保真网络结构相同,通过优化训练去除待处理图像的噪声和失真,再将图像恢复为未保真状态,并对未保真状态的图像进行分块处理。
更具体的,所述水印提取网络将输入的图像分块进行解码,得到每一块分块对应的比特序列,再按照顺序进行拼接,得到最终的二进制比特序列,再从中提取出水印信息,完成图像水印提取。
在具体实施过程中,解码器输入一张400x400大小的3通道RGB图像,即含水印图像,输出为800比特的二进制信息序列,即水印信息。解码器也成为两个阶段,第一阶段先对输入图像去除噪声和失真,尽力恢复到图像块嵌入水印但未经视觉保真的状态,因此该阶段成为水印恢复网络,第二阶段为水印提取网络,对图像分块进行解码,得到每一块分块所对应的二进制比特序列,最终再拼接起来形成最终的水印信息序列。水印恢复网络与视觉保真网络的网络结构相同,也是由3个Dense块构成的卷积神经网络,输入与输出也都是400x400大小的3通道RGB图像,该图像因为经过了打印或拍摄的过程,因此引入了许多噪声和失真,如色彩失真(对比度、亮度等)、几何失真(平移、缩放等)、光照变化、半色调失真等。水印恢复网络的一个作用便是试图通过优化训练达到去除这些噪声和失真的目的。水印提取网络是用于分块提取水印信息,因此水印信息网络的另一个作用则是将图像恢复到嵌入水印但未经视觉保真的状态,从而使水印提取网络可以分块提取出对应的水印信息。
在具体实施过程中,水印提取网络的网络结构如图4所示,卷积层的数字表示通道数,stride表示卷积核的步长,全连接层的数字表示神经元个数,水印恢复网络的输出图像进行4x4的分块,然后一整批并行地送入水印提取网络进行解码,得到每一块分块对应的比特序列,按顺序拼接成最终的二进制比特序列,再从中提取出水印信息,水印恢复网络的作用是去除噪声和失真,并且将图像恢复为分块水印图像,水印提取网络则负责分块对图像进行水印提取,共同构成解码器网络。
更具体的,基于深度学习的大容量抗打印/拍摄盲水印系统还包括含水印图像检测模块,所述含水印图像检测模块采用Canny边缘检测算法、轮廓查找算法和多边形近似算法,完成含水印图像的检测。
实施例2
更具体的,在实施例1的基础上,如图5所示,基于深度学习的大容量抗打印/拍摄盲水印方法,包括编码步骤和解码步骤,所述编码步骤具体包括:
A1:将待处理图像输入编码器中,由编码器将待处理图像进行分块将水印嵌入图像分块中;
A2:编码器将嵌有水印的图像分块进行还原拼接,并对还原后的图像进行图像视觉保真,完成对待处理图像的水印嵌入;
所述解码步骤具体包括:
B1:将待处理图像输入解码器中,由解码器将待处理图像恢复为未保真状态;并对未保真状态的图像进行分块;
B2:解码器使用GPU并行对图像分块进行水印信息提取,得到二进制比特序列,进而解析出水印信息。
更具体的,在所述步骤A1中,所述编码器通过水印嵌入网络把水印嵌入图像分块中;所述水印嵌入网络先对图像分块进行下采样卷积计算,提取图像特征,再进行上采样卷积计算,得到与待处理图像原图像大小一致的一系列残差图像;最后将一系列残差图像分别加上对应的原图像块,得到含水印信息的图像块,完成水印的嵌入。
更具体的,在所述步骤A2中,所述编码器通过视觉保真网络进行图像视觉保真;所述视觉保真网络为若干个Dense块组成的卷积神经网络,Dense块包括四个卷积块,每一个卷积块由一个1x1卷积层和一个3x3卷积层组成;卷积块间通过密集连接,共同实现对含水印信息的图像的图像视觉保真。
更具体的,在所述步骤B1中,所述解码器通过水印恢复网络将待处理图像恢复为未保真状态并对未保真状态的图像进行分块;所述水印恢复网络与所述视觉保真网络结构相同,通过优化训练去除待处理图像的噪声和失真,再将图像恢复为未保真状态,并对未保真状态的图像进行分块处理。
更具体的,在所述步骤B2中,所述解码器通过水印提取网络对待处理图像进行水印提取;所述水印提取网络将输入的图像分块进行解码,得到每一块分块对应的比特序列,再按照顺序进行拼接,得到最终的二进制比特序列,再从中提取出水印信息,完成图像水印提取。
在具体实施过程中,采用了分块嵌入和分开提取的方法,在每个图像分开中嵌入水印信息时只会局限于该分块内,不致于在其他区域嵌入过多的重复信息,有利于控制嵌入信息的冗余度,保留更多的有效信息空间,充分利用了每一块图像的冗余空间进行水印信息的嵌入,提高整体的嵌入容量;同时,减小了图像的尺寸,并行地对所有分块图像进行神经网络的计算,充分利用GPU的并行加速能力,从而提高运行速度;其次,本发明引入了视觉保真网络和水印恢复网络,从而形成了一个发明的盲水印嵌入与提取框架,在编码器中,水印嵌入网络进行分块信息嵌入,视觉保真网络用于增强水印的不可感知性,改善视觉效果;而在解码器中,水印恢复网络试图去除打印拍摄过程中的噪声和失真,并且恢复分块的水印信息,水印提取网络则分块进行信息的提取;整个系统的神经网络实现了分阶段目标细化,变得更有层次,有利于神经网络的训练和收敛。
实施例3
更具体的,视觉不可知性和解码鲁棒性是本发明的两个主要特性。
在具体实施过程中,视觉不可知性是指嵌入的水印不被视觉感知,表现在含水印图像与原图像视觉上基本相似。为了使编码器网络嵌入图像的水印具有视觉不可知性,使用了L2损失、SSIM损失和critic损失作为编码器网络的优化目标。
假设R(x)是输出的残差图像,则L2损失LR
Figure BDA0002273899070000091
SSIM是指结构相似性(structural similarity index),用于衡量两幅图像相似度。假设原图像为C,含水印图像为S,则SSIM损失LS
Figure BDA0002273899070000101
其中μC是C的平均值,μS是S的平均值,
Figure BDA0002273899070000102
是C的方差,
Figure BDA0002273899070000103
是S的方差,σCS是C和S的协方差,c1=(0.01L)2,c2=(0.03L)2是用来维持稳定的常数,L是像素值的动态范围。SSIM的范围为0到1,两张图像相似度越高,则值越大,因此SSIM损失引入了负号,使得SSIM损失越小,则两张图像越相似。
critic损失是使用了一个判别网络,其网络结构如图6所示。假设该网络为Dis(·),原输入图像为C,含水印图像为S,则critic损失LC
LC=Dis(C)-Dis(S)
L2损失倾向于使输出残差图幅度减小,SSIM损失和critic损失则倾向于使含水印图像与原图像更相似,三者的共同作用会加强水印的不可感知性。
在具体实施过程中,解码鲁棒性是指从经过打印拍摄的含水印图像中提取水印,提取到的水印信息序列与输入的基本相同,错误比特少,误比特率越低则代表解码鲁棒性更高。为了提高解码器解码准确率,使用了交叉熵损失作为解码器的优化目标。假设输入的原二进制比特序列为Mi(i=1,2,...,N),而解码器解码输出的比特序列为Di(i=1,2,...,N),则交叉熵损失LE为:
Figure BDA0002273899070000104
另外,为了使解码阶段水印恢复网络的输出更接近编码阶段水印嵌入网络的输出,还引入了均方误差损失函数(Mean Square Error,MSE),有利于网络的训练和收敛。假设水印嵌入网络输出图像为E,水印恢复网络的输出图像为Q,则MSE损失为:
Figure BDA0002273899070000105
其中W和H分别是整图的宽和高。
因此整个系统的优化目标是
minλ1LR2LS3Lc4LE5LM
其中λi(i=1,2,3,4,5)分别为各个损失的权重。
在具体实施过程中,对神经网络进行训练,使用自然图像数据集如COCO等,二进制信息序列则使用随机生成的方式。训练完成后保存模型,在实际应用的时候,嵌入水印只需使用编码器网络部分,将待隐藏的水印信息如文本或图像等,转换为二进制比特序列,加上一张400×400大小的彩色图像作为水印信息的载体,输入编码器网络,便可以得到嵌入水印后的图像,大小与输入图像相同,且视觉上与输入图像基本完全相似。由于打印拍摄过程的高噪声和失真,往往整串比特序列无法完全解码正确,可能会出现少量的错误比特,因此通常会使用纠错码,以加强水印的鲁棒性。在提取水印时,只需要使用解码器网络部分,含水印图像经过打印后,在拍摄过程中被检测与定位,截取出含水印图像部分,使用仿射变换等技术变换回400×400大小的图像,然后送入解码器网络,便可以得到解码后的二进制比特序列。对该二进制比特序列进行纠错码的解码和转换,便可以得到文本或图像形式的隐藏水印信息。
实施例4
更具体的,基于深度学习的大容量抗打印/拍摄盲水印方法还包括含水印图像检测步骤,将检测含水印的图像由解码器进行水印提取,具体包括以下步骤:
C1:使用Canny边缘检测算法,得到图像的边缘图像;
C2:使用轮廓查找算法对图像的边缘图像进行处理,得到边缘轮廓;
C3:由边缘轮廓筛除面积较小的轮廓,使用多边形近似算法,得到近似多边形;
C4:保留近似多边形为四边形的轮廓,完成含水印图像的检测。
在具体实施过程中,本发明所使用的含水印图像检测方法是基于边缘检测的。首先使用Canny边缘检测算法,得到图像的边缘图像,接着使用轮廓查找算法,得到边缘轮廓,并筛除面积较小的轮廓,然后使用多边形近似算法,得到近似多边形,最后考虑到含水印图像是四边形的,因此只保留近似多边形为四边形的轮廓,这些轮廓即是所要检测的含水印图像的轮廓。该方法具有较好的实时性,能满足移动端实时性的要求,并且保证一定的准确性和鲁棒性。
在具体实施过程中,本发明同时提出了一种基于边缘检测的水印图像定位方法,是为了提高在实际应用中对含水印图像的检测和定位性能。首先使用Canny边缘检测算法,得到图像的边缘图像,考虑到含水印图像通常与背景具有较清晰的分隔,再使用轮廓跟踪算法,得到水印图像的边界,并同时去除面积较小的轮廓(较小轮廓通常不是含水印图像,也无法正确解码)。通过使用多边形近似,得到多边形边框。在实际应用中,水印图像一般是四边形,因此可以保留四边形边框。比较采用语义分割的神经网络方法,本发明提出的定位检测方法具有计算复杂度低、可以满足移动端实时检测的显著优点。此外,该方法可以利用多种先验知识,因此可以有效提升检测的鲁棒性能。
实施例5
在具体实施过程中,现有技术是对整图进行水印的嵌入与提取,本发明是在编码侧对图像进行分块嵌入,而在解码侧也对图像进行分块提取。分块的目的是为了更有效地利用图像的可嵌入空间,提高整体的容量,并且利用GPU并行加速能力提高水印的嵌入与提取速度。因此,二者的不同之处在于是否对图像进行分块处理。另外,因为分块嵌入之后会影响水印的视觉不可感知性,因此解决方案是引入了视觉保真网络和水印恢复网络,使编码器和解码器自然形成了分阶段任务的范式,从而形成了一个新型的嵌入与提取框架。
在具体实施过程中,现有技术是对整图进行端到端的编码网络训练,该编码网络既要完成水印的嵌入任务,又要满足不可感知性的要求。而本发明由于使用了分块的方案,因此实现了任务的分离。在编码器中,水印嵌入网络负责完成对图像块的水印嵌入,视觉保真网络对整图进行视觉上的整体调整,使其满足水印不可感知性的要求。在解码器中,水印恢复网络负责恢复图像分块的水印,水印提取网络则用于提取图像分块的水印。相比之下,任务分离式的神经网络更容易训练学习。图像分块进行嵌入和提取,缩小了送入神经网络进行计算的图片的尺寸,从而可以使用GPU并行加速进行快速计算,相比整张大图进行运算,提高了效率。另外,图像分块限制了水印嵌入的空间,从而不会造成过多的冗余,更能有效利用图像空间,因此可以增大水印嵌入的容量。
在具体实施过程中,现有技术是使用语义分割网络对含水印图像进行检测,该检测方法计算量较大,不满足移动端的实时性要求,而且检测效果不够准确和鲁棒。本发明使用了基于边缘检测的检测方法,主要用到边缘检测、轮廓查找和多边形近似等算法,相比较神经网络的方法而言,该方法计算量较小,因此实时性较高,能满足移动端的实时性要求。而且,利用了多种有效的先验知识,提高了检测的准确性和鲁棒性。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (8)

1.基于深度学习的大容量抗打印/拍摄盲水印系统,包括编码器和解码器,其特征在于:所述编码器中设置有水印嵌入网络和视觉保真网络;所述解码器中设置有水印恢复网络和水印提取网络;其中:
所述编码器将待处理图像进行分块后由水印嵌入网络把水印嵌入图像分块中;
所述编码器将嵌有水印的图像分块进行还原拼接后,由所述视觉保真网络进行图像视觉保真;
所述解码器通过所述水印恢复网络将待处理图像恢复为未保真状态并对未保真状态的图像进行分块,由所述水印提取网络进行水印提取;
所述水印嵌入网络包括下采样卷积模块、上采样卷积模块和全连接层;所述下采样卷积模块用于对图像分块进行下采样卷积计算,提取图像特征,再由所述上采样卷积模块进行上采样卷积计算,得到与待处理图像原图像大小一致的一系列残差图像;最后由全连接层将一系列残差图像分别加上对应的原图像块,得到含水印信息的图像块;
所述视觉保真网络为若干个Dense块组成的卷积神经网络;所述的Dense块包括四个卷积块,所述的卷积块由一个1x1卷积层和一个3x3卷积层组成;所述卷积块间通过密集连接,实现了对含水印信息的图像的图像视觉保真。
2.根据权利要求1所述的基于深度学习的大容量抗打印/拍摄盲水印系统,其特征在于:所述水印恢复网络与所述视觉保真网络结构相同,通过优化训练去除待处理图像的噪声和失真,再将图像恢复为未保真状态,并对未保真状态的图像进行分块处理;所述水印提取网络将输入的图像分块进行解码,得到每一块分块对应的比特序列,再按照顺序进行拼接,得到最终的二进制比特序列,再从中提取出水印信息,完成图像水印提取。
3.根据权利要求1或2的基于深度学习的大容量抗打印/拍摄盲水印系统,其特征在于:还包括含水印图像检测模块,所述含水印图像检测模块采用Canny边缘检测算法、轮廓查找算法和多边形近似算法,完成含水印图像的检测。
4.应用如权利要求3所述的基于深度学习的大容量抗打印/拍摄盲水印系统的基于深度学习的大容量抗打印/拍摄盲水印方法,其特征在于:包括编码步骤和解码步骤,所述编码步骤具体包括:
A1:将待处理图像输入编码器中,由编码器将待处理图像进行分块将水印嵌入图像分块中;
A2:编码器将嵌有水印的图像分块进行还原拼接,并对还原后的图像进行图像视觉保真,完成对待处理图像的水印嵌入;
所述解码步骤具体包括:
B1:将待处理图像输入解码器中,由解码器将待处理图像恢复为未保真状态;并对未保真状态的图像进行分块;
B2:解码器使用GPU并行对图像分块进行水印信息提取,得到二进制比特序列,进而解析出水印信息。
5.根据权利要求4所述的基于深度学习的大容量抗打印/拍摄盲水印方法,其特征在于:在所述步骤A1中,所述编码器通过水印嵌入网络把水印嵌入图像分块中;所述水印嵌入网络先对图像分块进行下采样卷积计算,提取图像特征,再进行上采样卷积计算,得到与待处理图像原图像大小一致的一系列残差图像;最后将一系列残差图像分别加上对应的原图像块,得到含水印信息的图像块,完成水印的嵌入。
6.根据权利要求5所述的基于深度学习的大容量抗打印/拍摄盲水印方法,其特征在于:在所述步骤A2中,所述编码器通过视觉保真网络进行图像视觉保真;所述视觉保真网络为若干个Dense块组成的卷积神经网络,Dense块包括四个卷积块,每一个卷积块由一个1x1卷积层和一个3x3卷积层组成;卷积块间通过密集连接,共同实现对含水印信息的图像的图像视觉保真。
7.根据权利要求6所述的基于深度学习的大容量抗打印/拍摄盲水印方法,其特征在于:在所述步骤B1中,所述解码器通过水印恢复网络将待处理图像恢复为未保真状态并对未保真状态的图像进行分块;所述水印恢复网络与所述视觉保真网络结构相同,通过优化训练去除待处理图像的噪声和失真,再将图像恢复为未保真状态,并对未保真状态的图像进行分块处理;在所述步骤B2中,所述解码器通过水印提取网络对待处理图像进行水印提取;所述水印提取网络将输入的图像分块进行解码,得到每一块分块对应的比特序列,再按照顺序进行拼接,得到最终的二进制比特序列,再从中提取出水印信息,完成图像水印提取。
8.根据权利要求7所述的基于深度学习的大容量抗打印/拍摄盲水印方法,其特征在于:还包括含水印图像检测步骤,将检测含水印的图像由解码器进行水印提取,具体包括以下步骤:
C1:使用Canny边缘检测算法,得到图像的边缘图像;
C2:使用轮廓查找算法对图像的边缘图像进行处理,得到边缘轮廓;
C3:由边缘轮廓筛除面积较小的轮廓,使用多边形近似算法,得到近似多边形;
C4:保留近似多边形为四边形的轮廓,完成含水印图像的检测。
CN201911115397.8A 2019-11-14 2019-11-14 基于深度学习的大容量抗打印/拍摄盲水印系统及方法 Active CN111223034B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911115397.8A CN111223034B (zh) 2019-11-14 2019-11-14 基于深度学习的大容量抗打印/拍摄盲水印系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911115397.8A CN111223034B (zh) 2019-11-14 2019-11-14 基于深度学习的大容量抗打印/拍摄盲水印系统及方法

Publications (2)

Publication Number Publication Date
CN111223034A CN111223034A (zh) 2020-06-02
CN111223034B true CN111223034B (zh) 2023-04-28

Family

ID=70830619

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911115397.8A Active CN111223034B (zh) 2019-11-14 2019-11-14 基于深度学习的大容量抗打印/拍摄盲水印系统及方法

Country Status (1)

Country Link
CN (1) CN111223034B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111768327B (zh) * 2020-06-30 2022-07-19 苏州科达科技股份有限公司 基于深度学习的水印添加、提取方法、设备及存储介质
CN111932431B (zh) * 2020-07-07 2023-07-18 华中科技大学 基于水印分解模型的可见水印去除方法和电子设备
CN112308754B (zh) * 2020-10-30 2023-08-18 东南数字经济发展研究院 面向大容量鲁棒水印应用的多解码端并行提取方法
CN112579985B (zh) * 2020-12-23 2024-06-25 合肥高维数据技术有限公司 基于频域特征排列的图像数字版权保护方法及系统
CN112579994A (zh) * 2020-12-23 2021-03-30 陈子祺 一种基于人工智能的数字产品内容保护系统和方法
CN113095987B (zh) * 2021-03-26 2022-02-01 贵州大学 一种基于多尺度特征学习的弥散加权图像的鲁棒水印方法
CN113158583B (zh) * 2021-05-24 2023-05-16 南京信息工程大学 一种端到端的基于深度学习的文本图像水印模型建立方法
CN114268845B (zh) * 2021-12-21 2024-02-02 中国电影科学技术研究所 一种基于异构运算的8k超高清视频的实时水印添加方法
CN117314712A (zh) * 2022-06-23 2023-12-29 北京火山引擎科技有限公司 模型的训练方法、水印复原方法及相关设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002013138A1 (en) * 2000-08-03 2002-02-14 Digital Copyright Technologies Ag Method for adaptive digital watermarking robust against geometric transforms
CN101901470A (zh) * 2010-02-10 2010-12-01 桂林电子科技大学 基于能量域半脆弱水印的图像篡改检测及恢复方法
CN109993678A (zh) * 2019-03-26 2019-07-09 南京联创北斗技术应用研究院有限公司 一种基于深度对抗生成网络的鲁棒信息隐藏方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002013138A1 (en) * 2000-08-03 2002-02-14 Digital Copyright Technologies Ag Method for adaptive digital watermarking robust against geometric transforms
CN101901470A (zh) * 2010-02-10 2010-12-01 桂林电子科技大学 基于能量域半脆弱水印的图像篡改检测及恢复方法
CN109993678A (zh) * 2019-03-26 2019-07-09 南京联创北斗技术应用研究院有限公司 一种基于深度对抗生成网络的鲁棒信息隐藏方法

Also Published As

Publication number Publication date
CN111223034A (zh) 2020-06-02

Similar Documents

Publication Publication Date Title
CN111223034B (zh) 基于深度学习的大容量抗打印/拍摄盲水印系统及方法
Zhang et al. Robust invisible video watermarking with attention
CN111275637B (zh) 一种基于注意力模型的非均匀运动模糊图像自适应复原方法
CN111915530B (zh) 一种基于端到端的雾霾浓度自适应神经网络图像去雾方法
CN105741224B (zh) 基于pvo和自适应块分割的可逆水印算法
CN111340047B (zh) 基于多尺度特征与前背景对比的图像语义分割方法及系统
CN111091503A (zh) 基于深度学习的图像去失焦模糊方法
CN109993089B (zh) 一种基于深度学习的视频目标去除及背景恢复方法
CN115034982B (zh) 一种基于多尺度注意机制融合的水下图像增强方法
Lu et al. Reversible data hiding using local edge sensing prediction methods and adaptive thresholds
CN110796582A (zh) 一种基于矢量图形压缩的可逆明水印方法和装置
CN111914947B (zh) 基于特征融合图像实例分割方法、装置、设备及存储介质
CN113284037A (zh) 一种基于深度神经网络的陶瓷水印载体恢复方法
CN110324617A (zh) 图像处理方法及装置
CN109886856A (zh) 对屏幕拍摄过程鲁棒的数字水印方法
CN116029887A (zh) 一种基于小波神经网络的图像大容量鲁棒水印方法
Wang et al. A novel image restoration scheme based on structured side information and its application to image watermarking
Tang et al. AutoEnhancer: Transformer on U-Net architecture search for underwater image enhancement
CN117333398A (zh) 一种基于自监督的多尺度图像去噪方法及装置
Desai et al. Lightnet: Generative model for enhancement of low-light images
CN117078553A (zh) 一种基于多尺度深度学习的图像去雾方法
Lee et al. Reversible data hiding using a piecewise autoregressive predictor based on two-stage embedding
Bhatnagar et al. Reversible Data Hiding scheme for color images based on skewed histograms and cross-channel correlation
CN110570343B (zh) 一种基于自适应特征点提取的图像水印嵌入方法及装置
Voronin et al. Fast texture and structure image reconstruction using the perceptual hash

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant