CN111062854A - 检测水印的方法、装置、终端及存储介质 - Google Patents
检测水印的方法、装置、终端及存储介质 Download PDFInfo
- Publication number
- CN111062854A CN111062854A CN201911365673.6A CN201911365673A CN111062854A CN 111062854 A CN111062854 A CN 111062854A CN 201911365673 A CN201911365673 A CN 201911365673A CN 111062854 A CN111062854 A CN 111062854A
- Authority
- CN
- China
- Prior art keywords
- watermark
- feature map
- target picture
- convolution
- characteristic diagram
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/0021—Image watermarking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
Abstract
本申请实施例公开了一种检测水印的方法、装置、终端及存储介质,属于图像处理技术领域,本申请实施例提供的检测水印的方法能够提取目标图片的第一特征图,通过空洞卷积层得到感受野大于第一特征图的第二特征图,再根据第二特征图确定目标图片中是否存在水印区域,当目标图片中存在水印区域时,本申请实施例能够确定目标图片中的水印区域。由于本申请能够从目标图片中的提取高级语义信息时平衡特征图的分辨率和感受野,在同样分辨率的目标图片下能获得较高的感受野,提高了确定水印位置的速度和准确度。
Description
技术领域
本申请实施例涉及图像处理技术领域,特别涉及一种检测水印的方法、装置、终端及存储介质。
背景技术
数字水印(英文:Digital Watermark)是一种应用计算机算法嵌入载体文件的保护信息。一些图片或者视频中通过嵌入水印来注明文件的归属或者来源。
在一些技术手段中,第三方社交平台能够接收并发布用户上传的图片或者视频。第三方社交平台需要保证上传的图片或者视频中不含有水印,以免带来侵权的问题。在一些处理方式中,第三方社交平台采用模版匹配的方式确定水印,当图片中检测到与预设模版相同的水印时,第三方社交平台将图片筛选出来并禁止上传。
发明内容
本申请实施例提供了一种检测水印的方法、装置、终端及存储介质。所述技术方案如下:
根据本申请的一方面内容,提供了一种检测水印的方法,所述方法包括:
提取目标图片的第一特征图,所述第一特征图用于表示所述目标图片的图像特征;
将所述第一特征图输入空洞卷积层,得到第二特征图,所述第二特征图的感受野(英文:Receptive Field)大于所述第一特征图的感受野;
根据所述第二特征图,确定所述目标图片中是否存在水印区域;
当所述目标图片中存在水印区域时,确定所述水印区域的位置。
根据本申请的另一方面内容,提供了一种检测水印的装置,所述装置包括:
特征提取模块,用于提取目标图片的第一特征图,所述第一特征图用于表示所述目标图片的图像特征;
特征处理模块,用于将所述第一特征图输入空洞卷积层,得到第二特征图,所述第二特征图的感受野大于所述第一特征图的感受野;
水印检测模块,用于根据所述第二特征图,确定所述目标图片中是否存在水印区域;
区域确定模块,用于当所述目标图片中存在水印区域时,确定所述水印区域的位置。
根据本申请的另一方面内容,提供了一种终端,所述终端包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现如本申请实施提供的检测水印的方法。
根据本申请的另一方面内容,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述指令由处理器加载并执行以实现如本申请实施提供的检测水印的方法。
本申请实施例提供的技术方案带来的有益效果可以包括:
本申请实施例提供的检测水印的方法能够提取目标图片的第一特征图,通过空洞卷积层得到感受野大于第一特征图的第二特征图,再根据第二特征图确定目标图片中是否存在水印区域,当目标图片中存在水印区域时,本申请实施例能够确定目标图片中的水印区域。由于本申请能够从目标图片中的提取高级语义信息时平衡特征图的分辨率和感受野,在同样分辨率的目标图片下能获得较高的感受野,提高了确定水印位置的速度和准确度。
附图说明
为了更清楚地介绍本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本申请一个示例性实施例提供的一种终端的结构框图;
图2是本申请一个示例性实施例提供的一种检测水印的方法的流程图;
图3是基于图2所示实施例提供的一种水印检测的流程示意图;
图4是基于图2所示实施例提供的另一种水印检测的流程示意图;
图5是本申请另一个示例性实施例提供的检测水印的方法流程图;
图6是基于图5所示实施例提供的一种用于检测水印的神经网络的结构示意图;
图7是基于图5所示实施例提供的一种特征提取层包含多个卷积块时的结构示意图;
图8是基于图5所示实施例提供的一种水印检测神经网络的结构示意图;
图9是基于图2所示实施例提供的水印检测算法模型的训练过程的流程图;
图10是本申请一个示例性实施例提供的一种检测水印的装置的结构框图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。在本申请的描述中,需要说明的是,除非另有明确的规定和限定,术语“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。此外,在本申请的描述中,除非另有说明,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
在多媒体信息传播领域,可以通过水印增强对目标图片的保护效果。当检测平台需要确定目标图片中是否含有水印时,由于人力资源的不足,通常采用基于基础特征的水印检测算法进行自动检测。其中,基于基础特征的水印检测算法可以包括基于颜色特征的水印检测算法、基于纹理特征的水印检测算法或者基于形状特征的水印检测算法中的至少一种。基于当前的计算机硬件发展现状,基于基础特征的水印检测算法检测水印的速度难以满足实际检测工作的需求。
此外,目标图片通常可以是用户通过摄像头等设备采集的图片。由于摄像头在采集图片时,图片中的景物存在一定尺度的位移和旋转的偏差。因此,一些技术中提供的模版匹配的方式确定水印的定位不准确,导致无法完成水印的检测。同时,模版匹配的方式可以确定的水印需要存在于模版中,不在模版中的水印会导致该目标图片中的水印无法被检测。
为了本申请实施例所示方案易于理解,下面对本申请实施例中出现的若干名词进行介绍。
VGG(英文:Visual Geometry Group,中文:视觉几何组)16:属于VGGNet(英文:Visual Geometry Group Network)中的一种。其中,VGGNet是一种用于分类的卷积神经网络,该网络的网络深度为16。
CNN(英文:Convolutional Neural Networks,中文:卷积神经网络):是一类包含卷积计算且具有深度结构的前馈神经网络,是深度学习的代表算法之一。
Keras:是一个开放源代码软件库,可以用于进行高性能数值计算。借助其灵活的架构,终端可以将计算工作部署到多种平台(CPU、GPU或TPU)和设备(桌面设备、服务器集群、移动设备或边缘设备等)。
示例性地,本申请实施例所示的检测水印的方法,可以应用在终端中,该终端具备显示屏且具备检测水印的功能。终端可以包括手机、平板电脑、膝上型电脑、台式电脑、电脑一体机、服务器、工作站、电视、机顶盒、智能眼镜、智能手表、数码相机、MP4播放终端、MP5播放终端、学习机、点读机、电纸书、电子词典或车载终端等。
请参见图1,图1是本申请一个示例性实施例提供的一种终端的结构框图,如图1所示,该终端包括处理器120和存储器140,所述存储器140中存储有至少一条指令,所述指令由所述处理器120加载并执行以实现如本申请各个方法实施例所述的检测水印的方法。
在本申请中,终端100是具备检测水印的功能的电子设备。当终端100获取到目标图片时,终端100能够提取目标图片中的第一特征图,提取方式可以是通过卷积的方式获得,该第一特征图用于表示目标图片的图像特征,终端100将第一特征图输入空洞卷积层,得到第二特征图,该第二特征图的感受野大于第一特征图的感受野,根据第二特征图,终端确定目标图片中是否存在水印区域,当目标图片中存在水印区域时,终端将确定水印区域的位置。
处理器120可以包括一个或者多个处理核心。处理器120利用各种接口和线路连接整个终端100内的各个部分,通过运行或执行存储在存储器140内的指令、程序、代码集或指令集,以及调用存储在存储器140内的数据,执行终端100的各种功能和处理数据。可选的,处理器120可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable LogicArray,PLA)中的至少一种硬件形式来实现。处理器120可集成中央处理器(CentralProcessing Unit,CPU)、图像处理器(Graphics Processing Unit,GPU)、张量处理器(tensor processing unit,TPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示屏所需要显示的内容的渲染和绘制;TPU主要用于矩阵乘法和卷积运算;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器120中,单独通过一块芯片进行实现。
存储器140可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory,ROM)。可选的,该存储器140包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器140可用于存储指令、程序、代码、代码集或指令集。存储器140可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现下述各个方法实施例的指令等;存储数据区可存储下面各个方法实施例中涉及到的数据等。
请参考图2,图2是本申请一个示例性实施例提供的一种检测水印的方法的流程图。该检测水印的方法可以应用在上述图1所示的终端中。在图2中,检测水印的方法包括:
步骤210,提取目标图片的第一特征图,第一特征图用于表示目标图片的图像特征。
在本申请实施例中,终端能够从目标图片中提取第一特征图。目标图片可以是终端中存储的图片。该目标图片可以是终端通过图像采集组件采集的图片,也可以是终端通过网络接收的图片。
可选地,终端可以在指定应用中采用本申请实施例提供的方案,对上传至社交应用、新闻应用或者公共媒体应用的图片进行水印检测。或者,终端也可以在接收到目标图片时,检测该图片中是否存在水印,本申请实施例对此不作限定。
终端能够通过指定的方式从目标图片中提取第一特征图。示意的,终端能够通过指定的神经网络模型、特征提取层或特征提取模型提取特征图。例如,本申请实施例可以基于VGG16提取第一特征图。比如,从VGG16中的某一个卷积块(英文:Block)处理后的特征图作为第一特征图。
步骤220,将第一特征图输入空洞卷积层,得到第二特征图,第二特征图的感受野大于第一特征图的感受野。
示意性的,终端在得到包含高级语义信息的第一特征图后,将第一特征图输入空洞卷积层,得到第二特征图,该第二特征图的感受野大于第一特征图的感受野。
由于对于水印检测任务而言,有效的基于高级语义信息进行特征提取至关重要。第一特征图在未经过空洞卷积层处理时,会经过较多池化层的处理来扩大特征图的感受野,然而,过多的池化层将导致处理后的特征尺寸减小。基于该处理后的特征恢复原本的分辨率也比较困难。而本申请实施例采用的空洞卷积层解决了这一问题。同样尺寸的第一特征图,在输入到空洞卷积层中,可以比不输入到空洞卷积层的特征图具有更大的感受野。
步骤230,根据第二特征图,确定目标图片中是否存在水印区域。
在本申请实施例中,终端能够根据第二特征图,确定目标图片中是否存在水印区域。一种场景中,第二特征图中包括边界像素,终端能够根据边界像素确定目标图片中是否存在水印区域。
步骤240,当目标图片中存在水印区域时,确定水印区域的位置。
在一种可能的实现方式中,终端通过边框回归预测来确定水印区域的位置。在确定的过程中,终端能够使用目标图片中的边界像素去预测相邻的2个顶点坐标。示意性的,终端能够分别确认表框的头部的2个顶点坐标和尾部的2个顶点坐标,从而确定出水域区域所在的四边形框的四个顶点坐标。该四边形框所围成的区域即为水印区域。
示意性地,请参见图3,图3是基于图2所示实施例提供的一种水印检测的流程示意图。在图3中,目标图片310中含有水印311“张三设计”的字样,终端可以将目标图片310输入到特征提取模型320中获取第一特征图330。终端能够将第一特征图330输入到空洞卷积层340中,得到第二特征图350,之后终端通过分析第二特征图350,即可得到检测后的目标图片360,检测后的目标图片360中包括水印区域361。在图3中,水印区域361实现为矩形框。
另一种可能的检测流程中,请参见图4,图4是基于图2所示实施例提供的另一种水印检测的流程示意图。在图4中,目标图片410中包含水印411“张三设计”,该图片被输入到特征提取器(英文:feature extractor)420中。可选地,CNN可以作为特征提取器来提取目标图片的特征图。被特征提取器420提取出的特征图分别执行两个流程,第一流程进行像素级语义分割(英文:pixel classification),该第一流程的作用是将水印和背景图进行二分类,得到的结果图像430包括黑色部分的背景和水印部分的区域431。第二流程进行边框回归(英文:Bounding Box Regression)操作,得到结果图像440,结果图像440中标注有待处理内容441的区域。在本流程中,结果图像430和结果440一起执行非极大值抑制(英文:Non-maximum suppression,缩写:NMS)操作450,得到检测后的目标图片460,该目标图片460中标注有目标框461,相应的,该目标框461所包围的区域为目标图片460中的水印区域。
综上所述,本实施例提供的检测水印的方法,能够提取目标图片的第一特征图,通过空洞卷积层得到感受野大于第一特征图的第二特征图,再根据第二特征图确定目标图片中是否存在水印区域,当目标图片中存在水印区域时,本申请实施例能够确定目标图片中的水印区域。由于本申请能够从目标图片中的提取高级语义信息时平衡特征图的分辨率和感受野,在同样分辨率的目标图片下能获得较高的感受野,提高了确定水印位置的速度和准确度。
基于上一个实施例所公开的方案,终端还能够通过神经网络检测水印,其中,空洞卷积层可以设置于神经网络中的不同层级,请参考如下实施例。
请参见图5,图5是本申请另一个示例性实施例提供的检测水印的方法流程图。该检测水印的方法可以应用在上述图1所示的终端中。在图5中,该检测水印的方法包括:
步骤511,将目标图片输入到特征提取层中,特征提取层包括n个卷积块,n为正整数,n个卷积块串联排布组成特征提取层。
本申请实施例可以通过指定的神经网络完成水印检测任务。示意性的,请参见图6,图6是基于图5所示实施例提供的一种用于检测水印的神经网络的结构示意图。在图6中,水印检测神经网络600可以包括特征提取层610、特征合并层620和输出层630。其中,特征提取层610可以是单层的,也可以是多层的。特征合并层620可以是单层的,也可以是多层的。
特征提取层可以包括n个卷积块,n个卷积块串联排布,首尾相接依次完成对目标图片的特征提取工作。请参见图7,图7是基于图5所示实施例提供的一种特征提取层包含多个卷积块时的结构示意图。在图7中,特征提取层610包括四个卷积块,四个卷积块分别为第一卷积块611、第二卷积块612、第三卷积块613和第四卷积块614。其中,每一个卷积块包括一个池化层和若干个卷积层。第一卷积块611包括1个卷积层和1个池化层,第二卷积块包括2个卷积层和1个池化层,第三卷积块包括2个卷积层和1个池化层,第四卷积块包括3个卷积层和1个池化层。
需要说明的是,图7所示特征提取层包括的卷积块的数量仅为示例性说明。在其它可能的实现方式中,n个卷积块可以为1个卷积块、2个卷积块、3个卷积块、5个卷积块或者其它正整数个卷积块,本申请实施例对此不作限定。
步骤512,将目标图片输入到特征提取层,得到n个特征图,每一个卷积块输出一个特征图。
本实施例中,特征提取层中的每一个卷积块都能够输出完整的特征图。以图7所示的特征提取层的结构为例,当n等于4时,4个卷积块均能够针对一张目标图片输出1个特征图。
步骤513,将第i个卷积块输出的特征图作为第一特征图,i为不大于n的正整数。
示意性的,第i个卷积块是n个卷积块中的一个卷积块。终端能够将第i个卷积块输出的特征图作为第一特征图。由于网络结构设计上有所区别,第i个卷积块可以是n个卷积块中的一个卷积块。在此场景中,本申请提供的特征提取层,有一个卷积块负责输出第一特征图。
步骤521,将第一特征图分别输入m个空洞卷积层,m个空洞卷积层两两之间的扩张率不同。
请参见图8,图8是基于图5所示实施例提供的一种水印检测神经网络的结构示意图。在图8中,水印检测神经网络包括特征提取层、特征合并层和输出层630。其中,特征提取层包括第一卷积块611、地二卷积块612、第三卷积块613和第四卷积块614。特征合并层包括空洞空间金字塔池化结构621、图像池化组622、第一合并卷积层623、第一合并层624、第二合并层625和第二合并卷积层626。输出层630包括三组数据,第一组数据的输出层是1位score(中文:分值),用于表示像素是否在水印区域内,分值越高,说明该像素在水印区域内的可能性越高,该组数据在图中表示为(1*1,1)。第二组数据是2位vertex code(英文:顶点代码),用于判断该像素是否是边界像素并判断该像素是水印的头部还是尾部,该组数据在图中表示为(1*1,2)。第三组数据是4位vertex geo,是该像素可以预测的2个顶点坐标,所有的边界像素构成了文本框形状。
在图8中,特征提取层提取到的特征图能够分别与特征合并层中的特征图进行合并。第二卷积块612输出的特征图f3将通过第二合并层625中的连接部分(图中斜线覆盖部分)处理,与第二合并层625上采样后的特征图一并融合。同理,特征图f2的处理操作与特征图f3的处理操作类似。
在一种实现方式中,m个空洞卷积层通过级联的方式组合,m个空洞卷积层组合成为空洞空间金字塔池化结构,空洞空间金字塔池化结构用于令m个空洞卷积层并行工作。
在图8所示的水印检测神经网络中,第一特征图f1输入到空洞空间金字塔池化结构621中。空洞空间金字塔池化结构621中包括4个通过级联的方式组合的空洞卷积层。在一种可能的方式中,4个通过级联的方式组合的空洞卷积层从左到右分别为第一空洞卷积层621a、第二空洞卷积层621b、第三空洞卷积层621c和第四空洞卷积层621d。从第一空洞卷积层621a到第四空洞卷积层621d,每一层的空洞卷积层的扩张率逐渐增大。示例性的,第一空洞卷积层621a的扩张率为1、第二空洞卷积层621b的扩张率为6、第三空洞卷积层621c的扩张率为12和第四空洞卷积层621d的扩张率为18。其中,每层空洞卷积层的输出都会与输入,以及该空洞卷积层所有前层输出连接组合。由此可知,最终合并后的输出将获得更多更大尺度的感受野。图中空洞空间金字塔池化结构621能够生成更密集更大的特征金字塔,本申请的空洞空间金字塔池化结构621包括4个并行的操作。其中,第一空洞卷积层621a使用1*1的卷积,第二空洞卷积层621b、第三空洞卷积层621c和第四空洞卷积层621d使用3*3的卷积。在实际实践中,特征图的输出补偿为16。
步骤522,每一个空洞卷积层处理第一特征图得到一个中间输出图。
本实施例中,一个空洞卷积层处理第一特征图后将得到一个中间输出图。以图8所示实施例为例,空洞空间金字塔池化结构621将并列输出4个中间输出图。
步骤523,将m个中间输出图组合,得到第二特征图。
示意性的,上述步骤得到的m个中间输出图进行组合,得到第二特征图。以图8所示的实施例为例,经过第一合并卷积层623合并后的特征图为第二特征图。
步骤531,将第二特征图和融合特征图进行合并,得到结果特征图,融合特征图是特征合并层中除第二特征图之外的特征图。
可选地,本申请实施例能够将第二特征图和融合特征图进行合并,得到结果特征图。以图8所示的实施例为例,第二特征图可以在第一合并层624中与特征图f2合并,在第二合并层625中与特征图f3合并。在本例中,融合特征图包括特征图f2和特征图f3。其中,结果特征图是目标图片中指定的像素被水印检测网络标注处理过的特征图。
步骤532,根据结果特征图,确定目标图片中是否存在水印区域。
终端将根据结果特征图,确定目标图片中是否存在水印区域。其中,当目标图片中用于标注水印的像素点超过指定数目时,终端确认目标图片中存在水印区域。当目标图片中用于标注水印的像素点不超过指定数目时,终端确认目标图片中不存在水印区域。
步骤541,确定目标图片中的边界像素。
在本实施例中,经过水印检测神经网络检测的目标图片,存在被标注的边界像素。该边界像素用于指示水印区域的边界。
步骤542,根据边界像素确定水印区域的四边形边框顶点的坐标。
示意性的,终端将边界像素点确定出水印区域的四边形边框的顶点的坐标。
步骤551,截取目标图片中的水印区域。
在本实施例中,终端能够截取目标图片中的水印区域。终端可以通过前述步骤确定水印区域的四边形边框,并截取该四边形边框内的图像。
步骤552,根据目标图片的图像特征,对水印区域进行水印去除,得到处理后区域。
一种可能的实现方式中,终端能够调用经过训练的水印去除模型,仅将水印区域输入到该水印去除模型中,得到处理后的区域。
另一种可能的实现方式中,终端还可以将水印区域采用预设的图案替换,该预设的图案可以是目标图片中其它部分截取到的图案。
步骤553,将处理后区域覆盖在水印区域上,得到目标图片对应的无水印图像。
示意性的,本申请实施例能够将处理后的区域覆盖在水印区域上,并将该处理后的区域与目标图片相融合,得到目标图片对应的无水印图像。
可选地,本申请实施例涉及的神经网络的目标函数可由两部分组成,分别是分类图损失和几何形状损失,其算式表示如下:
Lloss=Ls+λgLg
其中,Ls为分类图损失,λg为两个损失的权重,此处可以设置为1。Lg是几何形状损失。在本申请实施例中,由于水印在目标图片中的尺寸变化极大,直接使用Ls或λg将导致损失偏差朝更大更长的方向变化。因此,本申请实施例选择Ls和λg的和值作为损失函数。
可选地,本申请实施例可以使用Keras定义卷积神经网络模型。
综上所述,本实施例能够通过将空洞卷积层可以设置于神经网络中的不同层级,使得神经网络的结构产生不同的变化,并实现保持神经网络在池化层较多的情况下,获得较大的感受野,从而提高神经网络在识别水印时能够编码更多尺度信息,提高了神经网络识别水印的能力。
本实施例提供的检测水印的方法,还能够在识别出水印所在的区域后,对该区域中的图像执行水印去除的工作,降低了水印去除模型所要处理的图像区域的面积,提高了去除水印的效率。
基于上述实施例所示的方法,本申请实施例还提供一种水印检测算法模型的训练方法,请参考如下实施例。
请参考图9,图9是基于图2所示实施例提供的水印检测算法模型的训练过程的流程图,在图9中,终端能能够使用神经网络之前先对该神经网络进行训练。在一种可能的场景中,图9所示流程在图2或图5所示的流程之前执行。在图9中,该圣经网络的训练过程包括:
步骤910,构建水印数据集。
首先,收集各式各样的水印。为了后续模型具有良好的泛化性能,该步骤中收集的水印的种类需要尽可能的多,样式需要尽可能丰富。
一种可能的方式中,水印的来源可以来自于个人、组织或公司。水印的样式可以包括中文、英文和标识(即logo)等。在本步骤中,终端可以制作带有水印的图像。示意性的,本实施例可以采用PASCAL VOC 2012数据集的图像作为原始的无水印图像,然后利用图像处理工具将收集到的q种水印以随机的大小、位置和透明度附加在原始图像上,同时记录下水印的位置信息,从而得到水印数据集。其中,q为收集到的水印的种类数量,q为正整数。
步骤920,对水印数据集中的训练样本进行格式调整、去重和重命名。
步骤930,对训练样本进行数据增强。
示意性的,终端能够通过尺度变换和噪声添加两个方面进行处理。
针对尺度变换,终端可以将训练样本的尺度统一为标准尺度。可选地,终端可以采用按比例缩放的方式进行尺度变换。
针对噪声添加,为了提高模型的鲁棒性,终端可以为训练样本添加随机噪声。
步骤940,对训练样本进行归一化处理。
示意性的,终端能够将训练样本中的像素点的像素值从[0,255]的区间归一到[0,1],去除带训练样本数据中包含的冗余信息,压缩训练时间。
步骤950,将水印数据集划分为训练集和测试集。
在本申请实施例中,终端可以将水印数据集中的80%划分为训练集,将水印数据集中的20%划分为测试集。在该设计中,测试集中的训练样本将和训练集中的训练样本完全不同,能够较好的模拟模型实际应用上用于识别从未处理过的水印的场景。
步骤960,根据目标函数采用误差发反向传播训练水印检测算法模型。
在卷积神经网络的训练过程中,在求解最优化问题时,通过进行误差反向传播来不断优化参数和目标函数,迭代更新网络中的权值,来完成整个训练过程。训练过程中将训练集输入水印检测算法模型并迭代预设次数epochs。
一种可能的方式中,本申请实施例设置为epochs为90次。每一次迭代计算过程中使用Adam梯度下降算法优化目标函数,为了加速学习,统一从图像集中采样512*512构建每一批送进去的图片张数为24,然后设置学习率为阶段衰减,这样有利于模型快速收敛。
步骤970,将测试集送入训练好的水印检测算法模型,验证模型的准确性。
步骤980,响应于高于目标阈值的准确性的水印检测算法模型,将该模型确定为用于检测水印的卷积神经网络模型。
综上所述,本实施例提供的水印检测算法模型的训练方法,能够通过水印手机、格式调整、去重、重命名和数据增强,得到较为丰富完整的水印数据集,再通过归一化处理以及测试集和样本集的划分,使得训练得到的水印检测算法模型能够适应实际水印检测中没有遇见过的水印,提高了水印检测算法模型的训练效率和训练好的水印检测算法模型的鲁棒性。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
请参考图10,图10是本申请一个示例性实施例提供的一种检测水印的装置的结构框图。该检测水印的装置可以通过软件、硬件或者两者的结合实现成为终端的全部或一部分。该装置包括:
特征提取模块1010,用于提取目标图片的第一特征图,所述第一特征图用于表示所述目标图片的图像特征;
特征处理模块1020,用于将所述第一特征图输入空洞卷积层,得到第二特征图,所述第二特征图的感受野大于所述第一特征图的感受野;
水印检测模块1030,用于根据所述第二特征图,确定所述目标图片中是否存在水印区域;
区域确定模块1040,用于当所述目标图片中存在水印区域时,确定所述水印区域的位置。
在一个可选的实施例中,所述特征处理模块1020,用于将所述第一特征图分别输入m个空洞卷积层,所述m个空洞卷积层两两之间的扩张率不同;每一个空洞卷积层处理所述第一特征图得到一个中间输出图;将m个中间输出图组合,得到所述第二特征图。
在一个可选的实施例中,本装置涉及的所述m个空洞卷积层通过级联的方式组合,所述m个空洞卷积层组合成为空洞空间金字塔池化结构,所述空洞空间金字塔池化结构用于令m个空洞卷积层并行工作。
在一个可选的实施例中,所述水印检测模块1030,用于将所述第二特征图和融合特征图进行合并,得到结果特征图,所述融合特征图是特征合并层中除所述第二特征图之外的特征图;根据所述结果特征图,确定所述目标图片中是否存在水印区域。
在一个可选的实施例中,所述特征提取模块1010,用于将所述目标图片输入到特征提取层中,所述特征提取层包括n个卷积块,n为正整数,所述n个卷积块串联排布组成所述特征提取层;将所述目标图片输入到所述特征提取层,得到n个特征图,每一个卷积块输出一个特征图;将第i个卷积块输出的特征图作为所述第一特征图,i为不大于n的正整数。
在一个可选的实施例中,所述区域确定模块1040,用于确定所述目标图片中的边界像素;根据所述边界像素确定所述水印区域的四边形边框顶点的坐标。
在一个可选的实施例中,所述装置还包括水印截取模块、水印去除模块和图像融合模块。所述水印截取模块,用于截取所述目标图片中的所述水印区域。所述水印去除模块,用于根据所述目标图片的图像特征,对所述水印区域进行水印去除,得到处理后区域。所述图像融合模块,用于将所述处理后区域覆盖在所述水印区域上,得到所述目标图片对应的无水印图像。
本申请实施例还提供了一种计算机可读介质,该计算机可读介质存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如上各个实施例所述的检测水印的方法。
需要说明的是:上述实施例提供的检测水印的装置在执行检测水印的方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的检测水印的装置与检测水印的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请的能够实现的示例性的实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种检测水印的方法,其特征在于,所述方法包括:
提取目标图片的第一特征图,所述第一特征图用于表示所述目标图片的图像特征;
将所述第一特征图输入空洞卷积层,得到第二特征图,所述第二特征图的感受野大于所述第一特征图的感受野;
根据所述第二特征图,确定所述目标图片中是否存在水印区域;
当所述目标图片中存在水印区域时,确定所述水印区域的位置。
2.根据权利要求1所述的方法,其特征在于,所述将所述第一特征图输入空洞卷积层,得到第二特征图,包括:
将所述第一特征图分别输入m个空洞卷积层,所述m个空洞卷积层两两之间的扩张率不同;
每一个空洞卷积层处理所述第一特征图得到一个中间输出图;
将m个中间输出图组合,得到所述第二特征图。
3.根据权利要求2所述的方法,其特征在于,所述m个空洞卷积层通过级联的方式组合,所述m个空洞卷积层组合成为空洞空间金字塔池化结构,所述空洞空间金字塔池化结构用于令m个空洞卷积层并行工作。
4.根据权利要求1所述的方法,其特征在于,所述根据所述第二特征图,确定所述目标图片中是否存在水印区域,包括:
将所述第二特征图和融合特征图进行合并,得到结果特征图,所述融合特征图是特征合并层中除所述第二特征图之外的特征图;
根据所述结果特征图,确定所述目标图片中是否存在水印区域。
5.根据权利要求1所述的方法,其特征在于,所述提取目标图片的第一特征图,包括:
将所述目标图片输入到特征提取层中,所述特征提取层包括n个卷积块,n为正整数,所述n个卷积块串联排布组成所述特征提取层;
将所述目标图片输入到所述特征提取层,得到n个特征图,每一个卷积块输出一个特征图;
将第i个卷积块输出的特征图作为所述第一特征图,i为不大于n的正整数。
6.根据权利要求1所述的方法,其特征在于,所述当所述目标图片中存在水印区域时,确定所述水印区域的位置,包括:
确定所述目标图片中的边界像素;
根据所述边界像素确定所述水印区域的四边形边框顶点的坐标。
7.根据权利要求6任一所述的方法,其特征在于,所述方法还包括:
截取所述目标图片中的所述水印区域;
根据所述目标图片的图像特征,对所述水印区域进行水印去除,得到处理后区域;
将所述处理后区域覆盖在所述水印区域上,得到所述目标图片对应的无水印图像。
8.一种检测水印的装置,其特征在于,所述装置包括:
特征提取模块,用于提取目标图片的第一特征图,所述第一特征图用于表示所述目标图片的图像特征;
特征处理模块,用于将所述第一特征图输入空洞卷积层,得到第二特征图,所述第二特征图的感受野大于所述第一特征图的感受野;
水印检测模块,用于根据所述第二特征图,确定所述目标图片中是否存在水印区域;
区域确定模块,用于当所述目标图片中存在水印区域时,确定所述水印区域的位置。
9.一种终端,其特征在于,所述终端包括处理器、和与所述处理器相连的存储器,以及存储在所述存储器上的程序指令,所述处理器执行所述程序指令时实现如权利要求1至7任一所述的检测水印的方法。
10.一种计算机可读存储介质,所述存储介质中存储有程序指令,其特征在于,所述程序指令被处理器执行时实现如权利要求1至7任一所述的检测水印的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911365673.6A CN111062854B (zh) | 2019-12-26 | 2019-12-26 | 检测水印的方法、装置、终端及存储介质 |
PCT/CN2020/136587 WO2021129466A1 (zh) | 2019-12-26 | 2020-12-15 | 检测水印的方法、装置、终端及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911365673.6A CN111062854B (zh) | 2019-12-26 | 2019-12-26 | 检测水印的方法、装置、终端及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111062854A true CN111062854A (zh) | 2020-04-24 |
CN111062854B CN111062854B (zh) | 2023-08-25 |
Family
ID=70303838
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911365673.6A Active CN111062854B (zh) | 2019-12-26 | 2019-12-26 | 检测水印的方法、装置、终端及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN111062854B (zh) |
WO (1) | WO2021129466A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112733822A (zh) * | 2021-03-31 | 2021-04-30 | 上海旻浦科技有限公司 | 一种端到端文本检测和识别方法 |
WO2021129466A1 (zh) * | 2019-12-26 | 2021-07-01 | Oppo广东移动通信有限公司 | 检测水印的方法、装置、终端及存储介质 |
WO2023019682A1 (zh) * | 2021-08-19 | 2023-02-23 | 广东艾檬电子科技有限公司 | 水印去除方法、装置、终端设备及可读存储介质 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114792285A (zh) * | 2022-04-21 | 2022-07-26 | 维沃移动通信有限公司 | 图像处理方法和处理装置、电子设备和可读存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050025337A1 (en) * | 2003-07-29 | 2005-02-03 | Wei Lu | Techniques and systems for embedding and detecting watermarks in digital data |
CN108230269A (zh) * | 2017-12-28 | 2018-06-29 | 北京智慧眼科技股份有限公司 | 基于深度残差网络的去网格方法、装置、设备及存储介质 |
CN109325534A (zh) * | 2018-09-22 | 2019-02-12 | 天津大学 | 一种基于双向多尺度金字塔的语义分割方法 |
CN109784181A (zh) * | 2018-12-14 | 2019-05-21 | 平安科技(深圳)有限公司 | 图片水印识别方法、装置、设备及计算机可读存储介质 |
CN110020676A (zh) * | 2019-03-18 | 2019-07-16 | 华南理工大学 | 基于多感受野深度特征的文本检测方法、系统、设备及介质 |
CN110428357A (zh) * | 2019-08-09 | 2019-11-08 | 厦门美图之家科技有限公司 | 图像中水印的检测方法、装置、电子设备及存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8891811B2 (en) * | 2004-09-17 | 2014-11-18 | Digimarc Corporation | Hierarchical watermark detector |
CN109285105B (zh) * | 2018-09-05 | 2023-08-11 | 北京字节跳动网络技术有限公司 | 水印检测方法、装置、计算机设备和存储介质 |
CN110322495B (zh) * | 2019-06-27 | 2021-11-02 | 电子科技大学 | 一种基于弱监督深度学习的场景文本分割方法 |
CN111062854B (zh) * | 2019-12-26 | 2023-08-25 | Oppo广东移动通信有限公司 | 检测水印的方法、装置、终端及存储介质 |
-
2019
- 2019-12-26 CN CN201911365673.6A patent/CN111062854B/zh active Active
-
2020
- 2020-12-15 WO PCT/CN2020/136587 patent/WO2021129466A1/zh active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050025337A1 (en) * | 2003-07-29 | 2005-02-03 | Wei Lu | Techniques and systems for embedding and detecting watermarks in digital data |
CN108230269A (zh) * | 2017-12-28 | 2018-06-29 | 北京智慧眼科技股份有限公司 | 基于深度残差网络的去网格方法、装置、设备及存储介质 |
CN109325534A (zh) * | 2018-09-22 | 2019-02-12 | 天津大学 | 一种基于双向多尺度金字塔的语义分割方法 |
CN109784181A (zh) * | 2018-12-14 | 2019-05-21 | 平安科技(深圳)有限公司 | 图片水印识别方法、装置、设备及计算机可读存储介质 |
CN110020676A (zh) * | 2019-03-18 | 2019-07-16 | 华南理工大学 | 基于多感受野深度特征的文本检测方法、系统、设备及介质 |
CN110428357A (zh) * | 2019-08-09 | 2019-11-08 | 厦门美图之家科技有限公司 | 图像中水印的检测方法、装置、电子设备及存储介质 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021129466A1 (zh) * | 2019-12-26 | 2021-07-01 | Oppo广东移动通信有限公司 | 检测水印的方法、装置、终端及存储介质 |
CN112733822A (zh) * | 2021-03-31 | 2021-04-30 | 上海旻浦科技有限公司 | 一种端到端文本检测和识别方法 |
CN112733822B (zh) * | 2021-03-31 | 2021-07-27 | 上海旻浦科技有限公司 | 一种端到端文本检测和识别方法 |
WO2023019682A1 (zh) * | 2021-08-19 | 2023-02-23 | 广东艾檬电子科技有限公司 | 水印去除方法、装置、终端设备及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111062854B (zh) | 2023-08-25 |
WO2021129466A1 (zh) | 2021-07-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111062854B (zh) | 检测水印的方法、装置、终端及存储介质 | |
CN111553406B (zh) | 基于改进yolo-v3的目标检测系统、方法及终端 | |
CN111476284A (zh) | 图像识别模型训练及图像识别方法、装置、电子设备 | |
CN109376256B (zh) | 图像搜索方法及装置 | |
CN110533594B (zh) | 模型训练方法、图像重建方法、存储介质及相关设备 | |
CN111275034B (zh) | 从图像中提取文本区域的方法、装置、设备和存储介质 | |
CN111325271B (zh) | 图像分类方法及装置 | |
CN111062871A (zh) | 一种图像处理方法、装置、计算机设备及可读存储介质 | |
CN111182367A (zh) | 一种视频的生成方法、装置及计算机系统 | |
CN113762138A (zh) | 伪造人脸图片的识别方法、装置、计算机设备及存储介质 | |
CN110619334A (zh) | 基于深度学习的人像分割方法、架构及相关装置 | |
CN114926734A (zh) | 基于特征聚合和注意融合的固体废弃物检测装置及方法 | |
CN113870196A (zh) | 一种基于锚点切图的图像处理方法、装置、设备和介质 | |
CN103946865B (zh) | 用于有助于检测图像内的文本的方法和装置 | |
CN113205047A (zh) | 药名识别方法、装置、计算机设备和存储介质 | |
CN114494302A (zh) | 图像处理方法、装置、设备及存储介质 | |
CN115953612A (zh) | 一种基于ConvNeXt的遥感影像植被分类方法和装置 | |
KR102444172B1 (ko) | 영상 빅 데이터의 지능적 마이닝 방법과 처리 시스템 | |
CN114998756A (zh) | 一种基于yolov5的遥感图像检测方法、装置及存储介质 | |
CN111741329B (zh) | 一种视频处理方法、装置、设备及存储介质 | |
CN110197459B (zh) | 图像风格化生成方法、装置及电子设备 | |
CN114387315A (zh) | 图像处理模型训练、图像处理方法、装置、设备及介质 | |
CN114399645A (zh) | 多模态数据扩充方法、系统、介质、计算机设备及终端 | |
CN115004245A (zh) | 目标检测方法、装置、电子设备和计算机存储介质 | |
CN113706636A (zh) | 一种用于篡改图像识别的方法与装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |