CN110349070B - 一种短视频水印检测方法 - Google Patents

一种短视频水印检测方法 Download PDF

Info

Publication number
CN110349070B
CN110349070B CN201910507617.5A CN201910507617A CN110349070B CN 110349070 B CN110349070 B CN 110349070B CN 201910507617 A CN201910507617 A CN 201910507617A CN 110349070 B CN110349070 B CN 110349070B
Authority
CN
China
Prior art keywords
video
probability
watermark
target watermark
representing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910507617.5A
Other languages
English (en)
Other versions
CN110349070A (zh
Inventor
范俊
熊永春
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Xiaoying Innovation Technology Co ltd
Original Assignee
Hangzhou Xiaoying Innovation Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Xiaoying Innovation Technology Co ltd filed Critical Hangzhou Xiaoying Innovation Technology Co ltd
Priority to CN201910507617.5A priority Critical patent/CN110349070B/zh
Publication of CN110349070A publication Critical patent/CN110349070A/zh
Application granted granted Critical
Publication of CN110349070B publication Critical patent/CN110349070B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/0021Image watermarking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2201/00General purpose image data processing
    • G06T2201/005Image watermarking
    • G06T2201/0065Extraction of an embedded watermark; Reliable detection

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

本发明公开了一种短视频水印检测方法,该方法充分考虑到短视频水印位置集中和水印面试较小的特点,利用yolov3模型和sigmoid二分类模型来预测每一帧视频中含有目标水印的概率,从而给短视频水印检测提供更高的检测准确率和更小的定位误差。

Description

一种短视频水印检测方法
技术领域
本发明涉及水印检测技术领域,更具体的说是涉及一种短视频水印检测方法。
背景技术
目前,现有的水印检测方法主要有两种,一种是基于基准水印比对方法,该方法需要实现知道待检测的基准水印模板,其检测、定位的流程如下:
1)提取:从待检测图片中提取水印信号;
2)计算与校正:通过计算相关度进行坐标校正,确定水印区域;
3)判断:计算该区域与所有水印模板的相似度,判断是否匹配某一个水印模板。
另一种是基于共有图案的方法,这种方法不需要事先知道水印模板,这种方法不需要实现知道水印模板,它假设每张图片J都是由原始图片I和水印模板W合成而来,形式化:
I(p)=a(p)W(p)+(1-a(p)I(p))
其中P=(x,y)是像素位置,上面公式是单张图片的表示,如果我们有一个图片集合K,那么每一张图片可以形式化表示为:
Ik=aW+(1-a)Ik'k=1,2,...K
然后用参数估计的方法计算出水印W,然后利用模板匹配的方法,对水印与目标图片进行水印位置匹配。
但是,基于基准水印比对方法存在如下缺点:
1)耗时长,水印的面积占比大都很小,需要对目标图片进行多次特征提取、计算校正,再与模板比对,整个过程非常耗时;
2)鲁棒性差,现在短视频上的水印大都是动态的,如果因为截帧的原因截到的水印不完整,或者是截到变形的动态水印,该方法的准确率就会大大折扣。
而基于共有图像的方法存在如下缺点:
1)对训练数据量要求很高,因为要估计的参数多;
2)对水印的位置和范围判断不准;
3)对于短视频内容经常出现水印叠加的问题和水印模糊的问题,该方法的准确率会大幅降低。
因此,如何提供一种检测准确率高、定位误差小且耗时短的水印检测方法是本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本发明提供了一种短视频水印检测方法,该方法充分考虑到短视频水印位置集中和水印面试较小的特点,利用yolov3模型和sigmoid二分类模型来预测每一帧视频中含有目标水印的概率,从而给短视频水印检测提供更高的检测准确率和更小的定位误差。
为了实现上述目的,本发明采用如下技术方案:
一种短视频水印检测方法,该方法包括以下步骤:
步骤1:预先标注出每张图中所有的水印及其坐标信息,利用预先标注的数据,训练yolov3模型和n个sigmoid二分类模型;
步骤2:对视频进行截帧,用训练好的yolov3模型预测每一帧视频中含有目标水印的概率;
步骤3:分别将每一帧视频中含有目标水印的概率与预先设定的概率阈值进行比对;
若当前帧视频中含有目标水印的概率大于预先设定的概率阈值,则判定当前帧视频中含有目标水印,直接进行步骤5;
若当前帧视频中含有目标水印的概率小于预先设定的概率阈值,则初步判定当前帧视频中不含有目标水印,进行步骤4;
步骤4:将初步判定不含有目标水印的每一帧视频分别输入到训练好的n个sigmoid二分类模型,进一步判定初步判定不含有目标水印的每一帧视频是否含有目标水印;
步骤5:输出目标水印。
在上述方案的基础上,对本发明提供的方案做进一步解释说明。
进一步地,步骤2中对视频进行截帧时,截取的视频帧数范围为5-10。
进一步地,yolov3模型中的损失函数为:
Figure BDA0002092350340000031
其中,第一行是bounding_box坐标误差;第二行是bounding_box的宽高误差,通过加大小物体检测错误的惩罚,提高小物体检测准确率;第三行是IOU误差;第四行是分类误差;
式中,S2表示网格的数量;B表示每个网格输出的bounding_box的数量;
Figure BDA0002092350340000032
表示一个指示变量,标识第i个网格的第j个变量是否负责这个物体的预测;xi,yi,wi,hi表示训练样本中标注的bounding_box的坐标和宽高;
Figure BDA0002092350340000033
表示预测的bounding_box的坐标和宽高;Ci表示训练集中标注的类别;
Figure BDA0002092350340000034
表示预测的类别;pi(c)表示第i个网格负责预测的物体类别是c的概率;
Figure BDA0002092350340000035
表示第i个网格预测的物体类别是c的概率。
进一步地,步骤2中用训练好的yolov3模型预测每一帧视频中含有目标水印的概率时,输出值为:
[<n1,p1,(x1,y1,w1,h1)>,<n2,p2,(x2,y2,w2,h2)>,...,<ni,pi,(xi,yi,wi,hi)>,...,<nn,pn,(xn,yn,wn,hn)>]
式中,ni表示目标水印,pi表示概率第i帧视频中含有目标水印ni的概率,(xi,yi,wi,hi)表示目标水印ni的位置。
经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种短视频水印检测方法,该方法充分考虑到短视频水印位置集中和水印面试较小的特点,利用yolov3模型和sigmoid二分类模型来预测每一帧视频中含有目标水印的概率,从而给短视频水印检测提供更高的检测准确率和更小的定位误差。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1附图为本发明提供的一种短视频水印检测方法的方法流程示意图;
图2附图为本发明实施例中yolov3模型的网络结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种短视频水印检测方法,参见附图1,该方法包括以下步骤:
S1:预先标注出每张图中所有的水印及其坐标信息,利用上述预先标注的数据,训练yolov3模型和n个sigmoid二分类模型;
S2:对视频进行截帧,用训练好的yolov3模型预测每一帧视频中含有目标水印的概率;
S3:分别将每一帧视频中含有目标水印的概率与预先设定的概率阈值进行比对;
若当前帧视频中含有目标水印的概率大于预先设定的概率阈值,则判定当前帧视频中含有目标水印,直接进行步骤S5;
若当前帧视频中含有目标水印的概率小于预先设定的概率阈值,则初步判定当前帧视频中不含有目标水印,进行步骤S4;
S4:将初步判定不含有目标水印的每一帧视频分别输入到训练好的n个sigmoid二分类模型,进一步判定初步判定不含有目标水印的每一帧视频是否含有目标水印;
S5:输出目标水印。
在一个具体的实施例中,步骤S2中对视频进行截帧时,截取的视频帧数范围为5-10。
在一个具体的实施例中,参见附图2,为yolov3模型的网络结构示意图,相比与传统的目标检测算法rcnn系列,yolov3抛弃了region_proposal,是一个完全端到端的网络,将物体检测和识别到统一到一个回归任务里,便于优化求解。yolov3模型中的损失函数为:
Figure BDA0002092350340000051
其中,第一行是bounding_box坐标误差;第二行是bounding_box的宽高误差,通过加大小物体检测错误的惩罚,提高小物体检测准确率;第三行是IOU误差;第四行是分类误差;
式中,S2表示网格的数量;B表示每个网格输出的bounding_box的数量;
Figure BDA0002092350340000052
表示一个指示变量,标识第i个网格的第j个变量是否负责这个物体的预测;xi,yi,wi,hi表示训练样本中标注的bounding_box的坐标和宽高;
Figure BDA0002092350340000053
表示预测的bounding_box的坐标和宽高;Ci表示训练集中标注的类别;
Figure BDA0002092350340000054
表示预测的类别;pi(c)表示第i个网格负责预测的物体类别是c的概率;
Figure BDA0002092350340000061
表示第i个网格预测的物体类别是c的概率。
相比于传统的算法,yolov3算法对水印的大小、角度、色彩等不敏感,同时泛化性能特别好。
在一个具体的实施例中,步骤S2中用训练好的yolov3模型预测每一帧视频中含有目标水印的概率时,输出值为:
[<n1,p1,(x1,y1,w1,h1)>,<n2,p2,(x2,y2,w2,h2)>,...,<ni,pi,(xi,yi,wi,hi)>,...,<nn,pn,(xn,yn,wn,hn)>]
式中,ni表示目标水印,pi表示概率第i帧视频中含有目标水印ni的概率,(xi,yi,wi,hi)表示目标水印ni的位置。
下面对上述实施例中提到的部分术语做具体解释说明:
yolov3是一种目标检测算法,用户检测一张图片中的某些物体及其位置
Sigmoid是一个在生物学中常见的S型函数,也称为S型生长曲线。在信息科学中,由于其单增以及反函数单增等性质,Sigmoid函数常被用作神经网络的阈值函数,将变量映射到0,1之间。
rcnn是Region-convolutional neural network(区域卷积神经网络)的缩写,表示一种目标检测算法。
region_proposal表示可能存在物体的一片区域。
bounding_box表示圈出一个物体的虚拟的矩形方框。
水印:视频中肉眼可见的标识视频版权微缩图片
IOU表示物体检测中预测区域和标注区域之间重叠部分的面积占比。
本发明实施例公开了一种短视频水印检测方法,该方法充分考虑到短视频水印位置集中和水印面试较小的特点,利用yolov3模型和sigmoid二分类模型来预测每一帧视频中含有目标水印的概率,由于动态水印的存在,截帧往往截不到水印的完整图,所以检测结果不够准确,所以我们设计了一个方案,结合连续帧的检测结果来提高预测置信度。本发明提供的方法利用训练好的sigmoid二分类模型对概率低的目标水印进行进一步判定,从而提高了概率低的水印的预测准确率,给短视频水印检测提供更准确的检测准确率和更小的定位误差。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (4)

1.一种短视频水印检测方法,其特征在于,包括以下步骤:
步骤1:预先标注出每张图中所有的水印及其坐标信息,利用预先标注的数据,训练yolov3模型和n个sigmoid二分类模型;
步骤2:对视频进行截帧,用训练好的yolov3模型预测每一帧视频中含有目标水印的概率;
步骤3:分别将每一帧视频中含有目标水印的概率与预先设定的概率阈值进行比对;
若当前帧视频中含有目标水印的概率大于预先设定的概率阈值,则判定当前帧视频中含有目标水印,直接进行步骤5;
若当前帧视频中含有目标水印的概率小于预先设定的概率阈值,则初步判定当前帧视频中不含有目标水印,进行步骤4;
步骤4:将初步判定不含有目标水印的每一帧视频分别输入到训练好的n个sigmoid二分类模型,进一步判定初步判定不含有目标水印的每一帧视频是否含有目标水印;
步骤5:输出目标水印。
2.根据权利要求1所述的一种短视频水印检测方法,其特征在于,步骤2中对视频进行截帧时,截取的视频帧数范围为5-10。
3.根据权利要求1所述的一种短视频水印检测方法,其特征在于,yolov3模型中的损失函数为:
Figure FDA0002092350330000011
其中,第一行是bounding_box坐标误差;第二行是bounding_box的宽高误差,通过加大小物体检测错误的惩罚,提高小物体检测准确率;第三行是IOU误差;第四行是分类误差;
式中,S2表示网格的数量;B表示每个网格输出的bounding_box的数量;
Figure FDA0002092350330000021
表示一个指示变量,标识第i个网格的第j个变量是否负责这个物体的预测;xi,yi,wi,hi表示训练样本中标注的bounding_box的坐标和宽高;
Figure FDA0002092350330000022
表示预测的bounding_box的坐标和宽高;Ci表示训练集中标注的类别;
Figure FDA0002092350330000023
表示预测的类别;pi(c)表示第i个网格负责预测的物体类别是c的概率;
Figure FDA0002092350330000024
表示第i个网格预测的物体类别是c的概率。
4.根据权利要求1所述的一种短视频水印检测方法,其特征在于,步骤2中用训练好的yolov3模型预测每一帧视频中含有目标水印的概率时,输出值为:
[<n1,p1,(x1,y1,w1,h1)>,<n2,p2,(x2,y2,w2,h2)>,...,<ni,pi,(xi,yi,wi,hi)>,...,<nn,pn,(xn,yn,wn,hn)>]
式中,ni表示目标水印,pi表示概率第i帧视频中含有目标水印ni的概率,(xi,yi,wi,hi)表示目标水印ni的位置。
CN201910507617.5A 2019-06-12 2019-06-12 一种短视频水印检测方法 Active CN110349070B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910507617.5A CN110349070B (zh) 2019-06-12 2019-06-12 一种短视频水印检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910507617.5A CN110349070B (zh) 2019-06-12 2019-06-12 一种短视频水印检测方法

Publications (2)

Publication Number Publication Date
CN110349070A CN110349070A (zh) 2019-10-18
CN110349070B true CN110349070B (zh) 2022-12-16

Family

ID=68181895

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910507617.5A Active CN110349070B (zh) 2019-06-12 2019-06-12 一种短视频水印检测方法

Country Status (1)

Country Link
CN (1) CN110349070B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110798750B (zh) * 2019-11-29 2021-06-29 广州市百果园信息技术有限公司 视频水印去除方法、视频数据发布方法及相关装置
CN111047496A (zh) * 2019-12-13 2020-04-21 支付宝(杭州)信息技术有限公司 阈值确定方法、水印检测方法、装置和电子设备
CN111340677B (zh) * 2020-02-27 2023-10-27 北京百度网讯科技有限公司 视频水印检测方法、装置、电子设备、计算机可读介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2421133A (en) * 2004-12-09 2006-06-14 Sony Uk Ltd Registering a water marked image by calculating distortion vector estimates
EP2682916A1 (en) * 2012-07-06 2014-01-08 Thomson Licensing Method for watermark decoding
CN109447168A (zh) * 2018-11-05 2019-03-08 江苏德劭信息科技有限公司 一种基于深度特征和视频目标检测的安全帽佩戴检测方法
CN109598231B (zh) * 2018-12-03 2021-03-02 广州市百果园信息技术有限公司 一种视频水印的识别方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN110349070A (zh) 2019-10-18

Similar Documents

Publication Publication Date Title
CN109146892B (zh) 一种基于美学的图像裁剪方法及装置
CN110349070B (zh) 一种短视频水印检测方法
CN107688829A (zh) 一种基于支持向量机的识别系统及识别方法
CN110941999B (zh) 一种人群计数系统中自适应计算高斯核大小的方法
US9025889B2 (en) Method, apparatus and computer program product for providing pattern detection with unknown noise levels
CN111931864B (zh) 基于顶点距离与交并比多重优化目标检测器的方法与系统
CN109697441B (zh) 一种目标检测方法、装置及计算机设备
CN112132206A (zh) 图像识别方法及相关模型的训练方法及相关装置、设备
CN111860494A (zh) 图像目标检测的优化方法、装置、电子设备和存储介质
CN110751606B (zh) 一种基于神经网络算法的泡沫图像处理方法及系统
CN112419202A (zh) 基于大数据及深度学习的野生动物图像自动识别系统
CN112016454A (zh) 一种人脸对齐的检测方法
CN110675396A (zh) 遥感影像云检测方法、装置、设备及计算机可读存储介质
CN110659637A (zh) 一种结合深度神经网络和sift特征的电能表示数与标签自动识别方法
CN117593193B (zh) 一种基于机器学习的钣金图像增强方法及系统
CN109492697B (zh) 图片检测网络训练方法及图片检测网络训练装置
CN113362221A (zh) 用于门禁的人脸识别系统与人脸识别方法
CN115880683B (zh) 一种基于深度学习的城市内涝积水智能水位检测方法
CN109948605B (zh) 一种针对小目标的图片增强方法及装置
CN114283431B (zh) 一种基于可微分二值化的文本检测方法
US20230386023A1 (en) Method for detecting medical images, electronic device, and storage medium
CN111047614A (zh) 一种基于特征提取的复杂场景图像的目标角点提取方法
CN111062388A (zh) 基于深度学习的广告文字的识别方法、系统、介质及设备
CN113486879B (zh) 图像区域建议框检测方法、装置、设备及存储介质
JP2001222683A (ja) 画像処理方法、画像処理装置、文字認識方法、文字認識装置及び記憶媒体

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 22nd floor, block a, Huaxing Times Square, 478 Wensan Road, Xihu District, Hangzhou, Zhejiang 310000

Applicant after: Hangzhou Xiaoying Innovation Technology Co.,Ltd.

Address before: 310000 16th floor, HANGGANG metallurgical technology building, No. 294, Tianmushan Road, Xihu District, Hangzhou City, Zhejiang Province

Applicant before: HANGZHOU QUWEI SCIENCE & TECHNOLOGY Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant