CN105975939B - 视频检测方法和装置 - Google Patents

视频检测方法和装置 Download PDF

Info

Publication number
CN105975939B
CN105975939B CN201610298495.XA CN201610298495A CN105975939B CN 105975939 B CN105975939 B CN 105975939B CN 201610298495 A CN201610298495 A CN 201610298495A CN 105975939 B CN105975939 B CN 105975939B
Authority
CN
China
Prior art keywords
image
detected
video
sample
signature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610298495.XA
Other languages
English (en)
Other versions
CN105975939A (zh
Inventor
申晓雷
宋丙玉
王源
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dulink network technology (Hainan) Co., Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201610298495.XA priority Critical patent/CN105975939B/zh
Publication of CN105975939A publication Critical patent/CN105975939A/zh
Application granted granted Critical
Publication of CN105975939B publication Critical patent/CN105975939B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/48Matching video sequences
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了视频检测方法和装置。所述方法的一具体实施方式包括:从待检测视频中截取图像以形成待检测图像序列;生成待检测图像序列中每个待检测图像的哈希签名;将待检测图像序列中各个待检测图像的哈希签名与从样本视频集合中各个样本视频所提取出的样本图像序列中各个样本图像的哈希签名进行匹配;记录样本图像序列中哈希签名匹配成功的样本图像的图像标识以及哈希签名匹配成功的样本图像所属的视频的视频标识,并统计各个图像标识和各个视频标识的出现次数;将视频标识出现次数大于第一阈值且视频标识所关联的图像标识中不同图像标识的出现次数大于第二阈值的样本视频,确定为待检测视频的同源视频。该实施方式实现了同源视频的自动检测。

Description

视频检测方法和装置
技术领域
本申请涉及计算机技术领域,具体涉及多媒体技术领域,尤其涉及视频检测方法和装置。
背景技术
服务器中存在着大量的视频,其中一些视频可能是相同的内容。查找出内容相同的同源视频有助于发现侵犯版权、涉恐以及涉黄等非法视频并进行封禁处理。此外,发现同源视频还可以用于减少同一资源的多个相同内容的副本,节省存储和带宽。
然而,由于网络中视频的数量越来越多,使得无法单纯靠人工鉴别和标注样本的方式来识别视频。
发明内容
本申请的目的在于提出一种改进的视频检测方法和装置,来解决以上背景技术部分提到的技术问题。
第一方面,本申请提供了一种视频检测方法,所述方法包括:从待检测视频中截取至少一个图像以形成待检测图像序列;生成所述待检测图像序列中每个待检测图像的哈希签名;将所述待检测图像序列中各个待检测图像的哈希签名与从样本视频集合中各个样本视频所提取出的样本图像序列中各个样本图像的哈希签名进行匹配,其中样本视频的视频标识与从该样本视频所提取出的样本图像序列中各个样本图像的图像标识是关联存储的;记录所述样本图像序列中哈希签名匹配成功的样本图像的图像标识以及所述哈希签名匹配成功的样本图像所属的视频的视频标识,并统计各个图像标识和各个视频标识的出现次数;将视频标识出现次数大于第一阈值、且视频标识所关联的图像标识中不同图像标识的出现次数大于第二阈值的样本视频,确定为所述待检测视频的同源视频。
在一些实施例中,所述从待检测视频中截取至少一个图像以形成待检测图像序列,包括:在所述待检测视频中的视频片段中,每隔第一预设帧数截取图像,以形成待检测图像序列。
在一些实施例中,所述视频片段是位于所述待检测视频的中间部分且长度为第一预设时长的视频片段。
在一些实施例中,所述样本图像序列是针对各个样本视频中位于样本视频的中间部分且时长为第二预设时长的视频片段、每隔第二预设帧数截取图像所形成的,其中,所述第二预设时长大于所述第一预设时长且所述第二预设帧数小于所述第一预设帧数。
在一些实施例中,所述生成所述待检测图像序列中每个待检测图像的哈希签名,包括:提取各个待检测图像的全局特征向量,并基于所提取的全局特征向量生成哈希签名。
在一些实施例中,在所述提取各个待检测图像的全局特征向量,并基于所提取的全局特征向量生成哈希签名之前,所述生成所述图像序列中每个图像的哈希签名还包括以下一项或多项:将待检测图像从三通道图像转换为单通道图像;对待检测图像进行腐蚀以弱化待检测图像中的字幕;去除待检测图像的黑边。
在一些实施例中,所述提取各个待检测图像的全局特征向量,并基于所提取的全局特征向量生成哈希签名,包括:将待测试图像均匀分块,计算所分成的分块的整体灰度均值以及各个块各自的灰度均值;根据各个块各自的灰度均值与所述整体灰度均值的大小关系,生成与各个块对应的二进制位,以形成哈希签名。
在一些实施例中,所述提取各个待检测图像的全局特征向量,并基于所提取的全局特征向量生成哈希签名,包括:对待测试图像放缩为行数与列数均为8的整数倍的图像;将已放缩图像均匀分成行数与列数均为8的块;计算每个块的DCT(Discrete CosineTransform,离散余弦变换)系数并量化;将每个已量化DCT系数中的前8位作为一行生成矩阵;对于所述矩阵的每个列,计算列中元素的均值并根据列中每个元素的数值与该均值的大小关系生成与各个元素对应的二进制位,以形成哈希签名。
在一些实施例中,所述提取各个待检测图像的全局特征向量,并基于所提取的全局特征向量生成哈希签名,包括:将待测试图像均匀分块,计算所分成的分块的整体灰度均值以及各个块各自的灰度均值,根据各个块各自的灰度均值与所述整体灰度均值的大小关系,生成与各个块对应的二进制位,以形成待生成哈希签名的第一部分;对待测试图像放缩为行数与列数均为8的整数倍的图像;将已放缩图像均匀分成行数与列数均为8的块;计算每个块的DCT系数并量化;将每个已量化DCT系数中进行排序后的前8个作为矩阵的各行生成矩阵;对于所述矩阵的每个列,计算列中元素的均值并根据列中每个元素的数值与该均值的大小关系生成与各个元素对应的二进制位,以形成待生成哈希签名的第二部分;基于所述第一部分和所述第二部分生成哈希签名。
在一些实施例中,在所述将所述待检测图像序列中各个待检测图像的哈希签名与从样本视频集合中各个样本视频所提取出的样本图像序列中各个样本图像的哈希签名进行匹配之前,所述方法还包括:基于所述待检测图像序列中各个待检测图像的哈希签名对所述待检测图像序列中的待检测图像进行去重处理。
在一些实施例中,所述将所述待检测图像序列中各个待检测图像的哈希签名与从样本视频集合中各个样本视频所提取出的样本图像序列中各个样本图像的哈希签名进行匹配,包括:依次计算所述样本图像序列中各个样本图像的哈希签名将与该图像的哈希签名的汉明距离,并将汉明距离不大于预设汉明距离阈值的哈希签名所对应的样本图像确定为匹配成功的样本图像。
在一些实施例中,所述依次计算所述样本图像序列中各个样本图像的哈希签名将与该图像的哈希签名的汉明距离,并将汉明距离不大于预设汉明距离阈值k的哈希签名所对应的样本图像确定为匹配成功的样本图像,包括:将待测试图像的哈希签名按位数平均分成m块后从中选择n块作为查询用子签名,其中n≤m-k;确定预先建立的子签名索引中与所述查询用子签名相同的子签名,其中所述子签名索引的各个子签名是对样本图像序列中各个样本图像的哈希签名平均分成m块后、将每n块提取出来而形成的,且各个子签名与所对应的样本图像是关联的;对于与所述查询用子签名相同的各个子签名,计算子签名所关联的样本图像的哈希签名中除子签名外的其他m-n块与待检测图像的哈希签名中除查询用子签名外的其他m-n块之间的汉明距离;将汉明距离不大于预设汉明距离阈值k的哈希签名所对应的样本图像确定为匹配成功的样本图像。
在本实施例的一些可选实现方式中,所述样本图像序列中各个样本图像的哈希签名以及待测试图像序列中各个待测试图像的哈希签名均为64位,k=4,m=6,n=2。
第二方面,本申请提供了一种视频检测装置,所述装置包括:截取单元,用于从待检测视频中截取至少一个图像以形成待检测图像序列;生成单元,用于生成所述待检测图像序列中每个待检测图像的哈希签名;匹配单元,用于将所述待检测图像序列中各个待检测图像的哈希签名与从样本视频集合中各个样本视频所提取出的样本图像序列中各个样本图像的哈希签名进行匹配,其中样本视频的视频标识与从该样本视频所提取出的样本图像序列中各个样本图像的图像标识是关联存储的;记录单元,用于记录所述样本图像序列中哈希签名匹配成功的样本图像的图像标识以及所述哈希签名匹配成功的样本图像所属的视频的视频标识,并统计各个图像标识和各个视频标识的出现次数;确定单元,用于将视频标识出现次数大于第一阈值、且视频标识所关联的图像标识中不同图像标识的出现次数大于第二阈值的样本视频,确定为所述待检测视频的同源视频。
在一些实施例中,所述截取单元进一步用于:在所述待检测视频中的视频片段中,每隔第一预设帧数截取图像,以形成待检测图像序列。
在一些实施例中,所述视频片段是位于所述待检测视频的中间部分且长度为第一预设时长的视频片段。
在一些实施例中,所述样本图像序列是针对各个样本视频中位于样本视频的中间部分且时长为第二预设时长的视频片段、每隔第二预设帧数截取图像所形成的,其中,所述第二预设时长大于所述第一预设时长且所述第二预设帧数小于所述第一预设帧数。
在一些实施例中,所述生成单元包括:生成子单元,用于提取各个待检测图像的全局特征向量,并基于所提取的全局特征向量生成哈希签名。
在一些实施例中,所述生成单元还包括以下一项或多项:转换子单元,用于在所述提取各个待检测图像的全局特征向量,并基于所提取的全局特征向量生成哈希签名之前,将待检测图像从三通道图像转换为单通道图像;腐蚀单元,用于在所述提取各个待检测图像的全局特征向量,并基于所提取的全局特征向量生成哈希签名之前,对待检测图像进行腐蚀以弱化待检测图像中的字幕;去黑边单元,用于在所述提取各个待检测图像的全局特征向量,并基于所提取的全局特征向量生成哈希签名之前,去除待检测图像的黑边。
在一些实施例中,所述生成子单元进一步用于:将待测试图像均匀分块,计算所分成的分块的整体灰度均值以及各个块各自的灰度均值;根据各个块各自的灰度均值与所述整体灰度均值的大小关系,生成与各个块对应的二进制位,以形成哈希签名。
在一些实施例中,所述生成子单元进一步用于:对待测试图像放缩为行数与列数均为8的整数倍的图像;将已放缩图像均匀分成行数与列数均为8的块;计算每个块的DCT系数并量化;将每个已量化DCT系数中的前8位作为一行生成矩阵;对于所述矩阵的每个列,计算列中元素的均值并根据列中每个元素的数值与该均值的大小关系生成与各个元素对应的二进制位,以形成哈希签名。
在一些实施例中,所述生成子单元进一步用于:将待测试图像均匀分块,计算所分成的分块的整体灰度均值以及各个块各自的灰度均值,根据各个块各自的灰度均值与所述整体灰度均值的大小关系,生成与各个块对应的二进制位,以形成待生成哈希签名的第一部分;对待测试图像放缩为行数与列数均为8的整数倍的图像;将已放缩图像均匀分成行数与列数均为8的块;计算每个块的DCT系数并量化;将每个已量化DCT系数中进行排序后的前8个作为矩阵的各行生成矩阵;对于所述矩阵的每个列,计算列中元素的均值并根据列中每个元素的数值与该均值的大小关系生成与各个元素对应的二进制位,以形成待生成哈希签名的第一部分;基于所述第一部分和所述第二部分生成哈希签名。
在一些实施例中,所述装置还包括:去重单元,用于在所述将所述待检测图像序列中各个待检测图像的哈希签名与从样本视频集合中各个样本视频所提取出的样本图像序列中各个样本图像的哈希签名进行匹配之前,基于所述待检测图像序列中各个待检测图像的哈希签名对所述待检测图像序列中的待检测图像进行去重处理。
在一些实施例中,所述匹配单元,进一步用于:依次计算所述样本图像序列中各个样本图像的哈希签名将与该图像的哈希签名的汉明距离,并将汉明距离不大于预设汉明距离阈值的哈希签名所对应的样本图像确定为匹配成功的样本图像。
在一些实施例中,所述匹配单元进一步用于:将待测试图像的哈希签名按位数平均分成m块后从中选择n块作为查询用子签名,其中n≤m-k;确定预先建立的子签名索引中与所述查询用子签名相同的子签名,其中所述子签名索引的各个子签名是对样本图像序列中各个样本图像的哈希签名平均分成m块后、将每n块提取出来而形成的,且各个子签名与所对应的样本图像是关联的;对于与所述查询用子签名相同的各个子签名,计算子签名所关联的样本图像的哈希签名中除子签名外的其他m-n块与待检测图像的哈希签名中除查询用子签名外的其他m-n块之间的汉明距离;将汉明距离不大于预设汉明距离阈值k的哈希签名所对应的样本图像确定为匹配成功的样本图像。
在一些实施例中,所述样本图像序列中各个样本图像的哈希签名以及待测试图像序列中各个待测试图像的哈希签名均为64位,k=4,m=6,n=2。
本申请提供的视频检测方法和装置,通过对待检测视频与样本视频中所截取的图像的哈希签名进行匹配,并根据匹配成功的次数确定出同源视频,实现了同源视频的自动检测。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请可以应用于其中的示例性系统架构图;
图2是根据本申请的视频检测方法的一个实施例的流程图;
图3是根据本申请的视频检测方法的又一个实施例的流程图;
图4是根据本申请的视频检测装置的一个实施例的结构示意图;
图5是适于用来实现本申请实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的视频检测方法或视频检测装置的实施例的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如网页浏览器应用、网盘应用、视频网站应用等。
终端设备101、102、103可以是具有显示屏并且支持视频播放的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture ExpertsGroup Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving PictureExperts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上播放的视频提供支持的后台服务器。后台服务器可以对接收到的视频请求等数据进行分析等处理,并将处理结果(例如所请求的视频数据)反馈给终端设备。
需要说明的是,本申请实施例所提供的视频检测方法一般由服务器105执行,相应地,视频检测装置一般设置于服务器105中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本申请的视频检测方法的一个实施例的流程200。所述的视频检测方法,包括以下步骤:
步骤201,从待检测视频中截取至少一个图像以形成待检测图像序列。
在本实施例中,视频检测方法运行于其上的电子设备(例如图1所示的服务器)可以首先从本地或通过有线连接方式或者无线连接方式从其他服务器或终端设备获取待检测视频。之后,电子设备可以对该待检测视频的部分或全部按帧进行截取,从而截取到至少一个图像,所截取的图像形成待检测图像序列。
需要指出的是,上述无线连接方式可以包括但不限于3G/4G连接、WiFi连接、蓝牙连接、WiMAX连接、Zigbee连接、UWB(ultra wideband)连接、以及其他现在已知或将来开发的无线连接方式。
步骤202,生成待检测图像序列中每个待检测图像的哈希签名。
在本实施例中,基于步骤201中得到的待检测图像序列,上述电子设备(例如图1所示的服务器)可以对每个待检测图像提取特征数据,在对特征数据进行处理生成每个待检测图像的哈希签名。
在本实施例的一些可选实现方式中,步骤202中生成待检测图像的哈希签名可以包括:提取各个待检测图像的全局特征向量,并基于所提取的全局特征向量生成哈希签名。
在本实施例的一些可选实现方式中,提取各个待检测图像的全局特征向量,并基于所提取的全局特征向量生成哈希签名,包括:将待测试图像均匀分块,计算所分成的分块的整体灰度均值以及各个块各自的灰度均值;根据各个块各自的灰度均值与整体灰度均值的大小关系,生成与各个块对应的二进制位,以形成哈希签名。在该实现方式中,均值方法在提取图像全局特征对图像降质、整体亮度与色度变化等过程中有较强的鲁棒性。
在本实施例的一些可选实现方式中,提取各个待检测图像的全局特征向量,并基于所提取的全局特征向量生成哈希签名,包括:对待测试图像放缩为行数与列数均为8的整数倍的图像;将已放缩图像均匀分成行数与列数均为8的块;计算每个块的DCT系数并量化;将每个已量化DCT系数中的前8位作为一行生成矩阵;对于矩阵的每个列,计算列中元素的均值并根据列中每个元素的数值与该均值的大小关系生成与各个元素对应的二进制位,以形成哈希签名。该方式中,DCT方法在提取全局特征时对图像内容变形、水印与标志的添加、一般性的滤镜、边界内容丢失等过程有较强的鲁棒性。
在本实施例的一些可选实现方式中,取各个待检测图像的全局特征向量,并基于所提取的全局特征向量生成哈希签名,可以通过以下方式执行:
首先,将待测试图像均匀分块,计算所分成的分块的整体灰度均值以及各个块各自的灰度均值,根据各个块各自的灰度均值与整体灰度均值的大小关系,生成与各个块对应的二进制位,以形成待生成哈希签名的第一部分。具体的,可以将要处理的图像拷贝一份,再将图像均匀分成8×8块图像的一个拷贝均匀分成8×8块,去除上下边界上的块,计算中间6×8块的整体灰度均值以及每块的灰度均值,用每块的均值与整体均值做比较,量化为48bit(位)整数。在执行该步骤之前,还可以预先去除上下边界上的块。因为图像内部块颜色的连续性要好于边界上去除黑边不彻底的块,可以使提取的全局特征和获取的哈希签名更稳定。
之后,对待测试图像放缩为行数与列数均为8的整数倍的图像;将已放缩图像均匀分成行数与列数均为8的块;计算每个块的DCT系数并量化;将每个已量化DCT系数中进行排序后的前8个作为矩阵的各行生成矩阵;对于矩阵的每个列,计算列中元素的均值并根据列中每个元素的数值与该均值的大小关系生成与各个元素对应的二进制位,以形成待生成哈希签名的第二部分。具体的,可以首先将上述步骤得到的图像拷贝放缩到16×16大小,并分成大小为8×8的四块,计算每块的DCT系数,DCT系数矩阵中的第一个(第一行第一列)系数是直流(DC)系数,对应的是均值信息,其他系数称为交流(AC)系数;再对各块的DCT系数都按“Z”排序,从低频到高频渐变,选取各块排序后的DCT系数矩阵的第2,3,4,5个低频系数并量化,构成4×4矩阵,每列对应的是不同块的同位置低频系数,按列求均值,每列元素与相应列均值比较,量化为16bit整数。在图像哈希签名中,既要考虑签名的区别性又要考虑其鲁棒性,在DCT系数中,高频系数选的越多,则图像的区别性越强,高频系数选的越少,则图像的鲁棒性越强。上述过程可以在区别性和鲁棒性之间取得较好的平衡。
最后,基于第一部分和第二部分生成哈希签名。例如,将前述过程中得到的48bit的整数与16bit的整数结合,得到共64bit的整数,即可作为哈希签名。
该实现方式,结合均值与DCT方法提取全局特征的方法保留了各自优点,增强了所生成的哈希签名的鲁棒性。
在本实施例的一些可选实现方式中,在提取各个待检测图像的全局特征向量,并基于所提取的全局特征向量生成哈希签名之前,步骤202还可以包括以下步骤中的一项或多项:将待检测图像从三通道图像转换为单通道图像;对待检测图像进行腐蚀以弱化待检测图像中的字幕;去除待检测图像的黑边。
在该实现方式中,将待检测图像从三通道图像转换为单通道图像。即,可以将图像统一转换成灰度图以进行后续处理,可以减少后续处理的数据量,有利于降低处理复杂度以及提高处理效率。
在该实现方式中,对待检测图像进行腐蚀以弱化待检测图像中的字幕,具体可以通过如下方式执行:用矩形核对图像进行腐蚀操作,弱化字幕。矩形核宽高取为1/40倍图像宽、1/40倍图像高,并且不超过9像素。腐蚀操作时可以利用形态学上的腐蚀算法对图像进行处理。腐蚀核如果太大,有可能会将图像中实际内容部分的细节腐蚀掉,该细节所处的行或列有可能会被误判成黑边。
对黑边区域有字幕的视频,对图像进行腐蚀操作,细化了文字,降低了黑边区域内的杂点比例,在去黑边操作时使得该区域更容易去除,而腐蚀操作对其他区域去黑边并无影响。
在该实现方式中,去除待检测图像的黑边,具体可以通过如下方式执行:从上下两个边界同时逐行向内扫描图像、从左右两个边界同时逐列向内扫描图像,分别计算每条线的灰度直方图,用线直方图峰值对应的像素点个数与阈值比较来判断该线是否为黑边,上下往内扫描时直到有一条判断为非黑边则停止扫描,左右往内扫描时直到有一条判断为非黑边则停止扫描,截取扫描终止时的上下左右边界内的图像内容为新图像。本发明中指的黑边是广义的黑边,具体是指某单一颜色。有黑边的影视图像,黑边区域是上下对称、左右对称的,扫描时上下若不同时往内扫、左右不同时往内扫,则上下两侧去除的区域大小不一致、左右两侧去除的区域大小不一致,这就造成全局特征的提取和哈希签名的获取和在图像实际内容区域内操作时相比存在偏差。如果上下同时扫描、左右同时扫描,上下两行、左右两列必须同时满足去除黑边的条件时,扫描才会终止,按这种方式扫描完成后,新的图像即使还存在黑边,黑边区域仍然还是对称的,上述所述的偏差将会降低很多。采用去黑边操作,可以保留下的是实际的图像内容,对无黑边的同源视频,去黑边操作对其实际影响并不大,保留下来的是同样的图像内容。去黑边操作增强了同源视频的图像哈希签名的稳定性。
需要说明的是,在对待检测图像作上述处理时,样本图像序列中的各个图像也进行相应的处理,以保证图像匹配时的准确度。
步骤203,将待检测图像序列中各个待检测图像的哈希签名与从样本视频集合中各个样本视频所提取出的样本图像序列中各个样本图像的哈希签名进行匹配。
在本实施例中,电子设备可以将待检测图像序列中各个待检测图像的哈希签名与从样本视频集合中各个样本视频所提取出的样本图像序列中各个样本图像的哈希签名进行匹配。其中,其中样本视频的视频标识与从该样本视频所提取出的样本图像序列中各个样本图像的图像标识是关联存储的。其中,样本视频集合是预先存储的,其包含的各个样本视频用于与待检测视频进行比对,以判断待检测视频是否与其中的一个样本视频为同源视频。
在本实施例的一些可选实现方式中,步骤203具体包括依次计算样本图像序列中各个样本图像的哈希签名将与该图像的哈希签名的汉明距离,并将汉明距离不大于预设汉明距离阈值的哈希签名所对应的样本图像确定为匹配成功的样本图像。在对图像进行匹配时,通常是提取不同图像中分块均值的全局特征后并将向量归一化,之后计算两个特征向量的欧式距离。该实现方式中,获取哈希签名的过程,是图像特征损失的过程。但从实验测算中可以得出,在汉明空间比较哈希签名,仍基本保持了在欧式空间中相同的相似性与不相似性,提取哈希签名的方法是局部敏感的。但是,哈希签名之间的汉明距离计算图像之间的匹配度,计算简单,因此操作速度快,且哈希签名占用的存储空间较小,因此有利于提高处理效率。
步骤204,记录样本图像序列中哈希签名匹配成功的样本图像的图像标识以及哈希签名匹配成功的样本图像所属的视频的视频标识,并统计各个图像标识和各个视频标识的出现次数。
在本实施例中,在通过步骤203进行匹配时,电子设备可以对样本图像序列中哈希签名匹配成功的样本图像的图像标识进行记录,同时,还对这些匹配成功的样本图像所属的视频的视频标识进行记录,并对各个图像标识和各个视频标识的出现次数进行统计。
步骤205,将视频标识出现次数大于第一阈值、且视频标识所关联的图像标识中不同图像标识的出现次数大于第二阈值的样本视频,确定为待检测视频的同源视频。
在本实施例中,基于步骤204中的统计结果,电子设备可以对各个样本视频对应的视频标识的出现次数与第一阈值进行比较。同时,电子设备还可以将各个样本视频的视频标识所关联的图像标识中不同图像标识的出现次数与第二阈值进行比较。当某一样本视频的视频的视频标识的出现次数大于第一阈值,且该样本视频的视频标识所关联的图像标识中不同图像标识的出现次数大于第二阈值时,将该样本视频确定为待检测视频的同源视频。
在本实施例的一些可选实现方式中,在步骤204之前,上述视频检测方法还包括:基于待检测图像序列中各个待检测图像的哈希签名对待检测图像序列中的待检测图像进行去重处理。在本实施例中,电子设备可以将哈希签名的多个图像进行去重处理,以减小后续处理的数据量。需要说明的是,样本图像序列中的各个图像也可以基于哈希签名进行去重处理。
在本实施例的一些可选实现方式中,步骤201可以是在待检测视频中的视频片段中,每隔第一预设帧数截取图像,以形成待测试图像序列。在该实现方式中,电子设备可以先从待检测视频选择需要提取的视频片段,并在选中的视频片段中每隔第一预设帧数均匀截取图像。
在本实施例的一些可选实现方式中,上述视频片段可以是位于待检测视频的中间部分且长度为第一预设时长的视频片段。在本实施例中,可以采用待检测视频的中间部分作为采集图像的视频片段。通常,上述第一预设时长的设置,可以避免将待检测视频开头或结尾的部分作为图像截取的来源,从而避免同源视频仅由于视频开头和结尾的不同而无法被检测出来。
在本实施例的一些可选实现方式中,样本图像序列是针对各个样本视频中位于样本视频的中间部分且时长为第二预设时长的视频片段、每隔第二预设帧数截取图像所形成的。其中,该第二预设时长大于第一预设时长且第二预设帧数小于第一预设帧数。例如,对于样本视频,可以从正中间部分截取10分钟,每隔10帧密集截取获得样本图像序列,计算每个图像的哈希签名,并记录下视频序号和图像序号。对于待检测视频,可以从正中间部分截取5分钟,每隔100帧稀疏截取获得图像序列。在该实现方式中,对样本视频的图像截取为密集截取,对待检测视频的图像截取为稀疏截取,且样本视频中图像截取的视频片段比待检测视频中图像截取的视频片段时间更长,从而能最大程度保障从待检测视频中截取的图像都能在从样本视频截取出的样本图像序列中匹配到,保证后续检测的准确度。
在上述实施例中,本通过对待检测视频与样本视频中所截取的图像的哈希签名进行匹配,并根据匹配成功的次数确定出同源视频,实现了同源视频的自动检测。本实施例的方案可广泛应用于认证、内容索引、版权视频检索、暴恐视频检索、大规模数据库管理、拷贝检测以及其他相关的视频处理领域。
进一步参考图3,其示出了视频检测方法的又一个实施例的流程300。该视频检测方法的流程300,包括以下步骤:
步骤301,从待检测视频中截取至少一个图像以形成待检测图像序列。
在本实施例中,步骤301的处理可以参考图2对应实施例中的步骤201,这里不再赘述。
步骤302,生成待检测图像序列中每个待检测图像的哈希签名。
在本实施例中,步骤301的处理可以参考图2对应实施例中的步骤201,这里不再赘述。
步骤303,将待测试图像的哈希签名按位数平均分成m块后从中选择n块作为查询用子签名。
在本实施例中,对于步骤302中各个待检测图像的哈希签名,电子设备可以将哈希签名平均分成m块。其中,m>k,其中可为预设的汉明距离阈值,将在步骤306中使用。对于所分成的m块,电子设备可以从中选择n块作为后续查询过程中用于与各个索引中子签名进行匹配的查询用子签名。其中,n≤m-k。因此,单个哈希签名对应有的查询用子签名的数量是
Figure BDA0000983430760000141
个。
步骤304,确定预先建立的子签名索引中与查询用子签名相同的子签名。
在本实施例中,电子设备可以使用上述查询用子签名预先建立的子签名索引中进行查询。其中,子签名索引中的各个子签名是对样本图像序列中各个样本图像的哈希签名平均分成m块后、将每n块提取出来而形成的,因此该子签名索引中的索引数量也可以是
Figure BDA0000983430760000151
个。
其中,子签名索引的中各个子签名与所对应的样本图像是关联的。在查询时,可以将待查询子签名与相同组合的子签名进行查询。最终,可以确定子签名索引中与查询用子签名相同的子签名。
步骤305,对于与查询用子签名相同的各个子签名,计算子签名关联的样本图像的哈希签名中除子签名外的其他m-n块与待检测图像的哈希签名中除查询用子签名外的其他m-n块之间的汉明距离。
在本实施例中,在基于步骤304查询到与查询用子签名相同的各个子签名后,电子设备可以对样本图像的哈希签名以及待检测图像的哈希签名中除子签名外的其他m-n块形成的数位进行比对,计算两者之间的汉明距离。
步骤306,将汉明距离不大于预设汉明距离阈值k的哈希签名所对应的样本图像确定为匹配成功的样本图像。
在本实施例中,对于步骤305中所计算的各个汉明距离,电子设备将汉明距离不大于预设汉明距离阈值k的哈希签名所对应的样本图像作为匹配成功的图像。其中,对于汉明距离阈值k,汉明距离不大于k的两个哈希签名之间不同的数位最多在m块中的k个块中各有一个分布,因此在m块中两个哈希签名至少在m-k个块上完全一致。因此,将m块中任意n块组合进行结合所形成的各个子签名用来建立索引,可以以保证在用于匹配的各个索引所关联的所有哈希签名中可以囊括所有与待检测图像的哈希签名的汉明距离不大于k的哈希签名。可选的,可以将n设置为n=m-k。
步骤307,记录样本图像序列中哈希签名匹配成功的样本图像的图像标识以及哈希签名匹配成功的样本图像所属的视频的视频标识,并统计各个图像标识和各个视频标识的出现次数。
在本实施例中,步骤307的具体处理可以参考图2对应实施例的步骤204,这里不再赘述。
步骤308,将视频标识出现次数大于第一阈值、且视频标识所关联的图像标识中不同图像标识的出现次数大于第二阈值的样本视频,确定为待检测视频的同源视频。
在本实施例中,步骤308的具体处理可以参考图2对应图实施例的步骤205,这里不再赘述。
在本实施例的一些可选实现方式中,上述样本图像序列中各个样本图像的哈希签名以及待测试图像序列中各个待测试图像的哈希签名均为64位,k=4,m=6,n=2。
从图3中可以看出,与图2对应的实施例相比,本实施例中的视频检测方法的流程300在匹配待检测图像序列中图像的哈希签名和样本图相同序列中图像的哈希签名时,使用通过子签名建立的索引进行查询。若任选n块所得到的哈希子签名的位的最小值为min,则对每个图像每个索引下理论上最多线性查询264-min次就能查询到最多在k个位上不同的相似图像。这种查询方式显著地增加了查询速度,且该查询方案不会丢失匹配的图像,从而提高了整体的处理效率。
进一步参考图4,作为对上述各图所示方法的实现,本申请提供了一种视频检测装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种服务器中。
如图4所示,本实施例所述的视频检测装置400包括:截取单元401、生成单元402、匹配单元403、记录单元404和确定单元405。其中,截取单元401用于从待检测视频中截取至少一个图像以形成待检测图像序列;生成单元402用于生成待检测图像序列中每个待检测图像的哈希签名;匹配单元403用于将待检测图像序列中各个待检测图像的哈希签名与从样本视频集合中各个样本视频所提取出的样本图像序列中各个样本图像的哈希签名进行匹配,其中样本视频的视频标识与从该样本视频所提取出的样本图像序列中各个样本图像的图像标识是关联存储的;记录单元404用于记录样本图像序列中哈希签名匹配成功的样本图像的图像标识以及哈希签名匹配成功的样本图像所属的视频的视频标识,并统计各个图像标识和各个视频标识的出现次数;而确定单元405,用于将视频标识出现次数大于第一阈值、且视频标识所关联的图像标识中不同图像标识的出现次数大于第二阈值的样本视频,确定为待检测视频的同源视频。
在本实施例中,视频检测装置400的截取单元401、生成单元402、匹配单元403、记录单元404和确定单元405的具体处理可以参考图2对应实施例的步骤201、步骤202、步骤203、步骤204和步骤205,这里不再赘述。
在本实施例的一些可选实现方式中,截取单元401进一步用于:在待检测视频中的视频片段中,每隔第一预设帧数截取图像,以形成待检测图像序列。该实现方式中的具体处理可以参考图2对应实施例中相应的实现方式。
在本实施例的一些可选实现方式中,上述视频片段是位于待检测视频的中间部分且长度为第一预设时长的视频片段。该实现方式中的具体处理可以参考图2对应实施例中相应的实现方式。
在本实施例的一些可选实现方式中,上述样本图像序列是针对各个样本视频中位于样本视频的中间部分且时长为第二预设时长的视频片段、每隔第二预设帧数截取图像所形成的,其中,第二预设时长大于第一预设时长且第二预设帧数小于第一预设帧数。该实现方式中的具体处理可以参考图2对应实施例中相应的实现方式。
在本实施例的一些可选实现方式中,生成单元402包括:生成子单元(未示出),用于提取各个待检测图像的全局特征向量,并基于所提取的全局特征向量生成哈希签名。该实现方式中的具体处理可以参考图2对应实施例中相应的实现方式。
在本实施例的一些可选实现方式中,生成单元402还包括以下一项或多项:转换子单元(未示出),用于在提取各个待检测图像的全局特征向量,并基于所提取的全局特征向量生成哈希签名之前,将待检测图像从三通道图像转换为单通道图像;腐蚀单元(未示出),用于在提取各个待检测图像的全局特征向量,并基于所提取的全局特征向量生成哈希签名之前,对待检测图像进行腐蚀以弱化待检测图像中的字幕;去黑边单元(未示出),用于在提取各个待检测图像的全局特征向量,并基于所提取的全局特征向量生成哈希签名之前,去除待检测图像的黑边。该实现方式中的具体处理可以参考图2对应实施例中相应的实现方式。
在本实施例的一些可选实现方式中,生成子单元进一步用于:将待测试图像均匀分块,计算所分成的分块的整体灰度均值以及各个块各自的灰度均值;根据各个块各自的灰度均值与整体灰度均值的大小关系,生成与各个块对应的二进制位,以形成哈希签名。该实现方式中的具体处理可以参考图2对应实施例中相应的实现方式。
在本实施例的一些可选实现方式中,生成子单元进一步用于:对待测试图像放缩为行数与列数均为8的整数倍的图像;将已放缩图像均匀分成行数与列数均为8的块;计算每个块的DCT系数并量化;将每个已量化DCT系数中的前8位作为一行生成矩阵;对于矩阵的每个列,计算列中元素的均值并根据列中每个元素的数值与该均值的大小关系生成与各个元素对应的二进制位,以形成哈希签名。该实现方式中的具体处理可以参考图2对应实施例中相应的实现方式。
在本实施例的一些可选实现方式中,生成子单元进一步用于:将待测试图像均匀分块,计算所分成的分块的整体灰度均值以及各个块各自的灰度均值,根据各个块各自的灰度均值与整体灰度均值的大小关系,生成与各个块对应的二进制位,以形成待生成哈希签名的第一部分;对待测试图像放缩为行数与列数均为8的整数倍的图像;将已放缩图像均匀分成行数与列数均为8的块;计算每个块的DCT系数并量化;将每个已量化DCT系数中进行排序后的前8个作为矩阵的各行生成矩阵;对于矩阵的每个列,计算列中元素的均值并根据列中每个元素的数值与该均值的大小关系生成与各个元素对应的二进制位,以形成待生成哈希签名的第二部分;基于第一部分和第二部分生成哈希签名。该实现方式中的具体处理可以参考图2对应实施例中相应的实现方式。
在本实施例的一些可选实现方式中,视频装置400还包括:去重单元(未示出),用于在将待检测图像序列中各个待检测图像的哈希签名与从样本视频集合中各个样本视频所提取出的样本图像序列中各个样本图像的哈希签名进行匹配之前,基于待检测图像序列中各个待检测图像的哈希签名对待检测图像序列中的待检测图像进行去重处理。该实现方式中的具体处理可以参考图2对应实施例中相应的实现方式。
在本实施例的一些可选实现方式中,匹配单元403进一步用于:依次计算样本图像序列中各个样本图像的哈希签名将与该图像的哈希签名的汉明距离,并将汉明距离不大于预设汉明距离阈值的哈希签名所对应的样本图像确定为匹配成功的样本图像。该实现方式中的具体处理可以参考图2对应实施例中相应的实现方式。
在本实施例的一些可选实现方式中,匹配单元403进一步用于:将待测试图像的哈希签名按位数平均分成m块后从中选择n块作为查询用子签名,其中n≤m-k;确定预先建立的子签名索引中与查询用子签名相同的子签名,其中子签名索引的各个子签名是对样本图像序列中各个样本图像的哈希签名平均分成m块后、将每n块提取出来而形成的,且各个子签名与所对应的样本图像是关联的;对于与查询用子签名相同的各个子签名,计算子签名所关联的样本图像的哈希签名中除子签名外的其他m-n块与待检测图像的哈希签名中除查询用子签名外的其他m-n块之间的汉明距离;将汉明距离不大于预设汉明距离阈值k的哈希签名所对应的样本图像确定为匹配成功的样本图像。该实现方式中的具体处理可以参考图2对应实施例中相应的实现方式。
在本实施例的一些可选实现方式中,上述样本图像序列中各个样本图像的哈希签名以及待测试图像序列中各个待测试图像的哈希签名均为64位,k=4,m=6,n=2。该实现方式中的具体处理可以参考图2对应实施例中相应的实现方式。
下面参考图5,其示出了适于用来实现本申请实施例的终端设备或服务器的计算机系统500的结构示意图。
如图5所示,计算机系统500包括中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有系统500操作所需的各种程序和数据。CPU 501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括截取单元、生成单元、匹配单元、记录单元和确定单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,截取单元还可以被描述为“从待检测视频中截取至少一个图像以形成待检测图像序列的单元”。
作为另一方面,本申请还提供了一种非易失性计算机存储介质,该非易失性计算机存储介质可以是上述实施例中所述装置中所包含的非易失性计算机存储介质;也可以是单独存在,未装配入终端中的非易失性计算机存储介质。上述非易失性计算机存储介质存储有一个或者多个程序,当所述一个或者多个程序被一个设备执行时,使得所述设备:从待检测视频中截取至少一个图像以形成待检测图像序列;生成所述待检测图像序列中每个待检测图像的哈希签名;将所述待检测图像序列中各个待检测图像的哈希签名与从样本视频集合中各个样本视频所提取出的样本图像序列中各个样本图像的哈希签名进行匹配,其中样本视频的视频标识与从该样本视频所提取出的样本图像序列中各个样本图像的图像标识是关联存储的;记录所述样本图像序列中哈希签名匹配成功的样本图像的图像标识以及所述哈希签名匹配成功的样本图像所属的视频的视频标识,并统计各个图像标识和各个视频标识的出现次数;将视频标识出现次数大于第一阈值、且视频标识所关联的图像标识中不同图像标识的出现次数大于第二阈值的样本视频,确定为所述待检测视频的同源视频。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (20)

1.一种视频检测方法,其特征在于,所述方法包括:
从待检测视频中截取至少一个图像以形成待检测图像序列;
生成所述待检测图像序列中每个待检测图像的哈希签名;
将所述待检测图像序列中各个待检测图像的哈希签名与从样本视频集合中各个样本视频所提取出的样本图像序列中各个样本图像的哈希签名进行匹配,其中样本视频的视频标识与从该样本视频所提取出的样本图像序列中各个样本图像的图像标识是关联存储的;
记录所述样本图像序列中哈希签名匹配成功的样本图像的图像标识以及所述哈希签名匹配成功的样本图像所属的视频的视频标识,并统计各个图像标识和各个视频标识的出现次数;
将视频标识出现次数大于第一阈值、且视频标识所关联的图像标识中不同图像标识的出现次数大于第二阈值的样本视频,确定为所述待检测视频的同源视频;
所述生成所述待检测图像序列中每个待检测图像的哈希签名,包括:
利用均值方法提取所述待检测图像序列中每个待检测图像的全局特征向量,并基于所提取的全局特征向量形成待生成哈希签名的第一部分;
利用DCT方法提取所述待检测图像序列中每个待检测图像的全局特征向量,并基于所提取的全局特征向量形成待生成哈希签名的第二部分;
基于第一部分和第二部分生成哈希签名。
2.根据权利要求1所述的方法,其特征在于,所述从待检测视频中截取至少一个图像以形成待检测图像序列,包括:
在所述待检测视频中的视频片段中,每隔第一预设帧数截取图像,以形成待检测图像序列。
3.根据权利要求2所述的方法,其特征在于,所述视频片段是位于所述待检测视频的中间部分且长度为第一预设时长的视频片段。
4.根据权利要求3所述的方法,其特征在于,所述样本图像序列是针对各个样本视频中位于样本视频的中间部分且时长为第二预设时长的视频片段、每隔第二预设帧数截取图像所形成的,其中,所述第二预设时长大于所述第一预设时长且所述第二预设帧数小于所述第一预设帧数。
5.根据权利要求1所述的方法,其特征在于,所述生成所述待检测图像序列中每个待检测图像的哈希签名,包括:
提取各个待检测图像的全局特征向量,并基于所提取的全局特征向量生成哈希签名。
6.根据权利要求5所述的方法,其特征在于,在所述提取各个待检测图像的全局特征向量,并基于所提取的全局特征向量生成哈希签名之前,所述生成所述图像序列中每个图像的哈希签名还包括以下一项或多项:
将待检测图像从三通道图像转换为单通道图像;
对待检测图像进行腐蚀以弱化待检测图像中的字幕;
去除待检测图像的黑边。
7.根据权利要求5所述的方法,其特征在于,所述提取各个待检测图像的全局特征向量,并基于所提取的全局特征向量生成哈希签名,包括:
将待测试图像均匀分块,计算所分成的分块的整体灰度均值以及各个块各自的灰度均值;
根据各个块各自的灰度均值与所述整体灰度均值的大小关系,生成与各个块对应的二进制位,以形成哈希签名。
8.根据权利要求5所述的方法,其特征在于,所述提取各个待检测图像的全局特征向量,并基于所提取的全局特征向量生成哈希签名,包括:
对待测试图像放缩为行数与列数均为8的整数倍的图像;
将已放缩图像均匀分成行数与列数均为8的块;
计算每个块的离散余弦变换DCT系数并量化;
将每个已量化DCT系数中的前8位作为一行生成矩阵;
对于所述矩阵的每个列,计算列中元素的均值并根据列中每个元素的数值与该均值的大小关系生成与各个元素对应的二进制位,以形成哈希签名。
9.根据权利要求5所述的方法,其特征在于,所述提取各个待检测图像的全局特征向量,并基于所提取的全局特征向量生成哈希签名,包括:
将待测试图像均匀分块,计算所分成的分块的整体灰度均值以及各个块各自的灰度均值,根据各个块各自的灰度均值与所述整体灰度均值的大小关系,生成与各个块对应的二进制位,以形成待生成哈希签名的第一部分;
对待测试图像放缩为行数与列数均为8的整数倍的图像;将已放缩图像均匀分成行数与列数均为8的块;计算每个块的DCT系数并量化;将每个已量化DCT系数中进行排序后的前8个作为矩阵的各行生成矩阵;对于所述矩阵的每个列,计算列中元素的均值并根据列中每个元素的数值与该均值的大小关系生成与各个元素对应的二进制位,以形成待生成哈希签名的第二部分;
基于所述第一部分和所述第二部分生成哈希签名。
10.根据权利要求1所述的方法,其特征在于,在所述将所述待检测图像序列中各个待检测图像的哈希签名与从样本视频集合中各个样本视频所提取出的样本图像序列中各个样本图像的哈希签名进行匹配之前,所述方法还包括:
基于所述待检测图像序列中各个待检测图像的哈希签名对所述待检测图像序列中的待检测图像进行去重处理。
11.根据权利要求1所述的方法,其特征在于,所述将所述待检测图像序列中各个待检测图像的哈希签名与从样本视频集合中各个样本视频所提取出的样本图像序列中各个样本图像的哈希签名进行匹配,包括:
依次计算所述样本图像序列中各个样本图像的哈希签名将与该图像的哈希签名的汉明距离,并将汉明距离不大于预设汉明距离阈值k的哈希签名所对应的样本图像确定为匹配成功的样本图像。
12.根据权利要求11所述的方法,其特征在于,所述依次计算所述样本图像序列中各个样本图像的哈希签名将与该图像的哈希签名的汉明距离,并将汉明距离不大于预设汉明距离阈值k的哈希签名所对应的样本图像确定为匹配成功的样本图像,包括:
将待测试图像的哈希签名按位数平均分成m块后从中选择n块作为查询用子签名,其中n≤m-k;
确定预先建立的子签名索引中与所述查询用子签名相同的子签名,其中所述子签名索引的各个子签名是对样本图像序列中各个样本图像的哈希签名平均分成m块后、将每n块提取出来而形成的,且各个子签名与所对应的样本图像是关联的;
对于与所述查询用子签名相同的各个子签名,计算子签名所关联的样本图像的哈希签名中除子签名外的其他m-n块与待检测图像的哈希签名中除查询用子签名外的其他m-n块之间的汉明距离;
将汉明距离不大于预设汉明距离阈值k的哈希签名所对应的样本图像确定为匹配成功的样本图像。
13.根据权利要求12所述的方法,其特征在于,所述样本图像序列中各个样本图像的哈希签名以及待测试图像序列中各个待测试图像的哈希签名均为64位,k=4,m=6,n=2。
14.一种视频检测装置,其特征在于,所述装置包括:
截取单元,用于从待检测视频中截取至少一个图像以形成待检测图像序列;
生成单元,用于生成所述待检测图像序列中每个待检测图像的哈希签名;
匹配单元,用于将所述待检测图像序列中各个待检测图像的哈希签名与从样本视频集合中各个样本视频所提取出的样本图像序列中各个样本图像的哈希签名进行匹配,其中样本视频的视频标识与从该样本视频所提取出的样本图像序列中各个样本图像的图像标识是关联存储的;
记录单元,用于记录所述样本图像序列中哈希签名匹配成功的样本图像的图像标识以及所述哈希签名匹配成功的样本图像所属的视频的视频标识,并统计各个图像标识和各个视频标识的出现次数;
确定单元,用于将视频标识出现次数大于第一阈值、且视频标识所关联的图像标识中不同图像标识的出现次数大于第二阈值的样本视频,确定为所述待检测视频的同源视频;
生成单元进一步用于:
利用均值方法提取所述待检测图像序列中每个待检测图像的全局特征向量,并基于所提取的全局特征向量形成待生成哈希签名的第一部分;
利用DCT方法提取所述待检测图像序列中每个待检测图像的全局特征向量,并基于所提取的全局特征向量形成待生成哈希签名的第二部分;
基于第一部分和第二部分生成哈希签名。
15.根据权利要求14所述的装置,其特征在于,所述截取单元进一步用于:
在所述待检测视频中的视频片段中,每隔第一预设帧数截取图像,以形成待检测图像序列。
16.根据权利要求15所述的装置,其特征在于,所述视频片段是位于所述待检测视频的中间部分且长度为第一预设时长的视频片段。
17.根据权利要求14所述的装置,其特征在于,所述生成单元包括:
生成子单元,用于提取各个待检测图像的全局特征向量,并基于所提取的全局特征向量生成哈希签名。
18.根据权利要求17所述的装置,其特征在于,所述生成单元还包括以下一项或多项:
转换子单元,用于在所述提取各个待检测图像的全局特征向量,并基于所提取的全局特征向量生成哈希签名之前,将待检测图像从三通道图像转换为单通道图像;
腐蚀单元,用于在所述提取各个待检测图像的全局特征向量,并基于所提取的全局特征向量生成哈希签名之前,对待检测图像进行腐蚀以弱化待检测图像中的字幕;
去黑边单元,用于在所述提取各个待检测图像的全局特征向量,并基于所提取的全局特征向量生成哈希签名之前,去除待检测图像的黑边。
19.根据权利要求14所述的装置,其特征在于,所述匹配单元,进一步用于:依次计算所述样本图像序列中各个样本图像的哈希签名将与该图像的哈希签名的汉明距离,并将汉明距离不大于预设汉明距离阈值k的哈希签名所对应的样本图像确定为匹配成功的样本图像。
20.根据权利要求19所述的装置,其特征在于,所述匹配单元进一步用于:
将待测试图像的哈希签名按位数平均分成m块后从中选择n块作为查询用子签名,其中n≤m-k;
确定预先建立的子签名索引中与所述查询用子签名相同的子签名,其中所述子签名索引的各个子签名是对样本图像序列中各个样本图像的哈希签名平均分成m块后、将每n块提取出来而形成的,且各个子签名与所对应的样本图像是关联的;
对于与所述查询用子签名相同的各个子签名,计算子签名所关联的样本图像的哈希签名中除子签名外的其他m-n块与待检测图像的哈希签名中除查询用子签名外的其他m-n块之间的汉明距离;
将汉明距离不大于预设汉明距离阈值k的哈希签名所对应的样本图像确定为匹配成功的样本图像。
CN201610298495.XA 2016-05-06 2016-05-06 视频检测方法和装置 Active CN105975939B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610298495.XA CN105975939B (zh) 2016-05-06 2016-05-06 视频检测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610298495.XA CN105975939B (zh) 2016-05-06 2016-05-06 视频检测方法和装置

Publications (2)

Publication Number Publication Date
CN105975939A CN105975939A (zh) 2016-09-28
CN105975939B true CN105975939B (zh) 2019-10-15

Family

ID=56992406

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610298495.XA Active CN105975939B (zh) 2016-05-06 2016-05-06 视频检测方法和装置

Country Status (1)

Country Link
CN (1) CN105975939B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106484837B (zh) * 2016-09-30 2020-08-04 腾讯科技(北京)有限公司 相似视频文件的检测方法和装置
CN108733737B (zh) * 2017-04-25 2021-02-09 阿里巴巴(中国)有限公司 视频库的建立方法及装置
CN108881947B (zh) * 2017-05-15 2021-08-17 阿里巴巴集团控股有限公司 一种直播流的侵权检测方法及装置
CN107808130A (zh) * 2017-10-19 2018-03-16 维沃移动通信有限公司 一种视频检测方法及装置、移动终端
CN109697641A (zh) * 2017-10-20 2019-04-30 北京京东尚科信息技术有限公司 计算商品相似度的方法和装置
CN109039800A (zh) * 2018-06-28 2018-12-18 腾讯科技(深圳)有限公司 在流量实验中进行流量分配的方法、装置和计算机设备
CN109740007B (zh) * 2018-08-27 2022-03-11 广州麦仑信息科技有限公司 一种基于图像特征签名的静脉图像快速检索方法
CN110083740B (zh) * 2019-05-07 2021-04-06 深圳市网心科技有限公司 视频指纹提取及视频检索方法、装置、终端及存储介质
CN110619362B (zh) * 2019-09-17 2021-11-09 北京市博汇科技股份有限公司 一种基于感知与像差的视频内容比对方法及装置
CN113553469B (zh) * 2020-04-23 2023-12-22 阿里巴巴集团控股有限公司 数据处理方法、装置、电子设备及计算机存储介质
CN111935506B (zh) * 2020-08-19 2023-03-28 百度时代网络技术(北京)有限公司 用于确定重复视频帧的方法和装置
CN111931678B (zh) * 2020-08-21 2021-09-07 腾讯科技(深圳)有限公司 一种视频信息处理方法、装置、电子设备及存储介质
CN112184837A (zh) * 2020-09-30 2021-01-05 百度(中国)有限公司 一种图像检测方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103051925A (zh) * 2012-12-31 2013-04-17 传聚互动(北京)科技有限公司 基于视频指纹的快速视频检测方法和装置
US8494234B1 (en) * 2007-03-07 2013-07-23 MotionDSP, Inc. Video hashing system and method
CN103336957A (zh) * 2013-07-18 2013-10-02 中国科学院自动化研究所 一种基于时空特征的网络同源视频检测方法
CN103942275A (zh) * 2014-03-27 2014-07-23 百度在线网络技术(北京)有限公司 一种视频识别方法与设备
CN105335956A (zh) * 2014-08-06 2016-02-17 腾讯科技(深圳)有限公司 同源图像的校验方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8494234B1 (en) * 2007-03-07 2013-07-23 MotionDSP, Inc. Video hashing system and method
CN103051925A (zh) * 2012-12-31 2013-04-17 传聚互动(北京)科技有限公司 基于视频指纹的快速视频检测方法和装置
CN103336957A (zh) * 2013-07-18 2013-10-02 中国科学院自动化研究所 一种基于时空特征的网络同源视频检测方法
CN103942275A (zh) * 2014-03-27 2014-07-23 百度在线网络技术(北京)有限公司 一种视频识别方法与设备
CN105335956A (zh) * 2014-08-06 2016-02-17 腾讯科技(深圳)有限公司 同源图像的校验方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"基于视频印记的同源视频检测";徐波;《中国优秀硕士学位论文全文数据库》;20080630;全文 *

Also Published As

Publication number Publication date
CN105975939A (zh) 2016-09-28

Similar Documents

Publication Publication Date Title
CN105975939B (zh) 视频检测方法和装置
US10324977B2 (en) Searching method and apparatus
Zhou et al. Coverless image steganography using partial-duplicate image retrieval
US20230289383A1 (en) Video fingerprinting
US9665789B2 (en) Device and method for analyzing the correlation between an image and another image or between an image and a video
AU2016250276B2 (en) Systems and methods for reducing data density in large datasets
Poddar et al. Non‐parametric modified histogram equalisation for contrast enhancement
US20190179851A1 (en) Systems and methods for addressing a media database using distance associative hashing
CA2906199C (en) Systems and methods for addressing a media database using distance associative hashing
US9146990B2 (en) Search and identification of video content
CN101425082A (zh) 视频文件内容确定方法及系统
WO2016082277A1 (zh) 一种视频认证方法及装置
CN111651636B (zh) 视频相似片段搜索方法及装置
EP3001871B1 (en) Systems and methods for addressing a media database using distance associative hashing
US9076071B2 (en) Logo recognition
WO2015167901A1 (en) Video fingerprinting
CN114169381A (zh) 图像标注方法、装置、终端设备及存储介质
CN113297420A (zh) 视频图像处理方法、装置、存储介质及电子设备
CN114241358A (zh) 基于数字孪生变电站的设备状态展示方法、装置和设备
CN113222921A (zh) 一种图像处理方法及系统
CN103955713A (zh) 一种图标识别方法和装置
CN110930287B (zh) 一种图像隐写检测方法、装置及计算机设备、存储介质
CN108492345B (zh) 一种基于尺度变换的数据块划分方法
CN114913350B (zh) 素材查重方法、装置、设备及存储介质
Oh et al. Low-complexity and robust comic fingerprint method for comic identification

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20200707

Address after: 571924 2001, 2nd floor, building A17, Hainan Ecological Software Park, hi tech industry demonstration zone, Chengmai County, Hainan Province

Patentee after: Dulink network technology (Hainan) Co., Ltd

Address before: 100085 Beijing, Haidian District, No. ten on the ground floor, No. 10 Baidu building, layer three

Patentee before: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.

TR01 Transfer of patent right