CN105681899B - 一种相似视频和盗版视频的检测方法及装置 - Google Patents
一种相似视频和盗版视频的检测方法及装置 Download PDFInfo
- Publication number
- CN105681899B CN105681899B CN201511032299.XA CN201511032299A CN105681899B CN 105681899 B CN105681899 B CN 105681899B CN 201511032299 A CN201511032299 A CN 201511032299A CN 105681899 B CN105681899 B CN 105681899B
- Authority
- CN
- China
- Prior art keywords
- picture
- picture library
- library
- video
- detected
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 47
- 238000000034 method Methods 0.000 claims abstract description 47
- 238000010586 diagram Methods 0.000 description 12
- 238000004364 calculation method Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 238000012512 characterization method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/442—Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
- H04N21/44236—Monitoring of piracy processes or activities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/23418—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/44008—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Computer Security & Cryptography (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Virology (AREA)
- Computer Networks & Wireless Communication (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Television Signal Processing For Recording (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例提供了一种相似视频和盗版视频的检测方法及装置,盗版视频的检测方法包括:获取待检测视频;根据预设规则,从待检测视频中提取多张特征图片作为第二图片库;确定第一图片库和第二图片库中每张图片的hash特征值,第一图片库为从正版视频中提取出的多张特征图片构成的;根据所述每张图片的hash特征值确定每两张图片之间的汉明距离;确定对应小于预设第一阈值的汉明距离的图片为一组相似图片;当相似图片的组数与对比数量总量的比值大于预设第二阈值时,确定待检测视频为盗版视频。所述方法通过对比视频中的图片是否相似,并根据相似图片在对比图片总量中的比例来判断待检测视频是否为盗版视频,大大提高了盗版视频的检测效率。
Description
技术领域
本发明涉及视频处理技术领域,特别是涉及一种相似视频和盗版视频的检测方法及装置。
背景技术
随着互联网的快速发展,大量的视频资源不断涌现,方便人们随随时随地进行视频观看。与此同时,盗版视频也层出不穷,大量的视频盗播给视频版权独享公司带来了巨大损失。为了保护视频版权,可以通过检测待检测视频与正版视频是否相似来判断待检测视频是否为盗版视频。
现有技术中,一般是通过比对待检测视频与正版视频的名称,或者通过人工查看待检测视频与正版视频的内容等方式来判断视频是否为相似视频,进而确定待检测视频是否为盗版视频。但是,视频的名称是很容易被修改的,对于一些修改了名称的盗播视频,通过比对视频名称的方法很难检测出来,而且,人工查看视频内容的检测方法工作量较大,效率较低。
发明内容
本发明实施例的目的在于提供一种相似视频和盗版视频的检测方法及装置,大大提高了相似视频和盗版视频的检测效率。
为达到上述目的,本发明实施例公开了一种相似视频的检测方法,包括步骤:
根据第一预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库;
确定所述第一图片库和第二图片库中每张图片的hash特征值;
根据所述第一图片库和第二图片库中每张图片的hash特征值,确定所述第一图片库中每张图片和第二图片库中每张图片之间的每个汉明距离,针对每个汉明距离,判断所述汉明距离是否小于预设第一阈值,如果是,确定对应该汉明距离的所述第一图片库和第二图片库中的图片为一组相似图片;
统计所述第一图片库和第二图片库中相似图片的组数,并判断所述第一图片库和第二图片库中相似图片的组数与对比数量总量的比值是否大于预设第二阈值,如果是,则确定所述两个待检测视频为相似视频,其中所述对比数量总量为所述第一图片库中的图片数量和第二图片库中的图片数量的乘积。
可选的,所述确定所述第一图片库和第二图片库中每张图片的hash特征值,包括:
将所述第一图片库和第二图片库中每张图片,按照预设值进行尺度变换,并对尺度变换后的所述第一图片库和第二图片库中每张图片做离散余弦变换DCT,获取所述第一图片库和第二图片库中每张图片的hash特征值。
可选的,所述根据第一预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库,包括:
根据预设的时间间隔从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库。
可选的,确定两个待检测视频为相似视频后,所述方法还包括:
根据第二预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库;采用局部二值模式LBP算法,分别确定所述第一图片库和第二图片库中每张图片上每个像素点的LBP值,并根据每个像素点的LBP值绘制LBP值直方图;将所述第一图片库中每张图片和第二图片库中每张图片的LBP值直方图进行重叠,针对每对图片确定重叠区域中像素点的数量,确定重叠区域中像素点的数量的平均值,根据所述平均值及所述图片像素点的数量,确定所述第一图片库和第二图片库的相似度;判断所述相似度是否大于预设第三阈值,如果是,确定所述两个待检测视频为相似视频。
可选的,确定所述两个待检测视频为相似视频后,所述方法还包括:
根据第三预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库;采用结构相似性SSIM算法,确定所述第一图片库中每张图片和第二图片库中每张图片之间的每个SSIM值,并根据所述多个SSIM值,计算所述第一图片库和第二图片库的相似度;判断所述相似度是否大于预设第四阈值,如果是,确定所述两个待检测视频为相似视频。
可选的,确定所述两个待检测视频为相似视频后,所述方法还包括:
根据第四预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库;采用加速健壮特征SURF算法,确定所述第一图片库和第二图片库中每张图片上的多个极值点,针对第一图片库中的每张图片的每个极值点,计算该极值点和第二图片库中每张图片的每个极值点之间的欧式距离,若所述欧式距离的最小值小于预设第五阈值,则确定第二图片库的图片中存在与该极值点匹配的极值点,并记录第一图片库中的该极值点;统计记录的第一图片库中的极值点的数量;判断所述数量是否大于预设数量阈值,如果是,则确定所述两个待检测视频为相似视频。
为了达到上述目的,本发明实施例还公开了一种盗版视频的检测方法,包括步骤:
获取待检测视频;
根据第一预设规则,从待检测视频中提取多张特征图片作为第二图片库;
确定第一图片库和第二图片库中每张图片的hash特征值,其中所述第一图片库为从正版视频中提取出的多张特征图片构成的;
根据所述第一图片库和第二图片库中每张图片的hash特征值,确定所述第一图片库中每张图片和第二图片库中每张图片之间的每个汉明距离,针对每个汉明距离,判断所述汉明距离是否小于预设第一阈值,如果是,确定对应该汉明距离的所述第一图片库和第二图片库中的图片为一组相似图片;
统计所述第一图片库和第二图片库中相似图片的组数,并判断所述第一图片库和第二图片库中相似图片的组数与对比数量总量的比值是否大于预设第二阈值,如果是,则确定所述待检测视频为盗版视频,其中所述对比数量总量为所述第一图片库中的图片数量和第二图片库中的图片数量的乘积。
可选的,所述确定所述第一图片库和第二图片库中每张图片的hash特征值,包括:
将所述第一图片库和第二图片库中每张图片,按照预设值进行尺度变换,并对尺度变换后的所述第一图片库和第二图片库中每张图片做离散余弦变换DCT,获取所述第一图片库和第二图片库中每张图片的hash特征值。
可选的,所述根据第一预设规则,从待检测视频中提取多张特征图片作为第二图片库,包括:
根据预设的时间间隔从待检测视频中提取多张特征图片作为第二图片库。
可选的,确定所述待检测视频为盗版视频后,所述方法还包括:
根据第二预设规则,从待检测视频中提取多张特征图片作为第二图片库,第一图片库为已保存的从正版视频中提取出的多张特征图片;采用局部二值模式LBP算法,分别确定所述第一图片库和第二图片库中每张图片上每个像素点的LBP值,并根据每个像素点的LBP值绘制LBP值直方图;将所述第一图片库中每张图片和第二图片库中每张图片的LBP值直方图进行重叠,针对每对图片确定重叠区域中像素点的数量,确定重叠区域中像素点的数量的平均值,根据所述平均值及所述图片像素点的数量,获得所述第一图片库和第二图片库的相似度;判断所述相似度是否大于预设第三阈值,如果是,确定所述待检测视频为盗版视频。
可选的,所述确定所述待检测视频为盗版视频后,所述方法还包括:
根据第三预设规则,从待检测视频中提取多张特征图片作为第二图片库,第一图片库为已保存的从正版视频中提取出的多张特征图片;采用结构相似性SSIM算法,确定所述第一图片库中每张图片和第二图片库中每张图片之间的每个SSIM值,并根据所述多个SSIM值,计算所述第一图片库和第二图片库的相似度;判断所述相似度是否大于预设第四阈值,如果是,确定所述待检测视频为盗版视频。
可选的,所述确定所述待检测视频为盗版视频后,所述方法还包括:
根据第四预设规则,从待检测视频中提取多张特征图片作为第二图片库,第一图片库为已保存的从正版视频中提取出的多张特征图片;采用加速健壮特征SURF算法,确定所述第一图片库和第二图片库中每张图片上的多个极值点,针对第一图片库中的每张图片的每个极值点,计算该极值点和第二图片库中每张图片的每个极值点之间的欧式距离,若所述欧式距离的最小值小于预设第五阈值,则确定第二图片库的图片中存在与该极值点匹配的极值点,并记录第一图片库中的该极值点;统计记录的第一图片库中的极值点的数量;判断所述数量是否大于预设数量阈值,如果是,则确定所述待检测视频为盗版视频。
为了达到上述目的,本发明实施例公开了一种相似视频的检测装置,包括:
图片库获取模块,用于根据第一预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库;
hash特征值确定模块,用于确定所述第一图片库和第二图片库中每张图片的hash特征值;
相似图片确定模块,用于根据所述第一图片库和第二图片库中每张图片的hash特征值,确定所述第一图片库中每张图片和第二图片库中每张图片之间的每个汉明距离,针对每个汉明距离,判断所述汉明距离是否小于预设第一阈值,如果是,确定对应该汉明距离的所述第一图片库和第二图片库中的图片为一组相似图片;
相似视频确定模块,用于统计所述第一图片库和第二图片库中相似图片的组数,并判断所述第一图片库和第二图片库中相似图片的组数与对比数量总量的比值是否大于预设第二阈值,如果是,则确定所述两个待检测视频为相似视频,其中所述对比数量总量为所述第一图片库中的图片数量和第二图片库中的图片数量的乘积。
可选的,所述hash特征值确定模块,具体用于:
将所述第一图片库和第二图片库中每张图片,按照预设值进行尺度变换,并对尺度变换后的所述第一图片库和第二图片库中每张图片做离散余弦变换DCT,获取所述第一图片库和第二图片库中每张图片的hash特征值。
可选的,所述图片库获取模块,具体用于:
根据预设的时间间隔从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库。
可选的,所述装置还包括第一确定模块,具体用于:
根据第二预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库;采用局部二值模式LBP算法,分别确定所述第一图片库和第二图片库中每张图片上每个像素点的LBP值,并根据每个像素点的LBP值绘制LBP值直方图;将所述第一图片库中每张图片和第二图片库中每张图片的LBP值直方图进行重叠,针对每对图片确定重叠区域中像素点的数量,确定重叠区域中像素点的数量的平均值,根据所述平均值及所述图片像素点的数量,确定所述第一图片库和第二图片库的相似度;判断所述相似度是否大于预设第三阈值,如果是,确定所述两个待检测视频为相似视频。
可选的,所述装置还包括第二确定模块,具体用于:
根据第三预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库;采用结构相似性SSIM算法,确定所述第一图片库中每张图片和第二图片库中中每张图片之间的每个SSIM值,并根据所述多个SSIM值,计算所述第一图片库和第二图片库的相似度;判断所述相似度是否大于预设第四阈值,如果是,确定所述两个待检测视频为相似视频。
可选的,所述装置还包括第三确定模块,具体用于:
根据第四预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库;采用加速健壮特征SURF算法,确定所述第一图片库和第二图片库中每张图片上的多个极值点,针对第一图片库中的每张图片的每个极值点,计算该极值点和第二图片库每张图片的每个极值点之间的欧式距离,若所述欧式距离的最小值小于预设第五阈值,则确定第二图片库的图片中存在与该极值点匹配的极值点,并记录第一图片库中的该极值点;统计记录的第一图片库中的极值点的数量;判断所述数量是否大于预设数量阈值,如果是,则确定所述两个待检测视频为相似视频。
为了达到上述目的,本发明实施例公开了一种盗版视频的检测装置,包括:
待检测视频获取模块,用于获取待检测视频;
图片库获取模块,用于根据第一预设规则,从待检测视频中提取多张特征图片作为第二图片库;
hash特征值确定模块,用于确定所述第一图片库和第二图片库中每张图片的hash特征值,其中所述第一图片库为从正版视频中提取出的多张特征图片构成的;
相似图片确定模块,用于根据所述第一图片库和第二图片库中每张图片的hash特征值,确定所述第一图片库中每张图片和第二图片库中每张图片之间的每个汉明距离,针对每个汉明距离,判断所述汉明距离是否小于预设第一阈值,如果是,确定对应该汉明距离的所述第一图片库和第二图片库中的图片为一组相似图片;
盗版视频确定模块,用于统计所述第一图片库和第二图片库中相似图片的组数,并判断所述第一图片库和第二图片库中相似图片的组数与对比数量总量的比值是否大于预设第二阈值,如果是,则确定所述待检测视频为盗版视频,其中所述对比数量总量为所述第一图片库中的图片数量和第二图片库中的图片数量的乘积。
可选的,所述hash特征值确定模块,具体用于:
将所述第一图片库和第二图片库中每张图片,按照预设值进行尺度变换,并对尺度变换后的所述第一图片库和第二图片库中每张图片做离散余弦变换DCT,获取所述第一图片库和第二图片库中每张图片的hash特征值。
可选的,所述图片库获取模块,具体用于:
根据预设的时间间隔从待检测视频中提取多张特征图片作为第二图片库。
可选的,所述装置还包括第四确定模块,具体用于:
根据第二预设规则,从待检测视频中提取多张特征图片作为第二图片库,第一图片库为已保存的从正版视频中提取出的多张特征图片;采用局部二值模式LBP算法,分别确定所述第一图片库和第二图片库中每张图片上每个像素点的LBP值,并根据每个像素点的LBP值绘制LBP值直方图;将所述第一图片库中每张图片和第二图片库中每张图片的LBP值直方图进行重叠,针对每对图片确定重叠区域中像素点的数量,确定重叠区域中像素点的数量的平均值,根据所述平均值及所述图片像素点的数量,获得所述第一图片库和第二图片库的相似度;判断所述相似度是否大于预设第三阈值,如果是,确定所述待检测视频为盗版视频。
可选的,所述装置还包括第五确定模块,具体用于:
根据第三预设规则,从待检测视频中提取多张特征图片作为第二图片库,第一图片库为已保存的从正版视频中提取出的多张特征图片;采用结构相似性SSIM算法,确定所述第一图片库中每张图片和第二图片库中每张图片之间的每个SSIM值,并根据所述多个SSIM值,计算所述第一图片库和第二图片库的相似度;判断所述相似度是否大于预设第四阈值,如果是,确定所述待检测视频为盗版视频。
可选的,所述装置还包括第六确定模块,具体用于:
根据第四预设规则,从待检测视频中提取多张特征图片作为第二图片库,第一图片库为已保存的从正版视频中提取出的多张特征图片;采用加速健壮特征SURF算法,确定所述第一图片库和第二图片库中每张图片上的多个极值点,针对第一图片库中的每张图片的每个极值点,计算该极值点和第二图片库中每张图片的每个极值点之间的欧式距离,若所述欧式距离的最小值小于预设第五阈值,则确定第二图片库的图片中存在与该极值点匹配的极值点,并记录第一图片库中的该极值点;统计记录的第一图片库中的极值点的数量;判断所述数量是否大于预设数量阈值,如果是,则确定所述待检测视频为盗版视频。
应用本发明实施例所提供的技术方案,在进行盗版视频的检测时,获取待检测视频;根据预设规则,从待检测视频中提取多张特征图片作为第二图片库;确定第一图片库和所述第二图片库中每张图片的hash特征值,其中所述第一图片库为从正版视频中提取出的多张特征图片构成的;根据所述第一图片库和第二图片库中每张图片的hash特征值,确定所述第一图片库中每张图片和第二图片库中每张图片之间的每个汉明距离,针对每个汉明距离,判断所述汉明距离是否小于预设第一阈值,如果是,确定对应该汉明距离的所述第一图片库和第二图片库中的图片为一组相似图片;统计所述第一图片库和第二图片库中相似图片的组数,并判断所述第一图片库和第二图片库中相似图片的组数与对比数量总量的比值是否大于预设第二阈值,如果是,则确定所述待检测视频为盗版视频,其中所述对比数量总量为所述第一图片库中的图片数量和第二图片库中的图片数量的乘积。所述方法通过对比视频中的图片是否相似,并根据相似图片在对比图片总量中的比例来判断待检测视频是否为盗版视频,因此,提高了盗版视频的检测效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种相似视频的检测方法的流程示意图;
图2为本发明实施例提供的一种盗版视频的检测方法的流程示意图;
图3为本发明实施例提供的一种相似视频的检测装置的结构示意图;
图4为本发明实施例提供的一种盗版视频的检测装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面通过具体实施例,对发明进行详细说明。
图1为本发明实施例提供的一种相似视频的检测方法的流程示意图,所述方法包括以下步骤:
步骤S101:根据第一预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库。
在本发明实施例中,采用第一预设规则,从两个待检测视频中分别提取多张特征图片,将对应每个待检测视频的多张特征图片构成第一图片库和第二图片库。第一预设规则可以有多种,例如可以通过分析两个待检测视频的关键帧,将两个待检测视频的所有关键帧对应的图片作为第一图片库和第二图片库,也可以是从两个待检测视频中随机选取多张特征图片作为第一图片库和第二图片库。
从视频中提取图片的过程属于现有技术,例如可以使用多媒体处理工具FFMPGE(Fast Forward Mpeg),在本发明实施例中不再赘述。
步骤S102:确定所述第一图片库和第二图片库中每张图片的hash特征值。
图片的hash特征值的长度可以需要进行设定,在本发明实施例中,设置每张图片的hash特征值的长度为64位。
步骤S103:根据所述第一图片库和第二图片库中每张图片的hash特征值,确定所述第一图片库中每张图片和第二图片库中每张图片之间的每个汉明距离,针对每个汉明距离,判断所述汉明距离是否小于预设第一阈值,如果是,确定对应该汉明距离的所述第一图片库和第二图片库中的图片为一组相似图片。
本发明实施例中,第一图片库和第二图片库中包含从两个待检测视频根据第一预设规则提取多张特征图片,将第一图片库中的图片与第二图片库中的每张图片进行对比,根据两张对比的图片的hash特征值,确定两张对比的图片之间的汉明距离。当该汉明距离小于预设第一阈值时,确定这两张对比的图片是一组相似图片;当该汉明距离大于或者等于预设第一阈值时,确定这两张对比的图片不是一组相似图片。其中,预设第一阈值可以根据需要预先设定。
步骤S104:统计所述第一图片库和第二图片库中相似图片的组数,并判断所述第一图片库和第二图片库中相似图片的组数与对比数量总量的比值是否大于预设第二阈值,如果是,则确定所述两个待检测视频为相似视频,其中所述对比数量总量为所述第一图片库中的图片数量和第二图片库中的图片数量的乘积。
本发明实施例中,通过统计所述第一图片库和第二图片库中相似图片的组数,计算第一图片库和第二图片库中相似图片的组数与对比数量总量的比值,可以确定第一图片库和第二图片库中相似图片在对比图片的总量中占的比例,将此比例与预设阈值的比较,可以判断两个待检测视频是否为相似视频。具体的,当第一图片库和第二图片库中相似图片的组数与对比数量总量的比值大于第二阈值时,确定两个待检测视频为相似视频;当第一图片库和第二图片库中相似图片的组数与对比数量总量的比值小于或者等于第二阈值时,确定两个待检测视频为不相似视频。其中,预设第二阈值可以根据需要预先设定。
假设两个待检测视频分别为第一视频和第二视频,分别对应第一图片库和第二图片库,第一图片库中包含3张图片A、B、C,第二图片库中包含两张图片D和E,预设第一阈值为5,预设第二阈值为50%。则相似视频的检测过程具体如下,确定A~E五张图片中每张图片的hash特征值;将第一图片库中的图片分别与第二图片库中的每张图片对比,则对比数量总量为6,即共有图片A与图片D、图片A与图片E、图片B与图片D、图片B与图片E、图片C与图片D、图片C与图片E六组图片需要对比,确定六组对比图片之间的汉明距离分别为4,4,5,4,6,4;将得到的六个汉明距离分别与预设第一阈值对比,根据步骤S103可知,共有图片A与图片D、图片A与图片E、图片B与图片E、图片C与图片E四组图片为相似图片,第一图片库和第二图片库中相似图片的组数与所述对比数量总量的比值为4/6,该比值大于预设第二阈值,因此可以确定第一视频和第二视频为相似视频。
应用本发明实施例提供的技术方案,在进行相似视频检测时,根据第一预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库;确定所述第一图片库和第二图片库中每张图片的hash特征值及所述第一图片库中每张图片和第二图片库中每张图片之间的汉明距离,针对每个汉明距离,判断所述汉明距离是否小于预设第一阈值,如果是,确定对应该汉明距离的所述第一图片库和第二图片库中的图片为一组相似图片;统计所述第一图片库和第二图片库中相似图片的组数,并判断所述第一图片库和第二图片库中相似图片的组数与对比数量总量的比值是否大于预设第二阈值,如果是,则确定所述两个待检测视频为相似视频,其中所述对比数量总量为所述第一图片库中的图片数量和第二图片库中的图片数量的乘积。所述方法通过对比视频中的图片是否相似,并根据相似图片在对比图片总量中的比例来判断两个待检测视频是否为相似视频,因此,提高了相似视频的检测效率。
基于上述实施例,在本发明的一个实施例中,所述确定所述第一图片库和第二图片库中每张图片的hash特征值,包括:
将所述第一图片库和第二图片库中每张图片,按照预设值进行尺度变换,并对尺度变换后的所述第一图片库和第二图片库中每张图片做离散余弦变换DCT,获取所述第一图片库和第二图片库中每张图片的hash特征值。
具体的,对第一图片库和第二图片库中每张图片进行尺度变换的预设值可以根据经验值进行设定,当该预设值小于图片的实际大小时,可以减少计算的数据量,提高相似视频的检测效率。
在本发明实施例中,该预设值可以为32×32像素大小。具体过程包括:将第一图片库和第二图片库中每张图片缩小为32×32像素的图片;对缩小后的每张图片做DCT变换,可以实现在保证质量的前提下对图片的数据进行压缩,进一步提高图片的处理效率;由于进行DCT变换后的每张图片包含低频部分和高频部分,图片的低频部分更能体现出图片的结构特性,因此,取每张图片的低频部分,按照预设值的窗口计算每张图片的hash特征值。在本发明实施例中,设置每张图片的hash特征值为64位,所以取每张图片的低频部分,按照8×8的窗口计算每张图片的hash特征值。
基于上述实施例,在本发明的一个实施例中,所述根据第一预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库,包括:根据预设的时间间隔从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库。
具体的,预先设置一个时间间隔值,例如5ms,当然也可以是2ms或者10ms,该时间间隔可以根据需要进行设置。针对两个待检测视频,每隔5ms从视频中提取出一张特征图片,这样可以提取出多张特征图片,可以确定第一图片库和第二图片库。
在本发明实施例中,确定所述两个待检测视频为相似视频后,为了进一步提高检测的准确性,可以采用以下三种方式中的任意一种方式,进一步对两个待检测视频进行检测。
第一种方式包括:根据第二预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库;采用局部二值模式LBP算法,分别确定所述第一图片库和第二图片库中每张图片上每个像素点的LBP值,并根据每个像素点的LBP值绘制LBP值直方图;将所述第一图片库中每张图片和第二图片库中每张图片的LBP值直方图进行重叠,针对每对图片确定重叠区域中像素点的数量,并确定重叠区域中像素点的数量的平均值,根据所述平均值及所述图片像素点的数量,确定所述第一图片库和第二图片库的相似度;判断所述相似度是否大于预设第三阈值,如果是,确定所述两个待检测视频为相似视频。
在本发明的一个实施例中,计算的每张图片的hash特征值主要能够反映图片的结构特征,而通过局部二值模式LBP算法获得的关于LBP值及与其对应的像素点数量的LBP值直方图在一定程度上能够有效表征图片本身的内容信息,基于内容信息对两个待检测视频进行比对,进一步提高了相似视频检测的准确性。
第二种方式包括:根据第三预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库;采用结构相似性SSIM算法,确定所述第一图片库中每张图片和第二图片库中每张图片之间的每个SSIM值,并根据所述多个SSIM值,计算所述第一图片库和第二图片库的相似度;判断所述相似度是否大于预设第四阈值,如果是,确定所述两个待检测视频为相似视频。
结构相似性SSIM算法考虑了图片之间像素的亮度、对比度以及结构相似性,对相似图片的识别更准确,进而能够进一步提高视频检测的准确性。
第三种方式包括:根据第四预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库;采用加速健壮特征SURF算法,确定所述第一图片库和第二图片库中每张图片上的多个极值点,针对第一图片库中的每张图片的每个极值点,计算该极值点和第二图片库中每张图片的每个极值点之间的欧式距离,若所述欧式距离的最小值小于预设第五阈值,则确定第二图片库的图片中存在与该极值点匹配的极值点,并记录第一图片库中的该极值点;统计记录的第一图片库中的极值点的数量;判断所述数量是否大于预设数量阈值,如果是,则确定所述两个待检测视频为相似视频。
加速健壮特征SURF算法考虑了图片之间的多个稳定的极值点,基于这些极值点可以更准确地检测图片之间的相似度,而且不受图片旋转的影响,因此,可以进一步提高相似视频检测的准确性。
图2为本发明实施例提供的一种盗版视频的检测方法的流程示意图,所述方法包括以下步骤:
步骤S201:获取待检测视频。
在实际应用中,可以采用网络爬虫技术获得被监控网站的一个或多个视频作为待检测视频。
步骤S202:根据第一预设规则,从待检测视频中提取多张特征图片作为第二图片库。
第二图片库是通过根据第一预设规则从待检测视频中提取多张特征图片确定的,第一预设规则可以有多种,例如可以通过分析待检测视频的关键帧,将待检测视频的所有关键帧对应的图片作为第二图片库,也可以是从待检测视频中随机选取多张特征图片作为第二图片库。
步骤S203:确定第一图片库和第二图片库中每张图片的hash特征值,其中所述第一图片库为从正版视频中提取出的多张特征图片构成的。
在本发明实施例中,从正版视频中提取多张特征图片组成的第一图片库已提前保存,则第一图片库中的图片数量已经确定,从正版视频中提取图片的规则也是确定的。获取第二图片库中每张图片的规则可以与获取第一图片库中每张图片的规则相同,也可以不同。
图片的hash特征值的长度可以需要进行设定,在本发明实施例中,设置每张图片的hash特征值的长度为64位。
步骤S204:根据所述第一图片库和第二图片库中每张图片的hash特征值,确定所述第一图片库中每张图片和第二图片库中每张图片之间的每个汉明距离,针对每个汉明距离,判断所述汉明距离是否小于预设第一阈值,如果是,确定对应该汉明距离的所述第一图片库和第二图片库中的图片为一组相似图片。
本发明实施例中,将第一图片库中的图片与第二图片库中的每张图片进行对比,根据两张对比的图片的hash特征值,确定两张对比的图片之间的汉明距离。当该汉明距离小于预设第一阈值时,确定这两张对比的图片是一组相似图片;当该汉明距离大于或者等于预设第一阈值时,确定这两张对比的图片不是一组相似图片。其中,预设第一阈值可以根据需要预先设定。
步骤S205:统计所述第一图片库和第二图片库中相似图片的组数,并判断所述第一图片库和第二图片库中相似图片的组数与对比数量总量的比值是否大于预设第二阈值,如果是,则确定所述待检测视频为盗版视频,其中所述对比数量总量为所述第一图片库中的图片数量和第二图片库中的图片数量的乘积。
本发明实施例中,通过统计所述第一图片库和第二图片库中相似图片的组数,计算第一图片库和第二图片库中相似图片的组数与对比数量总量的比值,可以确定第一图片库和第二图片库中相似图片在对比图片的总量中占的比例,将此比例与预设阈值的比较,可以判断待检测视频是否为盗版视频。具体的,当第一图片库和第二图片库中相似图片的组数与对比数量总量的比值大于第二阈值时,确定所述待检测视频为盗版视频;当第一图片库和第二图片库中相似图片的组数与对比数量总量的比值小于或者等于第二阈值时,确定所述待检测视频不是盗版视频。其中,预设第二阈值可以根据需要预先设定。
假设第一图片库中包含3张图片A、B、C,第二图片库中包含两张图片D和E,预设第一阈值为5,预设第二阈值为50%,则盗版视频的检测过程具体如下,确定A~E五张图片中每张图片的hash特征值;将第二图片库中的图片分别与第一图片库中的每张图片比对,则对比数量总量为6,即共有图片D与图片A、图片D与图片B、图片D与图片C、图片E与图片A、图片E与图片B、图片E与图片C六组图片需要对比,确定六组对比图片之间的汉明距离分别为4,4,5,4,6,4,将得到的六个汉明距离分别与预设第一阈值对比,根据步骤S204可知,共有图片D与图片A、图片D与图片B、图片E与图片A、图片E与图片C四组图片为相似图片,第一图片库和第二图片库中相似图片的组数与所述对比数量总量的比值为4/6,该比值大于预设第二阈值,因此可以确定待检测视频为盗版视频。
应用本发明实施例提供的技术方案,在进行盗版视频检测时,获取待检测视频;根据第一预设规则,从待检测视频中提取多张特征图片作为第二图片库;确定所述第一图片库和第二图片库中每张图片的hash特征值,其中所述第一图片库为从正版视频中提取出的多张特征图片构成的;根据所述第一图片库和第二图片库中每张图片的hash特征值,确定所述第一图片库中每张图片和第二图片库中每张图片之间的汉明距离,针对每个汉明距离,判断所述汉明距离是否小于预设第一阈值,如果是,确定对应该汉明距离的所述第一图片库和第二图片库中的图片为一组相似图片;统计所述第一图片库和第二图片库中相似图片的组数,并判断所述第一图片库和第二图片库中相似图片的组数与所述对比数量总量的比值是否大于预设第二阈值,如果是,则确定所述待检测视频为盗版视频,其中所述对比数量总量为所述第一图片库中的图片数量和第二图片库中的图片数量的乘积。所述方法通过对比视频中的图片是否相似,并根据相似图片在对比图片总量中的比例来判断待检测视频是否为盗版视频,因此,提高了盗版视频的检测效率。
在本发明的一个实施例中,所述确定所述第一图片库和第二图片库中每张图片的hash特征值,包括:将所述第一图片库和第二图片库中每张图片,按照预设值进行尺度变换,并对尺度变换后的所述第一图片库和第二图片库中每张图片做离散余弦变换DCT,获取所述第一图片库和第二图片库中每张图片的hash特征值。
具体的,对第一图片库和第二图片库中每张图片进行尺度变换的预设值可以根据经验值进行设定,当该预设值小于图片的实际大小时,可以减少计算的数据量,提高盗版视频的检测效率。
在本发明实施例中,该预设值可以为32×32像素大小。具体过程包括:对缩小后的每张图片做DCT变换,可以实现在保证质量的前提下对图片的数据进行压缩,进一步提高图片的处理效率;由于进行DCT变换后的每张图片包含低频部分和高频部分,图片的低频更能体现出图片的结构特性,因此,取每张图片的低频部分,按照预设值的窗口计算每张图片的hash特征值,在本发明实施例中,设置每张图片的hash特征值为64位,所以取每张图片的低频部分,按照8×8的窗口计算每张图片的hash特征值。
在本发明的一个实施例中,所述根据第一预设规则,从待检测视频中对应提取多张特征图片作为第二图片库,包括:根据预设的时间间隔从待检测视频中提取多张特征图片作为第二图片库。
具体的,预先设置一个时间间隔值,例如5ms,当然也可以是2ms或者10ms,该时间间隔可以根据需要进行设置。
在本发明实施例中,确定所述待检测视频为盗版视频后,为了进一步提高检测的准确性,可以采用以下三种方式中的任意一种方式,进一步对所述待检测视频进行检测。
第一种方式包括:根据第二预设规则,从待检测视频中提取多张特征图片作为第二图片库,第一图片库为已保存的从正版视频中提取出的多张特征图片;采用局部二值模式LBP算法,分别确定所述第一图片库和第二图片库中每张图片上每个像素点的LBP值,并根据每个像素点的LBP值绘制LBP值直方图;将所述第一图片库中每张图片和第二图片库中每张图片的LBP值直方图进行重叠,针对每对图片确定重叠区域中像素点的数量,确定重叠区域中像素点的数量的平均值,根据所述平均值及所述图片像素点的数量,获得所述第一图片库和第二图片库的相似度;判断所述相似度是否大于预设第三阈值,如果是,确定所述待检测视频为盗版视频。
在本发明的一个实施例中,计算的每张图片的hash特征值主要能够反映图片的结构特征,而通过局部二值模式LBP算法获得的关于LBP值及与其对应的像素点数量的LBP值直方图在一定程度上能够有效表征图片本身的内容信息,基于内容信息对待检测视频和正版视频进行比对,进一步提高了盗版视频检测的准确性。
第二种方式包括:根据第三预设规则,从待检测视频中提取多张特征图片作为第二图片库,第一图片库为已保存的从正版视频中提取出的多张特征图片;采用结构相似性SSIM算法,确定所述第一图片库中每张图片和第二图片库中每张图片之间的每个SSIM值,并根据所述多个SSIM值,计算所述第一图片库和第二图片库的相似度;判断所述相似度是否大于预设第四阈值,如果是,确定所述待检测视频为盗版视频。
结构相似性SSIM算法考虑了图片之间像素的亮度、对比度以及结构相似性,对相似图片的识别更准确,进而能够进一步提高盗版视频检测的准确性。
第三种方式包括:根据第四预设规则,从待检测视频中提取多张特征图片作为第二图片库,第一图片库为已保存的从正版视频中提取出的多张特征图片;采用加速健壮特征SURF算法,确定所述第一图片库和第二图片库中每张图片上的多个极值点,针对第一图片库中的每张图片的每个极值点,计算该极值点和第二图片库中每张图片的每个极值点之间的欧式距离,若所述欧式距离的最小值小于预设第五阈值,则确定第二图片库的图片中存在与该极值点匹配的极值点,并记录第一图片库中的该极值点;统计记录的第一图片库中的极值点的数量;判断所述数量是否大于预设数量阈值,如果是,则确定所述待检测视频为盗版视频。
加速健壮特征SURF算法考虑了图片之间的多个稳定的极值点,基于这些极值点可以更准确地检测图片之间的相似度,而且不受图片旋转的影响,因此,可以进一步提高盗版视频检测的准确性。
图3为本发明实施例提供的一种相似视频的检测装置的结构示意图,与图1所示的流程示意图对应,所述装置包括:图片库获取模块31,hash特征值确定模块32,相似图片确定模块33,相似视频确定模块34。
图片库获取模块31,用于根据第一预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库;
hash特征值确定模块32,用于确定所述第一图片库和第二图片库中每张图片的hash特征值;
相似图片确定模块33,用于根据所述第一图片库和第二图片库中每张图片的hash特征值,确定所述第一图片库中每张图片和第二图片库中每张图片之间的每个汉明距离,针对每个汉明距离,判断所述汉明距离是否小于预设第一阈值,如果是,确定对应该汉明距离的所述第一图片库和第二图片库中的图片为一组相似图片;
相似视频确定模块34,用于统计所述第一图片库和第二图片库中相似图片的组数,并判断所述第一图片库和第二图片库中相似图片的组数与对比数量总量的比值是否大于预设第二阈值,如果是,则确定所述两个待检测视频为相似视频,其中所述对比数量总量为所述第一图片库中的图片数量和第二图片库中的图片数量的乘积。
所述图片库获取模块31,具体用于根据预设的时间间隔从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库。
所述hash特征值确定模块32,具体用于将所述第一图片库和第二图片库中每张图片,按照预设值进行尺度变换,并对尺度变换后的所述第一图片库和第二图片库中每张图片做离散余弦变换DCT,获取所述第一图片库和第二图片库中每张图片的hash特征值。
在本发明实施例中,确定所述两个待检测视频为相似视频后,为了进一步提高检测的准确性,所述装置还可以包括以下至少一个模块:
第一确定模块(图中未示出),用于根据第二预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库;采用局部二值模式LBP算法,分别确定所述第一图片库和第二图片库中每张图片上每个像素点的LBP值,并根据每个像素点的LBP值绘制LBP值直方图;将所述第一图片库中每张图片和第二图片库中每张图片的LBP值直方图进行重叠,将所述第一图片库中每张图片和第二图片库中每张图片的LBP值直方图进行重叠,针对每对图片确定重叠区域中像素点的数量,确定重叠区域中像素点的数量的平均值,根据所述平均值及所述图片像素点的数量,确定所述第一图片库和第二图片库的相似度;判断所述相似度是否大于预设第三阈值,如果是,确定所述两个待检测视频为相似视频。
第二确定模块(图中未示出),用于根据第三预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库;采用结构相似性SSIM算法,确定所述第一图片库中每张图片和第二图片库中中每张图片之间的每个SSIM值,并根据所述多个SSIM值,计算所述第一图片库和第二图片库的相似度;判断所述相似度是否大于预设第四阈值,如果是,确定所述两个待检测视频为相似视频。
第三确定模块(图中未示出),用于根据第四预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库;采用加速健壮特征SURF算法,确定所述第一图片库和第二图片库中每张图片上的多个极值点,针对第一图片库中的每张图片的每个极值点,计算该极值点和第二图片库每张图片的每个极值点之间的欧式距离,若所述欧式距离的最小值小于预设第五阈值,则确定第二图片库的图片中存在与该极值点匹配的极值点,并记录第一图片库中的该极值点;统计记录的第一图片库中的极值点的数量;判断所述数量是否大于预设数量阈值,如果是,则确定所述两个待检测视频为相似视频。
应用本发明实施例提供的技术方案,在进行相似视频检测时,根据第一预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库;确定所述第一图片库和第二图片库中每张图片的hash特征值及所述第一图片库中每张图片和第二图片库中每张图片之间的汉明距离,针对每个汉明距离,判断所述汉明距离是否小于预设第一阈值,如果是,确定对应该汉明距离的所述第一图片库和第二图片库中的图片为一组相似图片;统计所述第一图片库和第二图片库中相似图片的组数,并判断所述第一图片库和第二图片库中相似图片的组数与对比数量总量的比值是否大于预设第二阈值,如果是,则确定所述两个待检测视频为相似视频,其中所述对比数量总量为所述第一图片库中的图片数量和第二图片库中的图片数量的乘积。所述方法通过对比视频中的图片是否相似,并根据相似图片在对比图片总量中的比例来判断两个待检测视频是否为相似视频,因此,提高了相似视频的检测效率。
图4为本发明实施例提供的一种盗版视频的检测装置的结构示意图,与图2所示的流程示意图对应,所述装置包括:待检测视频获取模块41,图片库获取模块42,hash特征值确定模块43,相似图片确定模块44,盗版视频确定模块45。
待检测视频获取模块41,用于获取待检测视频;
图片库获取模块42,用于根据第一预设规则,从待检测视频中提取多张特征图片作为第二图片库;
hash特征值确定模块43,用于确定所述第一图片库和第二图片库中每张图片的hash特征值,其中所述第一图片库为从正版视频中提取出的多张特征图片构成的;
相似图片确定模块44,用于根据所述第一图片库和第二图片库中每张图片的hash特征值,确定所述第一图片库中每张图片和第二图片库中每张图片之间的每个汉明距离,针对每个汉明距离,判断所述汉明距离是否小于预设第一阈值,如果是,确定对应该汉明距离的所述第一图片库和第二图片库中的图片为一组相似图片;
盗版视频确定模块45,用于统计所述第一图片库和第二图片库中相似图片的组数,并判断所述第一图片库和第二图片库中相似图片的组数与对比数量总量的比值是否大于预设第二阈值,如果是,则确定所述待检测视频为盗版视频,其中所述对比数量总量为所述第一图片库中的图片数量和第二图片库中的图片数量的乘积。
所述图片库获取模块42,具体用于根据预设的时间间隔从待检测视频中提取多张特征图片作为第二图片库。
所述hash特征值确定模块43,具体用于将所述第一图片库和第二图片库中每张图片,按照预设值进行尺度变换,并对尺度变换后的所述第一图片库和第二图片库中每张图片做离散余弦变换DCT,获取所述第一图片库和第二图片库中每张图片的hash特征值。
在本发明实施例中,确定所述待检测视频为盗版视频后,为了进一步提高检测的准确性,所述装置还可以包括以下至少一个模块:
第四确定模块(图中未示出),用于根据第二预设规则,从待检测视频中提取多张特征图片作为第二图片库,第一图片库为已保存的从正版视频中提取出的多张特征图片;采用局部二值模式LBP算法,分别确定所述第一图片库和第二图片库中每张图片上每个像素点的LBP值,并根据每个像素点的LBP值绘制LBP值直方图;将所述第一图片库中每张图片和第二图片库中每张图片的LBP值直方图进行重叠,针对每对图片确定重叠区域中像素点的数量,确定重叠区域中像素点的数量的平均值,根据所述平均值及所述图片像素点的数量,获得所述第一图片库和第二图片库的相似度;判断所述相似度是否大于预设第三阈值,如果是,确定所述待检测视频为盗版视频。
第五确定模块(图中未示出),用于根据第三预设规则,从待检测视频中提取多张特征图片作为第二图片库,第一图片库为已保存的从正版视频中提取出的多张特征图片;采用结构相似性SSIM算法,确定所述第一图片库中每张图片和第二图片库中每张图片之间的每个SSIM值,并根据所述多个SSIM值,计算所述第一图片库和第二图片库的相似度;判断所述相似度是否大于预设第四阈值,如果是,确定所述待检测视频为盗版视频。
第六确定模块(图中未示出),用于根据第四预设规则,从待检测视频中提取多张特征图片作为第二图片库,第一图片库为已保存的从正版视频中提取出的多张特征图片;采用加速健壮特征SURF算法,确定所述第一图片库和第二图片库中每张图片上的多个极值点,针对第一图片库中的每张图片的每个极值点,计算该极值点和第二图片库中每张图片的每个极值点之间的欧式距离,若所述欧式距离的最小值小于预设第五阈值,则确定第二图片库的图片中存在与该极值点匹配的极值点,并记录第一图片库中的该极值点;统计记录的第一图片库中的极值点的数量;判断所述数量是否大于预设数量阈值,如果是,则确定所述待检测视频为盗版视频。
应用本发明实施例提供的技术方案,在进行盗版视频的检测时,获取待检测视频;根据第一预设规则,从待检测视频中提取多张特征图片作为第二图片库;确定所述第一图片库和第二图片库中每张图片的hash特征值,其中所述第一图片库为从正版视频中提取出的多张特征图片构成的;确定所述第一图片库和第二图片库中每张图片的hash特征值及所述第一图片库中每张图片和第二图片库中每张图片之间的汉明距离,针对每个汉明距离,判断所述汉明距离是否小于预设第一阈值,如果是,确定对应该汉明距离的所述第一图片库和第二图片库中的图片为一组相似图片;统计所述第一图片库和第二图片库中相似图片的组数,并判断所述第一图片库和第二图片库中相似图片的组数与所述对比数量总量的比值是否大于预设第二阈值,如果是,则确定所述待检测视频为盗版视频,其中所述对比数量总量为所述第一图片库中的图片数量和第二图片库中的图片数量的乘积。所述方法通过对比视频中的图片是否相似,并根据相似图片在对比图片总量中的比例来判断待检测视频是否为盗版视频,因此,提高了盗版视频的检测效率。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (24)
1.一种相似视频的检测方法,其特征在于,所述方法包括:
根据第一预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库;
确定所述第一图片库和第二图片库中每张图片的hash特征值;
根据所述第一图片库和第二图片库中每张图片的hash特征值,确定所述第一图片库中每张图片和第二图片库中每张图片之间的每个汉明距离,针对每个汉明距离,判断所述汉明距离是否小于预设第一阈值,如果是,确定对应该汉明距离的所述第一图片库和第二图片库中的图片为一组相似图片;
统计所述第一图片库和第二图片库中相似图片的组数,并判断所述第一图片库和第二图片库中相似图片的组数与对比数量总量的比值是否大于预设第二阈值,如果是,则确定所述两个待检测视频为相似视频,其中所述对比数量总量为所述第一图片库中的图片数量和第二图片库中的图片数量的乘积。
2.根据权利要求1所述的方法,其特征在于,所述确定所述第一图片库和第二图片库中每张图片的hash特征值,包括:
将所述第一图片库和第二图片库中每张图片,按照预设值进行尺度变换,并对尺度变换后的所述第一图片库和第二图片库中每张图片做离散余弦变换DCT,获取所述第一图片库和第二图片库中每张图片的hash特征值。
3.根据权利要求1所述的方法,其特征在于,所述根据第一预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库,包括:
根据预设的时间间隔从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库。
4.根据权利要求1所述的方法,其特征在于,确定两个待检测视频为相似视频后,所述方法还包括:
根据第二预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库;采用局部二值模式LBP算法,分别确定所述第一图片库和第二图片库中每张图片上每个像素点的LBP值,并根据每个像素点的LBP值绘制LBP值直方图;将所述第一图片库中每张图片和第二图片库中每张图片的LBP值直方图进行重叠,针对每对图片确定重叠区域中像素点的数量,确定重叠区域中像素点的数量的平均值,根据所述平均值及所述图片像素点的数量,确定所述第一图片库和第二图片库的相似度;判断所述相似度是否大于预设第三阈值,如果是,确定所述两个待检测视频为相似视频。
5.根据权利要求1所述的方法,其特征在于,确定所述两个待检测视频为相似视频后,所述方法还包括:
根据第三预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库;采用结构相似性SSIM算法,确定所述第一图片库中每张图片和第二图片库中每张图片之间的每个SSIM值,并根据所述多个SSIM值,计算所述第一图片库和第二图片库的相似度;判断所述相似度是否大于预设第四阈值,如果是,确定所述两个待检测视频为相似视频。
6.根据权利要求1所述的方法,其特征在于,确定所述两个待检测视频为相似视频后,所述方法还包括:
根据第四预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库;采用加速健壮特征SURF算法,确定所述第一图片库和第二图片库中每张图片上的多个极值点,针对第一图片库中的每张图片的每个极值点,计算该极值点和第二图片库中每张图片的每个极值点之间的欧式距离,若所述欧式距离的最小值小于预设第五阈值,则确定第二图片库的图片中存在与该极值点匹配的极值点,并记录第一图片库中的该极值点;统计记录的第一图片库中的极值点的数量;判断所述数量是否大于预设数量阈值,如果是,则确定所述两个待检测视频为相似视频。
7.一种盗版视频的检测方法,其特征在于,所述方法包括:
获取待检测视频;
根据第一预设规则,从待检测视频中提取多张特征图片作为第二图片库;
确定第一图片库和第二图片库中每张图片的hash特征值,其中所述第一图片库为从正版视频中提取出的多张特征图片构成的;
根据所述第一图片库和第二图片库中每张图片的hash特征值,确定所述第一图片库中每张图片和第二图片库中每张图片之间的每个汉明距离,针对每个汉明距离,判断所述汉明距离是否小于预设第一阈值,如果是,确定对应该汉明距离的所述第一图片库和第二图片库中的图片为一组相似图片;
统计所述第一图片库和第二图片库中相似图片的组数,并判断所述第一图片库和第二图片库中相似图片的组数与对比数量总量的比值是否大于预设第二阈值,如果是,则确定所述待检测视频为盗版视频,其中所述对比数量总量为所述第一图片库中的图片数量和第二图片库中的图片数量的乘积。
8.根据权利要求7所述的方法,其特征在于,所述确定所述第一图片库和第二图片库中每张图片的hash特征值,包括:
将所述第一图片库和第二图片库中每张图片,按照预设值进行尺度变换,并对尺度变换后的所述第一图片库和第二图片库中每张图片做离散余弦变换DCT,获取所述第一图片库和第二图片库中每张图片的hash特征值。
9.根据权利要求7所述的方法,其特征在于,所述根据第一预设规则,从待检测视频中提取多张特征图片作为第二图片库,包括:
根据预设的时间间隔从待检测视频中提取多张特征图片作为第二图片库。
10.根据权利要求7所述的方法,其特征在于,确定所述待检测视频为盗版视频后,所述方法还包括:
根据第二预设规则,从待检测视频中提取多张特征图片作为第二图片库,第一图片库为已保存的从正版视频中提取出的多张特征图片;采用局部二值模式LBP算法,分别确定所述第一图片库和第二图片库中每张图片上每个像素点的LBP值,并根据每个像素点的LBP值绘制LBP值直方图;将所述第一图片库中每张图片和第二图片库中每张图片的LBP值直方图进行重叠,针对每对图片确定重叠区域中像素点的数量,确定重叠区域中像素点的数量的平均值,根据所述平均值及所述图片像素点的数量,获得所述第一图片库和第二图片库的相似度;判断所述相似度是否大于预设第三阈值,如果是,确定所述待检测视频为盗版视频。
11.根据权利要求7所述的方法,其特征在于,所述确定所述待检测视频为盗版视频后,所述方法还包括:
根据第三预设规则,从待检测视频中提取多张特征图片作为第二图片库,第一图片库为已保存的从正版视频中提取出的多张特征图片;采用结构相似性SSIM算法,确定所述第一图片库中每张图片和第二图片库中每张图片之间的每个SSIM值,并根据所述多个SSIM值,计算所述第一图片库和第二图片库的相似度;判断所述相似度是否大于预设第四阈值,如果是,确定所述待检测视频为盗版视频。
12.根据权利要求7所述的方法,其特征在于,所述确定所述待检测视频为盗版视频后,所述方法还包括:
根据第四预设规则,从待检测视频中提取多张特征图片作为第二图片库,第一图片库为已保存的从正版视频中提取出的多张特征图片;采用加速健壮特征SURF算法,确定所述第一图片库和第二图片库中每张图片上的多个极值点,针对第一图片库中的每张图片的每个极值点,计算该极值点和第二图片库中每张图片的每个极值点之间的欧式距离,若所述欧式距离的最小值小于预设第五阈值,则确定第二图片库的图片中存在与该极值点匹配的极值点,并记录第一图片库中的该极值点;统计记录的第一图片库中的极值点的数量;判断所述数量是否大于预设数量阈值,如果是,则确定所述待检测视频为盗版视频。
13.一种相似视频的检测装置,其特征在于,所述装置包括:
图片库获取模块,用于根据第一预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库;
hash特征值确定模块,用于确定所述第一图片库和第二图片库中每张图片的hash特征值;
相似图片确定模块,用于根据所述第一图片库和第二图片库中每张图片的hash特征值,确定所述第一图片库中每张图片和第二图片库中每张图片之间的每个汉明距离,针对每个汉明距离,判断所述汉明距离是否小于预设第一阈值,如果是,确定对应该汉明距离的所述第一图片库和第二图片库中的图片为一组相似图片;
相似视频确定模块,用于统计所述第一图片库和第二图片库中相似图片的组数,并判断所述第一图片库和第二图片库中相似图片的组数与对比数量总量的比值是否大于预设第二阈值,如果是,则确定所述两个待检测视频为相似视频,其中所述对比数量总量为所述第一图片库中的图片数量和第二图片库中的图片数量的乘积。
14.根据权利要求13所述的装置,其特征在于,所述hash特征值确定模块,具体用于:
将所述第一图片库和第二图片库中每张图片,按照预设值进行尺度变换,并对尺度变换后的所述第一图片库和第二图片库中每张图片做离散余弦变换DCT,获取所述第一图片库和第二图片库中每张图片的hash特征值。
15.根据权利要求13所述的装置,其特征在于,所述图片库获取模块,具体用于:
根据预设的时间间隔从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库。
16.根据权利要求13所述的装置,其特征在于,所述装置还包括第一确定模块,具体用于:
根据第二预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库;采用局部二值模式LBP算法,分别确定所述第一图片库和第二图片库中每张图片上每个像素点的LBP值,并根据每个像素点的LBP值绘制LBP值直方图;将所述第一图片库中每张图片和第二图片库中每张图片的LBP值直方图进行重叠,针对每对图片确定重叠区域中像素点的数量,确定重叠区域中像素点的数量的平均值,根据所述平均值及所述图片像素点的数量,确定所述第一图片库和第二图片库的相似度;判断所述相似度是否大于预设第三阈值,如果是,确定所述两个待检测视频为相似视频。
17.根据权利要求13所述的装置,其特征在于,所述装置还包括第二确定模块,具体用于:
根据第三预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库;采用结构相似性SSIM算法,确定所述第一图片库中每张图片和第二图片库中中每张图片之间的每个SSIM值,并根据所述多个SSIM值,计算所述第一图片库和第二图片库的相似度;判断所述相似度是否大于预设第四阈值,如果是,确定所述两个待检测视频为相似视频。
18.根据权利要求13所述的装置,其特征在于,所述装置还包括第三确定模块,具体用于:
根据第四预设规则,从两个待检测视频中分别提取多张特征图片作为第一图片库和第二图片库;采用加速健壮特征SURF算法,确定所述第一图片库和第二图片库中每张图片上的多个极值点,针对第一图片库中的每张图片的每个极值点,计算该极值点和第二图片库每张图片的每个极值点之间的欧式距离,若所述欧式距离的最小值小于预设第五阈值,则确定第二图片库的图片中存在与该极值点匹配的极值点,并记录第一图片库中的该极值点;统计记录的第一图片库中的极值点的数量;判断所述数量是否大于预设数量阈值,如果是,则确定所述两个待检测视频为相似视频。
19.一种盗版视频的检测装置,其特征在于,所述装置包括:
待检测视频获取模块,用于获取待检测视频;
图片库获取模块,用于根据第一预设规则,从待检测视频中提取多张特征图片作为第二图片库;
hash特征值确定模块,用于确定第一图片库和第二图片库中每张图片的hash特征值,其中所述第一图片库为从正版视频中提取出的多张特征图片构成的;
相似图片确定模块,用于根据所述第一图片库和第二图片库中每张图片的hash特征值,确定所述第一图片库中每张图片和第二图片库中每张图片之间的每个汉明距离,针对每个汉明距离,判断所述汉明距离是否小于预设第一阈值,如果是,确定对应该汉明距离的所述第一图片库和第二图片库中的图片为一组相似图片;
盗版视频确定模块,用于统计所述第一图片库和第二图片库中相似图片的组数,并判断所述第一图片库和第二图片库中相似图片的组数与对比数量总量的比值是否大于预设第二阈值,如果是,则确定所述待检测视频为盗版视频,其中所述对比数量总量为所述第一图片库中的图片数量和第二图片库中的图片数量的乘积。
20.根据权利要求19所述的装置,其特征在于,所述hash特征值确定模块,具体用于:
将所述第一图片库和第二图片库中每张图片,按照预设值进行尺度变换,并对尺度变换后的所述第一图片库和第二图片库中每张图片做离散余弦变换DCT,获取所述第一图片库和第二图片库中每张图片的hash特征值。
21.根据权利要求19所述的装置,其特征在于,所述图片库获取模块,具体用于:
根据预设的时间间隔从待检测视频中提取多张特征图片作为第二图片库。
22.根据权利要求19所述的装置,其特征在于,所述装置还包括第四确定模块,具体用于:
根据第二预设规则,从待检测视频中提取多张特征图片作为第二图片库,第一图片库为已保存的从正版视频中提取出的多张特征图片;采用局部二值模式LBP算法,分别确定所述第一图片库和第二图片库中每张图片上每个像素点的LBP值,并根据每个像素点的LBP值绘制LBP值直方图;将所述第一图片库中每张图片和第二图片库中每张图片的LBP值直方图进行重叠,针对每对图片确定重叠区域中像素点的数量,确定重叠区域中像素点的数量的平均值,根据所述平均值及所述图片像素点的数量,获得所述第一图片库和第二图片库的相似度;判断所述相似度是否大于预设第三阈值,如果是,确定所述待检测视频为盗版视频。
23.根据权利要求19所述的装置,其特征在于,所述装置还包括第五确定模块,具体用于:
根据第三预设规则,从待检测视频中提取多张特征图片作为第二图片库,第一图片库为已保存的从正版视频中提取出的多张特征图片;采用结构相似性SSIM算法,确定所述第一图片库中每张图片和第二图片库中每张图片之间的每个SSIM值,并根据所述多个SSIM值,计算所述第一图片库和第二图片库的相似度;判断所述相似度是否大于预设第四阈值,如果是,确定所述待检测视频为盗版视频。
24.根据权利要求19所述的装置,其特征在于,所述装置还包括第六确定模块,具体用于:
根据第四预设规则,从待检测视频中提取多张特征图片作为第二图片库,第一图片库为已保存的从正版视频中提取出的多张特征图片;采用加速健壮特征SURF算法,确定所述第一图片库和第二图片库中每张图片上的多个极值点,针对第一图片库中的每张图片的每个极值点,计算该极值点和第二图片库中每张图片的每个极值点之间的欧式距离,若所述欧式距离的最小值小于预设第五阈值,则确定第二图片库的图片中存在与该极值点匹配的极值点,并记录第一图片库中的该极值点;统计记录的第一图片库中的极值点的数量;判断所述数量是否大于预设数量阈值,如果是,则确定所述待检测视频为盗版视频。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201511032299.XA CN105681899B (zh) | 2015-12-31 | 2015-12-31 | 一种相似视频和盗版视频的检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201511032299.XA CN105681899B (zh) | 2015-12-31 | 2015-12-31 | 一种相似视频和盗版视频的检测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105681899A CN105681899A (zh) | 2016-06-15 |
CN105681899B true CN105681899B (zh) | 2019-05-10 |
Family
ID=56298518
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201511032299.XA Active CN105681899B (zh) | 2015-12-31 | 2015-12-31 | 一种相似视频和盗版视频的检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105681899B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108881947B (zh) * | 2017-05-15 | 2021-08-17 | 阿里巴巴集团控股有限公司 | 一种直播流的侵权检测方法及装置 |
CN108052972A (zh) * | 2017-12-11 | 2018-05-18 | 奕响(大连)科技有限公司 | 一种双拼的单通道的图片相似判定方法 |
CN108419092B (zh) * | 2018-04-19 | 2021-12-10 | 深圳大普微电子科技有限公司 | 一种确定相同视频的方法及装置 |
CN109788310A (zh) * | 2019-01-18 | 2019-05-21 | 陕西优米数据技术有限公司 | 基于区块链技术的微视频版权自动检测方法 |
CN110324729B (zh) * | 2019-07-18 | 2021-08-27 | 北京奇艺世纪科技有限公司 | 一种识别侵权视频链接的方法、装置、电子设备及介质 |
CN110737802B (zh) * | 2019-10-15 | 2022-06-03 | 中科智云科技有限公司 | 盗版视频检测方法、装置、电子设备及存储介质 |
CN111008666A (zh) * | 2019-12-05 | 2020-04-14 | 秒针信息技术有限公司 | 一种视频相似确定方法、装置、电子设备及存储介质 |
CN112149744B (zh) * | 2020-09-25 | 2022-09-16 | 浙江数秦科技有限公司 | 一种侵权图片快速识别方法 |
CN112688931B (zh) * | 2020-12-21 | 2022-08-12 | 杭州当虹科技股份有限公司 | 一种使用RecordRTC获取视频播放网页取证内容的方法 |
CN112788363B (zh) * | 2020-12-30 | 2023-04-28 | 北京奇艺世纪科技有限公司 | 识别侵权视频的方法、识别侵权视频的装置及电子设备 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2093699A1 (en) * | 2008-02-19 | 2009-08-26 | British Telecommunications Public Limited Company | Movable object status determination |
CN101807257A (zh) * | 2010-05-12 | 2010-08-18 | 上海交通大学 | 图像标签信息识别方法 |
CN101901346A (zh) * | 2010-05-06 | 2010-12-01 | 复旦大学 | 一种对彩色数字图像进行不良内容识别的方法 |
CN102346854A (zh) * | 2010-08-03 | 2012-02-08 | 株式会社理光 | 前景物体检测方法和设备 |
CN102393900A (zh) * | 2011-07-02 | 2012-03-28 | 山东大学 | 基于鲁棒哈希的视频拷贝检测方法 |
CN103150712A (zh) * | 2013-01-18 | 2013-06-12 | 清华大学 | 一种基于投影序列数据相似性的图像去噪方法 |
CN104036285A (zh) * | 2014-05-12 | 2014-09-10 | 新浪网技术(中国)有限公司 | 垃圾图片识别方法及系统 |
CN104036009A (zh) * | 2014-06-24 | 2014-09-10 | 北京奇虎科技有限公司 | 一种搜索匹配图片的方法、图片搜索方法及装置 |
CN104636488A (zh) * | 2015-02-26 | 2015-05-20 | 北京奇艺世纪科技有限公司 | 一种基于图片的重复视频文件确定方法及装置 |
CN105072455A (zh) * | 2015-08-11 | 2015-11-18 | 精硕世纪科技(北京)有限公司 | 视频匹配方法和装置 |
-
2015
- 2015-12-31 CN CN201511032299.XA patent/CN105681899B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2093699A1 (en) * | 2008-02-19 | 2009-08-26 | British Telecommunications Public Limited Company | Movable object status determination |
CN101901346A (zh) * | 2010-05-06 | 2010-12-01 | 复旦大学 | 一种对彩色数字图像进行不良内容识别的方法 |
CN101807257A (zh) * | 2010-05-12 | 2010-08-18 | 上海交通大学 | 图像标签信息识别方法 |
CN102346854A (zh) * | 2010-08-03 | 2012-02-08 | 株式会社理光 | 前景物体检测方法和设备 |
CN102393900A (zh) * | 2011-07-02 | 2012-03-28 | 山东大学 | 基于鲁棒哈希的视频拷贝检测方法 |
CN103150712A (zh) * | 2013-01-18 | 2013-06-12 | 清华大学 | 一种基于投影序列数据相似性的图像去噪方法 |
CN104036285A (zh) * | 2014-05-12 | 2014-09-10 | 新浪网技术(中国)有限公司 | 垃圾图片识别方法及系统 |
CN104036009A (zh) * | 2014-06-24 | 2014-09-10 | 北京奇虎科技有限公司 | 一种搜索匹配图片的方法、图片搜索方法及装置 |
CN104636488A (zh) * | 2015-02-26 | 2015-05-20 | 北京奇艺世纪科技有限公司 | 一种基于图片的重复视频文件确定方法及装置 |
CN105072455A (zh) * | 2015-08-11 | 2015-11-18 | 精硕世纪科技(北京)有限公司 | 视频匹配方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN105681899A (zh) | 2016-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105681899B (zh) | 一种相似视频和盗版视频的检测方法及装置 | |
CN105681898B (zh) | 一种相似视频和盗版视频的检测方法及装置 | |
US11527070B2 (en) | Methods and apparatus to count people in images | |
CN105657547B (zh) | 一种相似视频和盗版视频的检测方法及装置 | |
US9646358B2 (en) | Methods for scene based video watermarking and devices thereof | |
US9986289B2 (en) | Methods and apparatus to count people | |
US9292736B2 (en) | Methods and apparatus to count people in images | |
CN108769731A (zh) | 一种检测视频中目标视频片段的方法、装置及电子设备 | |
US8433108B2 (en) | Video fingerprinting | |
US20090290752A1 (en) | Method for producing video signatures and identifying video clips | |
Stamm et al. | Forensics vs. anti-forensics: A decision and game theoretic framework | |
US9465999B2 (en) | Methods and apparatus to count people in images | |
CN103718193B (zh) | 用于比较视频的方法和设备 | |
Bianchi et al. | Detection of non-aligned double JPEG compression with estimation of primary compression parameters | |
US9275285B2 (en) | Methods and apparatus to count people in images | |
CN102098531A (zh) | 一种检测摄像机被干扰的方法及装置 | |
GB2501224A (en) | Generating and comparing video signatures using sets of image features | |
CN102226920A (zh) | 抗裁剪的jpeg图像压缩历史及合成篡改检测方法 | |
CN108038462A (zh) | 一种对实时视频进行人脸检测并识别的方法及装置 | |
Tralic et al. | JPEG image tampering detection using blocking artifacts | |
Xiang et al. | Perceptual video hashing robust against geometric distortions | |
Shukla et al. | Overview of Scene Change Detection-Application to Watermarking | |
Li et al. | Efficient compressed domain video copy detection | |
Vashistha et al. | 2PASCD: an efficient 2-pass abrupt scene change detection algorithm | |
Leon et al. | Video identification using video tomography |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |