CN107801091B - 一种视频文件相似性识别方法和装置 - Google Patents

一种视频文件相似性识别方法和装置 Download PDF

Info

Publication number
CN107801091B
CN107801091B CN201610801423.2A CN201610801423A CN107801091B CN 107801091 B CN107801091 B CN 107801091B CN 201610801423 A CN201610801423 A CN 201610801423A CN 107801091 B CN107801091 B CN 107801091B
Authority
CN
China
Prior art keywords
video file
basic frame
video
frame information
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610801423.2A
Other languages
English (en)
Other versions
CN107801091A (zh
Inventor
刘述
夏勇
段世惠
田辉
高巍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Academy of Information and Communications Technology CAICT
Original Assignee
China Academy of Telecommunications Research CATR
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Academy of Telecommunications Research CATR filed Critical China Academy of Telecommunications Research CATR
Priority to CN201610801423.2A priority Critical patent/CN107801091B/zh
Publication of CN107801091A publication Critical patent/CN107801091A/zh
Application granted granted Critical
Publication of CN107801091B publication Critical patent/CN107801091B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display

Abstract

本发明提供了一种视频文件相似性识别方法和装置,该方法包括:分别提取第一视频文件、第二视频文件的时间特征序列;对第一视频文件的时间特征序列和第二视频文件的时间特征序列进行相关性计算,如果相关性计算结果高于预设阈值,则确定第一视频文件和第二视频文件是同一内容的视频文件,否则,确定第一视频文件和第二视频文件不是同一内容的视频文件。本发明能够以较小的运算量,准确识别出如码率、分辨率、帧率等指标不同,但内容有微小差别或无差别的两个视频文件。

Description

一种视频文件相似性识别方法和装置
技术领域
本发明涉及视频处理技术领域,特别涉及一种视频文件相似性识别方法和装置。
背景技术
视频识别也是当前比较热门的领域。
视频识别主要有两种方式,一种是对视频文件本身进行哈希计算,两个视频文件的哈希值一致则认为两个视频文件是同一个视频文件;另一种方式是对视频图像进行比较识别,视频图像一致则认为两个视频文件是同一个视频文件。
哈希计算的方法比较方便快捷,但是对于文件内容的微小变化十分敏感,码率不同、帧率不同、画面有水标或字幕不同,都会使相同内容的两个视频文件的哈希值完全不同。而图像识别方法需要很大的运算量,识别过程比较漫长,只适用于某些特定的场景。
发明内容
有鉴于此,本发明的目的在于一种视频文件相似性识别方法和装置,能够以较小的运算量,准确识别出码率、帧率、分辨率等指标不同,但内容有微小差别或无差别的两个视频文件。
为了达到上述目的,本发明提供了如下技术方案:
一种视频文件相似性识别方法,该方法包括:
分别提取第一视频文件、第二视频文件的时间特征序列;
对第一视频文件的时间特征序列和第二视频文件的时间特征序列进行相关性计算,如果相关性计算结果高于预设阈值,则确定第一视频文件和第二视频文件是同一内容的视频文件,否则,确定第一视频文件和第二视频文件不是同一内容的视频文件。
一种视频文件相似性识别装置,该装置包括:提取单元、识别单元;
所述提取单元,用于分别提取第一视频文件、第二视频文件的时间特征序列;
所述识别单元,用于对第一视频文件的时间特征序列和第二视频文件的时间特征序列进行相关性计算,如果相关性计算结果高于预设阈值,则确定第一视频文件和第二视频文件是同一内容的视频文件,否则,确定第一视频文件和第二视频文件不是同一内容的视频文件。
由上面的技术方案可知,本发明中,通过提取和比较两个视频文件的时间特征序列确定两个视频文件的相似性,相对于现有图像识别方法,运算量大大降低,相对于现有哈希算法,则可以准确识别出出码率、帧率、分辨率等指标不同,但内容有微小差别或无差别的两个视频文件,避免哈希算法中因文件内容有变化而导致的误判。
附图说明
图1是本发明实施例视频文件相似性识别方法流程图;
图2是本发明实施例视频文件相似性识别装置的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,下面结合附图并据实施例,对本发明的技术方案进行详细说明。
参见图1,图1是本发明实施例视频文件相似性识别方法流程图,如图1所示,该方法包括如下步骤:
步骤101、分别提取第一视频文件、第二视频文件的时间特征序列;
在本实施例中,提取视频文件的基础帧信息(I帧),并按照一定的规则排序,从而构成视频文件的时间特征序列,基于视频文件的时间特征序列进行相似性比较。对于是同一视频内容的两个视频文件来说,提取的基础帧信息按照相同的规则排序后形成的时间特征序列,其相关性是很高的,因此,可以根据两个视频文件的时间特征序列的相关性来判断两个视频文件是否是同一视频内容的视频文件。
提取第一视频文件的时间特征序列的具体方法为:提取第一视频文件从播放起始位置开始第一预设时长内的视频内容中的所有基础帧信息,将提取的第一视频文件的所有基础帧信息按照预设规则排列后作为第一视频文件的时间特征序列。
提取第二视频文件的时间特征序列的具体方法为:提取第二视频文件从播放起始位置开始第一预设时长内的视频内容中的所有基础帧信息,将提取的第二视频文件的所有基础帧信息按照预设规则排列后作为第二视频文件的时间特征序列。
在本实施例中,一基础帧信息可以包括以下内容:基础帧的播放序号、基础帧包括的总数据字节数、基础帧播放的相对起始时刻(也即基础帧相对于视频文件的播放起始时间的播放时刻)。
在本实施例中,可以基础帧的播放序号,进行基础帧信息的排序。具体地,
将提取的第一视频文件的所有基础帧信息按照预设规则排列的方法具体可以为:将提取的第一视频文件的所有基础帧信息按照播放序号从小到大的顺序排列,或者,将提取的第一视频文件的所有基础帧信息按照播放的相对起始时间从小到大的顺序排序。
将提取的第二视频文件的所有基础帧信息按照预设规则排列的方法具体可以为:将提取的第二视频文件的所有基础帧信息按照播放序号从小到大的顺序排列,或者,将提取的第二视频文件的所有基础帧信息按照播放的相对起始时间从小到大的顺序排序。
步骤102、对第一视频文件的时间特征序列和第二视频文件的时间特征序列进行相关性计算,如果相关性计算结果高于预设阈值,则确定第一视频文件和第二视频文件是同一内容视频文件,否则,确定第一视频文件和第二视频文件不是同一视频文件。
在本实施例中,对第一视频文件的时间特征序列和第二视频文件的时间特征序列的相关性计算可以采用现有技术方法,例如,a)统计学上以时间为参数的相关函数计算;b)欧氏空间的距离;c)动态时间弯曲算法下的距离;等等。
实际上,同一视频内容的两个视频文件,其播放总时长应该基本相同,如果两个视频文件的播放总时长差别过大,则说明两个视频文件不是同一视频文件。
基于上述原理分析,在本实施例中,在执行步骤101之前,可以先分别提取第一视频文件、第二视频文件的播放总时长,并计算第一视频文件的播放总时长与第二视频文件的播放总时长之间的差值,如果差值的绝对值小于第二预设时长,则继续执行步骤1,否则,可以直接确定第一视频文件和第二视频文件不是同一视频文件,并停止本次相似性识别过程(不再执行步骤101、102)。
在本实施例中,所述第一视频文件、第二视频文件均为采用H.264或MPEG4编码方式的视频文件。
以上结合图1对本发明实施例视频文件相似性识别方法进行了详细说明,本申请还提供了一种视频文件相似性识别装置,以下结合图2进行详细说明:
参见图2,图2是本发明实施例视频文件相似性识别装置的结构示意图,如图2所示,该装置包括:提取单元201、识别单元202;其中,
提取单元201,用于分别提取第一视频文件、第二视频文件的时间特征序列;
识别单元202,用于对第一视频文件的时间特征序列和第二视频文件的时间特征序列进行相关性计算,如果相关性计算结果高于预设阈值,则确定第一视频文件和第二视频文件是同一内容的视频文件,否则,确定第一视频文件和第二视频文件不是同一内容的视频文件。
图2所示装置中,
所述提取单元201,执行分别提取第一视频文件、第二视频文件的时间特征序列的操作之前,进一步用于:
分别提取第一视频文件、第二视频文件的播放总时长,并计算第一视频文件的播放总时长与第二视频文件的播放总时长之间的差值,如果差值的绝对值小于第二预设时长,则继续执行分别提取第一视频文件、第二视频文件的时间特征序列的操作,否则,确定第一视频文件和第二视频文件不是同一内容视频文件,并停止本次相似性识别过程。
图2所示装置中,
所述提取单元201,提取第一视频文件的时间特征序列时,用于:提取第一视频文件从播放起始位置开始第一预设时长内的视频内容中的所有基础帧信息,将提取的第一视频文件的所有基础帧信息按照预设规则排列后作为第一视频文件的时间特征序列;
所述提取单元201,提取第二视频文件的时间特征序列时,用于:提取第二视频文件从播放起始位置开始预设时长内的视频内容中的所有基础帧信息,将提取的第二视频文件的所有基础帧信息按照预设规则排列后作为第二视频文件的时间特征序列。
图2所示装置中,
所述基础帧信息包括基础帧的播放序号、基础帧包括的总数据字节数、基础帧播放的相对起始时间;
所述提起单元201,将提取的第一视频文件的所有基础帧信息按照预设规则排列时,用于:将提取的第一视频文件的所有基础帧信息按照播放序号从小到大的顺序排列,或者,将提取的第一视频文件的所有基础帧信息按照播放的相对起始时间从小到大的顺序排序;
所述提起单元201,将提取的第二视频文件的所有基础帧信息按照预设规则排列时,用于:将提取的第二视频文件的所有基础帧信息按照播放序号从小到大的顺序排列,或者,将提取的第二视频文件的所有基础帧信息按照播放的相对起始时间从小到大的顺序排序。
图2所示装置中,
所述第一视频文件为采用H.264或MPEG4编码方式的视频文件;
所述第二视频文件为采用H.264或MPEG4编码方式的视频文件。
从上面的内容可以看出,在本发明中,通过提取视频文件从播放起始位置开始一段时间内的基础帧信息,并以基础帧信息构成的序列为时间特征序列进行相关性计算,相对于现有技术中的哈希算法对码率、帧率、和/画面的微小变化的敏感度高,因此可以避免因码率、帧率、分辨率和画面的微小变化而导致的误判,具体来说,使用本发明提供的技术方案,既可以识别出具有相同视频内容但码率不同的两个视频文件;也可以识别出具有相同视频内容但采用不同编码器设置的两个视频文件,例如编码器设置是否使用B帧,连续出现B帧的数量;还可以识别出具有相同视频内容但帧速不同的两个视频文件,例如帧速为50帧/秒和25帧/秒;还可以识别出具有相同视频内容但一个添加了版权信息、另一个未添加版权信息的两个视频文件。另一方面,本发明仅利用基础帧信息构成的时间特征序列进行相关性计算,相对于现有技术中的图像识别方法,运算量大大降低。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (10)

1.一种视频文件相似性识别方法,其特征在于,该方法包括:
分别提取第一视频文件、第二视频文件的时间特征序列;所述时间特征序列为视频文件的按照预设规则排序的基础帧信息;所述基础帧信息包括基础帧的播放序号、基础帧包括的总数据字节数、基础帧播放的相对起始时间;
对第一视频文件的时间特征序列和第二视频文件的时间特征序列进行相关性计算,如果相关性计算结果高于预设阈值,则确定第一视频文件和第二视频文件是同一内容的视频文件,否则,确定第一视频文件和第二视频文件不是同一内容的视频文件。
2.根据权利要求1所述的方法,其特征在于,
执行分别提取第一视频文件、第二视频文件的时间特征序列的操作之前,进一步包括:
分别提取第一视频文件、第二视频文件的播放总时长,并计算第一视频文件的播放总时长与第二视频文件的播放总时长之间的差值,如果差值的绝对值小于第二预设时长,则继续执行分别提取第一视频文件、第二视频文件的时间特征序列的操作,否则,确定第一视频文件和第二视频文件不是同一内容的视频文件,并停止本次相似性识别过程。
3.根据权利要求1所述的方法,其特征在于,
提取第一视频文件的时间特征序列的方法为:提取第一视频文件从播放起始位置开始第一预设时长内的视频内容中的所有基础帧信息,将提取的第一视频文件的所有基础帧信息按照预设规则排列后作为第一视频文件的时间特征序列;
提取第二视频文件的时间特征序列的方法为:提取第二视频文件从播放起始位置开始第一预设时长内的视频内容中的所有基础帧信息,将提取的第二视频文件的所有基础帧信息按照预设规则排列后作为第二视频文件的时间特征序列;
4.根据权利要求1所述的方法,其特征在于,
将提取的第一视频文件的所有基础帧信息按照预设规则排列的方法为:将提取的第一视频文件的所有基础帧信息按照播放序号从小到大的顺序排列,或者,将提取的第一视频文件的所有基础帧信息按照播放的相对起始时间从小到大的顺序排序;
将提取的第二视频文件的所有基础帧信息按照预设规则排列的方法为:将提取的第二视频文件的所有基础帧信息按照播放序号从小到大的顺序排列,或者,将提取的第二视频文件的所有基础帧信息按照播放的相对起始时间从小到大的顺序排序。
5.根据权利要求1-4任一权项所述的方法,其特征在于,
所述第一视频文件为采用H.264或MPEG4编码方式的视频文件;
所述第二视频文件为采用H.264或MPEG4编码方式的视频文件。
6.一种视频文件相似性识别装置,其特征在于,该装置包括:提取单元、识别单元;
所述提取单元,用于分别提取第一视频文件、第二视频文件的时间特征序列;所述时间特征序列为视频文件的按照预设规则排序的基础帧信息;所述基础帧信息包括基础帧的播放序号、基础帧包括的总数据字节数、基础帧播放的相对起始时间;
所述识别单元,用于对第一视频文件的时间特征序列和第二视频文件的时间特征序列进行相关性计算,如果相关性计算结果高于预设阈值,则确定第一视频文件和第二视频文件是同一内容的视频文件,否则,确定第一视频文件和第二视频文件不是同一内容的视频文件。
7.根据权利要求6所述的装置,其特征在于,
所述提取单元,执行分别提取第一视频文件、第二视频文件的时间特征序列的操作之前,进一步用于:
分别提取第一视频文件、第二视频文件的播放总时长,并计算第一视频文件的播放总时长与第二视频文件的播放总时长之间的差值,如果差值的绝对值小于第二预设时长,则继续执行分别提取第一视频文件、第二视频文件的时间特征序列的操作,否则,确定第一视频文件和第二视频文件不是同一内容视频文件,并停止本次相似性识别过程。
8.根据权利要求6所述的装置,其特征在于,
所述提取单元,提取第一视频文件的时间特征序列时,用于:提取第一视频文件从播放起始位置开始第一预设时长内的视频内容中的所有基础帧信息,将提取的第一视频文件的所有基础帧信息按照预设规则排列后作为第一视频文件的时间特征序列;
所述提取单元,提取第二视频文件的时间特征序列时,用于:提取第二视频文件从播放起始位置开始第一预设时长内的视频内容中的所有基础帧信息,将提取的第二视频文件的所有基础帧信息按照预设规则排列后作为第二视频文件的时间特征序列;
9.根据权利要求6所述的装置,其特征在于,
所述提取单元,将提取的第一视频文件的所有基础帧信息按照预设规则排列时,用于:将提取的第一视频文件的所有基础帧信息按照播放序号从小到大的顺序排列,或者,将提取的第一视频文件的所有基础帧信息按照播放的相对起始时间从小到大的顺序排序;
所述提取单元,将提取的第二视频文件的所有基础帧信息按照预设规则排列时,用于:将提取的第二视频文件的所有基础帧信息按照播放序号从小到大的顺序排列,或者,将提取的第二视频文件的所有基础帧信息按照播放的相对起始时间从小到大的顺序排序。
10.根据权利要求6-9任一权项所述的装置,其特征在于,
所述第一视频文件为采用H.264或MPEG4编码方式的视频文件;
所述第二视频文件为采用H.264或MPEG4编码方式的视频文件。
CN201610801423.2A 2016-09-05 2016-09-05 一种视频文件相似性识别方法和装置 Active CN107801091B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610801423.2A CN107801091B (zh) 2016-09-05 2016-09-05 一种视频文件相似性识别方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610801423.2A CN107801091B (zh) 2016-09-05 2016-09-05 一种视频文件相似性识别方法和装置

Publications (2)

Publication Number Publication Date
CN107801091A CN107801091A (zh) 2018-03-13
CN107801091B true CN107801091B (zh) 2020-06-19

Family

ID=61530647

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610801423.2A Active CN107801091B (zh) 2016-09-05 2016-09-05 一种视频文件相似性识别方法和装置

Country Status (1)

Country Link
CN (1) CN107801091B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111696105B (zh) * 2020-06-24 2023-05-23 北京金山云网络技术有限公司 视频处理方法、装置和电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104216925A (zh) * 2013-06-05 2014-12-17 中国科学院声学研究所 一种视频内容去重的处理方法
CN105468755A (zh) * 2015-11-27 2016-04-06 东方网力科技股份有限公司 一种视频筛选存储方法和装置
CN105608233A (zh) * 2016-02-26 2016-05-25 北京大学 一种基于改进的om特征的视频拷贝检测方法
CN105893405A (zh) * 2015-11-12 2016-08-24 乐视云计算有限公司 重复视频检测方法和系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070061727A1 (en) * 2005-09-15 2007-03-15 Honeywell International Inc. Adaptive key frame extraction from video data

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104216925A (zh) * 2013-06-05 2014-12-17 中国科学院声学研究所 一种视频内容去重的处理方法
CN105893405A (zh) * 2015-11-12 2016-08-24 乐视云计算有限公司 重复视频检测方法和系统
CN105468755A (zh) * 2015-11-27 2016-04-06 东方网力科技股份有限公司 一种视频筛选存储方法和装置
CN105608233A (zh) * 2016-02-26 2016-05-25 北京大学 一种基于改进的om特征的视频拷贝检测方法

Also Published As

Publication number Publication date
CN107801091A (zh) 2018-03-13

Similar Documents

Publication Publication Date Title
US8433108B2 (en) Video fingerprinting
CN106484837B (zh) 相似视频文件的检测方法和装置
Zhang et al. Efficient video frame insertion and deletion detection based on inconsistency of correlations between local binary pattern coded frames
US11763431B2 (en) Scene-based image processing method, apparatus, smart terminal and storage medium
CN109063611B (zh) 一种基于视频语义的人脸识别结果处理方法和装置
US20180218222A1 (en) Persistent feature descriptors for video
JP2014506062A5 (zh)
WO2014000515A1 (zh) 一种广告视频检测方法
CN108989875B (zh) 一种生成弹幕文件的方法及装置
CN107609149B (zh) 一种视频定位方法和装置
CN112257595A (zh) 视频匹配方法、装置、设备及存储介质
EP2393290B1 (en) Video identifier creation device
CN107203763B (zh) 文字识别方法和装置
CN109697240B (zh) 一种基于特征的图像检索方法及装置
CN107801091B (zh) 一种视频文件相似性识别方法和装置
KR20190056457A (ko) 보행자 의상 특징 추출을 통한 보행자 추적 방법
KR20200042979A (ko) 영상정보기기에서의 개인정보의 비식별화 방법 및 시스템
KR101667011B1 (ko) 입체 영상의 장면 전환 검출 장치 및 방법
CN104102861A (zh) 一种基于文件头和压缩参数的jpeg图片原始性检测方法
JPWO2010084738A1 (ja) 照合加重情報抽出装置
CN105847849A (zh) 视频帧检测方法、装置、视频帧处理系统及计算机设备
KR100963701B1 (ko) 영상 식별 장치
CN105678243B (zh) 一种监控视频特征帧在线提取方法
KR101284200B1 (ko) 영상에서 연기를 검출하기 위한 영상처리 장치 및 방법
CN103646401B (zh) 基于时间梯度与空间梯度实现视频指纹提取的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20211223

Address after: 100191 No. 40, Haidian District, Beijing, Xueyuan Road

Patentee after: CHINA ACADEMY OF INFORMATION AND COMMUNICATIONS

Address before: 100191 No. 52 Garden North Road, Beijing, Haidian District

Patentee before: CHINA ACADEME OF TELECOMMUNICATION RESEARCH OF MIIT

TR01 Transfer of patent right