CN110377794B - 一种视频特征描述与去重检索处理方法 - Google Patents
一种视频特征描述与去重检索处理方法 Download PDFInfo
- Publication number
- CN110377794B CN110377794B CN201910504177.8A CN201910504177A CN110377794B CN 110377794 B CN110377794 B CN 110377794B CN 201910504177 A CN201910504177 A CN 201910504177A CN 110377794 B CN110377794 B CN 110377794B
- Authority
- CN
- China
- Prior art keywords
- video
- feature
- videos
- frame
- file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
Abstract
本发明公开了一种视频特征描述与去重检索处理方法。它具体包括如下步骤:(1)视频特征描述:对于任意视频,定义一个特征,并以此为基础进行变换得到多个特征;(2)去重检索处理:定义两个视频相似的条件,并对待检索视频进行步骤(1)中的特征提取,然后根据条件进行快速整理。本发明的有益效果是:首先通过定义多个视频特征来描述相应的视频,然后根据视频特征来定义视频相似的条件,最后对待检测的视频进行视频处理获得相应的视频特征,并根据视频特征来去重检所处理,这样设计实现了对视频的快速整理,大大减少人力开销。
Description
技术领域
本发明涉及视频处理相关技术领域,尤其是指一种视频特征描述与去重检索处理方法。
背景技术
视频在不同的渠道传播加工过程中经常会进行如不同分辨率、不同码率的转码、加黑边、字幕、台标等处理。不同的内容提供商的同一部片子的视频可能存在上述的不同。
内容引进方经常会引进海量的来自不同内容提供方的视频内容,这样的内容会多达几万部。内容提供方会提供的内容会包括片名、文件大小、时长等描述。但不同内容提供方提供的同一部片子的片名经常会有不一致,如中英文问题、大小写问题等不同的命名方式。这些文件混在一起,整理花费时间成本较大。
发明内容
本发明是为了克服现有技术中存在上述的不足,提供了一种减少人力开销的视频特征描述与去重检索处理方法。
为了实现上述目的,本发明采用以下技术方案:
一种视频特征描述与去重检索处理方法,具体包括如下步骤:
(1)视频特征描述:对于任意视频,定义一个特征,并以此为基础进行变换得到多个特征;
(2)去重检索处理:定义两个视频相似的条件,并对待检索视频进行步骤(1)中的特征提取,然后根据条件进行快速整理。
本发明首先通过定义多个视频特征来描述相应的视频,然后根据视频特征来定义视频相似的条件,最后对待检测的视频进行视频处理获得相应的视频特征,并根据视频特征来去重检所处理,这样设计实现了对视频的快速整理,大大减少人力开销。
作为优选,在步骤(1)中,视频特征描述的具体方法如下:
(11)对于任意视频,为其视频帧编号,第一帧编号为1,逐帧加1,其总帧数记为N;
(12)对视频进行场景检测,每一个场景切换的视频帧序号记录下来;
(13)假设检测为n段场景,经过检测后形成视频帧序列S1,S2,S3,…,Sn,其中Si为该场景切换时的视频帧序号,其中Sn值为N+1,该组视频帧序列命名为特征A;
(14)采用视频帧序号差记录的方式,将步骤(13)中的视频帧序列做如下变换为:D1=S1-1,D2=S2-S1,D3=S3-S2,…,Dn=Sn-Sn-1;由该变换后的D1,D2,D3,…,Dn组成的数字序列命名为特征B;
(15)由特征A进行Hash后形成的特征为C;
(16)由特征B进行Hash后形成的特征为D。
作为优选,所述的特征C和特征D为抽象特征,因为长度固定,用于检索;特征A和特征B为具体特征,方便利用该特征进行扩展业务,包括关键帧提取、片段提取。
作为优选,在步骤(2)中,定义两个视频相似的条件为:具有同样的总帧数,且特征A、特征B、特征C、特征D中一种或多种特征相等;去重检索处理的具体方法如下:
(21)将待检索视频文件集中的文件名称、文件大小、文件路径信息形成记录清单;
(22)对清单中的待检索视频集中的每一个视频文件,获取视频总帧数;
(23)按照总帧数对视频文件进行排序;
(24)对总帧数一样的视频,按照步骤(1)中的具体方法进行视频解码后进行场景检测,形成特征A、特征B、特征C、特征D;
(25)特征一致的视频,则认为是相似视频,归为一组。
作为优选,在步骤(24)中,在形成特征A、特征B、特征C、特征D后,将每一次场景切换关键帧的解码图像转成图像类型文件格式存储起来;在步骤(25)之后添加步骤(26),用户查看相似视频的场景切换关键帧,以快速对比视频是否一致。
本发明的有益效果是:首先通过定义多个视频特征来描述相应的视频,然后根据视频特征来定义视频相似的条件,最后对待检测的视频进行视频处理获得相应的视频特征,并根据视频特征来去重检所处理,这样设计实现了对视频的快速整理,大大减少人力开销。
具体实施方式
下面结合具体实施方式对本发明做进一步的描述。
一种视频特征描述与去重检索处理方法,具体包括如下步骤:
(1)视频特征描述:对于任意视频,定义一个特征,并以此为基础进行变换得到多个特征;
视频特征描述的具体方法如下:
(11)对于任意视频,为其视频帧编号,第一帧编号为1,逐帧加1,其总帧数记为N;
(12)对视频进行场景检测,每一个场景切换的视频帧序号记录下来;具体的场景检测可采用关键帧检测算法等,检测算法不做预设;
(13)假设检测为n段场景,经过检测后形成视频帧序列S1,S2,S3,…,Sn,其中Si为该场景切换时的视频帧序号,其中Sn值为N+1,该组视频帧序列命名为特征A;
(14)采用视频帧序号差记录的方式,将步骤(13)中的视频帧序列做如下变换为:D1=S1-1,D2=S2-S1,D3=S3-S2,…,Dn=Sn-Sn-1;由该变换后的D1,D2,D3,…,Dn组成的数字序列命名为特征B;
(15)由特征A进行Hash后形成的特征为C;具体为:由特征A可以进一步编码成字符串,如“S1,S2,S3,…,Sn”(形式可以进行扩展,不限于举例方式)的形式,然后对该字符串通过进行哈希Hash算法(如常用算法MD4、MD5、SHA等)后求得的Hash值作为特征,记为特征C;
(16)由特征B进行Hash后形成的特征为D;具体为:由特征B可以进一步编码成字符串,如“D1,D2,D3,…,Dn”(形式可以进行扩展,不限于举例方式)的形式,然后对该字符串进行哈希Hash算法(如常用算法MD4、MD5、SHA等)后求得的Hash值作为特征,记为特征D。
其中:特征C和特征D为抽象特征,因为长度固定,用于检索;特征A和特征B为具体特征,方便利用该特征进行扩展业务,包括关键帧提取、片段提取。
(2)去重检索处理:定义两个视频相似的条件,并对待检索视频进行步骤(1)中的特征提取,然后根据条件进行快速整理;
定义两个视频相似的条件为:具有同样的总帧数,且特征A、特征B、特征C、特征D中一种或多种特征相等;
去重检索处理的具体方法如下:
(21)将待检索视频文件集中的文件名称、文件大小、文件路径信息形成记录清单;
(22)对清单中的待检索视频集中的每一个视频文件,获取视频总帧数;
(23)按照总帧数对视频文件进行排序;
(24)对总帧数一样的视频,按照步骤(1)中的具体方法进行视频解码后进行场景检测,形成特征A、特征B、特征C、特征D,并为将每一次场景切换关键帧的解码图像转成JPG等图像类型文件格式存储起来;
(25)特征一致的视频,则认为是相似视频,归为一组;
(26)用户查看相似视频的场景切换关键帧,以快速对比视频是否一致。
本发明首先通过定义多个视频特征来描述相应的视频,然后根据视频特征来定义视频相似的条件,最后对待检测的视频进行视频处理获得相应的视频特征,并根据视频特征来去重检所处理,这样设计实现了对视频的快速整理,大大减少人力开销。
Claims (2)
1.一种视频特征描述与去重检索处理方法,其特征是,具体包括如下步骤:
(1)视频特征描述:对于任意视频,定义一个特征,并以此为基础进行变换得到多个特征;视频特征描述的具体方法如下:
(11)对于任意视频,为其视频帧编号,第一帧编号为1,逐帧加1,其总帧数记为N;
(12)对视频进行场景检测,每一个场景切换的视频帧序号记录下来;
(13)假设检测为n段场景,经过检测后形成视频帧序列S1,S2,S3,…,Sn,其中Si为该场景切换时的视频帧序号,其中Sn值为N+1,该组视频帧序列命名为特征A;
(14)采用视频帧序号差记录的方式,将步骤(13)中的视频帧序列做如下变换为:D1=S1-1,D2= S2-S1,D3= S3-S2,…,Dn= Sn-Sn-1;由该变换后的D1,D2,D3,…,Dn组成的数字序列命名为特征B;
(15)由特征A进行Hash后形成的特征为C;
(16)由特征B进行Hash后形成的特征为D;
其中,所述的特征C和特征D为抽象特征,因为长度固定,用于检索;特征A和特征B为具体特征,方便利用该特征进行扩展业务,包括关键帧提取、片段提取;
(2)去重检索处理:定义两个视频相似的条件,并对待检索视频进行步骤(1)中的特征提取,然后根据条件进行快速整理;定义两个视频相似的条件为:具有同样的总帧数,且特征A、特征B、特征C、特征D中一种或多种特征相等;去重检索处理的具体方法如下:
(21)将待检索视频文件集中的文件名称、文件大小、文件路径信息形成记录清单;
(22)对清单中的待检索视频集中的每一个视频文件,获取视频总帧数;
(23)按照总帧数对视频文件进行排序;
(24)对总帧数一样的视频,按照步骤(1)中的具体方法进行视频解码后进行场景检测,形成特征A、特征B、特征C、特征D;
(25)特征一致的视频,则认为是相似视频,归为一组。
2.根据权利要求1所述的一种视频特征描述与去重检索处理方法,其特征是,在步骤(24)中,在形成特征A、特征B、特征C、特征D后,将每一次场景切换关键帧的解码图像转成图像类型文件格式存储起来;在步骤(25)之后添加步骤(26),用户查看相似视频的场景切换关键帧,以快速对比视频是否一致。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910504177.8A CN110377794B (zh) | 2019-06-12 | 2019-06-12 | 一种视频特征描述与去重检索处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910504177.8A CN110377794B (zh) | 2019-06-12 | 2019-06-12 | 一种视频特征描述与去重检索处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110377794A CN110377794A (zh) | 2019-10-25 |
CN110377794B true CN110377794B (zh) | 2022-04-01 |
Family
ID=68250146
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910504177.8A Active CN110377794B (zh) | 2019-06-12 | 2019-06-12 | 一种视频特征描述与去重检索处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110377794B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111339356B (zh) * | 2020-02-21 | 2023-07-18 | 北京字节跳动网络技术有限公司 | 视频检索中防误判方法、装置及电子设备 |
CN112839257B (zh) * | 2020-12-31 | 2023-05-09 | 四川金熊猫新媒体有限公司 | 视频内容检测方法、装置、服务器及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101676914A (zh) * | 2008-09-16 | 2010-03-24 | Widi实验室 | 测量视频内容相似度的方法、管理视频内容的方法及系统 |
CN103617233A (zh) * | 2013-11-26 | 2014-03-05 | 烟台中科网络技术研究所 | 一种基于语义内容多层表示的重复视频检测方法与装置 |
CN103984778A (zh) * | 2014-06-06 | 2014-08-13 | 北京金山网络科技有限公司 | 一种视频检索方法及系统 |
CN104506933A (zh) * | 2014-12-23 | 2015-04-08 | 方正宽带网络服务有限公司 | 一种校验视频文件是否相同的方法及装置 |
CN106488257A (zh) * | 2015-08-27 | 2017-03-08 | 阿里巴巴集团控股有限公司 | 一种视频文件索引信息的生成方法和设备 |
CN107766838A (zh) * | 2017-11-08 | 2018-03-06 | 央视国际网络无锡有限公司 | 一种视频场景切换检测方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8515933B2 (en) * | 2009-08-18 | 2013-08-20 | Industrial Technology Research Institute | Video search method, video search system, and method thereof for establishing video database |
CN101840435A (zh) * | 2010-05-14 | 2010-09-22 | 中兴通讯股份有限公司 | 一种实现视频预览和检索的方法及移动终端 |
-
2019
- 2019-06-12 CN CN201910504177.8A patent/CN110377794B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101676914A (zh) * | 2008-09-16 | 2010-03-24 | Widi实验室 | 测量视频内容相似度的方法、管理视频内容的方法及系统 |
CN103617233A (zh) * | 2013-11-26 | 2014-03-05 | 烟台中科网络技术研究所 | 一种基于语义内容多层表示的重复视频检测方法与装置 |
CN103984778A (zh) * | 2014-06-06 | 2014-08-13 | 北京金山网络科技有限公司 | 一种视频检索方法及系统 |
CN104506933A (zh) * | 2014-12-23 | 2015-04-08 | 方正宽带网络服务有限公司 | 一种校验视频文件是否相同的方法及装置 |
CN106488257A (zh) * | 2015-08-27 | 2017-03-08 | 阿里巴巴集团控股有限公司 | 一种视频文件索引信息的生成方法和设备 |
CN107766838A (zh) * | 2017-11-08 | 2018-03-06 | 央视国际网络无锡有限公司 | 一种视频场景切换检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110377794A (zh) | 2019-10-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108769731B (zh) | 一种检测视频中目标视频片段的方法、装置及电子设备 | |
US20070253594A1 (en) | Method and system for fingerprinting digital video object based on multiresolution, multirate spatial and temporal signatures | |
FI92272C (fi) | Kuvansiirtojärjestelmän tiivistyskoodausmenetelmä | |
US7184603B2 (en) | System and method for lossless compression of digital images | |
US8204314B2 (en) | Method and system for fingerprinting digital video object based on multiresolution, multirate spatial and temporal signatures | |
JP2005513663A (ja) | コマーシャル及び他のビデオ内容の検出用のファミリーヒストグラムに基づく技術 | |
CN103475935A (zh) | 一种视频片段的检索方法及装置 | |
US8731066B2 (en) | Multimedia signature coding and decoding | |
CN108197265A (zh) | 一种基于短视频搜索完整视频的方法及系统 | |
US8169497B2 (en) | Method of segmenting videos into a hierarchy of segments | |
JP2003528546A (ja) | 画像及びビデオについての階層的な認証システム | |
CN110377794B (zh) | 一种视频特征描述与去重检索处理方法 | |
WO2017032245A1 (zh) | 一种视频文件索引信息的生成方法和设备 | |
CN102292979A (zh) | 视频描述符生成装置 | |
CN107527010B (zh) | 一种根据局部特征和运动矢量抽取视频基因的方法 | |
KR20100015666A (ko) | 데이터 스트림으로 비디오 데이터 및 관련 메타데이터를 전송하기 위한 방법 | |
WO1999065226A1 (fr) | Codeur et decodeur d'images, verificateur de caracteres et support de donnees | |
CN106604032B (zh) | 图像中文字块的压缩方法和装置及图像压缩方法和装置 | |
KR101632689B1 (ko) | 멀티미디어 조각파일의 복구방법 | |
US20110122003A1 (en) | Method and device for encoding and decoding of data in unique number values | |
JP4053251B2 (ja) | 画像検索システムおよび画像蓄積方法 | |
van der Meer et al. | JPEG File Fragmentation Point Detection using Huffman Code and Quantization Array Validation | |
CN111159468A (zh) | 一种利用分段和压缩的海底监测视频大数据存储方法 | |
CN111008301B (zh) | 一种以图搜视频的方法 | |
US20220286737A1 (en) | Separating Media Content into Program Segments and Advertisement Segments |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |