CN112468843A - 视频去重方法及装置 - Google Patents

视频去重方法及装置 Download PDF

Info

Publication number
CN112468843A
CN112468843A CN202011157663.6A CN202011157663A CN112468843A CN 112468843 A CN112468843 A CN 112468843A CN 202011157663 A CN202011157663 A CN 202011157663A CN 112468843 A CN112468843 A CN 112468843A
Authority
CN
China
Prior art keywords
video
image
scene change
images
characteristic data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011157663.6A
Other languages
English (en)
Inventor
余英
常江
宫良
夏泳
党海飞
易鹏
刘骏
曹志
韦安明
李忠炤
韩凯
肖辉
刘文翰
丁正华
高杨
薛静宜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhongguang Hengtong Technology Co ltd
Planning Institute Of Radio And Television Of State Administration Of Radio And Television
Original Assignee
Beijing Zhongguang Hengtong Technology Co ltd
Planning Institute Of Radio And Television Of State Administration Of Radio And Television
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhongguang Hengtong Technology Co ltd, Planning Institute Of Radio And Television Of State Administration Of Radio And Television filed Critical Beijing Zhongguang Hengtong Technology Co ltd
Priority to CN202011157663.6A priority Critical patent/CN112468843A/zh
Publication of CN112468843A publication Critical patent/CN112468843A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/49Segmenting video sequences, i.e. computational techniques such as parsing or cutting the sequence, low-level clustering or determining units such as shots or scenes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23418Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本申请实施例公开了一种视频去重方案,包括:获取一第一视频;根据设定的采样规则从所述第一视频中提取多个图像;其中,所述第一视频中场景变换剧烈程度较高的场景变换片段对应于较高的采样频率;对于所述多个图像中的每个图像,提取所述图像的图像特征信息;将所述多个图像对应的多个图像特征数据按照所述多个图像在所述第一视频中出现的顺序进行排序,得到所述第一视频的第一视频特征数据;将所述第一视频对应的第一视频特征数据与至少一第二视频根据相同的方法获得的至少一第二视频特征数据进行比对,确定所述第一视频与至少一所述第二视频中任一第二视频的相似度。本实施例的方案可以在保证去重准确度的前提下,更合理的安排算力。

Description

视频去重方法及装置
技术领域
本申请涉及视频处理领域,特别涉及一种视频去重方法及装置。
背景技术
随着互联网技术和产业的发展,除了传统的电视台之外,视频网站、短视频平台成为了新的海量媒资存储平台,并涌现出了数百万参与到内容创作中的视频博主。其中,经常会出现用户上传的内容已经在视频库内存在的情况,如果视频平台不能发现,不但浪费了存储空间,而且为以后的版权争议埋下了很大隐患。
因此需要将新上传的视频与平台视频库内已有的视频进行比较,避免重复上传,实现方式主要有以下几种方法:
1)对视频库中的视频抽取视频关键帧,将关键帧进行抽样和压缩,形成缩略图数据,组成视频特征库。新的视频内容上传时同样抽取关键帧,形成缩略图数据,与视频特征库中的数据进行对比,如果相似度较高,则进行人工审核来确定是否为同一视频片段;
2)对视频库中的视频抽取视频关键帧,定位字幕信息,通过OCR技术提取字幕,形成视频的字幕库。新的视频内容上传时做类似处理,提取字幕内容与字幕库中的数据进行对比,如果相似对较高,则进入人工审核来确定是否为同一视频片段;
3)对视频库中的视频提取视频的语音信息,形成台词旋律库。新的视频内容上传时做类似处理,提取语音信息与台词旋律库中的数据进行对比,如果相似对较高,则进入人工审核来确定是否为同一视频片段;
4)对视频库中的视频抽取视频关键帧,通过人脸识别来形成视频特征库。新的视频内容上传时同样进行人脸识别,可以粗略判断是否为同一演员。此外,还可以结合演员数量及对应的出场次序,形成视频的人脸和剧情特征库。
可以看出,第一、二、四种方法都需要对视频进行图像帧提取,并且从提取的图像帧中提取特定的图像特征信息来进行处理。但是在进行图像帧提取时,通常是以固定的采样频率进行提取的。
发明内容
本申请实施例可能的目的是:提供一种视频去重方案。
第一方面,本申请的一可能的实施方案提供了一种视频去重方法,包括:
获取一第一视频;
根据设定的采样规则从所述第一视频中提取多个图像;其中,所述采样规则包括:响应于所述第一视频中存在至少一场景变换片段,所述至少一场景变换片段对应于至少一第一采样频率,所述第一视频中其他片段对应于第二采样频率;其中,所述至少一第一采样频率高于所述第二采样频率;
对于所述多个图像中的每个图像,提取所述图像的图像特征信息;
将所述多个图像对应的多个图像特征数据按照所述多个图像在所述第一视频中出现的顺序进行排序,得到所述第一视频对应的第一视频特征数据;
将所述第一视频对应的第一视频特征数据与至少一第二视频根据相同的方法获得的至少一第二视频特征数据进行比对,确定所述第一视频与至少一所述第二视频中任一第二视频的相似度。
第二方面,本申请的一可能的实施方案提供了一种视频去重装置,包括:
视频获取模块,用于获取一第一视频;
图像提取模块,用于根据设定的采样规则从所述第一视频中提取多个图像;其中,所述采样规则包括:响应于所述第一视频中存在至少一场景变换片段,所述至少一场景变换片段对应于至少一第一采样频率,所述第一视频中其他片段对应于第二采样频率;其中,所述至少一第一采样频率高于所述第二采样频率;
图像特征获取模块,用于对于所述多个图像中的每个图像,提取所述图像的图像特征信息;
视频特征获取模块,用于将所述多个图像对应的多个图像特征数据按照所述多个图像在所述第一视频中出现的顺序进行排序,得到所述第一视频对应的第一视频特征数据;
比对模块,用于将所述第一视频对应的第一视频特征数据与至少一第二视频根据相同的方法获得的至少一第二视频特征数据进行比对,确定所述第一视频与至少一所述第二视频中任一第二视频的相似度。
本申请实施例的至少一个视频去重方案通过在对视频提取多帧图像用于相似性比对时,考虑到场景变换剧烈程度来调整采样的频率,对于包含场景变换片段的视频的去重处理,能在保证查重准确度的前提下,合理的减少算力。
附图说明
图1为本申请实施例一种视频去重方法的流程图;
图2为本申请实施例一种视频去重方法提取的图像中识别出的多种对象的示意图;
图3为本申请实施例的一种视频去重装置的结构示意框图;
图4为本申请实施例的一种平台设备的结构示意框图。
具体实施方式
下面结合附图(若干附图中相同的标号表示相同的元素)和实施例,对本申请的具体实施方式作进一步详细说明。以下实施例用于说明本申请,但不用来限制本申请的范围。
本领域技术人员可以理解,本申请中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等,既不代表任何特定技术含义,也不表示它们之间的必然逻辑顺序。
本申请的发明人发现,在从视频提取多个图像帧,并且从所述多个图像帧中提取特定的图像特征信息来进行查重处理时,通常采用固定的频率进行的图像帧的提取,例如,每隔1秒提取一图像帧。对于图像变换比较剧烈的场景,这样的提取频率可能太低了,会错过一些关键的图像特征信息;但是对于图像变换比较平缓的场景——例如几十秒之内几乎没有变化的场景来说,这样的提取频率太高了,造成不必要的冗余图像特征信息提取及处理,进而浪费算力。因此本申请的发明人提出了下面的更为灵活的基于图像帧提取的去重处理方案。
如图1所示,本申请实施例提供了一种视频去重方法,包括:
S110:获取一第一视频;
S120:根据设定的采样规则从所述第一视频中提取多个图像;其中,所述采样规则包括:响应于所述第一视频中存在至少一场景变换片段,所述至少一场景变换片段对应于至少一第一采样频率,所述第一视频中其他片段对应于第二采样频率;其中,所述至少一第一采样频率高于所述第二采样频率;
S130:对于所述多个图像中的每个图像,提取所述图像的图像特征信息;
S140:将所述多个图像对应的多个图像特征数据按照所述多个图像在所述第一视频中出现的顺序进行排序,得到所述第一视频对应的第一视频特征数据;
S150:将所述第一视频对应的第一视频特征数据与至少一第二视频根据相同的方法获得的至少一第二视频特征数据进行比对,确定所述第一视频与所述至少一所述第二视频中任一第二视频的相似度。
举例来说,本申请提供的去重装置作为本实施例的执行主体,执行S110~S150。具体地,所述去重装置可以以软件、硬件或软硬件结合的方式设置在一视频平台设备中,或者,所述去重装置本身就是所述视频平台设备。
通过本申请实施例的方法,对于包含场景切换等场景变换片段的视频的去重处理,可以在保证去重准确度的前提下,更合理的安排算力。
通过下面的实施方式进一步说明本申请实施例的方法。
S110:获取一第一视频。
在一种可能的实施方式中,所述第一视频为待比对视频。
在一种可能的实施方式中,所述获取一第一视频可以包括获取用户实时上传的一待比对视频。
在本申请另一种可能的实施方式中,所述获取一第一视频还可以是从视频平台设备的一存储器中获取存储在其中的一待比对视频。
S120:根据设定的采样规则从所述第一视频中提取多个图像。
在本申请一种可能的实施例中,在步骤S120之前,所述方法还包括:对所述第一视频进行场景变换检测,确定所述第一视频中是否存在所述场景变换片段。其中,在一种可能的实施方式中,响应于所述第一视频中一视频片段的场景变换剧烈程度高于预定程度,确定所述视频片段为一场景变换片段。
这里所述场景变换片段,可以为在两个不同的场景间进行切换的转场片段,例如转场帧与前一关键帧之间的视频片段;也可以为同一场景,但是变化较剧烈的视频片段,例如爆炸场景对应的片段。
在一种可能的实施方式中,可以采用任一种场景变换检测方法进行场景变换片段的检测。例如,通过比较相邻帧之间的颜色、灰度等特征信息的相关的差异值是否超过一差异阈值等,确定一图像帧是否为转场帧。上面所述的场景变换剧烈程度可以对应于这里的差异值。
在本申请实施例中,所述采样规则包括:响应于所述第一视频中存在至少一场景变换片段,所述至少一场景变换片段对应于至少一第一采样频率,所述第一视频中其他片段对应于第二采样频率;这里,所述至少一第一采样频率高于所述第二采样频率。即,对于场景变换剧烈的场景变换片段,采用较高的采样频率进行采样,以减少场景变换过程中关键图像特征信息的漏采;对于场景变换平缓的片段,采用较低的采用频率进行采样,减少相同的冗余图像特征信息的采集。这样,在保持后续比对准确率的同时,可以减少视频整体的采样密度,减少视频特征数据。
在一种可能的实施方式中,对于一视频图像提取的采样频率可以只分为两种,即场景变换片段一种,其他片段一种。例如,对于视频中的场景变换片段,采用0.5秒一次的采样频率进行图像提取;对于视频中的其他片段采用2秒一次的采用频率进行图像提取。
在本申请另一种可能的实施例中,不同的场景变换剧烈程度还可以对应不同的第一采样频率。所述至少一场景变换片段包括场景变换剧烈程度不同的多个场景变换片段,所述多个场景变换片段对应于不同的多个第一采样频率,其中,场景变换剧烈程度越高的场景变换片段对应的第一采样频率越高。这样可以进一步提高图像提取的灵活性。
例如,可以将场景变换片段根据场景变换剧烈程度分为三种,分别对应于0.1秒、0.2秒和0.5秒一次的采样频率。
S130:对于所述多个图像中的每个图像,提取所述图像的图像特征信息。
这里,所述图像特征信息可以为任何可以应用于去重处理的图像特征信息,例如前面所述的缩略图数据、字幕信息、人脸信息等。
在本申请的一种实施例中,进一步提出了下面的图像特征信息提取方案,可以在花费较小算力的前提下达成较高的视频查重准确率。所述方案包括:对于所述多个图像中的每个图像进行下面的操作,以得到每个图像对应的图像特征数据:
S131通过对象识别,得到所述图像中最大的多种对象;
S132至少根据所述多种对象的大小对所述多种对象分别对应的多个代码进行排序,得到所述图像对应的图像特征数据。
特别的,本申请实施例的方法与现在已有的查重方法是相互平行的,因此可以与已有的方法协同工作,进一步提高视频查重的命中率,例如,可以将准确率提至90%左右。
下面进一步的对上述图像特征数据提取方法进行描述:
1)通过对象识别,得到所述图像中最大的多种对象。
这里的对象识别可以采用常用的对象识别方法对所述对象进行识别。例如通过训练好的卷积神经网络对所述图像中的对象进行识别。
在一种可能的实施方式中,所述多种对象的个数不超过预设的阈值。这里,所述多种对象的个数阈值可以根据需要设定。在一种可能的实施方式中,可以使用已有的对象识别方法,从所述图像中识别出最大的5种对象,可以在确保去重准确率的前提下,对应的图像特征数据字节占用较小,后续比对也会使用较少的算力。例如,与现有一些方法相比,该实施例的方案可以节省算力开销超过50%。
这里最大的多种对象例如可以是所述多种对象在所述图像中占的面积最大或包含的像素最多。其中,在图像中包含相同种类的多个对象时,按照所述多个对象所占面积的总和来确定该种对象在图像中的大小,例如图2中对象“人”的大小是由图像中两个人所占的画幅大小决定的。在一种可能的实施方式中,可以对所述图像中的所有对象进行识别,然后再找出其中最大的几种。
例如,如图2所示为一视频片段中提取的一帧图像,通过图像识别确定该图像中最大的5种对象按照大小排列分别为:人、树、草坪、箱子、书。
2)根据所述多种对象的大小对所述多种对象分别对应的多个代码进行排序,得到所述图像对应的图像特征数据。
例如,在一种可能的实施方式中,对上面所述图2中5种对象的大小进行排列后,其中每种对象对应于一个唯一的16位编码,则5种对象对应于5x16的一串数字编码,占用10个字节。该串数字编码即为该图像对应的图像特征数据。
在一种可能的实施方式中,在进行步骤S110之前,所述方法还包括一物体库的建立:包括为视频中常见的所有对象中的每个对象配置唯一对应的代码,并将所述对象与代码的对应关系存储在所述物体库中。
例如,在一种可能的实施方式中,可以选取了1万种视频中常见的对象建立所述物体库。其中,对所述物体库中的不同对象进行不同的16位编码,两个字节即可表示一种对象。当然,在其他可能的实施方式中,所述物体库中的对象的数量根据需要可以灵活设定。所述物体库中对象的编码也可以是其他方式的,只要每个编码能唯一确定物体库中的一个对象,并且所占字节较小,方便后面的比对即可。
在一种可能的实施方式中,在所述多种对象中可能包含大小相同的至少两个对象(虽然几率很小),此时,可以按照设定的顺序排列所述大小相同的对象对应的代码。例如,在一种可能的实施方式中,可以根据所述至少两个对象在物体库中代码的先后顺序对所述至少两个对象的顺序进行排列。例如上面提到的每个对象对应一个16位编码,编码靠前的排在前面。
在一种可能的实施方式中,在所述图像中识别出的所有对象的个数有可能少于所述阈值,此时,可以通过设定的代码补齐。例如,以上面所述的16位编码为例,可以通过以设定的编码表示空的对象。例如在所述阈值为5个对象,但是图像中只识别出4个对象时,其余的16位编码均用0表示。
S140:将所述多个图像对应的多个图像特征数据按照所述多个图像在所述第一视频中出现的顺序进行排序,得到所述第一视频对应的第一视频特征数据。
通过步骤S140将所述多个图像在所述第一视频中出现的顺序这一时间特征考虑到特征数据中,可以进一步提高后续比对的准确率。
S150:将所述第一视频对应的第一视频特征数据与至少一第二视频根据相同的方法获得的至少一第二视频特征数据进行比对,确定所述第一视频与所述至少一所述第二视频中任一第二视频的相似度。
在一种可能的实施方式中,所述至少一第二视频为一视频库中的已有视频。
在一种可能的实施方式中,所述至少一第二视频之间已经进行过与下面第一视频特征数据的提取方式相同的第二视频特征数据的提取,并且进行了相互比对,根据比对结果排除掉重复视频。其中,在一种可能的实施方式中,所述视频库中的每个第二视频对应的第二视频特征数据均存储在一视频特征库中,方便后面比对使用。
在一种可能的实施方式中,所述方法还包括:根据所述相似度,确定所述第一视频与所述视频库中已有的一第二视频的重复可能性。
在一种可能的实施方式中,设置一相似度阈值,在所述相似度达到所述相似度阈值时:认为存在重复的情况,或者,进入人工审核来确定所述第一视频与对应的第二视频是否为同一视频片段。
不同的视频库,对相似度的要求可能不同。
在一种可能的实施方式的视频库中,认为第一视频和一第二视频整体相似才是重复,此时,可以进行第一视频特征数据整体与所述至少一第二视频特征数据的整体进行比对,在相似度达到一设定的相似度阈值,例如80%以上时,才认为所述两个视频是重复的,或者转为人工确认。
在另一种可能的实施方式的视频库中,认为所述第一视频和第二视频这两个视频中设定长度的片段之间相似就有重复可能,即对应的第一视频特征和第二视频特征中有设定长度的一段相似就认为这两个视频有重复可能。例如,在一个视频比另一个视频短时,所述设定长度可以为相对较短的那个视频的长度,此时相对较短的视频可能是另一个视频中的片段。或者,在另一种可能的实施方式中,所述设定长度也可以为比所述两个视频都要短的长度。
本领域技术人员可以理解,在本申请具体实施方式的上述方法中,各步骤的序号大小并不意味着执行顺序的先后,各步骤的执行顺序应以其功能和内在逻辑确定,而不应对本申请具体实施方式的实施过程构成任何限定。
如图3所示,本申请另一种可能的实施方式包括一种视频去重装置300,包括:
视频获取模块310,用于获取一第一视频;
图像提取模块320,用于根据设定的采样规则从所述第一视频中提取多个图像;其中,所述采样规则包括:响应于所述第一视频中存在至少一场景变换片段,所述至少一场景变换片段对应于至少一第一采样频率,所述第一视频中其他片段对应于第二采样频率;其中,所述至少一第一采样频率高于所述第二采样频率;
图像特征获取模块330,用于对于所述多个图像中的每个图像,提取所述图像的图像特征信息;
视频特征获取模块340,用于将所述多个图像对应的多个图像特征数据按照所述多个图像在所述第一视频中出现的顺序进行排序,得到所述第一视频对应的第一视频特征数据;
比对模块350,用于所述第一视频对应的第一视频特征数据与至少一第二视频根据相同的方法获得的至少一第二视频特征数据进行比对,确定所述第一视频与所述至少一所述第二视频中任一第二视频的相似度。
通过本申请实施例的方法,对于包含场景切换等场景变换片段的视频的去重处理,可以在保证去重准确度的前提下,更合理的安排算力。
本申请实施例各模块功能的进一步实现参见图1所示实施例中对应的描述。
图4为本申请实施例提供的又一种平台设备400的结构示意图,本申请具体实施例并不对平台设备400的具体实现做限定。如图4所示,该平台设备400可以包括:
处理器(processor)410、通信接口(Communications Interface)420、存储器(memory)430、以及通信总线440。其中:
处理器410、通信接口420、以及存储器430通过通信总线440完成相互间的通信。
通信接口420,用于与比如客户端等的网元通信。
处理器410,用于执行程序432,具体可以执行上述方法实施例中的相关步骤。
具体地,程序432可以包括程序代码,所述程序代码包括计算机操作指令。
处理器410可能是一个中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本申请实施例的一个或多个集成电路。
存储器430,用于存放程序432。存储器430可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。程序432具体可以用于使得所述平台设备400执行以下操作:
获取一第一视频;
根据设定的采样规则从所述第一视频中提取多个图像;其中,所述采样规则包括:响应于所述第一视频中存在至少一场景变换片段,所述至少一场景变换片段对应于至少一第一采样频率,所述第一视频中其他片段对应于第二采样频率;其中,所述至少一第一采样频率高于所述第二采样频率;
对于所述多个图像中的每个图像,提取所述图像的图像特征信息;
将所述多个图像对应的多个图像特征数据按照所述多个图像在所述第一视频中出现的顺序进行排序,得到所述第一视频对应的第一视频特征数据;
将所述第一视频对应的第一视频特征数据与至少一第二视频根据相同的方法获得的至少一第二视频特征数据进行比对,确定所述第一视频与至少一所述第二视频中任一第二视频的相似度。
程序432中各步骤的具体实现可以参见上述实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上实施方式仅用于说明本申请,而并非对本申请的限制,有关技术领域的普通技术人员,在不脱离本申请的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本申请的范畴,本申请的专利保护范围应由权利要求限定。

Claims (10)

1.一种视频去重方法,其特征在于,包括:
获取一第一视频;
根据设定的采样规则从所述第一视频中提取多个图像;其中,所述采样规则包括:响应于所述第一视频中存在至少一场景变换片段,所述至少一场景变换片段对应于至少一第一采样频率,所述第一视频中其他片段对应于第二采样频率;其中,所述至少一第一采样频率高于所述第二采样频率;
对于所述多个图像中的每个图像,提取所述图像的图像特征信息;
将所述多个图像对应的多个图像特征数据按照所述多个图像在所述第一视频中出现的顺序进行排序,得到所述第一视频对应的第一视频特征数据;
将所述第一视频对应的第一视频特征数据与至少一第二视频根据相同的方法获得的至少一第二视频特征数据进行比对,确定所述第一视频与至少一所述第二视频中任一第二视频的相似度。
2.根据权利要求1所述的方法,其特征在于:
所述至少一场景变换片段包括场景变换剧烈程度不同的多个场景变换片段,所述多个场景变换片段对应于不同的多个第一采样频率,其中,场景变换剧烈程度越高的场景变换片段对应的第一采样频率越高。
3.根据权利要求1或2所述的方法,其特征在于:
在提取所述多个图像之前,所述方法还包括:对所述第一视频进行场景变换检测,确定所述第一视频中是否存在所述场景变换片段。
4.根据权利要求3所述的方法,其特征在于:响应于所述第一视频中一视频片段的场景变换剧烈程度高于预定程度,确定所述视频片段为一场景变换片段。
5.根据权利要求1所述的方法,其特征在于:
所述第一视频为待比对视频;
所述至少一第二视频为一视频库中的已有视频;
所述方法还包括:根据所述相似度,确定所述第一视频与所述视频库中已有视频的重复可能性。
6.根据权利要求1所述的方法,其特征在于:
所述提取所述图像的图像特征信息包括:
通过对象识别,得到所述图像中最大的多种对象;
至少根据所述多种对象的大小对所述多种对象分别对应的多个代码进行排序,得到所述图像对应的图像特征数据。
7.根据权利要求6所述的方法,其特征在于,其中:所述多种对象的个数不超过预设的阈值。
8.根据权利要求7所述的方法,其特征在于,在所述图像中识别出的所有对象的个数少于所述阈值时,通过设定的代码补齐。
9.根据权利要求6所述的方法,其特征在于,在所述多种对象中包含大小相同的至少两种对象时,按照设定的顺序排列所述至少两种对象对应的代码。
10.一种视频去重装置,其特征在于,包括:
视频获取模块,用于获取一第一视频;
图像提取模块,用于根据设定的采样规则从所述第一视频中提取多个图像;其中,所述采样规则包括:响应于所述第一视频中存在至少一场景变换片段,所述至少一场景变换片段对应于至少一第一采样频率,所述第一视频中其他片段对应于第二采样频率;其中,所述至少一第一采样频率高于所述第二采样频率;
图像特征获取模块,用于对于所述多个图像中的每个图像,提取所述图像的图像特征信息;
视频特征获取模块,用于将所述多个图像对应的多个图像特征数据按照所述多个图像在所述第一视频中出现的顺序进行排序,得到所述第一视频对应的第一视频特征数据;
比对模块,用于将所述第一视频对应的第一视频特征数据与至少一第二视频根据相同的方法获得的至少一第二视频特征数据进行比对,确定所述第一视频与至少一所述第二视频中任一第二视频的相似度。
CN202011157663.6A 2020-10-26 2020-10-26 视频去重方法及装置 Pending CN112468843A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011157663.6A CN112468843A (zh) 2020-10-26 2020-10-26 视频去重方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011157663.6A CN112468843A (zh) 2020-10-26 2020-10-26 视频去重方法及装置

Publications (1)

Publication Number Publication Date
CN112468843A true CN112468843A (zh) 2021-03-09

Family

ID=74834531

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011157663.6A Pending CN112468843A (zh) 2020-10-26 2020-10-26 视频去重方法及装置

Country Status (1)

Country Link
CN (1) CN112468843A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113905282A (zh) * 2021-10-22 2022-01-07 北京房江湖科技有限公司 视频文件的上传处理方法和装置、电子设备和存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018149322A1 (zh) * 2017-02-15 2018-08-23 腾讯科技(深圳)有限公司 图像识别方法、装置、设备及存储介质
CN108932254A (zh) * 2017-05-25 2018-12-04 中兴通讯股份有限公司 一种相似视频的检测方法、设备、系统及存储介质
CN109189991A (zh) * 2018-08-17 2019-01-11 百度在线网络技术(北京)有限公司 重复视频识别方法、装置、终端及计算机可读存储介质
CN110209881A (zh) * 2018-11-08 2019-09-06 腾讯科技(深圳)有限公司 视频搜索方法、装置及存储介质
CN111212322A (zh) * 2020-01-15 2020-05-29 济南浪潮高新科技投资发展有限公司 一种基于多视频去重拼接的视频压缩方法
CN111464833A (zh) * 2020-03-23 2020-07-28 腾讯科技(深圳)有限公司 目标图像生成方法、目标图像生成装置、介质及电子设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018149322A1 (zh) * 2017-02-15 2018-08-23 腾讯科技(深圳)有限公司 图像识别方法、装置、设备及存储介质
CN108932254A (zh) * 2017-05-25 2018-12-04 中兴通讯股份有限公司 一种相似视频的检测方法、设备、系统及存储介质
CN109189991A (zh) * 2018-08-17 2019-01-11 百度在线网络技术(北京)有限公司 重复视频识别方法、装置、终端及计算机可读存储介质
CN110209881A (zh) * 2018-11-08 2019-09-06 腾讯科技(深圳)有限公司 视频搜索方法、装置及存储介质
CN111212322A (zh) * 2020-01-15 2020-05-29 济南浪潮高新科技投资发展有限公司 一种基于多视频去重拼接的视频压缩方法
CN111464833A (zh) * 2020-03-23 2020-07-28 腾讯科技(深圳)有限公司 目标图像生成方法、目标图像生成装置、介质及电子设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113905282A (zh) * 2021-10-22 2022-01-07 北京房江湖科技有限公司 视频文件的上传处理方法和装置、电子设备和存储介质
CN113905282B (zh) * 2021-10-22 2024-02-20 贝壳找房(北京)科技有限公司 视频文件的上传处理方法和装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
US11281712B2 (en) System, apparatus, method, program and recording medium for processing image
US7184100B1 (en) Method of selecting key-frames from a video sequence
CN111898416A (zh) 视频流处理方法、装置、计算机设备和存储介质
US20090274364A1 (en) Apparatus and methods for detecting adult videos
CN111241345A (zh) 一种视频检索方法、装置、电子设备和存储介质
EP2270749A2 (en) Methods of representing images
US20060062474A1 (en) Methods of representing and analysing images
CN111901604B (zh) 视频压缩、重构方法及对应装置、摄像头及视频处理设备
CN112434553B (zh) 一种基于深度字典学习的视频鉴别方法及系统
CN110381392B (zh) 一种视频摘要提取方法及其系统、装置、存储介质
CN111325245A (zh) 重复图像识别方法、装置、电子设备及计算机可读存储介质
CN110147469A (zh) 一种数据处理方法、设备及存储介质
CN111488813B (zh) 视频的情感标注方法、装置、电子设备及存储介质
CN116543334A (zh) 关键帧抽取方法、装置、电子设备及存储介质
CN116645624A (zh) 视频内容理解方法和系统、计算机设备、存储介质
CN112468843A (zh) 视频去重方法及装置
CN113157962B (zh) 图像检索方法、电子装置和存储介质
WO1999051022A1 (en) Method of selecting key-frames from a video sequence
CN108024148B (zh) 基于行为特征的多媒体文件识别方法、处理方法及装置
KR102277929B1 (ko) 얼굴 인식에 기반한 실시간 얼굴 마스킹 시스템 및 이를 이용한 실시간 얼굴 마스킹 방법
CN115379233B (zh) 一种大数据视频信息分析方法和系统
CN105989063A (zh) 视频检索方法和装置
CN113269140A (zh) 图像处理方法与装置、存储介质、电子设备
CN113674230A (zh) 一种室内逆光人脸关键点的检测方法及装置
Na et al. A Frame‐Based Video Signature Method for Very Quick Video Identification and Location

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210309