CN105262932A - 一种视频处理的方法及终端 - Google Patents
一种视频处理的方法及终端 Download PDFInfo
- Publication number
- CN105262932A CN105262932A CN201510681652.0A CN201510681652A CN105262932A CN 105262932 A CN105262932 A CN 105262932A CN 201510681652 A CN201510681652 A CN 201510681652A CN 105262932 A CN105262932 A CN 105262932A
- Authority
- CN
- China
- Prior art keywords
- moving target
- group
- unit
- integer
- segmentation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供了一种视频处理的方法,所述方法包括:提取待处理视频中的N个运动目标及与N个运动目标对应的M组运动轨迹;获取所述提取后得到的所述N个运动目标对应的L个背景图像;将所述N个运动目标进行分组,得到K组运动目标;将所述M组运动轨迹进行拼接以得到与所述K组运动目标对应的K组目标轨迹;统计所述K组目标轨迹对应的时间长度得到K个时间长度值;将所述K个时间长度值合并成P个分段;依据所述P个分段对应的预设时间信息对所述P个分段进行排序;根据所述排序的结果将所述K组运动目标与所述L个背景图像进行叠加;输出所述叠加后的视频。通过本发明实施例可降低提取摘要视频的时间复杂度和保证运动目标较高的连贯性。
Description
技术领域
本发明实施例涉及智能监控技术领域,具体涉及一种视频处理的方法及终端。
背景技术
实际应用中,倘若在监控的视频中要查找某一事件、对象或人物,一般需要手动对录像进行回溯并观看海量的视频内容,从中找查目标事件、对象或人物。查找时间往往与视频播放时间长度成正比,即便是快速播放,查询效率度仍然十分低,而且还容易漏掉目标。而视频摘要技术主要是将视频中运动信息进行快速摘要,并对这些摘要的运动信息进行重组,以运动目标搜索或摘要视频的方式,呈现给用户。视频摘要技术可消除了大量冗余的数据,并对这些数据进行索引、压缩和重排,大大的提高了查询的效率。
现有视频摘要技术中,主要采用分组与排序结合的方法,分组的目的在于让交叉和粘连的运动目标合并成同一个分组,从而保留原视频中交叉和粘连的运动目标的时序性,避免运动目标突然消失和出现。排序的目的在于让摘要出的运动目标在浓缩后的视频中,保持较为均匀的分布,便于用户的查看。分组过程中通过判断运动目标之间的轨迹是否交叉来分组,由于轨迹提取不够准确,导致同一个运动目标容易被分到不同的分组,导致运动目标断裂。排序过程中无法兼顾考虑时间复杂度与摘要视频中运动目标的连贯性。
发明内容
本发明实施例提供了一种视频处理的方法及终端,以期降低提取摘要视频的时间复杂度和保证运动目标较高的连贯性。
本发明实施例第一方面提供了一种目标检测的方法,包括:
读取待处理视频;
提取所述待处理视频中的N个运动目标及与所述N个运动目标对应的M组运动轨迹,其中,所述M为大于1的整数,所述N为大于或等于所述M的整数;
获取所述提取后得到的所述N个运动目标对应的L个背景图像,其中,所述L为大于1的整数;
将所述N个运动目标进行分组,得到K组运动目标,其中,所述K为大于1的整数;
将所述M组运动轨迹进行拼接以得到与所述K组运动目标对应的K组目标轨迹;
统计所述K组目标轨迹对应的时间长度得到K个时间长度值;
将所述K个时间长度值合并成P个分段,其中,所述P为小于或等于所述K的整数;
依据所述P个分段对应的预设时间信息对所述P个分段进行排序;
根据所述排序的结果将所述K组运动目标与所述L个背景图像进行叠加;
输出所述叠加后的视频。
结合本发明实施例的第一方面,在第一方面的第一种可能的实施方式中,所述提取所述待处理视频中的N个运动目标及与所述N个运动目标对应的M组运动轨迹包括:
采用前景检测算法提取所述待处理视频中的N个运动目标;
利用双向最邻近算法对所述N个运动目标进行跟踪,以得到M组运动轨迹。
结合本发明实施例的第一方面,在第一方面的第二种可能的实施方式中,所述将所述N个运动目标进行分组包括:
利用时间和位置之间的约束关系对所述N个运动目标进行分组。
结合本发明实施例的第一方面,在第一方面的第三种可能的实施方式中,所述将所述M组运动轨迹进行拼接以得到与所述K组运动目标对应的K组目标轨迹包括:
按照预设方式构造能量函数;
根据所述能量函数将所述M组运动轨迹进行拼接以得到与所述K组运动目标对应的K组目标轨迹。
结合本发明实施例的第一方面,在第一方面的第四种可能的实施方式中,所述根据所述排序的结果将所述K组运动目标与所述L个背景图像进行叠加包括:
确定所述K组运动目标在所述P个分段中的时间点;
根据所述时间点确定所述L个背景图像与所述K组运动目标之间的对应关系;
根据所述排序的结果和所述对应关系将所述K组运动目标与所述L个背景图像进行叠加。
本发明实施例第二方面提供了一种终端,包括:
读取单元,用于读取待处理视频;
提取单元,用于提取所述读取单元读取的待处理视频中的N个运动目标及与所述N个运动目标对应的M组运动轨迹,其中,所述M为大于1的整数,所述N为大于或等于所述M的整数;
获取单元,用于获取所述提取单元提取到的提取后得到的所述N个运动目标对应的L个背景图像,其中,所述L为大于1的整数;
分组单元,用于将所述提取单元提取到的N个运动目标进行分组,得到K组运动目标,其中,所述K为大于1的整数;
拼接单元,用于将所述获取单元获取到的M组运动轨迹进行拼接以得到与所述K组运动目标对应的K组目标轨迹;
统计单元,用于统计所述拼接单元拼接得到的K组目标轨迹对应的时间长度得到K个时间长度值;
合并单元,用于将所述统计单元统计出的K个时间长度值合并成P个分段,其中,所述P为小于或等于所述K的整数;
排序单元,用于依据所述合并单元合并得到的P个分段对应的预设时间信息对所述P个分段进行排序;
叠加单元,用于根据所述排序单元排序的结果将所述K组运动目标与所述L个背景图像进行叠加;
输出单元,用于输出所述叠加单元叠加后的视频。
结合本发明实施例的第二方面,在第二方面的第一种可能的实施方式中,所述提取单元包括:
提取子单元,用于采用前景检测算法提取所述待处理视频中的N个运动目标;
跟踪单元,用于利用双向最邻近算法对所述提取子单元提取的N个运动目标进行跟踪,以得到所述M组运动轨迹。
结合本发明实施例的第二方面,在第二方面的第二种可能的实施方式中,所述分组单元具体用于:
利用时间和位置之间的约束关系对所述N个运动目标进行分组。
结合本发明实施例的第二方面,在第二方面的第三种可能的实施方式中,所述拼接单元包括:
构造单元,用于按照预设方式构造能量函数;
拼接子单元,用于根据所述构造单元构造的能量函数将所述M组运动轨迹进行拼接以得到与所述K组运动目标对应的K组目标轨迹。
结合本发明实施例的第二方面,在第二方面的第四种可能的实施方式中,所述叠加单元包括:
第一确定单元,用于确定所述提取单元提取的K组运动目标在所述P个分段中的时间点;
第二确定单元,用于根据所述第一确定单元确定的时间点确定所述L个背景图像与所述K组运动目标之间的对应关系;
叠加子单元,用于根据所述排序单元排序排序的结果和所述第二确定单元确定的对应关系将所述K组运动目标与所述L个背景图像进行叠加。
实施本发明实施例,具有如下有益效果:
通过本发明实施例可读取待处理视频;提取所述读取单元读取的待处理视频中的N个运动目标及与所述N个运动目标对应的M组运动轨迹,其中,所述M为大于1的整数,所述N为大于或等于所述M的整数;获取所述提取后得到的所述N个运动目标对应的L个背景图像,其中,所述L为大于1的整数;将所述N个运动目标进行分组,得到K组运动目标,其中,所述K为大于1的整数;将所述M组运动轨迹进行拼接以得到与所述K组运动目标对应的K组目标轨迹;统计所述K组目标轨迹对应的时间长度得到K个时间长度值;将所述K个时间长度值合并成P个分段,其中,所述P为小于或等于所述K的整数;依据所述P个分段对应的预设时间信息对所述P个分段进行排序;根据所述排序的结果将所述K组运动目标与所述L个背景图像进行叠加;输出所述叠加后的视频。采用本发明实施例可通过提取运动目标,只对运动目标所在图像帧进行处理,因而,可降低提取摘要视频的时间复杂度,同时,在分组过程中,将相同的运动目标分到同一组,从而,也保证运动目标较高的连贯性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种视频处理的方法的第一实施例流程示意图;
图2是本发明实施例提供的一种视频处理的方法的第二实施例流程示意图;
图3是本发明实施例提供的一种终端的第一实施例结构示意图;
图4是本发明实施例提供的一种终端的第二实施例结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例所描述的终端可以包括智能手机(如Android手机、iOS手机、WindowsPhone手机等)、平板电脑、掌上电脑、笔记本电脑、移动互联网设备(MID,MobileInternetDevices)或穿戴式设备等,进一步地,上述终端还可以为视频矩阵、车载设备等,上述终端仅是举例,而非穷举,包含但不限于上述终端。
请参阅图1,为本发明实施例提供的一种视频处理的方法的第一实施例流程示意图。本实施例中所描述的视频处理的方法,包括以下步骤:
S101、读取待处理视频。
具体实现中,终端可从该终端的存储区域中读取待处理视频,或者,该终端可从互联网上直接读取待处理视频。该待处理视频中可包含至少一个运动目标。
S102、提取待处理视频中的N个运动目标及与N个运动目标对应的M组运动轨迹,其中,所述M为大于1的整数,所述N为大于或等于所述M的整数。
具体实现中,终端可对待处理视频进行运动目标提取,在待处理视频中包含多个运动目标的情况下,该终端可提取该待处理视频中的一个或者多个运动目标,在终端提取了该待处理视频中的多个运动目标的情况下,可进一步获取该多个运动目标对应的运动轨迹。其中,在包含运动目标的图像帧中,该图像帧中可包含一个或者多个运动目标,同时,该图像帧包含有且只有一组运动轨迹,该一组运动轨迹可包含一条或者多条运动轨迹。
可选地,在待处理视频中含有多个运动目标的情况下,终端可采用前景检测算法提取待处理视频中的N个运动目标,并在得到该N个运动目标的前提下,利用双向最邻近算法对该N个运动目标进行跟踪,以得到M个运动轨迹,其中,该N可为等于或大于1的整数,该M也为大于或等于1的整数。该前景检测算法可为混合高斯算法、平均背景法,光流法,前景建模法,背景非参数估计,背景建模法,优选地,混合高斯算法。
S103、获取所述提取后得到的所述N个运动目标对应的L个背景图像,其中,所述L为大于1的整数。
具体实现中,终端可获取提取了N个运动目标和该N个运动目标之后的该N个运动目标对应的L个背景图像。通常情况下,一副图像中除去了运动目标之后,剩余区域的图像可称为背景图像。由于N个运动目标中不同的运动目标对应的背景图像不一样,且该N个运动目标中的每个运动目标在不同时刻对应的背景图像不一样,所以,该N和该L不一定相等。
例如,背景图的获取方法,可如下,对待处理视频以时间间隔d0为时间间隔进行采样,因而,每隔时间间隔d0可取一张原始图像和前景掩膜图像,从而得到图像序列img={img1,img2,img3,……,imgn},前景掩膜序列map={map1,map2,map3,……,mapn};可将连续获取的m0个图像作为一个分段。每个分段内的m0个图像,将同一个图像坐标(x,y)的m0个像素值,按照对应前景掩膜中的标签分成前景像素点集合fg和背景像素点集合bg。如果bg集合不为空,则将bg的中值作为背景图在坐标(x,y)的像素值,否则取fg的中值。进一步地,可得到一张背景图,及该背景图对应的开始时间和结束时间。
S104、将所述N个运动目标进行分组,得到K组运动目标,其中,所述K为大于1的整数。
具体实现中,终端可将该N个运动目标进行分组,可选地,终端可利用时间和位置之间的约束关系对所述N个运动目标进行分组,以得到K组运动目标,该K为大于1的整数。一种可行的分组方式可如下,首先,终端可将该N个运动目标划分为N个组,然后,终端可利用时间和位置之间约束关系将该N个组中近邻的运动目标划分到同一个分组。在分组过程中,如果分组i和分组j之间存在近邻的运动目标,则可将分组i和分组j中的运动目标合并到同一分组,并对分组内运动目标按照先后时间进行排序,其中该分组i和分组j为该N个组中的不同的两个分组。近邻规则:前后2个运动目标xi和xj,xi结束时间和xj的开始时间的时间差小于b1,xi结束位置和xj结束位置的欧式距离小于b2,则可认为是近邻。
S105、将所述M组运动轨迹进行拼接以得到与所述K组运动目标对应的K组目标轨迹。
具体实现中,终端可对该M组运动轨迹进行拼接,从而,得到与该K组运动目标对应的K组目标轨迹,该M为大于1的整数。该K组目标轨迹中的每条轨迹包括一条或者多个轨迹。
S106、统计所述所述K组目标轨迹对应的时间长度得到K个时间长度值。
具体实现中,K组目标轨迹中的每个目标轨迹都有时间长度,终端可统计该K组目标轨迹的时间长度,从而,得到该K组目标轨迹的对应的K个时间长度值。
S107、将所述K个时间长度值合并成P个分段,其中,所述P为小于或等于所述K的整数。
具体实现中,终端可将该K个时间长度值合并成P个分段,因而,该P为小于或等于该K的整数。
S108、依据所述P个分段对应的预设时间信息对所述P个分段进行排序。
具体实现中,预设时间可包含起始时间、结束时间及P个分段中的每个分段对应的每个时间点的运动目标的坐标,因而,可利用该预设时间信息对该P个分段进行排序。
可选地,可根据P个分段的起始时间对P个分段进行编号,并根据该P个分段的序号依次拼接,即对于已经拼接的前i个分段,先对i+1分段进行排序,然后搜索i+1分段的拼接点,将i+1分段拼接到已排序的前i个分段里,得到最终整个视频的排序结果。其中排序结果描述了运动目标在后续的输出视频中的开始时间和结束时间。过程如下所述:
K组运动目标对应K个时间长度值,可对该K个时间长度值合并成若干个分段。分段划分的准则是分段累计的轨迹长度,例如,如果yi到yk-1的累计轨迹长度小于阈值b3,yi到yk大于等于b3,则将yi到yk的分组划分为一个分段。通过该分段方式划分得到分段序列Z。
将第i+1个分段内的分组照持续时间的长度进行排序,并分成2个部分Y1和Y2。Y1是持续时间较长的分组序列,Y2是持续时间较短的分组序列。第i+1个分段内分组序列Y1按顺序插入时间轴中,即从0到分段持续时间t中,查找第1个满足插入条件的时间点。插入时间点时需要满足2个约束:当前分组Y1i中的运动目标和前面已经插入的的运动目标重叠率均值p1<a1,重叠率方差p2<a2。这两个因素保证了合成视频运动目标的低重叠率和分布均衡。第i+1个分段内已排序的分组序列Y1,以整个Y1为单位,在第i分段的插入时间分段t0到t1之间,查找第1个满足插入条件的时间点。插入时间点时需要满足2个约束:当前分段Y1和前面已经插入分段的运动目标重叠率均值p1<a1,重叠率方差p2<a2。对于第i个分段中还未排序Y2中的各个分组,在第i分段的插入时间段t0到t1之间,查找第1个满足插入条件的时间点,依次插入到整个排序的时间轴里。当前分组Y2i的运动目标和前面已经插入的分组的运动目标重叠率均值p1<a1,重叠率方差p2<a2。
S109、根据所述排序的结果将所述K组运动目标与所述L个背景图像进行叠加。
具体实现中,终端可对P个分段排序后得到的排序的结果对K组运动目标和L个背景图像进行叠加。
可选地,终端可确定K组运动目标在所述P个分段中的时间点;根据该时间点确定L个背景图像与该K组运动目标之间的对应关系;根据排序的结果和该对应关系将K组运动目标与L个背景图像进行叠加。
S110、输出所述叠加后的视频。
具体实现中,终端可输出叠加后的视频,该视频可称为摘要视频或者浓缩视频。
通过本发明实施例可读取待处理视频;提取待处理视频中的N个运动目标及与N个运动目标对应的M组运动轨迹,其中,所述M为大于1的整数,所述N为大于或等于所述M的整数;获取所述提取后得到的所述N个运动目标对应的L个背景图像,其中,所述L为大于1的整数;将所述N个运动目标进行分组,得到K组运动目标,其中,所述K为大于1的整数;将所述M组运动轨迹进行拼接以得到与所述K组运动目标对应的K组目标轨迹;统计所述K组目标轨迹对应的时间长度得到K个时间长度值;将所述K个时间长度值合并成P个分段,其中,所述P为小于或等于所述K的整数;依据所述P个分段对应的预设时间信息对所述P个分段进行排序;根据所述排序的结果将所述K组运动目标与所述L个背景图像进行叠加;输出所述叠加后的视频。采用本发明实施例可通过提取运动目标,只对运动目标所在图像帧进行处理,因而,可降低提取摘要视频的时间复杂度,同时,在分组过程中,将相同的运动目标分到同一组,从而,也保证运动目标较高的连贯性。
请参阅图2,为本发明实施例提供的一种视频处理的方法的第二实施例流程示意图。本实施例中所描述的视频处理的方法,包括以下步骤:
S201、读取待处理视频。
具体实现中,终端可从该终端的存储区域中读取待处理视频,或者,该终端可从互联网上直接读取待处理视频。该待处理视频中可包含至少一个运动目标。
S202、提取待处理视频中的N个运动目标及与N个运动目标对应的M组运动轨迹,其中,所述M为大于1的整数,所述N为大于或等于所述M的整数。
具体实现中,终端可对待处理视频进行运动目标提取,在待处理视频中包含多个运动目标的情况下,该终端可提取该待处理视频中的一个或者多个运动目标,在终端提取了该待处理视频中的多个运动目标的情况下,可进一步获取该多个运动目标对应的运动轨迹。
S203、获取所述提取后得到的所述N个运动目标对应的L个背景图像,其中,所述L为大于1的整数。
具体实现中,终端可获取提取了N个运动目标和该N个运动目标之后的该N个运动目标对应的L个背景图像。
S204、将所述N个运动目标进行分组,得到K组运动目标,其中,所述K为大于1的整数。
具体实现中,终端可将该N个运动目标进行分组,可选地,终端可利用时间和位置之间的约束关系对所述N个运动目标进行分组,以得到K组运动目标,该K为大于1的整数。
S205、按照预设方式构造能量函数。
具体实现中,终端可构造一个能量函数E。
可选地,能量函数E可如下所示,函数s(i,j)表示运动轨迹i和运动轨迹j之间的拼接关系,k表示运动目标的个数。t(i)表示运动轨迹i的轨迹方程,该轨迹方程可包含多项式函数与方向,t(j)表示运动轨迹j的轨迹方程。f(i)表示运动轨迹i的特征,f(j)表示运动轨迹j的特征。该特征可为颜色和/或SURF特征,a1,a2表示权值,其中,a1的取值范围为大于0且小于1,a2的取值范围为大于0且小于1。
S206、根据所述能量函数将所述M组运动轨迹进行拼接以得到与所述K组运动目标对应的K组目标轨迹。。
具体实现中,终端可根据上述能量函数将M组运动轨迹进行拼接以得到与该K组运动目标对应的K组目标轨迹。
S207、统计所述K组目标轨迹对应的时间长度得到K个时间长度值。
S208、将所述K个时间长度值合并成P个分段,其中,所述P为小于或等于所述K的整数。
S209、依据所述P个分段对应的预设时间信息对所述P个分段进行排序。
S210、根据所述排序的结果将所述K组运动目标与所述L个背景图像进行叠加。
具体实现中,终端可对P个分段排序后得到的排序的结果对K组运动目标和L个背景图像进行叠加。
可选地,终端可确定K组运动目标在该P个分段中的时间点;根据该时间点确定L个背景图像与该K组运动目标之间的对应关系;根据排序的结果和该对应关系将K组运动目标与L个背景图像进行叠加。
S211、输出所述叠加后的视频。
通过本发明实施例可通过提取运动目标,只对运动目标所在图像帧进行处理,因而,可降低提取摘要视频的时间复杂度,并在分组过程中,可将相同的运动目标分到同一组,从而,也保证运动目标较高的连贯性。
请参阅图3,为本发明实施例提供的一种终端的第一实施例结构示意图。本实施例中所描述的终端,包括:读取单元301、提取单元302、获取单元303、分组单元304、拼接单元305、统计单元306、合并单元307、叠加单元308、输出单元309,具体如下:
读取单元301,用于读取待处理视频。
提取单元302,用于提取所述读取单元301读取的待处理视频中的N个运动目标及与所述N个运动目标对应的M组运动轨迹,其中,所述M为大于1的整数,所述N为大于或等于所述M的整数。
获取单元303,用于获取所述提取单元302提取到的提取后得到的所述N个运动目标对应的L个背景图像,其中,所述L为大于1的整数。
分组单元304,用于将所述提取单元302提取到的N个运动目标进行分组,得到K组运动目标,其中,所述K为大于1的整数。
作为一种可能的实施方式,分组单元304具体用于:
利用时间和位置之间的约束关系对所述N个运动目标进行分组。
拼接单元305,用于将所述获取单元303获取到的M组运动轨迹进行拼接得到以与所述K组运动目标对应的K组目标轨迹,其中M为大于1的整数。
统计单元306,用于统计所述拼接单元305拼接得到的K组目标轨迹对应的时间长度得到K个时间长度值。
合并单元307,用于将所述统计单元306统计出的K个时间长度值合并成P个分段,其中,所述P为小于或等于所述K的整数。
排序单元308,用于依据所述合并单元307分段得到的P个分段内对应的预设时间信息对所述P个分段进行排序。
叠加单元309,用于根据所述排序单元308排序的结果将所述K组运动目标与所述L个背景图像进行叠加。
输出单元310,用于输出所述叠加单元309叠加后的视频。
作为一种可能的实施方式,上述提取单元302可进一步包括:
提取子单元,用于采用前景检测算法提取所述待处理视频中的N个运动目标;
跟踪单元,用于利用双向最邻近算法对所述提取子单元提取的N个运动目标进行跟踪,以得到M组运动轨迹。
作为一种可能的实施方式,上述拼接单元305可进一步包括:
构造单元,用于按照预设方式构造能量函数。
拼接子单元,用于根据所述构造单元构造的能量函数将所述M组运动轨迹进行拼接以得到与所述K组运动目标对应的K组目标轨迹。
作为一种可能的实施方式,上述叠加单元309可进一步包括:
第一确定单元,用于确定所述提取单元提取的K组运动目标在所述P个分段中的时间点。
第二确定单元,用于根据所述第一确定单元确定的时间点确定所述L个背景图像与所述K组运动目标之间的对应关系。
叠加子单元,用于根据所述排序单元排序排序的结果和所述第二确定单元确定的对应关系将所述K组运动目标与所述L个背景图像进行叠加。
通过本发明实施例所描述的终端可读取待处理视频;提取待处理视频中的N个运动目标及与N个运动目标对应的M组运动轨迹,其中,所述M为大于1的整数,所述N为大于或等于所述M的整数;获取所述提取后得到的所述N个运动目标对应的L个背景图像,其中,所述L为大于1的整数;将所述N个运动目标进行分组,得到K组运动目标,其中,所述K为大于1的整数;将所述M组运动轨迹进行拼接以得到与所述K组运动目标对应的K组目标轨迹;统计所述K组目标轨迹对应的时间长度得到K个时间长度值;将所述K个时间长度值合并成P个分段,其中,所述P为小于或等于所述K的整数;依据所述P个分段对应的预设时间信息对所述P个分段进行排序;根据所述排序的结果将所述K组运动目标与所述L个背景图像进行叠加;输出所述叠加后的视频。采用本发明实施例可通过提取运动目标,只对运动目标所在图像帧进行处理,因而,可降低提取摘要视频的时间复杂度,同时,在分组过程中,将相同的运动目标分到同一组,从而,也保证运动目标较高的连贯性。
请参阅图4,为本发明实施例提供的一种终端的第二实施例结构示意图。本实施例中所描述的终端,包括:至少一个输入设备1000;至少一个输出设备2000;至少一个处理器3000,例如CPU;和存储器4000,上述输入设备1000、输出设备2000、处理器3000和存储器4000通过总线5000连接。
其中,上述输入设备1000具体可为触摸屏、物理按键或者触控笔。
上述输出设备2000具体可为显示屏。
读取待处理视频;
提取所述待处理视频中的N个运动目标及与所述N个运动目标对应的M组运动轨迹,其中,所述M为大于1的整数,所述N为大于或等于所述M的整数;
获取所述提取后得到的所述N个运动目标对应的L个背景图像,其中,所述L为大于1的整数;
将所述N个运动目标进行分组,得到K组运动目标,其中,所述K为大于1的整数;
将所述M组运动轨迹进行拼接以得到与所述K组运动目标对应的K组目标轨迹;
统计所述K组目标轨迹对应的时间长度得到K个时间长度值;
将所述K个时间长度值合并成P个分段,其中,所述P为小于或等于所述K的整数;
依据所述P个分段对应的预设时间信息对所述P个分段进行排序;
根据所述排序的结果将所述K组运动目标与所述L个背景图像进行叠加;
输出所述叠加后的视频。
作为一种可能的实施方式,上述处理器3000提取所述待处理视频中的N个运动目标及与所述N个运动目标对应的M组运动轨迹,其中,所述M为大于1的整数,所述N为大于或等于所述M的整数包括:
采用前景检测算法提取所述待处理视频中的N个运动目标;
利用双向最邻近算法对所述N个运动目标进行跟踪,以得到M组运动轨迹。
作为一种可能的实施方式,上述处理器3000将所述N个运动目标进行分组包括:
利用时间和位置之间的约束关系对所述N个运动目标进行分组。
作为一种可能的实施方式,上述处理器3000将所述M组运动轨迹进行拼接以得到与所述K组运动目标对应的K组目标轨迹包括:
按照预设方式构造能量函数;
根据所述能量函数将M组运动轨迹进行拼接以得到与所述K组运动目标对应的K组目标轨迹。
作为一种可能的实施方式,上述处理器3000根据所述排序的结果将所述K组运动目标与所述L个背景图像进行叠加包括:
确定所述K组运动目标在所述P个分段中的时间点;
根据所述时间点确定所述L个背景图像与所述K组运动目标之间的对应关系;
根据所述排序的结果和所述对应关系将所述K组运动目标与所述L个背景图像进行叠加。
具体实现中,本发明实施例中所描述的输入设备1000、输出设备2000和处理器3000可执行本发明实施例提供的一种视频处理的方法的第一实施例和第二实施例中所描述的实现方式,也可执行本发明实施例提供的一种终端的第一实施例中所描述的终端的实现方式,在此不再赘述。
本发明实施例还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时包括上述方法实施例中记载的任意一种信号处理方法的部分或全部步骤。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可能可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以为个人计算机、服务器或者网络设备等,具体可以是计算机设备中的处理器)执行本发明各个实施例上述方法的全部或部分步骤。其中,而前述的存储介质可包括:U盘、移动硬盘、磁碟、光盘、只读存储器(英文:Read-OnlyMemory,缩写:ROM)或者随机存取存储器(英文:RandomAccessMemory,缩写:RAM)等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种视频处理的方法,其特征在于,包括:
读取待处理视频;
提取所述待处理视频中的N个运动目标及与所述N个运动目标对应的M组运动轨迹,其中,所述M为大于1的整数,所述N为大于或等于所述M的整数;
获取所述提取后得到的所述N个运动目标对应的L个背景图像,其中,所述L为大于1的整数;
将所述N个运动目标进行分组,得到K组运动目标,其中,所述K为大于1的整数;
将所述M组运动轨迹进行拼接以得到与所述K组运动目标对应的K组目标轨迹;
统计所述K组目标轨迹对应的时间长度得到K个时间长度值;
将所述K个时间长度值合并成P个分段,其中,所述P为小于或等于所述K的整数;
依据所述P个分段对应的预设时间信息对所述P个分段进行排序;
根据所述排序的结果将所述K组运动目标与所述L个背景图像进行叠加;
输出所述叠加后的视频。
2.根据权利要求1所述的方法,其特征在于,所述提取所述待处理视频中的N个运动目标及与所述N个运动目标对应的M组运动轨迹包括:
采用前景检测算法提取所述待处理视频中的N个运动目标;
利用双向最邻近算法对所述N个运动目标进行跟踪,以得到M组运动轨迹。
3.根据权利要求1所述的方法,其特征在于,所述将所述N个运动目标进行分组包括:
利用时间和位置之间的约束关系对所述N个运动目标进行分组。
4.根据权利要求1所述的方法,其特征在于,所述将所述M组运动轨迹进行拼接以得到与所述K组运动目标对应的K组目标轨迹包括:
按照预设方式构造能量函数;
根据所述能量函数将所述M组运动轨迹进行拼接以得到与所述K组运动目标对应的K组目标轨迹。
5.根据权利要求1所述的方法,其特征在于,所述根据所述排序的结果将所述K组运动目标与所述L个背景图像进行叠加包括:
确定所述K组运动目标在所述P个分段中的时间点;
根据所述时间点确定所述L个背景图像与所述K组运动目标之间的对应关系;
根据所述排序的结果和所述对应关系将所述K组运动目标与所述L个背景图像进行叠加。
6.一种终端,其特征在于,包括:
读取单元,用于读取待处理视频;
提取单元,用于提取所述读取单元读取的待处理视频中的N个运动目标及与所述N个运动目标对应的M组运动轨迹,其中,所述M为大于1的整数,所述N为大于或等于所述M的整数;
获取单元,用于获取所述提取单元提取到的提取后得到的所述N个运动目标对应的L个背景图像,其中,所述L为大于1的整数;
分组单元,用于将所述提取单元提取到的N个运动目标进行分组,得到K组运动目标,其中,所述K为大于1的整数;
拼接单元,用于将所述获取单元获取到的M组运动轨迹进行拼接以得到与所述K组运动目标对应的K组目标轨迹;
统计单元,用于统计所述拼接单元拼接得到的K组目标轨迹对应的时间长度得到K个时间长度值;
合并单元,用于将所述统计单元统计出的K个时间长度值合并成P个分段,其中,所述P为小于或等于所述K的整数;
排序单元,用于依据所述合并单元合并得到的P个分段对应的预设时间信息对所述P个分段进行排序;
叠加单元,用于根据所述排序单元排序的结果将所述K组运动目标与所述L个背景图像进行叠加;
输出单元,用于输出所述叠加单元叠加后的视频。
7.根据权利要求6所述的终端,其特征在于,所述提取单元包括:
提取子单元,用于采用前景检测算法提取所述待处理视频中的N个运动目标;
跟踪单元,用于利用双向最邻近算法对所述提取子单元提取的N个运动目标进行跟踪,以得到M组运动轨迹。
8.根据权利要求6所述的终端,其特征在于,所述分组单元具体用于:
利用时间和位置之间的约束关系对所述N个运动目标进行分组。
9.根据权利要求6所述的终端,其特征在于,所述拼接单元包括:
构造单元,用于按照预设方式构造能量函数;
拼接子单元,用于根据所述构造单元构造的能量函数将所述M组运动轨迹进行拼接以得到与所述K组运动目标对应的K组目标轨迹。
10.根据权利要求6所述的终端,其特征在于,所述叠加单元包括:
第一确定单元,用于确定所述提取单元提取的K组运动目标在所述P个分段中的时间点;
第二确定单元,用于根据所述第一确定单元确定的时间点确定所述L个背景图像与所述K组运动目标之间的对应关系;
叠加子单元,用于根据所述排序单元排序排序的结果和所述第二确定单元确定的对应关系将所述K组运动目标与所述L个背景图像进行叠加。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510681652.0A CN105262932B (zh) | 2015-10-20 | 2015-10-20 | 一种视频处理的方法及终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510681652.0A CN105262932B (zh) | 2015-10-20 | 2015-10-20 | 一种视频处理的方法及终端 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105262932A true CN105262932A (zh) | 2016-01-20 |
CN105262932B CN105262932B (zh) | 2018-06-29 |
Family
ID=55102424
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510681652.0A Active CN105262932B (zh) | 2015-10-20 | 2015-10-20 | 一种视频处理的方法及终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105262932B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110147944A (zh) * | 2019-04-30 | 2019-08-20 | 阿里巴巴集团控股有限公司 | 排名方法及装置 |
CN110166851A (zh) * | 2018-08-21 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 一种视频摘要生成方法、装置和存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102708182A (zh) * | 2012-05-08 | 2012-10-03 | 浙江捷尚视觉科技有限公司 | 一种快速视频浓缩摘要方法 |
CN102819528A (zh) * | 2011-06-10 | 2012-12-12 | 中国电信股份有限公司 | 生成视频摘要的方法和装置 |
CN103079117A (zh) * | 2012-12-30 | 2013-05-01 | 信帧电子技术(北京)有限公司 | 视频摘要生成方法和视频摘要生成装置 |
US20130163961A1 (en) * | 2011-12-23 | 2013-06-27 | Hong Kong Applied Science and Technology Research Institute Company Limited | Video summary with depth information |
CN103455625A (zh) * | 2013-09-18 | 2013-12-18 | 武汉烽火众智数字技术有限责任公司 | 一种用于视频摘要的目标快速重排列方法 |
CN103686095A (zh) * | 2014-01-02 | 2014-03-26 | 中安消技术有限公司 | 一种视频浓缩方法和系统 |
CN104639994A (zh) * | 2013-11-08 | 2015-05-20 | 杭州海康威视数字技术股份有限公司 | 基于运动目标生成视频摘要的方法、系统及网络存储设备 |
CN104717573A (zh) * | 2015-03-05 | 2015-06-17 | 广州市维安电子技术有限公司 | 一种视频摘要的生成方法 |
-
2015
- 2015-10-20 CN CN201510681652.0A patent/CN105262932B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102819528A (zh) * | 2011-06-10 | 2012-12-12 | 中国电信股份有限公司 | 生成视频摘要的方法和装置 |
US20130163961A1 (en) * | 2011-12-23 | 2013-06-27 | Hong Kong Applied Science and Technology Research Institute Company Limited | Video summary with depth information |
CN102708182A (zh) * | 2012-05-08 | 2012-10-03 | 浙江捷尚视觉科技有限公司 | 一种快速视频浓缩摘要方法 |
CN103079117A (zh) * | 2012-12-30 | 2013-05-01 | 信帧电子技术(北京)有限公司 | 视频摘要生成方法和视频摘要生成装置 |
CN103455625A (zh) * | 2013-09-18 | 2013-12-18 | 武汉烽火众智数字技术有限责任公司 | 一种用于视频摘要的目标快速重排列方法 |
CN104639994A (zh) * | 2013-11-08 | 2015-05-20 | 杭州海康威视数字技术股份有限公司 | 基于运动目标生成视频摘要的方法、系统及网络存储设备 |
CN103686095A (zh) * | 2014-01-02 | 2014-03-26 | 中安消技术有限公司 | 一种视频浓缩方法和系统 |
CN104717573A (zh) * | 2015-03-05 | 2015-06-17 | 广州市维安电子技术有限公司 | 一种视频摘要的生成方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110166851A (zh) * | 2018-08-21 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 一种视频摘要生成方法、装置和存储介质 |
CN110147944A (zh) * | 2019-04-30 | 2019-08-20 | 阿里巴巴集团控股有限公司 | 排名方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN105262932B (zh) | 2018-06-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Xu et al. | Video event recognition using kernel methods with multilevel temporal alignment | |
CN111582241B (zh) | 视频字幕识别方法、装置、设备及存储介质 | |
CN102262618B (zh) | 一种版面信息识别的方法及装置 | |
CN104881458B (zh) | 一种网页主题的标注方法和装置 | |
CN108537119B (zh) | 一种小样本视频识别方法 | |
Guan et al. | A top-down approach for video summarization | |
CN110781960B (zh) | 视频分类模型的训练方法、分类方法、装置及设备 | |
CN113539304B (zh) | 视频拆条方法和装置 | |
CN111444346B (zh) | 一种用于文本分类的词向量对抗样本生成方法及装置 | |
CN106257496A (zh) | 海量网络文本与非文本图像分类方法 | |
CN102193934B (zh) | 用于寻找图像集合中的代表性图像的系统和方法 | |
Liu et al. | Joint shot boundary detection and key frame extraction | |
Barthel et al. | Graph-based browsing for large video collections | |
Nemade et al. | Image segmentation using convolutional neural network for image annotation | |
CN105262932A (zh) | 一种视频处理的方法及终端 | |
Ning et al. | Enhancement, integration, expansion: Activating representation of detailed features for occluded person re-identification | |
Liao et al. | Point cloud instance segmentation with semi-supervised bounding-box mining | |
CN113825012B (zh) | 视频数据处理方法和计算机设备 | |
Qian et al. | Partner learning: A comprehensive knowledge transfer for vehicle re-identification | |
CN113992944A (zh) | 视频编目方法、装置、设备、系统及介质 | |
CN115278300A (zh) | 视频处理方法、装置、电子设备、存储介质和程序产品 | |
CN115272941A (zh) | 弱监督视频时序动作检测与分类方法及系统 | |
CN109886185B (zh) | 一种目标识别方法、装置、电子设备和计算机存储介质 | |
CN114359790A (zh) | 基于弱监督学习的视频时序行为检测方法 | |
Gao et al. | Unsupervised and model-free news video segmentation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |