CN106791708B

CN106791708B - 一种视频处理方法及装置

Info

Publication number: CN106791708B
Application number: CN201710066454.2A
Authority: CN
Inventors: 程冰; 彭齐荣; 张立峰; 尹义; 万历
Original assignee: Shenzhen Intellifusion Technologies Co Ltd
Current assignee: Shenzhen Intellifusion Technologies Co Ltd
Priority date: 2017-02-07
Filing date: 2017-02-07
Publication date: 2018-04-06
Anticipated expiration: 2037-02-07
Also published as: CN106791708A

Abstract

本发明实施例提供了一种视频处理方法及装置，所述方法包括：获取目标布控对象的目标人脸图像；获取目标布控范围内目标人脸图像对应的样本图像集；确定样本图像集中包含目标人脸图像匹配的N张视频图像；对N张视频图像中每一视频图像进行图像分割，得到N个目标人脸图像；从样本图像集中确定出以N个目标脸人图像中的每一目标人脸图像对应的时间点为时间起点的预设时间长度内的视频图像中出现的人脸图像，得到P个人脸图像；将P个人脸图像进行分类，得到Q个对象及每一对象对应的人脸图像个数；将Q个对象中人脸图像个数大于第一预设阈值的K个对象作为目标对象。通过本发明实施例可快速确定出同行者。

Description

一种视频处理方法及装置

技术领域

本发明涉及视频监控技术领域，具体涉及一种视频处理方法及装置。

背景技术

随着经济、社会、文化的快速发展，国内外影响力的与日俱增，越来越多外来人口流向城市，这些人口增加在加快城市化进程的同时，也为城市管理带来更大的挑战，虽然，视频监控对城市安全提供了技术支持，但是，目前来看，摄像头已经在城市中布局开来，各个摄像头的功能较为独立，往往是通过人工方式对每一摄像头拍摄的视频图像进行逐帧查看，当需要查找与布控对象同时出现的人的情况下，便无法快速地确定同行者(同时出现的人)。

发明内容

本发明实施例提供了一种视频处理方法及装置，可以快速确定出同行者。

本发明实施例第一方面提供了一种视频处理方法，包括：

获取目标布控对象的目标人脸图像；

获取目标布控范围内所述目标人脸图像对应的样本图像集；

确定所述样本图像集中包含所述目标人脸图像匹配的N张视频图像；

对所述N张视频图像中每一视频图像进行图像分割，得到所述N个目标人脸图像，其中，每一张视频图像包含一张所述目标人脸图像；

从所述样本图像集中确定出以所述N个目标人脸图像中的每一目标人脸图像对应的时间点为时间起点的预设时间长度内的视频图像中出现的人脸图像，得到P个人脸图像，所述P为大于1的整数；

将所述P个人脸图像进行分类，得到Q个对象及每一对象对应的人脸图像个数，所述Q为小于所述P的正整数；

将所述Q个对象中人脸图像个数大于第一预设阈值的K个对象作为目标对象，所述K为小于所述Q的正整数。

结合本发明实施例第一方面，在第一方面的第一种可能实施方式中，所述获取目标布控范围内所述目标人脸图像对应的样本图像集，包括：

获取用户选取的布控时间段；

根据所述布控时间段确定所述目标人脸图像首次出现时间和最后出现时间；

从历史视频库中截取所述目标布控范围内处于所述首次出现时间与所述最后出现时间之间的样本图像集。

结合本发明实施例第一方面或第一方面的第一种可能实施方式，在第一方面的第二种可能实施方式中，所述确定所述样本图像集中包含所述目标人脸图像匹配的N张视频图像，包括：

对所述样本图像集进行解析，得到A张视频图像，所述A为大于1的整数；

将所述目标人脸图像与所述A张视频图像中的每一视频图像进行匹配，得到所述A个匹配值；

从所述A个匹配值中选取大于第二预设阈值的所述N个匹配值，并获取其对应的视频图像。

结合本发明实施例第一方面的第二种可能实施方式，在第一方面的第三种可能实施方式中，所述从所述样本图像集中确定出以所述N个目标人脸图像中的每一目标人脸图像对应的时间点为时间起点的预设时间长度内的视频图像中出现的人脸图像，包括：

将所述样本图像集中的每一视频图像进行图像分割，得到X个人脸图像，所述X为大于1的整数；

获取目标人脸图像i对应的时间点为时间起点的所述预设时间长度内的Y个人脸图像，所述目标人脸图像i为所述N个目标人脸图像中的任一个，所述Y为正整数，所述Y个人脸图像为所述X个人脸图像中的一部分。

结合本发明实施例第一方面或第一方面的第一种可能实施方式，在第一方面的第四种可能实施方式中，在所述将所述Q个对象中人脸图像个数大于第一预设阈值的K个对象作为目标对象之后，所述方法还包括：

将所述目标对象发送给终端。

本发明实施例第二方面提供了一种终端，包括：

第一获取单元，用于获取目标布控对象的目标人脸图像；

第二获取单元，用于获取目标布控范围内所述目标人脸图像对应的样本图像集；

第一确定单元，用于确定所述样本图像集中包含所述目标人脸图像匹配的N张视频图像；

分割单元，用于对所述N张视频图像中每一视频图像进行图像分割，得到所述N个目标人脸图像，其中，每一张视频图像包含一张所述目标人脸图像；

第二确定单元，用于从所述样本图像集中确定出以所述N个目标人脸图像中的每一目标人脸图像对应的时间点为时间起点的预设时间长度内的视频图像中出现的人脸图像，得到P个人脸图像，所述P为大于1的整数；

分类单元，用于将所述P个人脸图像进行分类，得到Q个对象及每一对象对应的人脸图像个数，所述Q为小于所述P的正整数；

第三确定单元，用于将所述Q个对象中人脸图像个数大于第一预设阈值的K个对象作为目标对象，所述K为小于所述Q的正整数。

结合本发明实施例第二方面，在第二方面的第一种可能实施方式中，所述第二获取单元包括：

第一获取模块，用于获取用户选取的布控时间段；

确定模块，用于根据所述布控时间段确定所述目标人脸图像首次出现时间和最后出现时间；

截取模块，用于从历史视频库中截取所述目标布控范围内处于所述首次出现时间与所述最后出现时间之间的样本图像集。

结合本发明实施例第二方面或第二方面的第一种可能实施方式，在第二方面的第二种可能实施方式中，所述第一确定单元包括：

解析模块，用于对所述样本图像集进行解析，得到A张视频图像，所述A为大于1的整数；

匹配模块，用于将所述目标人脸图像与所述A张视频图像中的每一视频图像进行匹配，得到所述A个匹配值；

选取模块，用于从所述A个匹配值中选取大于第二预设阈值的所述N个匹配值，并获取其对应的视频图像。

结合本发明实施例第二方面的第二种可能实施方式，在第二方面的第三种可能实施方式中，所述第二确定单元包括：

分割模块，用于将所述样本图像集中的每一视频图像进行图像分割，得到X个人脸图像，所述X为大于1的整数；

第二获取模块，用于获取目标人脸图像i对应的时间点为时间起点的所述预设时间长度内的Y个人脸图像，所述目标人脸图像i为所述N个目标人脸图像中的任一个，所述Y为正整数，所述Y个人脸图像为所述X个人脸图像中的一部分。

结合本发明实施例第二方面或第二方面的第一种可能实施方式，在第二方面的第四种可能实施方式中，所述视频处理装置还包括：

发送单元，用于在所述第三确定单元将所述Q个对象中人脸图像个数大于第一预设阈值的K个对象作为目标对象之后，将所述目标对象发送给终端。

实施本发明实施例，具有如下有益效果：

可以看出，通过本发明实施例，获取目标布控对象的目标人脸图像，获取目标布控范围内目标人脸图像对应的样本图像集，确定所述样本图像集中包含所述目标人脸图像匹配的N张视频图像，对N张视频图像中每一视频图像进行图像分割，得到N个目标人脸图像，其中，每一张视频图像包含一张目标人脸图像，从样本图像集中确定出以N个目标人脸图像中的每一目标人脸图像对应的时间点为时间起点的预设时间长度内的视频图像中出现的人脸图像，得到P个人脸图像，P为大于1的整数，将P个人脸图像进行分类，得到Q个对象及每一对象对应的人脸图像个数，Q为小于P的正整数，将Q个对象中人脸图像个数大于第一预设阈值的K个对象作为目标对象，K为小于Q的正整数。如此，可快速从样本图像集中确定同行者。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种视频处理方法的第一实施例流程示意图；

图2是本发明实施例提供的一种视频处理方法的第二实施例流程示意图；

图3a是本发明实施例提供的一种视频处理装置的第一实施例结构示意图；

图3b是本发明实施例提供的图3a所描述的视频处理装置的第二获取单元的结构示意图；

图3c是本发明实施例提供的图3a所描述的视频处理装置的第一确定单元的结构示意图；

图3d是本发明实施例提供的图3a所描述的视频处理装置的第二确定单元的结构示意图；

图3e是本发明实施例提供的图3a所描述的视频处理装置的又一结构示意图；

图4是本发明实施例提供的一种视频处理装置的第二实施例结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置展示该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

本发明实施例所描述视频处理装置可以包括智能手机(如Android手机、iOS手机、Windows Phone手机等)、平板电脑、掌上电脑、笔记本电脑、移动互联网设备(MID，MobileInternet Devices)或穿戴式设备等，上述仅是举例，而非穷举，包含但不限于上述装置，当然，上述视频处理装置还可以为服务器。

需要说明的是，本发明实施例中的视频处理装置可与多个摄像头连接，每一摄像头均可用于抓拍视频图像，每一摄像头均可有一个与之对应的位置标记，或者，可有一个与之对应的编号。通常情况下，摄像头可设置在公共场所，例如，学校、博物馆、十字路口、步行街、写字楼、车库、机场、医院、地铁站、车站、公交站台、超市、酒店、娱乐场所等等。摄像头在拍摄到视频图像后，可将该视频图像保存到视频处理装置所在系统的存储器。存储器中可存储有多个图像库，每一图像库可包含同一人的不同视频图像，当然，每一图像库还可以用于存储一个区域的视频图像或者某个指定摄像头拍摄的视频图像。

进一步可选地，本发明实施例中，摄像头拍摄的每一帧视频图像均对应一个属性信息，属性信息为以下至少一种：视频图像的拍摄时间、视频图像的位置、视频图像的属性参数(格式、大小、分辨率等)、视频图像的编号和视频图像中的人物特征属性。上述视频图像中的人物特征属性可包括但不仅限于：视频图像中的人物个数、人物位置、人物角度等等。

进一步需要说明的是，每一摄像头采集的视频图像通常为动态人脸图像，因而，本发明实施例中可以对人脸图像的角度信息进行规划，上述角度信息可包括但不仅限于：水平转动角度、俯仰角或者倾斜度。例如，可定义动态人脸图像数据要求两眼间距不小于30像素，建议60像素以上。水平转动角度不超过±30°、俯仰角不超过±20°、倾斜角不超过±45°。建议水平转动角度不超过±15°、俯仰角不超过±10°、倾斜角不超过±15°。例如，还可对人脸图像是否被其他物体遮挡进行筛选，通常情况下，饰物不应遮挡脸部主要区域，饰物如深色墨镜、口罩和夸张首饰等，当然，也有可能摄像头上面布满灰尘，导致人脸图像被遮挡。本发明实施例中的视频图像的图片格式可包括但不仅限于：BMP，JPEG，JPEG2000，PNG等等，其大小可以在10-30KB之间，每一视频图像还可以对应一个拍摄时间、以及拍摄该视频图像的摄像头统一编号、与人脸图像对应的全景大图的链接等信息(人脸图像和全局图像建立特点对应性关系文件)。

需要说明的是，本发明实施例中的对象是指某个人，例如，“张三”，张三可能是徘徊对象，只要张三在目标布控范围内的出现次数大于第一预设阈值，第一预设阈值可由用户自行设置或者系统默认。按照本发明实施例，从样本图像集中获取张三的人脸图像时，可得到多张人脸图像，在其人脸图像的张数大于第一预设阈值的时候，则可认为张三可作为目标对象，即同行者。

请参阅图1，为本发明实施例提供的一种视频处理方法的第一实施例流程示意图。本实施例中所描述的视频处理方法，包括以下步骤：

101、获取目标布控对象的目标人脸图像。

其中，视频处理装置可接收由终端发送的目标布控对象的目标人脸图像，或者，视频处理装置可自行加载目标布控对象的目标人脸图像。

可选地，终端可与视频处理装置之间建立网络连接，终端可将一个目标布控对象的目标人脸图像发送给视频处理装置。在实际应用中，视频处理装置也可以自行加载目标人脸图像，视频处理装置的管理员，在其身份验证通过后，可加载至少一个目标布控对象的人脸图像，如此，可实现对目标布控对象的设置。

102、获取目标布控范围内所述目标人脸图像对应的样本图像集。

其中，目标布控范围可由用户指定，或者，可以默认为某个具体范围(例如，所有摄像头的监控范围内)。视频处理装置可从历史视频库中获取目标布控范围内的所述目标人脸图像对应的样本图像集。通常情况下，目标布控范围可为一个或者多个摄像头所在监控范围。

可选地，上述步骤102中，获取目标布控范围内所述目标人脸图像对应的样本图像集，可包括如下步骤：

21)、获取用户选取的布控时间段；

22)、根据所述布控时间段确定所述目标人脸图像首次出现时间和最后出现时间；

23)、从历史视频库中截取所述目标布控范围内处于所述首次出现时间与所述最后出现时间之间的样本图像集。

其中，上述样本图像集可为一段视频文件，或者，多张视频图像组成的样本图像集。上述历史视频库中可包含监控范围内的所有摄像头拍摄到的样本图像集。通常情况下，视频的监控时间越来，则其内存越大，因而，可获取用户选取的布控时间段，针对不同的摄像头而言，每一摄像头的布控时间段可不一样，当然，所有的摄像头的布控时间段也可以一样，具体地，依据实际情况而定。上述布控区域可为监控范围的部分区域，即目标布控范围可由用户指定的一个或者多个摄像头的监控区域所构成，或者，目标布控范围可由用户指定的某个区域范围内的摄像头所构成。以目标布控范围内的一个摄像头为例，该摄像头可持续进行拍摄，因而，可记录不同时刻的录像，而用户需要的，是布控时间段内的样本图像集，因而，可从该摄像头对应的历史视频库中截取布控时间段对应的样本图像集。

其中，在步骤21中，用户可输入布控时间段，当然，可统一针对布控区域内的每一摄像头布控时间段。或者，布控区域内的每一摄像头对应的布控时间段不一样，因为布控对象同时出现在不同的摄像头的监控范围内的概率较小，因此，更多时候布控对象只会在一个时刻处于一个摄像头的监控范围内。因而，不同的摄像头可对应不同的布控时间段。进一步地，视频处理装置可确定布控时间段内目标人脸图像首次出现时间(第一次出现的时间)和最后出现时间(最后一次出现的时间)，然后，截取目标布控范围内处于首次出现时间与最后出现时间之间的样本图像集。

103、确定所述样本图像集中包含所述目标人脸图像匹配的N张视频图像。

具体实现中，可将样本图像集中的每一张视频图像与人脸图像进行匹配，从而，得到多个匹配值，从这些匹配值中选取大于某一阈值的匹配值对应的视频图像，得到N张视频图像。

可选地，上述步骤103中，确定所述样本图像集中包含所述目标人脸图像匹配的N张视频图像，可包括如下步骤：

31)、对所述样本图像集进行解析，得到A张视频图像，所述A为大于1的整数；

32)、将所述目标人脸图像与所述A张视频图像中的每一视频图像进行匹配，得到所述A个匹配值；

33)、从所述A个匹配值中选取大于第二预设阈值的所述N个匹配值，并获取其对应的视频图像。

其中，上述第二预设阈值可由用户自行设置或系统默认。在步骤31中，可对样本图像集进行解析(如解码操作)，从而，得到A张视频图像，将目标人脸图像与A张视频图像中的每一视频图像进行匹配，从而，可得到A个匹配值，选取A个匹配值中大于第二预设阈值的N个匹配值，并获取其对应的视频图像，得到N张视频图像，A

104、对所述N张视频图像中每一视频图像进行图像分割，得到所述N个目标人脸图像，其中，每一张视频图像包含一张所述目标人脸图像。

其中，可对N张视频图像中每一视频图像进行图像分割，从而，可得到N个目标人脸图像，即N张视频图像中的每一视频图像对应一个目标人脸图像。

105、从所述样本图像集中确定出以所述N个目标人脸图像中的每一目标人脸图像对应的时间点为时间起点的预设时间长度内的视频图像中出现的人脸图像，得到P个人脸图像，所述P为大于1的整数。

其中，预设时间长度可由用户指定或者系统默认。

可选地，上述步骤105中，从所述样本图像集中确定出以所述N个目标人脸图像中的每一目标人脸图像对应的时间点为时间起点的预设时间长度内的视频图像中出现的人脸图像，包括：

51)、将所述样本图像集中的每一视频图像进行图像分割，得到X个人脸图像，所述X为大于1的整数；

52)、获取目标人脸图像i对应的时间点为时间起点的所述预设时间长度内的Y个人脸图像，所述目标人脸图像i为所述N个目标人脸图像中的任一个，所述Y为正整数，所述Y个人脸图像为所述X个人脸图像中的一部分。

其中，样本图像集中的每一视频图像中可能包含多个人脸图像，因而，可对视频图像进行图像分割之后，可得到X个人脸图像，当然，每一人脸图像均对应一个时间点，即得到该人脸图像时刻的时间点，以目标人脸图像i为例，可获取目标人脸图像i对应的时间点为时间起点的预设时间长度内的Y个人脸图像，其中，目标人脸图像i为N个目标人脸图像中的任一个，Y为正整数，Y个人脸图像为X个人脸图像中的一个，如此，可对N个目标人脸图像均可进行上述操作，从而，可得到P个人脸图像。

106、将所述P个人脸图像进行分类，得到Q个对象及每一对象对应的人脸图像个数，所述Q为小于所述P的正整数。

其中，可将P个人脸图像进行分类，可得到Q个对象以及每一对象的人脸图像个数，Q为小于P的正整数。具体实现方式如下：视频处理装置可从P张人脸图像中任意选取一张人脸图像，以人脸图像j为例，可将其与其他的P-1张人脸图像进行匹配，得到P-1个匹配值，当然，该P-1个匹配值大小不一，因而，可从该P-1个匹配值中选取大于第二预设阈值的匹配值，并将其对应的人脸图像作为第j类，如此，可以得到上述Q个类中的一个类，假设第一类中包含S个人脸图像。进一步地，可从P张人脸图像中剔除属于第j类的人脸图像，得到P-S个人脸图像，再选取一张人脸图像h，该人脸图像为P-S个人脸图像中的一个，将人脸图像h与P-S个人脸图像中除了人脸图像h之外的其他图像进行匹配，得到P-S-1个匹配值，再从该P-S-1个匹配值中选取大于第二预设阈值的匹配值，并将其对应的人脸图像作为第h类，如此，可以得到上述Q个类中的又一个类，以此类推，可以得到上述Q个类，每一类对应一个对象。

107将所述Q个对象中人脸图像个数大于第一预设阈值的K个对象作为目标对象，所述K为小于所述Q的正整数。

其中，因而，可从Q个对象中选取人脸图像个数大于第一预设阈值的K个对象作为目标对象，即同行者，K为小于Q的正整数。

与上述一致地，请参阅图2，为本发明实施例提供的一种视频处理方法的第二实施例流程示意图。本实施例中所描述的视频处理方法，包括以下步骤：

201、获取目标布控对象的目标人脸图像。

202、获取目标布控范围内所述目标人脸图像对应的样本图像集。

203、确定所述样本图像集中包含所述目标人脸图像匹配的N张视频图像。

204、对所述N张视频图像中每一视频图像进行图像分割，得到所述N个目标人脸图像，其中，每一张视频图像包含一张所述目标人脸图像。

205、从所述样本图像集中确定出以所述N个目标人脸图像中的每一目标人脸图像对应的时间点为时间起点的预设时间长度内的视频图像中出现的人脸图像，得到P个人脸图像，所述P为大于1的整数。

206、将所述P个人脸图像进行分类，得到Q个对象及每一对象对应的人脸图像个数，所述Q为小于所述P的正整数。

207、将所述Q个对象中人脸图像个数大于第一预设阈值的K个对象作为目标对象，所述K为小于所述Q的正整数。

可选地，上述步骤201-步骤207的具体描述可参照图1所描述的视频处理方法的步骤101-步骤107的对应步骤，在此不再赘述。

208、将所述目标对象发送给终端。

其中，视频处理装置可将目标对象发送给至少一个终端。该至少一个终端可为布控范围内的终端用户。如此，终端可在接收到目标对象之后，进行侦查或者寻找线索。

可以看出，通过本发明实施例，获取目标布控对象的目标人脸图像，获取目标布控范围内目标人脸图像对应的样本图像集，确定所述样本图像集中包含所述目标人脸图像匹配的N张视频图像，对N张视频图像中每一视频图像进行图像分割，得到N个目标人脸图像，其中，每一张视频图像包含一张目标人脸图像，从样本图像集中确定出以N个目标人脸图像中的每一目标人脸图像对应的时间点为时间起点的预设时间长度内的视频图像中出现的人脸图像，得到P个人脸图像，P为大于1的整数，将P个人脸图像进行分类，得到Q个对象及每一对象对应的人脸图像个数，Q为小于P的正整数，将Q个对象中人脸图像个数大于第一预设阈值的K个对象作为目标对象，K为小于Q的正整数，将目标对象发送给终端。如此，可快速从样本图像集中确定同行者。

与上述一致地，以下为实施上述视频处理方法的装置，具体如下：

请参阅图3a，为本发明实施例提供的一种视频处理装置的第一实施例结构示意图。本实施例中所描述的视频处理装置，包括：第一获取单元301、第二获取单元302、第一确定单元303、分割单元304、第二确定单元305、分类单元306和第三确定单元307，具体如下：

第一获取单元301，用于获取目标布控对象的目标人脸图像；

第二获取单元302，用于获取目标布控范围内所述目标人脸图像对应的样本图像集；

第一确定单元303，用于确定所述样本图像集中包含所述目标人脸图像匹配的N张视频图像；

分割单元304，用于对所述N张视频图像中每一视频图像进行图像分割，得到所述N个目标人脸图像，其中，每一张视频图像包含一张所述目标人脸图像；

第二确定单元305，用于从所述样本图像集中确定出以所述N个目标人脸图像中的每一目标人脸图像对应的时间点为时间起点的预设时间长度内的视频图像中出现的人脸图像，得到P个人脸图像，所述P为大于1的整数；

分类单元306，用于将所述P个人脸图像进行分类，得到Q个对象及每一对象对应的人脸图像个数，所述Q为小于所述P的正整数；

第三确定单元307，用于将所述Q个对象中人脸图像个数大于第一预设阈值的K个对象作为目标对象，所述K为小于所述Q的正整数。

可选地，如图3b，图3b为图3a中所描述的视频处理装置中的第二获取单元302的具体细化结构，所述第二获取单元302可包括：第一获取模块3021、确定模块3022和截取模块3023，具体如下：

第一获取模块3021，用于获取用户选取的布控时间段；

确定模块3022，用于根据所述布控时间段确定所述目标人脸图像首次出现时间和最后出现时间；

截取模块3023，用于从历史视频库中截取所述目标布控范围内处于所述首次出现时间与所述最后出现时间之间的样本图像集。

可选地，如图3c，图3c为图3a中所描述的视频处理装置中的第一确定单元303的具体细化结构，所述第一确定单元303可包括：解析模块3031、匹配模块3032和选取模块3033，具体如下：

解析模块3031，用于对所述样本图像集进行解析，得到A张视频图像，所述A为大于1的整数；

匹配模块3032，用于将所述目标人脸图像与所述A张视频图像中的每一视频图像进行匹配，得到所述A个匹配值；

选取模块3033，用于从所述A个匹配值中选取大于第二预设阈值的所述N个匹配值，并获取其对应的视频图像。

可选地，如图3d，图3d为图3a中所描述的视频处理装置中的第二确定单元305的具体细化结构，所述第二确定单元305可包括：分割模块3051和第二获取模块3052，具体如下：

分割模块3051，用于将所述样本图像集中的每一视频图像进行图像分割，得到X个人脸图像，所述X为大于1的整数；

第二获取模块3052，用于获取目标人脸图像i对应的时间点为时间起点的所述预设时间长度内的Y个人脸图像，所述目标人脸图像i为所述N个目标人脸图像中的任一个，所述Y为正整数，所述Y个人脸图像为所述X个人脸图像中的一部分。

可选地，如图3e，图3e为图3a中所描述的视频处理装置的又一变型结构，所述视频处理装置还可包括：发送单元308，具体如下：

发送单元308，用于在所述第三确定单元307将所述Q个对象中人脸图像个数大于第一预设阈值的K个对象作为目标对象之后，将所述目标对象发送给终端。

可以看出，通过本发明实施例所描述的视频处理装置，获取目标布控对象的目标人脸图像，获取目标布控范围内目标人脸图像对应的样本图像集，确定所述样本图像集中包含所述目标人脸图像匹配的N张视频图像，对N张视频图像中每一视频图像进行图像分割，得到N个目标人脸图像，其中，每一张视频图像包含一张目标人脸图像，从样本图像集中确定出以N个目标人脸图像中的每一目标人脸图像对应的时间点为时间起点的预设时间长度内的视频图像中出现的人脸图像，得到P个人脸图像，P为大于1的整数，将P个人脸图像进行分类，得到Q个对象及每一对象对应的人脸图像个数，Q为小于P的正整数，将Q个对象中人脸图像个数大于第一预设阈值的K个对象作为目标对象，K为小于Q的正整数。如此，可快速从样本图像集中确定同行者。

与上述一致地，请参阅图4，为本发明实施例提供的一种视频处理装置的第二实施例结构示意图。本实施例中所描述的视频处理装置，包括：至少一个输入设备1000；至少一个输出设备2000；至少一个处理器3000，例如CPU；和存储器4000，上述输入设备1000、输出设备2000、处理器3000和存储器4000通过总线5000连接。

其中，上述输入设备1000具体可为触控面板、物理按键或者鼠标。

上述输出设备2000具体可为显示屏。

上述存储器4000可以是高速RAM存储器，也可为非易失存储器(non-volatilememory)，例如磁盘存储器。上述存储器4000用于存储一组程序代码，上述输入设备1000、输出设备2000和处理器3000用于调用存储器4000中存储的程序代码，执行如下操作：

上述处理器3000，用于：

获取目标布控对象的目标人脸图像；

获取目标布控范围内所述目标人脸图像对应的样本图像集；

可选地，上述处理器3000获取目标布控范围内所述目标人脸图像对应的样本图像集，包括：

获取用户选取的布控时间段；

可选地，上述处理器3000确定所述样本图像集中包含所述目标人脸图像匹配的N张视频图像

进一步可选地，上述处理器3000从所述样本图像集中确定出以所述N个目标人脸图像中的每一目标人脸图像对应的时间点为时间起点的预设时间长度内的视频图像中出现的人脸图像，包括：

可选地，上述处理器3000，在所述将所述Q个对象中人脸图像个数大于第一预设阈值的K个对象作为目标对象之后，还具体用于：

将所述目标对象发送给终端。

本发明实施例还提供一种计算机存储介质，其中，该计算机存储介质可存储有程序，该程序执行时包括上述方法实施例中记载的任何一种视频处理方法的部分或全部步骤。

尽管在此结合各实施例对本发明进行了描述，然而，在实施所要求保护的本发明过程中，本领域技术人员通过查看所述附图、公开内容、以及所附权利要求书，可理解并实现所述公开实施例的其他变化。在权利要求中，“包括”(comprising)一词不排除其他组成部分或步骤，“一”或“一个”不排除多个的情况。单个处理器或其他单元可以实现权利要求中列举的若干项功能。相互不同的从属权利要求中记载了某些措施，但这并不表示这些措施不能组合起来产生良好的效果。

本领域技术人员应明白，本发明的实施例可提供为方法、装置(设备)、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。计算机程序存储/分布在合适的介质中，与其它硬件一起提供或作为硬件的一部分，也可以采用其他分布形式，如通过Internet或其它有线或无线电信系统。

本发明是参照本发明实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管结合具体特征及其实施例对本发明进行了描述，显而易见的，在不脱离本发明的精神和范围的情况下，可对其进行各种修改和组合。相应地，本说明书和附图仅仅是所附权利要求所界定的本发明的示例性说明，且视为已覆盖本发明范围内的任意和所有修改、变化、组合或等同物。显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种视频处理方法，其特征在于，包括：

获取目标布控对象的目标人脸图像；

获取目标布控范围内所述目标人脸图像对应的样本图像集；

对所述N张视频图像中每一视频图像进行图像分割，得到N个目标人脸图像，其中，每一张视频图像包含一张所述目标人脸图像；

从所述样本图像集中确定出以所述N个目标人脸图像中的每一目标人脸图像对应的时间点为时间起点的预设时间长度内的视频图像中出现的人脸图像，得到P个人脸图像，P为大于1的整数；

将所述P个人脸图像进行分类，得到Q个对象及每一对象对应的人脸图像个数，Q为小于P的正整数；

将所述Q个对象中人脸图像个数大于第一预设阈值的K个对象作为目标对象，K为小于Q的正整数。

2.根据权利要求1所述的方法，其特征在于，所述获取目标布控范围内所述目标人脸图像对应的样本图像集，包括：

获取用户选取的布控时间段；

3.根据权利要求1或2任一项所述的方法，其特征在于，所述确定所述样本图像集中包含所述目标人脸图像匹配的N张视频图像，包括：

对所述样本图像集进行解析，得到A张视频图像，A为大于1的整数；

将所述目标人脸图像与所述A张视频图像中的每一视频图像进行匹配，得到A个匹配值；

4.根据权利要求3所述的方法，其特征在于，所述从所述样本图像集中确定出以所述N个目标人脸图像中的每一目标人脸图像对应的时间点为时间起点的预设时间长度内的视频图像中出现的人脸图像，包括：

将所述样本图像集中的每一视频图像进行图像分割，得到X个人脸图像，X为大于1的整数；

获取目标人脸图像i对应的时间点为时间起点的所述预设时间长度内的Y个人脸图像，所述目标人脸图像i为所述N个目标人脸图像中的任一个，Y为正整数，所述Y个人脸图像为所述X个人脸图像中的一部分。

5.根据权利要求1或2任一项所述的方法，其特征在于，在所述将所述Q个对象中人脸图像个数大于第一预设阈值的K个对象作为目标对象之后，所述方法还包括：

将所述目标对象发送给终端。

6.一种视频处理装置，其特征在于，包括:

第一获取单元，用于获取目标布控对象的目标人脸图像；

分割单元，用于对所述N张视频图像中每一视频图像进行图像分割，得到N个目标人脸图像，其中，每一张视频图像包含一张所述目标人脸图像；

第二确定单元，用于从所述样本图像集中确定出以所述N个目标人脸图像中的每一目标人脸图像对应的时间点为时间起点的预设时间长度内的视频图像中出现的人脸图像，得到P个人脸图像，P为大于1的整数；

分类单元，用于将所述P个人脸图像进行分类，得到Q个对象及每一对象对应的人脸图像个数，Q为小于P的正整数；

第三确定单元，用于将所述Q个对象中人脸图像个数大于第一预设阈值的K个对象作为目标对象，K为小于Q的正整数。

7.根据权利要求6所述的视频处理装置，其特征在于，所述第二获取单元包括：

第一获取模块，用于获取用户选取的布控时间段；

8.根据权利要求6或7任一项所述的视频处理装置，其特征在于，所述第一确定单元包括：

解析模块，用于对所述样本图像集进行解析，得到A张视频图像，A为大于1的整数；

匹配模块，用于将所述目标人脸图像与所述A张视频图像中的每一视频图像进行匹配，得到A个匹配值；

9.根据权利要求8所述的视频处理装置，其特征在于，所述第二确定单元包括：

分割模块，用于将所述样本图像集中的每一视频图像进行图像分割，得到X个人脸图像，X为大于1的整数；

第二获取模块，用于获取目标人脸图像i对应的时间点为时间起点的所述预设时间长度内的Y个人脸图像，所述目标人脸图像i为所述N个目标人脸图像中的任一个，Y为正整数，所述Y个人脸图像为所述X个人脸图像中的一部分。

10.根据权利要求6或7任一项所述的视频处理装置，其特征在于，所述视频处理装置还包括：