WO2018205991A1

WO2018205991A1 - 一种视频浓缩的方法、装置和系统

Info

Publication number: WO2018205991A1
Application number: PCT/CN2018/086478
Authority: WO
Inventors: 周剑辉
Original assignee: 华为技术有限公司
Priority date: 2017-05-12
Filing date: 2018-05-11
Publication date: 2018-11-15
Also published as: CN108881119B; CN108881119A

Abstract

本申请提供了一种视频浓缩的方法、装置和系统，属于计算机技术领域。该方法包括：接收并存储前端设备发送的在目标视频数据中提取的背景图像和预设类型的分析对象在所述目标视频数据中的位置点组成的第一位置集合；当接收到终端发送的所述目标视频数据的浓缩请求时，基于所述第一位置集合、所述目标视频数据中所述预设类型的分析对象的图像、背景图像，合成所述目标视频数据对应的浓缩视频数据；向所述终端发送所述浓缩视频数据。通过本申请，可以提高终端获取浓缩视频数据的效率。

Description

一种视频浓缩的方法、装置和系统

本申请要求于2017年5月12日提交中国专利局、申请号为201710334822.7、发明名称为“一种视频浓缩的方法、装置和系统”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及计算机技术领域，特别涉及一种视频浓缩的方法、装置和系统。

背景技术

城市公共场所一般安装有监控摄像头，昼夜不停的进行录像，并上传给服务器进行存储，当案件发生时，公安人员可以操作终端从服务器获取某个路口的监控摄像头在某个时间段内拍摄的视频数据进行播放，公安人员通过观看这些视频数据，从中寻找有用的信息。

为了节约公安人员浏览视频数据所用的时长，服务器将视频数据进行浓缩，视频的浓缩是在尽量保证视频中某些类型的分析对象(也可称作分析对象，如人、车、动物等)的信息完整的前提下，对这些类型的分析对象在时间上打乱重组，使视频时间缩短。现有技术中，公安人员想要看某个视频的浓缩视频，可以向服务器发送视频数据的浓缩请求，服务器接收到视频数据的获取请求后，可以提取背景图像、预设类型的分析对象在该视频数据中的位置信息，然后基于预设类型的分析对象的位置信息、背景图像，预设类型的分析对象的图像，合成该视频数据对应的浓缩视频数据，然后发送至终端进行播放。

由于服务器提取预设类型的分析对象的位置信息、背景图像所用的时长比较长，从而终端获取浓缩视频数据的效率较低。

发明内容

为了解决现有技术的问题，本发明实施例提供了一种视频浓缩的方法、装置和系统。所述技术方案如下：

第一方面，提供了一种视频浓缩方法，该方法包括：

接收并存储前端设备发送的在目标视频数据中提取的背景图像和预设类型的分析对象在目标视频数据中的位置点组成的第一位置集合；

当接收到终端发送的目标视频数据的浓缩请求时，基于第一位置集合、目标视频数据中预设类型的分析对象的图像、背景图像，合成目标视频数据对应的浓缩视频数据；

向终端发送浓缩视频数据。

其中，预设类型可以由技术人员预设，并且存储至摄像端，如人、车、动物等。预设类型的分析对象的图像可以是按照分析对象的外边缘在目标视频数据中截取的图像，也可以是按照分析对象的外边缘形成的最小矩形在目标视频数据中截取的图像。

本发明实施例所示的方案，服务器对接收到的前端设备发送的目标视频数据对应的背景图像和预设类型分析对象进行存储。当接收到终端发送的目标视频数据的浓缩请求时，可以基于第一位置集合、目标视频数据中预设类型的分析对象的图像、背景图像，合成目标视频数据对应的浓缩视频数据，将浓缩视频数据发送至终端，终端接收到浓缩视频数据后，可以进行播放。

在一种可能的实现方式中，该方法还包括：

接收并存储前端设备发送的目标视频数据中预设类型的分析对象的图像。

在一种可能的实现方式中，基于第一位置集合、目标视频数据中预设类型的分析对象的图像、背景图像，合成目标视频数据对应的浓缩视频数据之前，还包括：

接收并存储前端设备发送的目标视频数据，且接收并存储前端设备发送的预设类型的分析对象在目标视频数据中的每个位置点对应的播放进度点；

基于第一位置集合和每个位置点对应的播放进度点，从目标视频数据中截取预设类型的分析对象的图像。

本发明实施例所示的方案，服务器可以接收第一位置集合中每个位置点对应的播放进度点，然后在目标视频数据中，按照第一位置集合中每个位置点对应的播放进度点，确定出播放进度点对应的视频帧，然后使用位置点，从该视频帧中相应的位置处截取预设类型的分析对象的图像。

第二方面，提供了一种视频浓缩方法，该方法包括：

获取目标视频数据；

从目标视频数据中，提取背景图像和预设类型的分析对象在目标视频数据中的位置点组成的第一位置集合；

向服务器发送第一位置集合和背景图像。

本发明实施例所示的方案，前端设备可以进行持续的拍摄视频数据，获取持续拍摄的视频数据中的一段视频数据，该段视频数据在后续可以称为目标视频数据，如获取上午9点至上午10点的视频数据等。前端设备可以提取目标视频数据中的每一帧图像，分析每一帧图像的像素点数据，确定每一帧图像中包括的预设类型的分析对象的位置点，将确定出的预设类型的分析对象的位置点组成第一位置集合，在第一位置集合中存储有分析对象与位置点的对应关系，以及每个位置点在目标视频数据中的先后顺序。并且前端设备可以分析每一帧图像中像素点数据，确定每一帧图像中的背景图像，如果确定连续多帧图像中的背景图像相同，可以仅存储一张背景图像，然后向服务器发送第一位置集合和背景图像。

在一种可能的实现方式中，该方法还包括：

从目标视频数据中，截取预设类型的分析对象的图像；

向服务器发送预设类型的分析对象的图像。

本发明实施例所示的方案，前端设备在提取预设类型的分析对象在目标视频数据中的位置点时，还可以按照分析对象的外边缘在目标视频数据中截取图像，也可以按照分析对象的外边缘形成的最小矩形在目标视频数据中截取图像，然后向服务器发送预设类型的分析对象的图像。这样，可以节约服务器浓缩视频所用的时长。

在一种可能的实现方式中，该方法还包括：

从目标视频数据中，提取第一位置集合中的每个位置点对应的播放进度点；

向服务器发送每个位置点对应的播放进度点和目标视频数据。

本发明实施例所示的方案，前端设备在提取预设类型的分析对象在目标视频数据中的位置点时，还可以提取每个位置点对应的播放进度点，然后向服务器发送每个位置点对应的播放进度点和目标视频数据。

在一种可能的实现方式中，对目标视频数据进行降低分辨率处理，得到第一视频数据；

对目标视频数据进行降低帧率处理，得到第二视频数据；

从第一视频数据中，提取预设类型的分析对象在目标视频数据中的位置点组成的第一位置集合，并从第二视频数据中，提取背景图像。

本发明实施例所示的方案，前端设备可以将目标视频数据分别进行降低分辨率处理、降低帧率处理，分别得到第一视频数据与第二视频数据。然后从第一视频数据中，提取第一位置集合，从第二视频数据中，提取背景图像。这样，由于第一视频数据中每一帧图像的像素点比目标视频数据中每一帧图像的像素点少，在提取预设类型的分析对象的位置点时，速度会比较快，而且由于前端设备拍摄的范围一般是固定的，背景图像变化比较慢，可以使帧率降低，使每秒包括的帧数减少，进而使分析复杂度降低，从而可以更快的提取到背景图像。

在一种可能的实现方式中，对目标视频数据进行降低分辨率和降低帧率处理，得到第一视频数据。

本发明实施例所示的方案，前端设备还可以对目标视频数据进行降低分辨率和降低帧率处理，从第一视频数据中提取第一位置集合，这样，由于第一视频数据中每一帧图像的像素点比目标视频数据中每一帧图像的像素点少，而且帧率还比较低，从而可以缩短提取时长。

在一种可能的实现方式中，第一视频数据的帧率高于第二视频数据的帧率。

本发明实施例所示的方案，由于要在目标视频数据中找到每一帧图像包括的预设类型的分析对象，才能确定预设类型的分析对象的位置点，所以帧率要稍微高一点，而由于背景图像变化比较慢，帧率可以比提取位置点的视频数据的帧率低一点。

在一种可能的实现方式中，该方法还包括：

从第一视频数据中，提取第一位置集合中的每个位置点对应的播放进度点；

从目标视频数据中，提取特定类型的分析对象在目标视频数据中的位置点组成的第二位置集合，并提取第二位置集合中每个位置点对应的播放进度点，其中，特定类型包括预设类型中的至少一种类型；

基于第二位置集合中每个位置点对应的播放进度点、第二位置集合、第一位置集合中每个位置点对应的播放进度点和第一位置集合，在第二位置集合中，确定第一位置集合中不包括的分析对象的位置点组成的第三位置集合；

将第三位置集合中包括的位置点添加到第一位置集合中。

本发明实施例所示的方案，前端设备在第一视频数据中，提取预设类型分析对象在目标视频数据中的位置点组成的第一位置集合时，可以提取每个位置点对应的播放进度点。前端设备可以从目标视频数据中，提取特定类型的分析对象在目标视频数据中的位置点组成的第二位置集合。然后使用第一位置集合中每个位置点、以及每个位置点对应的播放进度点、第二位置集合中每个位置点、以及每个位置点对应的播放进度点，在第二位置集合中，确定第一位置集合中不包括的分析对象的位置点组成的第三位置集合，不包括的分析对象的位置点由三种位置点组成，其中是播放进度点相同但是位置点不同的位置点、播放进度点不相同但是位置点相同的位置点、播放进度点与位置点都不相同的位置点，然后将第三位置集合中包括的位置点添加到第一位置集合中。

第二方面，提供了一种服务器，服务器包括处理器、存储器、发射器和接收器，处理器通过执行指令来实现上述第一方面所提供的视频浓缩的方法。

第三方面，提供了一种前端设备，前端设备包括处理器、发射器和接收器，处理器通过执行指令来实现上述第二方面所提供的视频浓缩的方法。

第四方面，提供了一种服务器，该服务器包括至少一个模块，该至少一个模块用于实现上述第一方面所提供的视频浓缩的方法。

第五方面，提供了一种前端设备，该前端设备包括至少一个模块，该至少一个模块用于实现上述第二方面所提供的视频浓缩的方法。

第六方面，提供了一种包含指令的计算机程序产品，当其在服务器上运行时，使得服务器执行上述第一方面所提供的视频浓缩的方法。

第七方面，提供了一种包含指令的计算机程序产品，当其在前端设备上运行时，使得前端设备执行上述第二方面所提供的视频浓缩的方法。

本发明实施例提供的技术方案带来的有益效果是：

基于上述处理，服务器在接收到终端发送的目标视频数据的浓缩请求后，可以直接使用存储的预设类型的分析对象在目标视频数据中的位置点组成的第一位置集合和背景图像，合成浓缩视频数据，而不需要提取背景图像和预设类型的分析对象在目标视频数据中的位置点组成的第一位置集合，从而可以提高终端获取浓缩视频数据的效率。

附图说明

图1是本发明实施例提供的一种视频浓缩的系统的结构示意图；

图2是本发明实施例提供的一种前端设备的结构示意图；

图3是本发明实施例提供的一种服务器的结构示意图；

图4是本发明实施例提供的一种视频浓缩的流程示意图；

图5是本发明实施例提供的一种视频浓缩的流程示意图；

图6是本发明实施例提供一种服务器的结构示意图；

图7是本发明实施例提供一种服务器的结构示意图；

图8是本发明实施例提供的一种前端设备的结构示意图；

图9是本发明实施例提供的一种前端设备的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。

本发明实施例可以由前端设备和服务器共同实现，如图1所示，前端设备可以是网络摄像机(Internet Protocol Camera，IPC)，可以用于拍摄视频数据、提取预设类型的分析对象在视频数据中的位置点组成的位置集合等，前端设备也可以是边缘智能设备，可以用于从网络摄像机中获取视频数据，并提取预设类型的分析对象在视频数据中的位置点组成的位置集合等，前端设备还可以由网络摄像机和边缘智能设备组成，网络摄像机可以用于拍摄视频数据，并将视频数据传输至边缘智能设备，边缘智能设备可以用于提取预设类型的分析对象在视频数据中的位置点组成的位置集合等。服务器可以是云端设备等，可以用于存储视频数据和预设类型的分析对象在视频数据中的位置点组成的位置集合，还可以用于合成浓缩视频数据等。

如图2所示，前端设备可以包括接收器210、处理器220、发射器230、存储器240和图像采集部件250。接收器210、发射器230可以分别与处理器220连接，接收器210可以用于接收消息或数据，发射器230可以用于发送消息或数据，存储器240可以用于存储目标视频数据等，图像采集部件250可以用于拍摄视频数据，处理器220可以是前端设备的控制中心，利用各种接口和线路连接整个基站的各个部分，如接收器210、发射器230、存储器240等。在本发明实施例中，处理器220可以用于提取背景图像和位置集合的相关处理，可选的，处理器220可以包括一个或多个处理单元。

如图3所示，服务器可以包括接收器310、处理器320、发射器330和存储器340。接收器310、发射器330可以分别与处理器320连接，接收器310可以用于接收消息或数据，发射器330可以用于发送消息或数据，存储器340可以用于存储视频数据中包括的预设类型的分析对象在视频数据中的位置点组成的位置集合、每个位置点对应的播放进度点等，处理器320可以是服务器的控制中心，利用各种接口和线路连接整个基站的各个部分，如接收器310、发射器330等。在本发明实施例中，处理器320可以用于合成浓缩视频的相关处理，可选的，处理器320可以包括一个或多个处理单元。

如图4所示，本发明实施例提供了一种视频浓缩的方法，本发明实施例以前端设备为网络摄像机为例进行说明，该方法的处理流程可以包括如下的步骤：

步骤401，前端设备获取目标视频数据。

在实施中，公共场所中安装的前端设备一般会持续拍摄视频数据，前端设备可以获取持续拍摄的视频数据中的一段视频数据，该段视频数据在后续可以称为目标视频数据，如获取上午9点至上午10点的视频数据等。

步骤402，前端设备从目标视频数据中，提取背景图像和预设类型的分析对象在目标视频数据中的位置点组成的第一位置集合。

其中，预设类型可以由技术人员预设，并且存储至前端设备，如人、车、动物等。

在实施中，前端设备可以提取目标视频数据中的每一帧图像，分析每一帧图像的像素点数据，基于对应预设类型的分析对象预先存储的特征，确定每一帧图像中包括的预设类型的分析对象的位置点，将确定出的预设类型的分析对象的位置点组成第一位置集合，在第一位置集合中存储有分析对象与位置点的对应关系，以及每个位置点在目标视频数据中的先后顺序。并且前端设备可以分析每一帧图像中像素点数据，确定每一帧图像中的背景图像，如果确定连续多帧图像中的背景图像相同，可以仅存储一张背景图像。

需要说明的是，上述提到的位置点可以是分析对象的中心位置点，也可以是分析对象的边缘构成的多个位置点，本发明实施例不做限定。另外上述提到的预设类型的分析对象可以是仅指运动的预设类型的分析对象，静止的预设类型的分析对象可以作为背景图像中的一部分。

可选的，在提取背景图像时，前端设备可以分析每一帧图像的像素点数据，当检测到背景图像发生变化时，存储一张背景图像，例如，目标视频数据为某个街口的视频数据，从开始到结束背景图像一直没有发生变化，则可以仅存储一张背景图像，目标视频数据为某个街口的视频数据，在视频数据中10分钟处，路边多了一张桌子，则可以存储一张没有桌子的背景图像，记录时间为0分钟，还可以存储一张有桌子的背景图像，记录时间为10分钟。

步骤403，前端设备向服务器发送第一位置集合和背景图像。

在实施中，前端设备确定第一位置集合和背景图像后，可以向服务器发送第一位置集合和背景图像。

步骤404，服务器接收并存储前端设备发送的在目标视频数据中提取的背景图像和预设类型的分析对象在目标视频数据中的位置点组成的第一位置集合。

在实施中，服务器接收到前端设备发送的第一位置集合和背景图像时，可以将目标视频数据的标识与第一位置集合、背景图像对应存储。

步骤405，当服务器接收到终端发送的目标视频数据的浓缩请求时，基于第一位置集合、目标视频数据中预设类型的分析对象的图像、背景图像，合成目标视频数据对应的浓缩视频数据。

其中，预设类型的分析对象的图像可以是按照分析对象的外边缘在目标视频数据中截取的图像，也可以是按照分析对象的外边缘形成的最小矩形在目标视频数据中截取的图像。

在实施中，用户(如公安人员等)想要观看目标视频数据时，可以打开终端安装的视频播放器，找到目标视频的标识，然后点击对应的播放按键，终端则会检测到播放按键的点击指令，向服务器发送目标视频的浓缩请求。服务器接收到目标视频数据的浓缩请求时，可以查找存储的目标视频数据对应的第一位置集合和背景图像，然后服务器可以基于第一位置集合中包括的分析对象的位置点，确定出每两个分析对象在目标视频数据中的轨迹相似度(轨迹相似度指分析对象对应的每个位置点组成的轨迹)，然后使用预设的浓缩率、每两个分析对象在目标视频数据中的轨迹相似度，确定目标视频数据对应的浓缩视频数据中的每一帧图像中包括的分析对象，然后将每一帧图像中包括的分析对象的图像按照对应的位置点贴到背景图像中，然后对贴有前景图像的背景图像进行视频编码，得到目标视频数据对应的浓缩视频数据。

需要说明的是，上述确定目标视频数据对应的浓缩视频数据中的每一帧图像中包括的分析对象的方法可以是：服务器首先可以确定浓缩视频数据中第一帧图像对应的背景图像(一般可以将目标视频数据中第一帧图像对应的背景图像确定为浓缩视频数据中第一帧图像对应的背景图像)，然后可以在第一位置集合选取目标视频数据中的第一帧图像中包括的分析对象的位置点，接下来选取与这些位置点所属的分析对象轨迹相似度最低的分析对象，接下来选取与选取的前两个分析对象的轨迹相似度最低的分析对象，按照此方法依次进行选取，直到浓缩视频数据中第一帧图像对应的背景图像中没有空余的位置。然后选取浓缩视频数据的第二帧图像中包括的分析对象，将前面一帧图像中选取的分析对象作为第二帧图像中的分析对象，如果第二帧图像对应的背景图像中还有空余位置，可以再选取与第二帧图像中包括的分析对象轨迹相似度最低的分析对象，直到第二帧图像中没有空余的位置，这样可以依次确定浓缩视频数据中的每一帧图像包括的分析对象。

在上述确定目标视频数据对应的浓缩视频数据中的每一帧图像中包括的分析对象的方法中，如果两个分析对象的轨迹相似度特别高，如达到了百分之九十，则可以使一个分析对象紧跟着另一个分析对象出现。

另外，上述处理中，还需要考虑目标视频数据的浓缩率，浓缩率越高，目标视频数据对应的浓缩视频数据中的分析对象越密集，浓缩率越低，目标视频数据对应的浓缩视频数据中的分析对象越稀疏。

可选的，在选取背景图像时，如果目标视频数据中仅有一张背景图像，直接可以重复使用该背景图像，如果目标视频数据中有多张背景图像，背景图像都对应有时间标识，可以按照目标视频数据的播放时长与浓缩率，目标视频数据对应的浓缩视频数据的播放时长，一般目标视频数据的播放时长与浓缩视频数据的播放时长的比值等于浓缩率，然后使用背景图像在目标视频数据的播放时长的开始时间点与结束时间点，按比例计算出背景图像在浓缩视频数据的播放时长的开始时间点与结束时间点，例如，目标视频数据的播放时长为60分钟，浓缩率为6，目标视频数据对应的浓缩视频数据的播放时长为10分钟，目标视频数据有两张背景图像，前30分钟背景图像1，后30分钟背景图像2，那么浓缩视频数据中前5分钟使用背景图像1，后5分钟使用背景图像2。

可选的，用户还可以自己选择浓缩率，用户想要观看目标视频数据时，可以打开终端安装的视频播放器，找到目标视频的标识，然后点击对应的播放按键，终端则会检测到播放按键的点击指令，显示浓缩率选项，用户可以选择浓缩率，然后点击确认按键，终端向服务器发送目标视频的浓缩请求，在该浓缩请求中还携带有浓缩率，在服务器进行浓缩视频数据合成时使用接收到的浓缩率，剩下处理过程与前面的描述相同，此处不再赘述。

可选的，上述提到的目标视频数据中预设类型的分析对象的图像有两种获取方法：

方式一：前端设备从目标视频数据中，截取预设类型的分析对象的图像；向服务器发送预设类型的分析对象的图像。服务器接收并存储预设类型的分析对象的图像。

在实施中，前端设备可以识别目标视频数据中每一帧图像包括的像素点，在包括分析对象的每一帧图像中按照分析对象的外边缘截取分析对象的图像，或者在包括分析对象的每一帧图像中按照分析对象的外边缘形成的最小矩形截取分析对象的图像，然后向服务器发送预设类型的分析对象的图像。服务器可以接收预设类型的分析对象的图像，然后与目标视频数据的标识对应存储。

方式二：服务器在进行浓缩视频合成之前，截取预设类型的分析对象的图像，相应的处理可以如下：

前端设备从目标视频数据中，提取第一位置集合中的每个位置点对应的播放进度点；向服务器发送每个位置点对应的播放进度点和目标视频数据。服务器接收并存储前端设备发送的目标视频数据，且接收并存储前端设备发送的预设类型的分析对象在目标视频数据中的每个位置点对应的播放进度点；基于第一位置集合和每个位置点对应的播放进度点，从目标视频数据中截取预设类型的分析对象的图像。

在实施中，前端设备获取到拍摄的目标视频数据后，还可以向服务器发送目标视频数据，服务器接收到目标视频数据后，可以进行存储。

前端设备在获取到拍摄的目标视频数据后，在目标视频数据中，提取预设类型的分析对象在目标视频数据中的位置点时，还可以提取出对应的播放进度点，这样第一位置集合中的每个位置点都对应有播放进度点。服务器可以接收第一位置集合中每个位置点对应的播放进度点，然后可以在目标视频数据中，按照第一位置集合中的每个位置点，以及每个位置点对应的播放进度点，从目标视频数据中截取预设类型的分析对象的图像。

可选的，预设类型的分析对象的图像可以是按照分析对象的外边缘在目标视频数据中截取的图像，也可以是按照分析对象的外边缘形成的最小矩形在目标视频数据中截取的图像。

可选的，在步骤405中，服务器还可以使用第一位置集合中包括的位置点、每个位置点对应的播放进度点，以及浓缩率，确定出目标视频数据对应的浓缩视频数据中每一帧图像包括的分析图像，然后建立每一帧图像包括的分析图像的解码索引，该解码索引中包括每一帧图像中每个分析对象在目标视频数据中所属帧图像之前最近的一个关键帧，这样，如果服务器没有预先存储预设类型的分析对象在目标视频数据中的图像，服务器在合成浓缩视频数据中的某一帧图像时，可以使用解码索引在目标视频数据中找到该帧图像中所包括的分析对象对应的关键帧开始解码，解码到该分析对象所属的帧图像时，从中截取该分析对象的图像，合成浓缩视频数据。这样，截取分析对象的图像时，不需要每次都从目标视频数据的开始时间点进行解码，从而可以更快的获取到分析对象的图像。

另外，如果目标视频数据的播放时长比较长，可以将目标视频数据按照预先存储的时间窗口(如10分钟等)分为多段视频数据，对于每段视频数据，分别计算出每段视频数据对应的浓缩视频数据，再将每段视频数据对应的浓缩视频数据合成一段浓缩视频数据，即得到目标视频数据对应的浓缩视频数据。这样，可以将每段视频数据分别交给不同的线程处理，分别得到每段视频数据对应的浓缩视频数据，而不需要在一个进程中进行，从而可以节约浓缩视频数据所用的时长。

步骤406，服务器向终端发送浓缩视频数据。

在实施中，服务器得到浓缩视频数据后，可以以流媒体方式向终端发送该浓缩视频数据，终端接收到浓缩视频数据后，可以播放该浓缩视频数据。

本申请另一实施例中还提供了对目标视频数据进行处理后，再提取背景图像和第一位置集合的方案，如图5所示，相应的处理流程可以如下：

步骤501，前端设备获取目标视频数据。

在实施中，该步骤与步骤401中的处理完全相同，此处不再赘述。

步骤502，前端设备对目标视频数据进行降低分辨率处理，得到第一视频数据；对目标视频数据进行降低帧率处理，得到第二视频数据；从第一视频数据中，提取预设类型的分析对象在目标视频数据中的位置点组成的第一位置集合，并从第二视频数据中，提取背景图像。

在实施中，前端设备获取到拍摄的目标视频数据后，可以对目标视频数据进行降低分辨率处理，得到第一视频数据，如目标视频数据的分辨率为1080*720，第一视频数据的分辨率为325*288等，还可以对目标视频数据进行降低帧率处理，得到第二视频数据，如目标视频数据的帧率为每秒25帧，第二视频数据的帧率可以为每秒0.5帧等。

然后前端设备可以分析第一视频数据中的每一帧图像的像素点数据，提取预设类型的分析对象在目标视频数据中的位置点组成的第一位置集合，并且可以分析第二视频数据中的每一帧图像的像素点数据，从第二视频数据中，提取背景图像，这样，由于第一视频数据中每一帧图像的像素点比目标视频数据中每一帧图像的像素点少，在提取预设类型的分析对象的位置点时，速度会比较快，而且由于前端设备拍摄的范围一般是固定的，背景图像变化比较慢，可以使帧率降低，使每秒包括的帧数减少，进而使分析复杂度降低，从而可以更快的提取到背景图像。例如，目标视频数据的分辨率、帧率分别为1080*720、每秒25帧，第一视频数据的分辨率、帧率分为540*360，每秒25帧，第二视频数据的分辨率、帧率分别为1080*720、每秒0.5帧如果按照分辨率为352*288，帧率为每秒25帧为基准复杂度1，现有技术中的提取第一位置集合和背景图像的复杂度为：1080*720/352*288＝7.67，从第一视频数据中提取第一位置集合的复杂度为：540*360/352*288＝1.91，从第二视频数据中提取背景图像的复杂度为：1080*720*0.5/352*288*25＝0.153，可见本申请中总复杂度为：1.91+0.153＝2.063，相对现有技术的计算复杂度比较小。

可选的，第一视频数据还可以是降低帧率后的视频数据，相应的处理可以如下：对目标视频数据进行降低分辨率和降低帧率处理，得到第一视频数据。

在实施中，前端设备可以对目标视频数据进行降低分辨率和降低帧率处理，得到第一视频数据，如目标视频数据的分辨率为1080*720，帧率为每秒25帧，第一视频数据的分辨率可以为325*288，帧率可以为每秒12帧，这样，在提取预设类型的分析对象在目标视频数据中的位置点时，进行降低分辨率处理，可以减少每一帧图像中包括的像素点的数据，可以更快的提取到分析对象的位置点，而且进行降低帧率处理，使每秒包括的帧数减少，可以降低分析复杂度。

可选的，第一视频数据的帧率高于第二视频数据的帧率。

在实施中，第一视频数据的帧率要高于第二视频数据的帧率，这是由于第一视频数据是提取分析对象在目标视频数据中的位置点，如果帧率降低太多，会使有些分析对象识别不到，而第二视频数据是提取背景图像，前端设备拍摄的范围一般是固定的，背景图像变化比较慢，所以帧率可以降的比较低。

步骤503，前端设备从第一视频数据中，提取第一位置集合中的每个位置点对应的播放进度点；从目标视频数据中，提取特定类型的分析对象在目标视频数据中的位置点组成的第二位置集合，并提取第二位置集合中每个位置点对应的播放进度点，其中，特定类型包括预设类型中的至少一种类型；基于第二位置集合中每个位置点对应的播放进度点、第二位置集合、第一位置集合中每个位置点对应的播放进度点和第一位置集合，在第二位置集合中，确定第一位置集合中不包括的分析对象的位置点组成的第三位置集合；将第三位置集合中的位置点添加到第一位置集合中。

其中，特定类型包括预设类型中的至少一种类型，如预设类型为人、车、动物等，特定类型为人等。

在实施中，前端设备在第一视频数据中，提取预设类型分析对象在目标视频数据中的位置点组成的第一位置集合时，可以提取每个位置点对应的播放进度点。前端设备可以从目标视频数据中，提取特定类型的分析对象在目标视频数据中的位置点组成的第二位置集合，特定类型的分析对象在目标视频数据中的位置点组成的第二位置集合与前面提取第一位置集合的方法相同此处不再赘述。然后使用第一位置集合中每个位置点、以及每个位置点对应的播放进度点、第二位置集合中每个位置点、以及每个位置点对应的播放进度点，在第二位置集合中，确定第一位置集合中不包括的分析对象的位置点组成的第三位置集合，不包括的分析对象的位置点由三种位置点组成，其中是播放进度点相同但是位置点不同的位置点、播放进度点不相同但是位置点相同的位置点、播放进度点与位置点都不相同的位置点，然后将第三位置集合中包括的位置点添加到第一位置集合中，这样，可以使得到的特定类型的分析对象的位置点更全，尽可能的降低浓缩视频数据中分析对象的丢失率。

步骤504，前端设备向服务器发送第一位置集合和背景图像。

步骤505，服务器接收并存储前端设备发送的在目标视频数据中提取的背景图像和预设类型的分析对象在目标视频数据中的位置点组成的第一位置集合。

步骤506，当服务器接收到终端发送的目标视频数据的浓缩请求时，基于第一位置集合、目标视频数据中预设类型的分析对象的图像、背景图像，合成目标视频数据对应的浓缩视频数据。

步骤507，服务器向终端发送浓缩视频数据。

步骤504至步骤507的处理步骤分别与前面步骤403至406的处理步骤完全相同，本发明实施例不再赘述。

本发明实施例中，服务器在接收到终端发送的目标视频数据的浓缩请求后，可以直接使用存储的预设类型的分析对象在目标视频数据中的位置点组成的第一位置集合和背景图像，合成浓缩视频数据，而不需要提取背景图像和预设类型的分析对象在目标视频数据中的位置点组成的第一位置集合，从而可以提高终端获取浓缩视频数据的效率。

图6是本发明实施例提供的服务器的结构图。该装置可以通过软件、硬件或者两者的结合实现成为服务器中的部分或者全部。本发明实施例提供的服务器可以实现本发明实施例图4、图5所述的流程，该服务器包括：接收模块610、存储模块620、合成模块630和发送模块640，其中：

接收模块610，用于接收并存储前端设备发送的在目标视频数据中提取的背景图像和预设类型的分析对象在所述目标视频数据中的位置点组成的第一位置集合；

存储模块620，用于存储前端设备发送的在目标视频数据中提取的背景图像和预设类型的分析对象在所述目标视频数据中的位置点组成的第一位置集合；

合成模块630，用于当接收到终端发送的所述目标视频数据的浓缩请求时，基于所述第一位置集合、所述目标视频数据中所述预设类型的分析对象的图像、背景图像，合成所述目标视频数据对应的浓缩视频数据；

发送模块640，用于向所述终端发送所述浓缩视频数据。

可选的，所述接收模块610，还用于：

接收并存储所述前端设备发送的所述目标视频数据中所述预设类型的分析对象的图像。

可选的，所述接收模块610，还用于接收并存储所述前端设备发送的所述目标视频数据，且接收并存储所述前端设备发送的所述预设类型的分析对象在所述目标视频数据中的每个位置点对应的播放进度点；

如图7所示，所述服务器还包括：

所述截取模块650，用于基于所述第一位置集合和所述每个位置点对应的播放进度点，从所述目标视频数据中截取所述预设类型的分析对象的图像。

需要说明的是，上述接收模块610、存储模块620、合成模块630、发送模块640和截取模块650可以由处理器320实现，或者处理器320配合发射器330、接收器310、存储器340来实现。

图8是本发明实施例提供的前端设备的结构图。该装置可以通过软件、硬件或者两者的结合实现成为前端设备中的部分或者全部。本发明实施例提供的前端设备可以实现本发明实施例图4、图5所述的流程，该服务器包括：获取模块810、提取模块820和发送模块830，其中：

获取模块810，用于获取目标视频数据；

提取模块820，用于从所述目标视频数据中，提取背景图像和预设类型的分析对象在所述目标视频数据中的位置点组成的第一位置集合；

发送模块830，用于向服务器发送所述第一位置集合和背景图像。

可选的，如图9所示，所述前端设备还包括：

截取模块840，用于从所述目标视频数据中，截取所述预设类型的分析对象的图像；

所述发送模块830，还用于向所述服务器发送所述预设类型的分析对象的图像。

可选的，所述提取模块820，还用于从所述目标视频数据中，提取所述第一位置集合中的每个位置点对应的播放进度点；

所述发送模块830，还用于向所述服务器发送所述每个位置点对应的播放进度点和所述目标视频数据。

可选的，所述提取模块820，用于：

对所述目标视频数据进行降低分辨率处理，得到第一视频数据；

对所述目标视频数据进行降低帧率处理，得到第二视频数据；

从所述第一视频数据中，提取预设类型的分析对象在所述目标视频数据中的位置点组成的第一位置集合，并从所述第二视频数据中，提取背景图像。

可选的，所述提取模块820，用于：

对所述目标视频数据进行降低分辨率和降低帧率处理，得到第一视频数据。

可选的，所述第一视频数据的帧率高于所述第二视频数据的帧率。

可选的，所述提取模块820，还用于：

从所述第一视频数据中，提取所述第一位置集合中的每个位置点对应的播放进度点；

从所述目标视频数据中，提取特定类型的分析对象在所述目标视频数据中的位置点组成的第二位置集合，并提取所述第二位置集合中每个位置点对应的播放进度点，其中，所述特定类型包括所述预设类型中的至少一种类型；

基于所述第二位置集合中每个位置点对应的播放进度点、所述第二位置集合、所述第一位置集合中每个位置点对应的播放进度点和所述第一位置集合，在所述第二位置集合中，确定所述第一位置集合中不包括的分析对象的位置点组成的第三位置集合；

将所述第三位置集合中包括的位置点添加到所述第一位置集合中。

需要说明的是，上述获取模块810、提取模块820、发送模块830和截取模块840可以由处理器220实现，或者处理器220配合发射器230、接收器210来实现。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现，当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令，在服务器和前端设备上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴光缆、光纤、数字用户线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是服务器和前端设备能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(如软盘、硬盘和磁带等)，也可以是光介质(如数字视盘(Digital Video Disk，DVD)等)，或者半导体介质(如固态硬盘等)。

以上所述仅为本申请的一个实施例，并不用以限制本申请，凡在本申请的原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

一种视频浓缩的方法，其特征在于，所述方法包括：

接收并存储前端设备发送的在目标视频数据中提取的背景图像和预设类型的分析对象在所述目标视频数据中的位置点组成的第一位置集合；

当接收到终端发送的所述目标视频数据的浓缩请求时，基于所述第一位置集合、所述目标视频数据中所述预设类型的分析对象的图像、背景图像，合成所述目标视频数据对应的浓缩视频数据；

向所述终端发送所述浓缩视频数据。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

接收并存储所述前端设备发送的所述目标视频数据中所述预设类型的分析对象的图像。
根据权利要求1所述的方法，其特征在于，所述基于所述第一位置集合、所述目标视频数据中所述预设类型的分析对象的图像、背景图像，合成所述目标视频数据对应的浓缩视频数据之前，还包括：

接收并存储所述前端设备发送的所述目标视频数据，且接收并存储所述前端设备发送的所述预设类型的分析对象在所述目标视频数据中的每个位置点对应的播放进度点；

基于所述第一位置集合和所述每个位置点对应的播放进度点，从所述目标视频数据中截取所述预设类型的分析对象的图像。
一种视频浓缩的方法，其特征在于，所述方法包括：

获取目标视频数据；

从所述目标视频数据中，提取背景图像和预设类型的分析对象在所述目标视频数据中的位置点组成的第一位置集合；

向服务器发送所述第一位置集合和背景图像。
根据权利要求4所述的方法，其特征在于，所述方法还包括：

从所述目标视频数据中，截取所述预设类型的分析对象的图像；

向所述服务器发送所述预设类型的分析对象的图像。
根据权利要求4或5所述的方法，其特征在于，所述方法还包括：

从所述目标视频数据中，提取所述第一位置集合中的每个位置点对应的播放进度点；

向所述服务器发送所述每个位置点对应的播放进度点和所述目标视频数据。
根据权利要求4-6任一权利要求所述的方法，其特征在于，所述从所述目标视频数据中，提取背景图像和预设类型的分析对象在所述目标视频数据中的位置点组成的第一位置集合，包括：

对所述目标视频数据进行降低分辨率处理，得到第一视频数据；

对所述目标视频数据进行降低帧率处理，得到第二视频数据；

从所述第一视频数据中，提取预设类型的分析对象在所述目标视频数据中的位置点组成的所述第一位置集合，并从所述第二视频数据中，提取所述背景图像。
根据权利要求7所述的方法，其特征在于，所述对所述目标视频数据进行降低分辨率处理，得到第一视频数据，包括：

对所述目标视频数据进行降低分辨率和降低帧率处理，得到所述第一视频数据。
根据权利要求8所述的方法，其特征在于，所述第一视频数据的帧率高于所述第二视频数据的帧率。
根据权利要求7所述的方法，其特征在于，所述向服务器发送所述第一位置集合和背景图像之前，所述方法还包括：

从所述第一视频数据中，提取所述第一位置集合中的每个位置点对应的播放进度点；

从所述目标视频数据中，提取特定类型的分析对象在所述目标视频数据中的位置点组成的第二位置集合，并提取所述第二位置集合中每个位置点对应的播放进度点，其中，所述特定类型包括所述预设类型中的至少一种类型；

基于所述第二位置集合中每个位置点对应的播放进度点、所述第二位置集合、所述第一位置集合中每个位置点对应的播放进度点和所述第一位置集合，在所述第二位置集合中，确定所述第一位置集合中不包括的分析对象的位置点组成的第三位置集合；

将所述第三位置集合中包括的位置点添加到所述第一位置集合中。
一种服务器，其特征在于，所述服务器包括：

接收器，用于接收前端设备发送的在目标视频数据中提取的背景图像和预设类型的分析对象在所述目标视频数据中的位置点组成的第一位置集合；

存储器，用于存储所述前端设备发送的在目标视频数据中提取的背景图像和预设类型的分析对象在所述目标视频数据中的位置点组成的第一位置集合；

处理器，用于当接收到终端发送的所述目标视频数据的浓缩请求时，基于所述第一位置集合、所述目标视频数据中所述预设类型的分析对象的图像、背景图像，合成所述目标视频数据对应的浓缩视频数据；

发送器，用于向所述终端发送所述浓缩视频数据。
根据权利要求11所述的服务器，其特征在于，所述接收器，还用于：

接收并存储所述前端设备发送的所述目标视频数据中所述预设类型的分析对象的图像。
根据权利要求11所述的服务器，其特征在于，所述接收器，还用于：

接收并存储所述前端设备发送的所述目标视频数据，且接收并存储所述前端设备发送的所述预设类型的分析对象在所述目标视频数据中的每个位置点对应的播放进度点；

所述处理器，还用于基于所述第一位置集合和所述每个位置点对应的播放进度点，从所述目标视频数据中截取所述预设类型的分析对象的图像。
一种前端设备，其特征在于，所述前端设备包括：

处理器，用于获取目标视频数据，并从所述目标视频数据中，提取背景图像和预设类型的分析对象在所述目标视频数据中的位置点组成的第一位置集合；

发射器，用于向服务器发送所述第一位置集合和背景图像。
根据权利要求14所述的前端设备，其特征在于，所述处理器，还用于从所述目标视频数据中，截取所述预设类型的分析对象的图像；

所述发射器，还用于向所述服务器发送所述预设类型的分析对象的图像。
根据权利要求14或15所述的前端设备，其特征在于，所述处理器，还用于从所述目标视频数据中，提取所述第一位置集合中的每个位置点对应的播放进度点；

所述发射器，还用于向所述服务器发送所述每个位置点对应的播放进度点和所述目标视频数据。
根据权利要求14-16任一权利要求所述的前端设备，其特征在于，所述处理器，用于：

对所述目标视频数据进行降低分辨率处理，得到第一视频数据；

对所述目标视频数据进行降低帧率处理，得到第二视频数据；

从所述第一视频数据中，提取预设类型的分析对象在所述目标视频数据中的位置点组成的所述第一位置集合，并从所述第二视频数据中，提取所述背景图像。
根据权利要求17所述的前端设备，其特征在于，所述处理器，用于：

对所述目标视频数据进行降低分辨率和降低帧率处理，得到所述第一视频数据。
根据权利要求18所述的前端设备，其特征在于，所述第一视频数据的帧率高于所述第二视频数据的帧率。
根据权利要求17所述的前端设备，其特征在于，所述处理器，还用于：

从所述第一视频数据中，提取所述第一位置集合中的每个位置点对应的播放进度点；

从所述目标视频数据中，提取特定类型的分析对象在所述目标视频数据中的位置点组成的第二位置集合，并提取所述第二位置集合中每个位置点对应的播放进度点，其中，所述特定类型包括所述预设类型中的至少一种类型；

基于所述第二位置集合中每个位置点对应的播放进度点、所述第二位置集合、所述第一位置集合中每个位置点对应的播放进度点和所述第一位置集合，在所述第二位置集合中，确定所述第一位置集合中不包括的分析对象的位置点组成的第三位置集合；

将所述第三位置集合中包括的位置点添加到所述第一位置集合中。
一种服务器，其特征在于，所述服务器包括：

接收模块，用于接收前端设备发送的在目标视频数据中提取的背景图像和预设类型的分析对象在所述目标视频数据中的位置点组成的第一位置集合；

存储模块，用于存储所述前端设备发送的在目标视频数据中提取的背景图像和预设类型的分析对象在所述目标视频数据中的位置点组成的第一位置集合；

合成模块，用于当接收到终端发送的所述目标视频数据的浓缩请求时，基于所述第一位置集合、所述目标视频数据中所述预设类型的分析对象的图像、背景图像，合成所述目标视频数据对应的浓缩视频数据；

发送模块，用于向所述终端发送所述浓缩视频数据。
根据权利要求21所述的服务器，其特征在于，所述接收模块，还用于：

接收并存储所述前端设备发送的所述目标视频数据中所述预设类型的分析对象的图像。
根据权利要求21所述的服务器，其特征在于，所述接收模块，还用于接收并存储所述前端设备发送的所述目标视频数据，且接收并存储所述前端设备发送的所述预设类型的分析对象在所述目标视频数据中的每个位置点对应的播放进度点；

所述服务器还包括：

截取模块，用于基于所述第一位置集合和所述每个位置点对应的播放进度点，从所述目标视频数据中截取所述预设类型的分析对象的图像。
一种前端设备，其特征在于，所述前端设备包括：

获取模块，用于获取目标视频数据；

提取模块，用于从所述目标视频数据中，提取背景图像和预设类型的分析对象在所述目标视频数据中的位置点组成的第一位置集合；

发送模块，用于向服务器发送所述第一位置集合和背景图像。
根据权利要求24所述的前端设备，其特征在于，所述前端设备还包括：

截取模块，用于从所述目标视频数据中，截取所述预设类型的分析对象的图像；

所述发送模块，还用于向所述服务器发送所述预设类型的分析对象的图像。
根据权利要求24或25所述的前端设备，其特征在于，所述提取模块，还用于从所述目标视频数据中，提取所述第一位置集合中的每个位置点对应的播放进度点；

所述发送模块，还用于向所述服务器发送所述每个位置点对应的播放进度点和所述目标视频数据。
根据权利要求24-26任一权利要求所述的前端设备，其特征在于，所述提取模块，用于：

对所述目标视频数据进行降低分辨率处理，得到第一视频数据；

对所述目标视频数据进行降低帧率处理，得到第二视频数据；

从所述第一视频数据中，提取预设类型的分析对象在所述目标视频数据中的位置点组成的所述第一位置集合，并从所述第二视频数据中，提取所述背景图像。
根据权利要求27所述的前端设备，其特征在于，所述提取模块，用于：

对所述目标视频数据进行降低分辨率和降低帧率处理，得到所述第一视频数据。
根据权利要求28所述的前端设备，其特征在于，所述第一视频数据的帧率高于所述第二视频数据的帧率。
根据权利要求27所述的前端设备，其特征在于，所述提取模块，还用于：

从所述第一视频数据中，提取所述第一位置集合中的每个位置点对应的播放进度点；

从所述目标视频数据中，提取特定类型的分析对象在所述目标视频数据中的位置点组成的第二位置集合，并提取所述第二位置集合中每个位置点对应的播放进度点，其中，所述特定类型包括所述预设类型中的至少一种类型；

基于所述第二位置集合中每个位置点对应的播放进度点、所述第二位置集合、所述第一位置集合中每个位置点对应的播放进度点和所述第一位置集合，在所述第二位置集合中，确定所述第一位置集合中不包括的分析对象的位置点组成的第三位置集合；

将所述第三位置集合中包括的位置点添加到所述第一位置集合中。
一种视频浓缩的系统，其特征在于，所述系统包括服务器和前端设备，其中：

所述服务器，如所述权利要求11-13以及权利要求21-23中任一项权利要求所述的服务器；

所述前端设备，如所述权利要求14-20以及权利要求24-30中任一项权利要求所述的前端设备。
一种计算机可读存储介质，包括指令，当所述计算机可读存储介质在服务器上运行时，使得所述服务器执行所述权利要求1-3中任一权利要求所述的方法。
一种计算机可读存储介质，包括指令，当所述计算机可读存储介质在前端设备上运行时，使得所述前端设备执行所述权利要求4-10中任一权利要求所述的方法。