WO2016149938A1

WO2016149938A1 - 视频监控方法、视频监控系统以及计算机程序产品

Info

Publication number: WO2016149938A1
Application number: PCT/CN2015/075126
Authority: WO
Inventors: 俞刚; 李超; 尚泽远
Original assignee: 北京旷视科技有限公司; 北京小孔科技有限公司
Priority date: 2015-03-26
Filing date: 2015-03-26
Publication date: 2016-09-29
Also published as: US9792505B2; CN105519102A; US20170032194A1; CN105519102B

Abstract

本公开涉及基于深度视频的视频监控方法、视频监控系统以及计算机程序产品。一种视频监控方法，包括：获取经由视频采集装置采集的视频数据；基于所述视频数据，确定作为监控目标的对象；以及提取所述对象的特征信息；其中，所述视频数据为包含深度信息的视频数据。

Description

视频监控方法、视频监控系统以及计算机程序产品

技术领域

本公开涉及视频监控领域，更具体地，本公开涉及基于深度视频的视频监控方法、视频监控系统以及计算机程序产品。

背景技术

当前的图像或者视频监控往往需要依赖于工作人员人工的检测和处理。虽然越多来多的场景(例如机场、车站、商场、街道等)有摄像头覆盖，但是因为监控系统自身无法实现对行人特征的分析和跟踪，所以需要很多人力来进行处理和监视。这样需要配备大量的人力去进行监控和管理，并且随着摄像头规模进一步扩大后，难以高效的处理和反应一些突发事件。

智能监控的目的是根据图像数据，自动跟踪视频场景中的行人，并且对每个行人的特点和行为做分析处理。目前，智能监控往往仅仅依赖于传统非深度相机(RGB摄像机)。由于相机本身的限制，导致行人跟踪的精度不准，并且受限于场景中的行人动作姿态，所以基于行人的特征分析效果达不到预期。深度相机(深度摄像机)目前已被广泛用于人机交互等应用场景，但目前还不存在成熟的系统和方法能将其推广到智能监控领域。特别地，现有的各种监控系统，均无法实现对行人的特征(比如身高、体重、运动速度)的准确分析和对行人异常行为的有效检测。

发明内容

鉴于上述问题而提出了本公开。本公开提供了一种基于深度视频的视频监控方法、视频监控系统以及计算机程序产品，其能够高速有效地跟踪场景中的行人，并且准确实时地分析行人的特征信息，从而实现对于场景的统计分析以及异常情况监控。

根据本公开的一个实施例，提供了一种视频监控方法，包括：获取经由视频采集装置采集的视频数据；基于所述视频数据，确定作为监控目标的对象；以及提取所述对象的特征信息；其中，所述视频数据为包含深度信息的视频数据。

此外，根据本公开的一个实施例的视频监控方法，还包括：配置所述视频采集装置，并且确定所述视频采集装置的坐标参数。

此外，根据本公开的一个实施例的视频监控方法，其中确定所述视频采集装置的坐标参数包括：选择预定基准面上的多个基准点；基于所述多个基准点的坐标信息，确定所述视频采集装置的相机坐标系统与世界坐标系统的变换关系；基于所述变换关系，确定所述视频采集装置的坐标参数。

此外，根据本公开的一个实施例的视频监控方法，其中，所述基于所述视频数据，确定作为监控目标的对象包括：确定所述视频数据中的背景信息；基于所述背景信息，确定所述视频数据的每帧中的前景信息；获取对应于所述前景信息的前景区域的边缘轮廓信息；以及基于所述边缘轮廓信息，确定所述对象。

此外，根据本公开的一个实施例的视频监控方法，其中，基于所述边缘轮廓信息，确定所述对象包括：基于所述边缘轮廓信息，获取候选块；确定大于第一预定阈值的所述候选块为候选对象；以及基于预定算法获取所述候选对象的评估值，确定所述评估值大于第二预定阈值的所述候选对象为所述对象。

此外，根据本公开的一个实施例的视频监控方法，其中，基于所述边缘轮廓信息，确定所述对象还包括：匹配前一帧与当前帧中确定的所述对象的每一个，以确定离开前一帧的对象。

此外，根据本公开的一个实施例的视频监控方法，其中所述对象的特征信息包括：对象的体型信息以及移动速度。

此外，根据本公开的一个实施例的视频监控方法，其中提取所述对象的体型信息包括：选取所述对象距离所述视频采集装置的最近点作为所述对象的头部点；基于所述视频采集装置的相机坐标系统与世界坐标系统的变换关系，确定所述头部点在世界坐标系统中的坐标参数；以及基于所述头部点在世界坐标系统中的坐标参数，确定所述对象的头部距离地面的距离作为所述对象的身高信息。

此外，根据本公开的一个实施例的视频监控方法，其中提取所述对象的体型信息包括：选取所述对象距离所述视频采集装置的最近点作为所述对象的头部点；选取所述对象在图像坐标系的纵轴上的最大值的点作为所述对象的脚底点；基于所述视频采集装置的相机坐标系统与世界坐标系统的变换关系，确定在世界坐标系统中所述对象的头部点和所述对象的脚底点之间的距离作为所述对象的身高信息。

此外，根据本公开的一个实施例的视频监控方法，还包括：

计算所述对象的第一固定点在世界坐标体系中在第一选定帧与第二选定帧之间的运动距离；

基于所述第一选定帧与所述第二选定帧之间的时间间隔以及所述运动距离，确定所述对象的移动速度。

此外，根据本公开的一个实施例的视频监控方法，其中提取所述对象的体型信息还包括：提取所述对象的身高信息和轮廓信息；基于预先采集的不同对象的身高信息、轮廓信息与体重信息之间的对应关系，根据所述对象的身高信息和轮廓信息确定所述对象的体重信息。

此外，根据本公开的一个实施例的视频监控方法，还包括：分析所述特征信息，确定所述对象的异常事件，其中分析所述特征信息，确定所述对象的异常事件包括：在预定时间段内所述对象的体型信息的变化大于预定第三阈值时和/或所述对象的移动速度大于第四阈值时，确定所述对象的异常事件。

根据本公开的另一个实施例，提供了一种视频监控系统，包括：处理器；存储器；和存储在所述存储器中的计算机程序指令，在所述计算机程序指令被所述处理器运行时执行以下步骤：获取经由视频采集装置采集的视频数据；基于所述视频数据，确定作为监控目标的对象；以及提取所述对象的特征信息；其中，所述视频数据为包含深度信息的视频数据。

此外，根据本公开的另一个实施例的视频监控系统，还包括用于采集所述视频数据的所述视频采集装置。

此外，根据本公开的另一个实施例的视频监控系统，其中在所述计算机程序指令被所述处理器运行时还执行以下步骤：选择预定基准面上的多个基准点；基于所述多个基准点的坐标信息，确定所述视频采集装置的相机坐标系统与世界坐标系统的变换关系；基于所述变换关系，确定所述视频采集装置的坐标参数。

此外，根据本公开的另一个实施例的视频监控系统，其中在所述计算机程序指令被所述处理器运行时所执行的基于所述视频数据，确定作为监控目标的对象的步骤包括：确定所述视频数据中的背景信息；基于所述背景信息，确定所述视频数据的每帧中的前景信息；获取对应于所述前景信息的前景区域的边缘轮廓信息；以及基于所述边缘轮廓信息，确定所述对象。

此外，根据本公开的另一个实施例的视频监控系统，其中在所述计算机程序指令被所述处理器运行时所执行的基于所述边缘轮廓信息，确定所述对象的步骤包括：基于所述边缘轮廓信息，获取候选块；确定大于第一预定阈值的所述候选块为候选对象；以及基于预定算法获取所述候选对象的评估值，确定所述评估值大于第二预定阈值的所述候选对象为所述对象。

此外，根据本公开的另一个实施例述的视频监控系统，其中在所述计算机程序指令被所述处理器运行时所执行的基于所述边缘轮廓信息，确定所述对象的步骤还包括：匹配前一帧与当前帧中确定的所述对象的每一个，以确定离开前一帧的对象。

此外，根据本公开的另一个实施例的视频监控系统，其中所述对象的特征信息包括：对象的体型信息以及移动速度。

此外，根据本公开的另一个实施例的视频监控系统，其中在所述计算机程序指令被所述处理器运行时所执行的提取所述对象的体型信息的步骤包括：选取所述对象距离所述视频采集装置的最近点作为所述对象的头部点；基于所述视频采集装置的相机坐标系统与世界坐标系统的变换关系，确定所述头部点在世界坐标系统中的坐标参数；以及基于所述头部点在世界坐标系统中的坐标参数，确定所述对象的头部距离地面的距离作为所述对象的身高信息。

此外，根据本公开的另一个实施例的视频监控系统，其中在所述计算机程序指令被所述处理器运行时所执行的提取所述对象的体型信息的步骤包括：选取所述对象距离所述视频采集装置的最近点作为所述对象的头部点；选取所述对象在图像坐标系的纵轴上的最大值的点作为所述对象的脚底点；基于所述视频采集装置的相机坐标系统与世界坐标系统的变换关系，确定在世界坐标系统中所述对象的头部点和所述对象的脚底点之间的距离作为所述对象的身高信息。

此外，根据本公开的另一个实施例的视频监控系统，其中在所述计算机程序指令被所述处理器运行时所执行的提取所述对象的特征信息的步骤包括：计算所述对象的第一固定点在世界坐标体系中在第一选定帧与第二选定帧之间的运动距离；基于所述第一选定帧与所述第二选定帧之间的时间间隔以及所述运动距离，确定所述对象的移动速度。

此外，根据本公开的另一个实施例的视频监控方法，其中在所述计算机程序指令被所述处理器运行时所执行的提取所述对象的体型信息的步骤还包括：提取所述对象的身高信息和轮廓信息；基于预先采集的不同对象的身高信息、轮廓信息与体重信息之间的对应关系，根据所述对象的身高信息和轮廓信息确定所述对象的体重信息。

此外，根据本公开的另一个实施例的视频监控系统，其中在所述计算机程序指令被所述处理器运行时还执行：分析所述特征信息，确定所述对象的异常事件，并且其中在所述计算机程序指令被所述处理器运行所执行的确定所述对象的异常事件的步骤包括：在预定时间段内所述对象的体型信息的变化大于预定第三阈值时和/或所述对象的移动速度大于第四阈值时，确定所述对象的异常事件。

根据本公开的又一个实施例，提供了一种计算机程序产品，包括计算机可读存储介质，在所述计算机可读存储介质上存储了计算机程序指令，所述计算机程序指令在被计算机运行时执行以下步骤：获取经由视频采集装置采集的视频数据；基于所述视频数据，确定作为监控目标的对象；以及提取所述对象的特征信息；其中，所述视频数据为包含深度信息的视频数据。

要理解的是，前面的一般描述和下面的详细描述两者都是示例性的，并且意图在于提供要求保护的技术的进一步说明。

附图说明

通过结合附图对本发明实施例进行更详细的描述，本发明的上述以及其它目的、特征和优势将变得更加明显。附图用来提供对本发明实施例的进一步理解，并且构成说明书的一部分，与本发明实施例一起用于解释本发明，并不构成对本发明的限制。在附图中，相同的参考标号通常代表相同部件或步骤。

图1是图示根据本发明实施例的视频监控方法的流程图；

图2是图示根据本发明实施例的视频监控系统的功能性框图；

图3是进一步图示根据本发明实施例的视频监控方法中配置和确定视频采集装置的参数的流程图；

图4是图示用于确定视频采集装置的参数的相机坐标系统和世界坐标系统的示意图；

图5是进一步图示根据本发明实施例的视频监控方法中确定作为监控目标的对象的流程图；

图6是图示根据本发明实施例的视频监控方法中确定前景信息的示意图；

图7是进一步图示根据本发明实施例的视频监控方法中确定对象的身高信息的第一示例的流程图；

图8是进一步图示根据本发明实施例的视频监控方法中确定对象的身高信息的第二示例的流程图；

图9是图示根据本发明实施例的视频监控方法中确定对象的身高信息的示意图；

图10是进一步图示根据本发明实施例的视频监控方法中确定对象的移动速度的流程图；

图11是图示根据本发明实施例的视频监控方法中确定对象的移动速度的示意图；

图12是进一步图示根据本发明实施例的视频监控方法中确定对象的体重信息的流程图；

图13是进一步图示根据本发明实施例的视频监控方法中确定对象的异常事件的流程图；

图14是图示根据本发明实施例的视频监控系统的示意性框图。

具体实施方式

为了使得本发明的目的、技术方案和优点更为明显，下面将参照附图详细描述根据本发明的示例实施例。显然，所描述的实施例仅仅是本发明的一部分实施例，而不是本发明的全部实施例，应理解，本发明不受这里描述的示例实施例的限制。基于本公开中描述的本发明实施例，本领域技术人员在没有付出创造性劳动的情况下所得到的所有其它实施例都应落入本发明的保护范围之内。

以下，将参考附图详细描述本发明的优选实施例。

图1是图示根据本发明实施例的视频监控方法的流程图。如图1所示，根据本发明实施例的视频监控方法包括以下步骤。

在步骤S101中，获取经由视频采集装置采集的视频数据。在本发明的一个实施例中，所述视频采集装置为能够获取被摄体的深度信息的深度相机(深度摄像机)。获取经由视频采集装置采集的视频数据包括但不限于，在由物理位置上分离配置的视频采集装置采集视频数据之后，经由有线或者无线方式，接收从所述视频采集装置发送的视频数据。可替代地，视频采集装置可以与视频监控系统中的其他模块或组件物理上位于同一位置甚至位于同一机壳内部，视频监控系统中的其他模块或组件经由内部总线接收从所述视频采集装置发送的视频数据。此后，处理进到步骤S102。

在步骤S102中，基于所述视频数据，确定作为监控目标的对象。在本发明的一个实施例中，所述作为监控目标的对象为所述视频数据中记录的行人和/或其他物体，诸如交通工具、动物等。确定作为监控目标的对象一般地包括对于深度视频数据进行背景建模，然后根据背景数据来判断各个帧中的前景信息，并且基于预定算法获得前景区域的边缘轮廓信息，从而基于各个前景区域的轮廓来判断是否为待监控的对象。以下，将参照附图进一步详细描述如何确定作为监控目标的对象的流程。此后，处理进到步骤S103。

在步骤S103中，提取所述对象的特征信息。在本发明的一个实施例中，所述对象的特征信息包括但不限于所述对象的身高、体重、移动速度等中的至少一种。以下，将参照附图进一步详细描述如何提取所述对象的特征信息的流程。

上述根据本发明实施例的视频监控方法，采用深度相机/摄像机作为视频采集装置，从而实现基于深度视频信息的对象检测和特征信息提取，为进一步的统计分析和异常情况监控提供了准确和高效的数据保证。

以下，将参照图2进一步描述执行上述视频监控方法的视频监控系统。

图2是图示根据本发明实施例的视频监控系统的功能性框图。如图2所示，根据本发明实施例的视频监控系统20包括视频数据获取模块21、监控对象确定模块22、特征信息提取模块23以及特征信息分析模块24。所述视频数据获取模块21、监控对象确定模块22、特征信息提取模块23以及特征信息分析模块24例如可以由诸如硬件(服务器、专用计算机等)、软件、固件以及它们的任意可行的组合配置。

具体地，所述视频数据获取模块21用于获取视频数据。在本发明的一个实施例中，所述视频数据获取模块21可以包括能够获取被摄体的深度信息的深度相机(深度摄像机)的视频采集装置。所述视频采集装置可以与其后的监控对象确定模块22、特征信息提取模块23以及特征信息分析模块24物理上分离，或者物理上位于同一位置甚至位于同一机壳内部。在所述视频采集装置与其后的监控对象确定模块22、特征信息提取模块23以及特征信息分析模块24物理上分离的情况下，所述视频数据获取模块21进一步经由有线或者无线方式将所述视频采集装置获取的深度视频数据发送给其后的模块。在所述视频采集装置与其后的监控对象确定模块22、特征信息提取模块23以及特征信息分析模块24物理上位于同一位置甚至位于同一机壳内部的情况下，所述视频数据获取模块21经由内部总线将所述视频采集装置获取的深度视频数据发送给其后的模块。所述视频数据可以包括深度视频数据以及彩色视频数据。更具体地，可以根据视频采集装置的位置参数以及视频数据中每个像素点的深度信息值，确定视频数据中每个像素的三维位置参数。在经由有线或者无线方式或者经由内部总线发送所述视频数据之前，可以将其预定格式进行编码和压缩为视频数据包，以减少发送需要占用的通信量和带宽。

所述监控对象确定模块22用于基于从所述视频数据获取模块21获取的所述视频数据，确定作为监控目标的对象。所述监控对象确定模块22例如对于深度视频数据进行背景建模，然后根据背景数据来判断各个帧中的前景信息，并且基于预定算法获得前景区域的边缘轮廓信息，从而基于各个前景区域的轮廓来判断是否为待监控的对象。更具体地，所述监控对象确定模块22可以检测视频的每一帧中是否存储在行人，并且确定每个行人的具体位置。对于不同帧中的行人进行匹配关联，实现对于行人在不同帧中的准备追踪。

所述特征信息提取模块23用于对于由所述监控对象确定模块22确定的待监控的对象，基于从所述视频数据获取模块21获取的所述视频数据，提取各个待监控的对象的特征信息，诸如所述对象的身高、体重、移动速度等。

所述特征信息分析模块24用于对于由所述特征信息提取模块23提取的特征信息进行存储、统计分析以及异常情况的监控。更具体地，存储的数据包括但不限于行人在每一帧的位置、每个行人的特征信息、每一帧图像的具体时刻等。所述特征信息分析模块24实时分析特征信息以监控可能出现的异常情况，并且对于长期存储的特征信息进行整理和统计规律提取。例如，行人在哪个时刻比较多地出现，行人的平均身高、体重等特征。

以下，将进一步参照附图详细描述由根据本发明实施例的视频监控系统的各个模块执行的根据本发明实施例的视频监控方法的各个具体步骤流程。

首先，参照图3和图4描述视频采集装置的配置以及视频采集装置的坐标参数的确定。可以由上述视频数据获取模块21控制和执行视频采集装置的配置以及视频采集装置的坐标参数的确定。图3是进一步图示根据本发明实施例的视频监控方法中配置和确定视频采集装置的参数的流程图。图4是图示用于确定视频采集装置的参数的相机坐标系统和世界坐标系统的示意图。

如图3所示，根据本发明实施例的视频监控方法中配置和确定视频采集装置的参数的流程包括以下步骤。

在步骤S301中，配置视频采集装置。将作为所述视频采集装置的深度相机(深度摄像机)安装在需要监控的场景中。通常，深度相机(深度摄像机)的安装高度为2-3.5米，其视角为俯视地面(如图4示意性所示)。在此，所述视频采集装置可以是单一深度相机(即，只有深度相机镜头)或者深度彩色双镜头相机。在深度彩色双镜头相机的情况下，需要对相机进行校准，使得两个镜头得到的图像相对应和同步。此后，处理进到步骤S302，以便对于安装后的所述视频采集装置，确定其离基准面的实际高度和角度等坐标参数。

在步骤S302中，选择预定基准面上的多个基准点。如图4所示，所述预定基准面可以是地平面，选择的基准点的数目越大(例如，大于等于5个)，精度越高。此后，处理进到步骤S303。

在步骤S303中，基于选择的多个基准点的坐标信息，确定视频采集装置的相机坐标系统与世界坐标系统的变换关系。如图4所示，由点Oc与Xc、Yc和Zc轴构成的直角坐标系为相机坐标系统。为了描述相机的位置，引入世界坐标系统，由点Ow与Xw、Yw和Zw轴构成的直角坐标系为世界坐标系统。可以通过选择多个基准点，基于最小二乘法来估计相机坐标系统到世界坐标系统的转换矩阵，即相机坐标系统与世界坐标系统的变换关系。此后，处理进到步骤S304。

在步骤S304中，基于所述变换关系，确定视频采集装置的坐标参数。通过利用所述变换关系，将相机坐标系统转换到世界坐标系统，可以确定视频采集装置的实际高度和角度等坐标参数。同样地，将视频采集装置采集的视频中的像素点转换到世界坐标系统，可以确定视频场景中的完整地平面位置。

以下，将参照图5和图6描述作为监控目标的对象的确定。可以由上述监控对象确定模块22控制和执行监控目标的对象的确定。图5是进一步图示根据本发明实施例的视频监控方法中确定作为监控目标的对象的流程图。图6是图示根据本发明实施例的视频监控方法中确定前景信息的示意图。

如图5所示，根据本发明实施例的视频监控方法中确定作为监控目标的对象的流程包括以下步骤。

在步骤S501中，确定视频数据中的背景信息。在本发明的一个实施例中，在根据深度视频进行背景建模时，例如可以拍摄没有任何监控对象存在的背景帧作为背景信息，如图6(A)示出了作为背景信息的背景帧601。此后，处理进到步骤S502。

在步骤S502中，基于所述背景信息，确定所述视频数据的每帧中的前景信息。在本发明的一个实施例中，例如如图6(B)示出了所述视频数据的当前帧602，通过将所述背景帧601与所述当前帧602进行深度差比较，确定作为前景信息的前景区域603，如图6(C)所示。此后，处理进到步骤S503。

在步骤S503中，获取对应于所述前景信息的前景区域的边缘轮廓信息。在本发明的一个实施例中，根据在步骤S502中确定的前景区域，使用边缘检测算法来得到所述前景区域的边缘轮廓信息。此后，处理进到步骤S504。

在步骤S504中，基于所述边缘轮廓信息，获取候选块。在本发明的一个实施例中，基于在步骤S503中获取的边缘轮廓，使用双层轮廓来得到前景的多个候选块。此后，处理进到步骤S505。

在步骤S505中，确定大于第一预定阈值的所述候选块为候选对象。具在本发明的一个实施例中，所述第一预定阈值为候选块的最小可接受面积，其面积不大于所述第一预定阈值的候选块可能是由于噪声而产生的，从而剔除该面积过小的候选块，剩余的每一个候选块代表一个候选对象。此后，处理进到步骤S506。

在步骤S506中，基于预定算法获取所述候选对象的评估值，确定所述评估值大于第二预定阈值的所述候选对象为所述对象。在本发明的一个实施例中，可以基于彩色图像的行人检测算法和/或人头检测算法给每个候选对象进行评估，将其评估值大于第二预定阈值的候选对象确定为所述对象(例如，确定为行人)。在应用所述行人检测算法的情况下，遍历深度视频帧中所有可能的矩形框，每一个矩形框代表一个行人的候选区域。对于该区域，提取梯度直方图的图像特征，然后根据使用支持向量机来做分类，判断该矩形区域是否有行人存在。在应用人头检测算法的情况下，遍历深度视频帧中所有可能的矩形框，对于每个矩形框，提取颜色和纹理特征，此后采用训练好的支持向量机来判断该区域是否有人头存在。此后，处理进到步骤S507。

在步骤S507中，匹配前一帧与当前帧中确定的所述对象的每一个，以确定离开前一帧的对象。在本发明的一个实施例中，对于当前帧中确定的行人和前一帧中确定的行人进行匹配，匹配的标准可以是行人的行进距离以及候选对象上提取的颜色纹理信息。根据匹配的结果，可以得到同一个行人在不同帧上面的跟踪结果。例如，假设在第t-1帧中存在M个检测到的行人，在第t帧存在N个检测到的行人，那么需要求得第t-1帧检测到的行人与第t帧检测到的每个行人之间的距离，该距离可以定义为行人在两帧中头部点之间的空间位置距离。如果第t-1帧检测到的行人到第t帧的所有行人的最小距离小于预定阈值，则认为该第t-1帧检测到的行人匹配到第t帧中具有最小距离的行人。如果该最小距离大于预定阈值，则认为该第t-1帧检测到的行人已经离开第t帧，从而不再继续跟踪该行人。

以下，将参照图7到图12描述提取所述对象的特征信息。可以由上述特征信息提取模块23控制和执行所述对象的特征信息的提取。图7是进一步图示根据本发明实施例的视频监控方法中确定对象的身高信息的第一示例的流程图。图8是进一步图示根据本发明实施例的视频监控方法中确定对象的身高信息的第二示例的流程图。图9是图示根据本发明实施例的视频监控方法中确定对象的身高信息的示意图。图10是进一步图示根据本发明实施例的视频监控方法中确定对象的移动速度的流程图。图11是图示根据本发明实施例的视频监控方法中确定对象的移动速度的示意图。图12是进一步图示根据本发明实施例的视频监控方法中确定对象的体重信息的流程图。

如图7所示，根据本发明实施例的视频监控方法中确定对象的身高信息的第一示例的流程包括以下步骤。

在步骤S701中，选取对象距离所述视频采集装置的最近点作为所述对象的头部点。在本发明的一个实施例中，如图9所示，选取对象距离所述视频采集装置的最近点，因为行人为直立，所以该最近点可以假设为头部点901。此后，处理进到步骤S702。

在步骤S702中，基于所述视频采集装置的相机坐标系统与世界坐标系统的变换关系，确定所述头部点在世界坐标系统中的坐标参数。如上参照图3和图4已经描述的，可以将所述头部点在所述视频采集装置的相机坐标系统中的坐标参数转换为世界坐标系统的坐标参数。此后，处理进到步骤S703。

在步骤S703中，基于所述头部点在世界坐标系统中的坐标参数，确定所述对象的头部距离地面的距离作为所述对象的身高信息。在本发明的一个实施例中，如图9所示，确定头部点901距离地面的距离为所述对象的身高902。

根据本发明实施例的视频监控方法中确定对象的身高信息的方法不限于如图7所示的第一示例。如图8所示，根据本发明实施例的视频监控方法中确定对象的身高信息的第二示例的流程包括以下步骤。

在步骤S801中，类似于步骤S701，选取对象距离所述视频采集装置的最近点作为所述对象的头部点。此后，处理进到步骤S802。

在步骤S802中，选取所述对象在图像坐标系的纵轴上的最大值的点作为所述对象的脚底点。在本发明的一个实施例中，脚底点可以定义为行人的前景区域在图像坐标系的纵轴上的最大值的点。此后，处理进到步骤S803。

在步骤S803中，基于所述视频采集装置的相机坐标系统与世界坐标系统的变换关系，确定在世界坐标体系中所述对象的头部点和所述对象的脚底点之间的距离作为所述对象的身高信息。

除了参照图7到图9描述的身高信息，所述对象的特征信息还包括所述对象的移动速度以及体重信息等。

如图10所示，根据本发明实施例的视频监控方法中确定对象的移动速度的流程包括以下步骤。

在步骤S1001中，计算所述对象的第一固定点在世界坐标体系中在第一选定帧与第二选定帧之间的运动距离。在本发明的一个实施例中，所述第一固定点可以是所述对象的头部点。本发明不限于此，所述第一固定点还可以是所述对象的脚底点或对象上的任一固定点。在本发明的一个实施例中，第一选定帧是第T帧，第二选定帧是第T+t帧。如图11所示，所述对象在第一选定帧中是对象1101，在第二选定帧中是对象1102。所述第一固定点在世界坐标体系中在第一选定帧第T帧与第二选定帧第T+t帧之间的运动距离为运动距离1103。此后，处理进到步骤S1002。

在步骤S1002中，基于所述第一选定帧与所述第二选定帧之间的时间间隔以及所述运动距离，确定所述对象的移动速度。也就是说，所述对象的移动速度可以确定为V＝运动距离1103/t。

如图12所示，根据本发明实施例的视频监控方法中确定对象的体重信息的流程包括以下步骤。

在步骤S1201中，提取所述对象的身高信息和轮廓信息。此后，处理进到步骤S1202。

在步骤S1202中，基于预先采集的不同对象的身高信息、轮廓信息与体重信息之间的对应关系，根据所述对象的身高信息和轮廓信息确定所述对象的体重信息。在本发明的一个实施例中，首先采集包含不同身高体重的行人的数据集。其后，采集每个行人在深度相机下处于不同深度时的相应轮廓信息。对于每个轮廓的面积，根据该轮廓所在的深度距离进行正规化。然后，将所有行人的身高进行量化(例如，量化为多个身高区间)，对于落在同一区间内的所有数据拟合，从而建立正规化的轮廓面积与体重之间的关系。当已经建立和训练好对应关系的模型之后，当需要测量行人的体重时，根据该行人的身高所在区域的线性模型，以及正规化后的行人的轮廓面积，得到根据所述对应关系的模型确定的体重值。

以上参照图7到图12描述的所述对象的特征信息可以进一步用于对于对象的异常事件的监控。图13是进一步图示根据本发明实施例的视频监控方法中确定对象的异常事件的一种流程图。

如图13所示，根据本发明实施例的视频监控方法中确定对象的异常事件的流程包括以下步骤。其中，步骤S1301到步骤S1303与参照图1描述的步骤S101到S103相同，将省略其重复描述。

在步骤S1304中，分析所述特征信息。可以由上述特征信息分析模块24控制和执行所述特征信息的分析。在本发明的一个实施例中，分析所述特征信息包括分析获取的对象体型信息以及对象的移动速度。此后，处理进到步骤S1305。

在步骤S1305中，判断所述对象的体型信息的变化是否大于预定阈值。在本发明的一个实施例中，如果行人的身高信息与之前帧相比出现的变化大于预定阈值(例如，1米)，则可以判断出现诸如行人摔倒的异常事件。如果在步骤S1305获得肯定结果，则处理进到步骤S1307。

在步骤S1307中，判断出现异常事件。在本发明的一个实施例中，响应于出现异常事件，可以以适当的方式向视频监控系统的监控人员发出出现异常事件的警报。

如果在步骤S1305获得否定结果，则处理进到步骤S1306。

在步骤S1306中，继续判断所述对象的移动速度是否大于预定阈值。在本发明的一个实施例中，如果行人的移动速度突然大于预定阈值(例如，4米/秒)，则可以判断有异常事件出现。如果在步骤S1306获得肯定结果，则处理进到步骤S1307。相反地，如果在步骤S1306获得肯定结果，则确定基于步骤S1304的特征信息的分析，没有异常事件出现，处理返回步骤S1301。从而继续实时获取经由视频采集装置采集的视频数据并且继续执行监控。

以上步骤S1301至步骤S1307仅为确定对象的异常事件的一种示例性流程。在确定对象的异常事件的其他实现方式中，可以仅监控对象的移动速度，也可以仅监控对象的体型信息的变化，可以同时监控对象的体型信息的变化和对象的移动速度，还可以先监控对象的移动速度再监控对象的体型信息的变化，在此并不进行限定。

图14是图示根据本发明实施例的视频监控系统的示意性框图。如图14所示，根据本发明实施例的视频监控系包括：处理器141、存储器142、以及在所述存储器142的中存储的计算机程序指令143。

所述计算机程序指令143在所述处理器141运行时可以实现根据本发明实施例的视频监控系统的各个功能模块的功能，并且/或者可以执行根据本发明实施例的视频监控方法的各个步骤。

具体地，在所述计算机程序指令143被所述处理器141运行时执行以下步骤：获取经由视频采集装置采集的视频数据；基于所述视频数据，确定作为监控目标的对象；以及提取所述对象的特征信息；其中，所述视频数据为包含深度信息的视频数据。

例如，在所述计算机程序指令143被所述处理器141运行时还执行以下步骤：选择预定基准面上的多个基准点；基于所述多个基准点的坐标信息，确定所述视频采集装置的相机坐标系统与世界坐标系统的变换关系；基于所述变换关系，确定所述视频采集装置的坐标参数。

此外，在所述计算机程序指令143被所述处理器141运行时所执行的基于所述视频数据，确定作为监控目标的对象的步骤包括：确定所述视频数据中的背景信息；基于所述背景信息，确定所述视频数据的每帧中的前景信息；获取对应于所述前景信息的前景区域的边缘轮廓信息；以及基于所述边缘轮廓信息，确定所述对象。

此外，在所述计算机程序指令143被所述处理器141运行时所执行的基于所述边缘轮廓信息，确定所述对象的步骤包括：基于所述边缘轮廓信息，获取候选块；确定大于第一预定阈值的所述候选块为候选对象；以及基于预定算法获取所述候选对象的评估值，确定所述评估值大于第二预定阈值的所述候选对象为所述对象。

此外，在所述计算机程序指令143被所述处理器141运行时所执行的基于所述边缘轮廓信息，确定所述对象的步骤还包括：匹配前一帧与当前帧中确定的所述对象的每一个，以确定离开前一帧的对象。

此外，所述对象的特征信息包括：对象的体型信息以及移动速度。

此外，在所述计算机程序指令143被所述处理器141运行时所执行的提取所述对象的体型信息的步骤包括：选取所述对象距离所述视频采集装置的最近点作为所述对象的头部点；基于所述视频采集装置的相机坐标系统与世界坐标系统的变换关系，确定所述头部点在世界坐标系统中的坐标参数；以及基于所述头部点在世界坐标系统中的坐标参数，确定所述对象的头部距离地面的距离作为所述对象的身高信息。

此外，在所述计算机程序指令143被所述处理器141运行时所执行的提取所述对象的体型信息的步骤包括：选取所述对象距离所述视频采集装置的最近点作为所述对象的头部点；选取所述对象在图像坐标系的纵轴上的最大值的点作为所述对象的脚底点；基于所述视频采集装置的相机坐标系统与世界坐标系统的变换关系，确定在世界坐标系统中所述对象的头部点和所述对象的脚底点之间的距离作为所述对象的身高信息。

此外，在所述计算机程序指令143被所述处理器141运行时所执行的提取所述对象的特征信息的步骤包括：计算所述对象的第一固定点在世界坐标体系中在第一选定帧与第二选定帧之间的运动距离；基于所述第一选定帧与所述第二选定帧之间的时间间隔以及所述运动距离，确定所述对象的移动速度。

此外，在所述计算机程序指令143被所述处理器141运行时所执行的提取所述对象的体型信息的步骤还包括：提取所述对象的身高信息和轮廓信息；基于预先采集的不同对象的身高信息、轮廓信息与体重信息之间的对应关系，根据所述对象的身高信息和轮廓信息确定所述对象的体重信息。

此外，在所述计算机程序指令143被所述处理器141运行时还执行：分析所述特征信息，确定所述对象的异常事件，并且其中在所述计算机程序指令被所述处理器运行所执行的确定所述对象的异常事件的步骤包括：在预定时间段内所述对象的体型信息的变化大于预定第三阈值时和/或所述对象的移动速度大于第四阈值时，确定所述对象的异常事件。

根据本发明实施例的视频监控系统中的各模块可以通过根据本发明实施例的视频监控系统中的处理器运行在存储器中存储的计算机程序指令来实现，或者可以在根据本发明实施例的计算机程序产品的计算机可读存储介质中存储的计算机指令被计算机运行时实现。

所述计算机可读存储介质可以是一个或多个计算机可读存储介质的任意组合，例如一个计算机可读存储介质包含用于随机地生成动作指令序列的计算机可读的程序代码，另一个计算机可读存储介质包含用于进行人脸活动识别的计算机可读的程序代码。

所述计算机可读存储介质例如可以包括智能电话的存储卡、平板电脑的存储部件、个人计算机的硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、便携式紧致盘只读存储器(CD-ROM)、USB存储器、或者上述存储介质的任意组合。

在上面详细描述的本发明的示例实施例仅仅是说明性的，而不是限制性的。本领域技术人员应该理解，在不脱离本发明的原理和精神的情况下，可对这些实施例进行各种修改，组合或子组合，并且这样的修改应落入本发明的范围内。

Claims

一种视频监控方法，包括：

获取经由视频采集装置采集的视频数据；

基于所述视频数据，确定作为监控目标的对象；以及

提取所述对象的特征信息；

其中，所述视频数据为包含深度信息的视频数据。
如权利要求1所述的视频监控方法，还包括：

配置所述视频采集装置，并且确定所述视频采集装置的坐标参数。
如权利要求2所述的视频监控方法，其中确定所述视频采集装置的坐标参数包括：

选择预定基准面上的多个基准点；

基于所述多个基准点的坐标信息，确定所述视频采集装置的相机坐标系统与世界坐标系统的变换关系；

基于所述变换关系，确定所述视频采集装置的坐标参数。
如权利要求1所述的视频监控方法，其中，所述基于所述视频数据，确定作为监控目标的对象包括：

确定所述视频数据中的背景信息；

基于所述背景信息，确定所述视频数据的每帧中的前景信息；

获取对应于所述前景信息的前景区域的边缘轮廓信息；以及

基于所述边缘轮廓信息，确定所述对象。
如权利要求4所述的视频监控方法，其中，基于所述边缘轮廓信息，确定所述对象包括：

基于所述边缘轮廓信息，获取候选块；

确定大于第一预定阈值的所述候选块为候选对象；以及

基于预定算法获取所述候选对象的评估值，确定所述评估值大于第二预定阈值的所述候选对象为所述对象。
如权利要求5所述的视频监控方法，其中，基于所述边缘轮廓信息，确定所述对象还包括：

匹配前一帧与当前帧中确定的所述对象的每一个，以确定离开前一帧的对象。
如权利要求1所述的视频监控方法，其中所述对象的特征信息包括：对象的体型信息以及移动速度。
如权利要求7所述的视频监控方法，其中提取所述对象的体型信息包括：

选取所述对象距离所述视频采集装置的最近点作为所述对象的头部点；

基于所述视频采集装置的相机坐标系统与世界坐标系统的变换关系，确定所述头部点在世界坐标系统中的坐标参数；以及

基于所述头部点在世界坐标系统中的坐标参数，确定所述对象的头部距离地面的距离作为所述对象的身高信息。
如权利要求7所述的视频监控方法，其中提取所述对象的体型信息包括：

选取所述对象距离所述视频采集装置的最近点作为所述对象的头部点；

选取所述对象在图像坐标系的纵轴上的最大值的点作为所述对象的脚底点；

基于所述视频采集装置的相机坐标系统与世界坐标系统的变换关系，确定在世界坐标系统中所述对象的头部点和所述对象的脚底点之间的距离作为所述对象的身高信息。
如权利要求7所述的视频监控方法，还包括：

计算所述对象的第一固定点在世界坐标体系中在第一选定帧与第二选定帧之间的运动距离；

基于所述第一选定帧与所述第二选定帧之间的时间间隔以及所述运动距离，确定所述对象的移动速度。
如权利要求7所述的视频监控方法，其中提取所述对象的体型信息还包括：

提取所述对象的身高信息和轮廓信息；

基于预先采集的不同对象的身高信息、轮廓信息与体重信息之间的对应关系，根据所述对象的身高信息和轮廓信息确定所述对象的体重信息。
如权利要求7所述的视频监控方法，还包括：

分析所述特征信息，确定所述对象的异常事件，

其中分析所述特征信息，确定所述对象的异常事件包括：

在预定时间段内所述对象的体型信息的变化大于预定第三阈值时和/或所述对象的移动速度大于第四阈值时，确定所述对象的异常事件。
一种视频监控系统，包括：

处理器；

存储器；和

存储在所述存储器中的计算机程序指令，在所述计算机程序指令被所述处理器运行时执行以下步骤：

获取经由视频采集装置采集的视频数据；

基于所述视频数据，确定作为监控目标的对象；以及

提取所述对象的特征信息；

其中，所述视频数据为包含深度信息的视频数据。
如权利要求13所述的视频监控系统，还包括用于采集所述视频数据的所述视频采集装置。
如权利要求14所述的视频监控系统，其中在所述计算机程序指令被所述处理器运行时还执行以下步骤：

选择预定基准面上的多个基准点；

基于所述多个基准点的坐标信息，确定所述视频采集装置的相机坐标系统与世界坐标系统的变换关系；

基于所述变换关系，确定所述视频采集装置的坐标参数。
如权利要求13所述的视频监控系统，其中在所述计算机程序指令被所述处理器运行时所执行的基于所述视频数据，确定作为监控目标的对象的步骤包括：

确定所述视频数据中的背景信息；

基于所述背景信息，确定所述视频数据的每帧中的前景信息；

获取对应于所述前景信息的前景区域的边缘轮廓信息；以及

基于所述边缘轮廓信息，确定所述对象。
如权利要求16所述的视频监控系统，其中在所述计算机程序指令被所述处理器运行时所执行的基于所述边缘轮廓信息，确定所述对象的步骤包括：

基于所述边缘轮廓信息，获取候选块；

确定大于第一预定阈值的所述候选块为候选对象；以及

基于预定算法获取所述候选对象的评估值，确定所述评估值大于第二预定阈值的所述候选对象为所述对象。
如权利要求17所述的视频监控系统，其中在所述计算机程序指令被所述处理器运行时所执行的基于所述边缘轮廓信息，确定所述对象的步骤还包括：

匹配前一帧与当前帧中确定的所述对象的每一个，以确定离开前一帧的对象。
如权利要求13所述的视频监控系统，其中所述对象的特征信息包括：对象的体型信息以及移动速度。
如权利要求19所述的视频监控系统，其中在所述计算机程序指令被所述处理器运行时所执行的提取所述对象的体型信息的步骤包括：

选取所述对象距离所述视频采集装置的最近点作为所述对象的头部点；

基于所述视频采集装置的相机坐标系统与世界坐标系统的变换关系，确定所述头部点在世界坐标系统中的坐标参数；以及

基于所述头部点在世界坐标系统中的坐标参数，确定所述对象的头部距离地面的距离作为所述对象的身高信息。
如权利要求19所述的视频监控系统，其中在所述计算机程序指令被所述处理器运行时所执行的提取所述对象的体型信息的步骤包括：

选取所述对象距离所述视频采集装置的最近点作为所述对象的头部点；

选取所述对象在图像坐标系的纵轴上的最大值的点作为所述对象的脚底点；

基于所述视频采集装置的相机坐标系统与世界坐标系统的变换关系，确定在世界坐标系统中所述对象的头部点和所述对象的脚底点之间的距离作为所述对象的身高信息。
如权利要求19所述的视频监控系统，其中在所述计算机程序指令被所述处理器运行时所执行的提取所述对象的特征信息的步骤包括：

计算所述对象的第一固定点在世界坐标体系中在第一选定帧与第二选定帧之间的运动距离；

基于所述第一选定帧与所述第二选定帧之间的时间间隔以及所述运动距离，确定所述对象的移动速度。
如权利要求19所述的视频监控系统，其中在所述计算机程序指令被所述处理器运行时所执行的提取所述对象的体型信息的步骤还包括：

提取所述对象的身高信息和轮廓信息；

基于预先采集的不同对象的身高信息、轮廓信息与体重信息之间的对应关系，根据所述对象的身高信息和轮廓信息确定所述对象的体重信息。
如权利要求19所述的视频监控系统，其中在所述计算机程序指令被所述处理器运行时还执行：分析所述特征信息，确定所述对象的异常事件，并且

其中在所述计算机程序指令被所述处理器运行所执行的确定所述对象的异常事件的步骤包括：

在预定时间段内所述对象的体型信息的变化大于预定第三阈值时和/或所述对象的移动速度大于第四阈值时，确定所述对象的异常事件。
一种计算机程序产品，包括计算机可读存储介质，在所述计算机可读存储介质上存储了计算机程序指令，所述计算机程序指令在被计算机运行时执行以下步骤：

获取经由视频采集装置采集的视频数据；

基于所述视频数据，确定作为监控目标的对象；以及

提取所述对象的特征信息；

其中，所述视频数据为包含深度信息的视频数据。