CN110826522A

CN110826522A - 人体异常行为监控方法、系统、存储介质及监控设备

Info

Publication number: CN110826522A
Application number: CN201911121776.8A
Authority: CN
Inventors: 胡晓; 李树义; 向俊将; 孙娟; 朱希诚
Original assignee: Guangzhou University
Current assignee: Guangzhou University
Priority date: 2019-11-15
Filing date: 2019-11-15
Publication date: 2020-02-21

Abstract

本发明公开了一种人体异常行为监控方法、系统、存储介质及监控设备，所述方法包括：获取人体行为数据库中上传的视频数据集；利用八度卷积对预设I3D模型进行更新，以得到目标I3D模型；通过所述目标I3D模型对视频数据集进行训练与测试，以得到行为预测模型；将监控区域内人员流动的视频信息输入所述行为预测模型，以得到该监控区域内行为异常人员的异常信息，并根据该异常行为的种类生成一预警与警告信息。本发明能够在异常事件发生时，实时识别出一些异常行为并发出警告，让监控工作人员能及时了解情况并获得视频中行为异常人员的身高信息，以省去测量视频中行为异常人员身高的工作，满足了实际应用需求。

Description

人体异常行为监控方法、系统、存储介质及监控设备

技术领域

本发明涉及视频监控技术领域，特别是涉及一种人体异常行为监控方法、系统、存储介质及监控设备。

背景技术

随着经济的快速发展和人民生活水平的提高，人们的安全防范意识也在不断提升。视频监控系统作为视频监控的重要组成部分，广泛运用在人们生活的各个领域，例如，学校、银行、交通公寓等。

众所周知的，视频监控通常包括前端摄像机、传输线缆及视频监控平台。摄像机可分为网络数字摄像机和模拟摄像机，可作为前端视频图像信号的采集。完整的视频监控系统是由摄像、传输、控制、显示、记录登记5大部分组成。摄像机通过网络线缆或同轴视频电缆将视频图像传输到控制主机，控制主机再将视频信号分配到各监视器及录像设备，同时可将需要传输的语音信号同步录入到录像机内。通过控制主机，操作人员可发出指令，对云台的上、下、左、右的动作进行控制及对镜头进行调焦变倍的操作，并可通过视频矩阵实现在多路摄像机的切换。

然而传统的人工视频监控工作方式单一，只能机械的记录监控场景的事件，不具备自动分析视频中人物异常行为的功能，要想及时发现异常事件，就得要求工作人员日以继夜，不间断地观察监控视频，不仅会浪费大量人力物力，还会因为长时间观察视频，造成人眼疲劳及损伤，从而容易导致对异常事件的漏报和错报。

发明内容

为了解决上述问题，本发明的目的是提供一种能够对人体异常行为进行主动识别、存储与预警，节约人工成本的人体异常行为监控方法、系统、存储介质及监控设备。

一种人体异常行为监控方法，所述方法包括：

获取人体行为数据库中上传的视频数据集；

利用八度卷积对预设I3D模型进行更新，以得到目标I3D模型；

通过所述目标I3D模型对视频数据集进行训练与测试，以得到行为预测模型；

将监控区域内人员流动的视频信息输入所述行为预测模型，以得到该监控区域内行为异常人员的异常信息，并根据该异常行为的种类生成一预警与警告信息。

根据本发明提供的人体异常行为监控方法，通过获取人体行为数据库中上传的视频数据集，以为模型建立提供必要支持；利用八度卷积对预设I3D模型进行更新，以得到目标I3D模型，以提升网络的训练速度，提高视频识别任务的准确性，减少运行时间；通过所述目标 I3D模型对视频数据集进行训练与测试，以得到行为预测模型，提高模型获取的可靠性；通过将监控区域内人员流动的视频信息输入所述行为预测模型，以得到该监控区域内行为异常人员的异常信息，并根据该异常行为的种类生成一预警与警告信息，以便于对行为异常人员进行警示，且便于相关管理人员及时采取措施。本发明能够适用于复杂多变的监控场景、能够快速有效地识别监控数据中的异常情况，减少误报与漏报，为区域安全提供告警与支撑，满足了实际应用需求。

另外，根据本发明上述的人体异常行为监控方法，还可以具有如下附加的技术特征：

进一步地，各监控区域内设有至少一多焦摄像头，得到该监控区域内行为异常人员的异常信息的步骤之后，所述方法还包括：

提取所述监控区域内行为异常人员的异常视频片段，通过身高识别模型获取异常视频片段中行为异常人员的身高信息。

进一步地，利用八度卷积对预设I3D模型进行更新，以得到目标 I3D模型的方法包括：

通过预设I3D模型提取所述视频数据集的高频特征图及低频特征图；

分别对所述高频特征图及低频特征图进行相应频率的卷积，得到目标I3D模型。

进一步地，通过预设I3D模型提取所述视频数据集的高频特征图及低频特征图的方法包括：

获取所述预设I3D模型卷积层的输入特征张量；

根据所述输入特征张量的空间维数、信道数，沿着通道维度，将所述视频数据集分解为高频特征图及低频特征图。

进一步地，分别对所述高频特征图及低频特征图进行相应频率的卷积，得到目标I3D模型的方法包括：

根据所述高频特征图与卷积核的第一高频分量的卷积，以及低频特征图与卷积核的第二高频分量的卷积的上采样操作得到高频特征图的高频输出特征；

根据所述低频特征图与卷积核的第一低频分量的卷积，以及高频特征图与卷积核的第二低频分量的卷积的池化操作得到低频特征图的低频输出特征；

根据所述高频特征图的高频输出特征及低频特征图的低频输出特征，得到一经过八度卷积的目标I3D模型。

进一步地，通过所述目标I3D模型对视频数据集进行训练与测试，以得到行为预测模型的方法包括：

对所述视频数据集中的各视频片段进行样本采样，以得到一训练样本；

将各训练样本通过随机梯度下降法经卷积、最大池化、平均池化进行训练后，通过输出层输出为目标I3D模型；

将所述目标I3D模型作为特征提取器在人体行为数据库上进行训练，以得到一目标输出层；

通过所述视频数据集对所述目标I3D模型进行测试，以确定该目标I3D模型是否合格。

进一步地，根据该异常行为的种类生成一预警与警告信息的方法包括：根据所述异常行为的种类及各类异常行为的危险等级生成对应的频率预警与警告信息。

本发明的另一实施例提出一种人体异常行为监控系统，解决了现有人工视频监控工作方式单一，只能机械的记录监控场景的事件，不具备自动分析视频中人物异常行为的功能，要想及时发现异常事件，就得要求工作人员日以继夜，不间断地观察监控视频，不仅会浪费大量人力物力，还会因为长时间观察视频，造成人眼疲劳及损伤，从而容易导致对异常事件的漏报和错报的问题。

根据本发明实施例的人体异常行为监控系统，包括：

获取模块，用于获取人体行为数据库中上传的视频数据集；

更新模块，用于利用八度卷积对预设I3D模型进行更新，以得到目标I3D模型；

测试模块，用于通过所述目标I3D模型对视频数据集进行训练与测试，以得到行为预测模型；

预警模块，用于将监控区域内人员流动的视频信息输入所述行为预测模型，以得到该监控区域内行为异常人员的异常信息，并根据该异常行为的种类生成一预警与警告信息。

本发明的另一个实施例还提出一种存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述方法的步骤。

本发明的另一个实施例还提出一种监控设备，包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述方法。

本发明的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实施例了解到。

附图说明

图1是本发明第一实施例提出的人体异常行为监控方法的流程图；

图2是图1中步骤S102的具体流程图；

图3是本发明第一实施例中目标I3D模型的网络结构示意图；

图4是图3中Lnc模块的具体网络结构示意图；

图5是本发明第一实施例中身高识别模型的网络结构示意图；

图6是图5Lnc模块的具体网络结构示意图；

图7是本发明第二实施例提出的人体异常行为监控系统的结构框图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1，本发明第一实施例提出的一种人体异常行为监控方法，其中，包括步骤S101～S104：

步骤S101，获取人体行为数据库中上传的视频数据集。

目前，公开的人体行为数据库有很多，可根据需求到相应的网站进行下载，现在种类多且数据量很大是Kinetics-600视频数据集，视频来源于YouTube，一共有600个类别，每个类别至少600个视频以上，每段视频持续10秒左右。类别主要分为三大类：人与物互动，比如演奏乐器；人人互动，比如握手、拥抱；运动等。VIF视频数据库，主要关注的是人群的暴力行为，视频来源是真实的现实暴力录影，由246个视频组成，视频片段的平均长度为3.6秒。

在本实施例中，通过获取人体行为数据库中上传的视频数据集，以便于根据所应用的场景选取相应的视频数据集，避免由于数据获取的差异性而造成误差的累积，提高了数据获取的可靠性。

步骤S102，利用八度卷积对预设I3D模型进行更新，以得到目标I3D模型。

如上所述，为提高异常行为预测的可靠性，需解决双流网络中通过预处理视频，将视频帧分解为RGB图像和光流图像，然后将RGB 图像输入空间网络，光流图像输入时间网络，2个网络联合训练，最终通过直接平均和支持向量机两种方法进行融合得出分类结果，而导致运行速度较慢，无法满足实时要求的问题，因此为进一步提高行为预测模型的速度及性能，需利用八度卷积对预设I3D模型进行更新，以得到目标I3D模型，为下一步提高行为预测模型的可靠性提供必要条件。

请参阅图2，利用八度卷积对预设I3D模型进行更新，以得到目标I3D模型的方法包括如下步骤：

步骤S1021，通过预设I3D模型提取所述视频数据集的高频特征图及低频特征图。

进一步地，获取所述预设I3D模型卷积层的输入特征张量；根据所述输入特征张量的空间维数、信道数，沿着通道维度，将所述视频数据集分解为高频特征图及低频特征图。

步骤S1022，分别对所述高频特征图及低频特征图进行相应频率的卷积，得到目标I3D模型。

进一步地，根据所述高频特征图与卷积核的第一高频分量的卷积，以及低频特征图与卷积核的第二高频分量的卷积的上采样操作得到高频特征图的高频输出特征；根据所述低频特征图与卷积核的第一低频分量的卷积，以及高频特征图与卷积核的第二低频分量的卷积的池化操作得到低频特征图的低频输出特征；根据所述高频特征图的高频输出特征及低频特征图的低频输出特征，得到一经过八度卷积的目标I3D模型。

具体实施时，设所述预设I3D模型卷积层的输入特征张量为： X∈R^c×h×w，其中，h和w表示空间维数，c表示特征图的数量或信道数。

沿着通道维度，将X分解为:

其中，X^H∈R^{(1-α)c×h×w}为高频特征图，用于捕捉细节；

为低频特征图，用于表示整体架构；α∈[0,1]，表示分配给低频部分的通道比例，低频特征图定义为比高频低一个octave倍，即一半的空间分辨率。

将传统卷积设为：W∈R^c×k×k，表示一个k x k，c个通道的卷积核。X,Y∈R^c×h×w分别表示输入和输出张量。

Y_p,q∈R^c，里面的每个特征图可以用下面的公式(1)进行计算：

其中(p,q)表示位置坐标。

即对应卷积核大小的特征图上(p,q)的局部领域，假设k是一个奇数，并且输入和输出数据具有相同的维数，即：

c_in＝c_out＝c(3)

设X,Y为I3D模型卷积层因式分解的输入和输出特征张量，那么高频和低频特征图的输出可表示为：

Y＝{Y^H,Y^L} (4)

Y^H＝Y^H→H+Y^L→H (5)

Y^L＝Y^L→L+Y^H→L (6)

其中Y^H表示高频特征图的输出，Y^L表示低频特征图的输出。

由于Y^A→B表示从特征图A到特征图B的卷积更新过程，特别的Y^H→H,Y^L→L表示频内信息更新，Y^H→L,Y^L→H表示频间通信，为了计算这些项，将卷积核W分成两个分量W＝[W^H,W^L]，其中W^H表示高频分量，W^L表示低频分量，分别负责与X^H和X^L进行卷积，将各分量进一步划分为频率内分量和频率间分量可表示为：

W^H＝[W^H→H,W^L→H] (7)

W^L＝[W^L→L,W^H→L] (8)

其中，W^H→H和W^L→L为传统卷积运算，对于W^L→H是先对输入图像(视频帧)进行升采样(upsample)，再执行传统卷积，W^H→L是先对输入图像(视频帧)进行降采样，然后再执行传统卷积。为了控制输入和输出特征图的低频信息部分的比例，令第一层和最后一层八度卷积层的超参数满足：α_in＝0,α_out＝α (9)

中间的八度卷积层超参数则设为α_in＝α_out＝α (10)

对于高频特征图的输出Y^H，可在位置坐标(p,q)处进行计算，由以下式子求出:

它的频率内信息更新过程就是传统卷积过程，而频率间的信息交流过程，则可以先对输入图像(视频帧)的特征图进行上采样操作然后再进行传统卷积，类似的对于低频特征图的输出Y^L，它的频率内信息更新过程就是传统卷积过程，而频率间的信息交流过程则通过对输入图像(视频帧)进行下采样然后再进行传统卷积。具体可由以下公式求出：

为了避免出现中心偏移的错位情况，使用平均池化操作来进行下采样，重写八度卷积的输出，即公式(4)，则最终输出的高频输出特征与低频输出特征如下:

Y^H＝f(X^H；W^H→H)+upsample(f(X^L；W^L→H) (13)

Y^L＝f(X^L；W^L→L)+f(pool(X^H,2)；W^H→L)) (14)

其中f(X,W)表示与参数W的卷积，pool(X,k)表示是一个平均池化操作，池的核大小为k，步幅为k，upsample(X,k)表示上采样操作，用最近邻插值法。

可以理解的，通过将原始卷积特征映射分解成不同空间频率的两组特征图，并分别以相应的频率处理不同的卷积，相隔一个八度 (octave)。由于可以降低低频图的分辨率，因此能够大大节省存储和计算。这也有助于每一层获得更大的感受野，以捕获更多的上下文信息。此外，octave作为一个单一的、通用的、即插即用的卷积单元，可以直接替换预设I3D模型中传统的卷积，而无需对网络架构进行任何调整，这样可以提升网络的训练速度，提高视频识别任务的准确性，减少运行时间，使所获得的目标I3D模型更具有实时性。

步骤S103，通过所述目标I3D模型对视频数据集进行训练与测试，以得到行为预测模型。

如上所述，通过采用视频数据集对目标I3D模型进行训练与测试，以得到行为预测模型，从而提高行为预测模型获取的可靠性，为后期进行人体行为识别提供必要准备。

进一步地，对所述视频数据集中的各视频片段进行样本采样，以得到一训练样本；将各训练样本通过随机梯度下降法经卷积、最大池化、平均池化进行训练后，通过输出层输出为目标I3D模型；将所述目标I3D模型作为特征提取器在人体行为数据库上进行训练，以得到一目标输出层；通过所述视频数据集对所述目标I3D模型进行测试，以确定该目标I3D模型是否合格。

具体实施时，请参阅图3至图4，先在Kinetics-600视频数据集上进行预训练，将每个视频片段采样64帧，大小为224*224作为一个样本输入到网络的第一个八度卷积层，网络结构中有3个八度卷积层，相应的卷积核尺寸分别为7*7*7、1*1*1和3*3*3，有4个最大池化层，第一个最大池化层的卷积核尺寸为1*3*3,步幅为1，2，2，第二个最大池化层为的卷积核尺寸为1*3*3，步幅为1，2，2，第三个最大池化层的卷积核尺寸为3*3*3，步幅为2，第4个最大池化层的卷积核尺寸为2*2*2，步幅为2，还有一个平均池化层，卷积核尺寸为2*7*7，有9个基础模块，最后接了一个卷积核尺寸为1*1*1的全连接层作为输出层，训练时使用随机梯度下降法，batch size为30，初始学习率为0.003，每15000次迭代后将学习率除以2；训练时通过随机左右翻转视频，增加数据量；保存训练好的目标I3D模型；将预训练得到的目标I3D模型作为特征提取器，固定预训练的参数，在 VIF视频数据库上只重新训练一个分类器(最后的全连接层)；利用视频测试集对训练好的目标I3D模型进行测试，以验证模型的性能。

可以理解的，通过使用目标I3D模型可以捕获时序上的行为信息，能获得比2D卷积网络模型更多更有代表性的特征，对提升网络模型性能有较大帮助；利用I3D模型先在大视频数据库上预训练的办法，通过迁移学习，可以提升模型在其他小型视频数据库的识别性能； I3D网络是端对端训练的，比起双流网络模型运行速度更快，加入八度卷积，可让模型更具实时性。

步骤S104，将监控区域内人员流动的视频信息输入所述行为预测模型，以得到该监控区域内行为异常人员的异常信息，并根据该异常行为的种类生成一预警与警告信息。

具体的，通过将监控区域内人员流动的视频信息输入所述行为预测模型，以得到该监控区域内行为异常人员的异常信息，并根据所述异常行为的种类及各类异常行为的危险等级生成对应的频率预警与警告信息。其中，异常行为的类型可以为打架、抢劫、违规、盗窃等等，危险等级可分为轻微、严重、暴力等，预警与警告信息可以为语音播报、警示设备闪烁、预警设备震动等，在此不做限制。

在此还需要指出的是，在本发明其他实施例中，各监控区域内设有至少一多焦摄像头，得到该监控区域内行为异常人员的异常信息的步骤之后，所述方法还包括：提取所述监控区域内行为异常人员的异常视频片段，通过身高识别模型获取异常视频片段中行为异常人员的身高信息。

具体实施时，请参阅图5至图6，在一个固定的位置上设置一个摄像头，镜头可分别设置为4mm、8mm、12mm等常用的监控焦段；然后拍摄获取不同年龄段的人的视频片段，得事先获取被拍摄者们的详细身高信息，这个作为视频中人物身高的标签；利用ffmpeg改变收集到视频数据集的分辨率，获取低分辨的视频数据集；利用留出法，采取7:3的比例将视频数据集随机划分为训练集和测试集。

将2D的Inception V1网络结构中扩展为3D的inflated Inception V1网络结构；将每个视频片段采样32帧，大小为224*224作为一个样本输入到网络的第一个卷积层，网络结构中有3个卷积层，相应的卷积核尺寸分别为7*7*7、1*1*1和3*3*3；有4个最大池化层，第一个最大池化层的卷积核尺寸为1*3*3，步幅为1，2，2，第二个最大池化层为的卷积核尺寸为1*3*3，步幅为1，2，2，第三个最大池化层的卷积核尺寸为3*3*3，步幅为2，第4个最大池化层的卷积核尺寸为2*2*2，步幅为2；还有一个平均池化层，卷积核尺寸为2*7*7，有9个基础模块，最后接了一个卷积核尺寸为1*1*1的全连接层作为输出层。训练时使用随机梯度下降法，batch size为30，初始学习率为0.003，每15000次迭代将学习率除以2，训练时通过左右翻转视频，增加数据量；保存训练好的模型；将低分辨率的视频数据集输入到网络中进行重复学习；用训练好的模型对测试视频数据集进行测试，检验性能。

本发明中，网络模型是在高分辨率和低分辨率的视频数据集上进行训练和测试得到的，不仅可以在正常的情况下正确识别出视频中人物的身高，在视频较为模糊(低分辨率)，无参照物的情况下也可以识别出视频中人物的身高，具有很好的鲁棒性，因为是可以直接对摄像头拍摄到的视频流进行处理，所以能在极短的时间内得到人物的身高，满足了实际应用需求。

可以理解的，本发明可以运用到交通、银行、学校、公寓等各个场所，能够在异常事件发生时，实时识别出一些异常行为(打架，抢劫等暴力行为)并发出警告，让监控工作人员能及时了解情况。

请参阅图7，基于同一发明构思，本发明第二实施例提供的人体异常行为监控系统，包括：

获取模块10，用于获取人体行为数据库中上传的视频数据集。

更新模块20，用于利用八度卷积对预设I3D模型进行更新，以得到目标I3D模型。

进一步地，获取所述预设I3D模型卷积层的输入特征张量；根据所述输入特征张量的空间维数、信道数，沿着通道维度，将所述视频数据集分解为高频特征图及低频特征图；根据所述高频特征图与卷积核的第一高频分量的卷积，以及低频特征图与卷积核的第二高频分量的卷积的上采样操作得到高频特征图的高频输出特征；根据所述低频特征图与卷积核的第一低频分量的卷积，以及高频特征图与卷积核的第二低频分量的卷积的池化操作得到低频特征图的低频输出特征；根据所述高频特征图的高频输出特征及低频特征图的低频输出特征，得到一经过八度卷积的目标I3D模型。

测试模块30，用于通过所述目标I3D模型对视频数据集进行训练与测试，以得到行为预测模型。

预警模块40，用于将监控区域内人员流动的视频信息输入所述行为预测模型，以得到该监控区域内行为异常人员的异常信息，并根据该异常行为的种类生成一预警与警告信息。

进一步地，根据所述异常行为的种类及各类异常行为的危险等级生成对应的频率预警与警告信息。

进一步地，各监控区域内设有至少一多焦摄像头，所述预警模块 40，还用于提取所述监控区域内行为异常人员的异常视频片段，通过身高识别模型获取异常视频片段中行为异常人员的身高信息。

根据本发明提供的人体异常行为监控系统，通过获取人体行为数据库中上传的视频数据集，以为模型建立提供必要支持；利用八度卷积对预设I3D模型进行更新，以得到目标I3D模型，以提升网络的训练速度，提高视频识别任务的准确性，减少运行时间；通过所述目标 I3D模型对视频数据集进行训练与测试，以得到行为预测模型，提高模型获取的可靠性；通过将监控区域内人员流动的视频信息输入所述行为预测模型，以得到该监控区域内行为异常人员的异常信息，并根据该异常行为的种类生成一预警与警告信息，以便于对行为异常人员进行警示，且便于相关管理人员及时采取措施。本发明能够适用于复杂多变的监控场景、能够快速有效地识别监控数据中的异常情况，减少误报与漏报，为区域安全提供告警与支撑，满足了实际应用需求。

本发明实施例提出的人体异常行为监控系统的技术特征和技术效果与本发明实施例提出的方法相同，在此不予赘述。

此外，本发明的实施例还提出一种存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述方法的步骤。

此外，本发明的实施例还提出一种监控设备，包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，其中，所述处理器执行所述程序时实现上述方法的步骤。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。

计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(RAM)，只读存储器(ROM)，可擦除可编辑只读存储器(EPROM或闪速存储器)，光纤装置，以及便携式光盘只读存储器(CDROM)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管已经示出和描述了本发明的实施例，本领域的普通技术人员可以理解：在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由权利要求及其等同物限定。

最后应说明的是：以上所述实施例，仅为本发明的具体实施方式，用以说明本发明的技术方案，而非对其限制，本发明的保护范围并不局限于此，尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种人体异常行为监控方法，其特征在于，所述方法包括如下步骤：

获取人体行为数据库中上传的视频数据集；

利用八度卷积对预设I3D模型进行更新，以得到目标I3D模型；

2.根据权利要求1所述的人体异常行为监控方法，其特征在于，各监控区域内设有至少一多焦摄像头，得到该监控区域内行为异常人员的异常信息的步骤之后，所述方法还包括：

3.根据权利要求1所述的人体异常行为监控方法，其特征在于，利用八度卷积对预设I3D模型进行更新，以得到目标I3D模型的方法包括：

4.根据权利要求3所述的人体异常行为监控方法，其特征在于，通过预设I3D模型提取所述视频数据集的高频特征图及低频特征图的方法包括：

获取所述预设I3D模型卷积层的输入特征张量；

5.根据权利要求3所述的人体异常行为监控方法，其特征在于，分别对所述高频特征图及低频特征图进行相应频率的卷积，得到目标I3D模型的方法包括：

6.根据权利要求1所述的人体异常行为监控方法，其特征在于，通过所述目标I3D模型对视频数据集进行训练与测试，以得到行为预测模型的方法包括：

7.根据权利要求1所述的人体异常行为监控方法，其特征在于，根据该异常行为的种类生成一预警与警告信息的方法包括：根据所述异常行为的种类及各类异常行为的危险等级生成对应的频率预警与警告信息。

8.一种人体异常行为监控系统，其特征在于，所述系统包括：

获取模块，用于获取人体行为数据库中上传的视频数据集；

9.一种存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1至7任意一项所述的方法。

10.一种监控设备，包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至7任意一项所述的方法。