CN112287816B

CN112287816B - 一种基于深度学习的危险工作区事故自动检测报警方法

Info

Publication number: CN112287816B
Application number: CN202011170556.7A
Authority: CN
Inventors: 张新曼; 王静静; 寇杰; 彭羽瑞; 毛乙舒; 陈辉; 邢舒明; 罗圣哲; 周攀; 程昭晖; 陆罩
Original assignee: Xian Jiaotong University
Current assignee: Xian Jiaotong University
Priority date: 2020-10-28
Filing date: 2020-10-28
Publication date: 2023-05-23
Anticipated expiration: 2040-10-28
Also published as: CN112287816A

Abstract

一种基于深度学习的危险工作区事故自动检测报警方法，获取原始视频数据并进行预处理，将视频转换为深度学习网络可接受的输入训练集；通过卷积式时空自动编码器‑解码器学习训练视频中的特征模式，并利用所述训练集训练优化，得到车间事故检测模型；获取实时的待检测监控视频，采用所述车间事故检测模型检测每一帧监控视频图像的重建误差，若连续多张实时监控图像的局部最小重建误差大于阈值，则向车间管理员终端发送相应的报警信息以及对应的监控位置信息。本发明在大量视频分析基础上，又进行了正常场景的视频专项学习，得到了经过充分训练的检测模型，能够快速准确的检测出车间异常事故，可在任何车间场景下进行事故检测。

Description

一种基于深度学习的危险工作区事故自动检测报警方法

技术领域

本发明属于视频内容自动分析技术领域，特别涉及一种基于深度学习的危险工作区事故自动检测报警方法。

背景技术

车间安全不仅是企业的生命线，同样也是职工的生命线。但是现代化车间的生产环境日趋复杂，生产过程需要更加精密的操作，长期损耗或者操作不当都会造成设备倒塌、设备卷人、设备爆炸等十分严重的后果，轻则机器损坏，重则工人可能失去性命。一方面随着监控系统规模的不断扩大，视频数据海量增大，从中获取有用的信息或者情报越来越困难，查找效率低，工作量繁重，难以满足监控系统视频异常检测的需求。另一方面现有的常规视频处理技术对视频的拍摄角度、光照条件等要求严苛，而且只能是针对某一特定场景进行分析，无法拓展到各种场景，也无法同时对多种异常情况进行检测，所以一种更加智能的事故异常检测方法迫在眉睫。

近年来，深度学习在视频智能分析中得到了重大进展，解决了视频图像剧烈形变、镜头抖动、尺度变化、光照变化，遮挡等问题，可以同时进行大量视频的学习，特别是卷积神经网络已经证明了它在目标识别、人物检测和动作识别等广泛应用中的有效性，在异常检测领域越来越引起国内外分析专家的注目。但是现有的卷积神经网络的训练普遍要求有监督的，需要标签作为学习信号，视频信号涉及大数据处理，而且由于其高维性、随机噪声以及大量的事件的交互作用，手动对感兴趣的区域进行检测分割和标记是非常困难的，而且这样得到的检测模型很难推广到不同的监视场景。本发明利用多层卷积构建编码器-解码器形成深度学习网络，以一种无监督的学习方式捕捉数据中的空间结构和时间演化，侦测包含拥挤场景的车间视频事故，不仅不需要任何复杂的人工标记支持，并且大大提高了检测模型对不同场景的应用能力，能同时高效检测设备倒塌、设备卷人、设备爆炸三类事故，对其他异常事故也有一定的检测报警功能，保障工人生命安全。

发明内容

为了克服上述现有技术的缺点，本发明的目的在于提供一种基于深度学习的危险工作区事故自动检测报警方法，不需要对多种场景下的各种事故进行标记，从正常场景的训练视频中学习正常模式，然后在与正常模式偏离的事件中检测到异常，通过深度学习能够有效实现各种车间场景下的设备倒塌、设备卷人、设备爆炸等工作事故检测，适用范围广，检测结果准确可靠，有较高的鲁棒性和普适性。

为了实现上述目的，本发明采用的技术方案是：

一种基于深度学习的危险工作区事故自动检测报警方法，包括以下步骤：

1)获取原始视频数据并进行预处理，将视频转换为深度学习网络可接受的输入训练集；

2)通过卷积式空间自动编码器-解码器和卷积式时间自动编码器-解码器学习训练视频中的特征模式，并利用所述训练集训练优化，得到车间事故检测模型，以检测设备倒塌、设备卷人和设备爆炸等异常事故；

3)获取实时的待检测监控视频，采用所述车间事故检测模型检测每一帧监控视频图像的重建误差，若连续多张实时监控图像的局部最小重建误差大于阈值，则向车间管理员终端发送相应的报警信息；

4)在检测到发生车间事故时，向现场管理员终端发送发生车间事故的实时监控图像以及对应的监控位置信息。

进一步地，所述步骤1)中，获取只包含正常场景的原始视频数据，从其中提取图像，对图像进行灰度化处理以降低维数；对灰度化处理后的图像进行归一化(如尺度变换)，使其具有零均值和单位方差。

进一步地，可将图像在时间维度上进行数据扩充，按不同的步幅提取监控图像拼接出不同时间跨度的新视频片段，以增加训练数据集的数量，将实时获取的监控转换为深度学习网络可接受的输入训练集。

进一步地，所述步骤2)包括：

2.1)构建卷积式空间自动编码器-解码器学习每个视频帧的空间结构，构建卷积式时间编码器-解码器学习编码的空间结构的时间模式；

2.2)使用反向传播算法并以无监督的方式训练模型，训练原则为最小化原始输入视频集和卷积网络输出视频集之间的重构误差，选择非线性函数作为激活函数，兼顾编码器和解码器函数的对称性；

2.3)通过输入测试数据来评估训练得到的车间事故检测模型的性能，并检查它是否能够在保持低虚警率的情况下检测异常事件，利用测试集验证训练得到的车间事故检测模型是否达到收敛条件，若达到收敛条件，则输出车间事故检测模型；否则重新进入步骤2.1)。

其中，所述卷积式空间自动编码器-解码器由两个卷积层和两个反卷积层组成，其中两个卷积层构成编码器，两个反卷积层构成解码器，卷积运算通过对两个卷积层和两个反卷积层的每一层的输入数据应用卷积核来保持像素之间的空间关系，并且从输入图像数据中提取空间结构特征；卷积运算在卷积核和输入区域中对应卷积核大小的局部区域之间执行点积，每一层的输出是对输入数据遍历卷积运算的结果，卷积网络在训练过程中会自行学习卷积核的值。

所述卷积式时间编码器-解码器使用三层卷积长期短期记忆(ConvLSTM)模型，卷积长短期记忆(ConvLSTM)模型用于学习输入之间的时间依赖性，卷积长短期记忆的矩阵运算被卷积所取代，通过对输入层到隐含层和隐含层到隐含层的连接使用卷积，卷积长短期记忆需要更少的权重并生成更好的空间特征映射，卷积长短期记忆网络还添加了一个可选的窥视孔连接，以使网络能够更好地获取过去的信息。

进一步地，所述步骤2.2)中，使用随机梯度下降法，训练时对每个样本进行梯度更新；为了保证编码和解码函数的对称性，选择双曲正切作为空间编码器和解码器的激活函数；在模型训练学习的过程中，给定训练的学习率、批大小(batchsize)、训练轮数epoch。

进一步地，所述步骤2.3)采用评估指标正则性得分作为收敛条件，当车间事故检测模型得到的正则性得分大于阈值，则达到收敛条件，训练得到的车间事故检测模型验证通过；否则不满足收敛条件。

进一步地，所述步骤3)采用所述车间事故检测模型检测每一帧监控视频图像的重建误差，为了减少正则性得分中有噪声和无意义的极小值，应用Persistence1D算法对具有固定时间窗口的局部极小值进行分组，若连续多张实时监控图像的局部最小重建误差大于阈值，则向车间管理员终端发送相应的报警信息，误差阈值根据多次实验获得的真阳性率和假阳性率以及受试者接收工作特性曲线(ROC)下的面积综合考虑，最终实现设备倒塌、设备卷人、设备爆炸等车间事故的自动检测和报警。

进一步地，所述步骤4)在获取待检测监控视频时，同时获取与待检测监控视频匹配的车间摄像头位置信息，将位置信息自动扩展为监控视频的属性之一，并在检测到发生车间事故时，向现场管理员终端发送发生车间事故的实时监控图像以及对应的监控位置信息，做到及时快速处理事故。

与现有技术相比，本发明的有益效果是：

提出了一种基于深度学习来检测视频中的设备倒塌、设备卷人、设备爆炸等车间事故。基于当异常事件发生时，视频的最新帧将明显不同于旧帧的基本原则，训练了一个端到端的模型，该模型由一个空间特征提取器和一个时间编码解码器组成，前者自动学习每个视频帧的空间结构，后者学习编码的空间结构的时间模式。该模型采用只包含正常场景的视频集进行训练，采用无监督的反向传播方法，目标是使学习模型重建的输入视频量和输出视频量之间的重建误差最小。当模型经过适当训练后，正常的视频体积具有较低的重建误差，而由异常场景组成的视频体积具有较高的重建误差。通过对每个测试输入量产生的误差进行阈值化，训练得到的车间事故检测模型将能够检测到异常事件的发生。训练是无监督的学习方法，与任何特定任务无关，也不需要监督信号，能够推广到不同的车间工作场景。本发明能够实现监控视频的实时车间事故检测，有效检测设备倒塌、设备卷人、设备爆炸以及其他一些异常事故，检测结果准确可靠，鲁棒性强，适用范围广，为社会经济安全提供了保障，应用前景广阔。

进一步的，本发明的空间编码器和解码器由两个卷积层和反卷积层构成，对监控视频进行特征提取从而识别异常事故。时间编码器-解码器采用一个三层卷积长短期存储器(LSTM)模型，卷积网络以其出色的图像特征提取性能而具有目标识别的独特优势，LSTM模型则广泛用于序列学习和时间序列建模，可以更好的提取监控视频中的空间结构和时间模式。从数学上看，卷积运算在卷积核和输入的局部区域之间执行点积，引入卷积网络更有利于从输入图像中提取特征，卷积运算也可以通过使用方形的卷积核来学习图像特征并保留像素之间的空间关系。为克服梯度消失问题，在深度学习网络中加入“遗忘门”的结构，可以有效防止反向传播中的梯度消失或爆炸，因此可以处理较长的序列，并且可以将它们堆叠在一起以捕获更高级别的信息。数据库为只包含正常场景的视频集，通过无监督的学习方式得到视频中的空间结构和时间模式得到车间事故检测模型，计算输入帧的重建误差，重建误差大于所设误差阈值即发生车间事故，否则车间工作正常。

附图说明

图1为本发明车间事故视频检测方法流程图。

图2为空间编码器-解码器结构图。

图3为时间编码器-解码器结构图。

图4为典型LSTM单元结构图。

图5为损失函数随训练轮数变化关系图。

图6为ROC曲线图。

图7为设备倒塌误差分析示例：(a)视频正常的图像帧；(b)视频出现设备倒塌的图像帧；(c)坍塌事故发生时视频的正则性得分曲线结果。

图8为设备卷人误差分析示例：(a)视频正常的图像帧；(b)视频出现设备卷人的图像帧；(c)卷人事故发生时视频的正则性得分曲线结果。

图9为设备爆炸误差分析示例：(a)视频正常的图像帧；(b)视频出现设备爆炸的图像帧；(c)爆炸事故发生时视频的正则性得分曲线结果。

具体实施方式

下面结合附图和实施例详细说明本发明的实施方式。

参见图1，本发明基于深度学习的车间事故自动检测报警方法，对监控视频进行实时监测和报警，可用于检测设备倒塌、设备卷人和设备爆炸等事故，方案如下：

获取原始视频数据(只包含正常场景的视频)，从其中提取图像并进行预处理，将视频转换为深度学习网络可接受的输入训练集。

通过卷积式空间自动编码器-解码器和卷积式时间自动编码器-解码器学习训练视频中的特征模式，并利用所述的训练集训练优化，得到车间事故检测模型，通过深度学习将异常检测转换为一个时空序列异常点检测问题。

获取实时的待检测监控视频，采用所述车间事故检测模型检测每一帧监控视频图像的重建误差，若连续多张(例如50张)实时监控图像的局部最小重建误差大于阈值，则向车间管理员终端发送相应的报警信息。

在获取待检测监控视频时，同时获取与待检测监控视频匹配的车间摄像头位置信息，将位置信息自动扩展为监控视频的属性之一，并在检测到重建误差大于阈值时确认发生车间事故，向现场管理员终端发送发生车间事故的实时监控图像以及对应的监控位置信息，及时对设备倒塌、设备卷人、设备爆炸等异常事故进行报警，做到及时快速处理事故，减少人员伤亡。

具体步骤如下：

1.工作场景监控视频预处理

如图1所示的预处理流程，实时监控视频获取后进行视频的预处理部分，从原始监控视频中提取每一帧图像并调整为统一尺寸，然后对图像进行灰度化处理以降低维数；对处理后的图像进行归一化，使其具有零均值和单位方差；模型输入要求为连续10帧的视频图像，在时间维度上进行数据扩充，按不同的步幅提取监控图像拼接出不同时间跨度的新视频片段，以增加训练数据集的数量，将实时获取的监控视频转换为深度学习网络可接受的输入训练集。

特别的，模型输入要求为视频图像集合，每个集合由10个连续图像帧组成，由于该模型中的参数数目较多，需要大量的训练数据，因此在时间维度上进行数据扩充，以增加训练数据集的大小。为了生成足够数量的图像训练集合，按不同的步幅提取监控图像拼接出不同时间跨度的新视频片段，如步幅1、步幅2和步幅3。例如，步幅1序列由帧{1、2、3、4、5、6、7、8、9、10}组成，而步幅2序列包含帧编号{1、3、5、7、9、11、13、15、17、19}，而步幅3序列将包含帧编号{1、4、7、10、13、16、19、22、25、28}，通过以上的数据处理和数据扩充，实现将实时获取的监控视频转换为深度学习网络可接受的输入训练集。

2.时空特征自动编码器-解码器的深度学习

在具体的训练过程中，包括：

1)构建卷积式空间自动编码器-解码器学习每个视频帧的空间结构，构建卷积式时间编码器-解码器学习编码的空间结构的时间模式；

卷积式空间自动编码器-解码器由两个卷积层和两个反卷积层组成，如图2所示，两个卷积层构成编码器，两个反卷积层构成解码器。卷积的主要目的是从输入图像数据中提取空间结构特征，卷积运算通过对两个卷积层和两个反卷积层的每一层的输入数据应用卷积核来保持像素之间的空间关系，并且从输入图像数据中提取空间结构特征。从数学上讲，卷积运算在滤波器和输入的局部区域之间执行点积。假设有一个n×n平方输入层，后面是卷积层。如果使用m×m滤波器W，卷积层输出的大小将为(n-m+1)×(n-m+1)。

卷积运算在卷积核和输入区域中对应卷积核大小的局部区域之间执行点积，每一层的输出是对输入数据遍历卷积运算的结果，卷积网络在训练过程中会自行学习这些卷积核的值。

其中M_j表示每个卷积核对应的l层输入集合，

是l层第i个输入，/>

是l层第j个输出，/>

是l层第i个输入对第j个输出的权重，b是l层第j个输出的偏置。

在训练前要指定卷积核的数量、卷积核大小、隐含层层数等参数。随着卷积核数量的增加，提取的图像特征也就越多，网络在识别不可见图像中的模式方面就越好。然而，更多的卷积核会增加计算时间并更快地消耗内存，因此需要通过设置合适的网络参数来达到速度和精度的平衡。

卷积式时间编码器-解码器使用三层卷积长期短期记忆(ConvLSTM)模型，如图3所示。卷积长短期记忆(ConvLSTM)模型主要用于学习输入之间的时间依赖性，卷积长短期记忆的矩阵运算被卷积所取代，通过对输入层到隐含层和隐含层到隐含层的连接使用卷积，卷积长短期记忆需要较少的权重并生成更好的空间特征映射。

在传统的前馈神经网络中，是以假设所有的输入(和输出)是相互独立为前提的，然而，在涉及存在先后序列的任务中，学习输入之间的时间依赖性非常重要，卷积长短期记忆(ConvLSTM)模型非常适合用于学习输入之间的时间依赖性。一方面，ConvLSTM加入“遗忘门”克服梯度消失的问题，可以防止反向传播的误差消失或爆炸，从而可以在长序列上工作，并且可以将它们叠加在一起以获取更高层次的信息。另一方面，ConvLSTM的矩阵运算被卷积所取代，通过对输入层到隐含层和隐含层到隐含层的连接使用卷积，ConvLSTM需要较少的权重并生成更好的空间特征映射。ConvLSTM单元可以用下列公式来概括，图4为典型的LSTM单元，具体的参数关系如图4所示，每个连接的权重集由卷积核代替(符号*表示卷积运算)，有利于它在每个ConvLSTM状态下临时传播空间特性。

f_t＝σ(W_f*[h_t-1,x_t,C_t-1]+b_f)

i_t＝σ(W_i*[h_t-1,x_t,C_t-1]+b_i)

o_t＝σ(W_o*[h_t-1,x_t,C_t-1]+b_o)

方程f_t表示遗忘层，i_t表示输入门，i_t和

是添加新信息的地方，C_t合并了新旧信息，o_t表示输出门，o_t和h_t在下一个时间步骤将目前所学的输出到ConvLSTM单元。变量x_t表示输入特征，h_t表示隐含层状态，C_t表示时间t时刻的单元状态。W是可训练权重矩阵，b是偏差向量，符号/>

表示Hadamard积。卷积长短期记忆网络还添加了一个可选的“窥视孔”连接，以使网络能够更好地获取过去的信息。

2)使用反向传播算法并以无监督的方式训练模型，训练原则为最小化原始输入视频集和卷积网络输出视频集之间的重构误差，选择非线性函数作为激活函数，兼顾编码器和解码器函数的对称性；

自动编码器-解码器采用无监督的反向传播方法，通过最小化原始输入视频集和卷积网络输出视频集之间的重构误差来训练模型。在模型训练学习的过程中，给定训练的学习率、批大小(batchsize)、训练轮数epoch。

使用随机梯度下降法，训练时对每个样本进行梯度更新。

W_t+1＝W_t-η_tg_t

其中g_t是单个样本对权重等参数的偏导；即训练时，每次只从一批训练样本中随机选取一个样本进行梯度下降；对随机梯度下降来说，只需要一次关注一个训练样本，一点点把参数朝着全局最小值的方向进行修改了。

为了保证编码和解码函数的对称性，选择双曲正切作为空间编码器和解码器的激活函数。

在模型训练学习的过程中，学习率为0.01，使用随机梯度下降法，批大小(batchsize)设置为16，训练轮数epoch设置为500。图5显示的是模型在训练过程中的损失随训练轮数(epoch)的变化图，虚线表示的是在训练集上的损失，实线表示的是在验证集上的损失。可以看到，随着训练轮数的逐渐增大，无论是训练集还是验证集上的损失函数都逐渐减小。并且这种减少的效果在训练轮数在0到100的范围内最为明显，当训练轮数大于100后，随着训练轮数的增大，损失函数的下降比较缓慢，迭代训练400轮后损失函数几乎不再下降。故本发明设置总的训练轮数为500。

3.检测模型的收敛性检验；

训练好模型后，需要通过输入测试数据来评估训练得到的车间事故检测模型的性能，并检查它是否能够在保持低虚警率的情况下检测异常事件，利用测试集验证训练得到的车间事故检测模型是否达到收敛条件，若达到收敛条件，则输出车间事故检测模型；否则重新进入自动编码器-解码器网络结构的构建和训练。

检验训练的车间事故检测模型的性能，采用评估指标正则性得分作为收敛条件，当车间事故检测模型的得到的正则性得分大于阈值，则达到收敛条件，训练得到的车间事故检测模型验证通过；否则不满足收敛条件。

将视频序列的帧t中的所有像素值的重建误差作为输入帧和重建帧之间的欧氏距离：

e(t)＝||x(t)-f_W(x(t))||₂

其中f_W是时空模型的学习权重。然后通过在0和1之间缩放来计算异常得分s_a(t)。随后，正则性得分s_r(t)可以简单地从1减去异常得分得到：

s_r(t)＝1-s_a(t)

4.设备倒塌、设备卷人、设备爆炸的异常检测；

采用所述车间事故检测模型检测每一帧监控视频图像的重建误差，应用Persistence1D算法进行事件计数的分组，误差阈值参考多方面实验数据，图5为损失函数随训练轮数变化关系图。

为了减少正则性得分中有噪声和无意义的极小值，应用Persistence1D算法对具有固定时间窗口的局部极小值进行分组，若连续多张(例如50张)实时监控图像的局部最小重建误差大于阈值，则向车间管理员终端发送报警视频信息和车间事故位置信息。

误差阈值决定了车间事故检测系统行为的敏感度，例如，设置一个较低的阈值会使系统对场景中发生的异常事件变得敏感，在那里会触发更多的警报。在本发明中误差阈值根据多次实验获得的真阳性率和假阳性率以及受试者接收工作特性曲线(ROC)下的面积综合考虑。

图6为ROC曲线图，可以体现车间事故检测模型对异常事件检测的能力，并展示了受试者接收工作特性曲线(ROC)。如图6所示，其中横坐标表示的是FPR(当前被错误分到正样本类别中真实的负样本占所有负样本总数的比例)，也称为假阳性率，假阳性就是在标准的阴性(标准的阴性就等于假阳性加真阴性＝FP+TN)中，被检测为阳性的概率；纵坐标表示TPR(当前分到正样本中真实的正样本所占所有正样本的比例)，也称为真阳性率，真阳性率就是在标准的阳性(标准的阳性就等于真阳性加假阴性＝TP+FN)中，同时被检测为阳性的概率。

图7、图8和图9分别是设备倒塌误差分析示例、设备卷人误差分析示例和设备爆炸误差分析示例，图(a)是正常的视频帧，图(b)是检测到的异常视频帧，图(c)中表示的是相应的异常事故发生时的正则性得分曲线结果，得分越低，表示越可能出现异常，也就是越可能出现事故。红色区域表示真实标签，也就是红色区域内发生异常。根据图7、图8和图9可以看出，红色区域的正则性得分都非常低，这表明使用正则性得分作为异常检测指标是可行的，即基于无监督时空学习的深度卷积网络检测车间事故的方案是可行的。

综上，本发明在大量的视频分析的基础上，又进行了正常场景的视频专项学习，得到了经过充分训练的检测模型，能够快速准确的检测出车间异常事故，非常有利于对工人进行及时救援，挽救生命，同时训练模型适用范围广，鲁棒性高，可以在任何车间场景下进行可靠的事故检测。

以上的具体实施方式仅为本发明的较佳实施例，并不用以限制本发明，凡在发明的精神及原则之内所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于深度学习的危险工作区事故自动检测报警方法，其特征在于，包括以下步骤：

其中，获取只包含正常场景的原始视频数据，从其中提取图像，对图像进行灰度化处理以降低维数；对灰度化处理后的图像进行归一化，使其具有零均值和单位方差；并将图像在时间维度上进行数据扩充，按不同的步幅提取监控图像拼接出不同时间跨度的新视频片段，以增加训练数据集的数量，将实时获取的监控转换为深度学习网络可接受的输入训练集；

2)通过卷积式空间自动编码器-解码器和卷积式时间自动编码器-解码器学习训练视频中的特征模式，并利用所述训练集训练优化，得到车间事故检测模型，以检测包括设备倒塌、设备卷人和设备爆炸在内的异常事故；

其中，采用所述车间事故检测模型检测每一帧监控视频图像的重建误差，为了减少正则性得分中有噪声和无意义的极小值，应用Persistence1D算法对具有固定时间窗口的局部极小值进行分组，若连续多张实时监控图像的局部最小重建误差大于阈值，则向车间管理员终端发送相应的报警信息，误差阈值根据多次实验获得的真阳性率和假阳性率以及受试者接收工作特性曲线下的面积综合考虑，最终实现设备倒塌、设备卷人、设备爆炸等异常事故的自动检测和报警；

其中，将视频序列的帧t中的所有像素值的重建误差作为输入帧和重建帧之间的欧氏距离；

2.根据权利要求1所述基于深度学习的危险工作区事故自动检测报警方法，其特征在于，所述步骤2)包括：

3.根据权利要求2所述基于深度学习的危险工作区事故自动检测报警方法，其特征在于，所述卷积式空间自动编码器-解码器由两个卷积层和两个反卷积层组成，其中两个卷积层构成编码器，两个反卷积层构成解码器，卷积运算通过对两个卷积层和两个反卷积层的每一层的输入数据应用卷积核来保持像素之间的空间关系，并且从输入图像数据中提取空间结构特征；卷积运算在卷积核和输入区域中对应卷积核大小的局部区域之间执行点积，每一层的输出是对输入数据遍历卷积运算的结果，卷积网络在训练过程中会自行学习卷积核的值。

4.根据权利要求2所述基于深度学习的危险工作区事故自动检测报警方法，其特征在于，所述卷积式时间编码器-解码器使用三层卷积长期短期记忆模型，卷积长短期记忆模型用于学习输入之间的时间依赖性，卷积长短期记忆的矩阵运算被卷积所取代，通过对输入层到隐含层和隐含层到隐含层的连接使用卷积，卷积长短期记忆需要更少的权重并生成更好的空间特征映射，卷积长短期记忆网络还添加了一个可选的窥视孔连接，以使网络能够更好地获取过去的信息。

5.根据权利要求2所述基于深度学习的危险工作区事故自动检测报警方法，其特征在于，所述步骤2.2)中，使用随机梯度下降法，训练时对每个样本进行梯度更新；为了保证编码和解码函数的对称性，选择双曲正切作为空间编码器和解码器的激活函数；在模型训练学习的过程中，给定训练的学习率、批大小、训练轮数。

6.根据权利要求2所述基于深度学习的危险工作区事故自动检测报警方法，其特征在于，所述步骤2.3)采用评估指标正则性得分作为收敛条件，当车间事故检测模型得到的正则性得分大于阈值，则达到收敛条件，训练得到的车间事故检测模型验证通过；否则不满足收敛条件。

7.根据权利要求1所述基于深度学习的危险工作区事故自动检测报警方法，其特征在于，所述步骤4)在获取待检测监控视频时，同时获取与待检测监控视频匹配的车间摄像头位置信息，将位置信息自动扩展为监控视频的属性之一，并在检测到发生车间事故时，向现场管理员终端发送发生车间事故的实时监控图像以及对应的监控位置信息，做到及时快速处理事故。