CN114937222A

CN114937222A - 一种基于双分支网络的视频异常检测方法及系统

Info

Publication number: CN114937222A
Application number: CN202210394205.7A
Authority: CN
Inventors: 霍永青; 杜娜; 王达
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2022-04-14
Filing date: 2022-04-14
Publication date: 2022-08-23

Abstract

本发明提供了一种基于双分支网络的视频异常检测方法及系统，属于视频处理技术领域。本发明通过将采用堆叠的ConvLSTM网络作为预测分支和3D卷积网络作为记忆分支的双分支网络，提高了学习正常视频特征的能力、有效的提升了正常视频的预测能力而削弱了异常视频的预测能力，解决了深度网络泛化能力过强而导致预测的异常帧与其真值之间的误差较小的问题。

Description

一种基于双分支网络的视频异常检测方法及系统

技术领域

本发明属于视频处理技术领域，尤其涉及一种基于双分支网络的视频异常检测方法及系统。

背景技术

随着监控视频数量的急剧增加，人工监控由于耗费大量人力、财力不再适用监控视频领域。因此，开发一种实时监控系统，实现对监控视频中异常模式的智能检测，是一项紧迫的任务。从模型训练的角度来说，异常模式是一种少见且不同于正常模式的模式。从异常模式的定义角度来说，异常的种类繁多、发生的概率较低并很分散，并且在一个场景中被定义为异常的模式在另一个场景中可能是视作正常的。因此，现有的大多数数据集中的训练集只存在正常模式标签，很少有标签来标记异常模式。由于异常模式的稀疏性和异常模式标签数据的缺乏，用单一的分类方法很难完成异常检测任务，因此，当前的主流方法是以无监督的方式在正常视频中学习正常事件模式，目的是使用不包含异常模式的训练集学习描述正常模式的模型，在测试阶段，异常模式是指外观和运动模式的变化与训练中观察到的常规模式不一致的模式。

目前，大多数现有算法使用无监督学习方法来建模监控视频中的正常模式。根据现有假设，异常模式检测方法可分为基于生成的重构帧与其真值之间的重建误差方法以及基于生成的预测帧及其真值之间的预测误差方法。这两种方法都是先将多个连续正常帧作为模型的输入，然后提取帧外观信息和上下文信息，最终目的是重建输入帧或预测即将到来的帧。重构误差方法的基本假设是，在推理阶段中，正常模式的重建误差与异常模式的重建误差存在显著差异，因此可以利用这个差异来区分它们。同样，基于预测误差方法的假设是正常模式的预测误差较小，而异常模式的预测误差较大。自动编码器(AE)在这两种方法中都得到了广泛的应用，它包含获取低维输入数据表示的编码器和将潜在特征层重构回高维特征表示的解码器。但是这种假设不一定成立，因为卷积神经网络(CNN)具有过强的深度特征学习能力。最终，正常模式和异常模式的重建误差将相似，导致无法区分正常模式和异常模式。为了提升监控视频的检测异常的能力，在2018年国际会议IEEEConference on Computer Vision and Pattern Recognition上，《Future FramePrediction for Anomaly Detection–A New Baseline》引入了一个基于视频预测的视频异常检测框架，该框架以预测的帧与其真值之间的强度差、梯度差和光流差为损失函数，基于预测误差的方法考虑连续帧之间的语义，但它仍然面临着网络泛化能力过强的问题。因此，无论是基于重建误差的方法还是基于预测误差的方法都不能提供完美的解决方案。但是由于基于预测误差的方法考虑了多帧之间的语义，其异常检测性能优于基于重构误差的方法，如何提升正常视频的预测能力而削弱网络对异常视频的预测能力是待解决的技术问题。

发明内容

针对现有技术中的上述不足，本发明提供的一种基于双分支网络的视频异常检测方法及系统，解决了深度网络泛化能力过强而导致预测的异常帧与其真值之间的误差较小的问题。

为了达到以上目的，本发明采用的技术方案为：

本方案提供一种基于双分支网络的视频异常检测方法，包括以下步骤：

S1、将正常视频的连续t帧分别作为预测分支和记忆分支的输入；

S2、通过所述记忆分支利用3D卷积神经网络学习正常视频流的特征信息，并计算得到特征分离损失和特征紧凑损失；

S3、通过所述预测分支利用2D卷积神经网络提取视频帧的外观特征，并根据外观特征，利用ConvLSTM提取上下文信息得到细胞状态和隐藏状态；

S4、根据步骤S2学习的正常视频流的特征信息，以及步骤S3得到的细胞状态和隐藏状态生成新的正常视频特征，并根据所述新的正常视频特征利用解码器生成未来帧；

S5、利用所述未来帧的均方预测损失、特征分离损失和特征紧凑损失对模型进行训练；

S6、根据训练后的模型，利用未来帧的均方预测损失计算异常得分，并根据异常得分判别帧是否异常，完成视频异常的检测。

本发明的有益效果是：本发明为了提取视频流的时间上下文信息以及提升异常检测的精度，采用堆叠的ConvLSTM网络作为预测分支和3D卷积网络作为记忆分支的双分支网络，解决了深度网络泛化能力过强而导致的预测的异常帧与其真值之间的误差较小的问题。

进一步地，所述步骤S2包括以下步骤：

S201、通过3D卷积神经网络利用6个3D卷积操作对正常视频的连续t帧进行特征提取，得到时空特征

其中，Z^M表示时空特征，z_l ^M表示局部特征，用作寻址，且z_l ^M∈R^c，R^c表示长度为通道数c的向量，R^w×h×c表示时空特征的尺寸，w表示时空特征的宽度，h表示时空特征的长度，l表示局部特征的数量；

S202、基于所述记忆分支，初始化s个记忆向量为

并根据局部特征z_l ^M和记忆向量m_i，计算得到记忆特征F^mem；

S203、利用两层反卷积对所述记忆特征F^mem进行卷积操作，得到新的记忆特征

S204、计算得到局部特征z_l ^M与记忆向量m_i间的特征分离损失和特征紧凑损失。

上述进一步方案的有益效果是：本发明提出的记忆分支通过3D卷积能够提取紧凑且分散的正常模式特征，并且引入特征紧凑损失和特征分离损失从而得到多种多样的特征，以正常视频流的上下文语义信息。

进一步地，所述步骤S202中新的记忆特征的表达式如下：

其中，F^mem表示记忆特征，f_l ^mem表示局部记忆特征，w'表示记忆特征的宽度， h'表示记忆特征的高度，l表示局部记忆特征的数量，R^'w'×h'×c'表示记忆特征的尺寸，a_l-i表示局部特征z_l ^M与第i个记忆向量间的寻址向量，m_i表示记忆向量M中的第i个记忆向量，(m_i)^T表示m_i的转置，c表示记忆特征通道数。

上述进一步方案的有益效果是：本发明通过计算得到新的记忆特征，在模型训练过程中可以得到与时空特征最接近且多样的记忆向量，并借助记忆向量得到含有丰富信息的正常视频特征。

再进一步地，所述步骤S204中特征分离损失的表达式如下：

其中，L_compact表示特征分离损失，m_p表示与局部特征最接近的记忆向量，p 表示与局部特征最接近的记忆向量的索引；

所述特征紧凑损失的表达式如下：

其中，L_separate表示特征紧凑损失，m_n与局部特征接近的记忆向量，α表示一个大于0的常数，n表示与局部特征接近的记忆向量的索引。

上述进一步方案的有益效果是：本发明所提出的特征分离损失和特征紧凑损失可以使得记忆向量与局部特征最接近的项足够近、与局部特征第二接近的项足够远，促进多样且分散的记忆特征的提取。

再进一步地，所述步骤S3包括以下步骤：

S301、通过所述预测分支，将输入序列的每一帧独立发送至具有2D卷积的空间编码器E_sp，提取视频帧的外观特征；

S302、根据每一帧的外观特征，利用ConvLSTM网络提取帧之间的上下文信息，得到细胞状态C_t和隐藏状态H_t。

上述进一步方案的有益效果是：本发明利用ConvLSTM网络来提取视频流的时空信息，并综合记忆分支得到的特征，加强模型对正常模式的预测能力，而削弱模型对异常分支的预测能力。

再进一步地，所述步骤S4包括以下步骤：

S401、将所述细胞状态C_t和新的记忆特征

沿通道维度进行拼接，得到基于通道的注意力A_t ^mem；

S402、根据所述注意力A_t ^mem和新的记忆特征

计算得到通道优化后的记忆特征

S403、将记忆特征

和隐藏状态H_t沿通道维度进行拼接，得到新的正常视频特征；

S404、根据新的正常视频特征利用解码器生成未来帧。

上述进一步方案的有益效果是：本发明综合预测分支提取的包含上下文信息的特征(如细胞状态、隐藏状态)与记忆分支提取到的记忆特征，并利用注意力优化得到正常视频特征，提升模型提取正常帧特征的能力。

再进一步地，所述记忆特征

的表达式如下：

其中，

表示位置相乘。

上述进一步方案的有益效果是：本发明利用注意力优化记忆特征，使得记忆特征集中在注意力权重较大的区域。

再进一步地，所述步骤S5中模型的损失函数的表达式如下：

L＝L_pre+λ_cL_compact+λ_sL_separate

其中，L表示模型的损失函数，L_pre、L_compact和L_separate分别表示预测损失函数、特征紧凑损失和特征分离损失，λ_c和λ_s分别表示权重系数。

上述进一步方案的有益效果是：本发明综合三种损失函数，使得模型预测的未来帧与真实的未来帧尽可能的相似，提升了模型预测未来帧的能力。

本发明提供还一种基于双分支网络的视频异常检测系统，包括：

输入模块，用于将正常视频的连续t帧分别作为预测分支和记忆分支的输；

第一处理模块，用于通过所述记忆分支利用3D卷积神经网络学习正常视频流的特征信息，并计算得到特征分离损失和特征紧凑损失；

第二处理模块，用于通过所述预测分支利用2D卷积神经网络提取视频帧的外观特征，并根据外观特征，利用ConvLSTM提取上下文信息得到细胞状态和隐藏状态；

第三处理模块，用于根据学习的正常视频流的特征信息、细胞状态和隐藏状态生成新的正常视频特征，并根据所述新的正常视频特征利用解码器生成未来帧；

训练模块，用于利用所述未来帧的均方预测损失、特征分离损失和特征紧凑损失对模型进行训练；

检测模块，用于根据训练后的模型，利用未来帧的均方预测损失计算异常得分，并根据异常得分判别帧是否异常，完成视频异常的检测。

附图说明

图1为本发明的方法流程图。

图2为本发明的检测示意图。

图3为本实施例中基于Ped1数据集的ROC曲线示意图。

图4为本实施例中基于Ped2数据集的ROC曲线示意图。

图5为本实施例中基于Avenue数据集的ROC曲线示意图。

图6为本发明的系统结构示意图。

具体实施方式

下面对本发明的具体实施方式进行描述，以便于本技术领域的技术人员理解本发明，但应该清楚，本发明不限于具体实施方式的范围，对本技术领域的普通技术人员来讲，只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内，这些变化是显而易见的，一切利用本发明构思的发明创造均在保护之列。

实施例1

鉴于现实生活中异常情况多种多样，收集和标注所有异常事件几乎是一件不可能的事情，这使得传统的二分类方法在此不适用，此外，它很难以明确界定异常情况。目前，现有技术主要利用无监督方法来进行异常检测，即训练视频仅包含正常样本数据。现有的技术将视频异常检测任务转换为视频帧预测或者帧重构任务，这是因为异常视频的帧预测误差和帧重构误差相比于正常视频大。随着深度学习的发展，卷积神经网络广泛运用在异常检测领域，然而深度网络的泛化能力过强，随着网络训练过程的推进，网络不仅能很好的重构、预测正常数据也可以重构、预测异常数据。本发明通过构造双分支网络提高了对异常检测的效率，该双分支网络包含两个分支：根据输入帧预测未来帧的预测分支和提取紧凑且分散的正常模式特征的记忆分支。如图1所示，本发明提供了一种基于双分支网络的视频异常检测方法，其实现方法如下：

本实施例中，将正常视频的连续t帧I＝{I₁,I₂,...,I_t}作为两个分支的输入来进行模型训练，其中，I_t表示第t帧正常视频帧。

本实施例中，首先对视频帧做预处理操作，包括将每一帧的尺寸大小调整为256×256、像素值大小调整到[-1,1]的范围。

本实施例中，训练集只包含正常样本数据，测试集为有标签的样本(包含正常与异常数据)。

S2、通过所述记忆分支利用3D卷积神经网络学习正常视频流的特征信息，并计算得到特征分离损失和特征紧凑损失，其实现方法如下：

S202、基于所述记忆分支，初始化s个记忆向量为

本实施例中，步骤S2包含四个子步骤，其一为特征提取；其二为获取记忆；其三为空间对称；其四为计算特征紧凑损失和特征分离损失：

第一，3D卷积神经网络使用6个3D卷积操作对连续t帧I＝{I₁,I₂,...,I_t}进行特征提取，得到的时空特征为

局部特征z_l ^M∈R^c被用来作为寻址特征。

第二，初始化s个记忆项为

其中，m_i∈R^c表示一个记忆项。寻址向量

用于寻址记忆M，寻址向量通过式(1)可获得。在式(1) 式中exp(.)/∑exp(.)表示softmax函数，将寻址向量与记忆项矩阵进行相乘得到新的记忆特征F^mem，如式(2)和(3)。

其中，F^mem表示记忆特征，f_l ^mem表示局部记忆特征，w'表示记忆特征的宽度，h'表示记忆特征的高度，l表示局部记忆特征的数量，R^'w'×h'×c'表示记忆特征的尺寸，a_l-i表示局部特征z_l ^M与第i个记忆向量间的寻址向量，m_i表示记忆向量M中的第i个记忆向量，(m_i)^T表示m_i的转置，c表示记忆特征通道数。

第三，为了使记忆特征能在预测分支上使用，利用两层的反卷积操作处理第二步骤的记忆特征

第四，计算记忆项与寻址特征之间的特征分离损失L_separate与特征紧凑损失L_compact。特性紧凑损失鼓励查询接近记忆中最近的项，从而减少类内变化。使用特征紧凑损失训练我们的模型只会使所有记忆项相似，因此所有查询都紧密地映射在记忆空间中，失去了记录各种正常模式的能力。在式(4)中的特征紧凑损失使得所有查询和内存项彼此接近，从而导致所有记忆项都相似。然而，记忆项应该彼此足够远，以考虑正常数据的各种模式。为了在获得紧凑的特征表示时防止此问题，本发明提出了一种特征分离损失。

其中p由式(5)获得。

本发明利用n表示查询z_l ^M的第二个最近记忆项的索引：

其中，L_compact表示特征分离损失，m_p表示与局部特征最接近的记忆向量，p 表示与局部特征最接近的记忆向量的索引，L_separate表示特征紧凑损失，m_n与局部特征接近的记忆向量，α表示一个大于0的常数，n表示与局部特征接近的记忆向量的索引。

S3、通过所述预测分支利用2D卷积神经网络提取视频帧的外观特征，并根据外观特征，利用ConvLSTM提取上下文信息得到细胞状态和隐藏状态，其实现方法如下：

S4、根据步骤S2学习的正常视频流的特征信息，以及步骤S3得到的细胞状态和隐藏状态生成新的正常视频特征，并根据所述新的正常视频特征利用解码器生成未来帧，其实现方法如下：

S401、将所述细胞状态C_t和新的记忆特征

沿通道维度进行拼接，得到基于通道的注意力A_t ^mem；

S402、根据所述注意力A_t ^mem和新的记忆特征

计算得到通道优化后的记忆特征

S403、将记忆特征

S404、根据新的正常视频特征利用解码器生成未来帧。

本实施例中，预测分支的任务可以表述为如下：目标是优化预测函数F，使生成的下一帧

对于给定的前一个序列I，与实际的下一帧I_t+1相似。图2显示了在推断阶段提出的视频异常检测的总体框架。输入序列通过两条路径来预测未来的帧，一个(图2的下方路径)用于获取正常模式紧凑且分离的记忆特征，另一个(图2的上方路径)用于使用记忆特征反复预测帧：由图可知，记忆分支首先利用运动编码器对输入序列进行编码得到时空特征Z^M，然后基于记忆M 与时空特征Z^M生成记忆特征F^mem；预测分支首先利用空间编码器对输入序列的每一帧进行编码得到外观特征，然后外观特征被传送至ConvLSTM网络以此提取输入流的时间特征，细胞状态C_t与记忆特征沿着通道方向拼接，拼接后的特征经过全连接层得到注意力权重，注意力权重与记忆特征相乘得到优化后的记忆特征，最后将优化后的记忆特征与隐藏状态H_t沿着通道方向拼接，拼接后的特征传送到解码器以此预测未来帧。

第一，输入序列的每一帧独立地馈送到具有2D卷积的空间编码器E_sp，以提取外观特征。

第二，ConvLSTM网络以时间步长顺序接收每个提取的空间特征f_t ^sp＝E_sp(I_t) 作为输入，从ConvLSTM的循环处理中获得细胞状态C_t∈R^h,w,c和隐藏状态 H_t∈R^h,w,c，其中，f_t ^sp表示第t帧的编码特征，I_t表示第t帧正常帧，E_sp(g)表示编码函数，R^h,w,c表示尺寸为(h,w,c)的三维立方体。

第三，由于细胞状态C_t包含输入序列从过去到现在的信息，因此本发明使用细胞状态C_t细化记忆特征

以便在当前步骤嵌入所需的运动上下文。细胞状态C_t和记忆特征

沿着通道维度进行拼接，拼接后的特征经过完全连接层来得到基于通道的注意力A_t ^mem。通道优化后的记忆特征由式(8)得到，其中

表示对应位置相乘。

第四，优化后的记忆特征

与H_t沿着通道方向拼接，拼接后的新特征作为解码器的输入来预测t+1帧。

模型的损失函数的表达式如下：

L＝L_pre+λ_cL_compact+λ_sL_separate

本实施例中，用预测误差来刻画预测出的未来帧

和它的真实的未来帧I_t+1之间的均方误差，本发明使用峰值信号来刻画：

最终的正常得分由预测误差进行归一化后得到：

其中，

表示

与I_t+1间的峰值信噪比，log₁₀表示以10为底的对数函数，

表示

的最大像素值，I_t+1表示真实的第t+1帧，

表示预测的第t+1帧，N表示一帧中的像素总数，S(t+1)表示正常得分，P(g)表示计算峰值信号函数，

表示一段测试视频中最小的峰值信噪比，

表示预测的第 t帧，I_t表示真实的第t帧，

表示一段测试视频中最大的峰值信噪比。

下面对本发明作进一步地说明。

本发明所述的一种基于多尺度视频异常检测方法，如图2所示，本发明框架主要分为三个部分：(a)记忆分支生成紧凑、分散的记忆向量，然后形成记忆特征，提升网络对正常帧的预测能力，削弱网络对异常帧的预测能力；(b) 预测分支首先提取时空特征，综合该特征与记忆特征形成新的正常模式特征，最后基于该特征预测未来帧；(c)综合未来帧的均方预测损失和记忆模块的特征分离损失、特征紧凑损失来训练该网络。具体步骤分别阐述如下：

(1)利用3D卷积神经网络时空特征提取器将相邻多帧作为输入，提取低维度的时空特征Z^M，然后利用记忆模块生成记忆向量M并作为本发明设计的整个网络模型的参数参与到网络更新过程中，最后利用记忆向量生成记忆特征 F^mem。

(2)利用2D卷积神经网络外观特征提取器将相邻多帧作为输入，提取低维度的时空特征，将每一帧的外观特征输送至四层ConvLSTM网络中，提取帧之间的上下文信息以获得细胞状态C_t和隐藏状态H_t，并沿着通道方向拼接细胞状态C_t与记忆特征F^mem，基于这个拼接后的新特征利用线性层得到注意力权重 A_t ^mem，将注意力权重A_t ^mem与记忆特征

相乘得到新的记忆特征

再将新的记忆特征

与隐藏状态H_t沿着通道方向拼接作为解码器的输入完成帧的预测功能。

本实施例中，本发明提出的方法在三个公开数据集上与目前最前沿的视频异常检测算法进行比较。UCSD Ped1数据集由34段正常训练视频样本和36段测试视频样本组成，其异常事件包括滑滑板、骑自行车等；UCSD Ped2数据集由16段正常训练视频样本和12段测试视频样本组成，其异常事件包括骑自行车、车辆行驶等；CUHK Avenue数据集由16段正常训练视频样本和21段测试视频样本组成，其异常事件包括抛物体、奔跑等，训练集只包含正常行为，测试集中的某一帧可能存在或不存在异常行为。

本实施例中，本发明在帧级别使用AUC(曲线下面积)作为评估指标。受试者工作曲线(Receiver Operating Characteristic,ROC)下面积的累积结果为AUC 值。较高的AUC值表示更好的异常检测性能。当出现异常模式(如车辆入侵) 时，视频帧的常规分数降低，正常得分S(t+1)值越高，代表解码器所预测的图片质量越好，其预测帧的值越接近于地面真实值，表明该帧更可能为正常事件，否则视为异常事件。正常得分S(t+1)越高、AUC的值将越高，整体比较效果如表1所示。AUC值越大，则模型性能越好。具体的ROC曲线图如图3-5。图3 为本发明在UCSD Ped1数据集上的实验结果，由图可知，ROC曲线下的面积大于0.5，也即该模型在UCSD Ped1数据集上具有分类效果。图4为本发明在UCSD Ped2数据集上的实验结果，由图可知，ROC曲线下的面积大于0.5，也即该模型在UCSD Ped2数据集上具有分类效果。图5为本发明在Avenue数据集上的实验结果，由图可知，ROC曲线下的面积大于0.5，也即该模型在Avenue数据集上具有分类效果。由此可见，本发明所提出的基于双分支的视频异常检测算法优于现在的方法，特别在UCSD Ped2数据集上，本发明的算法的AUC分数高达95.3％，与其他方法相比有明显提高，证明了利用记忆分支提取正常模式的多种多样的紧凑且分散的特征的有效性。

表1

实施例2

如图6所示，本发明提供了一种基于双分支网络的视频异常检测系统，包括：

如图6所示实施例提供的一种基于双分支网络的视频异常检测系统可以执行上述方法实施例一种基于双分支网络的视频异常检测方法所示的技术方案，其实现原理与有益效果类似，此处不再赘述。

本实施例中，本申请可以根据一种基于双分支网络的视频异常检测方法进行功能单元的划分，例如可以将各个功能划分为各个功能单元，也可以将两个或两个以上的功能集成在一个处理单元中。上述集成单元即可以采用硬件的形式来实现，也可以采用软件功能单元的形式来实现。需要说明的是，本发明中对单元的划分是示意性的，仅仅为一种逻辑划分，实际实现时可以有另外的划分方式。

本实施例中，一种基于双分支网络的视频异常检测系统为了实现一种基于双分支网络的视频异常检测方法的原理与有益效果，其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到，结合本发明所公开的实施例描述的各示意单元及算法步骤，本发明能够以硬件和/或硬件和计算机软件结合的形式来实现，某个功能以硬件还是计算机软件驱动的方式来执行，取决于技术方案的特定应用和设计约束条件，可以对每个特定的应用来使用不同的方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

本实施例中，本发明为了提取视频流的时间上下文信息以及提升异常检测的精度，采用堆叠的ConvLSTM网络作为预测分支和3D卷积网络作为记忆分支的双分支网络，解决了深度网络泛化能力过强而导致的预测的异常帧与其真值之间的误差较小的问题。

以上所述仅为本发明的较佳实施例而已，并不会限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于双分支网络的视频异常检测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于双分支网络的视频异常检测方法，其特征在于，所述步骤S2包括以下步骤：

S202、基于所述记忆分支，初始化s个记忆向量为

3.根据权利要求2所述的基于双分支网络的视频异常检测方法，其特征在于，所述步骤S202中记忆特征F^mem的表达式如下：

其中，F^mem表示记忆特征，f_l ^mem表示局部记忆特征，w'表示记忆特征的宽度，h'表示记忆特征的高度，l表示局部记忆特征的数量，R'^w'×h'^×c'表示记忆特征的尺寸，a_l-i表示局部特征z_l ^M与第i个记忆向量间的寻址向量，m_i表示记忆向量M中的第i个记忆向量，(m_i)^T表示m_i的转置，c表示记忆特征通道数。

4.根据权利要求3所述的基于双分支网络的视频异常检测方法，其特征在于，所述步骤S204中特征分离损失的表达式如下：