WO2023142550A1

WO2023142550A1 - 异常事件检测方法及装置、计算机设备、存储介质、计算机程序、计算机程序产品

Info

Publication number: WO2023142550A1
Application number: PCT/CN2022/127087
Authority: WO
Inventors: 李国球; 蔡官熊; 曾星宇; 赵瑞
Original assignee: 上海商汤智能科技有限公司
Priority date: 2022-01-27
Filing date: 2022-10-24
Publication date: 2023-08-03
Also published as: CN114511810A

Abstract

本公开是关于一种异常事件检测方法及装置、计算机设备、存储介质、计算机程序、计算机程序产品。该方法包括：获取至少两个图像序列；其中，每一所述图像序列中包括至少一帧图像；对每一所述图像序列进行至少两种尺度的划分，得到同一尺度下所有图像帧中同一位置的图像块组成的图像块集合；基于各所述图像序列的图像块集合，确定各所述图像序列之间的相关性特征；根据各所述图像序列之间的相关性特征，在所述至少两个图像序列中确定出存在异常事件的目标图像序列。通过该方法，能提升异常事件检测的准确性。

Description

异常事件检测方法及装置、计算机设备、存储介质、计算机程序、计算机程序产品

相关申请的交叉引用

本公开实施例基于申请号为202210103096.9、申请日为2022年01月27日、申请名称为“异常事件检测方法及装置、计算机设备、存储介质”的中国专利申请提出，并要求该中国专利申请的优先权，该中国专利申请的全部内容在此引入本公开作为参考。

技术领域

本公开涉及计算机视觉技术领域，尤其涉及一种异常事件检测方法及装置、计算机设备、存储介质、计算机程序、计算机程序产品。

背景技术

视频异常检测方法旨在捕捉视频中的异常事件并确定其发生的时间区间，异常事件指不符合预期的、极少出现的行为。如何提升异常事件检测的准确性，一直以来备受关注。

发明内容

本公开提供一种异常事件检测方法及装置、计算机设备、存储介质、计算机程序、计算机程序产品。

本公开实施例提供一种异常事件检测方法，包括：获取至少两个图像序列；其中，每一所述图像序列中包括至少一帧图像；对每一所述图像序列进行至少两种尺度的划分，得到同一尺度下所有图像帧中同一位置的图像块组成的图像块集合；基于各所述图像序列的图像块集合，确定各所述图像序列之间的相关性特征；根据各所述图像序列之间的相关性特征，在所述至少两个图像序列中确定出存在异常事件的目标图像序列。

本公开实施例提供一种异常事件检测装置，包括：获取模块，配置为获取至少两个图像序列；其中，每一所述图像序列中包括至少一帧图像；划分模块，配置为对每一所述图像序列进行至少两种尺度的划分，得到同一尺度下所有图像帧中同一位置的图像块组成的图像块集合；第一确定模块，配置为基于各所述图像序列的图像块集合，确定各所述图像序列之间的相关性特征；第二确定模块，配置为根据各所述图像序列之间的相关性特征，在所述至少两个图像序列中确定出存在异常事件的目标图像序列。

本公开实施例提供一种计算机设备，包括：处理器；用于存储处理器可执行指令的存储器；其中，所述处理器被配置为执行如上述第一方面中所述的异常事件检测方法。

本公开实施例提供一种存储介质，包括：当所述存储介质中的指令由设备的处理器执行时，使得设备能够执行如上述第一方面中所述的异常事件检测方法。

本公开实施例提供一种计算机程序，所述计算机程序包括计算机可读代码，在所述计算机可读代码被计算机读取并执行的情况下，实现本公开任一实施例中的方法的部分或全部步骤。

本公开实施例提供一种计算机程序产品，所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，所述计算机程序被计算机读取并执行时，实现本公开任一实施例中的方法的部分或全部步骤。

本公开的实施例提供的技术方案可以包括以下有益效果：

在本公开的实施例中，考虑到一些异常事件发生在图像帧中很小的区域，而有些异常事件可能贯穿了整个画面，因而直接将图像帧作为整体或者进行单一尺度的区域划分均无法应对各种异常事件，因而本公开针对各图像序列中的每帧图像进行多尺度的划分，能提升异常事件检测中尺度的鲁棒性。此外，本公开基于各图像序列的图像块集合，确定图像序列之间的相关性特征，使得异常事件检测装置能在多尺度基础上结合图像序列之间的关联性，提升对异常事件的检测精度。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

图1为本公开实施例示出的一种异常事件检测方法流程图一；

图2为本公开实施例示出的一种尺度划分的示例图；

图3为本公开实施例示出的一种异常事件检测方法流程图二；

图4为本公开实施例中基于第一拼接特征获得第一特征的原理示例图；

图5为本公开实施例中一种特征融合的原理示例图；

图6为本公开实施例中一种异常事件检测方法流程图三；

图7为本公开实施例中一种异常事件检测方法流程图四；

图8A为本公开实施例示出的一种异常事件检测方法原理图；

图8B为本公开实施例示出的图8A中部分模块的处理过程示意图；

图9为本公开实施例示出的一种异常事件检测装置图；

图10为本公开实施例中计算机设备的一种硬件实体示意图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

本公开实施例提供的异常事件检测方法，其执行主体可以是异常事件检测装置，例如，异常事件检测方法可以由终端设备或服务器或其它电子设备执行，其中，终端设备可以为用户设备(User Equipment，UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字处理(Personal Digital Assistant，PDA)、手持设备、计算设备、车载设备、可穿戴设备等。在一些可能的实现方式中，异常事件检测方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。

在本公开的实施例中，异常事件检测装置可以包括图像采集组件，从而利用图像采集组件采集某一场景的连续帧图像，并划分得到至少两个图像序列。例如，图像采集组件是摄像头，可采集某一固定位置的视频，包括该摄像头的异常事件检测装置可在时间维度上将该视频划分为至少两个图像序列，一个图像序列可称之为一个视频片段，不同视频片段之间所包括的图像帧可不重叠。此外，异常事件检测装置也可以不包括图像采集组件，异常事件检测装置可接收传输的已划分好的至少两个图像序列；或者，通过独立设置的位于不同角度的摄像头采集同一场景的多个视频后，传输至异常事件检测装置，异常事件检测装置接收到的一个视频即可称之为一个图像序列。本公开实施例中，一个图像序列可以是一个时间窗口内的序列，即图像序列中的各图像帧在时间上相邻。

需要说明的是，本公开实施例中，图像序列的获取方式，以及图像序列中所包括的至少一帧图像的内容，可以根据实际需求和应用场景确定，本公开实施例不作限定。

图1为本公开实施例示出的一种异常事件检测方法流程图一，如图1所示，异常事件检测方法包括以下步骤：

S11、获取至少两个图像序列；其中，每一所述图像序列中包括至少一帧图像；

S12、对每一所述图像序列进行至少两种尺度的划分，得到同一尺度下所有图像帧中同一位置的图像块组成的图像块集合；

S13、基于各所述图像序列的图像块集合，确定各所述图像序列之间的相关性特征；

S14、根据各所述图像序列之间的相关性特征，在所述至少两个图像序列中确定出存在异常事件的目标图像序列。

本公式实施例中，异常事件检测装置获取至少两个图像序列后，针对每一图像序列进行至少两种尺度的划分，是指对图像序列所包括的每一帧图像进行至少两种尺度的划分。对图像序列进行多尺度划分后，同一尺度下所有图像帧中同一位置的图像块组成的图像块集合。

示例性的，异常事件检测装置将视频V划分为不重叠的T个图像序列

针对各图像序列，对每一帧图像利用R组不同的滑动窗口尺寸

进行划分。图2为本公开实施例示出的一种尺度划分的示例图，如图2所示，某一图像序列进行了3种尺度(R＝3)的划分，划分后每帧图像中对应的图像块数量分别为L21标识的1个、L22标识的6个和L23标识的15个。本公开的实施例中，将图像序列的不同图像帧中同位置的图像块作为整体形成一个图像块集合，即图2中所示的一个小立方体。图示的

中包括一个立方体，即该尺度下对应一个图像块集合；

中包括6个立方体，即该尺度下对应6个图像块集合；

中包括15个立方体，即该尺度下对应15个图像块集合。

本公开实施例中，同一尺度的图像块集合可表示为

其中，N _r为尺度对应的图像块集合的数量。如图2所示，第一种尺度的划分N _r为1；第二种尺度的划分N _r为6；第三种尺度的划分N _r为15。

需要说明的是，本公开的实施例中，对图像序列中每一帧图像进行对应尺度的划分时，同一尺度对应的图像块的尺寸相同。此外，在利用滑动窗口将每一帧图像分割成互不重叠的图像块时，每一帧图像在对应尺度下的图像块的数量，可以为对每帧图像的尺寸与滑动窗口的尺寸的比值进行向下取整后的结果，即本公开在做图像块划分时，当帧图像的尺寸与滑动窗口的尺寸无法整除时，不会额外通过例如补“0”或补“1”的方式获得图像块，本公开中每个图像块的内容均属于划分前的帧图像中的内容。

本步骤S13中，异常事件检测装置得到各图像序列的图像块集合后，即可获得可表征每一图像序列的特征，再基于表征图像序列的特征，获得图像序列之间的相关性特征。

在一种实施例中，基于图像序列的各图像块集合，获得可表征图像序列的特征时，例如，可直接将不同尺度的多个图像块集合中各图像块的特征拼接后作为图像序列的特征。如前述示例，每个图像序列共包括3帧图像，每帧图像均包括3种尺度的图像块集合，假设每个图像块对应一个特征，则该图像序列的特征数量为：每帧图像多尺度划分后的图像块个数*图像帧数，即(1+6+15)*3共66个特征。在该实施例中，若至少两个图像序列是对同一视频在时间维度上划分获得的，则基于各图像序列的特征获得的图像序列之间的相关性特征，可称之为时间相关性特征。

在另一种实施例中，基于图像序列的各图像块集合，获得可表征图像序列的特征时，例如可针对同一尺度的不同图像块集合，确定不同图像块集合之间的相关性特征，再基于同一尺度的不同图像块集合之间的相关性特征获得图像序列的特征。或者针对每帧图像，先获得图像块之间的相关性特征，再基于图像块之间的相关性特征获得图像序列的特征。

可以理解的是，由于图像块带有位置属性，则无论是同一尺度的不同图像块集合之间的相关性特征，还是一帧图像内的多个图像块之间的相关性特征，都带有空间属性，该相关性特征可表征为空间上的相关性。在本公开的实施例中，若至少两个图像序列是对同一视频在时间维度上划分获得，则基于各图像序列的特征获得的图像序列之间的相关性特征，可称之为时空相关性特征。

当然，若本公开实施例中至少两个图像序列是同一场景的不同角度的图像序列，则至少两个图像序列之间的相关性特征可理解为空间相关性特征。此外，若先获得同一尺度的不同图像块集合之间的相关性特征，或一帧图像的多个图像块之间的相关性特征，再基于该相关性特征获得各图像序列的相关性特征，则该图像序列的相关性特征可理解为包括局部空间相关性以及全局空间相关性的特征。其中，局部空间相关性关联图像块的位置属性，全局空间相关性关联图像序列的获取角度属性。

需要说明的是，图像序列之间的相关性特征，用于表征图像序列之间的关联关系，例如可以包括对各图像序列的特征利用不同权重进行加权处理后的特征，通过权重的分配体现不同图像序列之间的关联关系。此外，图像序列的相关性特征，还可以包括针对任一图像序列的特征，融合其他图像序列的部分特征，即图像序列之间的关联关系通过特征融合来体现。需要说明的是，本公开对相关性特征的获取方式不做限制。

在本公开的实施例中，若有T个图像序列，图像序列之间的相关性特征用φ _ST表示，则φ _ST中包括T个图像序列所对应的特征，只是各图像序列对应的特征均基于其他图像序列的特征进行了相关性处理。

在步骤S14中，异常事件检测装置在获得各图像序列之间的相关性特征后，即可根据该相关性特征，例如采用传统的特征识别方法或已训练好的模型在至少两个图像序列中确定出存在异常事件的目标图像序列。

可以理解的是，在本公开的实施例中，考虑到一些异常事件发生在图像帧中很小的区域，而有些异常事件可能贯穿了整个画面，因而直接将图像帧作为整体或者进行单一尺度的区域划分均无法应对各种异常事件，因而本公开针对各图像序列中的每帧图像进行多尺度的划分，能提升异常事件检测中尺度的鲁棒性。此外，本公开基于各图像序列的图像块集合，确定图像序列之间的相关性特征，例如前述的通过权重分配获得时间或空间，再或者是时空上的关联性，使得异常事件检测装置能在多尺度基础上结合图像序列之间的关联性，提升对异常事件的检测精度。

图3为本公开实施例示出的一种异常事件检测方法流程图二，如图3所示，图1中的步骤S13可包括如下步骤：

S13a、针对每一所述图像序列，基于同一尺度下的各图像块集合，获得尺度对应的第一特征；其中，所述第一特征中包括同一尺度的各图像块集合之间的相关性；

S13b、将同一所述图像序列中各尺度对应的所述第一特征融合，得到每一所述图像序列的第二特征；

S13c、基于各所述图像序列的所述第二特征，确定各所述图像序列之间的所述相关性特征。

在步骤S13a中，在确定尺度对应的图像块集合后，即可获得包括同尺度的各图像块集合之间的相关性的第一特征，如获得图2所示的

中每个小立方体块的之间的相关性特征。可以理解的是，由于图像块集合中的图像块带有位置属性，则各图像块集合也带有位置属性，因而获得的第一特征是包括图像块集合之间的空间相关性的特征。

示例性的，若异常事件检测装置进行了R组的尺度划分，第一特征用

表示，则异常事件检测装置获得的尺度对应的第一特征

共有R组。

在步骤S13b中，将同一图像序列中各尺度对应的第一特征融合，得到每一图像序列的第二特征，若有T个图像序列，第二特征用φ′ _t表示，则异常事件检测装置得到T组φ′ _t。

在步骤S13c中，基于各图像序列的第二特征，确定各图像序列之间的相关性特征，由于第一特征是包括图像块集合之间的空间相关性特征，若至少两个图像序列是同一视频不同时间段的图像序列，则在该步骤获得的图像序列之间的相关性特征可以是时空相关性特征。此外，同前述分析，若至少两个图像序列是同一场景的不同角度的图像序列，则图像序列之间的相关性特征也可以是包括局部空间相关性以及全局空间相关性的特征。

可以理解的是，在本公开的实施例中，以图像序列的所有帧图像中同一位置的图像块组成的图像块集合作为处理单元来获得第一特征，而不关注于每一帧图像的一个图像块，那么在基于第一特征进一步获得图像序列之间的相关性特征时能相对减少计算量；且获得的各图像块集合之间的相关性特征包括了多维度的相关性特征，因而能提升异常事件检测的精准度。

在一种实施例中，所述基于同一尺度下的各图像块集合，获得尺度对应的第一特征，包括：

对同一尺度下的各所述图像块集合做特征提取，获得所述图像块集合对应的特征；

将同一尺度的所述图像块集合的特征进行拼接，获得尺度对应的第一拼接特征；

基于所述尺度对应的第一拼接特征，利用自注意力机制和卷积处理构建所述第一拼接特征所表征的同一尺度的图像块集合之间的关联关系，获得所述尺度对应的第一特征。

在该实施例中，以图像块集合为整体获得图像块集合的特征，然后将同一尺度的图像块集合的特征进行拼接，获得尺度对应的第一拼接特征。

在将同一尺度的图像块集合的特征进行拼接时，可将图像块集合作为整体进行水平拼接。示例性的，若经过特征提取后，每个图像块集合对应的特征的维度是D维，第一拼接特征用

表示，则

的维度是：同一尺度的图像块集合的数量*D，即N _r*D。

在一种实施例中，所述对同一尺度下的各所述图像块集合做特征提取，获得所述图像块集合对应的特征，包括：

对同一尺度下的各所述图像块集合做特征提取，获得所述图像块集合对应的包括所述图像块集合中各图像块之间的时序信息的特征。

如前所述的，图像序列中的各图像帧在时间上相邻，即图像序列内图像帧之间有时序信息，因而图像集合中的各图像块之间也有时序信息。在该实施例中，在对图像块集合做特征提取时，可获得包括图像块集合中各图像块之间的时序信息的特征。

示例性的，本公开可利用预设I3D特征编码器对同一尺度下的各图像块集合做特征提取，以获得包括图像块集合中各图像块之间的时序信息在内的特征。可以理解的是，由于I3D特征编码器的网络结构较深，且使用的是3维卷积核，而图像块集合又是包含了时序信息，因而利用3维卷积核能将图像块集合的时序信息包含进来，使得特征提取更完备。

本公开实施例中，在获得尺度对应的第一拼接特征后，即可构建第一拼接特征所表征的同一尺度的图像块集合之间的关联关系，从而得到尺度对应的第一特征。

需要说明的是，在本公开的实施例中，如前所述的，尺度对应的第一特征可用

表示，那么得到的尺度对应的第一特征的维度与第一拼接特征的维度相同，只是第一特征中包括了同一尺度的图像序列之间的相关性，

的维度也可以是N _r*D。

可以理解的是，本公开通过自注意力机制以及卷积处理构建第一拼接特征所表征的同一尺度的图像块集合之间的关联关系，基于机器视觉理论，能使得获得的第一特征具有较好的增强效果，例如有选择地突出同一尺度的各图像块集合中感兴趣的部分(即可能存在异常的部分)，从而能进一步提升异常事件的检测效果。

在一种实施例中，所述基于所述尺度对应的第一拼接特征，利用自注意力机制和卷积处理构建所述第一拼接特征所表征的同一尺度的图像块集合之间的关联关系，获得所述尺度对应的第一特征，包括：

基于所述自注意力机制以及所述第一拼接特征，确定权重矩阵；其中，所述权重矩阵中包括：表征同一尺度的各所述图像块集合存在异常的概率的权重值；

基于所述权重矩阵以及所述第一拼接特征，获得加权后的特征；

对所述第一拼接特征进行卷积处理，获得卷积后的特征；

基于所述加权后的特征、卷积后的特征以及所述第一拼接特征，获得所述第一特征。

在该实施例中，先基于自注意力机制确定权重矩阵，权重矩阵中的权重值表征的是同一尺度的各图像块集合存在异常的概率，若权重值越大，则说明该图像块集合存在异常的概率越大。

该实施例中，还对第一拼接特征进行卷积处理，例如采用非空洞卷积或空洞卷积的方式对第一拼接特征进行处理。在对第一拼接特征进行卷积处理时，因第一拼接特征中包括了同一尺度的各图像块集合的特征，因而也可通过卷积核的卷积操作，关联多个图像块集合的特征。

在一种实施例中，所述对所述第一拼接特征进行卷积处理，获得卷积后的特征，包括：

利用至少二个空洞卷积核分别对所述第一拼接特征进行卷积，获得各所述空洞卷积核对应的卷积结果；其中，至少二个所述空洞卷积核的空洞率不同；

将各所述空洞卷积核对应的卷积结果进行拼接，获得所述卷积后的特征。

在该实施例中，采用空洞卷积的方式对第一拼接特征进行处理，例如，至少二个空洞卷积核包括三个，每个空洞卷积核均为一维卷积核，空洞率分别为1、2和4。若第一拼接特征

的维度是N _r*D，则利用三个空洞卷积核进行处理后的，每个空洞卷积核对应的卷积结果的维度可以是N _r*D/4，将各空洞卷积核对应的卷积结果进行拼接后获得的卷积后的特征为N _r*3D/4。

本公开实施例中，卷积后的结果可用

*∈{DC1,DC2,DC3}表示，其中，DC1、DC2和DC3分别为空洞卷积核对应的卷积结果。

当然，本公开并不限定于上述3个一维空洞卷积核，因最终加权后的特征、卷积后的特征以及第一拼接特征需共同配合形成第一特征，因此可根据实际需要设置空洞卷积核的个数、尺寸以及对应的空洞率。

可以理解的是，由于空洞卷积能扩大感受野，且多个带有不同空洞率的空洞卷积核叠加时，不同的感受野会带来多尺度信息，因而经过多个空洞卷积核进行卷积，并将卷积结果进行拼接后获得的空洞卷积后的特征使得第一拼接特征得到增强。

在一种实施例中，所述基于所述自注意力机制以及所述第一拼接特征，确定权重矩阵，包括：

对所述第一拼接特征进行降维处理，获得降维后的第一拼接特征；

对所述降维后的第一拼接特征利用预设第一卷积核进行卷积，获得第一卷积结果；

对所述降维后的第一拼接特征利用预设第二卷积核进行卷积，获得第二卷积结果；

将所述第一卷积结果和所述第二卷积结果的转置相乘后的结果利用所述自注意力机制，确定所述权重矩阵。

在本公开的实施例中，首先对第一拼接特征进行降维处理，以减少后续计算量。示例性的，可通过一维卷积矩阵进行降维。示例性的，降维后的第一拼接特征可以用

表示，维度为N _r*D/4。当然，本公开并不限定于将每一图像块集合的特征维度降为原特征维度的1/4。

本公开实施例中，自注意力机制基于预测同一尺度中任一图像块集合与其他图像块集合之间的协方差，将每个图像块集合视为随机变量，获得的权重矩阵中的权值是每个图像块集合与所有图像块集合的相关。

在该实施例中，预设第一卷积核和预设第二卷积核可均为一维卷积核，利用预设第一卷积核和预设第二卷积核对降维后的第一拼接特征做卷积，获得的第一卷积结果和第二卷积结果，可均为一维向量。第一卷积结果和第二卷积结果的转置的乘积，经自注意力机制的归一化指数函数(softmax)获得的注意力图即权重矩阵，该权重矩阵实质是协方差矩阵。

示例性的，若第一卷积结果的维度是N _r*D/4，第二卷积结果的维度是D/4*N _r，则权重矩阵的维度是N _r*N _r。

在一种实施例中，所述基于所述权重矩阵以及所述第一拼接特征，获得加权后的特征，包括：

利用预设第三卷积核对所述降维后的第一拼接特征进行卷积，获得第三卷积结果；

将所述权重矩阵和所述第三卷积结果相乘，获得加权矩阵；

将所述加权矩阵和预设第四卷积核进行卷积后的结果，与所述降维后的第一拼接特征的和值，确定为所述加权后的特征。

在该实施例中，预设第三卷积核和预设第四卷积核也可以是一维卷积核，利用预设第三卷积核对降维后的第一拼接特征进行卷积后的第三卷积结果与权重矩阵相乘，获得的加权矩阵中的每一项都是降维后的第一拼接特征中图像块集合的加权和，权重是降维后的第一拼接特征中所包括的同一尺度的各图像块集合之间的协方差。

示例性的，第三卷积结果的维度可以为N _r*D/4，加权矩阵的维度为N _r*D/4，加权后的特征的维度可以为N _r*D/4。

本公开的实施例中，将加权矩阵与预设第四卷积和进行卷积后的结果，与降维后的第一拼接特征加和，即进行残差连接，获得的加权后的特征对各图像块集合的表征能力更强。

本公开中，上述获得权重矩阵以及加权后的特征的过程可通过如下公式(1)和(2)来表示：

上述公式(1)和(2)中，W _θ为预设第一卷积核，

为预设第二卷积核，W _g为预设第三卷积核，W _z为预设第四卷积核，

是降维后的第一拼接特征。softmax部分得到的即是权重矩阵，

即为加权矩阵，

即为加权后的特征。

在一种实施例中，所述基于所述加权后的特征、卷积后的特征以及所述第一拼接特征，获得所述第一特征，包括：

将所述加权后的特征与所述卷积后的特征拼接后，与所述第一拼接特征加和，获得所述第一特征。

在该实施例中，第一特征可通过如下公式(3)表示：

其中，

即为加权后的特征，

为卷积后的结果，

为第一拼接特征，

为第一特征，维度是N _r*D。

图4为本公开实施例中基于第一拼接特征获得第一特征的原理示例图，如图4所示，右侧L41所标识的分支为基于自注意力机制和第一拼接特征

确定权重矩阵M，再基于权重矩阵M和第一拼接特征

获得加权后的特征

的过程；左侧L42所标识的分支为基于空洞卷积对第一拼接特征

进行处理获得卷积后的特征N _r*3D/4的过程，将加权后的特征

与卷积后的特征N _r*3D/4拼接后，与第一拼接特征

加和，即获得图4所示的第一特征

上述过程可参照前述描述。

在一种实施例中，所述将同一所述图像序列中各尺度对应的所述第一特征融合，得到每一所述图像序列的第二特征，包括：

将同一尺度的所述第一特征，按各所述图像块集合的位置关系进行重构，获得尺度对应的重构特征；

将所述尺度对应的重构特征利用预设第五卷积核卷积后，经全连接层转化为一维特征向量；

将各尺度的所述一维特征向量累加，得到每一所述图像序列的第二特征。

在该实施例中，由于尺度对应的第一特征，是基于将同尺度的图像块集合进行拼接后获得，且尺度对应的第一特征与第一拼接特征的维度相同，可将第一特征理解为同尺度的图像块集合的相关性特征水平拼接后的结果。由于图像块集合中所包括的图像块是带有位置属性的，因而本公开可按各图像块集合中图像块的位置关系进行重构，获得尺度对应的重构特征，可以理解的而是，该重构特征是一个三维向量，在本公开的实施例中可用

来表示。该重构特征中的每一个元素表征一个图像块集合，特征维度为D维。

在基于图像块集合中图像块的位置关系重构获得重构特征后，通过预设第五卷积核和全连接层将该重构特征转化成一维特征向量，其中，预设第五卷积核可为二维卷积核，用于对重构特征进行特征降维的卷积处理，经二维卷积后的特征经全连接层后转换后的一维特征向量可用

表示，其特征维度可为D维。可以理解的是，该一维特征向量即为表征同尺度的图像块集合的特征。

由于图像序列的第二特征是通过各尺度的一维特征向量进行累加后获得的，可以理解的是，该图像序列的第二特征是融合了多尺度的特征。

图5为本公开实施例中一种特征融合的原理示例图，以一个尺度对应的第一特征为例进行说明，如图5所示，虚线框L51a所示的即为一个尺度对应的第一特征，该第一特征中包括同一尺度的各图像块集合之间的相关性。图示中的立方体L52a即表征将该第一特征按各图像块集合中图像块的位置关系进行重构后获得的重构特征。重构特征通过二维卷积层L53a和全连接层L54a后将重构特征转化为的一维特征向量。如图5所示，每一个第一特征对应一个重构特征，通过二维卷积层和全连接层将各重构特征转化为的一维特征向量后进行累加后得到L50，即图像序列对应的第二特征。其中，二维卷积层中可包括本公开的预设第五卷积核。需要说明的是，图5所示的L53a、L53b以及L53c可以是同样的二维卷积层，L54a、L54b以及L54c也可以是同样的全连接层，对此本公开实施例不做限制。

可以理解的是，本公开通过将所有尺度的图像块集合的特征融合起来，使得异常事件检测装置能对图像序列中的图像帧有一个从局部到整体的感知，因而能提升对不同尺度的异常事件的鲁棒性。

在一种实施例中，所述基于各所述图像序列的所述第二特征，确定各所述图像序列之间的所述相关性特征，包括：

将各所述图像序列的所述第二特征进行拼接，获得第二拼接特征；

基于所述第二拼接特征，构建所述第二拼接特征所表征的不同图像序列之间的关联关系，确定各所述图像序列之间的所述相关性特征。

在本公开的实施例中，可基于同一尺度的图像块集合之间相关性特征的获取方式，即尺度对应的第一特征的获取方式，确定各图像序列之间的相关性特征。

在该实施例中，可将各图像序列的第二特征进行拼接，例如按水平方式进行拼接，获得第二拼接特征，然后基于前述图4的原理，基于自注意力机制以及第二拼接特征，确定图像序列的权重矩阵，图像序列的权重矩阵中包括：表征各图像序列存在异常的概率的权重值。随后，基于图像序列的权重矩阵以及第二拼接特征，获得所有图像序列对应的加权后的特征。其中，在基于自注意力机制进行处理时，可先对第二拼接特征进行降维处理，例如利用一维卷积进行降维处理。此外，还对第二拼接特征进行卷积处理，获得所有图像序列对应的卷积后的特征，并进一步将所有图像序列对应的加权后的特征、所有图像序列对应的卷积后的特征以及第二拼接特征，确定各图像序列之间的相关性特征。

示例性的，若图像序列的第二特征用φ ^′ _t表示，则T组图像序列共有T组φ ^′ _t，将各图像序列的第二特征进行拼接获得第二拼接特征可用

表示。

上述过程可通过如下公式(4)-(6)表示：

其中，

为对第二拼接特征进行降维后的特征；W _θ、

W _g以及W _z可参考前述公式(1)和(2)中的描述，softmax部分得到的为图像序列的权重矩阵；

为所有图像序列对应的加权矩阵，

属于所有图像序列的加权后的特征；φ _*,A则是所有图像序列对应的卷积后的特征，φ _ST用于表示各图像序列之间的相关性特征。

需要说明的是，在本公开的实施例中，φ _ST的维度可以是图像序列个数*每个图像序列的特征维数，即为T*D维。

图6为本公开实施例中一种异常事件检测方法流程图三，如图3所示，图1中的步骤S14可包括如下步骤：

S14a、基于预设异常预测模型对各所述图像序列之间的相关性特征进行检测，获得各所述图像序列的预测结果；其中，所述预设异常预测模型为采用弱监督训练方法训练获得的模型；

S14b、根据各所述图像序列的预测结果，确定存在所述异常事件的所述目标图像序列。

如前所述的，可根据各图像序列之间的相关性特征，采用传统的特征识别方法或已训练好的模型在至少两个图像序列中确定出存在异常事件的目标图像序列。在该实施例中，采用的是事先训练好的通过弱监督训练方式获得的异常检测模型。

在进行弱监督训练时，需构建损失函数，损失函数用来估计模型的预测值与真实值之间的不一致程度，通常损失函数值越小，模型的鲁邦性越好。在训练过程中，可通过对损失函数的约束调整模型的参数，以训练获得较优的模型。

在本公开的实施例中，对训练样本按前述图1至图5中的描述获得训练样本的特征，然后基于获得的训练样本的特征和样本标签构建损失函数，不断修正模型的参数，以获得检测效果更好的模型。本公开实施例中，初始模型例如是卷积神经网络(Convolutional Neural Networks，CNN)模型、深度神经网络(Deep Neural Networks，DNN)模型等，此处不做限制。

在一种实施例中，所述方法还包括：

对训练样本集中的正样本和负样本，分别选取特征梯度较大的K个样本图像序列计算平均特征梯度；其中，所述K为大于1的正整数；

根据所述正样本对应的平均特征梯度，以及所述负样本对应的平均特征梯度，构建损失函数；

基于所述损失函数训练获得所述预设异常预测模型。

在本公开实施例中，训练样本集中包括正样本和负样本，其中，正样本是指样本所包括的图像序列中不存在异常事件的样本，负样本是指样本所包含的图像序列中存在异常事件的样本。一个样本可以是一个视频，视频又被划分为不同的图像序列，一个视频对应一个标签，但图像序列没有标签。本公开实施例中，可将每个视频比作成一个“包”，图像序列比作“实例”，即“包”是有标签的，但是“实例”没有标签。

本公开实施例中，对正样本和负样本，分别选取特征梯度较大的K个样本图像序列计算平均特征梯度，再基于正样本对应的平均特征梯度，以及负样本对应的平均特征梯度，构建损失函数。

假若对训练样本中一个视频所包括的T个图像序列基于前述方法获得的样本特征为

构建损失函数的方法如下：

A、从所有图像序列中挑选出特征梯度较大的前K个图像序列，按如下公式(7)计算平均特征梯度：

其中，||φ″ _t|| ₂为特征的2范数，本公开中特征梯度通过计算特征的2范数获得。

B、基于视频标签标识的异常视频φ _ST’ ⁺和正常视频φ _ST′ ^-，按如下公式(8)计算排序损失：

其中，g(φ _ST′ ⁺)为正常视频中前K个图像序列的平均特征梯度，g(φ _ST′ ^-)为异常视频中前K个图像序列的平均特征梯度。

C、将各视频所包括的前K个图像序列的特征输入到原始模型预测异常分数得到

(一个图像序列对应一个预测分数)，基于预测的异常分数以及视频对应的标签，计算交叉熵损失，如下公式(9)所示：

其中，s代表预测的异常分数，y代表视频对应的标签，例如异常视频的标签值为1，正常视频的标签值为0。

D、引入稀疏约束和时间平滑约束，确定总损失函数为如下公式(10)：

其中，λ _fm,λ ₁,λ ₂是用于平衡各项损失的因子，

表示稀疏约束，

表示时间平滑约束。

本公开可基于上述步骤构建损失函数从而预设异常检测模型。将各图像序列之间的相关性特征φ _ST输入到预设异常检测模型后，即可得到各图像序列的预测结果，例如该预测结果是预测分数，本公开将各预测分数和预设分数阈值进行比较，例如将预测分数大于预设分数阈值的图像序列确定为存在异常事件的目标图像序列。

可以理解的是，本公开利用基于弱监督训练方法获得的异常事件检测模型对图像序列的相关性特征进行处理以确定存在异常事件的目标图像序列的方式，相对于传统方法，预设异常事件检测模型的泛化能力要更好；此外，相对于通过无监督方法训练获得的模型，由于若监督训练方式有训练标签的指导，因而对异常事件检测的准确性要更优。

图7为本公开实施例中一种异常事件检测方法流程图四，如图7所示，图1中的步骤S11可包括如下步骤：

S11a、获取待检测视频；

S11b、确定所述待检测视频中相邻帧图像之间的差异值；

S11c、将所述差异值大于预设差异阈值的所述相邻帧图像中，时间靠前的图像帧确定为一个所述图像序列的尾帧，时间靠后的图像帧确定为与一个所述图像序列相邻的图像序列的首帧。

在该实施例中，至少两个图像序列来自于同一视频，即待检测视频。在基于待检测视频划分图像序列时，本公开通过聚类的方式，检测待检测视频中相邻帧图像之间的差异值，将图像帧中内容较相似的一些图像帧作为一个图像序列，通过该种方式能使得各图像序列之间的内容不重复，提高不同图像序列之间的差异性，因而能提升异常定位的准确性。

需要说明的是，本公开在确定待检测视频中相邻帧图像之间的差异值时，例如可以是将相邻两帧图像做差分来确定该差异值，但本公开并不限定该方式。此外，本公开中异常事件检测装置获取至少二个图像序列的方式也并不限定于该实施例的方式，还可以是例如基于时间将视频划分为等时长的图像序列等，此处不再详述。

图8A为本公开实施例示出的一种异常事件检测方法原理图，图8B为本公开实施例示出的图8A中部分模块的处理过程示意图。图8A中L81标识的视频片段即图像序列，共示出了3个图像序列。将每个图像序列输入多尺度补丁生成器L82后，得到的一个补丁即为本公开提及的一个图像块集合。将各补丁输入预训练特征编码器L83提取特征后，即可基于L84标识的模块进行补丁空间关系建模。如图8B所示，针对一个图像序列，将图像序列输入多尺度补丁生成器L82(共R组尺度)后，得到尺度对应的

中可包括多个图像块集合。针对尺度对应的

通过L3标识的预训练特征编码器后获得尺度对应的第一拼接特征

随后将尺度对应的第一拼接特征通过L84标识的补丁空间关系建模可获得同一尺度的各图像块集合之间的相关性，即尺度对应的第一特征，如图8B中所示的

针对各尺度对应的补丁空间关系建模后的第一特征，即可通过L85标识的补丁聚合模块将同一图像序列的不同尺度的第一特征

进行拼接，即获得图像序列对应的第二特征，也就是图8A中L86所示的T特征片段中的一个。随后，将所有图像序列的第二特征，即L86中所示的T个特征片段通过L87所标识的视频时间关系模块后获得时空建模后的特征，即本公开提及的图像序列之间的相关性特征。最后，将该相关性特征输入到预训练好的分类器L88即可得到各图像序列的预测分数，基于各图像序列的预测分数即可确定该图像序列是否存在异常事件。其中，预训练好的分类器可以是基于弱监督训练方法获得的，通过训练样本的视频级标签以及训练样本的预测分数来构建模型的损失函数，并在损失满足收敛条件时固定模型参数从而得到训练好的分类器。

图9为本公开实施例示出的一种异常事件检测装置图。参照图9，异常事件检测装置900包括：

获取模块901，配置为获取至少两个图像序列；其中，每一所述图像序列中包括至少一帧图像；

划分模块902，配置为对每一所述图像序列进行至少两种尺度的划分，得到同一尺度下所有图像帧中同一位置的图像块组成的图像块集合；

第一确定模块903，配置为基于各所述图像序列的图像块集合，确定各所述图像序列之间的相关性特征；

第二确定模块904，配置为根据各所述图像序列之间的相关性特征，在所述至少两个图像序列中确定出存在异常事件的目标图像序列。

在一些实施例中，所述第一确定模块903，配置为针对每一所述图像序列，基于同一尺度下的各图像块集合，获得尺度对应的第一特征；其中，所述第一特征中包括同一尺度的各图像块集合之间的相关性；将同一所述图像序列中各尺度对应的所述第一特征融合，得到每一所述图像序列的第二特征；基于各所述图像序列的所述第二特征，确定各所述图像序列之间的所述相关性特征。

在一些实施例中，所述第一确定模块903，配置为对同一尺度下的各所述图像块集合做特征提取，获得所述图像块集合对应的特征；将同一尺度的所述图像块集合的特征进行拼接，获得尺度对应的第一拼接特征；基于所述尺度对应的第一拼接特征，利用自注意力机制和卷积处理构建所述第一拼接特征所表征的同一尺度的图像块集合之间的关联关系，获得所述尺度对应的第一特征。

在一些实施例中，所述第一确定模块903，配置为基于所述自注意力机制以及所述第一拼接特征，确定权重矩阵；其中，所述权重矩阵中包括：表征同一尺度的各所述图像块集合存在异常的概率的权重值；基于所述权重矩阵以及所述第一拼接特征，获得加权后的特征；对所述第一拼接特征进行卷积处理，获得卷积后的特征；基于所述加权后的特征、卷积后的特征以及所述第一拼接特征，获得所述第一特征。

在一些实施例中，所述第一确定模块903，配置为对所述第一拼接特征进行降维处理，获得降维后的第一拼接特征；对所述降维后的第一拼接特征利用预设第一卷积核进行卷积，获得第一卷积结果；对所述降维后的第一拼接特征利用预设第二卷积核进行卷积，获得第二卷积结果；将所述第一卷积结果和所述第二卷积结果的转置相乘后的结果利用所述自注意力机制，确定所述权重矩阵。

在一些实施例中，所述第一确定模块903，配置为利用预设第三卷积核对所述降维后的第一拼接特征进行卷积，获得第三卷积结果；将所述权重矩阵和所述第三卷积结果相乘，获得加权矩阵；将所述加权矩阵和预设第四卷积核进行卷积后的结果，与所述降维后的第一拼接特征的和值，确定为所述加权后的特征。

在一些实施例中，所述第一确定模块903，配置为利用至少二个空洞卷积核分别对所述第一拼接特征进行卷积，获得各所述空洞卷积核对应的卷积结果；其中，至少二个所述空洞卷积核的空洞率不同；将各所述空洞卷积核对应的卷积结果进行拼接，获得所述卷积后的特征。

在一些实施例中，所述第一确定模块903，配置为将所述加权后的特征与所述卷积后的特征拼接后，与所述第一拼接特征加和，获得所述第一特征。

在一些实施例中，所述第一确定模块903，配置为对同一尺度下的各所述图像块集合做特征提取，获得所述图像块集合对应的包括所述图像块集合中各图像块之间的时序信息的特征。

在一些实施例中，所述第一确定模块903，配置为将同一尺度的所述第一特征，按各所述图像块集合的位置关系进行重构，获得尺度对应的重构特征；将所述尺度对应的重构特征利用预设第五卷积核卷积后，经全连接层转化为一维特征向量；将各尺度的所述一维特征向量累加，得到每一所述图像序列的第二特征。

在一些实施例中，所述第一确定模块903，配置为将各所述图像序列的所述第二特征进行拼接，获得第二拼接特征；基于所述第二拼接特征，基于自注意力机制以及卷积处理构建所述第二拼接特征所表征的不同图像序列之间的关联关系，确定各所述图像序列之间的所述相关性特征。

在一些实施例中，所述第二确定模块904，配置为基于预设异常预测模型对各所述图像序列之间的相关性特征进行检测，获得各所述图像序列的预测结果；其中，所述预设异常预测模型为采用弱监督训练方法训练获得的模型；根据各所述图像序列的预测结果，确定存在所述异常事件的所述目标图像序列。

在一些实施例中，所述装置还包括：计算模块905，配置为对训练样本集中的正样本和负样本，分别选取特征梯度较大的K个样本图像序列计算平均特征梯度；其中，所述K为大于1的正整数；构建模块906，配置为根据所述正样本对应的平均特征梯度，以及所述负样本对应的平均特征梯度，构建损失函数；训练模块907，配置为基于所述损失函数训练获得所述预设异常预测模型。

在一些实施例中，所述获取模块901，配置为获取待检测视频；确定所述待检测视频中相邻帧图像之间的差异值；将所述差异值大于预设差异阈值的所述相邻帧图像中，时间靠前的图像帧确定为一个所述图像序列的尾帧，时间靠后的图像帧确定为与一个所述图像序列相邻的图像序列的首帧。

以上装置实施例的描述，与上述方法实施例的描述是类似的，具有同方法实施例相似的有益效果。对于本公开装置实施例中未披露的技术细节，请参照本公开方法实施例的描述而理解。

对应地，本公开实施例提供一种计算机设备，包括存储器和处理器，所述存储器存储有可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述方法中的步骤。

对应地，本公开实施例提供一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现上述方法中的步骤。所述计算机可读存储介质可以是瞬时性的，也可以是非瞬时性的。

对应地，本公开实施例提供一种计算机程序产品，所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，所述计算机程序被计算机读取并执行时，实现上述方法中的部分或全部步骤。该计算机程序产品可以通过硬件、软件或其结合的方式实现。在一个可选实施例中，所述计算机程序产品体现为计算机存储介质，在另一个可选实施例中，计算机程序产品体现为软件产品，例如软件开发包(Software Development Kit，SDK)等等。

这里需要指出的是：以上存储介质、计算机程序产品和设备实施例的描述，与上述方法实施例的描述是类似的，具有同方法实施例相似的有益效果。对于本公开存储介质、计算机程序产品和设备实施例中未披露的技术细节，请参照本公开方法实施例的描述而理解。

需要说明的是，图10为本公开实施例中计算机设备的一种硬件实体示意图，如图10所示，该计算机设备1000的硬件实体包括：处理器1001、通信接口1002和存储器1003，其中：

处理器1001通常控制计算机设备1000的总体操作。

通信接口1002可以使计算机设备通过网络与其他终端或服务器通信。

存储器1003配置为存储由处理器1001可执行的指令和应用，还可以缓存待处理器1001以及计算机设备1000中各模块待处理或已经处理的数据(例如，图像数据、音频数据、语音通信数据和视频通信数据)，可以通过闪存(FLASH)或随机访问存储器(Random Access Memory，RAM)实现。处理器1001、通信接口1002和存储器1003之间可以通过总线1004 进行数据传输。

应理解，说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本公开的至少一个实施例中。因此，在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外，这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解，在本公开的各种实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本公开实施例的实施过程构成任何限定。上述本公开实施例序号为了描述，不代表实施例的优劣。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

在本公开所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。以上所描述的设备实施例是示意性的，例如，所述单元的划分，为一种逻辑功能划分，实际实现时可以有另外的划分方式，如：多个单元或组件可以结合，或可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口，设备或单元的间接耦合或通信连接，可以是电性的、机械的或其它形式的。

上述作为分离部件说明的单元可以是、或也可以不是物理上分开的，作为单元显示的部件可以是、或也可以不是物理单元；既可以位于一个地方，也可以分布到多个网络单元上；可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外，在本公开各实施例中的各功能单元可以全部集成在一个处理单元中，也可以是各单元分别单独作为一个单元，也可以两个或两个以上单元集成在一个单元中；上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于计算机可读存储介质中，该程序在执行时，执行包括上述方法实施例的步骤。

或者，本公开上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读存储介质中。基于这样的理解，本公开的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本公开各个实施例所述方法的全部或部分。

计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备，可为易失性存储介质或者非易失性存储介质。计算机可读存储介质可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的例子(非穷举的列表)包括：便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(Read Only Memory，ROM)、可擦式可编程只读存储器、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身，诸如无线电波或者其它自由传播的电磁波、通过波导或其它传输媒介传播的电磁波(例如，通过光纤电缆的光脉冲)、或者通过电线传输的电信号。

以上所述，仅为本公开的实施方式，但本公开的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本公开揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本公开的保护范围之内。因此，本公开的保护范围应以所述权利要求的保护范围为准。

Claims

一种异常事件检测方法，所述方法包括：

获取至少两个图像序列；其中，每一所述图像序列中包括至少一帧图像；

对每一所述图像序列进行至少两种尺度的划分，得到同一尺度下所有图像帧中同一位置的图像块组成的图像块集合；

基于各所述图像序列的图像块集合，确定各所述图像序列之间的相关性特征；

根据各所述图像序列之间的相关性特征，在所述至少两个图像序列中确定出存在异常事件的目标图像序列。
根据权利要求1所述的方法，其中，所述基于各所述图像序列的图像块集合，确定各所述图像序列之间的相关性特征，包括：

针对每一所述图像序列，基于同一尺度下的各图像块集合，获得尺度对应的第一特征；其中，所述第一特征中包括同一尺度的各图像块集合之间的相关性；

将同一所述图像序列中各尺度对应的所述第一特征融合，得到每一所述图像序列的第二特征；

基于各所述图像序列的所述第二特征，确定各所述图像序列之间的所述相关性特征。
根据权利要求2所述的方法，其中，所述基于同一尺度下的各图像块集合，获得尺度对应的第一特征，包括：

对同一尺度下的各所述图像块集合做特征提取，获得所述图像块集合对应的特征；

将同一尺度的所述图像块集合的特征进行拼接，获得尺度对应的第一拼接特征；

基于所述尺度对应的第一拼接特征，利用自注意力机制和卷积处理构建所述第一拼接特征所表征的同一尺度的图像块集合之间的关联关系，获得所述尺度对应的第一特征。
根据权利要求3所述的方法，其中，所述基于所述尺度对应的第一拼接特征，利用自注意力机制和卷积处理构建所述第一拼接特征所表征的同一尺度的图像块集合之间的关联关系，获得所述尺度对应的第一特征，包括：

基于所述自注意力机制以及所述第一拼接特征，确定权重矩阵；其中，所述权重矩阵中包括：表征同一尺度的各所述图像块集合存在异常的概率的权重值；

基于所述权重矩阵以及所述第一拼接特征，获得加权后的特征；

对所述第一拼接特征进行卷积处理，获得卷积后的特征；

基于所述加权后的特征、卷积后的特征以及所述第一拼接特征，获得所述第一特征。
根据权利要求4所述的方法，其中，所述基于所述自注意力机制以及所述第一拼接特征，确定权重矩阵，包括：

对所述第一拼接特征进行降维处理，获得降维后的第一拼接特征；

对所述降维后的第一拼接特征利用预设第一卷积核进行卷积，获得第一卷积结果；

对所述降维后的第一拼接特征利用预设第二卷积核进行卷积，获得第二卷积结果；

将所述第一卷积结果和所述第二卷积结果的转置相乘后的结果利用所述自注意力机制，确定所述权重矩阵。
根据权利要求5所述的方法，其中，所述基于所述权重矩阵以及所述第一拼接特征，获得加权后的特征，包括：

利用预设第三卷积核对所述降维后的第一拼接特征进行卷积，获得第三卷积结果；

将所述权重矩阵和所述第三卷积结果相乘，获得加权矩阵；

将所述加权矩阵和预设第四卷积核进行卷积后的结果，与所述降维后的第一拼接特征的和值，确定为所述加权后的特征。
根据权利要求4所述的方法，其中，所述对所述第一拼接特征进行卷积进处理，获得卷积后的特征，包括：

利用至少二个空洞卷积核分别对所述第一拼接特征进行卷积，获得各所述空洞卷积核对应的卷积结果；其中，至少二个所述空洞卷积核的空洞率不同；

将各所述空洞卷积核对应的卷积结果进行拼接，获得所述卷积后的特征。
根据权利要求4所述的方法，其中，所述基于所述加权后的特征、卷积后的特征以及所述第一拼接特征，获得所述第一特征，包括：

将所述加权后的特征与所述卷积后的特征拼接后，与所述第一拼接特征加和，获得所述第一特征。
根据权利要求3所述的方法，其中，所述对同一尺度下的各所述图像块集合做特征提取，获得所述图像块集合对应的特征，包括：

对同一尺度下的各所述图像块集合做特征提取，获得所述图像块集合对应的包括所述图像块集合中各图像块之间的时序信息的特征。
根据权利要求2所述的方法，其中，所述将同一所述图像序列中各尺度对应的所述第一特征融合，得到每一所述图像序列的第二特征，包括：

将同一尺度的所述第一特征，按各所述图像块集合的位置关系进行重构，获得尺度对应的重构特征；

将所述尺度对应的重构特征利用预设第五卷积核卷积后，经全连接层转化为一维特征向量；

将各尺度的所述一维特征向量累加，得到每一所述图像序列的第二特征。
根据权利要求2所述的方法，其中，所述基于各所述图像序列的所述第二特征，确定各所述图像序列之间的所述相关性特征，包括：

将各所述图像序列的所述第二特征进行拼接，获得第二拼接特征；

基于所述第二拼接特征，基于自注意力机制以及空洞卷积构建所述第二拼接特征所表征的不同图像序列之间的关联关系，确定各所述图像序列之间的所述相关性特征。
根据权利要求1至11中任一项所述的方法，其中，所述根据各所述图像序列之间的相关性特征，在所述至少两个图像序列中确定出存在异常事件的目标图像序列，包括：

基于预设异常预测模型对各所述图像序列之间的相关性特征进行检测，获得各所述图像序列的预测结果；其中，所述预设异常预测模型为采用弱监督训练方法训练获得的模型；

根据各所述图像序列的预测结果，确定存在所述异常事件的所述目标图像序列。
根据权利要求12所述的方法，其中，所述方法还包括：

对训练样本集中的正样本和负样本，分别选取特征梯度较大的K个样本图像序列计算平均特征梯度；其中，所述K为大于1的正整数；

根据所述正样本对应的平均特征梯度，以及所述负样本对应的平均特征梯度，构建损失函数；

基于所述损失函数训练获得所述预设异常预测模型。
根据权利要求1至11中任一项所述的方法，其中，所述获取至少两个图像序列，包括：

获取待检测视频；

确定所述待检测视频中相邻帧图像之间的差异值；

将所述差异值大于预设差异阈值的所述相邻帧图像中，时间靠前的图像帧确定为一个所述图像序列的尾帧，时间靠后的图像帧确定为与一个所述图像序列相邻的图像序列的首帧。
一种异常事件检测装置，所述装置包括：

获取模块，配置为获取至少两个图像序列；其中，每一所述图像序列中包括至少一帧图像；

划分模块，配置为对每一所述图像序列进行至少两种尺度的划分，得到同一尺度下所有图像帧中同一位置的图像块组成的图像块集合；

第一确定模块，配置为基于各所述图像序列的图像块集合，确定各所述图像序列之间的相关性特征；

第二确定模块，配置为根据各所述图像序列之间的相关性特征，在所述至少两个图像序列中确定出存在异常事件的目标图像序列。
根据权利要求15所述的装置，其中，所述第一确定模块，配置为针对每一所述图像序列，基于同一尺度下的各图像块集合，获得尺度对应的第一特征；其中，所述第一特征中包括同一尺度的各图像块集合之间的相关性；将同一所述图像序列中各尺度对应的所述第一特征融合，得到每一所述图像序列的第二特征；基于各所述图像序列的所述第二特征，确定各所述图像序列之间的所述相关性特征。
根据权利要求16所述的装置，其中，所述第一确定模块，配置为对同一尺度下的各所述图像块集合做特征提取，获得所述图像块集合对应的特征；将同一尺度的所述图像块集合的特征进行拼接，获得尺度对应的第一拼接特征；基于所述尺度对应的第一拼接特征，利用自注意力机制和卷积处理构建所述第一拼接特征所表征的同一尺度的图像块集合之间的关联关系，获得所述尺度对应的第一特征。
根据权利要求17所述的装置，其中，所述第一确定模块，配置为基于所述自注意力机制以及所述第一拼接特征，确定权重矩阵；其中，所述权重矩阵中包括：表征同一尺度的各所述图像块集合存在异常的概率的权重值；基于所述权重矩阵以及所述第一拼接特征，获得加权后的特征；对所述第一拼接特征进行卷积处理，获得卷积后的特征；基于所述加权后的特征、卷积后的特征以及所述第一拼接特征，获得所述第一特征。
根据权利要求18所述的装置，其中，所述第一确定模块，配置为对所述第一拼接特征进行降维处理，获得降维后的第一拼接特征；对所述降维后的第一拼接特征利用预设第一卷积核进行卷积，获得第一卷积结果；对所述降维后的第一拼接特征利用预设第二卷积核进行卷积，获得第二卷积结果；将所述第一卷积结果和所述第二卷积结果的转置相乘后的结果利用所述自注意力机制，确定所述权重矩阵。
根据权利要求19所述的装置，其中，所述第一确定模块，配置为利用预设第三卷积核对所述降维后的第一拼接特征进行卷积，获得第三卷积结果；将所述权重矩阵和所述第三卷积结果相乘，获得加权矩阵；将所述加权矩阵和预设第四卷积核进行卷积后的结果，与所述降维后的第一拼接特征的和值，确定为所述加权后的特征。
根据权利要求19所述的装置，其中，所述第一确定模块，配置为利用至少二个空洞卷积核分别对所述第一拼接特征进行卷积，获得各所述空洞卷积核对应的卷积结果；其中，至少二个所述空洞卷积核的空洞率不同；将各所述空洞卷积核对应的卷积结果进行拼接，获得所述卷积后的特征。
根据权利要求19所述的装置，其中，所述第一确定模块，配置为将所述加权后的特征与所述卷积后的特征拼接后，与所述第一拼接特征加和，获得所述第一特征。
根据权利要求18所述的装置，其中，所述第一确定模块，配置为对同一尺度下的各所述图像块集合做特征提取，获得所述图像块集合对应的包括所述图像块集合中各图像块之间的时序信息的特征。
根据权利要求17所述的装置，其中，所述第一确定模块，配置为将同一尺度的所述第一特征，按各所述图像块集合的位置关系进行重构，获得尺度对应的重构特征；将所述尺度对应的重构特征利用预设第五卷积核卷积后，经全连接层转化为一维特征向量；将各尺度的所述一维特征向量累加，得到每一所述图像序列的第二特征。
根据权利要求17所述的装置，其中，所述第一确定模块，配置为将各所述图像序列的所述第二特征进行拼接，获得第二拼接特征；基于所述第二拼接特征，基于自注意力机制以及卷积处理构建所述第二拼接特征所表征的不同图像序列之间的关联关系，确定各所述图像序列之间的所述相关性特征。
根据权利要求15至17中任一项所述的装置，其中，所述第二确定模块，配置为基于预设异常预测模型对各所述图像序列之间的相关性特征进行检测，获得各所述图像序列的预测结果；其中，所述预设异常预测模型为采用弱监督训练方法训练获得的模型；根据各所述图像序列的预测结果，确定存在所述异常事件的所述目标图像序列。
根据权利要求26所述的装置，其中，所述装置还包括：计算模块，配置为对训练样本集中的正样本和负样本，分别选取特征梯度较大的K个样本图像序列计算平均特征梯度；其中，所述K为大于1的正整数；构建模块，配置为根据所述正样本对应的平均特征梯度，以及所述负样本对应的平均特征梯度，构建损失函数；训练模块，配置为基于所述损失函数训练获得所述预设异常预测模型。
根据权利要求15至25所述的装置，其中，所述获取模块，配置为获取待检测视频；确定所述待检测视频中相邻帧图像之间的差异值；将所述差异值大于预设差异阈值的所述相邻帧图像中，时间靠前的图像帧确定为一个所述图像序列的尾帧，时间靠后的图像帧确定为与一个所述图像序列相邻的图像序列的首帧。
一种计算机设备，包括：处理器；用于存储处理器可执行指令的存储器；其中，所述处理器被配置为执行如权利要求1至14中任一项所述的异常事件检测方法。
一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现权利要求1至14中任一项所述的异常事件检测方法。
一种计算机程序，包括计算机可读代码，在计算机可读代码在设备上运行的情况下，设备中的处理器执行配置为实现权利要求1至14中任意一项所述的方法。
一种计算机程序产品，配置为存储计算机可读指令，所述计算机可读指令被执行时使得计算机执行权利要求1至14中任意一项所述的方法。