WO2022105243A1

WO2022105243A1 - 事件检测方法、装置、电子设备及存储介质

Info

Publication number: WO2022105243A1
Application number: PCT/CN2021/103735
Authority: WO
Inventors: 张游春
Original assignee: 北京旷视科技有限公司
Priority date: 2020-11-23
Filing date: 2021-06-30
Publication date: 2022-05-27
Also published as: CN112507813A

Abstract

一种事件检测方法、装置、电子设备及存储介质。该事件检测方法，包括：获取预设场景区域的视频流数据，并根据所述视频流数据获取至少一个关键帧图像；检测所述至少一个关键帧图像内是否存在与所述事件对应的场景目标；确定所述场景目标在所述预设场景区域中的实际位置和/或停留时长；根据是否存在所述场景目标以及根据所述实际位置和/或停留时长判断与所述预设场景区域对应的所述事件是否发生。该方法通过场景目标的识别结合该场景目标在预设场景区域的时空信息来进行判断对应的事件是否发生，降低了误判率，可以提高检测的准确率。

Description

事件检测方法、装置、电子设备及存储介质

相关申请的交叉引用

本申请要求于2020年11月23日提交中国专利局的申请号为2020113252059、名称为“事件检测方法、装置、电子设备及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及计算机网络技术领域，具体而言，涉及一种事件检测方法、装置、电子设备及存储介质。

背景技术

当前随着计算机视觉识别技术的发展，人脸、人体、机动车、非机动车等固定特征目标的识别技术日臻成熟，且在安防领域应用越来越多，应用场景也趋于复杂化。而在城市管理领域，计算机视觉识别更多倾向于物品、行为及事件识别，即场景式检测识别。

在相关技术条件下，通过物品识别技术将识别到的符合特征的单个目标(人、车、物、动物等)或多个目标组合(目标1+目标2+目标3+……+目标n)作为检测结果进行呈现或推送。

但是，单纯基于物品识别很难准确判断事件是否发生。

发明内容

本申请实施例的目的在于提供一种事件检测方法、装置、电子设备及存储介质，可以提高检测事件是否发生的准确性。

本申请实施例提供了一种事件检测方法，包括：

获取预设场景区域的视频流数据，并根据所述视频流数据获取至少一个关键帧图像；

检测所述至少一个关键帧图像内是否存在与所述事件对应的场景目标；

确定所述场景目标在所述预设场景区域中的实际位置和/或停留时长；

根据是否存在所述场景目标以及根据所述实际位置和/或停留时长判断与所述预设场景区域对应的所述事件是否发生。

可选地，在本申请实施例所述的事件检测方法中，所述检测所述至少一个关键帧图像内是否存在与所述事件对应的场景目标，包括：

通过场景目标检测模型检测所述至少一个关键帧图像内是否存在与所述事件对应的场景目标。

可选地，在本申请实施例所述的事件检测方法中，所述通过场景目标检测模型检测所述至少一个关键帧图像内是否存在与所述事件对应的场景目标，包括：

获取与所述事件对应的场景目标检测模型；

通过所述场景目标检测模型检测所述至少一个关键帧图像内是否存在与所述事件对应的场景目标。

可选地，在本申请实施例所述的事件检测方法中，所述场景目标检测模型通过如下方法训练：

对样本图像中的场景目标进行标注，得到标注信息，所述标注信息包括所述样本图像中组成场景目标的各子场景目标的分类信息和位置信息，以及所述样本图像中的场景目标的位置信息；

根据所述标注信息，对所述样本图像对应的预置框或位置点进行标签分配，得到所述样本图像对应的预置框或位置点的样本标签；

执行迭代步骤，直至损失收敛；所述迭代步骤包括：将所述样本图像输入初始场景目标检测模型，得到初始检测结果；根据初始检测结果、标注信息和所述样本标签，确定损失值；根据损失值，对初始场景目标检测模型的参数进行更新，得到更新后的初始场景目标检测模型；将损失收敛后得到的场景目标检测模型作为所述场景目标检测模型。

可选地，在本申请实施例所述的事件检测方法中，所述场景目标包括多个子目标；

通过场景目标检测模型检测所述至少一个关键帧图像内是否存在与所述事件对应的场景目标，包括：

通过场景目标检测模型检测所述至少一个关键帧图像，得到所述至少一个关键帧图像内存在的子目标种类和/或子目标数量；

若所述至少一个关键帧图像内存在的子目标种类和/或子目标数量满足以下条件中的至少一种，则确定所述至少一个关键帧图像内存在与所述城市管理事件对应的场景目标：

所述至少一个关键帧图像内存在的子目标种类大于预设种类阈值；

所述至少一个关键帧图像内存在的子目标数量大于预设数量阈值；

所述至少一个关键帧图像内存在的特定子目标种类的目标数量大于预设数量阈值。

可选地，在本申请实施例所述的事件检测方法中，所述确定所述场景目标在所述预设场景区域中的实际位置和/或停留时长，包括以下至少一项：

通过所述场景目标检测模型对所述至少一个关键帧图像进行检测，根据检测得到的输出结果中包含的场景目标的位置确定场景目标在所述预设场景区域中的实际位置；

通过所述场景目标检测模型对所述至少一个关键帧图像进行检测，根据检测得到的输出结果中包含的子目标的类别、子目标的置信度和子目标的位置信息，确定场景目标在所述预设场景区域中的实际位置；

通过所述场景目标检测模型对所述至少一个关键帧图像进行检测，将连续出现所述场景目标的关键帧图像的帧数作为所述停留时长。

可选地，在本申请实施例所述的事件检测方法中，所述根据所述实际位置和/或停留时长判断与所述预设场景区域对应的所述城市管理事件是否发生，包括：

若所述实际位置位于所述预设场景区域的预设区域范围和/或所述停留时长大于预先配置的目标时长；则判断所述城市管理事件发生。

可选地，在本申请实施例所述的事件检测方法中，所述实际位置是否位于所述预设场景区域的预设区域范围通过如下方式判断：

判断所述实际位置对应的实际区域与所述预设场景区域的预设区域范围之间的重叠度是否大于预设阈值；

若大于所述预设阈值，则判断所述实际位置位于所述预设场景区域的预设区域范围。

可选地，在本申请实施例所述的事件检测方法中，将连续出现所述场景目标的关键帧图像的帧数作为所述停留时长；

所述停留时长是否大于预先配置的目标时长通过如下方式判断：若所述停留时长大于所述预设帧数，则确定所述停留时长大于预先配置的目标时长。

可选地，在本申请实施例所述的事件检测方法中，所述根据所述视频流数据获取至少一个关键帧图像，包括：

以预设解码帧率对所述视频流数据进行解码，并得到多个关键帧图像。

本申请实施例还提供了一种事件检测装置，包括：

第一获取模块，配置成获取预设场景区域的视频流数据，并根据所述视频流数据获取至少一个关键帧图像；

检测模块，配置成检测所述至少一个关键帧图像内是否存在与所述事件对应的场景目标；

第二获取模块，配置成若存在，则确定所述场景目标在所述预设场景区域中的实际位置和/或停留时长；

判断模块，配置成根据所述实际位置和/或停留时长判断与所述预设场景区域对应的所述事件是否发生。

可选地，所述检测模块配置成：

获取与所述事件对应的场景目标检测模型；

可选地，所述装置还包括模型训练模块，配置成：

可选地，所述场景目标包括多个子目标；所述检测模块配置成：

通过场景目标检测模型检测所述至少一个关键帧图像，得到所述至少一个关键帧图像内存在的子目标种类、子目标数量、子目标位置信息中的至少一种；

若所述至少一个关键帧图像内存在的子目标种类和/或子目标数量满足以下条件中的至少一种，则确定所述至少一个关键帧图像内存在与所述事件对应的场景目标：

所述至少一个关键帧图像内存在的特定子目标种类的目标数量大于预设数量阈值；

所述至少一个关键帧图像内存在的子目标之间的位置信息满足预设位置条件。

可选地，所述第二获取模块，配置成以下至少一项：

可选地，所述判断模块配置成：

若所述实际位置位于所述预设场景区域的预设区域范围和/或所述停留时长大于预先配置的目标时长；则判断所述事件发生。

可选地，所述判断模块配置成：

判断所述实际位置对应的实际区域与所述预设场景区域的预设区域范围之间的重叠度是否大于预设阈值；若大于所述预设阈值，则判断所述实际位置位于所述预设场景区域的预设区域范围；

将连续出现所述场景目标的关键帧图像的帧数作为所述停留时长；若所述停留时长大于所述帧数，则确定所述停留时长大于预先配置的目标时长。

可选地，所述第一获取模块配置成：

本申请实施例提供一种电子设备，包括处理器以及存储器，所述存储器存储有计算机可读取指令，当所述计算机可读取指令由所述处理器执行时，运行如上述第一方面提供的所述方法中的步骤。

本申请实施例提供一种存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时运行如上述第一方面提供的所述方法中的步骤。

本申请的其他特征和优点将在随后的说明书阐述，并且，部分地从说明书中变得显而易见，或者通过实施本申请实施例了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对本申请实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本申请实施例提供的事件检测方法的一种流程图。

图2为本申请实施例提供的事件检测装置的一种结构图。

图3为本申请实施例提供的电子设备的结构示意图。

具体实施方式

下面将结合本申请实施例中附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。同时，在本申请的描述中，术语“第一”、“第二”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

请参照图1，图1是本申请实施例中的一种事件检测方法的流程图。全文以城市管理事件为例，但不以城市管理事件为限，也即，该事件监测方法也可以应用于其它场合，在此不进行限制。该事件检测方法可以由诸如计算机、服务器、手机、监控终端、机器人等电子设备执行，本申请实施例对执行事件检测方法的电子设备不进行限制，只需具有图像处理能力及数据处理能力即可；如图1所示，该方法主要包括以下步骤S101～步骤S104：

S101、获取预设场景区域的视频流数据，并根据所述视频流数据获取至少一个关键帧图像。

S102、检测所述至少一个关键帧图像内是否存在与所述事件对应的场景目标。

S103、确定所述场景目标在所述预设场景区域中的实际位置和/或停留时长。

S104、根据是否存在所述场景目标以及根据所述实际位置和/或停留时长判断与所述预设场景区域对应的所述事件是否发生。

其中，在该步骤S101中，该视频流数据RTSP(Real Time Streaming Protocol，实时流传输协议)可以是执行事件检测方法的电子设备从城市的某一监控区域的摄像机导入的实时的视频流数据。在本申请实施例中，可以采用关键帧解码的方式来获取该多个关键帧图像。视频流数据展示的是预设场景区域(例如是拍摄视频流数据的摄像机的视野)的画面。对于一个预设场景区域，可预先设置其对应的事件，该事件诸如可以是城市管理事件，从而对由视频流数据解码所得的关键帧图像中是否存在城市管理事件对应的场景目标进行判断。例如，对于辅路的摄像头，可设置该摄像头对应的预设场景区域的城市管理事件为违章停车。对于沿街商铺前的摄像头，可设置该摄像头对应的预设场景区域的城市管理事件为沿街晾晒或占道经营。

其中，在该步骤S102中，不同的预设场景区域对应的城市管理事件可以是不相同的。因此，如果要检测关键帧图像内是否存在有与该预设场景区域对应的场景目标，就需要先确认与该预设场景区域对应的城市管理事件，然后基于该城市管理事件来确定对应的场景目标。

城市管理事件对应有场景目标，不同类型的城市管理事件对应的场景目标的类型可以不同。场景目标可以包含单个目标，也可以是多个目标的组合。例如，对于垃圾堆放这一城市管理事件，场景目标是单个目标：垃圾；对于沿街晾晒这一城市管理事件，场景目标是多个子目标的组合：衣服和衣架。

检测是否存在场景目标可以通过多种方式实施，例如可以通过常规图像处理方法实施，也可以由场景检测算法、场景目标检测模型按照预设方式实施。可选地，由场景目标检测模型的输出结果可直接确定出是否存在场景目标。例如，场景目标检测模型的输出结果包括场景目标位置和场景目标置信度，当场景目标置信度大于预设置信度阈值时，认为存在场景目标。可选地，基于场景目标检测模型的输出结果需进一步判断输出结果是否符合要求，才能确定出是否存在场景目标。例如，场景目标检测模型的输出结果包括子目标的位置、类别和子目标置信度，根据子目标的位置、类别、置信度确定是否存在场景目标。

在该步骤S103中，可以在步骤S102中确定存在与所述城市管理事件对应的场景目标后，再确定场景目标的实际位置和/或停留时长，也可同时检测是否存在场景目标并确定场景目标的实际位置。

可选地，在检测是否存在场景目标的同时确定场景目标的实际位置。场景目标检测模型输出场景目标位置、场景目标置信度，当场景目标置信度大于预设置信度阈值时，认为存在场景目标，场景目标检测模型输出的场景目标位置即为场景目标的实际位置。可以理解的是，当场景目标置信度不大于预设置信度阈值时，认为不存在场景目标，此时目标检测模型输出的“场景目标位置”不用来表征场景目标实际位置。

可选地，可在确定存在场景目标之后，再确定场景目标实际位置。例如，根据场景目标检测模型的输出结果确定子目标的类别、置信度和位置信息，再根据子目标的类别、置信度和位置信息确定是否存在场景目标。再在确定存在场景目标后，根据子目标位置确定场景目标位置。例如，可以将该多个子目标所在位置的几何中心作为场景目标的位置。

可选地，上述步骤S103中所述确定所述场景目标在所述预设场景区域中的实际位置和/或停留时长，包括以下(1)至(3)中的至少一项：

(1)通过所述场景目标检测模型对所述至少一个关键帧图像进行检测，根据检测得到的输出结果中包含的场景目标的位置确定场景目标在所述预设场景区域中的实际位置。

(2)通过所述场景目标检测模型对所述至少一个关键帧图像进行检测，根据检测得到的输出结果中包含的子目标的类别、子目标的置信度和子目标的位置信息，确定场景目标在所述预设场景区域中的实际位置。其中，子目标的类别也可称为子目标种类；子目标的置信度可理解为检测到的子目标存在的可能性，置信度越高，该子目标存在的可能性越大。

另外需要说明的是，根据单个关键帧图像确定出的场景目标的实际位置仅代表场景目标在该关键帧图像中的实际位置。若一个场景目标在多个关键帧图像中出现，可根据场景目标在其出现的多个关键帧图像中各自的实际位置确定场景目标在预设场景区域中的实际位置，例如，将场景目标在其出现的多个关键帧图像中各自的实际位置的平均值作为场景目标在预设场景区域中的实际位置。

(3)通过所述场景目标检测模型对所述至少一个关键帧图像进行检测，将连续出现所述场景目标的关键帧图像的帧数作为所述停留时长。也即，场景目标在预设场景区域中的停留时长可基于连续出现所述场景目标的关键帧图像的帧数确定，帧数越大，说明所述场景目标在预设场景区域中的停留时长越长。

在实际应用中，可以根据需求采用上述(1)～(3)中的一种或多种实现，在此不进行限制。

其中，在该步骤S104中，在判断城市管理事件是否发生时，不仅考虑到是否存在场景目标，而且还考虑到场景目标的实际位置是否位于预设区域范围和/或场景目标的停留时长是否达到目标时长，应当理解的是，上述是否存在目标和是否满足位置/时长要求是两个独立的判断因素。

一方面，将是否存在场景目标、场景目标实际位置和/或停留时长是否满足要求独立判断，能够使实际位置和/或停留时长可根据用户实际需要设置，从而使城市管理事件的检测标准的配置更为灵活。可以理解的是，对于某一类型的城市管理事件，不管预设场景区域如何，其对应的场景目标的类型大概率是相同的，但是预设场景区域的不同可能使场景目标需要满足的位置和/或时长条件不同。例如，对于沿街晾晒这一城市管理事件，其场景目标都是衣服+衣架，但是对于预设场景区域A，画面左上方是不允许沿街晾晒的区域，对于预设场景区域B，画面右上方是不允许沿街晾晒的区域，这时就需要对预设场景区域A和B对应的城市管理事件中的位置进行分别设置。再例如，A市认为在违章停车区域停车十分钟是违章停车事件，B市认为在违章停车区域停车二十分钟是违章停车事件，这时就需要对预设场景区域A和B对应的城市管理事件中的时长进行分别设置。因此，将位置条件和/或时长条件作为独立于是否场景目标之外的判断条件，有利于根据实际需要设置出现城市管理事件的标准。

另一方面，将是否存在场景目标、场景目标实际位置和/或停留时长是否满足要求独立判断，能够使某些城市管理事件之间复用场景目标检测算法。例如，同样的场景目标，出现在马路中央，则对应A城市管理事件，出现在步行街，则对应B城市管理事件。如此，可使A城市管理事件和B城市管理事件共享场景目标检测算法，只是城市管理事件对应的位置/时长条件需要单独设置。

再一方面，将是否存在场景目标、场景目标实际位置和/或停留时长是否满足要求分开判断，使场景目标检测算法只判断是否存在场景目标，而不关注场景目标实际位置和/或停留时长要求，从而能够就是否存在场景目标这一问题针对性的对场景目标检测算法进行训练和优化，有利于提高场景检测算法的准确率。

在本实施例中，将是否存在目标、场景目标的实际位置/停留时长是否满足位置/时长要求作为城市管理事件是否发生的两个独立的判断因素，将事件检测解耦为目标检测和位置/时长判断，有利于对检测城市管理事件是否发生的标准进行灵活设置，有利于提高场景目标检测算法的准确率，从而提高事件检测的准确率。

可选地，该步骤S101中的根据所述视频流数据获取多个关键帧图像具体为：以预设解码帧率对所述视频流数据进行解码，并得到多个关键帧图像。其中，该预设解码帧率可以根据实际情况进行设定，以在满足计算要求的同时减轻计算设备压力。例如，预设解码帧率可以设定为每隔2秒解码一个关键帧得到一个关键帧图像。其中，该多个关键帧图像按照其采集时间进行排序。当然，可以理解地，该预设解码帧率可以根据具体的场景来进行设置。例如，如果是在繁华程度较高的街道或者路段，该预设解码帧率应该较大。在较为冷清的路段，该预设解码帧率应该较小。在例如，场景目标包括快速移动的目标如快速行驶的车辆，则该预设解码帧率可以较大，场景目标包括缓慢移动的目标如停止的车辆，则该预设解码帧率可以较小。

其中，不同的预设场景区域的视频流数据可设置有不同的事件标识。该事件标识用于表示该视频流数据所对应的城市管理事件，事件标识例如可以是违章停车事件、违规摆摊事件、垃圾乱堆放事件等城市管理事件的标识，可以理解的是，不同类型的城市管理事件对应的事件标识不同。可选地，可以基于该视频流数据的来源的摄像机的标识信息确定该视频流数据对应的事件标识。当然，可以理解地，同一预设场景区域在不同时间拍摄的视频流可对应不同的城市管理事件。例如，该预设场景区域在凌晨12点到下午5点之间拍摄的视频流数据对应的城市管理事件为违章停车事件，该预设场景区域在下午5点至凌晨12点之间拍摄的视频流数据对应的城市管理事件为违规摆摊事件。对于同一预设场景区域，还可以同时对应多个城市管理事件，例如，对于某个预设场景区域A内的视频流数据，不仅要用来进行违章停车判断，还用来进行垃圾乱堆放事件的判断。可以理解的是，这两个城市管理事件对应的场景目标的类型、场景目标的位置/时长要求可以不同。

可选地，该步骤S102可以具体为：通过场景目标检测模型检测所述至少一个关键帧图像内是否存在与所述事件对应的场景目标。示例性地，该事件可以为城市管理事件。

其中，通过场景目标检测模型检测所述至少一个关键帧图像内是否存在与所述城市管理事件对应的场景目标，可以是由场景目标检测模型的输出结果直接确定关键帧图像内是否包含场景目标，也可以是在场景目标检测模型的输出结果的基础上进一步确定关键帧图像内是否包含场景目标。该场景目标检测模型为预先训练得到。其中，场景目标检测模型可以是与一个或多个指定的事件类型相对应，能够检测出相应的事件类型。示例性地，该场景目标检测模型可以为针对多种城市管理事件的通用模型，也可以是针对特定种类的城市管理事件的场景目标检测模型。

对于场景目标检测模型为针对特定种类的城市管理事件的场景目标检测模型的情形，可选地，步骤S102可以包括以下子步骤：S1021、获取与所述事件对应的场景目标检测模型；S1022、通过所述场景目标检测模型检测所述至少一个关键帧图像内是否存在与所述事件对应的场景目标。

其中，在该步骤S1021中，不同类型的城市管理事件可以对应一个不同类型的场景目标检测模型，可以根据预设场景区域对应的城市管理事件标识来查询数据库以获取该城市管理事件对应的场景目标识别模型。例如，违章停车事件对应A模型，违规摆摊事件对应B模型，垃圾乱堆放事件对应C模型。不同场景目标检测模型配置成检测不同的场景目标。例如，对应违章停车事件的场景目标为汽车，违规摆摊事件的场景目标为三轮车、水果以及经营者。可选地，即使对于同一类型的城市管理事件，在不同的天气情况下，也可以采用不同的场景目标检测模型。例如，浓雾天气的违章停车事件对应A1模型，晴朗无雾的天气的违章停车事件对应A2模型。

在该步骤S1022中，是否存在场景目标可以由该场景目标模型的输出结果直接确定。例如，场景目标模型的输出结果包括场景目标的置信度，若置信度高于预设置信度阈值，则认为存在场景目标。

其中，对应某一城市管理事件的场景目标检测模型可以通过如下方法训练：S11、对样本图像中的场景目标进行标注，得到标注信息，所述标注信息包括所述样本图像中组成场景目标的各子场景目标的分类信息和位置信息，以及所述样本图像中的场景目标的位置信息；S12、根据所述标注信息，对所述样本图像对应的预置框(对应基于锚框的目标检测模型)或位置点(对应非基于锚框的位置检测模型)进行标签分配，得到所述样本图像对应的预置框或位置点的样本标签；S13、执行迭代步骤，直至损失收敛；所述迭代步骤包括：将所述样本图像输入初始场景目标检测模型，得到初始检测结果；根据初始检测结果、标注信息和所述样本标签，确定损失值；根据损失值，对初始场景目标检测模型的参数进行更新，得到更新后的初始场景目标检测模型；S14、将损失收敛后得到的场景目标检测模型作为所述场景目标检测模型。在实际应用中，可以利用预设的损失函数来确定损失，并根据损失以及反向传播算法来对初始场景目标检测模型的参数进行更新，直至初始场景目标检测模型能够输出符合预期的结果时停止更新参数(也即，停止训练)，此时的初始场景目标检测模型即作为训练得到的场景目标检测模型。

在该步骤S11中，先获取样本集，该样本集内包括多个样本图像。当然，该多个样本图像可以包括具有与城市管理事件对应的场景目标的样本图像，还可以包括不具有与该城市管理事件对应的场景目标的样本图像。

对样本图像中的场景目标进行标注时，可以由人工标注，也可以采用可识别场景目标的预设算法自动标注，也可人工和自动结合标注。不仅可以标注场景目标的位置信息，还可以标注组成场景目标的各子目标的分类信息和位置信息。对场景目标的位置信息的标注可以基于对组成场景目标的子目标的标注信息(子目标的分类信息和位置信息)根据预设规则自动生成。其中预设规则是与场景目标对应的规则，用于表征当认为样本图像中存在场景目标时，样本图像中的子目标需要满足的条件。例如，已经在样本图像标注A、B、C、D4个子目标的分类L1、L2、L3、L3及位置信息。对于第一城市管理事件，预设规则为：样本图像中包含L1类型的子目标和L3类型的子目标，且L1类型的子目标和L3类型的子目标的位置重叠率大于30％，满足预设规则才认为样本图像中存在场景目标。对于第二城市管理事件，预设规则为：样本图像中包含L1、L2、L3 3个类型的子目标。当判断存在场景目标时，可基于子目标的位置信息生成场景目标的位置信息(例如将各子目标几何中心作为场景目标中心)。由此，可基于子目标的标注信息如分类信息和位置信息，根据预设规则自动生成场景目标的标注信息。基于此，在对一张样本图像进行了子目标的标注后，可根据子目标的标注信息生成对应多个场景目标的标注信息，这些标注信息可用于训练多个类型的场景目标对应的场景目标检测模型。例如，基于样本图像中子目标的标注信息，可确定样本图像中存在场景目标A并生成场景目标A的位置信息，还可确定样本图像中不存在场景目标B。样本图像既可作为训练场景目标A的场景目标检测模型的样本图像，又可作为训练场景目标B的场景目标检测模型的样本图像。如此，只对样本图像中的子目标进行一次标注即可将样本图像分别作为不同场景目标检测模型的样本图像，而无需在将该样本图像作为不同场景目标检测模型的样本图像时，对样本图像重新标注。

对于场景目标检测模型为针对多种城市管理事件的通用模型的情形，可以用场景目标检测模型进行子目标的检测，再根据检测结果确定是否存在场景目标以及场景目标的位置。可选地，场景目标检测模型是能够检测出载具、物品等多种类型目标的检测模型。

可选地，一些城市管理事件的场景目标包括多个子目标，当多个子目标的分类、位置信息符合预设规则时，则认为样本图像中存在场景目标。

对应地，步骤S102可以包括以下子步骤S1023～S1024：

S1023、通过场景目标检测模型检测所述至少一个关键帧图像，得到所述至少一个关键帧图像内存在的子目标种类、子目标数量、子目标位置信息中的至少一种；

S1024、若所述至少一个关键帧图像内存在的子目标种类、子目标数量、子目标位置信息满足以下条件中的至少一种，则确定所述至少一个关键帧图像内存在与所述事件对应的场景目标：所述至少一个关键帧图像内存在的子目标种类大于预设种类阈值；所述至少一个关键帧图像内存在的子目标数量大于预设数量阈值；所述至少一个关键帧图像内存在的特定子目标种类的子目标数量大于预设数量阈值；所述至少一个关键帧图像内存在的子目标之间的位置信息满足预设位置条件。

其中，在该步骤S1023中，子目标种类、子目标数量、子目标位置信息可以是通过场景目标检测模型检测得出的，或者基于场景目标检测模型的检测结果得出的。场景目标检测模型会检测出关键帧图像内的子目标的置信度(用于表征子目标是否存在)、种类、位置信息中至少一种。子目标种类是指各个子目标的所对应的种类。例如，子目标A是衣服类，子目标B是载具类。子目标数量可以是模型中子目标的总数量，或者各种类的子目标的数量。例如，衣服类子目标有0个，载具类子目标为3个，总子目标为5个。子目标位置信息为子目标所在的位置，可以由位置框的左上、右下坐标表示。

其中，在该步骤S1024中，可根据场景目标检测模型检测的至少一个关键帧图像内存在的子目标种类、子目标数量、子目标位置信息等信息确定关键帧图像中是否存在场景目标。例如，当存在第一类型的子目标、第二类型的子目标，且二者位置重叠率大于重叠率阈值时，认为存在场景目标。或者，当存在至少两个第一类型的子目标、至多0个(即不存在)第二类型的子目标时，认为存在场景目标。例如，对于违规摆摊事件这种类型的城市管理事件，若要想判别其为违规摆摊事件，该场景目标所要包括的子目标至少需要包括：三轮车或者其他敞开型的汽车、摆放在三轮车或者其他敞开型的汽车上的商品(例如，水果、小吃、玩具或者书籍等常见小商品)，当然，还可以包括一个经营者以及一定数量的围观者或者购买者。当然，在实际的图像采集过程中，对于这种具有多个子目标的场景目标，其中个别子目标可能出现被遮挡的情况，因此，只需要识别出该多个第一场景目标中的预设数量或者预设种类的子目标，或者特定种类的子目标达到预设数量，即可判断为该关键帧图像里存在与该预设场景区域对应的城市管理事件对应的场景目标。

可选地，实际位置是否位于所述预设场景区域的预设区域范围通过如下方式(S1031和S1032)判断：S1031、判断所述实际位置对应的实际区域与所述预设场景区域的预设区域范围之间的重叠度是否大于预设阈值。其中，重叠度可根据实际区域与预设区域范围之间的IOU判断。S1032、若大于所述预设阈值，则判断所述实际位置位于所述预设场景区域的预设区域范围。其中，在该步骤S1031中，该预设阈值的设定可以基于具体的城市管理事件来设置。

其中，将连续出现与城市管理事件对应的场景目标的关键帧图像的帧数作为所述停留时长。判断留时长大于预先配置的目标时长通过如下方式：S1033、若所述停留时长大于所述预设帧数，则确定所述停留时长大于预先配置的目标时长。例如，在连续的N张关键帧图像中检测出了场景目标，N张关键帧是以2秒1帧的速度解码得到的，则停留时长为 2N秒。

可选地，该步骤S104可以具体包括：若所述实际位置位于所述预设场景区域的预设区域范围和/或所述停留时长大于预先配置的目标时长，则判断所述城市管理事件发生。

其中，该预设区域范围以及目标时长是基于该城市管理事件的种类预先设置的。不同的城市管理事件对应的预设区域范围及目标时长可以不相同。在本实施例中，可以是当实际位置位于预设区域范围时，判断城市管理事件发生；或者当停留时长大于预先配置的目标时长时，判断城市管理事件发生；或者必须实际位置和停留时长同时满足对应条件，才能判断城市管理事件发生。例如，对于违规停车事件这类城市管理事件，其既要满足位置要求，也需要满足时长要求。而对于车辆逆行事件只要满足位置要求即可。对于不同的城市管理事件，其对应的场景目标在预设场景区域的停留时间是不同的。例如，对于违规停车事件而言，该目标时间一般设置比较短，例如设置为3秒或者5秒。对于违规摆摊事件而言，该目标时间设置较长，例如可以设置为30秒或者1分钟，当然也可以为其他时间。在同时满足场景目标存在条件，和实际位置、停留时长条件时，认为存在城市管理事件。

由上可知，本申请实施例提供的事件检测方法通过获取预设场景区域的视频流数据，并根据所述视频流数据获取至少一个关键帧图像；检测所述至少一个关键帧图像内是否存在与事件对应的场景目标；确定所述场景目标在所述预设场景区域中的实际位置和/或停留时长；根据是否存在所述场景目标以及根据所述实际位置和/或停留时长判断与所述预设场景区域对应的所述事件是否发生，从而实现事件的检测，由于通过场景目标的识别结合该场景目标在预设场景区域的时空信息来判断事件是否发生，降低了误判率，可以提高检测的准确率。

请参照图2，图2是本申请实施例中的一种事件检测装置的结构示意图。该事件检测装置也可以采用前述电子设备实现，该事件检测装置包括：第一获取模块201、检测模块202、第二获取模块203以及判断模块204。

其中，该第一获取模块201配置成获取预设场景区域的视频流数据，并根据所述视频流数据获取至少一个关键帧图像。该视频流数据RTSP(Real Time Streaming Protocol，实时流传输协议)从城市的某一监控区域的摄像机接入的实时的视频流数据。在本申请实施例中，可以采用关键帧解码的方式来获取该多个关键帧图像。

可选地，第一获取模块201在根据所述视频流数据获取多个关键帧图像时，具体配置成：以预设解码帧率对所述视频流数据进行解码，并得到多个关键帧图像。其中，该预设解码帧率可以根据实际情况进行设定，例如，预设解码帧率可以设定为每隔2秒解码一个关键帧得到一个关键帧图像。其中，该多个关键帧图像按照时间轴进行依次排序。当然，可以理解地，该预设解码帧率可以根据具体的场景来进行设置。例如，如果是在繁华程度较高的街道或者路段，该预设解码帧率应该较大。在较为冷清的路段，该预设解码帧率应该较小。

其中，不同的预设场景区域的视频流数据设置有不同的事件标识。该事件标识用于表示该视频流数据所对应的城市管理事件，事件标识例如可以是违章停车事件、违规摆摊事件、垃圾乱堆放事件等城市管理事件的标识，可以理解的是，不同城市管理事件对应的事件标识不同。可选地，可以通过获取该视频流数据的来源的摄像机的标识信息，然后基于该标识信息得到对应的事件标识。当然，可以理解地，对于同一预设场景区域的城市管理事件可以发生改变。例如，在上午凌晨到下午5点之间，该预设场景区对应的城市管理事件为违章停车事件，在下午5点至凌晨12点之间，该预设场景区域对应的城市管理事件为违规摆摊事件。当然，其并不限于此。

可选地，对于同一预设场景区域，还可以同时对应多个城市管理事件，例如，对于某个预设场景区域A内的视频流数据，不仅要用来进行违章停车判断，还可以用来进行垃圾乱堆放事件的判断。

其中，该检测模块202配置成检测所述至少一个关键帧图像内是否存在与所述事件对应的场景目标。由于不同的预设场景区域对应的城市管理事件是不相同的。因此，如果要检测关键帧图像内是否存在有与该预设场景区域对应的场景目标，就需要先确认与该预设场景区域对应的城市管理事件，然后基于该城市管理事件来确定对应的场景目标。其中，在识别场景目标时即可以采用常规的图像识别方法，也可以采用预先训练的目标检测模型来进行检测。

可选地，该检测模块202配置成：通过场景目标检测模型检测所述至少一个关键帧图像内是否存在与所述事件对应的场景目标。

其中，该场景目标检测模型为预先训练得到，该场景目标检测模型可以为针对所有城市管理事件的通用模型，也可以是针对单一种类的城市管理事件的专门训练的场景目标检测模型。

可选地，该检测模块202配置成：获取与所述事件对应的场景目标检测模型；通过所述场景目标检测模型检测所述至少一个关键帧图像内是否存在与所述事件对应的场景目标。其中，不同类型的城市管理事件可以对应一个不同类型的场景目标检测模型。例如，违章停车事件对应A模型，违规摆摊事件对应B模型，垃圾乱堆放事件对应C模型。例如，对于违章停车事件的场景目标为汽车，违规摆摊事件的场景目标为三轮车、水果以及经营者。因此，可以根据该事件标识来查询数据库以获取对应的场景目标，然后基于该场景目标的来选取合适的场景目标识别模型。可选地，即使对于同一类型的城市管理事件，在不同的天气情况下，也可以采用不同的场景目标检测模型。例如，浓雾天气的违章停车事件对应 A1模型，晴朗无雾的天气的违章停车事件对应A2模型。每一场景目标的位置可以由该场景目标模型直接给出。

可选地，所述场景目标包括多个子目标；该检测模块202配置成：通过场景目标检测模型检测所述至少一个关键帧图像，得到所述至少一个关键帧图像内存在的子目标种类、子目标数量、子目标位置信息中的至少一种；若所述至少一个关键帧图像内存在的子目标种类和/或子目标数量满足以下条件中的至少一种，则确定所述至少一个关键帧图像内存在与所述事件对应的场景目标：所述至少一个关键帧图像内存在的子目标种类大于预设种类阈值；所述至少一个关键帧图像内存在的子目标数量大于预设数量阈值；所述至少一个关键帧图像内存在的特定子目标种类的目标数量大于预设数量阈值；所述至少一个关键帧图像内存在的子目标之间的位置信息满足预设位置条件。

可选地，所述装置还包括模型训练模块，配置成：对样本图像中的场景目标进行标注，得到标注信息，所述标注信息包括所述样本图像中组成场景目标的各子场景目标的分类信息和位置信息，以及所述样本图像中的场景目标的位置信息；根据所述标注信息，对所述样本图像对应的预置框或位置点进行标签分配，得到所述样本图像对应的预置框或位置点的样本标签；执行迭代步骤，直至损失收敛；所述迭代步骤包括：将所述样本图像输入初始场景目标检测模型，得到初始检测结果；根据初始检测结果、标注信息和所述样本标签，确定损失值；根据损失值，对初始场景目标检测模型的参数进行更新，得到更新后的初始场景目标检测模型；将损失收敛后得到的场景目标检测模型作为所述场景目标检测模型。

其中，该第二获取模块203配置成：若存在，则确定所述场景目标在所述预设场景区域中的实际位置和/或停留时长。其中，对于场景目标为一个整体的情况，可以直接由目标检测模型来输出该场景目标的位置，对于场景目标包括多个子目标的情况，要基于各个子目标的位置来计算得到该场景目标的位置，例如，可以将该多个子目标所在区域的几何中心作为场景目标的位置。

可选地，所述第二获取模块203，配置成以下至少一项：

其中，实际位置是否位于所述预设场景区域的预设区域范围通过如下方式判断：判断所述实际位置对应的实际区域与所述预设场景区域的预设区域范围之间的重叠度是否大于预设阈值；若大于所述预设阈值，则判断所述实际位置位于所述预设场景区域的预设区域范围。其中，该预设阈值的设定可以基于具体的城市管理事件来设置。

其中，将连续出现与城市管理事件对于的场景目标的关键帧图像的帧数作为所述停留时长。判断留时长大于预先配置的目标时通过如下方式：若所述停留时长大于所述预设帧数，则确定所述停留时长大于预先配置的目标时长。其中，其中时长与帧数的换算关系如下：时长T＝帧数N*每帧的持续时间t。

其中，该判断模块204配置成根据所述实际位置和/或停留时长判断与所述预设场景区域对应的所述城市管理事件是否发生。判断依据是计算场景目标的实际位置是否位于预设场景区域的预设范围，判断场景目标在预设场景区域停留的时长与目标时长的关系。该判断模块204配置成若所述实际位置位于所述预设场景区域的预设区域范围和/或所述停留时长大于预先配置的目标时长，则判断所述城市管理事件发生。

可选地，所述判断模块配置成：判断所述实际位置对应的实际区域与所述预设场景区域的预设区域范围之间的重叠度是否大于预设阈值；若大于所述预设阈值，则判断所述实际位置位于所述预设场景区域的预设区域范围；将连续出现所述场景目标的关键帧图像的帧数作为所述停留时长；若所述停留时长大于所述帧数，则确定所述停留时长大于预先配置的目标时长。上述内容具体阐述了判断实际位置是否位于所述预设场景区域的预设区域范围的方式以及判断所述停留时长是否大于预先配置的目标时长的方式。

其中，该预设区域范围以及目标时长是基于该城市管理事件的种类预先设置的。不同的城市管理事件对应的预设区域范围不同，对应的目标时长也不相同。在本实施例中，可以是当实际位置位于预设区域范围时，判断城市管理事件发生；或者当停留时长大于预先配置的目标时长时，判断城市管理事件发生；或者必须实际位置和停留时长同时满足对应条件，才能判断城市管理事件发生。例如，对于违规停车事件这类城市管理事件，其既要满足位置要求，也需要满足时长要求。而对于车辆逆行事件只要满足位置要求即可。对于不同的城市管理事件，其对应的场景目标在预设场景区域的停留时间是不同的。例如，对于违规停车事件而言，该目标时间一般设置比较短，例如设置为3秒或者5秒。对于违规摆摊事件而言，该目标时间设置较长，例如可以设置为30秒或者1分钟，当然也可以为其他时间。

由上可知，本申请实施例提供的事件检测装置通过获取预设场景区域的视频流数据，并根据所述视频流数据获取至少一个关键帧图像；检测所述至少一个关键帧图像内是否存在与事件对应的场景目标；确定所述场景目标在所述预设场景区域中的实际位置和/或停留时长；根据是否存在所述场景目标以及根据所述实际位置和/或停留时长判断与所述预设场景区域对应的事件是否发生，从而实现事件的检测，由于通过场景目标的识别结合该场景目标在预设场景区域的时空信息来进行判断事件是否发生，降低了误判率，可以提高检测的准确率。

请参照图3，图3为本申请实施例提供的一种电子设备的结构示意图，本申请实施例提供一种电子设备3，包括：处理器301和存储器302，处理器31和存储器302通过通信总线303和/或其他形式的连接机构(未标出)互连并相互通讯，存储器302存储有处理器301可执行的计算机程序，当计算设备运行时，处理器301执行该计算机程序，以执行时执行上述实施例的任一可选的实现方式中的方法。

本申请实施例提供一种存储介质，所述计算机程序被处理器执行时，执行上述实施例的任一可选的实现方式中的方法。其中，存储介质可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(Static Random Access Memory,简称SRAM)，电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,简称EEPROM)，可擦除可编程只读存储器(Erasable Programmable Read Only Memory,简称EPROM)，可编程只读存储器(Programmable Red-Only Memory,简称PROM)，只读存储器(Read-Only Memory,简称ROM)，磁存储器，快闪存储器，磁盘或光盘。

在本申请所提供的实施例中，应该理解到，所揭露装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

另外，作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

再者，在本申请实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。

在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。

以上所述仅为本申请的实施例而已，并不用于限制本申请的保护范围，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

工业实用性

本申请提出的技术方案中，通过场景目标的识别结合该场景目标在预设场景区域的时空信息来进行判断事件是否发生，降低了误判率，可以提高检测事件是否发生的准确率。

Claims

一种事件检测方法，其特征在于，包括：

获取预设场景区域的视频流数据，并根据所述视频流数据获取至少一个关键帧图像；

检测所述至少一个关键帧图像内是否存在与所述事件对应的场景目标；

确定所述场景目标在所述预设场景区域中的实际位置和/或停留时长；

根据是否存在所述场景目标以及根据所述实际位置和/或停留时长判断与所述预设场景区域对应的所述事件是否发生。
根据权利要求1所述的事件检测方法，其特征在于，所述检测所述至少一个关键帧图像内是否存在与所述事件对应的场景目标，包括：

通过场景目标检测模型检测所述至少一个关键帧图像内是否存在与所述事件对应的场景目标。
根据权利要求2所述的事件检测方法，其特征在于，所述场景目标检测模型通过如下方法训练：

对样本图像中的场景目标进行标注，得到标注信息，所述标注信息包括所述样本图像中组成场景目标的各子场景目标的分类信息和位置信息，以及所述样本图像中的场景目标的位置信息；

根据所述标注信息，对所述样本图像对应的预置框或位置点进行标签分配，得到所述样本图像对应的预置框或位置点的样本标签；

执行迭代步骤，直至损失收敛；所述迭代步骤包括：将所述样本图像输入初始场景目标检测模型，得到初始检测结果；根据初始检测结果、标注信息和所述样本标签，确定损失值；根据损失值，对初始场景目标检测模型的参数进行更新，得到更新后的初始场景目标检测模型；

将损失收敛后得到的场景目标检测模型作为所述场景目标检测模型。
根据权利要求2至3任一项所述的事件检测方法，其特征在于，所述场景目标包括多个子目标；

通过场景目标检测模型检测所述至少一个关键帧图像内是否存在与所述事件对应的场景目标，包括：

通过场景目标检测模型检测所述至少一个关键帧图像，得到所述至少一个关键帧图像内存在的子目标种类、子目标数量、子目标位置信息中的至少一种；

若所述至少一个关键帧图像内存在的子目标种类和/或子目标数量满足以下条件中的至少一种，则确定所述至少一个关键帧图像内存在与所述事件对应的场景目标：

所述至少一个关键帧图像内存在的子目标种类大于预设种类阈值；

所述至少一个关键帧图像内存在的子目标数量大于预设数量阈值；

所述至少一个关键帧图像内存在的特定子目标种类的目标数量大于预设数量阈值；

所述至少一个关键帧图像内存在的子目标之间的位置信息满足预设位置条件。
根据权利要求2至4任一项所述的事件检测方法，其特征在于，所述确定所述场景目标在所述预设场景区域中的实际位置和/或停留时长，包括以下至少一项：

通过所述场景目标检测模型对所述至少一个关键帧图像进行检测，根据检测得到的输出结果中包含的场景目标的位置确定场景目标在所述预设场景区域中的实际位置；

通过所述场景目标检测模型对所述至少一个关键帧图像进行检测，根据检测得到的输出结果中包含的子目标的类别、子目标的置信度和子目标的位置信息，确定场景目标在所述预设场景区域中的实际位置；

通过所述场景目标检测模型对所述至少一个关键帧图像进行检测，将连续出现所述场景目标的关键帧图像的帧数作为所述停留时长。
根据权利要求1至5任一项所述的事件检测方法，其特征在于，所述根据所述实际位置和/或停留时长判断与所述预设场景区域对应的所述事件是否发生，包括：

若所述实际位置位于所述预设场景区域的预设区域范围和/或所述停留时长大于预先配置的目标时长；则判断所述事件发生。
根据权利要求6所述的事件检测方法，其特征在于，

所述实际位置是否位于所述预设场景区域的预设区域范围通过如下方式判断：

判断所述实际位置对应的实际区域与所述预设场景区域的预设区域范围之间的重叠度是否大于预设阈值；

若大于所述预设阈值，则判断所述实际位置位于所述预设场景区域的预设区域范围。
一种事件检测装置，其特征在于，包括：

第一获取模块，配置成获取预设场景区域的视频流数据，并根据所述视频流数据获取至少一个关键帧图像；

检测模块，配置成检测所述至少一个关键帧图像内是否存在与所述事件对应的场景目标；

第二获取模块，配置成若存在，则确定所述场景目标在所述预设场景区域中的实际位置和/或停留时长；

判断模块，配置成根据所述实际位置和/或停留时长判断与所述预设场景区域对应的所述事件是否发生。
根据权利要求8所述的事件检测装置，其特征在于，所述检测模块配置成：

通过场景目标检测模型检测所述至少一个关键帧图像内是否存在与所述事件对应的场景目标。
根据权利要求9所述的事件检测装置，其特征在于，所述装置还包括模型训练模块，配置成：

对样本图像中的场景目标进行标注，得到标注信息，所述标注信息包括所述样本图像中组成场景目标的各子场景目标的分类信息和位置信息，以及所述样本图像中的场景目标的位置信息；

根据所述标注信息，对所述样本图像对应的预置框或位置点进行标签分配，得到所述样本图像对应的预置框或位置点的样本标签；

执行迭代步骤，直至损失收敛；所述迭代步骤包括：将所述样本图像输入初始场景目标检测模型，得到初始检测结果；根据初始检测结果、标注信息和所述样本标签，确定损失值；根据损失值，对初始场景目标检测模型的参数进行更新，得到更新后的初始场景目标检测模型；

将损失收敛后得到的场景目标检测模型作为所述场景目标检测模型。
根据权利要求9至10任一项所述的事件检测装置，其特征在于，所述场景目标包括多个子目标；所述检测模块配置成：

通过场景目标检测模型检测所述至少一个关键帧图像，得到所述至少一个关键帧图像内存在的子目标种类、子目标数量、子目标位置信息中的至少一种；

若所述至少一个关键帧图像内存在的子目标种类和/或子目标数量满足以下条件中的至少一种，则确定所述至少一个关键帧图像内存在与所述事件对应的场景目标：

所述至少一个关键帧图像内存在的子目标种类大于预设种类阈值；

所述至少一个关键帧图像内存在的子目标数量大于预设数量阈值；

所述至少一个关键帧图像内存在的特定子目标种类的目标数量大于预设数量阈值；

所述至少一个关键帧图像内存在的子目标之间的位置信息满足预设位置条件。
根据权利要求9至11任一项所述的事件检测装置，其特征在于，所述第二获取模块，配置成以下至少一项：

通过所述场景目标检测模型对所述至少一个关键帧图像进行检测，根据检测得到的输出结果中包含的场景目标的位置确定场景目标在所述预设场景区域中的实际位置；

通过所述场景目标检测模型对所述至少一个关键帧图像进行检测，根据检测得到的输出结果中包含的子目标的类别、子目标的置信度和子目标的位置信息，确定场景目标在所述预设场景区域中的实际位置；

通过所述场景目标检测模型对所述至少一个关键帧图像进行检测，将连续出现所述场景目标的关键帧图像的帧数作为所述停留时长。
根据权利要求8至12任一项所述的事件检测装置，其特征在于，所述判断模块配置成：

若所述实际位置位于所述预设场景区域的预设区域范围和/或所述停留时长大于预先配置的目标时长；则判断所述事件发生。
一种电子设备，其特征在于，包括处理器以及存储器，所述存储器存储有计算机可读取指令，当所述计算机可读取指令由所述处理器执行时，运行如权利要求1-7任一项所述的方法。
一种存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时运行如权利要求1至7任一项所述的方法。