CN113743444A - 人群异常检测方法、装置、电子设备及存储介质 - Google Patents
人群异常检测方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN113743444A CN113743444A CN202110613426.4A CN202110613426A CN113743444A CN 113743444 A CN113743444 A CN 113743444A CN 202110613426 A CN202110613426 A CN 202110613426A CN 113743444 A CN113743444 A CN 113743444A
- Authority
- CN
- China
- Prior art keywords
- abnormal
- geographic
- crowd
- sequence data
- geographic grid
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/20—Services signaling; Auxiliary data signalling, i.e. transmitting data via a non-traffic channel
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/021—Services related to particular areas, e.g. point of interest [POI] services, venue services or geofences
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Alarm Systems (AREA)
Abstract
本申请提出了一种人群异常检测方法、装置、电子设备及存储介质,包括获取N个地理网格当前时刻的终端设备的实时信令序列数据;针对N个地理网格中的任一地理网格,根据当前时刻的时刻类型,确定任一地理网格的实时信令序列数据对应的历史信令序列数据;对实时信令序列数据与历史信令序列数据进行拼接,以生成待检测序列数据;基于每个地理网格的待检测序列数据,从N个地理网格中确定存在人群异常的异常地理网格。本申请中,降低了人群异常聚集检测的难度,基于信令数据,提高检测效率的同时可以实现高覆盖的人群异常聚集检测,不依赖于视频监控设备,降低了检测成本,进而实现了高效、及时、兼顾成本且覆盖面广的人群异常聚集的检测。
Description
技术领域
本申请涉及数据统计分析领域,尤其涉及一种人群异常检测方法、装置、电子设备及存储介质。
背景技术
目前社会管理过程中,人群的异常聚集往往伴随社会性问题的发生,对于人群的异常聚集需要进行重点关注。
相关技术中,针对人群的异常聚集情况的检测,依赖于视频监控设备,由视频监控设备采集视频图像信息后,进行技术分析获取人群的异常聚集情况。由于视频监控设备的布放成本较高,且依赖于采集视频图像信息获取人群异常聚集的情况时效性较低,故而,如何实现高效、实时且兼顾成本的人群的异常聚集检测,成为当前需要解决的问题。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本申请第一方面提出一种人群异常检测方法。
本申请第二方面还提出一种人群异常检测装置。
本申请第三方面提出一种电子设备。
本申请第四方面提出一种计算机可读存储介质。
本申请第五方面提出一种计算机程序产品。
本申请第一方面提出一种人群异常检测方法,包括:获取N个地理网格当前时刻的终端设备的实时信令序列数据;针对所述N个地理网格中的任一地理网格,根据所述当前时刻的时刻类型,确定所述任一地理网格的实时信令序列数据对应的历史信令序列数据;对所述实时信令序列数据与所述历史信令序列数据进行拼接,以生成待检测序列数据;基于每个地理网格的所述待检测序列数据,从所述N个地理网格中确定存在人群异常的异常地理网格。
另外,本申请第一方面提出的人群异常检测方法,还可以具有如下附加的技术特征:
根据本申请的一个实施例,所述从所述N个地理网格中确定存在人群异常的异常地理网格之后,还包括:获取所述异常地理网格的待检测序列数据的均值和方差,并基于所述均值和所述方差,确定地理网格异常判定值;获取所述异常地理网格当前时刻的人数,并选取所述当前时刻的人数大于所述异常判定值的异常地理网格,作为最终的异常地理网格。
根据本申请的一个实施例,所述人群异常检测方法,还包括:获取所述异常地理网格的坐标信息;基于所述坐标信息,对所述异常地理网格进行地理网格聚合处理,生成人群异常区域。
根据本申请的一个实施例,所述基于所述坐标信息,对所述异常地理网格进行地理网格聚合处理,生成人群异常区域,包括:根据所述异常地理网格的坐标信息,确定所述异常地理网格的中心点坐标;基于所述中心点坐标,确定任意两个异常地理网格之间的距离;根据所述距离和所述异常地理网格的坐标信息,对所述异常地理网格进行分组,形成聚合地理网格分组;对属于同一分组内的异常地理网格进行地理网格聚合处理,生成所述人群异常区域。
根据本申请的一个实施例,所述根据所述距离和所述异常地理网格的坐标信息,对所述异常地理网格进行分组,形成聚合地理网格分组,包括:选取所述距离小于预设距离阈值的异常地理网格对,其中,所述任意两个异常地理网格构成一个异常地理网格对;基于所述异常地理网格的坐标信息,从所述异常地理网格对中确定空间位置上连续的一个或多个所述聚合地理网格分组,其中,所述聚合地理网格分组包括一个或多个异常地理网格对。
根据本申请的一个实施例,所述获取N个地理网格当前时刻的终端设备的实时信令序列数据之前,还包括:获取所述N个地理网格的历史信令数据;针对所述N个地理网格中任一地理网格,对所述任一地理网格的历史信令数据按照预设时间间隔进行数据切分,以生成多个信令子序列数据;对所述信令子序列数据的时刻进行时间类型识别,并将属于同一时间类别的信令子序列数据,按照时间顺序从早到晚的顺序进行拼接,获取每个时间类型的历史信令序列数据。
根据本申请的一个实施例,所述人群异常检测方法,还包括:获取所述任一地理网格内的历史信令数据对应的采集时间长度;响应于所述采集时间长度大于预设时间长度,基于聚类算法进行时间类型识别;响应于所述采集时间长度小于或者等于所述预设时间长度,按照分类规则进行时间类型识别。
根据本申请的一个实施例,所述生成所述人群异常区域之后,还包括:获取所述人群异常区域内的最大坐标和最小坐标,作为所述人群异常区域的区域边界。
根据本申请的一个实施例,所述生成所述人群异常区域之后,还包括:获取属于所述人群异常区域内的地理网格,并统计属于所述人群异常区域的每个地理网格在当前时刻的人数,以及设定时长的历史人数;将所述当前时刻的人数和所述历史人数拼接,生成所述人群异常区域的人数序列数据。
本申请第二方面还提出一种人群异常检测装置,包括:获取模块,用于获取N个地理网格当前时刻的终端设备的实时信令序列数据;所述获取模块,还用于针对所述N个地理网格中的任一地理网格,根据所述当前时刻的时刻类型,确定所述任一地理网格的实时信令序列数据对应的历史信令序列数据;拼接模块,用于对所述实时信令序列数据与所述历史信令序列数据进行拼接,以生成待检测序列数据;检测模块,用于基于每个地理网格的所述待检测序列数据,从所述N个地理网格中确定存在人群异常的异常地理网格。
本申请第二方面提出的人群异常检测装置还可以具有如下附加的技术特征:
根据本申请的一个实施例,所述人群异常检测装置,还包括:计算模块,用于获取所述异常地理网格的待检测序列数据的均值和方差,并基于所述均值和所述方差,确定地理网格异常判定值;异常地理网格确定模块,用于获取所述异常地理网格当前时刻的人数,并选取所述当前时刻的人数大于所述异常判定值的异常地理网格,作为最终的异常地理网格。
根据本申请的一个实施例,所述人群异常检测装置,还包括:坐标获取模块,用于获取所述异常地理网格的坐标信息;聚合模块,用于基于所述坐标信息,对所述异常地理网格进行地理网格聚合处理,生成人群异常区域。
根据本申请的一个实施例,所述聚合模块,还用于:根据所述异常地理网格的坐标信息,确定所述异常地理网格的中心点坐标;基于所述中心点坐标,确定任意两个异常地理网格之间的距离;根据所述距离和所述异常地理网格的坐标信息,对所述异常地理网格进行分组,形成聚合地理网格分组;对属于同一分组内的异常地理网格进行地理网格聚合处理,生成所述人群异常区域。
根据本申请的一个实施例,所述聚合模块,还用于:选取所述距离小于预设距离阈值的异常地理网格对,其中,所述任意两个异常地理网格构成一个异常地理网格对;基于所述异常地理网格的坐标信息,从所述异常地理网格对中确定空间位置上连续的一个或多个所述聚合地理网格分组,其中,所述聚合地理网格分组包括一个或多个异常地理网格对。
根据本申请的一个实施例,所述人群异常检测装置,还包括:所述获取模块,还用于获取所述N个地理网格的历史信令数据;切分模块,用于针对所述N个地理网格中任一地理网格,对所述任一地理网格的历史信令数据按照预设时间间隔进行数据切分,以生成多个信令子序列数据;所述拼接模块,还用于对所述信令子序列数据的时刻进行时间类型识别,并将属于同一时间类别的信令子序列数据,按照时间顺序从早到晚的顺序进行拼接,获取每个时间类型的历史信令序列数据。
根据本申请的一个实施例,所述人群异常检测装置,还包括:所述获取模块,还用于获取所述任一地理网格内的历史信令数据对应的采集时间长度;识别模块,用于响应于所述采集时间长度大于预设时间长度,基于聚类算法进行时间类型识别;所述识别模块,还用于响应于所述采集时间长度小于或者等于所述预设时间长度,按照分类规则进行时间类型识别。
根据本申请的一个实施例,所述人群异常检测装置,还包括:边界生成模块,用于获取所述人群异常区域内的最大坐标和最小坐标,作为所述人群异常区域的区域边界。
根据本申请的一个实施例,所述人群异常检测装置,还包括:人数获取模块,用于获取属于所述人群异常区域内的地理网格,并统计属于所述人群异常区域的每个地理网格在当前时刻的人数,以及设定时长的历史人数;所述拼接模块,还用于将所述当前时刻的人数和所述历史人数拼接,生成所述人群异常区域的人数序列数据。
本申请第三方面提出了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述第一方面提出的人群异常检测方法。
本申请第四方面提出了一种计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行第一方面提出的人群异常检测方法。
本申请第五方面提出了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据上述第一方面提出的人群异常检测方法。
本申请提出的人群异常检测方法及装置,获取N个地理网格的当前时刻的终端设备的实时信令序列数据,并根据时间类型确定N个地理网格中每个地理网格对应的历史信令序列数据,将实时信令序列数据与历史信令序列数据进行拼接,生成待检测序列数据,基于待检测序列数据获取N个地理网格中出现人群异常聚集情况的异常地理网格。本申请中,将地理位置信息划分成N个地理网格,降低了人群异常聚集检测的难度,通过信令数据,实现对于人群是否出现异常聚集情况的判断,提高检测效率的同时实现了高覆盖的人群异常聚集检测,不依赖于视频监控设备,降低了检测的成本,进而实现了高效、及时、兼顾成本且覆盖面广的人群异常聚集的检测。
应当理解,本申请所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请一实施例的人群异常检测方法的流程示意图;
图2为本申请另一实施例的人群异常检测方法的流程示意图;
图3为本申请另一实施例的人群异常检测方法的流程示意图;
图4为本申请另一实施例的人群异常检测方法的流程示意图;
图5为本申请另一实施例的人群异常检测方法的流程示意图;
图6为本申请另一实施例的人群异常检测方法的流程示意图;
图7为本申请另一实施例的人群异常检测方法的流程示意图;
图8为本申请一实施例的人群异常检测装置的结构示意图;
图9为本申请另一实施例的人群异常检测装置的结构示意图;
图10为本申请一实施例的电子设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
下面参照附图描述本申请实施例的人群异常检测方法、装置、电子设备和存储介质。
图1为申请一实施例的人群异常检测方法的流程示意图,如图1所示,该方法包括:
S101,获取N个地理网格当前时刻的终端设备的实时信令序列数据。
目前,存在有普及率非常高的终端设备,比如手机设备、可穿戴设备等便携式电子设备。该终端设备在使用过程中,可以实时地或者按照设定的间隔时间发送信令数据至对应的接收设备,以通过信令数据实现终端设备与接收设备之间的信息或数据的交互。信令数据中可以包括终端设备的设备信息、时间信息、空间信息、信令数据使用人数等等。其中,空间信息为通过算法进行编码生成的可以表征地理位置的字符串,比如通过一种地址编码算法(geohash)对地理位置编码生成的一维字符串,可以对应到地图上的设定面积的地理网格。信令数据使用人数,可以理解为,基于存在信令数据交互的终端设备的数量所获取的使用者的人数。
进一步地,基于终端设备的高普及率,可以将终端设备对应的信令数据作为使用者的替代信息,比如,使用者的运动轨迹、某一区域或者某一时间范围内使用者的人数、终端设备发送或者接受信令数据的时间等等。
需要说明的是,可以设定信令数据人数统计的时间间隔,比如设定时间间隔为5分钟,则信令数据每5分钟统计一次。
一般情况下,针对某一个地理位置,通常可以采用经纬度坐标对该地理位置进行标记,其中,经纬度坐标是一个二维数组,表示的并非地球表面的某一个点,而是泛指一片区域,所表示的区域的范围与经纬度的取值精度直接相关。因此,可以基于算法,以及某一片区域的经纬度,将该区域划分成多个地理网格,比如geohash算法。geohash算法可以对地图或者地图上的某一个区域进行划分,然后采用base32编码的方式,将地图或者地图上的某一区域划分成一块一块的矩形块,其中,划分获取到的一块一块的矩形块即为本申请实施例中的地理网格。
本申请实施例中,可以将N个地理网格的当前时刻的信令数据确定为N个地理网格的实时信令数据。通过对信令数据的获取和数据分析,可以间接获取终端设备使用者的相关信息。比如,根据信令数据中所包含的空间信息和时间信息,可以获取到使用者在某一个时刻所处的地理位置。
为了实现对人群的异常聚集的实时检测,可以通过终端设备的服务提供商获取到终端设备的信令数据,进而获取其中可用于判断人群是否异常聚集的有效信息,比如地理位置信息、时间信息以及信令数据的数量等等。进一步地,通过对信令数据中的有效信息的分析,获取到某一个时刻某一个地理位置的人群数量,并结合该地理位置的历史人群聚集数据,判断其是否出现异常聚集。
其中,为了更好的统计终端设备的地理位置信息,可以使用多种编码方式对地理位置信息进行编码,进而获取到可以表征地理位置的字符,比如可以使用geohash算法将某一个地理位置的经纬度数据编码成一个一维的字符串。
本申请实施例中,使用geohash算法对地球表面的经纬度进行编码,可以将地球的表面划分称为N个地理网格,基于设定的geohash算法的精度,对每个地理网格设定固定的面积大小,每个地理网格均对应地球表面的某个地理位置。
为了实现N个地理网格的当前时刻的人群的异常聚集的检测,需要获取N个地理网格当前时刻的人群聚集的信息,包括地理网格的信息、时间信息以及信令数据数量,其中,信令数据的数量可以理解为发送了信令数据的终端设备的数量,且时间信息和信令数据数量与地理网格信息对应。
进一步地,可以对实时信令数据进行预处理,生成实时信令序列数据。可选地,根据所设定的数据格式,对获取到的地理网格信息,以及该地理网格信息对应的时间信息以及信令数据数量进行格式转换,进而获取到终端设备在当前时刻的实时信令序列数据。
比如,设定需要获取50个地理网格的实时信令序列数据,每5分钟进行一次50个地理网格的信令数据统计,则可以获取到每个地理网格当前时刻的人群聚集数为Pwt,其中, w为地理网格身份标识号(identity document,id),t为精确到分钟的时间。进一步地,实时信令序列数据可以理解为一串按时间先后排序的Pwt的序列。
S102,针对N个地理网格中的任一地理网格,根据当前时刻的时刻类型,确定任一地理网格的实时信令序列数据对应的历史信令序列数据。
人群的聚集情况受到多种因素的影响,比如,不同的地理位置存在不同的人群分布情况,再比如,相同的地理位置在不同的时间,其人群分布情况亦存在不同等等。为了实现更加精准的人群异常聚集情况的检测,需要将当前时刻的人群聚集情况与历史人群聚集情况进行对比。
一般情况下,在历史时间里,相同的地理位置的相同类型的时间上,人群的聚集情况大致类似。比如,针对某一个大型商场,纵向对比该商场近三年的人群聚集情况,可以发现,在每周的非工作日的时间内该商场的人流量较大,且通过统计学的静态分布可知,该大型商场的历史聚集人数存在范围值。由此可以判断,未来的时间内,在人群没有出现异常聚集的场景下,该商场在每周休息日的时候人流量会保持在基于历史数据获取到的范围值内。
本申请实施例中,针对N个地理网格中的每个地理网格,可以存在不同时间类型的历史信令序列数据。N个地理网格的当前时刻的终端设备的实时信令序列数据中,包含有时间信息,该时间信息可以根据历史信令序列数据所设定的时间类型进行识别,比如,春节假期可以被归类于节假日,周一到周五可以被归类于工作日等等。
进一步地,根据当前时刻N个地理网格的终端设备的实时信令序列数据中的时间信息所对应的时间类型,可以从N个地理网格中的每个时间类型对应的历史信令序列数据中获取到N个地理网格当前时刻的实时信令序列数据所属的时间类型对应的相同时间类型的历史信令序列数据。
S103,对实时信令序列数据与历史信令序列数据进行拼接,以生成待检测序列数据。
为了更加精准的识别当前时刻的实时信令序列数据中所携带的人群聚集情况是否出现异常,需要将实时信令序列数据与历史信令序列数据进行对比。
为了降低实时信令序列数据的识别难度,可以将实时信令序列数据与历史信令序列数据进行拼接,使得在检测过程中可以同时获取到历史信令序列数据和实时信令序列数据中携带的人群聚集信息。
其中,将历史信令序列数据中携带的历史人群聚集情况并作为检测标准,进而生成包含有历史信令序列数据和实时信令序列数据的全新序列数据。
进一步地,可以将实时信令序列数据拼接于历史信令序列数据之后,使得检测过程中,可以先行获取历史信令序列数据中的人群正常聚集的历史数据,进而在读取序列数据中的实时信令序列数据后,将实时信令序列数据中携带的人群聚集情况直接与先行获取到的历史信令序列数据中的历史人群聚集情况进行比较,有效缩短了对比时间。
进一步地,将历史信令序列数据与实时信令序列数据拼接,进而生成待检测序列数据。
比如,每5分钟获取一次的50个地理网格对应的聚集人数为Pwt,则当前时刻的实时信令序列数据为一串按时间先后排序的Pwt的序列,设定当前时刻所属的时间类型为q,则可以获取到历史信令序列数据为P′wq,进一步地,将实时信令序列数据Pwt拼接至历史信令序列数据P′wq之后可得待检测序列数据为Pw。
S104,基于每个地理网格的待检测序列数据,从N个地理网格中确定存在人群异常的异常地理网格。
针对N个地理网格中某一个地理网格的待检测序列数据,将其中包含的实时信令序列数据与历史信令序列数据进行比较,进而判断当前时刻的该地理网格是否出现人群异常聚集的情况。
比如,针对地理网格A在夏季节假日的人群异常聚集检测,在地理网格A的历史信令序列数据中,其对应的某一个大型商场在夏季的节假日,人流量范围值在每天5000人~10000人。获取地理网格A当前时刻终端设备的实时信令序列数据,其中,当前时刻的时间类型为夏季的节假日,人流量在当日达到了20000人次,基于该情况可以判断,当前时刻的地理网格A出现了人群异常聚集的情况。
可选地,可以设置人群异常聚集检测的模型,将待检测序列数据输入至人群异常聚集检测的模型中,根据模型的输出结果,判断待检测序列数据对应的地理网格是否出现人群异常聚集。
本申请实施例中,历史信令序列数据与实时信令序列数据均属于时间序列数据,一般情况下,时间序列数据具有周期性(seasonal)以及趋势性(trend),对时间序列数据进行异常检测时,需要基于时间序列数据的两个基本特性进行异常检测,不能将某一个时间序列数据作为孤立的样本点处理。进一步地,可以使用时间序列异常检测算法(SeasonalHybrid Extreme Studentized Deviate,S-H-ESD)。
针对某一个地理网格对应的待检测序列数据,通过分析其中历史信令序列数据携带的历史人群聚集情况,可以获取到该地理网格的历史人群聚集的周期性以及趋势性。该地理网格当前时刻的实时信令序列数据中的人群聚集情况与同一待检测序列数据中的历史信令序列数据在时间周期上是对应的。
进一步地,将该地理网格的实时信令序列数据中携带的人群聚集情况与获取到的该地理网格的历史人群聚集的趋势进行对比,若该地理网格的当前时刻的人群聚集情况属于获取到历史人群聚集的趋势的范围内,则可以判断该地理网格当前时刻不存在人群异常聚集的情况,若该地理网格的当前时刻的人群聚集情况超过获取到的历史人群聚集的趋势的范围上限或者低于获取到的历史人群聚集的趋势范围下限,则可以判断该地理网格当前时刻存在人群异常聚集情况,进而将该地理网格确定为异常地理网格。
本申请提出的人群异常检测方法,获取N个地理网格的当前时刻的终端设备的实时信令序列数据,并根据时间类型确定N个地理网格中每个地理网格对应的历史信令序列数据,将实时信令序列数据与历史信令序列数据进行拼接,生成待检测序列数据,基于待检测序列数据获取N个地理网格中出现人群异常聚集情况的异常地理网格。本申请中,将地理位置信息划分成N个地理网格,降低了人群异常聚集检测的难度,通过信令数据,实现对于人群是否出现异常聚集情况的判断,提高检测效率的同时实现了高覆盖的人群异常聚集检测,不依赖于视频监控设备,降低了检测的成本,进而实现了高效、及时、兼顾成本且覆盖面广的人群异常聚集的检测。
上述实施例的基础上,关于历史信令序列数据的获取,可结合图2进一步理解,图2为本申请另一实施例的人群异常检测方法的流程示意图,如图2所示,该方法包括:
S201,获取N个地理网格的历史信令数据。
一般情况下,随着时间的变化,人群聚集的情况存在周期性的波动。比如,针对某一个地理网格对应的公园,工作日的公园呈现白天人少晚上人多的情况,节假日的公园则出现全天的人流量很多的情况,夏季的公园的人流量远远高于冬季的公园等等。为了更加准确的实现对于某一个地理网格的当前时刻的人群异常聚集的检测,需要获取该地理网格的人群聚集的历史信令数据,以分析该地理网格在正常情况下,历史人群的聚集情况的周期和趋势。
可以从终端设备的服务提供商处,获取N个地理网格的历史信令数据,其中,历史信令数据包含有终端设备的设备信息、历史时间信息、历史空间信息、历史信令数据使用人数等等。其中,空间信息可以为通过算法进行编码生成的可以表征地理位置的字符串,比如上述实施例提出的通过geohash算法对地理位置编码生成的一维字符串。
本申请实施例中,可以获取N个地理网格对应的在过去的连续的设定时长范围内的信令数据,即为N个地理网格对应的历史信令数据。
比如,设定获取50个地理网格5月1日至5月31日时间跨度范围内对应的历史信令数据,其中,设定每5分钟对该50个地理网格的人群聚集情况进行一次统计,可以获取到 50个地理网格对应的人群聚集人数P′wt,其中,w为地理网格id,t为精确到分钟的时间。进一步地,将获取到的历史信令数据按照时间先顺序进行排序,进而获取到一串的P′wt序列,即为50个地理网格对应的采集时间长度从5月1日至5月31日的历史信令数据。
S202,针对N个地理网格中任一地理网格,对任一地理网格的历史信令数据按照预设时间间隔进行数据切分,以生成多个信令子序列数据。
为了实现人群异常聚集的检测,针对获取到的历史信令数据需要进行数据的分类和预处理。由于本申请实施例中的人群异常检测的方法基于时间序列数据统计人群聚集情况的不同,因此,需要将历史信令数据按照预设的时间间隔进行分割,比如按天进行数据切分。
针对N个地理网格中的某一个地理网格,对该地理网格对应历史信令数据,按预设的时间间隔进行分割,生成多个信令子序列数据。比如,设定该地理网格对应的历史信令数据的时间范围为5月1日至5月31日,将该历史信令数据按天进行数据切分,可以获取到 31个信令子序列数据。
需要说明的是,N个地理网格中,每一个地理网格均需要对其对应的历史信令数据按预设的时间间隔进行数据切割。
比如,针对50个地理网格(W1,W2,…,W50),设定获取每个地理网格5月1日至5月 31日对应的历史信令数据P′wt,可以将获取到的历史信令数据P′wt组成的序列按天进行数据切分,获取到31个信令子序列数据P′wdt,其中,d表示日期,t不包含日期。
再比如,同样针对50个地理网格(W1,W2,…,W50),设定获取每个地理网格5月1日至5月31日对应的历史信令数据P′wt,可以将获取到的历史信令数据P′wt组成的序列以设定的4个小时的时间间隔进行数据切分,获取到186个信令子序列数据P′wdt',其中,d表示日期,t不包含日期。
S203,对信令子序列数据的时刻进行时间类型识别,并将属于同一时间类别的信令子序列数据,按照时间顺序从早到晚的顺序进行拼接,获取每个时间类型的历史信令序列数据。
本申请实施例中,针对N个地理网格中的某一个地理网格,获取该地理网格的历史信令数据划分生成的多个信令子序列数据后,需要基于时间类型对多个信令子序列数据进行归类,进而生成该地理网格中的时间类型对应的历史信令序列数据。
进一步地,可以设置该地理网格的历史信令数据所对应的预设采集时间长度,并基于预设时间长度与该地理网格的历史信令数据的实际采集长度的对比结果,对获取到的多个信令子序列数据进行分类。可以理解为,采集时间长度大于预设的采集时间长度所采集到的历史信令数据的数量可以满足聚类自适应归类方法所需的样本数量。
可选地,响应于采集时间长度大于预设时间长度,基于聚类算法进行时间类型识别。
针对N个地理网格中的某一个地理网格,当该地理网格对应的历史信令数据的实际采集时间长度大于预设的采集时间长度时,可以通过聚类算法,使该地理网格的多个信令子序列数据实现自适应分类,进而实现该地理网格的多个信令子序列数据的分类。
比如,设定历史信令数据所对应的预设采集时间长度为一年等于365天,针对某一个地理网格,设定其历史信令数据P′wt的采集时间长度超过一年,将该历史信令数据P′wt按天进行数据切割,获取到数量大于365的信令子序列数据P′wdt,则通过聚类将全部的信令子序列数据P′wdt归类至k个时间类型内,其中,时间类型的数量k由聚类模型基于识别到的信令子序列数据的时间类型而自动生成。进一步地,将k个时间类型下的信令子序列数据按照时间先后顺序进行拼接,进而生成k个时间类型对应的历史信令序列数据 P′w1,P′w2,…,P′wk。
需要说明的是,通过聚类算法实现信令子序列数据的分类,可以使信令子序列数据的分类结果覆盖面更广,可以理解为,通过聚类方法的进行的信令子序列数据的分类,可以在聚类的过程中识别出更多的惯用的时间类型之外的其他时间类型。比如,严冬盛夏的休息日人流量少于暖春凉秋的休息日的人流量,通过聚类算法可以更容易获取该类型的人群聚集的规律,将严冬盛夏归为一个时间类型,将暖春凉秋归为一个时间类型。
其中,聚类算法可以使用基于密度的聚类算法,比如dbscan算法(Density-BasedSpatial Clustering of Applications with Noise,DBSCAN),也可以使用基于划分法的聚类算法,比如K均值聚类算法(K-MEANS算法)等等。
将多个信令子序列数据进行聚类,在聚类的过程中识别时间类型,进而将信令子序列数据分别归类到获取的各个时间类型中,生成时间到时间类型的映射关系。
可选地,响应于采集时间长度小于或者等于预设时间长度,按照分类规则进行时间类型识别。
针对N个地理网格中的某一个地理网格,当该地理网格对应的历史信令数据的采集时间长度小于或者等于预设时间长度时,该场景下采集到的历史信令数据数量相对较少,不满足聚类的自适应归类方法所需求的样本数量。该场景下,需要人工进行信令子序列数据的分类。可以设置一个分类规则,该规则中包含有人工设置的多个时间类型,以及可以归类于某一个时间类型的信令子序列数据的相关特征。基于该分类规则,将该地理网格对应的多个信令子序列数据进行时间类型上的归类,进而生成时间到时间类型的映射关系。
比如,设定历史信令数据所对应的预设采集时间长度为一年等于365天,针对某一个地理网格,设定其历史信令数据P′wt的采集时间长度为5月1日至5月31日,将该历史信令数据P′wt按天进行数据切割,获取到31个信令子序列数据P′wdt。由于31小于365,需要基于设定的分类规则对信令子序列数据进行分类。进一步地,设定31个信令子序列数据P′wdt进行分类的时间类型分别为工作日、节假日以及非工作和/或节假日的三个时间类型,在5 月1日至5月31日的采集时间长度中,工作日共计20天,节假日共计5天,非工作和/或节假日共计6天,按照设定的规则进行分类,则工作日的时间类型中包含有20个信令子序列数据,节假日的时间类型中包含有5个信令子序列数据,非工作和/或节假日的时间类型中包含有6个信令子序列数据。进一步地,将每个时间类型下的多个信令子序列数据按照时间先后顺序进行拼接,分别生成工作日时间类型下的历史信令序列数据P′w1、节假日时间类型下的历史信令序列数据P′w2以及非工作和/或节假日时间类型下的历史信令序列数据 P′w3。
需要说明的是,上述针对某一个地理网格的历史信令数据的分类以及预处理方法适用于全部的N个地理网格,每一个地理网格均可以基于上述实施例中的方法,获取其对应的包含有一个或者多个时间类型的历史信令序列数据。
进一步地,设定N个地理网格中,每个地理网格输出了k个时间类型的历史信令序列数据,则将每个地理网格进行上述操作后,可以获取M个历史信令序列数据集合,公式如下:
本申请提出的人群异常检测方法,对获取到的N个地理网格的历史信令数据按预设的时间间隔进行切分生成信令子序列数据,并将信令子序列数据进行时间类型的归类,进一步地,将属于同一时间类型的信令子序列数据按时间先后顺序进行拼接,获取到N个地理网格中每个地理网格对应的全部时间类型的历史信令序列数据。本申请中,通过对历史信令数据的分类以及预处理,实现了历史信令序列数据的获取,为获取人群异常聚集的周期性和趋势性提供了数据,进而提高了对当前时刻的人群异常聚集情况检测的准确程度,实现了高效、及时、兼顾成本且覆盖面广的人群异常聚集的检测。
一般情况下,针对某一个地理网格,可以基于其实时信令序列数据中携带的当前时刻的人群聚集情况与历史信令数据中所携带的历史人群聚集情况之间进行对比的结果,确定该地理网格是否出现人群的异常聚集,将全部的不符合该地理网格基于历史信令数据获取到的人群聚集的趋势性和周期性的情况确定为人群的异常聚集的检测结果,比如人数骤增、人数骤降等等。由于本申请实施例提出的人群异常聚集的检测方法主要针对人数骤增的异常聚集情况,故而,在确定N个地理网格内的出现人群异常聚集情况的异常地理网格后,需要对该部分异常地理网格的人群异常聚集情况进行进一步地统计分析,以获取其中人群骤增的异常地理网格。
为了更准确的定位人群异常聚集的范围,可结合图3进一步理解,图3为本申请另一实施例的人群异常检测方法的流程示意图,如图3所示,该方法包括:
S301,训练时序异常检测模型,基于训练好的时序异常检测模型,确定N个地理网格中存在人群异常的异常地理网格。
本申请实施例中,针对某一个地理网格,通过对比其历史信令数据与实时信令数据实现该地理网格中人群异常聚集的检测,可以理解为,通过对比该地理网格不同的时间点的人群聚集情况实现人群异常聚集检测。
因此,可以设置一个时序异常检测模型,并获取N个地理网格的历史信令数据对该时序异常检测模型进行训练。比如,可以将某一个地理网格过去十年的历史信令数据作为训练样本,其中,每个训练样本均存在一个人群聚集标签,该标签可以指示该训练样本是否正常,比如,可以使用数字1标识训练样本正常,使用数字0标识训练样本异常。
进一步地,将训练样本输入至时序异常检测模型进行训练,将预测输出的人群聚集结果与实际的历史信令数据中对应的人群聚集进行对比,并基于对比的结果对时序异常检测模型进行各项参数的调整,直至最终训练输出的结果可以满足实际应用所需。
再进一步,将N个地理网格的待检测序列数据输入至训练好的时序异常检测模型中,该模型可以预测出每个待检测序列数据是否出现人群异常聚集,确定出现人群异常聚集的待检测序列数据所对应的地理网格,即为从N个地理网格中确认出现人群异常聚集情况的异常地理网格。
S302,获取异常地理网格的待检测序列数据的均值和方差,并基于均值和方差,确定地理网格异常判定值。
一般情况下,某一地点的人群骤增的情况存在不可控性,本申请实施例中虽然可以根据N个地理网格的历史聚集人数获取该地理网格人群骤增的周期性和趋势性,但是在异常地理网格中,同样存在正常人群聚集的情况。比如,某个大型商场首次举办的大型活动,纵向对比该商场的历史人群聚集情况,该商场本次活动过程中商场的聚集人群人数出现骤增,但是横向对比其它地段、条件等各项参数配置相近的商场的类似活动中的人群聚集情况,可以判断,该商场本次活动的人群聚集情况属于正常聚集范围。
因此,需要对异常地理网格中人群增加的情况进行进一步地判断,获取其中出现异常骤增的地理网格。针对某一个异常地理网格,可以对其历史信令数据进行统计概率的静态分布,进而获取该地理网格人群正常增加的范围。进一步地,可以通过如下公式获取该地理网格的历史人群正常聚集的人数范围上限X:
进一步地,该地理网格的历史人群正常聚集的人数范围上限X即为该地理网格对应的地理网格异常判定值。再进一步,可以获取全部异常地理网格对应的待检测序列数据,进而获取全部异常地理网格对应的地理网格异常判定值。
比如,在上述对50个地理网格(W1,W2,…,W50)进行人群异常聚集检测的示例的基础上,设定其中地理网格W1,W7,W15,W22,W38出现聚集的情况。对地理网格 W1,W7,W15,W22,W38进行进一步地的筛选,获取该5个异常地理网格对应的时间类型为q,对应的待检测序列数据为Pw,则可以获取到异常地理网格对应的历史信令序列数据P′wq。进一步地,获取历史信令序列数据P′wq的均值和方差σq,生成每个异常地理网格对应的地理网格异常判定值Xq,其中,地理网格异常判定值
S303,获取异常地理网格当前时刻的人数,并选取当前时刻的人数大于异常判定值的异常地理网格,作为最终的异常地理网格。
确定出现人群异常聚集情况的异常地理网格后,可以获取到每一个异常地理网格对应的待检测序列数据。其中,待检测序列数据中携带有异常地理网格当前时刻的实时信令序列数据以及设定时长的历史信令序列数据。进一步地,基于待检测序列数据携带的当前时刻的实时信令序列数据,获取其中携带的当前时刻异常地理网格的人群聚集人数。
本申请实施例针对的是人群骤增情况下的人群异常聚集情况的检测,因此,可以将获取到的异常地理网格当前时刻的人群聚集人数与获取到的地理网格异常判定值进行比较,筛选出当前时刻的聚集人数大于其对应的地理网格异常判定值的异常地理网格,该异常地理网格的人群增加情况可以理解为异常骤增。
进一步地,将获取到的确定人群骤增异常聚集情况的异常地理网格确定为最终的异常地理网格。
比如,在上述示例的基础上,获取异常地理网格W1,W7,W15,W22,W38对应的待检测序列数据Pw后,将该5个异常地理网格的当前时刻的人群聚集人数与其对应的地理网格异常判定值Xq进行对比,设定该5个异常地理网格中,地理网格W7,W15的当前人群聚集人数小于或等于其对应的地理网格异常判定值Xq,地理网格W1,W22,W38的当前时刻的人群聚集人数大于其对应的地理网格异常判定值Xq,则可以确定地理网格W1,W22,W38即为人群骤增情况的最终的异常地理网格。
本申请实施例提出的人群异常检测方法,通过时序异常检测模型,获取出现人群异常聚集情况的异常地理网格,并对获取到的异常地理网格进行进一步地统计分析,通过异常地理网格的地理网格异常判定值与异常地理网格当前时刻聚集人数的对比结果,确定异常地理网格中人群骤增的异常聚集的地理网格,作为最终的异常地理网格。通过对出现异常聚集情况的地理网格进行进一步地统计分析,有效缩小了人群异常聚集检测的检测范围,从而提高了人群异常聚集检测的准确程度,进而实现了高效、及时、兼顾成本且覆盖面广的人群异常聚集的检测。
一般情况下,同一实际场所往往包括多个地理位置上连续的多个地理网格,为了更好地确定实际场所是否存在异常,可以对异常地理网格做进一步地聚合处理,从而可以从宏观上指导相关人员进行人群异常聚集的预防。进一步地,可结合图4,图4为本申请另一实施例的人群异常检测方法的流程示意图,如图4所示,该方法包括:
S401,获取异常地理网格的坐标信息。
本申请实施例中,异常地理网格可以是基于待检测序列数据获取到的人群聚集人数出现异常的地理网格,也可以是基于人群聚集人数出现异常的地理网格进一步筛选出的人群异常骤增的异常地理网格。
其中,基于初步筛选的异常地理网格生成的人群异常聚集区域,与基于人群聚集人数出现异常的地理网格进一步筛选出的人群异常骤增的异常地理网格生成的人群异常聚集区域,均可以实现对于人群异常聚集情况的检测。
进一步地,确定异常地理网格后,可以根据异常地理网格对应的待检测序列数据中携带的历史信令序列数据和/或实时信令序列数据,获取历史信令序列数据和/或实时信令序列数据中携带的可以表征异常地理网格的地理位置的编码字符串,对地理位置的编码字符串进行解码计算,进而获取到异常地理网格对应的地理位置的坐标信息。
可选地,可以使用geohash算法,geohash算法是通过二分的方法对地理位置的经纬度坐标信息进行编码,将二维的经纬度坐标编码为一维的字符串。
比如,设定N个地理网格中的某一个地理网格中心经纬度坐标为(39.92,116.39),通过geohash算法,对上述地理网格的中心坐标中的纬度坐标进行编码。
将纬度范围(-90,90)二分称为两个区间,分别是(-90,0)以及(0,90),将该地理网格的中心位置的纬度与获取到的两个纬度区间进行对比,若该纬度坐标落入二分获取的前一个纬度区间,则编码为0,若该纬度坐标落入二分获取的后一个纬度区间,则编码为1。
进一步地,将其落入的纬度区间(0,90)再一次进行二分,获取到(0,45)以及(45,90)两个纬度区间,再次将该地理网格中心纬度坐标与第二次二分获取到的两个纬度区间进行对比,若其落入获取的第一个纬度区间,则编码为0,若其落入获取的第二个纬度区间,则编码为1。
将其落入的纬度区间继续进行二分,并基于获取到的两个纬度区间继续对该地理网格中心纬度坐标进行编码,以此类推。根据预设的字符串的精度,获取到该地理网格中心纬度坐标的编码字符串,比如,设定字符串精度到8位,则对于纬度区间的二分次数到达8次时,停止进行纬度区间的二分,进而获取到当前精度下该地理网格中心纬度坐标编码的字符串为10111000。
进一步地,将获取到的最终异常地理网格的地理位置字符串进行解码,获取字符串对应的地理位置的经纬度坐标,进而确定最终的异常地理网格对应的坐标信息。
S402,基于坐标信息,对异常地理网格进行地理网格聚合处理,生成人群异常区域。
N个地理网格中,每一个地理网格可以覆盖地图中的一个规则形状区域,比如矩形。
一般情况下,人群的大型聚集所覆盖到的地理范围存在不稳定性和不可控性,比如,某个大型娱乐活动,参与者所占用的场地面积可以远远大于本申请实施例中的单一地理网格所覆盖到的面积。故而,需要对最终的异常地理网格进行进一步的聚合处理,对于满足聚合条件的异常地理网格进行合并,并将进行合并的异常地理网格作为一个整体,进而生成人群异常聚集区域。
本申请实施例中,可以将异常地理网格的中心点坐标信息映射至地图中,根据地图上异常地理网格的中心点坐标进行两两比较,对于其中满足聚合条件的异常地理网格,可以进行地理网格聚合处理,进而生成出现人群骤增的异常聚集情况的完整区域。
比如,在上述实施例提出的示例的基础上,设定每个地理网格可以映射地图上一个正方形的地理位置,确定最终的异常地理网格为W1,W22,W38,基于其携带的地理位置编码字符串,获取到该3个异常地理网格对应的坐标信息,将异常地理网格W1,W22,W38的坐标信息映射至地图上,获取每个异常地理网格的四个点的坐标进行计算,确定异常地理网格 W1,W22,W38的中心坐标。设定,每个地理网格可以覆盖地图上的一个150m×150m面积的地理网格,则当两个地理网格的中心点在地图上距离小于2×150m时,可以理解为,该两个地理网格在地图上属于同一地点,满足该条件的两个异常地理网格即可进行聚合处理。
基于该设定,对异常地理网格W1,W22,W38的中心坐标之间的距离进行比较,设定异常地理网格W1,W22的中心坐标之间的距离小于2×150m,异常地理网格W38与其他两个异常地理网格W1,W22的中心点坐标之间的距离大于2×150m,则可以将异常地理网格W1,W22进行聚合处理,进而生成人群异常聚集区域Z1,将异常地理网格W38单独作为一个人群异常聚集区域,为Z2。
需要特别说明的是,本申请实施例针对的是人群异常骤增情况下的人群聚集检测,虽然基于初步筛选获取到的异常地理网格生成的人群异常聚集区域也可以体现人群的异常聚集,但是其中包含有除人群异常骤增情况之外的其他异常情况。
本申请提出的人群异常检测方法,通过对异常地理网格的地理网格聚合处理,将满足聚合处理条件的异常地理网格进行合并进而获取到精准的人群异常聚集的区域,使得人群异常聚集检测的结果可以与实际空间的建筑物和/或场景实现对应,为后续对于人群异常聚集的情况判断以及处理措施的执行提供了数据支撑。
进一步地,可结合图5理解,图5为本申请另一实施例的人群异常检测方法的流程示意图,如图5所示,该方法包括:
S501,根据异常地理网格的坐标信息,确定异常地理网格的中心点坐标。
根据异常地理网格的待检测序列数据中的历史信令序列数据和/或实时信令序列数据中携带的地理位置坐标信息编码的字符串,获取地理网格对应的坐标信息。将获取到的异常地理网格的坐标信息映射至地图中,可以获取到异常地理网格在地图上的覆盖范围所属的地理位置信息。
本申请实施例提出的可以表征地位位置信息的地理网格为具有规则形状的地理网格,比如矩形等等,一般情况下,在确定每个地理网格映射至地图的位置以及坐标信息后,可以获取地理网格对应的几何中心点,该几何中心点映射至地图上的坐标确定为中心点坐标。
S502,基于中心点坐标,确定任意两个异常地理网格之间的距离。
确定异常地理网格的中心点坐标后,可以基于每两个异常地理网格中心点的坐标获取两个中心点之间的距离,进而确定两个异常地理网格之间的距离。
进一步地,获取每两个异常地理网格的中心坐标之间的距离,直至获取到全部异常地理网格中任意两个异常地理网格之间的距离。
比如,设定异常地理网格为W1,W22,W38,确定任意两个异常地理网格之间的距离即为分别获取W1,W22之间的距离、W22,W38之间的距离以及W1,W38之间的距离。
S503,根据距离和异常地理网格的坐标信息,对异常地理网格进行分组,形成聚合地理网格分组。
获取到全部的异常地理网格中任意两个地理网格之间的距离后,根据任意两个地理网格之间的距离进行异常地理网格的分组,形成聚合地理网格分组。
进一步地,可以选取距离小于预设距离阈值的异常地理网格对,其中,任意两个异常地理网格构成一个异常地理网格对。
可以设定一个异常地理网格之间的距离阈值,将任意两个异常地理网格组成一个异常地理网格对,并获取每个异常地理网格对中包含的两个异常地理网格之间的距离。
将获取到的每个异常地理网格对中的两个异常地理网格之间距离与设定的距离阈值进行比较,当两个异常地理网格之间的距离小于该距离阈值时,可以理解为,该两个异常地理网格在地图中地理位置距离较近,可以视为同一区域,或者该两个异常地理网格在地图中映射的地理位置上的建筑物和/或场地为同一建筑物和/或场地。
进一步地,获取符合两个异常地理网格之间的距离均小于预设的距离阈值的异常地理网格对。
再进一步,基于异常地理网格的坐标信息,从异常地理网格对中确定空间位置上连续的一个或多个聚合地理网格分组,其中,聚合地理网格分组包括一个或多个异常地理网格对。
获取到符合聚合条件的异常地理网格对后,根据异常地理网格对中每个异常地理网格的坐标信息,进一步地识别其中属于同一建筑物和/或场地的异常地理网格。
一般情况下,某一个地理位置上的建筑物和/或场地存在一定的面积,该面积范围内可以包含一个或者多个地理网格映射在地图上的地理位置。获取符合聚合条件的异常地理网格对中的异常地理网格后,可以获取其对应的中心点坐标,将获取到的中心点坐标映射进地图中,可以根据中心点坐标所落的位置筛选出异常地理网格对中,在地理位置上属于同一建筑物和/或场地的异常地理网格对。一般情况下,在空间位置的维度,确定属于同一建筑物和/或场地的异常地理网格对在空间位置上是连续的,因此可以将上述筛选出的在地理位置上属于同一建筑物和/或场地的异常地理网格对进行聚合,生成一个聚合地理网格分组。
比如,设定人群异常聚集的区域内的异常地理网格的中心点坐标之间距离阈值为L=2 ×150m,每一个地理网格映射至地图上的覆盖面积为150m×150m,将异常地理网格任意两个进行分组,生成异常地理网格对。
进一步地,将获取到的异常地理网格对中每个异常地理网格的中心点映射至地图中,并根据中心点坐标之间的距离与距离阈值L之间的比较结果进行聚类。循环对比任一异常地理网格对中两个异常地理网格之间的中心点距离与距离阈值L,当出现某异常地理网格对中的两个异常地理网格的中心点坐标之间的距离小于L时,则将该两个异常地理网格归类为同一区域,直到全部的异常地理网格的中心坐标之间的距离全部大于或者等于距离阈值L时,停止聚类,进而生成一个或者多个异常地理网格对生成的聚合地理网格分组。
需要说明的是,属于同一建筑物和/或场地的一个或者多个异常地理网格对可以生成一个聚合地理网格分组,本申请实施例中的一个或者多个异常地理网格对可以属于不同的建筑物和/或场地,因此,符合聚合条件的异常地理网格对生成的聚合地理网格分组可以是一个,也可以是多个。
本申请提出的人群异常聚集的检测方法,通过异常地理网格的中心坐标信息,获取空间位置上连续的异常地理网格对组成的异常地理网格分组,为后续可以实现人群异常聚集区域的生成提供了支撑,使得人群异常聚集检测可以实现高效、及时、兼顾成本且覆盖面广的检测。
进一步地,可结合图6理解,图6为本申请另一实施例的人群异常检测方法的流程示意图,如图6所示,该办法包括:
S601,获取人群异常区域内的最大坐标和最小坐标,作为人群异常区域的区域边界。
为了进一步获取人群异常聚集区域内的人群聚集密度,进而对人群异常聚集情况的程度进行准确判断,需要获取人群异常聚集区域的区域边界。
基于异常地理网格的聚合归类生成人群异常聚集区域后,可以根据该人群异常聚集区域中所包含的异常地理网格对应的坐标信息,获取人群异常聚集区域的最大坐标和最小坐标,并基于最大坐标与最小坐标,生成人群异常聚集区域的边界线。
比如,在上述步骤S402提出的示例的基础上,异常地理网格W1,W22生成了人群异常聚集区域Z1,异常地理网格W38生成了人群异常聚集区域Z2。通过获取异常地理网格W1以及W22的最大经纬度与最小经纬度,可以获取人群异常聚集区域Z1的最大坐标和最小坐标,同理通过获取异常地理网格的最大经纬度与最小经纬度,可以获取人群异常聚集区域Z2的最大坐标以及最小坐标。
进一步地,将人群异常聚集区域Z1的最大经度与最小经度分别沿着最大纬度与最小纬度所在的纬度线,基于两个经度之间的最小距离相连接,再将其最大纬度与最小纬度沿着最大经度与最小经度所在的经度线,基于两个纬度之间的最小距离相连接,进而生成人群异常聚集区域Z1的区域边界。相应地,通过同样的方法可以获取人群异常聚集区域Z2的区域边界。
S602,获取属于人群异常区域内的地理网格,并统计属于人群异常区域的每个地理网格在当前时刻的人数,以及设定时长的历史人数。
一般情况下,人群异常聚集所参与的人数,可以直接反应人群异常聚集的严重程度。
确定人群异常聚集区域的区域边界后,可以获取其覆盖范围内的全部的地理网格,进而获取每个地理网格对应的实时信令序列数据。每个地理网格对应的实时信令序列数据中携带有当前时刻该地理网格的人群聚集人数,将人群异常聚集区域内所包含的全部地理网格对应的当前时刻的人群聚集人数相加,即可获取到人群异常聚集区域当前时刻的人群聚集人数。
相应地,可以同时获取到人群异常聚集区域所覆盖的全部地理网格中每个地理网格对应的历史信令序列数据,历史信令序列数据是采集设定时长范围内的地理网格的历史人群聚集情况,其中携带有每个地理网格对应的采集设定时长范围内地理网格的历史人群聚集人数。进一步地,将每个地理网格在设定时长范围内的对应的历史人群聚集人数相加,即可获取到人群异常聚集区域设定时长的历史人群聚集人数。
S603,将当前时刻的人数和历史人数拼接,生成人群异常区域的人数序列数据。
为了可以更加直观的实现当前时刻的人群聚集情况与历史人群聚集情况的对比,本申请实施例中,获取到当前时刻的人群异常聚集人数以及设定时长的历史聚集人数后,需要将当前时刻的人群异常聚集人数以及设定时长的历史聚集人数进行拼接,进而生成人数异常聚集区域的人数序列数据。
比如,在上述示例的基础上,对50个地理网格进行人群异常聚集检测,并确定其中人群异常聚集区域为Z1。统计人群异常聚集区域Z1当前时刻的人群聚集人数,并统计该区域覆盖到的每个地理网格在过去30天内的历史人群聚集人数,将当前时刻的人群聚集人数拼接至历史人群聚集人数后,生成人群异常聚集区域Z1的人数序列数据。
进一步地,该人数序列数据可以作为本轮次的50个地理网格发人群异常聚集检测的输出结果。
本申请提出的人群异常检测方法,通过获取人群异常区域内的最大坐标和最小坐标,生成人群异常聚集区域的边界,使得监控者可以更准确的锁定人群异常聚集的范围,通过当前时刻的人群异常聚集人数以及设定时长的历史聚集人数进行拼接,生成人数序列数据,使得监控者可以准确判断当前时刻人群异常聚集区域内的聚集程度,进而提出有效的处理措施。
为了更好的理解上述实施例,可结合图7,图7为本申请另一实施例的人群异常检测方法的流程示意图,该方法如图7所示:
针对N个地理网格进行人群异常聚集情况检测,对N个地理网格对应的历史信令数据按预设的时间间隔进行切分,获取每个地理网格对应的信令子序列数据,将获取到的信令子序列数据按照时间类型进行归类,并对每一个时间类型下的信子序列按照时间先后的顺序进行拼接,进而生成每个地理网格包含的多个时间类型对应的历史信令序列数据。
进一步地,获取N个地理网格当前时刻的实时信令序列数据,并基于实时信令序列数据所属的时间类型获取其对应的历史信令序列数据,将实时信令序列数据拼接至历史信令序列数据之后生成待检测序列数据,并输入人群异常聚集检测模型获取出现人群异常聚集的异常地理网格。进一步地,将获取到的异常地理网格进行统计分析,筛选出出现人群骤增情况的异常地理网格并确定为最终的异常地理网格。将最终的异常地理网格进行聚类以生成人群异常聚集区域,根据人群异常聚集区域的最大坐标以及做小坐标,获取人群异常聚集区域的区域边界,进而获取人群异常聚集区域内的全部地理网格的当前时刻的人群聚集人数以及设定时长的历史聚集人数,将二者进行拼接生成人数序列数据,并将该人数序列数据作为最终的检测结果输出。
本申请提出的人群异常检测方法,将地理位置信息划分成N个地理网格,降低了人群异常聚集检测的难度,通过信令数据,实现对于人群是否出现异常聚集情况的判断,提高检测效率的同时实现了高覆盖的人群异常聚集检测,不依赖于视频监控设备,降低了检测的成本,进而实现了高效、及时、兼顾成本且覆盖面广的人群异常聚集的检测。
与上述几种实施例提出的人群异常检测方法相对应,本申请的一个实施例还提出了一种人群异常检测装置,由于本申请实施例提出的人群异常检测装置与上述几种实施例提出的人群异常检测方法相对应,因此上述人群异常检测方法的实施方式也适用于本申请实施例提出的人群异常检测装置,在下述实施例中不再详细描述。
图8为本申请一实施例的人群异常检测装置的结构示意图,如图8所示,群异常检测装置100,包括获取模块11、拼接模块12、检测模块13,其中:
获取模块11,用于获取N个地理网格当前时刻的终端设备的实时信令序列数据;
获取模块11,还用于针对N个地理网格中的任一地理网格,根据当前时刻的时刻类型,确定任一地理网格的实时信令序列数据对应的历史信令序列数据;
拼接模块12,用于对实时信令序列数据与历史信令序列数据进行拼接,以生成待检测序列数据;
检测模块13,用于基于每个地理网格的待检测序列数据,从N个地理网格中确定存在人群异常的异常地理网格。
图9为本申请一实施例的人群异常检测装置的结构示意图,如图9所示,人群异常检测装置200,包括获取模块21、拼接模块22、检测模块23、计算模块24、异常地理网格确定模块25、坐标获取模块26、聚合模块27、切分模块28、识别模块29、边界生成模块 210、人数获取模块211,其中:
需要说明的是,获取模块11、拼接模块12、检测模块13与获取模块21、拼接模块22、检测模块23,具备相同的结构和功能。
本申请实施例中,人群异常检测装置200,还包括:
计算模块24,用于获取异常地理网格的待检测序列数据的均值和方差,并基于均值和方差,确定地理网格异常判定值;
异常地理网格确定模块25,用于获取异常地理网格当前时刻的人数,并选取当前时刻的人数大于异常判定值的异常地理网格,作为最终的异常地理网格。
本申请实施例中,人群异常检测装置200,还包括:
坐标获取模块26,用于获取异常地理网格的坐标信息;
聚合模块27,用于基于坐标信息,对异常地理网格进行地理网格聚合处理,生成人群异常区域。
本申请实施例中,聚合模块27,还用于:根据异常地理网格的坐标信息,确定异常地理网格的中心点坐标;基于中心点坐标,确定任意两个异常地理网格之间的距离;根据距离和异常地理网格的坐标信息,对异常地理网格进行分组,形成聚合地理网格分组;对属于同一分组内的异常地理网格进行地理网格聚合处理,生成人群异常区域。
本申请实施例中,聚合模块27,还用于:选取距离小于预设距离阈值的异常地理网格对,其中,任意两个异常地理网格构成一个异常地理网格对;基于异常地理网格的坐标信息,从异常地理网格对中确定空间位置上连续的一个或多个聚合地理网格分组,其中,聚合地理网格分组包括一个或多个异常地理网格对。
本申请实施例中,人群异常检测装置200,还包括:
获取模块21,还用于获取N个地理网格的历史信令数据;
切分模块28,用于针对N个地理网格中任一地理网格,对任一地理网格的历史信令数据按照预设时间间隔进行数据切分,以生成多个信令子序列数据;
拼接模块22,还用于对信令子序列数据的时刻进行时间类型识别,并将属于同一时间类别的信令子序列数据,按照时间顺序从早到晚的顺序进行拼接,获取每个时间类型的历史信令序列数据。
本申请实施例中,人群异常检测装置200,还包括:
获取模块21,还用于获取任一地理网格内的历史信令数据对应的采集时间长度;
识别模块29,用于响应于采集时间长度大于预设时间长度,基于聚类算法进行时间类型识别;
识别模块29,还用于响应于采集时间长度小于或者等于预设时间长度,按照分类规则进行时间类型识别。
本申请实施例中,人群异常检测装置200,还包括:
边界生成模块210,用于获取人群异常区域内的最大坐标和最小坐标,作为人群异常区域的区域边界。
本申请实施例中,人群异常检测装置200,还包括:
人数获取模块211,用于获取属于人群异常区域内的地理网格,并统计属于人群异常区域的每个地理网格在当前时刻的人数,以及设定时长的历史人数;
拼接模块22,还用于将当前时刻的人数和历史人数拼接,生成人群异常区域的人数序列数据。
本申请提出的人群异常检测装置,获取N个地理网格的历史信令数据,并进行切分、归类,以生成每个地理网格包括的多个时间类型对应的历史信令序列数据。获取当前时刻 N个地理网格的实时信令序列数据,并基于实时信令序列数据所属的时间类型获取其对应的历史信令序列数据,将二者进行拼接生成待检测序列数据,输入至人群异常聚集检测模型后,获取出现人群异常聚集的异常地理网格,进一步地,将获取到的异常地理网格进行统计分析,筛选出人群骤增异常聚集的地理网格确定为最终的异常地理网格。进一步地,将确定的异常地理网格进行归类,生成人群异常聚集区域,并输出最终的检测结果。本申请提出的人群异常检测方法,将地理位置信息划分成N个地理网格,降低了人群异常聚集检测的难度,通过信令数据,实现对于人群是否出现异常聚集情况的判断,提高检测效率的同时实现了高覆盖的人群异常聚集检测,不依赖于视频监控设备,降低了检测的成本,进而实现了高效、及时、兼顾成本且覆盖面广的人群异常聚集的检测。
为达到上述实施例,本申请还提出了一种电子设备、一种计算机可读存储介质和一种计算机程序产品。
图10示出了可以用来实施本申请的实施例的示例电子设备1000的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图10所示,设备1000包括存储器101、处理器102及存储在存储101上并可在处理器102上运行的计算机程序,处理器102执行程序指令时,实现上述实施例提出的人群异常检测方法。
本申请实施例提出的电子设备,通过处理器102执行存储在存储器101上的计算机程序,针对N个地理网格进行人群异常聚集情况检测,对N个地理网格对应的历史信令数据按预设的时间间隔进行切分,获取每个地理网格对应的信令子序列数据,将获取到的信令子序列数据按照时间类型进行归类,并对每一个时间类型下的信子序列按照时间先后的顺序进行拼接,进而生成每个地理网格包含的多个时间类型对应的历史信令序列数据。
进一步地,获取N个地理网格当前时刻的实时信令序列数据,并基于实时信令序列数据所属的时间类型获取其对应的历史信令序列数据,将实时信令序列数据拼接至历史信令序列数据之后生成待检测序列数据,并输入人群异常聚集检测模型获取出现人群异常聚集的异常地理网格。
进一步地,将获取到的异常地理网格进行统计分析,筛选出出现人群骤增情况的异常地理网格并确定为最终的异常地理网格。将最终的异常地理网格进行聚类以生成人群异常聚集区域,根据人群异常聚集区域的最大坐标以及做小坐标,获取人群异常聚集区域的区域边界,进而获取人群异常聚集区域内的全部地理网格的当前时刻的人群聚集人数以及设定时长的历史聚集人数,将二者进行拼接生成人数序列数据,并将该人数序列数据作为最终的检测结果输出。
本申请提出的人群异常检测方法,将地理位置信息划分成N个地理网格,降低了人群异常聚集检测的难度,通过信令数据,实现对于人群是否出现异常聚集情况的判断,提高检测效率的同时实现了高覆盖的人群异常聚集检测,不依赖于视频监控设备,降低了检测的成本,进而实现了高效、及时、兼顾成本且覆盖面广的人群异常聚集的检测。
本申请实施例提出的一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器102执行时,实现上述实施例提出的人群异常检测方法。
本申请实施例的计算机可读存储介质,通过存储计算机程序并被处理器执行,通过处理器102执行存储在存储器101上的计算机程序,针对N个地理网格进行人群异常聚集情况检测,对N个地理网格对应的历史信令数据按预设的时间间隔进行切分,获取每个地理网格对应的信令子序列数据,将获取到的信令子序列数据按照时间类型进行归类,并对每一个时间类型下的信子序列按照时间先后的顺序进行拼接,进而生成每个地理网格包含的多个时间类型对应的历史信令序列数据。
进一步地,获取N个地理网格当前时刻的实时信令序列数据,并基于实时信令序列数据所属的时间类型获取其对应的历史信令序列数据,将实时信令序列数据拼接至历史信令序列数据之后生成待检测序列数据,并输入人群异常聚集检测模型获取出现人群异常聚集的异常地理网格。
进一步地,将获取到的异常地理网格进行统计分析,筛选出出现人群骤增情况的异常地理网格并确定为最终的异常地理网格。将最终的异常地理网格进行聚类以生成人群异常聚集区域,根据人群异常聚集区域的最大坐标以及做小坐标,获取人群异常聚集区域的区域边界,进而获取人群异常聚集区域内的全部地理网格的当前时刻的人群聚集人数以及设定时长的历史聚集人数,将二者进行拼接生成人数序列数据,并将该人数序列数据作为最终的检测结果输出。
本申请提出的人群异常检测方法,将地理位置信息划分成N个地理网格,降低了人群异常聚集检测的难度,通过信令数据,实现对于人群是否出现异常聚集情况的判断,提高检测效率的同时实现了高覆盖的人群异常聚集检测,不依赖于视频监控设备,降低了检测的成本,进而实现了高效、及时、兼顾成本且覆盖面广的人群异常聚集的检测。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/ 或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本身的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本申请的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者地理网格浏览器的用户计算机,用户可以通过该图形用户界面或者该地理网格浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信地理网格)来将系统的部件相互连接。通信地理网格的示例包括:局域网(LAN)、广域网(WAN)、互联网和区块链地理网格。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信地理网格进行交互。通过在相应的计算机上运行并且彼此具有客户端服务器关系的计算机程序来产生客户端和服务器的关系。服务端可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务(“Virtual Private Server”,或简称“VPS”)中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合区块链的服务器。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (22)
1.一种人群异常检测方法,其特征在于,包括:
获取N个地理网格当前时刻的终端设备的实时信令序列数据;
针对所述N个地理网格中的任一地理网格,根据所述当前时刻的时刻类型,确定所述任一地理网格的实时信令序列数据对应的历史信令序列数据;
对所述实时信令序列数据与所述历史信令序列数据进行拼接,以生成待检测序列数据;
基于每个地理网格的所述待检测序列数据,从所述N个地理网格中确定存在人群异常的异常网格。
2.根据权利要求1所述的方法,其特征在于,所述从所述N个地理网格中确定存在人群异常的异常地理网格之后,还包括:
获取所述异常地理网格的待检测序列数据的均值和方差,并基于所述均值和所述方差,确定地理网格异常判定值;
获取所述异常地理网格当前时刻的人数,并选取所述当前时刻的人数大于所述异常判定值的异常地理网格,作为最终的异常地理网格。
3.根据权利要求1所述的方法,其特征在于,所述基于每个地理网格的所述待检测序列数据,从所述N个地理网格中确定存在人群异常的异常地理网格,还包括:
训练时序异常检测模型,基于训练好的时序异常检测模型,确定所述N个地理网格中存在人群异常的异常地理网格。
4.根据权利要求1~3中任一项所述的方法,其特征在于,还包括:
获取所述异常地理网格的坐标信息;
基于所述坐标信息,对所述异常地理网格进行地理网格聚合处理,生成人群异常区域。
5.根据权利要求4所述的方法,其特征在于,所述基于所述坐标信息,对所述异常地理网格进行地理网格聚合处理,生成人群异常区域,包括:
根据所述异常地理网格的坐标信息,确定所述异常地理网格的中心点坐标;
基于所述中心点坐标,确定任意两个异常地理网格之间的距离;
根据所述距离和所述异常地理网格的坐标信息,对所述异常地理网格进行分组,形成聚合地理网格分组;
对属于同一分组内的异常地理网格进行地理网格聚合处理,生成所述人群异常区域。
6.根据权利要求5所述的方法,其特征在于,所述根据所述距离和所述异常地理网格的坐标信息,对所述异常地理网格进行分组,形成聚合地理网格分组,包括:
选取所述距离小于预设距离阈值的异常地理网格对,其中,所述任意两个异常地理网格构成一个异常地理网格对;
基于所述异常地理网格的坐标信息,从所述异常地理网格对中确定空间位置上连续的一个或多个所述聚合地理网格分组,其中,所述聚合地理网格分组包括一个或多个异常地理网格对。
7.根据权利要求1所述的方法,其特征在于,所述获取N个地理网格当前时刻的终端设备的实时信令序列数据之前,还包括:
获取所述N个地理网格的历史信令数据;
针对所述N个地理网格中任一地理网格,对所述任一地理网格的历史信令数据按照预设时间间隔进行数据切分,以生成多个信令子序列数据;
对所述信令子序列数据的时刻进行时间类型识别,并将属于同一时间类别的信令子序列数据,按照时间顺序从早到晚的顺序进行拼接,获取每个时间类型的历史信令序列数据。
8.根据权利要求6所述的方法,其特征在于,还包括:
获取所述任一地理网格内的历史信令数据对应的采集时间长度;
响应于所述采集时间长度大于预设时间长度,基于聚类算法进行时间类型识别;
响应于所述采集时间长度小于或者等于所述预设时间长度,按照分类规则进行时间类型识别。
9.根据权利要求4所述的方法,其特征在于,所述生成所述人群异常区域之后,还包括:
获取所述人群异常区域内的最大坐标和最小坐标,作为所述人群异常区域的区域边界。
10.根据权利要求4所述的方法,其特征在于,所述生成所述人群异常区域之后,还包括:
获取属于所述人群异常区域内的地理网格,并统计属于所述人群异常区域的每个地理网格在当前时刻的人数,以及设定时长的历史人数;
将所述当前时刻的人数和所述历史人数拼接,生成所述人群异常区域的人数序列数据。
11.一种人群异常检测装置,其特征在于,包括:
获取模块,用于获取N个地理网格当前时刻的终端设备的实时信令序列数据;
所述获取模块,还用于针对所述N个地理网格中的任一地理网格,根据所述当前时刻的时刻类型,确定所述任一地理网格的实时信令序列数据对应的历史信令序列数据;
拼接模块,用于对所述实时信令序列数据与所述历史信令序列数据进行拼接,以生成待检测序列数据;
检测模块,用于基于每个地理网格的所述待检测序列数据,从所述N个地理网格中确定存在人群异常的异常地理网格。
12.根据权利要求11所述的装置,其特征在于,还包括:
计算模块,用于获取所述异常地理网格的待检测序列数据的均值和方差,并基于所述均值和所述方差,确定地理网格异常判定值;
异常地理网格确定模块,用于获取所述异常地理网格当前时刻的人数,并选取所述当前时刻的人数大于所述异常判定值的异常地理网格,作为最终的异常地理网格。
13.根据权利要求11或12所述的装置,其特征在于,还包括:
坐标获取模块,用于获取所述异常地理网格的坐标信息;
聚合模块,用于基于所述坐标信息,对所述异常地理网格进行地理网格聚合处理,生成人群异常区域。
14.根据权利要求13所述的装置,其特征在于,所述聚合模块,还用于:
根据所述异常地理网格的坐标信息,确定所述异常地理网格的中心点坐标;
基于所述中心点坐标,确定任意两个异常地理网格之间的距离;
根据所述距离和所述异常地理网格的坐标信息,对所述异常地理网格进行分组,形成聚合地理网格分组;
对属于同一分组内的异常地理网格进行地理网格聚合处理,生成所述人群异常区域。
15.根据权利要求14所述的装置,其特征在于,所述聚合模块,还用于:
选取所述距离小于预设距离阈值的异常地理网格对,其中,所述任意两个异常地理网格构成一个异常地理网格对;
基于所述异常地理网格的坐标信息,从所述异常地理网格对中确定空间位置上连续的一个或多个所述聚合地理网格分组,其中,所述聚合地理网格分组包括一个或多个异常地理网格对。
16.根据权利要求11所述的装置,其特征在于,还包括:
所述获取模块,还用于获取所述N个地理网格的历史信令数据;
切分模块,用于针对所述N个地理网格中任一地理网格,对所述任一地理网格的历史信令数据按照预设时间间隔进行数据切分,以生成多个信令子序列数据;
所述拼接模块,还用于对所述信令子序列数据的时刻进行时间类型识别,并将属于同一时间类别的信令子序列数据,按照时间顺序从早到晚的顺序进行拼接,获取每个时间类型的历史信令序列数据。
17.根据权利要求15所述的装置,其特征在于,还包括:
所述获取模块,还用于获取所述任一地理网格内的历史信令数据对应的采集时间长度;
识别模块,用于响应于所述采集时间长度大于预设时间长度,基于聚类算法进行时间类型识别;
所述识别模块,还用于响应于所述采集时间长度小于或者等于所述预设时间长度,按照分类规则进行时间类型识别。
18.根据权利要求13所述的装置,其特征在于,还包括:
边界生成模块,用于获取所述人群异常区域内的最大坐标和最小坐标,作为所述人群异常区域的区域边界。
19.根据权利要求13所述的装置,其特征在于,还包括:
人数获取模块,用于获取属于所述人群异常区域内的地理网格,并统计属于所述人群异常区域的每个地理网格在当前时刻的人数,以及设定时长的历史人数;
所述拼接模块,还用于将所述当前时刻的人数和所述历史人数拼接,生成所述人群异常区域的人数序列数据。
20.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-10中任一项所述的方法。
21.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-10中任一项所述的方法。
22.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-10中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110613426.4A CN113743444A (zh) | 2021-06-02 | 2021-06-02 | 人群异常检测方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110613426.4A CN113743444A (zh) | 2021-06-02 | 2021-06-02 | 人群异常检测方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113743444A true CN113743444A (zh) | 2021-12-03 |
Family
ID=78728474
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110613426.4A Pending CN113743444A (zh) | 2021-06-02 | 2021-06-02 | 人群异常检测方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113743444A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117874544A (zh) * | 2024-03-12 | 2024-04-12 | 徐州阿卡控制阀门有限公司 | 基于时序分析的阀门故障智能诊断方法 |
-
2021
- 2021-06-02 CN CN202110613426.4A patent/CN113743444A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117874544A (zh) * | 2024-03-12 | 2024-04-12 | 徐州阿卡控制阀门有限公司 | 基于时序分析的阀门故障智能诊断方法 |
CN117874544B (zh) * | 2024-03-12 | 2024-05-31 | 徐州阿卡控制阀门有限公司 | 基于时序分析的阀门故障智能诊断方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11598900B2 (en) | Weather-driven multi-category infrastructure impact forecasting | |
CN107809331B (zh) | 识别异常流量的方法和装置 | |
CN110677859B (zh) | 弱覆盖区域的确定方法、装置和计算机可读存储介质 | |
CN109992633A (zh) | 基于用户位置的地理围栏确定方法、装置、电子设备 | |
CN111176953B (zh) | 一种异常检测及其模型训练方法、计算机设备和存储介质 | |
CN113177857B (zh) | 一种基于台风灾害预估的资源弹性调配方法 | |
CN110059919B (zh) | 一种基于大数据的人口异常信息检测方法和系统 | |
CN114217319B (zh) | 一种对天气雷达分钟降水预报值进行订正的方法及装置 | |
CN113283824A (zh) | 智慧园区数据综合管理方法及系统 | |
CN117217380A (zh) | 停车场空余停车位预测方法、装置、电子设备及存储介质 | |
CN110334127B (zh) | 一种配电网线路故障规律挖掘方法、系统及存储介质 | |
Samuels et al. | Silence of the Tweets: incorporating social media activity drop-offs into crisis detection | |
CN113743444A (zh) | 人群异常检测方法、装置、电子设备及存储介质 | |
CN113837667A (zh) | 一种基于位置大数据的城市抗灾韧性阈值检测方法及系统 | |
CN116703132B (zh) | 共享车辆动态调度的管理方法、装置及计算机设备 | |
CN112330332A (zh) | 识别关于节点任务的欺诈风险的方法、计算设备和介质 | |
CN112541047A (zh) | 一种适用于多级网格化管理系统的海量数据聚合方法 | |
US8032302B1 (en) | Method and system of modifying weather content | |
CN116631168A (zh) | 地质安全监测方法、装置、计算机设备和存储介质 | |
US9625613B2 (en) | Weather determination system and method | |
CN114048614B (zh) | 一种预测环境污染的方法和装置 | |
Li et al. | Unraveling fundamental properties of power system resilience curves using unsupervised machine learning | |
US11922686B2 (en) | Catastrophe analysis via realtime windspeed and exposure visualization | |
US20230298343A1 (en) | Systems and Methods for Optimizing Asset Maintenance Protocols by Predicting Vegetation-Driven Outages | |
CN115223371B (zh) | 一种电动自行车大数据分析系统及其工作方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |