CN110188818A - 热点区域聚类方法、装置及电子设备 - Google Patents
热点区域聚类方法、装置及电子设备 Download PDFInfo
- Publication number
- CN110188818A CN110188818A CN201910454163.XA CN201910454163A CN110188818A CN 110188818 A CN110188818 A CN 110188818A CN 201910454163 A CN201910454163 A CN 201910454163A CN 110188818 A CN110188818 A CN 110188818A
- Authority
- CN
- China
- Prior art keywords
- event
- visual field
- temperature
- value
- map
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Remote Sensing (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Radiation Pyrometers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种热点区域聚类方法、装置及电子设备,涉及数据挖掘技术领域,该方法包括:获取发生在地图视界内的事件数据和地图视界的视界最大距离;采用基于距离的热度衰减原理,根据事件数据和视界最大距离计算得到每个事件的热度综合值;根据各事件的热度综合值从多个事件中筛选出热点事件;基于热点事件在目标地图中的位置,确定热点区域。本发明提供的热点区域聚类方法、装置及电子设备,引入了自适应的视界最大距离,与现有技术相比,不需要设置超级参数,因此提高了热点区域聚类的自适应性;另外,在筛选热点事件时考虑了所有事件的整体分布,与现有技术相比,不依赖局部的通联和密度,因此提高了热点区域聚类的呈现效果。
Description
技术领域
本发明涉及数据挖掘技术领域,尤其是涉及一种热点区域聚类方法、装置及电子设备。
背景技术
随着技术的发展,对事件(例如,失火事件、抢劫事件等)的描述包括更多属性信息,比如事件发生的时间、地点(例如,经纬度)等。隐藏在这些数据下的更多有用信息被不断挖掘,基于地理空间的事件发生的热点区域,往往隐藏着更多的问题诱发因素,提取和直观展示这些区域可为问题的剖析和解决提供有效的帮助。
在现有技术中,可以基于事件的相关属性信息,通过聚类算法找到事件的高发区域,也即得到热点区域。虽然现有的聚类算法很多,但部分算法仅在某些特定问题上表现良好,不适用于地理空间的热点区域的聚类问题,而另一部分算法的自适应性差。例如K-Means算法(K均值聚类算法)能很好地做聚类划分,但它完成的是把事件划分为确定的几个类,需要明确知道聚类的类别数,且某一事件一定归属于其中的某个类,因此K-Means算法对于地理空间的热点区域的聚类不适用。又如,DBSCAN(Density-Based SpatialClustering of Applications with Noise)算法是基于密度的聚类算法,能较好地聚类类似地理空间的热点区域,然而DBSCAN算法需要设置超级参数:扫描半径和类别中心的事件数(最小包含点数MinPts),这在一定程度上限制了算法的自适应性。另外,现有的聚类算法过多依赖于局部的通联和密度,而忽略了全局数据的整体分布导致聚类得到的热点区域在地图上的呈现效果较差。
因此,针对地理空间的热点区域的聚类问题,现有的聚类算法具有自适应性差、聚类的呈现效果差的问题。
发明内容
本发明的目的在于提供一种热点区域聚类方法、装置及电子设备,以提高热点区域聚类的自适应性和呈现效果。
本发明提供的一种热点区域聚类方法,包括:
获取发生在地图视界内的事件数据和所述地图视界的视界最大距离;其中,所述地图视界为目标地图的视野边界,所述事件数据包括多个事件以及每个所述事件对应的热度值和位置,所述视界最大距离为所述目标地图的实际最大直线距离;
采用基于距离的热度衰减原理,根据所述事件数据和所述视界最大距离计算得到每个所述事件的热度综合值;
根据各所述事件的热度综合值从多个所述事件中筛选出热点事件;
基于所述热点事件在所述目标地图中的位置,确定热点区域。
进一步地,获取所述地图视界的视界最大距离,包括:
如果所述地图视界为矩形,获取所述地图视界的实际对角线长度;
将所述实际对角线长度确定为所述地图视界的视界最大距离。
进一步地,采用基于距离的热度衰减原理,根据所述事件数据和所述视界最大距离计算得到每个所述事件的热度综合值,包括:
根据每个所述事件对应的位置,计算得到各所述事件两两之间的距离;
采用基于距离的热度衰减原理,根据各所述事件两两之间的距离、每个所述事件对应的热度值和所述视界最大距离,计算得到各所述事件两两之间的热度影响值;
根据各所述事件两两之间的热度影响值,计算得到每个所述事件的热度综合值。
进一步地,根据各所述事件两两之间的热度影响值,计算得到每个所述事件的热度综合值,包括:
遍历所述事件数据中的各所述事件;
针对遍历到的当前事件,计算各所述事件对所述当前事件的热度影响值之和;
将计算得到的和值确定为所述当前事件的热度综合值;
直至遍历完各所述事件,得到每个所述事件的热度综合值。
进一步地,根据各所述事件的热度综合值从多个所述事件中筛选出热点事件,包括:
计算各所述事件的热度综合值的平均值,得到热度均值;
分别比较各所述事件的热度综合值与所述热度均值,得到第一比较结果;
根据所述第一比较结果,从多个所述事件中筛选出热点事件。
进一步地,根据各所述事件的热度综合值从多个所述事件中筛选出热点事件,包括:
计算各所述事件的热度综合值的平均值,得到热度均值;分别比较各所述事件的热度综合值与所述热度均值,得到第一比较结果;
根据各所述事件两两之间的热度影响值,计算得到每个所述事件的热度影响值的方差;计算各所述事件的热度影响值的方差的平均值,得到方差均值;分别比较各所述事件的热度影响值的方差与所述方差均值,得到第二比较结果;
根据所述第一比较结果和所述第二比较结果,从多个所述事件中筛选出热点事件。
进一步地,根据各所述事件的热度综合值从多个所述事件中筛选出热点事件,包括:
根据各所述事件的热度综合值从多个所述事件中筛选出多个当前候选事件,并记当前的筛选次数为1;
重复执行以下筛选步骤,直至筛选次数达到预设的迭代次数:根据所述视界最大距离以及各所述当前候选事件对应的热度值和位置,更新每个所述当前候选事件的热度综合值;根据更新后的各所述当前候选事件的热度综合值从各所述当前候选事件中筛选出目标事件,将所述目标事件作为下一次筛选所用的当前候选事件,并更新所述筛选次数;
将所述筛选次数达到所述迭代次数时对应的当前候选事件确定为热点事件。
进一步地,基于所述热点事件在所述目标地图中的位置,确定热点区域,包括:
根据所述热点事件的位置将所述热点事件呈现在所述目标地图内,以使用户基于所述热点事件在所述目标地图中的位置分布确定热点区域。
本发明提供的一种热点区域聚类装置,包括:
获取模块,用于获取发生在地图视界内的事件数据和所述地图视界的视界最大距离;其中,所述地图视界为目标地图的视野边界,所述事件数据包括多个事件以及每个所述事件对应的热度值和位置,所述视界最大距离为所述目标地图的实际最大直线距离;
计算模块,用于采用基于距离的热度衰减原理,根据所述事件数据和所述视界最大距离计算得到每个所述事件的热度综合值;
筛选模块,用于根据各所述事件的热度综合值从多个所述事件中筛选出热点事件;
确定模块,用于基于所述热点事件在所述目标地图中的位置,确定热点区域。
本发明提供的一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述热点区域聚类方法。
本发明提供的热点区域聚类方法、装置及电子设备中,该方法包括:获取发生在地图视界内的事件数据和地图视界的视界最大距离;其中,地图视界为目标地图的视野边界,事件数据包括多个事件以及每个事件对应的热度值和位置,视界最大距离为目标地图的实际最大直线距离;采用基于距离的热度衰减原理,根据事件数据和视界最大距离计算得到每个事件的热度综合值;根据各事件的热度综合值从多个事件中筛选出热点事件;基于热点事件在目标地图中的位置,确定热点区域。本发明提供的热点区域聚类方法、装置及电子设备,引入了自适应的视界最大距离,与现有技术相比,不需要设置超级参数,因此提高了热点区域聚类的自适应性;另外,在筛选热点事件时考虑了所有事件的整体分布,与现有技术相比,不依赖局部的通联和密度,因此提高了热点区域聚类的呈现效果。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种热点区域聚类方法的流程示意图;
图2为本发明实施例提供的一种计算事件的热度综合值的流程示意图;
图3为本发明实施例提供的另一种热点区域聚类方法的流程示意图;
图4为本发明实施例提供的一种热点区域聚类装置的结构示意图;
图5为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前现有的聚类算法因需要设置超级参数,导致自适应性差,且过多依赖于局部的通联和密度,而忽略了全局数据的整体分布,导致呈现效果不理想。基于此,本发明实施例提供的一种热点区域聚类方法、装置及电子设备,所使用的相关参数考虑了地图视界的大小,不需要设置超级参数,可以提高热点区域聚类的自适应性;还考虑了在地图视界内的所有事件的整体分布,可以提高热点区域聚类的呈现效果。
为便于对本实施例进行理解,首先对本发明实施例所公开的一种热点区域聚类方法进行详细介绍。
本发明实施例提供了一种热点区域聚类方法,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
参见图1所示的一种热点区域聚类方法的流程示意图,该方法包括如下步骤:
步骤S102,获取发生在地图视界内的事件数据和地图视界的视界最大距离;其中,地图视界为目标地图的视野边界,事件数据包括多个事件以及每个事件对应的热度值和位置,视界最大距离为目标地图的实际最大直线距离。
上述目标地图为用户选取的地图,通常在显示目标地图时目标地图的地图视界呈现为矩形。需要说明的是,地图视界不限于为矩形,在其他实施例中,地图视界还可以呈现为其他任意形状,例如圆形、菱形等。
上述事件数据可以根据实际需求获取,这里对事件数据的来源不做限定。例如,若对目标地图所在的地理空间进行6个月内的失火事件的热点区域聚类,则可以获取发生在其地图视界内的6个月内的所有失火事件及每个失火事件的热度值和位置。可选地,事件的位置可以地理坐标系统中的经纬度表示。需要说明的是,各个失火事件的热度值可以是相同的数值,如各个失火事件的热度值均默认为1;各个失火事件的热度值也可以是根据实际情况设置的不同的数值,如将影响较大的失火事件X的热度值设置为2,将影响较小的失火事件Y的热度值设置为1。
以地图视界为矩形为例,获取地图视界的视界最大距离的过程如下:获取地图视界的实际对角线长度;将实际对角线长度确定为该地图视界的视界最大距离。在一种可选的实现方式中,可以获取地图视界的对角线上两个端点的实际位置,基于两个端点的实际位置计算得到实际对角线长度,从而得到视界最大距离。在另一种可选的实现方式中,先获取地图视界的实际长度和实际宽度,然后根据实际长度和实际宽度计算得到实际对角线长度,从而得到视界最大距离。
步骤S104,采用基于距离的热度衰减原理,根据上述事件数据和视界最大距离计算得到每个事件的热度综合值。
在计算每个事件的热度综合值考虑了所有事件的整体分布,目标地图中的每个事件的存在都影响了其所在区域的热度,各事件两两之间也会产生热度影响,且一个事件产生的热度影响会随着地理位置上的距离的增大而衰减,也即距离越大,两个事件对彼此的热度影响越低。当两个事件的距离达到视界最大距离时,认为相互热度影响降低到零,即两个事件相互不产生热度提升。最后通过考虑各事件两两之间产生的热度影响来最终得到每个事件的热度综合值。
步骤S106,根据各事件的热度综合值从多个事件中筛选出热点事件。
根据各事件的热度综合值从多个事件中筛选出热度较高的热点事件。
在一种可选的实施方式中,计算各事件的热度综合值的平均值,得到热度均值;分别比较各事件的热度综合值与热度均值,得到第一比较结果;根据第一比较结果,从多个事件中筛选出热点事件。可以将第一比较结果中热度综合值较大的事件筛选出来,作为热点事件。
需要说明的是,在比较各事件的热度综合值与热度均值,得到第一比较结果时,可以将每个事件的热度综合值直接与热度均值进行比较,也可以先将热度均值乘以第一预设系数得到第一比较阈值,再将每个事件的热度综合值与第一比较阈值进行比较,其中,第一预设系数为大于0小于1的数值,该第一预设系数可以根据实际情况设置。
步骤S108,基于热点事件在目标地图中的位置,确定热点区域。
本实施例中仅保留热度较高的热点事件,目标地图中区域的热点密度由其热点事件的分布而呈现冷热变化,从而在目标地图的地理空间中聚类出热点的几个区域(热点区域),热点区域的呈现效果更加直观。
在一种可选的实现方式中,根据热点事件的位置将热点事件呈现在目标地图内,以使用户基于热点事件在目标地图中的位置分布确定热点区域。这里热点区域是人直观感受到的点的聚集区,是人为直观观察得到的,而不是按照预设的计算机程序划分的,这样得到的热点区域更加符合人的习惯,更加准确。
本发明实施例中,获取发生在地图视界内的事件数据和地图视界的视界最大距离;其中,地图视界为目标地图的视野边界,事件数据包括多个事件以及每个事件对应的热度值和位置,视界最大距离为目标地图的实际最大直线距离;采用基于距离的热度衰减原理,根据事件数据和视界最大距离计算得到每个事件的热度综合值;根据各事件的热度综合值从多个事件中筛选出热点事件;基于热点事件在目标地图中的位置,确定热点区域。本发明实施例提供的热点区域聚类方法,引入了自适应的视界最大距离,与现有技术相比,不需要设置超级参数,因此提高了热点区域聚类的自适应性;另外,在筛选热点事件时考虑了所有事件的整体分布,与现有技术相比,不依赖局部的通联和密度,因此提高了热点区域聚类的呈现效果。
可选地,本实施例提供了一种计算事件的热度综合值的具体流程,参见图2所示的一种计算事件的热度综合值的流程示意图,上述步骤S104包括如下步骤S202至步骤S206:
步骤S202,根据每个事件对应的位置,计算得到各事件两两之间的距离。
步骤S204,采用基于距离的热度衰减原理,根据各事件两两之间的距离、每个事件对应的热度值和视界最大距离,计算得到各事件两两之间的热度影响值。
可选地,可以通过如下公式计算事件B对事件A的热度影响值PBA:
PBA=kB(dmax-dAB)n
其中,dmax表示视界最大距离;dAB表示事件A与事件B之间的距离;n表示衰减指数,n为大于1的数值,n的取值越大,事件B对周围事件的热度影响衰减的越快;kB表示事件B的热度系数,且当dAB=0时,PBA等于事件B的热度值。n的取值可以根据需要选取,可选地,n可以为2或3。
步骤S206,根据各事件两两之间的热度影响值,计算得到每个事件的热度综合值。
对于每个事件,将地图视界内所有事件对该事件的热度影响值的总和作为该事件的热度综合值,其中,一个事件对自身的热度影响值为该事件的热度值。
在一种可能的实现方式中,步骤S206的具体过程如下:遍历上述事件数据中的各事件;针对遍历到的当前事件,计算各事件对当前事件的热度影响值之和;将计算得到的和值确定为当前事件的热度综合值;直至遍历完各事件,得到每个事件的热度综合值。其中,当前事件对当前事件(自身)的热度影响值为当前事件的热度值。
考虑到当存在多个热点区域时,处于多个热点区域之间的某些孤立的事件的热度综合值可能会被烘托得很高,但这种事件并不是我们所需的热点事件,在另一种可选的实施方式中,上述步骤S106的过程如下:计算各事件的热度综合值的平均值,得到热度均值;分别比较各事件的热度综合值与热度均值,得到第一比较结果;根据各事件两两之间的热度影响值,计算得到每个事件的热度影响值的方差;计算各事件的热度影响值的方差的平均值,得到方差均值;分别比较各事件的热度影响值的方差与方差均值,得到第二比较结果;根据第一比较结果和第二比较结果,从多个事件中筛选出热点事件。
具体地,可以先根据第一比较结果筛选出热度较高的事件,再根据第二比较结果从这些热度较高的事件中再次筛选出热度方差较大的事件,从而得到热点事件。也可以先根据第二比较结果筛选出热度方差较大的事件,再根据第一比较结果从这些热度方差较大的事件中再次筛选出热度较高的事件,从而得到热点事件。还可以分别筛选出热度较高的事件和热度方差较大的事件,再取二者的交集,得到热点事件。
可选地,可以通过如下公式计算事件A的热度方差D(A):
其中,Z表示各事件构成的集合;PiA表示事件i对事件A的热度影响值;表示各事件对事件A的热度影响值的平均值,可以通过以下公式计算得到:其中,PA表示事件A的热度综合值,n表示集合Z中各事件的个数。
需要说明的是,在比较各事件的热度影响值的方差与方差均值,得到第二比较结果时,可以将每个事件的热度影响值的方差直接与方差均值进行比较,也可以先将方差均值乘以第二预设系数得到第二比较阈值,再将每个事件的热度影响值的方差与第二比较阈值进行比较,其中,第二预设系数为大于0小于1的数值,该第二预设系数可以根据实际情况设置。
另外,第一比较结果和第二比较结果的获取顺序无先后之分,在其他实施例中,也可以先得到第二比较结果,再得到第一比较结果。还可以先根据上述事件数据和视界最大距离计算得到每个事件的热度综合值、热度均值、热度影响值的方差和方差均值,然后再得到第一比较结果和第二比较结果。
这种增加方差过滤的筛选方式,能够剔除处于多个热点区域之间的孤立的事件,从而保留更贴合用户需求的热点事件。
为了进一步提高热点区域聚类的呈现效果,参见图3所示的另一种热点区域聚类方法的流程示意图,该方法包括如下步骤:
步骤S302,获取发生在地图视界内的事件数据和地图视界的视界最大距离。
步骤S304,采用基于距离的热度衰减原理,根据上述事件数据和视界最大距离计算得到每个事件的热度综合值。
步骤S306,根据各事件的热度综合值从多个事件中筛选出多个当前候选事件,并记当前的筛选次数为1。
根据各事件的热度综合值从多个事件中筛选出多个当前候选事件的过程可以参照前述步骤S106的具体过程,这里不再赘述。其中,可以通过给热度均值增加第一预设系数来改变聚类的速度,第一预设系数越大,聚类的速度越快,但结果越不准确,因此在设置第一预设系数时可以根据实际情况,综合考虑聚类的速度和结果的准确度。
步骤S308,重复执行以下筛选步骤,直至筛选次数达到预设的迭代次数:根据视界最大距离以及各当前候选事件对应的热度值和位置,更新每个当前候选事件的热度综合值;根据更新后的各当前候选事件的热度综合值从各当前候选事件中筛选出目标事件,将目标事件作为下一次筛选所用的当前候选事件,并更新筛选次数。
上述迭代次数可以根据需求设置,例如,可以设置为3或5。
步骤S310,将筛选次数达到迭代次数时对应的当前候选事件确定为热点事件。
步骤S312,基于热点事件在目标地图中的位置,确定热点区域。
本实施例中,通过迭代聚类进一步提高了热点区域聚类的呈现效果,并且每次迭代筛选时过滤掉一些热度较低的事件,因此通过迭代聚类还可以动态展现聚类过程。
本发明实施例还提供了一种热点区域聚类装置,该热点区域聚类装置主要用于执行本发明实施例上述内容所提供的热点区域聚类方法,以下对本发明实施例提供的热点区域聚类装置做具体介绍。
参见图4所示的一种热点区域聚类装置的结构示意图,该装置包括:
获取模块42,用于获取发生在地图视界内的事件数据和地图视界的视界最大距离;其中,地图视界为目标地图的视野边界,事件数据包括多个事件以及每个事件对应的热度值和位置,视界最大距离为目标地图的实际最大直线距离;
计算模块44,用于采用基于距离的热度衰减原理,根据事件数据和视界最大距离计算得到每个事件的热度综合值;
筛选模块46,用于根据各事件的热度综合值从多个事件中筛选出热点事件;
确定模块48,用于基于热点事件在目标地图中的位置,确定热点区域。
可选地,上述获取模块42在获取地图视界的视界最大距离时,具体用于:如果地图视界为矩形,获取地图视界的实际对角线长度;将实际对角线长度确定为地图视界的视界最大距离。
可选地,上述计算模块44具体用于:根据每个事件对应的位置,计算得到各事件两两之间的距离;采用基于距离的热度衰减原理,根据各事件两两之间的距离、每个事件对应的热度值和视界最大距离,计算得到各事件两两之间的热度影响值;根据各事件两两之间的热度影响值,计算得到每个事件的热度综合值。
可选地,上述计算模块44在根据各事件两两之间的热度影响值,计算得到每个事件的热度综合值时,具体用于:遍历上述事件数据中的各事件;针对遍历到的当前事件,计算各事件对当前事件的热度影响值之和;将计算得到的和值确定为当前事件的热度综合值;直至遍历完各事件,得到每个事件的热度综合值。
在一种可能的实现方式中,上述筛选模块46具体用于:计算各事件的热度综合值的平均值,得到热度均值;分别比较各事件的热度综合值与热度均值,得到第一比较结果;根据第一比较结果,从多个事件中筛选出热点事件。
在另一种可能的实现方式中,上述筛选模块46具体用于:计算各事件的热度综合值的平均值,得到热度均值;分别比较各事件的热度综合值与热度均值,得到第一比较结果;根据各事件两两之间的热度影响值,计算得到每个事件的热度影响值的方差;计算各事件的热度影响值的方差的平均值,得到方差均值;分别比较各事件的热度影响值的方差与方差均值,得到第二比较结果;根据第一比较结果和第二比较结果,从多个事件中筛选出热点事件。
可选地,在一些可能的实施例中,上述筛选模块46具体用于:根据各事件的热度综合值从多个事件中筛选出多个当前候选事件,并记当前的筛选次数为1;重复执行以下筛选步骤,直至筛选次数达到预设的迭代次数:根据视界最大距离以及各当前候选事件对应的热度值和位置,更新每个当前候选事件的热度综合值;根据更新后的各当前候选事件的热度综合值从各当前候选事件中筛选出目标事件,将目标事件作为下一次筛选所用的当前候选事件,并更新筛选次数;将筛选次数达到迭代次数时对应的当前候选事件确定为热点事件。
可选地,上述确定模块48具体用于:根据热点事件的位置将热点事件呈现在目标地图内,以使用户基于热点事件在目标地图中的位置分布确定热点区域。
本发明实施例中,该装置包括:获取模块42获取发生在地图视界内的事件数据和地图视界的视界最大距离;其中,地图视界为目标地图的视野边界,事件数据包括多个事件以及每个事件对应的热度值和位置,视界最大距离为目标地图的实际最大直线距离;计算模块44采用基于距离的热度衰减原理,根据事件数据和视界最大距离计算得到每个事件的热度综合值;筛选模块46根据各事件的热度综合值从多个事件中筛选出热点事件;确定模块48基于热点事件在目标地图中的位置,确定热点区域。本发明提供的热点区域聚类装置,引入了自适应的视界最大距离,与现有技术相比,不需要设置超级参数,因此提高了热点区域聚类的自适应性;另外,在筛选热点事件时考虑了所有事件的整体分布,与现有技术相比,不依赖局部的通联和密度,因此提高了热点区域聚类的呈现效果。
本发明实施例还提供了一种电子设备,参见图5所示的一种电子设备的结构示意图,该电子设备100包括:处理器50,存储器51,总线52和通信接口53,所述处理器50、通信接口53和存储器51通过总线52连接;处理器50用于执行存储器51中存储的可执行模块,例如计算机程序。
其中,存储器51可能包含高速随机存取存储器(RAM,RandomAccessMemory),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口53(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。
总线52可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器51用于存储程序,所述处理器50在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流过程定义的装置所执行的方法可以应用于处理器50中,或者由处理器50实现。
处理器50可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器50中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器50可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital SignalProcessing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器51,处理器50读取存储器51中的信息,结合其硬件完成上述方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置和电子设备的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本发明实施例所提供的进行热点区域聚类方法的计算机程序产品,包括存储了处理器可执行的非易失的程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (10)
1.一种热点区域聚类方法,其特征在于,包括:
获取发生在地图视界内的事件数据和所述地图视界的视界最大距离;其中,所述地图视界为目标地图的视野边界,所述事件数据包括多个事件以及每个所述事件对应的热度值和位置,所述视界最大距离为所述目标地图的实际最大直线距离;
采用基于距离的热度衰减原理,根据所述事件数据和所述视界最大距离计算得到每个所述事件的热度综合值;
根据各所述事件的热度综合值从多个所述事件中筛选出热点事件;
基于所述热点事件在所述目标地图中的位置,确定热点区域。
2.根据权利要求1所述的方法,其特征在于,获取所述地图视界的视界最大距离,包括:
如果所述地图视界为矩形,获取所述地图视界的实际对角线长度;
将所述实际对角线长度确定为所述地图视界的视界最大距离。
3.根据权利要求1所述的方法,其特征在于,采用基于距离的热度衰减原理,根据所述事件数据和所述视界最大距离计算得到每个所述事件的热度综合值,包括:
根据每个所述事件对应的位置,计算得到各所述事件两两之间的距离;
采用基于距离的热度衰减原理,根据各所述事件两两之间的距离、每个所述事件对应的热度值和所述视界最大距离,计算得到各所述事件两两之间的热度影响值;
根据各所述事件两两之间的热度影响值,计算得到每个所述事件的热度综合值。
4.根据权利要求3所述的方法,其特征在于,根据各所述事件两两之间的热度影响值,计算得到每个所述事件的热度综合值,包括:
遍历所述事件数据中的各所述事件;
针对遍历到的当前事件,计算各所述事件对所述当前事件的热度影响值之和;
将计算得到的和值确定为所述当前事件的热度综合值;
直至遍历完各所述事件,得到每个所述事件的热度综合值。
5.根据权利要求1所述的方法,其特征在于,根据各所述事件的热度综合值从多个所述事件中筛选出热点事件,包括:
计算各所述事件的热度综合值的平均值,得到热度均值;
分别比较各所述事件的热度综合值与所述热度均值,得到第一比较结果;
根据所述第一比较结果,从多个所述事件中筛选出热点事件。
6.根据权利要求3所述的方法,其特征在于,根据各所述事件的热度综合值从多个所述事件中筛选出热点事件,包括:
计算各所述事件的热度综合值的平均值,得到热度均值;分别比较各所述事件的热度综合值与所述热度均值,得到第一比较结果;
根据各所述事件两两之间的热度影响值,计算得到每个所述事件的热度影响值的方差;计算各所述事件的热度影响值的方差的平均值,得到方差均值;分别比较各所述事件的热度影响值的方差与所述方差均值,得到第二比较结果;
根据所述第一比较结果和所述第二比较结果,从多个所述事件中筛选出热点事件。
7.根据权利要求1所述的方法,其特征在于,根据各所述事件的热度综合值从多个所述事件中筛选出热点事件,包括:
根据各所述事件的热度综合值从多个所述事件中筛选出多个当前候选事件,并记当前的筛选次数为1;
重复执行以下筛选步骤,直至筛选次数达到预设的迭代次数:根据所述视界最大距离以及各所述当前候选事件对应的热度值和位置,更新每个所述当前候选事件的热度综合值;根据更新后的各所述当前候选事件的热度综合值从各所述当前候选事件中筛选出目标事件,将所述目标事件作为下一次筛选所用的当前候选事件,并更新所述筛选次数;
将所述筛选次数达到所述迭代次数时对应的当前候选事件确定为热点事件。
8.根据权利要求1所述的方法,其特征在于,基于所述热点事件在所述目标地图中的位置,确定热点区域,包括:
根据所述热点事件的位置将所述热点事件呈现在所述目标地图内,以使用户基于所述热点事件在所述目标地图中的位置分布确定热点区域。
9.一种热点区域聚类装置,其特征在于,包括:
获取模块,用于获取发生在地图视界内的事件数据和所述地图视界的视界最大距离;其中,所述地图视界为目标地图的视野边界,所述事件数据包括多个事件以及每个所述事件对应的热度值和位置,所述视界最大距离为所述目标地图的实际最大直线距离;
计算模块,用于采用基于距离的热度衰减原理,根据所述事件数据和所述视界最大距离计算得到每个所述事件的热度综合值;
筛选模块,用于根据各所述事件的热度综合值从多个所述事件中筛选出热点事件;
确定模块,用于基于所述热点事件在所述目标地图中的位置,确定热点区域。
10.一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910454163.XA CN110188818B (zh) | 2019-05-28 | 2019-05-28 | 热点区域聚类方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910454163.XA CN110188818B (zh) | 2019-05-28 | 2019-05-28 | 热点区域聚类方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110188818A true CN110188818A (zh) | 2019-08-30 |
CN110188818B CN110188818B (zh) | 2021-05-04 |
Family
ID=67718566
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910454163.XA Active CN110188818B (zh) | 2019-05-28 | 2019-05-28 | 热点区域聚类方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110188818B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113392338A (zh) * | 2021-06-11 | 2021-09-14 | 中国联合网络通信集团有限公司 | 热点区域定位方法、装置、设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103578265A (zh) * | 2012-07-18 | 2014-02-12 | 北京掌城科技有限公司 | 基于出租车gps数据的打车热点获取方法 |
US20160004762A1 (en) * | 2014-07-07 | 2016-01-07 | Edward-Robert Tyercha | Hilbert Curve Partitioning for Parallelization of DBSCAN |
CN106780262A (zh) * | 2017-01-13 | 2017-05-31 | 中国科学院遥感与数字地球研究所 | 一种考虑城市道路网络约束的同位模式发现方法及装置 |
CN107481511A (zh) * | 2017-08-16 | 2017-12-15 | 深圳先进技术研究院 | 一种计算候选公交站点的方法及系统 |
CN107862030A (zh) * | 2017-11-01 | 2018-03-30 | 平安科技(深圳)有限公司 | 出险待命位置确定方法、装置、计算机设备和存储介质 |
CN107990609A (zh) * | 2017-11-20 | 2018-05-04 | 珠海格力电器股份有限公司 | 电子膨胀阀的控制方法及冷媒循环系统 |
CN108959466A (zh) * | 2018-06-20 | 2018-12-07 | 淮阴工学院 | 基于bcs-dbscan的出租车载客热点可视化方法及系统 |
-
2019
- 2019-05-28 CN CN201910454163.XA patent/CN110188818B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103578265A (zh) * | 2012-07-18 | 2014-02-12 | 北京掌城科技有限公司 | 基于出租车gps数据的打车热点获取方法 |
US20160004762A1 (en) * | 2014-07-07 | 2016-01-07 | Edward-Robert Tyercha | Hilbert Curve Partitioning for Parallelization of DBSCAN |
CN106780262A (zh) * | 2017-01-13 | 2017-05-31 | 中国科学院遥感与数字地球研究所 | 一种考虑城市道路网络约束的同位模式发现方法及装置 |
CN107481511A (zh) * | 2017-08-16 | 2017-12-15 | 深圳先进技术研究院 | 一种计算候选公交站点的方法及系统 |
CN107862030A (zh) * | 2017-11-01 | 2018-03-30 | 平安科技(深圳)有限公司 | 出险待命位置确定方法、装置、计算机设备和存储介质 |
CN107990609A (zh) * | 2017-11-20 | 2018-05-04 | 珠海格力电器股份有限公司 | 电子膨胀阀的控制方法及冷媒循环系统 |
CN108959466A (zh) * | 2018-06-20 | 2018-12-07 | 淮阴工学院 | 基于bcs-dbscan的出租车载客热点可视化方法及系统 |
Non-Patent Citations (2)
Title |
---|
QINGWEN HAN ET AL: "A road hotspots identification method based on Natural Nearest Neighbor clustering", 《2015 IEEE 18TH INTERNATIONAL CONFERENCE ON INTELLIGENT TRANSPORTATION SYSTEMS》 * |
方琪: "基于决策图的城市热点区域提取", 《测绘与空间地理信息》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113392338A (zh) * | 2021-06-11 | 2021-09-14 | 中国联合网络通信集团有限公司 | 热点区域定位方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110188818B (zh) | 2021-05-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7627599B2 (en) | Method, apparatus, and program product for visualizing tree structured information | |
CN110264326A (zh) | 识别异常账户集合和风险账户集合的方法、装置及设备 | |
CN109859054A (zh) | 网络社团挖掘方法、装置、计算机设备及存储介质 | |
CN109033966B (zh) | 绕路检测模型训练方法和装置,以及绕路检测方法和装置 | |
CN107885796A (zh) | 信息推荐方法及装置、设备 | |
JP2007333730A (ja) | 推定関数を使用する最適ルート決定 | |
CN110335068A (zh) | 一种商户聚集区域确定方法及装置 | |
JP2020501232A (ja) | リスク制御イベント自動処理の方法および装置 | |
CN110544255B (zh) | 面向3d打印的三角网格孔洞的分割方法及系统 | |
CN108829804A (zh) | 基于距离划分树的高维数据相似性连接查询方法及装置 | |
CN108346098A (zh) | 一种风控规则挖掘的方法及装置 | |
CN110428386A (zh) | 地图网格合并方法、装置、存储介质、电子装置 | |
CN116484036A (zh) | 图像推荐方法、装置、电子设备及计算机可读存储介质 | |
CN112818071A (zh) | 一种基于统一路网的交管领域知识图谱构建方法及装置 | |
CN113709006B (zh) | 一种流量确定方法、装置、存储介质及电子装置 | |
CN104268243A (zh) | 一种位置数据处理方法及装置 | |
CN103712628A (zh) | 导航路径描绘方法和终端 | |
CN110188818A (zh) | 热点区域聚类方法、装置及电子设备 | |
CN110033117A (zh) | 模型校准方法及装置 | |
CN104376084B (zh) | 路径相似度计算方法和装置 | |
CN112131327A (zh) | 一种运动轨迹的生成方法及装置 | |
JP6242090B2 (ja) | 地図更新装置、地図更新システム及び地図の更新管理方法 | |
CN109684418A (zh) | 基于电网图数据库的数据存储方法及装置 | |
CN112738756B (zh) | 一种物联网设备数据收集方法及装置 | |
CN114996503A (zh) | 一种节点定位方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |