CN102750361B - 基于局部多层网格的轨迹数据热点区域发现方法 - Google Patents

基于局部多层网格的轨迹数据热点区域发现方法 Download PDF

Info

Publication number
CN102750361B
CN102750361B CN201210193256.XA CN201210193256A CN102750361B CN 102750361 B CN102750361 B CN 102750361B CN 201210193256 A CN201210193256 A CN 201210193256A CN 102750361 B CN102750361 B CN 102750361B
Authority
CN
China
Prior art keywords
cell
hot spot
spot region
density
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201210193256.XA
Other languages
English (en)
Other versions
CN102750361A (zh
Inventor
张磊
鲍苏宁
刘磊军
杨光
李静
李帆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Mining and Technology CUMT
Original Assignee
China University of Mining and Technology CUMT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Mining and Technology CUMT filed Critical China University of Mining and Technology CUMT
Priority to CN201210193256.XA priority Critical patent/CN102750361B/zh
Publication of CN102750361A publication Critical patent/CN102750361A/zh
Application granted granted Critical
Publication of CN102750361B publication Critical patent/CN102750361B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明涉及一种基于局部多层网格的轨迹数据热点区域发现方法,本发明解决其技术问题所采用的技术方案是:步骤1)根据轨迹数据分布特点局部多层次划分轨迹运动空间,计算单元格密度;步骤2)对密度单元格在给定的阀值下筛选及扩张,计算候选热点区域;步骤3)根据候选热点区域轨迹支持数及轨迹数据在候选热点区域内的停留时间,筛选出热点区域,该方法划分网格覆盖运动平面的自适应效果比较好,只要指定单元格内样本点数量阈值,在迭代划分过程中,总能得到一个合适的网格覆盖运动空间,把样本数据做细致的划分,只要设定的密度阈值一定,初始划分参数对挖掘结果不会有太大影响,可以应用于海量数据挖掘,保证算法的效率和适应性。

Description

基于局部多层网格的轨迹数据热点区域发现方法
技术领域
本发明涉及网络的位置服务领域,尤其是一种基于局部多层网格的轨迹数据热点区域发现方法。
背景技术
现有的关于轨迹数据热点区域发现方法多是基于规则密度网格,需要掌握移动对象情况从而设置合理的参数,影响结果的准确性,导致方法适用性较差。
发明内容
为了解决现有技术存在的不足,本发明提出了一种基于局部多层网格的轨迹数据热点区域发现方法,本方法能根据样本数据的分布情况局部多层次划分空间,使得单元格内样本点数趋于一致,计算单元格密度,通过扩张高密度单元格准确的定位热点区域,可以应用于海量数据挖掘,保证算法的效率和适应性
    本发明解决其技术问题所采用的技术方案是:
步骤1)根据轨迹数据分布特点局部多层次划分轨迹运动空间,计算单元格密度;
步骤2)对密度单元格在给定的阀值下筛选及扩张,计算候选热点区域;
步骤3)根据候选热点区域轨迹支持数及轨迹数据在候选热点区域内的停留时间,筛选出热点区域。
所述步骤1)中多层次划分运动空间的步骤包括:
步骤1.1)根据轨迹数据分布特点,初始化划分参数d;
步骤1.2)对轨迹运动空间的每一个维度进行基于参数d的等分,形成d×d个大小相等的矩形单元格;
步骤1.3)设定单元格内最小数据点个数n;
步骤1.4)将每个单元格内数据点的个数与最小数据点个数进行比较,当单元格内数据点的个数大于最小数据点个数n时,该单元格将被继续划分,否则该单元格被认为是“局部稀疏”的不再进行划分;
步骤1.5)对需要被继续划分的单元格,通过调用函数multi-Divide(G, Ci,n)进一步划分,直到所有满足划分条件的单元格划分完成,输出单元格集合G。
所述步骤1.5)中调用函数multi-Divide(G,Ci,n)对单元格进一步划分的方法包括以下步骤:
步骤1.5.1)对Ci中的每一个单元格ci,j进行遍历;
步骤1.5.2)把每个单元格ci,j四等分;
步骤1.5.3)统计单元格ci+1,j中的样本点的个数;
步骤1.5.4)如果样本点的个数大于最小数据点个数n,则递归调用multi-Divide(G,Ci,n),否则将单元格ci+1,j加入输出的单元格集合G中。
其中,G为输出的单元格集合,Ci表示第i层中需要进一步划分的单元格集合,n为单元格内最小数据点个数,ci,j表示Ci中的第j个单元格。
所述步骤2)包括:   
步骤2.1)设定热点区域密度阀值;
步骤2.2)以该热点区域密度阀值为标准对单元格集合中的密度单元格进行初步筛选,把密度不小于热点区域密度阀值的单元格筛选到候选热点区域中并排序;
步骤2.3)将单元格集合中未处理的单元格依次分别基于密度的扩张,扩张后的单元格密度不小于热点区域密度阀值的即被候选热点区域吸收,具体步骤包括:
步骤2.3.1)判断如果该单元格与候选热点区域中任意单元格邻接且与候选热点区域中所有单元格合并后的平均密度不小于热点区域密度阀值,则候选热点区域扩张吸收该单元格;
步骤2.3.2)如果该单元格与候选热点区域中任何单元格都不邻接,则候选热点区域不吸收该单元格,继续遍历单元格中的下一个单元格;
步骤2.3.3)如果候选热点区域中所有单元格合并后的平均密度小于热点区域密度阀值,则此次扩张失败,即候选热点区域不能吸收该单元格。
所述步骤2.3)中,单元格集合中未处理的单元格与候选热点区域中任意单元格是否邻接的判断方法为:从横向和纵向两个维度判断两个矩形单元格是否邻接,设定其中一个矩形单元格的宽为w1,高为h1,中心点为p1,另一个矩形单元格的宽为w2,高为h2,中心点为p2,如果(w1+w2)/2<|p1.x-p2.x|,则矩形单元格横向分离;如果(h1+h2)/2<|p1.y-p2.y|,则矩形单元格纵向分离,如果两个矩形单元格既不横向分离又不纵向分离,则可认定为相邻或相接。
本发明的有益效果是:该基于局部多层网格的轨迹数据热点区域发现方法划分网格覆盖运动平面的自适应效果比较好,只要指定单元格内样本点数量阈值,在迭代划分过程中,总能得到一个合适的网格覆盖运动空间,把样本数据做细致的划分,只要设定的密度阈值一定,初始划分参数对挖掘结果不会有太大影响,可以应用于海量数据挖掘,保证算法的效率和适应性。
附图说明
附图1为该基于局部多层网格的轨迹数据热点区域发现方法的流程图。
附图2为轨迹数据运动空间经局部多层网格划分后的示意图。
附图3为单元格集合中未处理的单元格与候选热点区域中任意单元格邻接方式示意图。
具体实施方式
下面结合附图及实施例对本发明作进一步说明。
本发明的主要构思为:对于轨迹数据高密度样本区域迭代地进行多层次网格划分,每深入一个层次的划分都使覆盖网格的精度提高一倍,最终使得覆盖高密度区域的网格单元格尺寸能取到一个合适值,因此算法中对于覆盖网格单元格尺寸的初始值选择不再重要,也不会对结果产生重大影响,对样本空间采用灵活的划分尺度并利用这些细分单元格发现热点区域能有效控制热点区域的范围,同时也能有效避免得到区域范围过大的问题,在一定程度上减弱了网格划分对样本数据点之间联系产生的割裂影响。
局部多层次划分后,得到一个覆盖运动空间的不规则网格,计算每个单元格密度,对高密度单元格进行基于密度的扩张,得到候选热点区域,如果候选热点区域满足轨迹支持数阈值和移动对象最短停留时间阈值,则该候选区域为热点区域,逐一考察候选区域,最终得到热点区域集合。
 参见图1和图2所示, 一种基于局部多层网格的轨迹数据热点区域发现方法,包括以下步骤:
步骤1)根据轨迹数据分布特点局部多层次划分轨迹运动空间,计算单元格密度,移动对象的运动平面假设为一个规则矩形,样本空间的多层次划分是一个递归过程,在最初仅仅对样本空间进行简单的划分,然后对符合条件的单元格作进一步多层次划分,其步骤包括:
步骤1.1)根据轨迹数据分布特点,初始化划分参数d;
步骤1.2)把样本空间划分为d×d个相同的矩形单元格{c0i|0≤i≤(d×d)},每个单元格的宽度为W0i,高度为H0i,面积S0i=W0i×H0i
每个矩形宽为Woi,高度为H0i,分别表示第0层次划分的第i个单元格的宽度和高度,通过这两个参数很容易得出单元格的面积S,用于计算单元格样本密度,以上为对样本空间的简单划分;
步骤1.3)设定单元格内最小数据点个数n;
步骤1.4)统计每个单元格中点的个数count(ci,j),如果单元格ci,j中数据点个数大于n,则把该单元格加入集合Ci中,否则把该单元格加入单元格集合G中;
其中,G为输出的单元格集合,Ci表示第i层中需要进一步划分的单元格集合,n为单元格内最小数据点个数,ci,j表示Ci中的第j个单元格;
参数n是单元格进一步划分的条件,对于每个单元格,如果其中包含样本点数超过n那么该单元格将继续被划分,否则该单元格被认为是“局部稀疏”的,不需要继续划分了,通过这个参数体现了算法对运动空间划分的“局部性”;
步骤1.5)对于Ci中的每个单元格ci,j调用函数multi-Divide(G,Ci,n)对单元格进一步划分包括以下步骤:
步骤1.5.1)对Ci中的每一个单元格ci,j进行遍历;
步骤1.5.2)把每个单元格ci,j四等分,每次划分后使得原来的精度提高一倍;划分得到的单元格被标识为ci+1,j,0≤j≤3,记录下新得到的单元格的长度和宽度,用于计算单元格中样本点的平均密度;
步骤1.5.3)统计单元格ci+1,j中的样本点的个数;
步骤1.5.4)如果样本点的个数大于n,则递归调用multi-Divide(G, Ci,n),否则将单元格ci+1,j加入输出的网格单元格集合G中。
步骤2)对密度单元格在给定的阀值下筛选及扩张,计算候选热点区域,以单元格集合G以及设定的热点区域阈值                                                为参数,算法结束将得到候选热点区域集合R,包括以下步骤:
步骤2.1)设定热点区域密度阀值
步骤2.2)计算单元格集合G中每个单元格的密度,并把这些单元格标记为未处理。对于G中的单元格,以密度为主要标准进行非升序排列并以单元格的面积为次要标准非降序排列,对单元格进行初步筛选,把密度不小于热点区域密度阈值的单元筛选到集合G*中,并排序,把G*中每个未处理的候选密度单元格ck看作热点区域r的初始组成单元格,如果该单元格已经处理过了,则继续考察G*下一个单元格;
步骤2.3)从G中按照排好的顺序选择未处理单元格,将单元格集合中未处理的单元格依次分别基于密度的扩张,扩张后的单元格密度不小于热点区域密度阀值的即被候选热点区域吸收,判断如果该单元格与r中的任意单元格邻接且与r中所有单元格合并后的平均密度不小于密度阈值,则热点区域r扩张吸收该单元格;如果该单元格与r中任何单元格都不邻接,则r不能吸收该单元格,继续遍历G中的下一个单元格;如果r中所有单元格合并后的平均密度小于密度阈值,那么此次扩张失败,即r不能吸收该单元格,并且热点区域r到达边界,跳出循环考察G*中下一个未处理的单元格。
如图3所示,在进行密度单元格扩张时候需要判断两个单元格是否相邻,根据本算法划分得到的单元格不可能相交,因此主要考察单元格的邻接情况就可以了,两个矩形单元格的位置关系包括相离、相邻和相接,表示矩形相邻接的五种情况,需要一种方法能准确判断这五种相邻情况,对于单元格c1,c2,假如c1的中心点为p1,宽为w1,高为h1;c2中心点位p2,宽为w2,高位h2。通过观察可以发现,图中b,c两种情况可以看作是a的特殊情况,它们都是a中矩形在一边上运动产生的重合;而且,如果两个矩形的宽或高相等,那么b,c两种情况继续运动后产生情况d,e,如果两个矩形的宽和高度都不相等,那么矩形相邻接任然可以归属为b,c两种情况。可以从横向和纵向两个维度来判断两个矩形是否邻接,如果(w1+w2)/2 < |p1.x-p2.x|,则矩形横向分离,如果(h1+h2)/2 < |p1.y- p2.y|,则矩形纵向分离,如果两个矩形既不横向分离又不纵向分离,则可认定两个矩形相邻或相接。
步骤3)根据区域轨迹支持数及轨迹数据在候选热点区域内的停留时间,筛选出热点区域,其步骤包括:
以候选热点区域集合R和轨迹数据集合T为参数,同时需要设定热点区域轨迹支持度阈值SR和轨迹在候选区域中最短停留时间阈值。对于每个候选热点区域,遍历轨迹集合,如果轨迹与该区域相交,且轨迹在该区域内停留的时间不小于阈值ts,则该轨迹为候选区域的支持轨迹统计每个区域的支持轨迹,以此计算候选区域的支持度,如果支持度大于阈值SR,则可以判定该区域为热点区域, 

Claims (3)

1.一种基于局部多层网格的轨迹数据热点区域发现方法,其特征在于,该方法包括以下步骤:
步骤1)根据轨迹数据分布特点局部多层次划分轨迹运动空间,计算单元格密度;
步骤1.1)根据轨迹数据分布特点,初始化划分参数d;
步骤1.2)对轨迹运动空间的每一个维度进行基于参数d的等分,形成d×d个大小相等的矩形单元格;
步骤1.3)设定单元格内最小数据点个数n;
步骤1.4)将每个单元格内数据点的个数与最小数据点个数n进行比较,当单元格内数据点的个数大于最小数据点个数n时,该单元格将被继续划分,否则该单元格被认为是“局部稀疏”的不再进行划分;
步骤1.5)对需要被继续划分的单元格,通过调用函数multi-Divide(G,Ci,n)进一步划分,直到所有满足划分条件的单元格划分完成,输出单元格集合G;
步骤1.5.1)对Ci中的每一个单元格ci,j进行遍历;
步骤1.5.2)把每个单元格ci,j四等分;每次划分后使得原来的精度提高一倍,划分得到的单元格被标识为ci+1,j,0≤j≤3,记录下新得到的单元格的长度和宽度,用于计算单元格中样本点的平均密度;
步骤1.5.3)统计单元格ci+1,j中的样本点的个数;
步骤1.5.4)如果该单元格中样本点的个数大于n,则递归调用multi-Divide(G,Ci,n),否则将单元格ci+1,j加入输出的单元格集合G中;
其中,G为输出的单元格集合,Ci表示第i层中需要进一步划分的单元格集合,n为单元格内最小数据点个数,ci,j表示Ci中的第j个单元格;
步骤2)对密度单元格在给定的阀值下筛选及扩张,计算候选热点区域;
步骤2.1)设定热点区域密度阀值;
步骤2.2)以该热点区域密度阀值为标准对单元格集合中的密度单元格进行初步筛选,把密度不小于热点区域密度阀值的单元格筛选到候选热点区域中并排序;
步骤2.3)将单元格集合中未处理的单元格依次分别基于密度的扩张,扩张后的单元格密度不小于热点区域密度阀值的即被候选热点区域吸收;
步骤3)根据候选热点区域轨迹支持数及轨迹数据在候选热点区域内的停留时间,筛选出热点区域。
2.根据权利要求1所述一种基于局部多层网格的轨迹数据热点区域发现方法,其特征在于,步骤2.3)包括:
步骤2.3.1)判断如果该单元格与候选热点区域中任意单元格邻接且与候选热点区域中所有单元格合并后的平均密度不小于热点区域密度阀值,则候选热点区域扩张吸收该单元格;
步骤2.3.2)如果该单元格与候选热点区域中任何单元格都不邻接,则候选热点区域不吸收该单元格,继续遍历单元格中的下一个单元格;
步骤2.3.3)如果候选热点区域中所有单元格合并后的平均密度小于热点区域密度阀值,则此次扩张失败,即候选热点区域不能吸收该单元格。
3.根据权利要求2所述一种基于局部多层网格的轨迹数据热点区域发现方法,其特征在于,单元格集合中未处理的单元格与候选热点区域中任意单元格是否邻接的判断方法为:从横向和纵向两个维度判断两个矩形单元格是否邻接,设定其中一个矩形单元格的宽为w1,高为h1,中心点为p1,另一个矩形单元格的宽为w2,高为h2,中心点为p2,如果(w1+w2)/2<|p1.x-p2.x|,则矩形单元格横向分离;如果(h1+h2)/2<|p1.y-p2.y|,则矩形单元格纵向分离,如果两个矩形单元格既不横向分离又不纵向分离,则可认定为相邻或相接。
CN201210193256.XA 2012-06-13 2012-06-13 基于局部多层网格的轨迹数据热点区域发现方法 Expired - Fee Related CN102750361B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210193256.XA CN102750361B (zh) 2012-06-13 2012-06-13 基于局部多层网格的轨迹数据热点区域发现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210193256.XA CN102750361B (zh) 2012-06-13 2012-06-13 基于局部多层网格的轨迹数据热点区域发现方法

Publications (2)

Publication Number Publication Date
CN102750361A CN102750361A (zh) 2012-10-24
CN102750361B true CN102750361B (zh) 2015-02-18

Family

ID=47030546

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210193256.XA Expired - Fee Related CN102750361B (zh) 2012-06-13 2012-06-13 基于局部多层网格的轨迹数据热点区域发现方法

Country Status (1)

Country Link
CN (1) CN102750361B (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104075709B (zh) * 2013-03-29 2018-10-16 百度在线网络技术(北京)有限公司 基于稀疏轨迹点数据的移动轨迹确定方法及设备
CN103324706B (zh) * 2013-06-17 2016-03-23 中国矿业大学 具有时间约束的轨迹数据热点区域的方法
CN104639397B (zh) * 2015-01-13 2017-11-03 中国科学院计算技术研究所 获取用户常规活动区域的方法与系统
CN106611499A (zh) * 2015-10-21 2017-05-03 北京计算机技术及应用研究所 一种检测机动车热点路径的方法
CN105682024B (zh) * 2016-01-05 2019-03-26 重庆邮电大学 一种基于移动信令数据的城市热点识别方法
CN106376032B (zh) * 2016-08-31 2017-09-22 鲁向东 热点区域自动识别方法和装置
CN107070961B (zh) * 2016-09-30 2020-06-23 阿里巴巴集团控股有限公司 基于地理位置数据的热点区域确定方法及装置
CN107071719A (zh) * 2016-12-12 2017-08-18 浙江大学 一种基于室内移动对象轨迹分析的热点区域热度分析方法
CN109688532B (zh) * 2017-10-16 2020-11-24 中移(苏州)软件技术有限公司 一种划分城市功能区域的方法及装置
CN108197347B (zh) * 2017-12-08 2019-12-17 北京农业信息技术研究中心 连续不规则区域采样点的地理空间分布均匀度检测方法
CN109243290B (zh) * 2018-10-08 2021-02-26 杭州飞弛网络科技有限公司 一种基于线下活动的足迹展示生成方法与系统
CN110609824B (zh) * 2019-09-09 2022-09-09 南京师范大学 城市路网环境下基于动态空间网络模型的热点区域检测方法
CN110909037B (zh) * 2019-10-09 2024-02-13 中国人民解放军战略支援部队信息工程大学 一种频繁轨迹模式的挖掘方法及装置
CN111931740B (zh) * 2020-09-29 2021-01-26 创新奇智(南京)科技有限公司 商品销量识别方法及装置、电子设备、存储介质
CN112800210B (zh) * 2021-04-06 2021-06-18 湖南师范大学 基于海量公交数据的人群画像算法
CN113129328B (zh) * 2021-04-22 2022-05-17 中国电子科技集团公司第二十九研究所 一种目标热点区域精细化分析方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100747393B1 (ko) * 2003-04-25 2007-08-07 미쓰이 긴조꾸 고교 가부시키가이샤 전자 부품 실장용 필름 캐리어 테이프와 그 제조 방법 및솔더 레지스트 도포용 스크린
CN101609564B (zh) * 2009-07-09 2011-06-15 杭州力孚信息科技有限公司 一种草图式输入的三维网格模型制作方法

Also Published As

Publication number Publication date
CN102750361A (zh) 2012-10-24

Similar Documents

Publication Publication Date Title
CN102750361B (zh) 基于局部多层网格的轨迹数据热点区域发现方法
CN101702655B (zh) 网络拓扑图的布局方法和系统
CN104616210B (zh) 一种智能配电网大数据融合重构与交互方法
JP7486659B2 (ja) 基地局の省エネルギー処理方法及び処理装置
US11716240B2 (en) Method, device and computer program product for anomaly detection
CN112312444B (zh) 一种5g网络切片下资源备份方法
CN113709754B (zh) 基于聚类算法的无线宽带通信系统布站组网方法及系统
CN107659973A (zh) 基于密度改进K‑means算法的超密集网络分簇方法
CN104182803A (zh) 风电数据预处理方法及风电功率预测方法和系统
US20160007210A1 (en) Efficient evaluation of hotspots for metrocell deployment
Zhou et al. Two-tier spatial modeling of base stations in cellular networks
CN115525999A (zh) 基于平衡四叉树的自适应细分网格拓扑优化方法与系统
CN105049286A (zh) 基于层次聚类的云平台测速数据判定方法
CN103634829A (zh) 一种基于路测信息的路段筛选方法和设备
CN108809470B (zh) 一种超密集蜂窝网络中的分簇算法
Yuan et al. Dynamic computational resource allocation for fast inter frame coding in video conferencing applications
CN106658526A (zh) 一种超密集小蜂窝网络中基于模拟退火算法频谱分配方法
CN106780747B (zh) 一种快速分割cfd计算网格的方法
CN111339727B (zh) 先进制程下最小化时延和溢出的通孔柱感知层分配器
CN108738028B (zh) 一种超密集组网下的分簇方法
CN103533556A (zh) 一种小区频率优化方法及装置
CN105979591B (zh) 低功耗大连接场景下基于最小有效sinr最优的用户调度方法
CN110380808B (zh) 以用户设备为中心的微小区半分簇干扰协调方法
CN106446012B (zh) 一种在osgb数据处理中提升渲染场景效率的方法
CN105024400A (zh) 一种实现光伏可再生能源离网控制的方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C53 Correction of patent for invention or patent application
CB03 Change of inventor or designer information

Inventor after: Zhang Lei

Inventor after: Bao Suning

Inventor after: Liu Leijun

Inventor after: Yang Guang

Inventor after: Li Jing

Inventor after: Li Fan

Inventor before: Zhang Lei

Inventor before: Yang Guang

Inventor before: Li Jing

Inventor before: Li Fan

COR Change of bibliographic data

Free format text: CORRECT: INVENTOR; FROM: ZHANG LEI YANG GUANG LI JING LI FAN TO: ZHANG LEI BAO SUNING LIU LEIJUN YANG GUANG LI JING LI FAN

C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150218

Termination date: 20150613

EXPY Termination of patent right or utility model