CN110334171A - 一种基于Geohash的时空伴随对象挖掘方法 - Google Patents

一种基于Geohash的时空伴随对象挖掘方法 Download PDF

Info

Publication number
CN110334171A
CN110334171A CN201910601962.5A CN201910601962A CN110334171A CN 110334171 A CN110334171 A CN 110334171A CN 201910601962 A CN201910601962 A CN 201910601962A CN 110334171 A CN110334171 A CN 110334171A
Authority
CN
China
Prior art keywords
geohash
target
date
time
space
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910601962.5A
Other languages
English (en)
Inventor
戴华
李佳玮
杨庚
徐佳
黄海平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Post and Telecommunication University
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing Post and Telecommunication University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Post and Telecommunication University filed Critical Nanjing Post and Telecommunication University
Priority to CN201910601962.5A priority Critical patent/CN110334171A/zh
Publication of CN110334171A publication Critical patent/CN110334171A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Remote Sensing (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Excavating Of Shafts Or Tunnels (AREA)

Abstract

本发明提供了一种基于Geohash的时空伴随对象挖掘方法,首先,将每条轨迹数据的经纬度转变为Geohash编码保存在数据库中,实现地图的网格化编码;然后,通过Geohash值统计出每个轨迹对象经过的网格数以及每两个对象在相近的时间同时出现的网格数;最后,计算出移动对象的轨迹相似度从而挖掘出伴随对象。采用本发明能够实现在保证较高准确度的条件下,显著提高时空伴随对象挖掘的效率。

Description

一种基于Geohash的时空伴随对象挖掘方法
技术领域
本发明属于移动对象数据库领域,涉及一种高效的时空伴随对象挖掘方法,具体涉及一种基于Geohash的时空伴随对象挖掘方法。
背景技术
随着无线通信和移动计算技术以及全球定位和导航系统的快速发展,空间轨迹数据不断增多。通这些来自于人类、动物、车辆和船只的轨迹挖掘出时空伴随对象对于动物研究、城市道路规划、军事监测都能起到作用。
目前的时空伴随对象挖掘方法都在时间效率以及准确度上有着一定的缺陷。例如在轨迹聚类中的DBSCAN算法时间复杂度较高,不利于大数据环境下轨迹数据的伴随对象挖掘。同时,大部分方法要求轨迹的时间连续性,这会使得在某一时刻离开集群的对象被忽略,进而使得准确度下降。
发明内容
发明目的:为了提高时空伴随对象挖掘的时间效率以及准确度,本发明提供了一种基于Geohash的时空伴随对象挖掘方法,以解决现有方法的不足。
发明内容:本发明所述的一种基于Geohash的时空伴随对象挖掘方法,包括以下步骤:
(1)轨迹长度的计算:将预先获取的轨迹数据的经纬度转变为Geohash编码保存在数据库中,实现地图的网格化编码;
(2)伴随长度的计算:通过Geohash值统计出每个轨迹对象经过的网格数以及每两个对象在相近的时间同时出现的网格数;
(3)伴随关系的判定:最后计算出移动对象的轨迹相似度从而挖掘出伴随对象。
所述步骤(1)包括以下步骤:
(11)输入轨迹数据“目标ID,年月日,时分秒,经度,纬度”,将每条数据的经纬度转为一个固定精度的Geohash值,输出数据格式为:目标ID,年月日,时分秒,Geohash值;
(12)以目标ID结合年月日进行分组,以目标ID结合年月日结合Geohash值进行排序;
(13)统计出每个目标每天经过的网格数,输出数据格式为:目标ID,年月日,网格数。
所述步骤(2)包括以下步骤:
(21)输入轨迹数据,将每条数据的经纬度转为一个固定精度的Geohash值;
(22)以Geohash值结合年月日进行分组,以Geohash值结合年月日结合时分秒进行排序;
(23)分析每天每个网格在相近的时间段内出现的两个不同目标,输出数据格式为:目标ID1,目标ID2,年月日,只记录一次。
所述步骤(3)包括以下步骤:
(31)根据步骤(1)计算出两个目标的轨迹长度,分别记为N1和N2,根据(23)计算出伴随长度,记为C;
(32)通过(31)中获得的N1、N2和C计算出轨迹相似度S;
(33)判断(31)得到的N1、N2和(32)得到的C是否满足伴随条件,判定如下:
N1≥Nmin
N2≥Nmin
S≥Sth
其中,Nmin为判断伴随的最小网格数,Sth为判断伴随的轨迹相似度阈值。
步骤(3)所述轨迹相似度S通过以下公式实现:
其中,N1、N2为移动对象的轨迹长度,C为目标对的伴随长度。
有益效果:与现有技术相比,本发明的有益效果:1、通过Geohash编码可以将二维的经纬度坐标用一维的字符串来表示,在数据库中只需要对一个字段进行索引,这样单索引的查询要比多索引查询高效得多,同时通过Geohash将轨迹网格化,有利于集群的挖掘,这比基于DBSCAN的轨迹聚类算法高效;2、不需要移动对象每个时间戳都伴随,而是使用轨迹相似度来放宽时间连续性的限制,从整体上来挖掘具有伴随关系的对象,这保证了挖掘时空伴随对象的准确度且更具与现实意义。
附图说明
图1为本发明的流程图;
图2为利用Geohash编码将地图网格化示意图。
具体实施方式
下面结合附图对本发明作进一步详细说明。如图1所示,本发明包括以下步骤:
图2为本发明利用Geohash编码将地图网格化的示意图。在同一网格内轨迹点的Geohash编码的前缀相同。如图2中在“abcdef”所表示的网格中,目标1和目标2轨迹点“abcdef123*”和“abcdef456*”前6位相同。
1、轨迹长度计算阶段包括以下步骤:
(1)输入轨迹数据“目标ID,年月日,时分秒,经度,纬度”,将每条数据的经纬度转为一个固定精度的Geohash值,输出数据格式为:目标ID,年月日,时分秒,Geohash值;Geohash值的固定精度是关键因素,若Geohash长度过长,则其代表的网格就会过大,使得相距很远的移动对象也被判定为伴随对象。若Geohash长度过小,则其代表的网格就会过小,使得很多伴随对象被遗漏,大大降低准确度。
(2)以目标ID+年月日进行分组,以目标ID+年月日+Geohash值进行排序。
(3)统计出每个目标每天经过的网格数,输出数据格式为:目标ID,年月日,网格数。
2、伴随长度计算阶段包括以下步骤:
(1)输入轨迹数据,将每条数据的经纬度转为一个固定精度的Geohash值。
(2)以Geohash值+年月日进行分组,以Geohash值+年月日+时分秒进行排序。
(3)分析每天每个网格在相近的时间段内(比如30秒)出现的两个不同目标,同一天同一个网格两个目标重复出现只记录一次。输出数据格式为:目标ID1,目标ID2,年月日。
3、伴随关系判定阶段包括以下步骤:
(1)根据第一阶段得出目标对轨迹长度,记为N1和N2。根据第二阶段得出伴随长度,记为C。例如图2中,目标1的轨迹坐标点经过了13个网格,目标2的轨迹坐标点经过了14个网格,目标1和2的轨迹坐标点在相近时间段内出现在同一网格数的次数为11。所以N1=13,N2=14,C=11。
(2)通过第三阶段中获得的N1、N2和C计算出轨迹相似度图2中目标1与目标2的轨迹相似度为
(3)判断N1、N2和C是否满足伴随条件。满足则输出伴随对象。条件如下:
①N1≥Nmin
②N2≥Nmin
③S≥Sth
其中,Nmin为判断伴随的最小网格数,Sth为判断伴随的轨迹相似度阈值。例如图2中,设定Nmin和Sth分别为10、75%,则目标1与目标2伴随。假设目标1与目标2分别代表动物迁徙时的个体与队伍,在第4个坐标点以及第11个坐标点处,目标1脱离了队伍但随后又回到了队伍中。这种情况下,本发明可以挖掘出目标1和目标2的伴随关系而现有方法的时间连续性限制了伴随关系的挖掘。

Claims (5)

1.一种基于Geohash的时空伴随对象挖掘方法,其特征在于,包括以下步骤:
(1)轨迹长度的计算:将预先获取的轨迹数据的经纬度转变为Geohash编码保存在数据库中,实现地图的网格化编码;
(2)伴随长度的计算:通过Geohash值统计出每个轨迹对象经过的网格数以及每两个对象在相近的时间同时出现的网格数;
(3)伴随关系的判定:最后计算出移动对象的轨迹相似度从而挖掘出伴随对象。
2.根据权利要求1所述的一种基于Geohash的时空伴随对象挖掘方法,其特征在于,所述步骤(1)包括以下步骤:
(11)输入轨迹数据“目标ID,年月日,时分秒,经度,纬度”,将每条数据的经纬度转为一个固定精度的Geohash值,输出数据格式为:目标ID,年月日,时分秒,Geohash值;
(12)以目标ID结合年月日进行分组,以目标ID结合年月日结合Geohash值进行排序;
(13)统计出每个目标每天经过的网格数,输出数据格式为:目标ID,年月日,网格数。
3.根据权利要求1所述的一种基于Geohash的时空伴随对象挖掘方法,其特征在于,所述步骤(2)包括以下步骤:
(21)输入轨迹数据,将每条数据的经纬度转为一个固定精度的Geohash值;
(22)以Geohash值结合年月日进行分组,以Geohash值结合年月日结合时分秒进行排序;
(23)分析每天每个网格在相近的时间段内出现的两个不同目标,输出数据格式为:目标ID1,目标ID2,年月日,只记录一次。
4.根据权利要求1所述的一种基于Geohash的时空伴随对象挖掘方法,其特征在于,所述步骤(3)包括以下步骤:
(31)根据步骤(1)计算出两个目标的轨迹长度,分别记为N1和N2,根据(23)计算出伴随长度,记为C;
(32)通过(31)中获得的N1、N2和C计算出轨迹相似度S;
(33)判断(31)得到的N1、N2和(32)得到的C是否满足伴随条件,判定如下:
N1≥Nmin
N2≥Nmin
S≥Sth
其中,Nmin为判断伴随的最小网格数,Sth为判断伴随的轨迹相似度阈值。
5.根据权利要求1所述的一种基于Geohash的时空伴随对象挖掘方法,其特征在于,步骤(3)所述轨迹相似度S通过以下公式实现:
其中,N1、N2为移动对象的轨迹长度,C为目标对的伴随长度。
CN201910601962.5A 2019-07-05 2019-07-05 一种基于Geohash的时空伴随对象挖掘方法 Pending CN110334171A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910601962.5A CN110334171A (zh) 2019-07-05 2019-07-05 一种基于Geohash的时空伴随对象挖掘方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910601962.5A CN110334171A (zh) 2019-07-05 2019-07-05 一种基于Geohash的时空伴随对象挖掘方法

Publications (1)

Publication Number Publication Date
CN110334171A true CN110334171A (zh) 2019-10-15

Family

ID=68144217

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910601962.5A Pending CN110334171A (zh) 2019-07-05 2019-07-05 一种基于Geohash的时空伴随对象挖掘方法

Country Status (1)

Country Link
CN (1) CN110334171A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110888884A (zh) * 2019-11-26 2020-03-17 杭州三汇数字信息技术有限公司 基于geohash匹配的车码拟合方法及系统
CN111209261A (zh) * 2020-01-02 2020-05-29 邑客得(上海)信息技术有限公司 基于信令大数据的用户出行轨迹提取方法和系统
CN111581320A (zh) * 2020-05-09 2020-08-25 海南中智信信息技术有限公司 一种基于行为轨迹的碰头地点及时长识别方法及系统
CN111625591A (zh) * 2020-05-15 2020-09-04 深圳市甲易科技有限公司 一种实现信息可视化的轨迹规律分析方法
CN112100308A (zh) * 2020-11-02 2020-12-18 中科星图股份有限公司 一种北斗时空轨迹的相似性查询方法
CN112689238A (zh) * 2019-10-18 2021-04-20 西安光启未来技术研究院 一种基于区域的轨迹碰撞方法、系统、存储介质及处理器
CN113779105A (zh) * 2021-08-11 2021-12-10 桂林电子科技大学 分布式轨迹流伴随模式挖掘方法
CN113806459A (zh) * 2021-08-09 2021-12-17 北京北斗伏羲科技有限公司 基于北斗网格的同行人员识别方法、系统及存储介质
US20240087446A1 (en) * 2022-09-14 2024-03-14 Maxar Technologies Holdings Inc. Hashing vehicle position data in real-time to detect behavior patterns
EP4339916A1 (en) * 2022-09-14 2024-03-20 Maxar Intelligence Inc. Hashing vehicle position data in real-time to detect behavior patterns
CN117786428A (zh) * 2024-02-27 2024-03-29 亿海蓝(北京)数据技术股份公司 确定船舶轨迹相似度的方法、装置和可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107229940A (zh) * 2016-03-25 2017-10-03 阿里巴巴集团控股有限公司 数据伴随分析方法及装置
CN107967493A (zh) * 2017-12-18 2018-04-27 广州汇智通信技术有限公司 一种人车伴随的判定方法、系统及相关装置
CN109388757A (zh) * 2018-10-10 2019-02-26 广州力挚网络科技有限公司 一种热门轨迹提取方法与装置
JP2019101622A (ja) * 2017-11-30 2019-06-24 キヤノンマーケティングジャパン株式会社 情報処理装置、制御方法、プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107229940A (zh) * 2016-03-25 2017-10-03 阿里巴巴集团控股有限公司 数据伴随分析方法及装置
JP2019101622A (ja) * 2017-11-30 2019-06-24 キヤノンマーケティングジャパン株式会社 情報処理装置、制御方法、プログラム
CN107967493A (zh) * 2017-12-18 2018-04-27 广州汇智通信技术有限公司 一种人车伴随的判定方法、系统及相关装置
CN109388757A (zh) * 2018-10-10 2019-02-26 广州力挚网络科技有限公司 一种热门轨迹提取方法与装置

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112689238A (zh) * 2019-10-18 2021-04-20 西安光启未来技术研究院 一种基于区域的轨迹碰撞方法、系统、存储介质及处理器
CN110888884A (zh) * 2019-11-26 2020-03-17 杭州三汇数字信息技术有限公司 基于geohash匹配的车码拟合方法及系统
CN110888884B (zh) * 2019-11-26 2022-08-23 杭州三汇数字信息技术有限公司 基于geohash匹配的车码拟合方法及系统
CN111209261A (zh) * 2020-01-02 2020-05-29 邑客得(上海)信息技术有限公司 基于信令大数据的用户出行轨迹提取方法和系统
CN111209261B (zh) * 2020-01-02 2020-11-03 邑客得(上海)信息技术有限公司 基于信令大数据的用户出行轨迹提取方法和系统
CN111581320A (zh) * 2020-05-09 2020-08-25 海南中智信信息技术有限公司 一种基于行为轨迹的碰头地点及时长识别方法及系统
CN111625591A (zh) * 2020-05-15 2020-09-04 深圳市甲易科技有限公司 一种实现信息可视化的轨迹规律分析方法
CN112100308A (zh) * 2020-11-02 2020-12-18 中科星图股份有限公司 一种北斗时空轨迹的相似性查询方法
CN113806459A (zh) * 2021-08-09 2021-12-17 北京北斗伏羲科技有限公司 基于北斗网格的同行人员识别方法、系统及存储介质
CN113806459B (zh) * 2021-08-09 2023-12-08 北京北斗伏羲科技有限公司 基于北斗网格的同行人员识别方法、系统及存储介质
CN113779105A (zh) * 2021-08-11 2021-12-10 桂林电子科技大学 分布式轨迹流伴随模式挖掘方法
CN113779105B (zh) * 2021-08-11 2022-12-13 桂林电子科技大学 分布式轨迹流伴随模式挖掘方法
US20240087446A1 (en) * 2022-09-14 2024-03-14 Maxar Technologies Holdings Inc. Hashing vehicle position data in real-time to detect behavior patterns
EP4339915A1 (en) * 2022-09-14 2024-03-20 Maxar Intelligence Inc. Hashing vehicle position data in real-time to detect behavior patterns
EP4339916A1 (en) * 2022-09-14 2024-03-20 Maxar Intelligence Inc. Hashing vehicle position data in real-time to detect behavior patterns
US12020564B2 (en) 2022-09-14 2024-06-25 Maxar Intelligence Inc. Hashing vehicle position data in real-time to detect behavior patterns
CN117786428A (zh) * 2024-02-27 2024-03-29 亿海蓝(北京)数据技术股份公司 确定船舶轨迹相似度的方法、装置和可读存储介质

Similar Documents

Publication Publication Date Title
CN110334171A (zh) 一种基于Geohash的时空伴随对象挖掘方法
CN112182410B (zh) 基于时空轨迹知识图谱的用户出行模式挖掘方法
CN106528589B (zh) 数据管理方法及装置
CN104462190B (zh) 一种基于海量空间轨迹挖掘的在线的位置预测方法
CN104965913A (zh) 一种基于gps地理位置数据挖掘的用户分类方法
CN109145173B (zh) 一种基于相似度的矢量要素变化比对方法
CN104850604A (zh) 一种基于张量的用户轨迹挖掘方法
EP3144703B1 (en) Generating trail network maps
CN103593430A (zh) 一种基于移动对象时空信息轨迹分段聚类的方法
Gailey et al. A note on a computer-based system for theodolite tracking of cetaceans
CN110716935A (zh) 基于网约车出行的轨迹数据分析与可视化方法及系统
CN108510008B (zh) 一种基于浮动车轨迹点空间关系和分布的路网提取方法
CN103942310A (zh) 基于时空模式的用户行为相似性挖掘方法
CN102567497A (zh) 一种最匹配模糊轨迹问题的查询方法
CN110275911A (zh) 基于频繁序列模式的私家车出行热点路径挖掘方法
CN105067004A (zh) 一种基于地形的路径搜索方法
CN111405461B (zh) 一种优化等间隔指纹采样个数的无线室内定位方法
CN110716925B (zh) 一种基于轨迹分析的跨境行为识别方法
CN105678246A (zh) 一种基于基站标号轨迹的运动模式挖掘方法
Huang et al. Frequent pattern-based map-matching on low sampling rate trajectories
Ghosh et al. Traj-cloud: a trajectory cloud for enabling efficient mobility services
CN118298117A (zh) 一种三维多层级地质模型构建方法
CN110909037B (zh) 一种频繁轨迹模式的挖掘方法及装置
CN108108407A (zh) 基于时空轨迹的群体运动移动簇模式排序方法
CN104778355A (zh) 基于广域分布交通系统的异常轨迹检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20191015