CN113704342A - 一种轨迹伴随分析的方法、系统、设备和存储介质 - Google Patents
一种轨迹伴随分析的方法、系统、设备和存储介质 Download PDFInfo
- Publication number
- CN113704342A CN113704342A CN202110872432.1A CN202110872432A CN113704342A CN 113704342 A CN113704342 A CN 113704342A CN 202110872432 A CN202110872432 A CN 202110872432A CN 113704342 A CN113704342 A CN 113704342A
- Authority
- CN
- China
- Prior art keywords
- data
- analysis
- track
- accompanying
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 87
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000013459 approach Methods 0.000 claims abstract description 6
- 230000004044 response Effects 0.000 claims abstract description 3
- 238000012545 processing Methods 0.000 claims description 20
- 230000002776 aggregation Effects 0.000 claims description 9
- 238000004220 aggregation Methods 0.000 claims description 9
- 230000004931 aggregating effect Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 7
- 230000002123 temporal effect Effects 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 abstract description 13
- 238000004422 calculation algorithm Methods 0.000 description 10
- 238000007726 management method Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 238000005070 sampling Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000011161 development Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/26—Visual data mining; Browsing structured data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/2433—Query languages
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24553—Query execution of query operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
Abstract
本发明提供了一种轨迹伴随分析的方法、系统、设备和存储介质,方法包括:获取采集对象的原始轨迹数据,对所述原始轨迹数据进行空间和时间维度的编码,并将编码后的轨迹数据存储到数据库;响应于接收到查询指令,将所述查询指令解析为所述数据库存储字段的行键范围,并根据所述行键范围返回符合所述查询指令的轨迹数据;对所述轨迹数据进行碰撞,并根据碰撞结果从所述数据库中获取临近点数据;以及对所述临近点数据进行伴随分析,获取目标号码的伴随号码和伴随相似度。本发明通过多种碰撞方式组合,使得能快速从数据库中获取对应轨迹数据,降低伴随分析的计算量,提升伴随分析的速度和准确率。
Description
技术领域
本领域涉及数据分析领域,更具体地,特别是指一种轨迹伴随分析的方法、系统、设备和存储介质。
背景技术
随着卫星、无线网络以及定位设施的快速发展,移动对象的轨迹数据急剧增长。对轨迹数据进行轨迹分析可以分析道路拥堵时空特征、人员活动热点区域和异常行驶车辆等,适用业务场景非常广,在安防、交通等行业发挥着巨大的作用。
伴随分析是轨迹数据的一种常见分析任务。在安防场景中,有方案使用GeoHash算法对时空数据编码,将时空数据和标签数据分别存储在分布式数据库HBase(HBase是一个分布式的、面向列的开源数据库)中,并采用Bitmap(位图)技术建立时空库索引表和标签库索引表,对轨迹数据进行多维/伴随分析;在移动大数据场景中,同样使用GeoHash对轨迹数据进行编码,对目标的轨迹点按照时间维度进行拼接,组合成目标轨迹记录;并提出一种根据GeoHash编码字符串的重合度计算相似度权重的方法,实现轨迹的伴随分析。现有方案中,根据目标轨迹点从所有数据中查找疑似伴随目标的计算方法比较复杂,且较为耗时,导致伴随分析的速度无法进一步提升。且不同的碰撞方法,从数据库中获取的目标点的数量和质量也相差极大,对后续的伴随分析的准确性和计算量有较大影响。
发明内容
有鉴于此,本发明实施例的目的在于提出一种轨迹伴随分析的方法、系统、计算机设备及计算机可读存储介质,本发明通过对海量轨迹数据进行智能冷热存储管理,并通过高效的轨迹点碰撞算法,提升伴随分析的速度和准确率,降低伴随分析的计算量,通过可选的时间分层存储策略,对轨迹数据智能化管理,降低存储成本;通过GeoMesa时空工具包,简化轨迹数据编码和查询的工作量;并通过4种碰撞方法组合,降低伴随分析的计算量,提升伴随分析的速度和准确率。
基于上述目的,本发明实施例的一方面提供了一种轨迹伴随分析的方法,包括如下步骤:获取采集对象的原始轨迹数据,对所述原始轨迹数据进行空间和时间维度的编码,并将编码后的轨迹数据存储到数据库;响应于接收到查询指令,将所述查询指令解析为所述数据库存储字段的行键范围,并根据所述行键范围返回符合所述查询指令的轨迹数据;对所述轨迹数据进行碰撞,并根据碰撞结果从所述数据库中获取临近点数据;以及对所述临近点数据进行伴随分析,获取目标号码的伴随号码和伴随相似度。
在一些实施方式中,所述对所述原始轨迹数据进行空间和时间维度的编码包括:根据预设精度,分别对时间数据和空间数据采用二分法处理,并将处理后的时间数据和空间数据穿插在一起进行编码。
在一些实施方式中,所述根据碰撞结果从所述数据库中获取临近点数据包括:在空间维度采用第一数量邻域和轨迹点自身数据,并在时间维度采用前后第二数量个时间分片和轨迹点自身时间分片。
在一些实施方式中,所述对所述临近点数据进行伴随分析包括:对每个目标号码碰撞出的号码进行去重,并对碰撞出的号码进行聚合,并将聚合结果按降序排列。
本发明实施例的另一方面,提供了一种轨迹伴随分析的系统,包括:编码模块,配置用于获取采集对象的原始轨迹数据,对所述原始轨迹数据进行空间和时间维度的编码,并将编码后的轨迹数据存储到数据库;查询模块,配置用于响应于接收到查询指令,将所述查询指令解析为所述数据库存储字段的行键范围,并根据所述行键范围返回符合所述查询指令的轨迹数据;碰撞模块,配置用于对所述轨迹数据进行碰撞,并根据碰撞结果从所述数据库中获取临近点数据;以及分析模块,配置用于对所述临近点数据进行伴随分析,获取目标号码的伴随号码和伴随相似度。
在一些实施方式中,所述编码模块配置用于:根据预设精度,分别对时间数据和空间数据采用二分法处理,并将处理后的时间数据和空间数据穿插在一起进行编码。
在一些实施方式中,所述碰撞模块配置用于:在空间维度采用第一数量邻域和轨迹点自身数据,并在时间维度采用前后第二数量个时间分片和轨迹点自身时间分片。
在一些实施方式中,所述分析模块配置用于:对每个目标号码碰撞出的号码进行去重,并对碰撞出的号码进行聚合,并将聚合结果按降序排列。
本发明实施例的又一方面,还提供了一种计算机设备,包括:至少一个处理器;以及存储器,所述存储器存储有可在所述处理器上运行的计算机指令,所述指令由所述处理器执行时实现如上方法的步骤。
本发明实施例的再一方面,还提供了一种计算机可读存储介质,计算机可读存储介质存储有被处理器执行时实现如上方法步骤的计算机程序。
本发明具有以下有益技术效果:通过对海量轨迹数据进行智能冷热存储管理,并通过高效的轨迹点碰撞算法,提升伴随分析的速度和准确率,降低伴随分析的计算量,通过可选的时间分层存储策略,对轨迹数据智能化管理,降低存储成本;通过GeoMesa时空工具包,简化轨迹数据编码和查询的工作量;并通过4种碰撞方法组合,降低伴随分析的计算量,提升伴随分析的速度和准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
图1为本发明提供的轨迹伴随分析的方法的实施例的示意图;
图2为本发明提供的轨迹伴随分析的系统的实施例的示意图;
图3为本发明提供的轨迹伴随分析的计算机设备的实施例的硬件结构示意图;
图4为本发明提供的轨迹伴随分析的计算机存储介质的实施例的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。
需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。
本发明实施例的第一个方面,提出了一种轨迹伴随分析的方法的实施例。图1示出的是本发明提供的轨迹伴随分析的方法的实施例的示意图。
如图1所示,本发明实施例包括如下步骤:
S1、获取采集对象的原始轨迹数据,对所述原始轨迹数据进行空间和时间维度的编码,并将编码后的轨迹数据存储到数据库;
S2、响应于接收到查询指令,将所述查询指令解析为所述数据库存储字段的行键范围,并根据所述行键范围返回符合所述查询指令的轨迹数据;
S3、对所述轨迹数据进行碰撞,并根据碰撞结果从所述数据库中获取临近点数据;以及
S4、对所述临近点数据进行伴随分析,获取目标号码的伴随号码和伴随相似度。
获取采集对象的原始轨迹数据,对所述原始轨迹数据进行空间和时间维度的编码,并将编码后的轨迹数据存储到数据库。获取采集对象的原始数据,并通过GeoMesa工具包进行空间/时空编码算法处理后,存入HBase。可选的,可以指定时间分层存储策略,实现轨迹数据的冷热存储智能管理。
在一些实施方式中,所述对所述原始轨迹数据进行空间和时间维度的编码包括:根据预设精度,分别对时间数据和空间数据采用二分法处理,并将处理后的时间数据和空间数据穿插在一起进行编码。获取采集对象的轨迹点数据,并通过GeoMesa工具包,对轨迹数据中的空间和时间维度进行Z3编码,组合为数据存储的行键的部分字段,最终,轨迹数据存储在HBase中。Z3编码是指将轨迹点的时间和空间数据按照类似GeoHash算法的分片和穿插。其中,空间数据处理方式和GeoHash的二分法一致,时间数据从1970年1月1日0点开始,将距离该时间点的星期数作为Epoch Week,在每个week内部,按照设定的级别,按照天/小时/分钟做分片(这里选择为按分钟进行分片),做二分法处理,最终和空间数据的处理结果穿插在一起,作为Z3编码结果,得到Z值。可选的,轨迹数据在写入HBase时,可指定时间分层存储策略,当轨迹数据超过一定时间后,将对应数据目录的级别设置为COLD(冷),实现轨迹数据的冷热存储智能管理。
响应于接收到查询指令,将所述查询指令解析为所述数据库存储字段的行键范围,并根据所述行键范围返回符合所述查询指令的轨迹数据。通过GeoMesa解析查询语句,将查询语句转换为scan+file语句,从HBase中快速获取对应轨迹记录。
通过GeoMesa工具包将用户指定的查询条件解析为HBase存储字段的行键范围,并进行批量scan(扫描)操作,返回符合条件的轨迹数据,供用户后续伴随分析使用。比如用户设置查询条件为指定区域范围内指定时间段,GeoMesa将其解析为包含起始和终止扫描范围的scan+filter(过滤)语句,从HBase中获取对应数据。
对所述轨迹数据进行碰撞,并根据碰撞结果从所述数据库中获取临近点数据。通过对轨迹数据进行4种碰撞,根据碰撞结果,从HBase快速、高效获取临近点数据。轨迹分析中,碰撞一般指在数据库中快速查找到需要的数据或轨迹点。
将目标轨迹分别按照全轨迹点采样、运动轨迹补点采样、头尾点采样、头中尾点采样整理出4批碰撞区域,在时空库中碰撞获取一批关联号码;4种碰撞方式分别如下:
a.全轨迹碰撞:去除驻留点(如办公室全天在一起,但是下班不在一起,碰撞点的权重过高,但实际无效)或者将驻留点的权重降低,一般采2个点,剔除离群点,去重,并对碰撞结果取topN,从效率和精度考虑,一般取Top 2000。
b.补点采样碰撞:目标号码的轨迹点和待碰撞号码的轨迹点都很少,不易碰撞;因此对轨迹点进行补点采样,丰富碰撞点,使结果更加精准;最后,取topN。
c.头尾碰撞:主要用于处理目标轨迹点与伴随轨迹点差异较大的情况。比如目标号码轨迹点很少,那碰撞结果必然不理想;或者待碰撞轨迹点较少,碰撞效果也不好。最后,取M组结果(M设置为800,作为上限值)。但如果碰撞结果很多,如超过N,则该方式计算结果放弃。
d.头尾中碰撞:类似于头尾碰撞,但是碰撞时对中间点也做碰撞,3个点全碰撞才保留;最后,取M组结果(M设置为800,作为上限值)。但如果碰撞结果很多,如超过M,则该方式计算结果放弃。(中间点是指目标号码轨迹点中与头尾点的方差之和最小的轨迹点)。
在一些实施方式中,所述根据碰撞结果从所述数据库中获取临近点数据包括:在空间维度采用第一数量邻域和轨迹点自身数据,并在时间维度采用前后第二数量个时间分片和轨迹点自身时间分片。轨迹点数据的碰撞一般在空间范围采用8邻域(相邻的GeoHash编码区域)+轨迹点自身;时间维度采用前后两个时间分片,考虑到前后2分钟的数据可能较少,这里采用前后四个时间分片+轨迹点本身时间分片。也即只要数据在这个查询范围内的数据,都可作为碰撞结果返回。根据该碰撞规则,将上述4种碰撞转换为对应的查询语句,进行查询即可。
对所述临近点数据进行伴随分析,获取目标号码的伴随号码和伴随相似度。将轨迹点数据做聚合计算,按照聚合结果降序排列取TopN,获取一批伴随轨迹,通过伴随分析算法,获取指定号码的伴随号码和伴随相似度。伴随分析是针对时空数据的一种数据挖掘方法,通过给定目标信息,计算伴随目标和伴随相似度。
在一些实施方式中,所述对所述临近点数据进行伴随分析包括:对每个目标号码碰撞出的号码进行去重,并对碰撞出的号码进行聚合,并将聚合结果按降序排列。根据设置的查询条件,获取目标号码的轨迹数据,并剔除其中离群点;对目标轨迹进行4种碰撞运算,并根据碰撞点从HBase中碰撞获取一批关联号码;一般取topN(对精度要求高的话,N就取大点,一般取2000个号码),同时对每个目标号码点碰撞出的号码进行去重;根据手机号码,对碰撞结果做聚合,将聚合结果按降序排列,取TopN,用于伴随分析;对关联号码轨迹做剔除离群点处理,然后根据轨迹点计算伴随度,并按伴相似度降序输出伴随轨迹。
本发明实施例使用GeoMesa工具包实现复杂的数据编码和查询语句解析,简单方便,无需编写复杂的代码,降低代码开发量和开发复杂度;改写GeoMesa数据写入逻辑,扩展支持HBase时间分层存储策略,实现轨迹数据的智能冷热存储管理,减少存储空间占用,降低存储成本;通过4种碰撞方式组合,使得能快速从HBase中获取对应轨迹数据,降低伴随分析的计算量,提升伴随分析的速度和准确率。
需要特别指出的是,上述轨迹伴随分析的方法的各个实施例中的各个步骤均可以相互交叉、替换、增加、删减,因此,这些合理的排列组合变换之于轨迹伴随分析的方法也应当属于本发明的保护范围,并且不应将本发明的保护范围局限在实施例之上。
基于上述目的,本发明实施例的第二个方面,提出了一种轨迹伴随分析的系统。如图2所示,系统200包括如下模块:编码模块,配置用于获取采集对象的原始轨迹数据,对所述原始轨迹数据进行空间和时间维度的编码,并将编码后的轨迹数据存储到数据库;查询模块,配置用于响应于接收到查询指令,将所述查询指令解析为所述数据库存储字段的行键范围,并根据所述行键范围返回符合所述查询指令的轨迹数据;碰撞模块,配置用于对所述轨迹数据进行碰撞,并根据碰撞结果从所述数据库中获取临近点数据;以及分析模块,配置用于对所述临近点数据进行伴随分析,获取目标号码的伴随号码和伴随相似度。
在一些实施方式中,所述编码模块配置用于:根据预设精度,分别对时间数据和空间数据采用二分法处理,并将处理后的时间数据和空间数据穿插在一起进行编码。
在一些实施方式中,所述碰撞模块配置用于:在空间维度采用第一数量邻域和轨迹点自身数据,并在时间维度采用前后第二数量个时间分片和轨迹点自身时间分片。
在一些实施方式中,所述分析模块配置用于:对每个目标号码碰撞出的号码进行去重,并对碰撞出的号码进行聚合,并将聚合结果按降序排列。
本发明实施例通过对海量轨迹数据进行智能冷热存储管理,并通过高效的轨迹点碰撞算法,提升伴随分析的速度和准确率,降低伴随分析的计算量,通过可选的时间分层存储策略,对轨迹数据智能化管理,降低存储成本;通过GeoMesa时空工具包,简化轨迹数据编码和查询的工作量;并通过4种碰撞方法组合,降低伴随分析的计算量,提升伴随分析的速度和准确率。
基于上述目的,本发明实施例的第三个方面,提出了一种计算机设备,包括:至少一个处理器;以及存储器,存储器存储有可在处理器上运行的计算机指令,指令由处理器执行以实现如下步骤:S1、获取采集对象的原始轨迹数据,对所述原始轨迹数据进行空间和时间维度的编码,并将编码后的轨迹数据存储到数据库;S2、响应于接收到查询指令,将所述查询指令解析为所述数据库存储字段的行键范围,并根据所述行键范围返回符合所述查询指令的轨迹数据;S3、对所述轨迹数据进行碰撞,并根据碰撞结果从所述数据库中获取临近点数据;以及S4、对所述临近点数据进行伴随分析,获取目标号码的伴随号码和伴随相似度。
在一些实施方式中,所述对所述原始轨迹数据进行空间和时间维度的编码包括:根据预设精度,分别对时间数据和空间数据采用二分法处理,并将处理后的时间数据和空间数据穿插在一起进行编码。
在一些实施方式中,所述根据碰撞结果从所述数据库中获取临近点数据包括:在空间维度采用第一数量邻域和轨迹点自身数据,并在时间维度采用前后第二数量个时间分片和轨迹点自身时间分片。
在一些实施方式中,所述对所述临近点数据进行伴随分析包括:对每个目标号码碰撞出的号码进行去重,并对碰撞出的号码进行聚合,并将聚合结果按降序排列。
本发明实施例通过对海量轨迹数据进行智能冷热存储管理,并通过高效的轨迹点碰撞算法,提升伴随分析的速度和准确率,降低伴随分析的计算量,通过可选的时间分层存储策略,对轨迹数据智能化管理,降低存储成本;通过GeoMesa时空工具包,简化轨迹数据编码和查询的工作量;并通过4种碰撞方法组合,降低伴随分析的计算量,提升伴随分析的速度和准确率。
如图3所示,为本发明提供的上述轨迹伴随分析的计算机设备的一个实施例的硬件结构示意图。
以如图3所示的装置为例,在该装置中包括一个处理器301以及一个存储器302。
处理器301和存储器302可以通过总线或者其他方式连接,图3中以通过总线连接为例。
存储器302作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本申请实施例中的轨迹伴随分析的方法对应的程序指令/模块。处理器301通过运行存储在存储器302中的非易失性软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例的轨迹伴随分析的方法。
存储器302可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据轨迹伴随分析的方法的使用所创建的数据等。此外,存储器302可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器302可选包括相对于处理器301远程设置的存储器,这些远程存储器可以通过网络连接至本地模块。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
一个或者多个轨迹伴随分析的方法对应的计算机指令303存储在存储器302中,当被处理器301执行时,执行上述任意方法实施例中的轨迹伴随分析的方法。
本发明实施例通过对海量轨迹数据进行智能冷热存储管理,并通过高效的轨迹点碰撞算法,提升伴随分析的速度和准确率,降低伴随分析的计算量,通过可选的时间分层存储策略,对轨迹数据智能化管理,降低存储成本;通过GeoMesa时空工具包,简化轨迹数据编码和查询的工作量;并通过4种碰撞方法组合,降低伴随分析的计算量,提升伴随分析的速度和准确率。
执行上述轨迹伴随分析的方法的计算机设备的任何一个实施例,可以达到与之对应的前述任意方法实施例相同或者相类似的效果。
本发明还提供了一种计算机可读存储介质,计算机可读存储介质存储有被处理器执行时执行如上轨迹伴随分析的方法的计算机程序。
如图4所示,为本发明提供的上述轨迹伴随分析的计算机存储介质的一个实施例的示意图。以如图4所示的计算机存储介质为例,计算机可读存储介质401存储有被处理器执行时执行如上方法的计算机程序402。
本发明实施例通过对海量轨迹数据进行智能冷热存储管理,并通过高效的轨迹点碰撞算法,提升伴随分析的速度和准确率,降低伴随分析的计算量,通过可选的时间分层存储策略,对轨迹数据智能化管理,降低存储成本;通过GeoMesa时空工具包,简化轨迹数据编码和查询的工作量;并通过4种碰撞方法组合,降低伴随分析的计算量,提升伴随分析的速度和准确率。
最后需要说明的是,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关硬件来完成,轨迹伴随分析的方法的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,程序的存储介质可为磁碟、光盘、只读存储记忆体(ROM)或随机存储记忆体(RAM)等。上述计算机程序的实施例,可以达到与之对应的前述任意方法实施例相同或者相类似的效果。
以上是本发明公开的示例性实施例,但是应当注意,在不背离权利要求限定的本发明实施例公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外,尽管本发明实施例公开的元素可以以个体形式描述或要求,但除非明确限制为单数,也可以理解为多个。
应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。
上述本发明实施例公开实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。
Claims (10)
1.一种轨迹伴随分析的方法,其特征在于,包括如下步骤:
获取采集对象的原始轨迹数据,对所述原始轨迹数据进行空间和时间维度的编码,并将编码后的轨迹数据存储到数据库;
响应于接收到查询指令,将所述查询指令解析为所述数据库存储字段的行键范围,并根据所述行键范围返回符合所述查询指令的轨迹数据;
对所述轨迹数据进行碰撞,并根据碰撞结果从所述数据库中获取临近点数据;以及
对所述临近点数据进行伴随分析,获取目标号码的伴随号码和伴随相似度。
2.根据权利要求1所述的方法,其特征在于,所述对所述原始轨迹数据进行空间和时间维度的编码包括:
根据预设精度,分别对时间数据和空间数据采用二分法处理,并将处理后的时间数据和空间数据穿插在一起进行编码。
3.根据权利要求1所述的方法,其特征在于,所述根据碰撞结果从所述数据库中获取临近点数据包括:
在空间维度采用第一数量邻域和轨迹点自身数据,并在时间维度采用前后第二数量个时间分片和轨迹点自身时间分片。
4.根据权利要求1所述的方法,其特征在于,所述对所述临近点数据进行伴随分析包括:
对每个目标号码碰撞出的号码进行去重,并对碰撞出的号码进行聚合,并将聚合结果按降序排列。
5.一种轨迹伴随分析的系统,其特征在于,包括:
编码模块,配置用于获取采集对象的原始轨迹数据,对所述原始轨迹数据进行空间和时间维度的编码,并将编码后的轨迹数据存储到数据库;
查询模块,配置用于响应于接收到查询指令,将所述查询指令解析为所述数据库存储字段的行键范围,并根据所述行键范围返回符合所述查询指令的轨迹数据;
碰撞模块,配置用于对所述轨迹数据进行碰撞,并根据碰撞结果从所述数据库中获取临近点数据;以及
分析模块,配置用于对所述临近点数据进行伴随分析,获取目标号码的伴随号码和伴随相似度。
6.根据权利要求5所述的系统,其特征在于,所述编码模块配置用于:
根据预设精度,分别对时间数据和空间数据采用二分法处理,并将处理后的时间数据和空间数据穿插在一起进行编码。
7.根据权利要求5所述的系统,其特征在于,所述碰撞模块配置用于:
在空间维度采用第一数量邻域和轨迹点自身数据,并在时间维度采用前后第二数量个时间分片和轨迹点自身时间分片。
8.根据权利要求5所述的系统,其特征在于,所述分析模块配置用于:
对每个目标号码碰撞出的号码进行去重,并对碰撞出的号码进行聚合,并将聚合结果按降序排列。
9.一种计算机设备,其特征在于,包括:
至少一个处理器;以及
存储器,所述存储器存储有可在所述处理器上运行的计算机指令,所述指令由所述处理器执行时实现权利要求1-4任意一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-4任意一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110872432.1A CN113704342A (zh) | 2021-07-30 | 2021-07-30 | 一种轨迹伴随分析的方法、系统、设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110872432.1A CN113704342A (zh) | 2021-07-30 | 2021-07-30 | 一种轨迹伴随分析的方法、系统、设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113704342A true CN113704342A (zh) | 2021-11-26 |
Family
ID=78650968
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110872432.1A Pending CN113704342A (zh) | 2021-07-30 | 2021-07-30 | 一种轨迹伴随分析的方法、系统、设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113704342A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113961018A (zh) * | 2021-12-21 | 2022-01-21 | 浙江这里飞科技有限公司 | 一种无人机碰撞风险的确定方法及装置 |
CN116070601A (zh) * | 2023-03-28 | 2023-05-05 | 联仁健康医疗大数据科技股份有限公司 | 数据拼接方法、装置、电子设备及存储介质 |
CN116842285A (zh) * | 2023-07-27 | 2023-10-03 | 中国人民解放军陆军工程大学 | 基于时空轨迹数据的目标伴随模式挖掘方法 |
CN117591757A (zh) * | 2023-10-31 | 2024-02-23 | 和智信(山东)大数据科技有限公司 | 轨迹数据处理方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017162084A1 (zh) * | 2016-03-25 | 2017-09-28 | 阿里巴巴集团控股有限公司 | 数据伴随分析方法及装置 |
CN107590250A (zh) * | 2017-09-18 | 2018-01-16 | 广州汇智通信技术有限公司 | 一种时空轨迹生成方法及装置 |
CN110019402A (zh) * | 2017-12-26 | 2019-07-16 | 浙江宇视科技有限公司 | 数据分析方法、装置及可读存储介质 |
CN110399440A (zh) * | 2019-06-28 | 2019-11-01 | 苏州浪潮智能科技有限公司 | 一种经纬度网格化编码方法和装置 |
CN111046042A (zh) * | 2019-12-10 | 2020-04-21 | 厦门卫星定位应用股份有限公司 | 基于时空碰撞的快速检索方法及系统 |
CN111177195A (zh) * | 2019-12-18 | 2020-05-19 | 北京明略软件系统有限公司 | 一种数据比对碰撞方法和装置 |
-
2021
- 2021-07-30 CN CN202110872432.1A patent/CN113704342A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017162084A1 (zh) * | 2016-03-25 | 2017-09-28 | 阿里巴巴集团控股有限公司 | 数据伴随分析方法及装置 |
CN107229940A (zh) * | 2016-03-25 | 2017-10-03 | 阿里巴巴集团控股有限公司 | 数据伴随分析方法及装置 |
CN107590250A (zh) * | 2017-09-18 | 2018-01-16 | 广州汇智通信技术有限公司 | 一种时空轨迹生成方法及装置 |
CN110019402A (zh) * | 2017-12-26 | 2019-07-16 | 浙江宇视科技有限公司 | 数据分析方法、装置及可读存储介质 |
CN110399440A (zh) * | 2019-06-28 | 2019-11-01 | 苏州浪潮智能科技有限公司 | 一种经纬度网格化编码方法和装置 |
CN111046042A (zh) * | 2019-12-10 | 2020-04-21 | 厦门卫星定位应用股份有限公司 | 基于时空碰撞的快速检索方法及系统 |
CN111177195A (zh) * | 2019-12-18 | 2020-05-19 | 北京明略软件系统有限公司 | 一种数据比对碰撞方法和装置 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113961018A (zh) * | 2021-12-21 | 2022-01-21 | 浙江这里飞科技有限公司 | 一种无人机碰撞风险的确定方法及装置 |
CN116070601A (zh) * | 2023-03-28 | 2023-05-05 | 联仁健康医疗大数据科技股份有限公司 | 数据拼接方法、装置、电子设备及存储介质 |
CN116842285A (zh) * | 2023-07-27 | 2023-10-03 | 中国人民解放军陆军工程大学 | 基于时空轨迹数据的目标伴随模式挖掘方法 |
CN116842285B (zh) * | 2023-07-27 | 2024-05-03 | 中国人民解放军陆军工程大学 | 基于时空轨迹数据的目标伴随模式挖掘方法 |
CN117591757A (zh) * | 2023-10-31 | 2024-02-23 | 和智信(山东)大数据科技有限公司 | 轨迹数据处理方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113704342A (zh) | 一种轨迹伴随分析的方法、系统、设备和存储介质 | |
CN109165215B (zh) | 一种云环境下时空索引的构建方法、装置及电子设备 | |
Marketos et al. | Building real-world trajectory warehouses | |
CN110334111B (zh) | 一种多维轨迹分析方法及装置 | |
CN101442762B (zh) | 网络性能分析以及网络故障定位方法和装置 | |
CN104462222A (zh) | 一种卡口车辆通行数据的分布式存储方法及系统 | |
CN102902752A (zh) | 一种日志监控方法及系统 | |
CN113297135A (zh) | 数据处理方法以及装置 | |
CN104504077A (zh) | 网页访问数据的统计方法和装置 | |
CN106407429A (zh) | 文件追踪方法、装置及系统 | |
CN109145225B (zh) | 一种数据处理方法及装置 | |
CN111324781A (zh) | 一种数据分析方法、装置及设备 | |
Yadamjav et al. | Querying recurrent convoys over trajectory data | |
CN117376092A (zh) | 故障根因定位方法、装置、设备及存储介质 | |
CN104317820B (zh) | 报表的统计方法和装置 | |
CN105468748B (zh) | 一种分布式存储位置数据方法及系统 | |
CN115905435A (zh) | 一种基于时空聚合中间态的信令数据分析方法及装置 | |
CN115190431A (zh) | 时空数据分析方法、装置、可读存储介质和设备 | |
CN114969187A (zh) | 数据分析系统及方法 | |
CN112988797A (zh) | 基于p-stable lsh的时空伴随查询方法 | |
CN110442780B (zh) | 基于智慧园区的车主画像生成方法、装置和计算机设备 | |
CN114969567B (zh) | 一种高性能时空轨迹关联分析方法、装置及设备 | |
CN111552684A (zh) | 异常数据定位方法、装置、计算机设备和存储介质 | |
CN111552905A (zh) | 一种用户访问关键路径的获取方法及系统 | |
Hu et al. | Mining both frequent and rare episodes in multiple data streams |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |