CN112000736B - 时空轨迹伴随分析方法、系统及电子设备和存储介质 - Google Patents
时空轨迹伴随分析方法、系统及电子设备和存储介质 Download PDFInfo
- Publication number
- CN112000736B CN112000736B CN202010821130.7A CN202010821130A CN112000736B CN 112000736 B CN112000736 B CN 112000736B CN 202010821130 A CN202010821130 A CN 202010821130A CN 112000736 B CN112000736 B CN 112000736B
- Authority
- CN
- China
- Prior art keywords
- data
- time
- track
- trajectory
- accompanying
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 48
- 238000000034 method Methods 0.000 claims abstract description 39
- 230000000379 polymerizing effect Effects 0.000 claims abstract description 5
- 238000012545 processing Methods 0.000 claims description 26
- 238000006116 polymerization reaction Methods 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 12
- 238000013500 data storage Methods 0.000 claims description 4
- 238000012216 screening Methods 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 abstract description 13
- 238000013499 data model Methods 0.000 abstract description 5
- 230000008030 elimination Effects 0.000 abstract 1
- 238000003379 elimination reaction Methods 0.000 abstract 1
- 238000004891 communication Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 4
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2219—Large Object storage; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/2433—Query languages
- G06F16/244—Grouping and aggregation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24553—Query execution of query operations
- G06F16/24554—Unary operations; Data partitioning operations
- G06F16/24556—Aggregation; Duplicate elimination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2471—Distributed queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Fuzzy Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种时空轨迹伴随分析方法及相关组件,该方法包括:获取采集对象的原始数据,对原始数据中的空间数据编码生成字符串并添加至原始数据中,生成预处理数据;将预处理数据写入时序库Druid,写入时时序库根据时间粒度对预处理数据进行预聚合实现初始去重;接收针对目标对象的轨迹查询请求,查找数据并二次去重,生成目标对象的第一时空轨迹及伴随对象的第二时空轨迹;确定第二时空轨迹与第一时空轨迹的伴随次数,确定每个第二时空轨迹与第一时空轨迹的伴随程度。本申请利用时序库通过预聚合操作实现粗略去重,避免数据冗余,降低空间占用,提升二次去重计算速度,在伴随分析时无需构建非线性数据模型进行拟合,降低了计算复杂度。
Description
技术领域
本申请涉及数据处理技术领域,更具体地说,涉及一种时空轨迹伴随分析方法、系统及一种电子设备和一种计算机可读存储介质。
背景技术
随着卫星、无线网络以及定位设施的快速发展,移动对象的轨迹数据急剧增长,轨迹数据的分析、挖掘作为数据挖掘的一个新型分支,在安防、交通等行业发挥着巨大的作用。时空轨迹数据是采集对象的位置、时间和标签信息的采样记录集合。通过对时空数据进行分析,可以得到时空数据中的相似特征,进而有助于用户从中发现有效信息。
在安防场景中,使用GeoHash对时空数据编码,并保存在分布式数据库Hbase中,对轨迹数据进行多维/伴随分析;在移动大数据场景中,同样使用GeoHash对时空数据编码,对目标轨迹点按照时间维度进行拼接,组合成目标轨迹记录,并可根据GeoHash编码字符串的重合度计算相似度权重,实现轨迹的伴随分析。也即,生成的轨迹数据需要按照时间维度人为设计复杂的代码逻辑对数据进行排序拼接。在进行伴随分析时,通常需要构建复杂的非线性数据模型进行拟合处理,计算复杂度较高,且需要耗费大量的人力成本。
发明内容
本申请的目的在于提供一种时空轨迹伴随分析方法、系统及一种电子设备和一种计算机可读存储介质,降低了计算复杂度、耗时及人力成本。
为实现上述目的,本申请提供了一种时空轨迹伴随分析方法,包括:
获取采集对象的原始数据,对所述原始数据中的空间数据进行plus code编码生成字符串,将所述字符串添加至所述原始数据中,生成预处理数据;
将所述预处理数据写入时序库Druid中进行存储,写入过程中所述时序库Druid根据时间粒度对所述预处理数据进行预聚合操作,实现初始去重;
接收针对目标对象的轨迹查询请求,根据所述轨迹查询请求在所述时序库Druid中进行数据查找并进行二次去重处理,生成所述目标对象的第一时空轨迹,以及所述目标对象对应的伴随对象的第二时空轨迹;
确定所述第二时空轨迹与所述第一时空轨迹的伴随次数,基于所述伴随次数确定每个所述第二时空轨迹与所述第一时空轨迹的伴随程度。
可选的,所述写入过程中所述时序库Druid根据时间粒度对所述预处理数据进行预聚合操作,实现初始去重,包括:
利用所述时序库Druid根据时间维度,对所述预处理数据进行预聚合操作,将经过所述预聚合操作的处理后数据按照顺序分块存储的方式写入所述时序库Druid中进行存储;
利用所述时序库Druid根据所述处理后数据的维度信息,创建所述处理后数据对应的位图索引。
可选的,所述根据所述轨迹查询请求在所述时序库Druid中进行数据查找,生成所述目标对象的第一时空轨迹,包括:
根据所述轨迹查询请求,通过所述位图索引进行位运算,筛选所述目标对象在指定时间段内的第一轨迹数据;
基于时间粒度对所述第一轨迹数据进行去重处理,得到去重后数据;
按照时间顺序对所述去重后数据进行汇总,生成所述目标对象对应的第一时空轨迹。
可选的,所述基于时间粒度对所述第一轨迹数据进行去重处理,得到去重后数据,包括:
统计每个时间粒度内置信度最高的轨迹点确定为当前时间粒度的轨迹点数据;所述置信度包括每个plus code编码的字符串出现的频次。
可选的,所述第二时空轨迹的生成过程,包括:
根据所述第一时空轨迹,在所述时序库Druid中查询与所有伴随对象对应的第二轨迹数据;
根据所述伴随对象的标识信息,对所述第二轨迹数据进行分组,并根据时间粒度对所述第二轨迹数据进行去重处理,生成每个所述伴随对象对应的第二时空轨迹。
可选的,所述确定所述第二时空轨迹与所述第一时空轨迹的伴随次数,基于所述伴随次数确定每个所述第二时空轨迹与所述第一时空轨迹的伴随程度,包括:
分别统计每个所述第二时空轨迹与所述第一时空轨迹的伴随总次数和最大连续伴随次数;
确定所述伴随总次数和所述最大连续伴随次数对应的权重,通过加权方式计算每个所述第二时空轨迹与所述第一时空轨迹的伴随程度。
可选的,所述基于所述伴随次数确定每个所述第二时空轨迹与所述第一时空轨迹的伴随程度之后,还包括:
通过预设显示方式展示所述第一时空轨迹,并按照所述伴随程度大小的降序排列输出伴随轨迹列表。
为实现上述目的,本申请提供了一种时空轨迹伴随分析系统,包括:
数据编码模块,用于获取采集对象的原始数据,对所述原始数据中的空间数据进行plus code编码生成字符串,将所述字符串添加至所述原始数据中,生成预处理数据;
数据存储模块,用于将所述预处理数据写入时序库Druid中进行存储,写入过程中所述时序库Druid根据时间粒度对所述预处理数据进行预聚合操作,实现初始去重;
轨迹生成模块,用于接收针对目标对象的轨迹查询请求,根据所述轨迹查询请求在所述时序库Druid中进行数据查找并进行二次去重处理,生成所述目标对象的第一时空轨迹,以及所述目标对象对应的伴随对象的第二时空轨迹;
伴随分析模块,用于确定所述第二时空轨迹与所述第一时空轨迹的伴随次数,基于所述伴随次数确定每个所述第二时空轨迹与所述第一时空轨迹的伴随程度。
为实现上述目的,本申请提供了一种电子设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现前述公开的任一种时空轨迹伴随分析方法的步骤。
为实现上述目的,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现前述公开的任一种时空轨迹伴随分析方法的步骤。
通过以上方案可知,本申请提供的一种时空轨迹伴随分析方法,包括:获取采集对象的原始数据,对所述原始数据中的空间数据进行plus code编码生成字符串,将所述字符串添加至所述原始数据中,生成预处理数据;将所述预处理数据写入时序库Druid中进行存储,写入过程中所述时序库Druid根据时间粒度对所述预处理数据进行预聚合操作,实现初始去重;接收针对目标对象的轨迹查询请求,根据所述轨迹查询请求在所述时序库Druid中进行数据查找并进行二次去重处理,生成所述目标对象的第一时空轨迹,以及所述目标对象对应的伴随对象的第二时空轨迹;确定所述第二时空轨迹与所述第一时空轨迹的伴随次数,基于所述伴随次数确定每个所述第二时空轨迹与所述第一时空轨迹的伴随程度。由上可知,本申请可在生成预处理数据之后,利用时序库Druid通过预聚合操作实现数据的粗略去重,避免数据冗余,降低存储空间占用,提升后续二次精确去重过程的计算速度,并基于时序库Druid自动将数据按照时间进行排序,无需手动排序工作,在伴随分析时可基于第二时空轨迹与第一时空轨迹的伴随次数计算伴随程度,避免构建复杂的非线性数据模型进行拟合处理,降低了计算复杂度、耗时及人力成本。
本申请还公开了一种时空轨迹伴随分析系统及一种电子设备和一种计算机可读存储介质,同样能实现上述技术效果。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本申请。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例公开的一种时空轨迹伴随分析方法的流程图;
图2为本申请实施例公开的一种时空轨迹伴随分析系统的结构图;
图3为本申请实施例公开的一种具体的时空轨迹伴随分析方法的流程图;
图4为本申请实施例公开的数据编码模块的处理流程图;
图5为本申请实施例公开的数据去重模块的处理流程图;
图6为本申请实施例公开的一种电子设备的结构图;
图7为本申请实施例公开的另一种电子设备的结构图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例公开了一种时空轨迹伴随分析方法,降低了计算复杂度、耗时及人力成本。
参见图1所示,本申请实施例公开的一种时空轨迹伴随分析方法包括:
S101:获取采集对象的原始数据,对所述原始数据中的空间数据进行plus code编码生成字符串,将所述字符串添加至所述原始数据中,生成预处理数据;
本申请实施例,首先获取采集对象的原始数据,进而对原始数据中的空间数据进行plus code编码生成字符串。plus code编码,旨在将表示地理位置的经纬度数据通过算法编码为一个指定长度(精度)的字符串。生成字符串后,将其添加至原始数据中,生成预处理数据。上述plus code编码的编码精度可在具体实施时进行设定,本实施例可具体将其设置为8。
S102:将所述预处理数据写入时序库Druid中进行存储,写入过程中所述时序库Druid根据时间粒度对所述预处理数据进行预聚合操作,实现初始去重;
本步骤中,可将预处理数据写入时序库Druid中进行存储。在数据写入时,可根据时间粒度对上述生成的预处理数据进行预聚合操作,实现初始去重。Druid是一个集时间序列数据库、数据仓库和全文检索系统特点于一体的分析性数据平台,主要特性为列式存储、基于时间的优化分区、支持实时多维分析。时间粒度是时序库Druid中存储数据的一个存储设置项,表示一个时间段。例如时间粒度为1小时,则这1小时内的n条数据在存储过程中做预聚合,即去重处理,并且这n条数据的时间维度值会变成这1小时的起始时间。如果这n条数据除时间维度外,其他维度值都相同,那么最终仅存储1条数据,该条数据的时间维度值是该时间粒度内的起始时间。在实际应用中,由于原始数据的采集密度较大,一般需要指定时间粒度做预聚合去重处理,避免数据冗余,降低存储空间占用。
具体地,时序库Druid根据时间粒度对所述预处理数据进行预聚合操作,实现初始去重时时,可利用时序库Druid根据时间维度,对所述预处理数据进行预聚合操作,将经过预聚合操作的处理后数据按照顺序分块存储的方式写入时序库Druid中进行存储;并可利用时序库Druid根据处理后数据的维度信息,创建处理后数据对应的位图索引。
S103:接收针对目标对象的轨迹查询请求,根据所述轨迹查询请求在所述时序库Druid中进行数据查找并进行二次去重处理,生成所述目标对象的第一时空轨迹,以及所述目标对象对应的伴随对象的第二时空轨迹;
在具体实施中,可接收用户针对目标对象的轨迹查询请求,该查询请求可包括目标对象的名称、标识等,例如可具体为手机号、身份证号等。根据该轨迹查询请求中的参数,在时序库Druid中查找相应的轨迹数据,根据时间顺序生成目标对象的第一时空轨迹,并生成目标对象对应的伴随对象的第二时空轨迹。
具体地,上述根据所述轨迹查询请求在所述时序库Druid中进行数据查找并进行二次的精确去重处理,生成所述目标对象的第一时空轨迹的过程可以包括:根据轨迹查询请求,通过位图索引进行位运算,筛选目标对象在指定时间段内的第一轨迹数据;基于时间粒度对第一轨迹数据进行去重处理,得到去重后数据;按照时间顺序对去重后数据进行汇总,生成目标对象对应的第一时空轨迹。基于时间粒度对第一轨迹数据进行去重处理时,可统计每个时间粒度内置信度最高的轨迹点确定为当前时间粒度的轨迹点数据;所述置信度包括每个plus code编码的字符串出现的频次。也即,可保留每个时间粒度内频次最高的轨迹点数据实现数据去重处理。
需要指出的是,上述第二时空轨迹的生成过程可包括:根据所述第一时空轨迹,在所述时序库Druid中查询与所有伴随对象对应的第二轨迹数据;根据所述伴随对象的标识信息,对所述第二轨迹数据进行分组,并根据时间粒度对所述第二轨迹数据进行去重处理,生成每个所述伴随对象对应的第二时空轨迹。具体地,可首先根据目标对象的轨迹数据,在时序库Druid中查询与目标对象轨迹数据相同的疑似伴随对象,即轨迹点相同的对象,进而从时序库Druid中获取伴随对象的轨迹数据,生成第二时空轨迹,可以理解的是,去重处理过程可参考上述针对第一轨迹数据公开的去重过程。
S104:确定所述第二时空轨迹与所述第一时空轨迹的伴随次数,基于所述伴随次数确定每个所述第二时空轨迹与所述第一时空轨迹的伴随程度。
本步骤中,可首先确定第二时空轨迹与第一时空轨迹的伴随次数,基于该伴随次数计算每个第二时空轨迹与第一时空轨迹的伴随程度。具体地,可分别统计每个第二时空轨迹与第一时空轨迹的伴随总次数和最大连续伴随次数;确定伴随总次数和最大连续伴随次数对应的权重,通过加权方式计算每个第二时空轨迹与第一时空轨迹的伴随程度。
可以理解的是,在基于伴随次数确定每个第二时空轨迹与第一时空轨迹的伴随程度之后,可通过预设显示方式展示第一时空轨迹,并按照伴随程度大小的降序排列输出伴随轨迹列表。其中,预设显示方式可包括:在可视化界面的预设显示位置显示第一时空轨迹,具体可显示目标对象的基本信息,以及第一时空轨迹的具体数据和示意图。
通过以上方案可知,本申请提供的一种时空轨迹伴随分析方法,包括:获取采集对象的原始数据,对所述原始数据中的空间数据进行plus code编码生成字符串,将所述字符串添加至所述原始数据中,生成预处理数据;将所述预处理数据写入时序库Druid中进行存储,写入过程中所述时序库Druid根据时间粒度对所述预处理数据进行预聚合操作,实现初始去重;接收针对目标对象的轨迹查询请求,根据所述轨迹查询请求在所述时序库Druid中进行数据查找并进行二次去重处理,生成所述目标对象的第一时空轨迹,以及所述目标对象对应的伴随对象的第二时空轨迹;确定所述第二时空轨迹与所述第一时空轨迹的伴随次数,基于所述伴随次数确定每个所述第二时空轨迹与所述第一时空轨迹的伴随程度。由上可知,本申请可在生成预处理数据之后,利用时序库Druid通过预聚合操作实现数据的粗略去重,避免数据冗余,降低存储空间占用,提升后续二次精确去重过程的计算速度,并基于时序库Druid自动将数据按照时间进行排序,无需手动排序工作,在伴随分析时可基于第二时空轨迹与第一时空轨迹的伴随次数计算伴随程度,避免构建复杂的非线性数据模型进行拟合处理,降低了计算复杂度、耗时及人力成本。
下面对本申请实施例提供的一种时空轨迹伴随分析系统进行介绍,下文描述的一种时空轨迹伴随分析系统与上文描述的一种时空轨迹伴随分析方法可以相互参照。
参见图2所示,本申请实施例提供的一种时空轨迹伴随分析系统包括:
数据编码模块201,用于获取采集对象的原始数据,对所述原始数据中的空间数据进行plus code编码生成字符串,将所述字符串添加至所述原始数据中,生成预处理数据;
数据存储模块202,用于将所述预处理数据写入时序库Druid中进行存储,写入过程中所述时序库Druid根据时间粒度对所述预处理数据进行预聚合操作,实现初始去重;
轨迹生成模块203,用于接收针对目标对象的轨迹查询请求,根据所述轨迹查询请求在所述时序库Druid中进行数据查找并进行二次去重处理,生成所述目标对象的第一时空轨迹,以及所述目标对象对应的伴随对象的第二时空轨迹;
伴随分析模块204,用于确定所述第二时空轨迹与所述第一时空轨迹的伴随次数,基于所述伴随次数确定每个所述第二时空轨迹与所述第一时空轨迹的伴随程度。
关于上述模块201至204的具体实施过程可参考前述实施例公开的相应内容,在此不再进行赘述。
下面对本申请实施例提供的上述时空轨迹伴随分析系统进行介绍。图3为该系统对应的时空轨迹伴随分析方法的流程图。具体地,如图4所示,数据编码模块获取采集对象的原始数据,可设定编码精度为8,将原始数据中的经纬度数据进行plus code编码,生成长度为8的字符串,并作为新的维度添加到原始数据中,生成预处理数据。数据存储模块采用时序数据库Druid最为后端存储。在摄入上述生成的预处理数据时,根据时间粒度,对数据进行预聚合操作,实现数据粗略去重,避免数据冗余,降低存储空间占用,提升后续二次精确去重过程的计算速度。轨迹生成模块根据查询信息,例如用户标签或维度信息,输出相关目标的所有数据,并通过数据去重模块,对中间查询数据精确去重,生成相关对象的轨迹数据。伴随分析模块根据生成的轨迹数据,计算指定时间段内的目标伴随总次数和最大连续伴随次数,计算其伴随程度;并按照降序排列,输出伴随目标列表。
参见图5所示,可采用数据去重模块,在每个时间粒度内仅保留一条频次最高的轨迹点数据,实现数据去重。
上述伴随分析模块可分别统计每组轨迹记录的伴随总次数和最大连续伴随次数,计算轨迹的伴随程度。伴随程度越高,表示在相同时间段内,该伴随对象与查询对象的伴随程度越高。伴随程度计算过程如下:设伴随总次数和最大连续伴随次数的权重都为0.5,则伴随程度=伴随总次数/N*0.5+最大连续伴随次数/N*0.5,其中,N为查询对象的轨迹记录数。例如,若查询对象A的轨迹记录为{(t1,p1),(t2,p2),(t3,p3),(t4,p4),(t5,p5),(t6,p6),(t7,p7)},伴随对象B1的轨迹记录为:{(t1,p1),(t3,p3),(t4,p4),(t5,p5),(t6,p6)},伴随对象B2的轨迹记录为:{(t1,p1),(t2,p2),(t3,p3),(t4,p4),(t5,p5),(t6,p6)},N为对象A的轨迹记录数,即N=7,则伴随对象B1相对查询对象A的伴随总次数为5,最大连续伴随次数为4,其对应的伴随程度=5/7*0.5+4/7*0.5=0.643;伴随对象B2相对查询对象A的伴随总次数为6,最大连续伴随次数为6,其伴随程度=6/7*0.5+6/7*0.5=0.857。进而即可根据计算得到的伴随程度,将上述轨迹记录按照伴随程度降序排列输出。
本申请还提供了一种电子设备,参见图6所示,本申请实施例提供的一种电子设备包括:
存储器100,用于存储计算机程序;
处理器200,用于执行所述计算机程序时可以实现上述实施例所提供的步骤。
具体的,存储器100包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机可读指令,该内存储器为非易失性存储介质中的操作系统和计算机可读指令的运行提供环境。处理器200在一些实施例中可以是一中央处理器(CentralProcessing Unit,CPU)、控制器、微控制器、微处理器或其他数据处理芯片,为电子设备提供计算和控制能力,执行所述存储器100中保存的计算机程序时,可以实现前述任一实施例公开的时空轨迹伴随分析方法。
在上述实施例的基础上,作为优选实施方式,参见图7所示,所述电子设备还包括:
输入接口300,与处理器200相连,用于获取外部导入的计算机程序、参数和指令,经处理器200控制保存至存储器100中。该输入接口300可以与输入装置相连,接收用户手动输入的参数或指令。该输入装置可以是显示屏上覆盖的触摸层,也可以是终端外壳上设置的按键、轨迹球或触控板,也可以是键盘、触控板或鼠标等。
显示单元400,与处理器200相连,用于显示处理器200处理的数据以及用于显示可视化的用户界面。该显示单元400可以为LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。
网络端口500,与处理器200相连,用于与外部各终端设备进行通信连接。该通信连接所采用的通信技术可以为有线通信技术或无线通信技术,如移动高清链接技术(MHL)、通用串行总线(USB)、高清多媒体接口(HDMI)、无线保真技术(WiFi)、蓝牙通信技术、低功耗蓝牙通信技术、基于IEEE802.11s的通信技术等。
图7仅示出了具有组件100-500的电子设备,本领域技术人员可以理解的是,图7示出的结构并不构成对电子设备的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
本申请还提供了一种计算机可读存储介质,该存储介质可以包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。该存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现前述任一实施例公开的时空轨迹伴随分析方法。
本申请可在生成预处理数据之后,利用时序库Druid通过预聚合操作实现数据的粗略去重,避免数据冗余,降低存储空间占用,提升后续二次精确去重过程的计算速度,并基于时序库Druid自动将数据按照时间进行排序,无需手动排序工作,在伴随分析时可基于第二时空轨迹与第一时空轨迹的伴随次数计算伴随程度,避免构建复杂的非线性数据模型进行拟合处理,降低了计算复杂度、耗时及人力成本。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
Claims (9)
1.一种时空轨迹伴随分析方法,其特征在于,包括:
获取采集对象的原始数据,对所述原始数据中的空间数据进行plus code编码生成字符串,将所述字符串添加至所述原始数据中,生成预处理数据;
将所述预处理数据写入时序库Druid中进行存储,写入过程中所述时序库Druid根据时间粒度对所述预处理数据进行预聚合操作,实现初始去重;
接收针对目标对象的轨迹查询请求,根据所述轨迹查询请求在所述时序库Druid中进行数据查找并进行二次去重处理,生成所述目标对象的第一时空轨迹,以及所述目标对象对应的伴随对象的第二时空轨迹;
确定所述第二时空轨迹与所述第一时空轨迹的伴随次数,基于所述伴随次数确定每个所述第二时空轨迹与所述第一时空轨迹的伴随程度;
其中,分别统计每个所述第二时空轨迹与所述第一时空轨迹的伴随总次数和最大连续伴随次数;
确定所述伴随总次数和所述最大连续伴随次数对应的权重,通过加权方式计算每个所述第二时空轨迹与所述第一时空轨迹的伴随程度。
2.根据权利要求1所述的时空轨迹伴随分析方法,其特征在于,所述写入过程中所述时序库Druid根据时间粒度对所述预处理数据进行预聚合操作,实现初始去重,包括:
利用所述时序库Druid根据时间维度,对所述预处理数据进行预聚合操作,将经过所述预聚合操作的处理后数据按照顺序分块存储的方式写入所述时序库Druid中进行存储;
利用所述时序库Druid根据所述处理后数据的维度信息,创建所述处理后数据对应的位图索引。
3.根据权利要求2所述的时空轨迹伴随分析方法,其特征在于,所述根据所述轨迹查询请求在所述时序库Druid中进行数据查找,生成所述目标对象的第一时空轨迹,包括:
根据所述轨迹查询请求,通过所述位图索引进行位运算,筛选所述目标对象在指定时间段内的第一轨迹数据;
基于时间粒度对所述第一轨迹数据进行去重处理,得到去重后数据;
按照时间顺序对所述去重后数据进行汇总,生成所述目标对象对应的第一时空轨迹。
4.根据权利要求3所述的时空轨迹伴随分析方法,其特征在于,所述基于时间粒度对所述第一轨迹数据进行去重处理,得到去重后数据,包括:
统计每个时间粒度内置信度最高的轨迹点确定为当前时间粒度的轨迹点数据;所述置信度包括每个plus code编码的字符串出现的频次。
5.根据权利要求1所述的时空轨迹伴随分析方法,其特征在于,所述第二时空轨迹的生成过程,包括:
根据所述第一时空轨迹,在所述时序库Druid中查询与所有伴随对象对应的第二轨迹数据;
根据所述伴随对象的标识信息,对所述第二轨迹数据进行分组,并根据时间粒度对所述第二轨迹数据进行去重处理,生成每个所述伴随对象对应的第二时空轨迹。
6.根据权利要求1所述的时空轨迹伴随分析方法,其特征在于,所述基于所述伴随次数确定每个所述第二时空轨迹与所述第一时空轨迹的伴随程度之后,还包括:
通过预设显示方式展示所述第一时空轨迹,并按照所述伴随程度大小的降序排列输出伴随轨迹列表。
7.一种时空轨迹伴随分析系统,其特征在于,包括:
数据编码模块,用于获取采集对象的原始数据,对所述原始数据中的空间数据进行plus code编码生成字符串,将所述字符串添加至所述原始数据中,生成预处理数据;
数据存储模块,用于将所述预处理数据写入时序库Druid中进行存储,写入过程中所述时序库Druid根据时间粒度对所述预处理数据进行预聚合操作,实现初始去重;
轨迹生成模块,用于接收针对目标对象的轨迹查询请求,根据所述轨迹查询请求在所述时序库Druid中进行数据查找并进行二次去重处理,生成所述目标对象的第一时空轨迹,以及所述目标对象对应的伴随对象的第二时空轨迹;
伴随分析模块,用于确定所述第二时空轨迹与所述第一时空轨迹的伴随次数,基于所述伴随次数确定每个所述第二时空轨迹与所述第一时空轨迹的伴随程度;
其中,所述系统 还用于分别统计每个所述第二时空轨迹与所述第一时空轨迹的伴随总次数和最大连续伴随次数;确定所述伴随总次数和所述最大连续伴随次数对应的权重,通过加权方式计算每个所述第二时空轨迹与所述第一时空轨迹的伴随程度。
8.一种电子设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至6任一项所述时空轨迹伴随分析方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述时空轨迹伴随分析方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010821130.7A CN112000736B (zh) | 2020-08-14 | 2020-08-14 | 时空轨迹伴随分析方法、系统及电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010821130.7A CN112000736B (zh) | 2020-08-14 | 2020-08-14 | 时空轨迹伴随分析方法、系统及电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112000736A CN112000736A (zh) | 2020-11-27 |
CN112000736B true CN112000736B (zh) | 2023-03-24 |
Family
ID=73473220
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010821130.7A Active CN112000736B (zh) | 2020-08-14 | 2020-08-14 | 时空轨迹伴随分析方法、系统及电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112000736B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112561948B (zh) * | 2020-12-22 | 2023-11-21 | 中国联合网络通信集团有限公司 | 基于时空轨迹的伴随轨迹识别方法、设备及存储介质 |
CN113449158A (zh) * | 2021-06-22 | 2021-09-28 | 中国电子进出口有限公司 | 一种多源数据间的伴随分析方法和系统 |
CN113706578B (zh) * | 2021-08-03 | 2024-07-23 | 杭州数梦工场科技有限公司 | 一种基于轨迹的移动对象伴随关系的确定方法和装置 |
CN113704378A (zh) * | 2021-09-02 | 2021-11-26 | 北京锐安科技有限公司 | 一种伴随信息的确定方法、装置、设备及存储介质 |
CN114064792A (zh) * | 2021-11-18 | 2022-02-18 | 厦门市美亚柏科信息股份有限公司 | 一种时空伴随对象挖掘方法、终端设备及存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107590250A (zh) * | 2017-09-18 | 2018-01-16 | 广州汇智通信技术有限公司 | 一种时空轨迹生成方法及装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7143398B2 (en) * | 2003-03-13 | 2006-11-28 | Che-An Chang | Application infa operating system |
CN107229940A (zh) * | 2016-03-25 | 2017-10-03 | 阿里巴巴集团控股有限公司 | 数据伴随分析方法及装置 |
WO2018175603A1 (en) * | 2017-03-21 | 2018-09-27 | Sri International | Robust biometric access control using physiological-informed multi-signal correlation |
CN110909263B (zh) * | 2019-11-29 | 2022-10-25 | 北京明略软件系统有限公司 | 一种身份特征的伴随关系确定方法及装置 |
-
2020
- 2020-08-14 CN CN202010821130.7A patent/CN112000736B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107590250A (zh) * | 2017-09-18 | 2018-01-16 | 广州汇智通信技术有限公司 | 一种时空轨迹生成方法及装置 |
Non-Patent Citations (2)
Title |
---|
Multiple symbol differential detection based on sphere decoding for unitary space-time modulation;Ying L I;《Science in China(Series F:Information Sciences)》;20091231;全文 * |
伴随模式在反恐情报同步轨迹数据分析中的应用研究;李勇男;《现代情报》;20181205(第12期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112000736A (zh) | 2020-11-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112000736B (zh) | 时空轨迹伴随分析方法、系统及电子设备和存储介质 | |
CN110968654B (zh) | 文本数据的地址类目确定方法、设备以及系统 | |
CN111488426A (zh) | 一种查询意图确定方法、装置及处理设备 | |
US20110282861A1 (en) | Extracting higher-order knowledge from structured data | |
CN108319585B (zh) | 数据处理方法及装置、电子设备、计算机可读介质 | |
CN104102719A (zh) | 一种轨迹信息的推送方法及装置 | |
CN105159930A (zh) | 搜索关键词的推送方法和装置 | |
CN105209858B (zh) | 企业场所数据的非确定性消岐和匹配 | |
CN104423621A (zh) | 拼音字符串处理方法和装置 | |
CN111177568B (zh) | 基于多源数据的对象推送方法、电子装置及存储介质 | |
CN104994424A (zh) | 一种构建音视频标准数据集的方法和装置 | |
CN114579882A (zh) | 地址查询方法、获取地理编码预测模型的方法及对应装置 | |
CN116206453A (zh) | 一种基于迁移学习的交通流预测方法、装置及相关设备 | |
CN104969221A (zh) | 格式化数据库中的半结构化数据 | |
CN114049172A (zh) | 物品推荐排序方法、装置、计算机设备及存储介质 | |
CN117312688B (zh) | 基于时空资产目录的跨源数据检索方法、介质及设备 | |
CN118069532A (zh) | 测试用例确定方法、装置、计算机设备和存储介质 | |
CN114090769A (zh) | 实体挖掘方法、装置、计算机设备和存储介质 | |
CN110851708B (zh) | 负样本的抽取方法、装置、计算机设备和存储介质 | |
CN110245275B (zh) | 一种大规模相似新闻标题快速归一化方法 | |
CN117033534A (zh) | 地理信息处理方法、装置、计算机设备和存储介质 | |
CN114513550B (zh) | 一种地理位置信息的处理方法、装置及电子设备 | |
CN115080824A (zh) | 目标词的挖掘方法、装置、电子设备及存储介质 | |
CN117421386B (zh) | 基于gis的空间数据处理方法及系统 | |
CN111538914A (zh) | 地址信息的处理方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |