CN116662315A - 基于大数据的时空轨迹补全的方法、装置、设备及介质 - Google Patents
基于大数据的时空轨迹补全的方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN116662315A CN116662315A CN202310598235.4A CN202310598235A CN116662315A CN 116662315 A CN116662315 A CN 116662315A CN 202310598235 A CN202310598235 A CN 202310598235A CN 116662315 A CN116662315 A CN 116662315A
- Authority
- CN
- China
- Prior art keywords
- track
- trajectory
- data
- approximate
- blank
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 78
- 230000000295 complement effect Effects 0.000 claims abstract description 45
- 238000004364 calculation method Methods 0.000 claims abstract description 23
- 238000004590 computer program Methods 0.000 claims description 13
- 238000005516 engineering process Methods 0.000 claims description 11
- 238000012216 screening Methods 0.000 claims description 5
- 238000012163 sequencing technique Methods 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000013079 data visualisation Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2477—Temporal data queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/27—Regression, e.g. linear or logistic regression
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Software Systems (AREA)
- Remote Sensing (AREA)
- Probability & Statistics with Applications (AREA)
- Mathematical Physics (AREA)
- Fuzzy Systems (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
本申请涉及时空轨迹计算领域,特别是涉及到一种基于大数据的时空轨迹补全的方法、装置、设备及介质,其中方法包括:获取指定目标的轨迹数据,其中所述轨迹数据包括位置信息和时间信息;基于所述位置信息生成待补全轨迹坐标图;若所述待补全轨迹坐标图中的待补全轨迹存在空白轨迹,则基于所述空白轨迹的断连点求取所述待补全轨迹与历史轨迹中的近似轨迹的相似度;根据相似度在指定阈值内的所述近似轨迹,对所述空白轨迹进行补全;基于补全轨迹进行匹配度计算,并保留匹配度最高的所述补全轨迹。本申请涉及的方法能够在位置信息丢失情况下,绘制出合理的完整轨迹,并且计算方法复杂度低,计算性能高。
Description
技术领域
本申请涉及时空轨迹计算领域,特别是涉及到一种基于大数据的时空轨迹补全的方法、装置、设备及介质。
背景技术
在时空轨迹计算领域,当一个目标进行移动时,其位置和时间会发生改变,根据此时空信息,可以绘制出目标的活动轨迹,例如行人走路的轨迹,骑车的轨迹,开车的轨迹,飞行器的飞行轨迹,动物活动轨迹等,但由于设备或信号的不确定性,其位置信息在某些时间段会存在丢失的可能性,这样会造成存在多个分段轨迹或空白轨迹的情况,使得绘制合理的完整轨迹存在一定的困难。
因此针对时空轨迹计算领域中,若位置信息在某些时间段丢失情况下,如何提供一种计算方法复杂度低,计算性能高的绘制方法,绘制出合理的完整轨迹是一个亟待解决的问题。
发明内容
本申请的主要目的为提供一种基于大数据的时空轨迹补全的方法、装置、设备及介质,旨在解决现有技术基于时空轨迹计算领域中,若位置信息在某些时间段丢失情况下,如何提供一种计算方法复杂度低,计算性能高的绘制方法,绘制出合理的完整轨迹的技术问题。
为了实现上述发明目的,本申请提出一种基于大数据技术的时空轨迹补全的方法,所述方法包括:
获取指定目标的轨迹数据,其中所述轨迹数据包括位置信息和时间信息;
基于所述位置信息生成待补全轨迹坐标图;
若所述待补全轨迹坐标图中的待补全轨迹存在空白轨迹,则基于所述空白轨迹的断连点求取所述待补全轨迹与历史轨迹中的近似轨迹的相似度;
根据相似度在指定阈值内的所述近似轨迹,对所述空白轨迹进行补全;
基于补全轨迹进行匹配度计算,并保留匹配度最高的所述补全轨迹。
进一步地,获取所述位置信息中的经度数据和纬度数据;
将所述经度数据和纬度数据对应转化为X坐标数据和y坐标数据;
对所述X坐标数据和所述y坐标数据对应的点按照时间顺序进行连接,生成待补全轨迹坐标图。
进一步地,获取所述待补全轨迹的时间戳信息;
若相邻时间戳间隔时间大于指定阈值,则判定为存在空白轨迹。
进一步地,判断所述历史轨迹中是否存在经过所述断连点指定范围内的轨迹;
若有,判定为近似轨迹。
进一步地,设待补全轨迹为A,近似轨迹为B,利用最小二乘法求取所述轨迹与所述近似轨迹分别在断连点处的近似直线,其中坐标的取值按照预设范围选取;
利用公式求取相似度S;其中其中kAb代表轨迹A在断连点b点的方向向量,kBb代表近似轨迹B在断连点b点的方向向量,kAc代表轨迹A在断连点c点的方向向量,kBc代表近似轨迹B在断连点c点的方向向量;方向向量的求取可用最小二乘法求取的近似直线的斜率表示。
进一步地,将所述补全轨迹按照分为ab、bc、cd三条线段,其中bc为相邻两个断连点组成的线段;
根据公式求出所述bc线与所述ab以及所述cd线的不匹配度M;其中:/>是使用的所述补全轨迹计算出来的平均速度,是所述待补全轨迹中去除所述空白轨迹计算出来的平均速度。
进一步地,获取M的计算值,并对其进行排序;
根据排序结果保留对应M值最小的补全轨迹。
本申请的第二方面提出一种基于大数据技术的时空轨迹补全的装置,所述装置包括:
轨迹数据获取模块,用于获取指定目标的轨迹数据,其中所述轨迹数据包括位置信息和时间信息;
坐标生成模块,用于基于所述位置信息生成待补全轨迹坐标图;
相似度计算模块,用于若所述待补全轨迹坐标图中的待补全轨迹存在空白轨迹,则基于所述空白轨迹的断连点求取所述待补全轨迹与历史轨迹中的近似轨迹的相似度;
轨迹补全模块,用于根据相似度在指定阈值内的所述近似轨迹,对所述空白轨迹进行补全;
最终筛选模块,用于基于补全轨迹进行匹配度计算,并保留匹配度最高的所述补全轨迹。
本申请的第三方面提出一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
本申请的第四方面提出一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述方法的步骤。
本申请提供的一种基于大数据技术的时空轨迹补全的方法,本申请利用大数据技术,提出了一种新的时空轨迹补全算法,在大量历史轨迹数据中,使用最小二乘法利用直线去拟合曲线,用直线的夹角余弦相似度计算轨迹相似度,初步预选出待匹配的轨迹路线,然后充分利用时空信息,计算补全轨迹与原轨迹的匹配度,选择匹配度最高的轨迹作为完整的目标活动轨迹路线;
本申请中计算轨迹相似度的方法复杂度较低,计算性能高效,而且综合考虑到空白轨迹的出入射方向信息,在轨迹匹配中有较高的准确率。
附图说明
图1为本申请一实施例的基于大数据技术的时空轨迹补全的方法的流程示意图;
图2为本申请一实施例的基于大数据技术的时空轨迹补全的装置的结构示意框图;
图3为本申请一实施例的计算机设备的结构示意框图;
图4为本申请一实施例中的待补全轨迹坐标示意图;
图5为本申请一实施例中的待补全轨迹与近似轨迹的坐标示意图;
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“上述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在特征、整数、步骤、操作、元件、模块和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、模块、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一模块和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
参照图1,本发明实施例提供一种基于大数据技术的时空轨迹补全的方法,包括步骤S1-S5,具体地:
S1、获取指定目标的轨迹数据,其中所述轨迹数据包括位置信息和时间信息。
首先,基于数据库中的指定目标,获取该目标的轨迹数据,其中所述指定目标可以是单个也可以是多个,包含多种类型的关键词,其中所述轨迹数据包括位置信息和时间信息,其中所述位置信息包括经纬度信息,所述经纬度信息,所述时间信息表示目标当时所处经纬度的时间节点,其中时间可以以时间戳的形式存储在数据库中被获取和调用。
S2、基于所述位置信息生成待补全轨迹坐标图。
根据所获取的轨迹数据中的位置信息,将位置信息转化为坐标点,具体的坐标转化方法实现可以参考地图相关的转化技术,将转化后的坐标点按照时间顺序连接起来,形成连续的轨迹路径,可以生成待补全轨迹坐标图,如果该轨迹数据在某个时间段缺失了某些位置信息,则会导致轨迹不连续,需要进行后续的补全处理。
S3、若所述待补全轨迹坐标图中的待补全轨迹存在空白轨迹,则基于所述空白轨迹的断连点求取所述待补全轨迹与历史轨迹中的近似轨迹的相似度。
如果生成的待补全轨迹中存在空白轨迹,即轨迹不连续部分,可以通过历史轨迹中的近似轨迹进行补全,具体地,可以根据空白轨迹的断连点,找到贴合或者距离其较近的历史轨迹中的点,并计算两者之间相似度。
S4、根据相似度在指定阈值内的所述近似轨迹,对所述空白轨迹进行补全。
如果在一定的阈值范围内存在若干与空白轨迹较为相似的历史轨迹,则可以利用这些历史轨迹信息,针对空白轨迹处缺失的轨迹进行轨迹补全,从而使得待补全轨迹变得完整连续。
S5、基于补全轨迹进行匹配度计算,并保留匹配度最高的所述补全轨迹。
由于一定的阈值范围内存在若干个相似轨道,所以针对已经进行补全的补全轨迹需要进行匹配度的计算,根据计算出的匹配度筛选出匹配值最高的补全轨迹。
如上所述,本实施例利用大数据技术,提出了一种新的时空轨迹补全算法,在大量历史轨迹数据中,使用最小二乘法利用直线去拟合曲线,用直线的夹角余弦相似度计算轨迹相似度,初步预选出待匹配的轨迹路线,然后充分利用时空信息,计算补全轨迹与原轨迹的匹配度,选择匹配度最高的轨迹作为完整的目标活动轨迹路线;本申请中计算轨迹相似度的方法复杂度较低,计算性能高效,而且综合考虑到空白轨迹的出入射方向信息,在轨迹匹配中有较高的准确率。
在一个实施例中,上述基于所述位置信息生成待补全轨迹坐标图的步骤,包括:
S101、获取所述位置信息中的经度数据和纬度数据;
S102、将所述经度数据和纬度数据对应转化为X坐标数据和y坐标数据;
S103、对所述X坐标数据和所述y坐标数据对应的点按照时间顺序进行连接,生成待补全轨迹坐标图。
本实施例中,将位置信息中所携带的经纬度对应转化为坐标数据,并生成待补全轨迹图的方法;具体地,以一辆车的行驶轨迹为例,可以获取车辆在某一时刻的经纬度信息,然后按照该方法处理成点坐标数据,按照时间顺序连接这些点就可以得到车辆的行驶轨迹,将位置信息转化为坐标数据,可以便于对其进行分析处理,例如进行数据可视化、生成轨迹图等操作,更容易掌握轨迹的行驶情况,洞察数据的内在规律,这对于后续的轨迹分析处理非常重要,有助于基于图像信息进行进一步的分析和比较。
在一个实施例中,上述基于所述位置信息生成待补全轨迹坐标图的步骤之后,包括:
S201、获取所述待补全轨迹的时间戳信息;
S202、若相邻时间戳间隔时间大于指定阈值,则判定为存在空白轨迹。
在本实施例中,需要获取待补全轨迹的时间戳信息,并提前设置一个时间阈值,其中时间戳是指对待补全轨迹进行采样时所记录下的时间点,通常用于表示轨迹点之间的时间间隔,若两个相邻的时间戳之间的时间间隔大于指定的时间阈值,则可以判定这两个时间戳之间存在空白轨迹;例如,如果根据车辆的GPS信息获得了一系列地理位置数据和时间戳信息,我们可以按时间顺序对数据进行排列,在相邻时间戳的时间间隔大于设定的阈值时,就可以将这两个时间戳之间的轨迹部分判定为空白轨迹;
如图4所示,其中,bc段虚线就是待补全轨迹由于丢失数据而产生的空白轨迹;
通过设置时间阈值来判断空白轨迹,可以快速地发现可能被遗漏或丢失的轨迹数据,避免数据缺失造成的误差和影响,提高数据分析结果的准确性,并且在过程中能够减少人工干预的需求,同时也提高了数据处理效率和准确性;
在一个实施例中,上述基于所述空白轨迹的断连点求取所述待补全轨迹与历史轨迹中的近似轨迹的相似度的步骤之前,包括:
S301、判断所述历史轨迹中是否存在经过所述断连点指定范围内的轨迹;
S302、若有,判定为近似轨迹。
在本实施例中,需要基于历史轨迹的数据,其中包括每个轨迹点的经纬度信息和时间戳信息,以及当前待补全轨迹的断连点的位置信息;首可选的将断连点所在区域划分为一个圆形区域,并设定半径阈值,该半径阈值可以与所述断连点相同,然后,对于历史轨迹中的每个轨迹点,判断其是否落在圆形区域内,如果存在轨迹点落在圆形区域内,且落点与断连点距离小于设定的半径阈值,则可以判定为近似轨迹;例如,如果某辆车在某时段内行驶过程中遇到了信号盲区,导致轨迹数据中出现了断连点,我们可以通过该方法来判断是否存在经过该断连点的轨迹点,并判断这些轨迹点是否构成了一条近似轨迹,通过该方法可以识别出近似轨迹,即遇到断连点后重新采集的轨迹点所构成的轨迹,从而更加全面地了解车辆行驶情况,为后续的数据分析和车辆运营管理提供有力支持,针对信号盲区等突发状况导致轨迹数据中存在断连点的情况,通过判断是否存在近似轨迹可以增强数据的鲁棒性,并减少数据异常对分析结果的影响。
在一个实施例中,上述基于所述空白轨迹的断连点求取所述待补全轨迹与历史轨迹中的近似轨迹的相似度的步骤,包括:
S401、设待补全轨迹为A,近似轨迹为B,利用最小二乘法求取所述轨迹与所述近似轨迹分别在断连点处的近似直线,其中坐标的取值按照预设范围选取;
S402、利用公式求取相似度S;其中其中kAb代表轨迹A在断连点b点的方向向量,kBb代表近似轨迹B在断连点b点的方向向量,kAc代表轨迹A在断连点c点的方向向量,kBc代表近似轨迹B在断连点c点的方向向量;方向向量的求取可用最小二乘法求取的近似直线的斜率表示。
本实施例中利用最小二乘法计算得到的直线方程去拟合轨迹曲线,然后用夹角的余弦去近似轨迹相似度;最小二乘法是一种常用的回归分析方法,用于寻找一个线性模型来描述自变量和因变量之间的关系;其基本思想是,通过寻找一条直线,使得该直线和数据点的距离平方和最小;
(假设有n个数据点,自变量为x,因变量为y),最小二乘法的步骤如下:
建立线性回归模型;假设y与x之间存在线性关系,可建立如下的线性回归模型:
y=β0+β1*x
其中,β0和β1分别表示截距和斜率。
定义误差函数;假设第i个数据点的坐标为(xi,yi),预测值为y^i,则第i个数据点的误差为:
ei=yi-y^i
平方误差为:
ei^2=(yi-y^i)^2
所有数据点的平方误差之和为:
S=∑(ei^2)
求解最小化误差函数的参数;通过求解β0和β1,使得误差函数S最小化。可以通过求偏导数的方式,得到β0和β1的最小二乘估计值:
β1=(∑(xi-xˉ)(yi-yˉ))/(∑(xi-xˉ)^2)
β0=y--β1*x
其中,xˉ和yˉ分别为x和y的平均值,这样y=β0+β1*x的直线方程就可以求出。
如图5所示,假设有2条轨迹,粗线A为待补全轨迹,B为历史轨迹中经过b、c两点的一条近似轨迹,可进行如下步骤求解2条轨迹的相似度;
根据上述最小二乘法的求解公式,可以求得:
轨迹A在b点的近似直线为:yAb=KAbx+BAb
轨迹A在c点的近似直线为:yAc=KAcx+BAc
轨迹B在b点的近似直线为:yBb=KBbx+BBb
轨迹B在c点的近似直线为:yBc=KBcx+BBc在计算过程中,可选取坐标附近的10-20个点位坐标进行代入计算;
A、B两条轨迹的相似度S可用如下公式求取:
其中:kAb=(KAb,1),kBb=(KBb,1)kBb=(KBb,1),kAc=(KAc,1),kBc=(KBc,1),·代表点乘;
综上,2条轨迹的相似度S即可求出,整体步骤简单,算法复杂度不高,即使面对大量轨迹,也可快速求解相似度。
在一个实施例中,上述基于补全轨迹进行匹配度计算的步骤,包括:
S501、将所述补全轨迹按照所述断连点分为ab、bc、cd三条线段,其中bc为相邻两个断连点组成的线段;
S502、根据公式求出所述bc线与所述ab以及所述cd线的不匹配度M;其中:/>是使用的所述补全轨迹计算出来的平均速度,/>是所述待补全轨迹中去除所述空白轨迹计算出来的平均速度。
在本实施例中,已经经过相似度阈值过滤后会过滤掉绝大多数轨迹,根据相似度在指定阈值内的所述近似轨迹,对所述空白轨迹进行补全,然后利用时间信息,对补全轨迹进行匹配度计算;根据分析,一个运动目标的运动轨迹应该是平滑的,空白轨迹的运动信息大概率也和已记录轨迹的运行信息保持一致。可以理解为,b、c间的平均速度应该和a、b与c、d间的速度差别不是很大,b、c间的线由于是空白的,其运动状态到底是加速、减速还是匀速不得而知,但由于ab、bc、cd都是目标A运动的轨迹,其运动信息也差不多一致,本专利用如下公式来衡量bc线与ab、cd线的不匹配度M:
其中:是使用的补全轨迹计算出来的平均速度,/>是待补全轨迹中去除空白轨迹计算出来的平均速度;
由此可以计算出当前补全轨迹的bc线段,与其他两段的不匹配度。
在一实施例中,上述保留匹配度最高的所述补全轨迹的步骤,包括:
S601、获取M的计算值,并对其进行排序;
S602、根据排序结果保留对应M值最小的补全轨迹。
在本实施例中,最小M值对应的补全轨迹即为匹配度最高的轨迹,本实施例筛选出拥有最高匹配度的所述补全轨迹进行保留。
参照图2,在一个实施例中,上述基于大数据技术的时空轨迹补全的装置,包括:
轨迹数据获取模块100,用于获取指定目标的轨迹数据,其中所述轨迹数据包括位置信息和时间信息;
坐标生成模块200,用于基于所述位置信息生成待补全轨迹坐标图;
相似度计算模块300,用于若所述待补全轨迹坐标图中的待补全轨迹存在空白轨迹,则基于所述空白轨迹的断连点求取所述待补全轨迹与历史轨迹中的近似轨迹的相似度;
轨迹补全模块400,用于根据相似度在指定阈值内的所述近似轨迹,对所述空白轨迹进行补全;
最终筛选模块500,用于基于补全轨迹进行匹配度计算,并保留匹配度最高的所述补全轨迹。
在一实施例中,上述坐标生成模块200,包括:
经纬度获取单元,用于获取所述位置信息中的经度数据和纬度数据;
数据转化单元,用于将所述经度数据和纬度数据对应转化为X坐标数据和y坐标数据;
顺序连接单元,用于对所述X坐标数据和所述y坐标数据对应的点按照时间顺序进行连接,生成待补全轨迹坐标图。
在一个实施例中,空白判定模块,包括:
时间戳获取单元,用于获取所述待补全轨迹的时间戳信息;
间隔存在单元,用于若相邻时间戳间隔时间大于指定阈值,则判定为存在空白轨迹。
在一实施例中,近似判定模块,包括:
经过判断单元,用于判断所述历史轨迹中是否存在经过所述断连点指定范围内的轨迹;
存在近似单元,用于若有,判定为近似轨迹。
在一实施例中,所述相似度计算模块300,包括:
最小二乘法单元,用于设待补全轨迹为A,近似轨迹为B,利用最小二乘法求取所述轨迹与所述近似轨迹分别在断连点处的近似直线,其中坐标的取值按照预设范围选取;
夹角余弦单元,用于利用公式求取相似度S;其中其中kAb代表轨迹A在断连点b点的方向向量,kBb代表近似轨迹B在断连点b点的方向向量,kAc代表轨迹A在断连点c点的方向向量,kBc代表近似轨迹B在断连点c点的方向向量;方向向量的求取可用最小二乘法求取的近似直线的斜率表示。
在一实施例中,上述最终筛选模块500,包括:
线段分割单元,用于将所述补全轨迹按照所述断连点分为ab、bc、cd三条线段,其中bc为相邻两个断连点组成的线段;
计算单元,用于根据公式求出所述bc线与所述ab以及所述cd线的不匹配度M;其中:/>是使用的所述补全轨迹计算出来的平均速度,/>是所述待补全轨迹中去除所述空白轨迹计算出来的平均速度。
在一实施例中,所述最终筛选模块500,包括:
M值获取单元,用于获取M的计算值,并对其进行排序;
保留最优单元,用于根据排序结果保留对应M值最小的补全轨迹。
参照图3,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储基于大数据技术的时空轨迹补全的方法过程中的使用数据等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。进一步地,上述计算机设备还可以设置有输入装置和显示屏等。上述计算机程序被处理器执行时以实现基于大数据技术的时空轨迹补全的方法,包括如下步骤:获取指定目标的轨迹数据,其中所述轨迹数据包括位置信息和时间信息;基于所述位置信息生成待补全轨迹坐标图;若所述待补全轨迹坐标图中的待补全轨迹存在空白轨迹,则基于所述空白轨迹的断连点求取所述待补全轨迹与历史轨迹中的近似轨迹的相似度;根据相似度在指定阈值内的所述近似轨迹,对所述空白轨迹进行补全;基于补全轨迹进行匹配度计算,并保留匹配度最高的所述补全轨迹。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种基于大数据技术的时空轨迹补全的方法,包括如下步骤:获取指定目标的轨迹数据,其中所述轨迹数据包括位置信息和时间信息;基于所述位置信息生成待补全轨迹坐标图;若所述待补全轨迹坐标图中的待补全轨迹存在空白轨迹,则基于所述空白轨迹的断连点求取所述待补全轨迹与历史轨迹中的近似轨迹的相似度;根据相似度在指定阈值内的所述近似轨迹,对所述空白轨迹进行补全;基于补全轨迹进行匹配度计算,并保留匹配度最高的所述补全轨迹。
可以理解的是,本实施例中的计算机可读存储介质可以是易失性可读存储介质,也可以为非易失性可读存储介质。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (10)
1.一种基于大数据技术的时空轨迹补全的方法,其特征在于,所述方法包括:
获取指定目标的轨迹数据,其中所述轨迹数据包括位置信息和时间信息;
基于所述位置信息生成待补全轨迹坐标图;
若所述待补全轨迹坐标图中的待补全轨迹存在空白轨迹,则基于所述空白轨迹的断连点求取所述待补全轨迹与历史轨迹中的近似轨迹的相似度;
根据相似度在指定阈值内的所述近似轨迹,对所述空白轨迹进行补全;
基于补全轨迹进行匹配度计算,并保留匹配度最高的所述补全轨迹。
2.根据权利要求1所述的基于大数据技术的时空轨迹补全的方法,其特征在于,所述基于所述位置信息生成待补全轨迹坐标图的步骤,包括:
获取所述位置信息中的经度数据和纬度数据;
将所述经度数据和纬度数据对应转化为X坐标数据和y坐标数据;
对所述X坐标数据和所述y坐标数据对应的点按照时间顺序进行连接,生成待补全轨迹坐标图。
3.根据权利要求1所述的基于大数据技术的时空轨迹补全的方法,其特征在于,基于所述位置信息生成待补全轨迹坐标图的步骤之后,包括:
获取所述待补全轨迹的时间戳信息;
若相邻时间戳间隔时间大于指定阈值,则判定为存在空白轨迹。
4.根据权利要求1所述的基于大数据技术的时空轨迹补全的方法,其特征在于,所述基于所述空白轨迹的断连点求取所述待补全轨迹与历史轨迹中的近似轨迹的相似度的步骤之前,包括:
判断所述历史轨迹中是否存在经过所述断连点指定范围内的轨迹;
若有,判定为近似轨迹。
5.根据权利要求1所述的基于大数据技术的时空轨迹补全的方法,其特征在于,所述基于所述空白轨迹的断连点求取所述待补全轨迹与历史轨迹中的近似轨迹的相似度的步骤,包括:
设待补全轨迹为A,近似轨迹为B,利用最小二乘法求取所述轨迹与所述近似轨迹分别在断连点处的近似直线,其中坐标的取值按照预设范围选取;
利用公式求取相似度S;其中其中kAb代表轨迹A在断连点b点的方向向量,kBb代表近似轨迹B在断连点b点的方向向量,kAc代表轨迹A在断连点c点的方向向量,kBc代表近似轨迹B在断连点c点的方向向量;方向向量的求取可用最小二乘法求取的近似直线的斜率表示。
6.根据权利要求1所述的基于大数据技术的时空轨迹补全的方法,其特征在于,所述基于补全轨迹进行匹配度计算的步骤,包括:
将所述补全轨迹按照分为ab、bc、cd三条线段,其中bc为相邻两个断连点组成的线段;
根据公式求出所述bc线与所述ab以及所述cd线的不匹配度M;其中:/>是使用的所述补全轨迹计算出来的平均速度,/>是所述待补全轨迹中去除所述空白轨迹计算出来的平均速度。
7.根据权利要求6所述的基于大数据技术的时空轨迹补全的方法,其特征在于,所述保留匹配度最高的所述补全轨迹的步骤,包括:
获取M的计算值,并对其进行排序;
根据排序结果保留对应M值最小的补全轨迹。
8.一种基于大数据技术的时空轨迹补全的装置,其特征在于,所述装置包括:
轨迹数据获取模块,用于获取指定目标的轨迹数据,其中所述轨迹数据包括位置信息和时间信息;
坐标生成模块,用于基于所述位置信息生成待补全轨迹坐标图;
相似度计算模块,用于若所述待补全轨迹坐标图中的待补全轨迹存在空白轨迹,则基于所述空白轨迹的断连点求取所述待补全轨迹与历史轨迹中的近似轨迹的相似度;
轨迹补全模块,用于根据相似度在指定阈值内的所述近似轨迹,对所述空白轨迹进行补全;
最终筛选模块,用于基于补全轨迹进行匹配度计算,并保留匹配度最高的所述补全轨迹。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310598235.4A CN116662315A (zh) | 2023-05-25 | 2023-05-25 | 基于大数据的时空轨迹补全的方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310598235.4A CN116662315A (zh) | 2023-05-25 | 2023-05-25 | 基于大数据的时空轨迹补全的方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116662315A true CN116662315A (zh) | 2023-08-29 |
Family
ID=87714661
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310598235.4A Pending CN116662315A (zh) | 2023-05-25 | 2023-05-25 | 基于大数据的时空轨迹补全的方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116662315A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118152677A (zh) * | 2024-05-10 | 2024-06-07 | 浙江大华技术股份有限公司 | 轨迹补全方法、终端及计算机可读存储介质 |
-
2023
- 2023-05-25 CN CN202310598235.4A patent/CN116662315A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118152677A (zh) * | 2024-05-10 | 2024-06-07 | 浙江大华技术股份有限公司 | 轨迹补全方法、终端及计算机可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108519094B (zh) | 局部路径规划方法及云处理端 | |
CN112783195B (zh) | 多无人机的巡检路线规划方法、装置和计算机设备 | |
CN113587944B (zh) | 准实时的车辆行驶路线生成方法、系统及设备 | |
CN111339802A (zh) | 实时相对地图的生成方法及装置、电子设备和存储介质 | |
CN116662315A (zh) | 基于大数据的时空轨迹补全的方法、装置、设备及介质 | |
DE112016006692T5 (de) | Verfahren zur Vorhersage einer Bewegung eines Objekts | |
CN113743179A (zh) | 路上障碍物检知装置、方法及记录介质 | |
CN110738687A (zh) | 对象跟踪方法、装置、设备及存储介质 | |
CN116907523A (zh) | 路径规划方法、装置、计算机设备和存储介质 | |
CN113269811A (zh) | 数据融合方法、装置及电子设备 | |
Wang et al. | A semi-automatic video labeling tool for autonomous driving based on multi-object detector and tracker | |
CN118334915B (zh) | 一种无人机航线冲突优化调度系统及方法 | |
US20230213633A1 (en) | Aggregation-based lidar data alignment | |
CN111414804B (zh) | 识别框确定方法、装置、计算机设备、车辆和存储介质 | |
CN111666137A (zh) | 数据标注方法、装置、计算机设备和存储介质 | |
CN114780644A (zh) | 一种船舶航行数据处理方法、装置、设备及存储介质 | |
CN113611112A (zh) | 一种目标关联方法、装置、设备及存储介质 | |
CN111832343A (zh) | 目跟踪方法和装置、存储介质 | |
CN109270566B (zh) | 导航方法、导航效果测试方法、装置、设备和介质 | |
US20230221125A1 (en) | Method for ascertaining an initial pose of a vehicle | |
CN113127804B (zh) | 确定车辆故障次数的方法、装置、计算机设备和存储介质 | |
CN115755012A (zh) | 姿态角预测模型的训练、姿态角预测方法、装置及设备 | |
US20220406199A1 (en) | Method and device for supervising a traffic control system | |
CN112800349A (zh) | 水上移动目标的运动状态获取方法、装置、设备和介质 | |
CN113447037A (zh) | 行程偏航检测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |