CN113535861B - 一种多尺度特征融合与自适应聚类的轨迹预测方法 - Google Patents
一种多尺度特征融合与自适应聚类的轨迹预测方法 Download PDFInfo
- Publication number
- CN113535861B CN113535861B CN202110806262.7A CN202110806262A CN113535861B CN 113535861 B CN113535861 B CN 113535861B CN 202110806262 A CN202110806262 A CN 202110806262A CN 113535861 B CN113535861 B CN 113535861B
- Authority
- CN
- China
- Prior art keywords
- track
- clustering
- user
- feature
- layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000004927 fusion Effects 0.000 title claims abstract description 58
- 238000000034 method Methods 0.000 title claims abstract description 25
- 239000013598 vector Substances 0.000 claims abstract description 15
- 238000005065 mining Methods 0.000 claims abstract description 6
- 238000012545 processing Methods 0.000 claims abstract description 6
- 238000004422 calculation algorithm Methods 0.000 claims description 20
- 230000001364 causal effect Effects 0.000 claims description 15
- 238000000605 extraction Methods 0.000 claims description 15
- 230000003044 adaptive effect Effects 0.000 claims description 13
- 238000010606 normalization Methods 0.000 claims description 10
- 239000000203 mixture Substances 0.000 claims description 6
- 230000009466 transformation Effects 0.000 claims description 5
- 238000013145 classification model Methods 0.000 claims description 4
- 125000004122 cyclic group Chemical group 0.000 claims description 4
- 238000007637 random forest analysis Methods 0.000 claims description 4
- 238000012805 post-processing Methods 0.000 claims description 3
- 238000001228 spectrum Methods 0.000 claims description 3
- 238000007619 statistical method Methods 0.000 claims description 2
- 238000007500 overflow downdraw method Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000002759 z-score normalization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
- G06F16/2308—Concurrency control
- G06F16/2315—Optimistic concurrency control
- G06F16/2322—Optimistic concurrency control using timestamps
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Remote Sensing (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种多尺度特征融合与自适应聚类的轨迹预测方法,包括:S1:在每个单一的特征空间进行单特征聚类,得到多尺度特征聚类结果;S2:对多尺度特征聚类结果进行融合;S3:根据融合的轨迹聚类结果建立模型,对用户当前轨迹进行分类;S4:使用类别中聚类中心作为预测候选集。本发明通过在每一个特征向量空间聚类的基础上,根据每个特征空间的聚类结果进行融合特征聚类,不仅能有效的缓解了早融合聚类的时候维数不统一带来的数学处理问题,同时多尺度特征融合使得聚类的结果更准确,并能够更好的捕获用户潜在运动模式,共同模式聚类挖掘能够一定程度上扩展了用户运动轨迹数据集,填充信息缺失部分,轨迹预测准确率更高。
Description
技术领域
本发明涉及轨迹预测技术领域,尤其涉及一种多尺度特征融合与自适应聚类的轨迹预测方法。
背景技术
用户签入行为与GPS采样频率相比有明显差别,个性化签入行为使得用户移动轨迹中可能只有少量的用户有效签入,这使得轨迹数据出现稀疏的现象,同时使得数据中蕴含的用户潜在信息存在信息不全的问题,因此存在影响预测准确率的可能。
在对轨迹进行聚类时,如果只关注单一特征,那么最终得到的结果只能够反映了用户运动轨迹某一方面的特点,不能完全捕获用户整体全面的轨迹特征。例如,轨迹签入时间均值只反映了轨迹的时间特性;轨迹签入位置众数只关注了轨迹的空间特性;轨迹的速度只关注了轨迹的方向性特征。而轨迹聚类的结果往往会直接影响到后期的用户下一足迹的预测结果。在传统的特征融合方法中,更多的使用的是早融合的思想,特征融合发生在特征空间层面,首先将多尺度特征进行融合,然后将融合的特征输入训练器进行学习,最后进行预测。但是该方法在进行融合时存在维度不一致带来的数学处理问题,使得进行融合时需要先解决维度配准的数学处理问题。
发明内容
本发明的目的在于克服现有技术的不足,为实现轨迹数据多尺度特征融合以及用户共同模式挖掘,解决特征融合时维数不一致以及数据集稀疏的问题,并实现对用户轨迹数据全方位、多角度的关注,提供一种多尺度特征融合与自适应聚类的轨迹预测方法。
本发明的目的是通过以下技术方案来实现的:
一种多尺度特征融合与自适应聚类的轨迹预测方法,包括以下步骤:
步骤1:在每个单一的特征空间进行单特征聚类,得到多尺度特征聚类结果;
步骤2:对多尺度特征聚类结果进行融合;
步骤3:根据融合的轨迹聚类结果建立模型,对用户当前轨迹进行分类;
步骤4:使用类别中聚类中心作为预测候选集。
进一步的,所述步骤3中的模型包括六层,从数据的流动方向依次为:轨迹切割层、轨迹特征提取层、轨迹归一化因果嵌入层、轨迹分类层、轨迹多尺度特征融合聚类层以及轨迹建模与预测层;
所述轨迹切割层:利用基于时间统计特性的自适应时间戳计算算法根据用户个性化特征确认每一个用户独特的切割时间戳,使用该时间戳将用户历史长轨迹切割为便于后期处理的短轨迹;
所述轨迹特征提取层:结合小波变换、多重分形和统计分析三种方法分别对用户轨迹进行多方位的特征提取;
所述轨迹归一化因果嵌入层:对特征空间下的每一个轨迹单特征进行因果向量嵌入,然后对嵌入向量进行归一化处理;
所述轨迹分类层:以归一化后轨迹序列作为输入,在特征空间下使用高斯混合模型对用户轨迹进行分类,得到特征空间中轨迹的g个类别;
所述轨迹多尺度特征融合聚类层:在已经分好类的每一个类别中,利用多尺度特征融合与自适应聚类算法得到每一个类别中轨迹聚类结果;
轨迹建模与预测层:使用随机森林获取用户当前轨迹属于历史轨迹不同类别的概率,选取概率最高的类别根据类别中聚类的不同权重从而得到用户当前轨迹属于不同聚类的概率,进而计算出预测的下一个POI。
进一步的,所述轨迹特征提取层具体为:使用小波变换对轨迹数据进行去噪操作,小波系数统计信息分析作为用户轨迹的一大特征,使用多重分形谱描述用户轨迹,获取相关系数作为用户轨迹的一大特征;统计分析用户轨迹时间均值和位置众数作为用户轨迹的一大特征。
进一步的,所述轨迹分类层中对用户轨迹进行分类包括两个步骤:一是对历史轨迹数据进行分析和挖掘,构建轨迹数据分类模型;二是利用构建的模型对未知类别的新数据进行划分。
进一步的,所述轨迹多尺度特征融合聚类层具体为:在每一个类别中以三种不同的特征分别使用基于密度的均值飘移聚类算法进行循环聚类,每一次循环出来的三个特征空间的结果采用多尺度特征融合与自适应聚类算法在聚类层进行融合,得到基于三个特征空间的融合聚类结果,记录聚类中心并赋予不同的权值,并将中心点与权重一起作为候选目标位置记录下来。
本发明的有益效果:解决了轨迹数据维度不一致以及数据集稀疏的问题,能够更好的捕获用户潜在运动模式,共同模式聚类挖掘能够一定程度上扩展了用户运动轨迹数据集,填充信息缺失部分,轨迹预测准确率更高。
附图说明
图1是本发明的方法流程图。
图2是基于多尺度特征融合和自适应聚类的轨迹预测模型图。
具体实施方式
为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图说明本发明的具体实施方式。
本实施例中,如图1所示,一种多尺度特征融合与自适应聚类的轨迹预测方法,采用了晚融合的思想,是一种在聚类层面上的特征融合方法,包括以下步骤:
S1:在每个单一的特征空间进行单特征聚类,得到多尺度特征聚类结果;
S2:对多尺度特征聚类结果进行融合;
S3:根据融合的轨迹聚类结果建立模型,对用户当前轨迹进行分类;
S4:使用类别中聚类中心作为预测候选集。
先在每个单一的特征空间进行单特征聚类,再对多尺度特征聚类结果进行融合,从而解决维度不一致的问题;根据融合的轨迹聚类结果进行建模,对用户当前轨迹进行分类,使用类别中聚类中心作为预测候选集,一定程度上解决了数据集稀疏的问题,最终实现用户轨迹预测。
已知给定用户的轨迹签入数据<lu-m,lu-m+1,...,lu-1,lu>,其中l表示用户的一个签入点,利用自适应时间戳tsu切割出用户当前轨迹T=<lu-n,lu-n+1,...,lu-1,lu>,使用多方法集成轨迹时间序列特征提取获取用户轨迹多尺度特征(D1,D2)(Δα,Δf)和(Et,Pm),每一个特征关注轨迹一方面的潜在信息,将多尺度特征进行聚类层融合,既能进一步关注轨迹潜在信息,又能解决融合时维度不一致带来的问题。同时在聚类结果的基础上训练模型,以此来预测用户的下一个足迹(下一POI)。本发明提出多尺度特征融合与自适应聚类算法,并结合该算法提出基于多尺度特征融合与自适应聚类的轨迹预测模型,如图2所示。
一、模型框架。
为了得到更加可靠的轨迹聚类结果,在单个特征空间进行聚类的基础上,需要融合多个特征空间的聚类结果,实现轨迹数据特征的全方位关注。
同时由于用户签入行为是一个非常具有个性化的不可控行为,这使得用户及数据非常稀疏,稀疏的数据集使得预测时用户轨迹候选点非常少,这种数据集包含的用户信息不完全,为了能够更好的挖掘用户运动潜在模式,对下一步足迹进行预测,需要从数据集中挖掘共同运动模式,以获取更多有用的信息。
基于多尺度特征融合与自适应聚类的轨迹预测模型一共包括六层,分别为轨迹切割层、轨迹特征提取层、轨迹单特征归一化嵌入层、轨迹单特征分类层、轨迹多尺度特征融合聚类层以及轨迹建模与预测层。
(1)轨迹切割层:利用基于时间统计特性的自适应时间戳算法(AdaptiveNext)根据用户个性化特征确认每一个用户独特的切割时间戳,使用该时间戳将用户历史长轨迹切割为便于后期处理的短轨迹。
用户历史轨迹是包含了大量签入数据的长轨迹,为了能够从用户历史轨迹中挖掘用户潜在运动模式,因此首先需要对用户历史轨迹进行切割,使得切割出来的短轨迹能够更好地拟合用户潜在运动模式。
在以往的切割方式中,采用的是人为确定的固定时间戳轨迹切割方式(6小时、12小时、24小时),这种固定时间戳切割方式不仅引入了大量的人为因素,而且在一定程度上忽略了不同用户轨迹之间的差异性,从而影响后续预测准确率。
为了解决这些问题,本发明采用的是基于时间统计特性的自适应时间戳算法(AdaptiveNext),具体可见发明专利一种基于自适应时间戳与多尺度特征提取的轨迹预测方法,来对轨迹进行切割,关注不同用户自身的轨迹特性,从而能够更好地拟合用户潜在运动模式。
(2)轨迹特征提取层:利用时间序列多方法集成特征提取的思想,结合小波、分形和统计三种方法对用户轨迹进行多方位、全面的特征提取。
由于用户轨迹是一个复杂的时序数据,因此使用单一的特征不能很好的捕获用户轨迹多尺度特征,提取用户多尺度轨迹特征信息,步骤如下所示:
①使用小波变换对轨迹数据进行去噪操作;
②小波系数统计信息分析作为用户轨迹一大特征;
③多重分形谱描述用户轨迹,获取相关系数作为用户轨迹一大特征;
④分析用户轨迹时间均值、位置众数作为用户轨迹一大特征。
(3)轨迹归一化因果嵌入层:对特征空间下的每一个轨迹单特征进行因果向量嵌入,然后对嵌入向量进行归一化处理。
由于用户签入时间的顺序性,因此在对当前轨迹特征进行向量嵌入的时候,我们的关注点往往只是在当前轨迹之前的轨迹,而不关注之后的轨迹。在这种情况下,使用CBOW模型或Skip-Gram模型对轨迹进行嵌入无法完成我们的目标。随着因果POI模型的出现,解决了这一问题,该模型能够仅关注当前目标之前的历史数据,而与之后的未来数据无关。使用因果POI模型嵌入将用户轨迹从高维空间嵌入到低维空间中,便于后面对轨迹进行研究。
为了将轨迹序列作为分类模型的输入,同时能够降低模型处理复杂度,提高模型精度,我们需要使用z-score归一化方法对轨迹因果嵌入向量进行归一化处理,从而得到轨迹归一化因果嵌入向量。
对轨迹进行归一化因果嵌入的具体步骤如下:
①根据用户自身ID从数据集中提取出用户的签入点数据;
②按照固定时间戳对用户轨迹进行切分;
③使用word2vec嵌入技术对用户每一条轨迹进行向量嵌入;
④对嵌入后的向量做归一化处理;
⑤结束。
根据上述步骤,不仅能够得到轨迹的归一化因果嵌入向量,而且能够更好的关注轨迹之间潜在的联系,有利于提高预测准确率。
(4)轨迹分类层:在特征空间下使用高斯混合模型(GMM)对用户轨迹进行分类,得到特征空间中轨迹的g个类别;
轨迹分类层通过训练高斯混合模型(GMM)作为分类器,对不知道类别的轨迹数据进行分类。分类过程主要可以划分为两个步骤,第一步对历史轨迹数据进行分析和挖掘,构建轨迹数据分类模型;第二步利用构建的模型对未知类别的新的数据进行划分。分类的准确性、过拟合、矛盾划分的取舍等问题将会很大程度上影响轨迹预测。
轨迹分类层将会利用轨迹归一化因果嵌入层归一化后轨迹序列作为输入,使用高斯混合模型(GMM)对用户轨迹进行分类,得到轨迹的g个类别。高斯混合模型是一个将高斯分布作为基本分布进行混合的模型,根据公式(1)求得高斯分布密度函数,进而使用公式(2)得到高斯分布模型。
其中,
其中是αk系数,表示观测数据属于第k个子模型的概率,
(5)轨迹多尺度特征融合聚类层:在已经分好类的每一个类别中,利用多尺度特征融合与自适应聚类算法(Multi-scaleFeature-fusionandAdaptive-clustering)得到每一个类别中轨迹聚类结果。
将轨迹分类完成后,在每一个类别中以三种不同的特征分别使用基于密度的聚类算法(meanshift)进行循环聚类,然后融合单特征空间的聚类结果得到融合聚类的结果,记录聚类中心并赋予不同的权值w,将中心点与权重一起作为候选目标位置记录下来。具体的步骤如下所示:
①在每一个类别分别以(D1,D2)、(△α,△f)和(Et,Pm)为特征进行循环聚类;
②每一次循环出来的三个特征空间的结果采用多尺度特征融合与自适应聚类算法在聚类层进行融合,得到基于三个特征空间的融合聚类结果;
③记录融合聚类的中心点,并为其分配对应的权重w,然后将中心点和权重对应记录下来。
(6)轨迹建模与预测层:使用随机森林获取用户当前轨迹属于历史轨迹不同类别的概率,选取概率最高的类别,根据类别中聚类的不同权重从而得到用户当前轨迹属于不同聚类的概率,进而计算出预测的下一个POI。
在本实施例中,我们使用随机森林获取用户当前轨迹属于历史轨迹不同聚类类别的概率,选取概率最高的k个类别,根据选取的k个聚类中心点按照公式(3)计算出预测的经纬度作为预测的下一个POI;
其中,μi表示轨迹数据第i个聚类的概率,xi表示第i个聚类中心点的经度,yi表示第i个聚类中心点的纬度。
本发明采用欧式距离来计算当前轨迹属于不同聚类的概率,按照距离由近到远表示属于类的概率的由高到低。欧式距离也称欧几里得距离,是最常见的距离度量,按照公式(4)计算轨迹欧氏空间中两点间的距离公式,衡量多维空间中两个轨迹签入点之间的绝对距离。
二、多尺度特征融合与自适应聚类算法。
(1)多尺度特征融合
用户轨迹数据是用户按照时间顺序将签入点进行连接记录而形成的,这些数据不仅包含用户的空间位置、时间信息,还包含用户一些自身属性,轨迹数据是非常复杂的。通常,轨迹数据是用空间坐标来描述,即轨迹集合中的任意一条轨迹可以表示T=<l1,l2,…,ln>;其中,li表示当前轨迹中用户的第i个签入点数据,包括签入时间、签入位置等信息,n表示当前用户轨迹包含的签入点个数。
通过不同特征提取方法获得的轨迹数据多尺度特征可分为底层特征和高层特征,底层特征具有更高的分辨率,包含更多位置、时间等细节信息,但是其噪声更多,导致较低的语义性;相比而言,高层特征的分辨率较低,感知细节信息的能力较差,但是具有更强的语义信息。因此融合底层与高层特征两者的优点,将两者有效地融合,更好的关注轨迹数据的全局特征,是改善轨迹预测模型的关键。
提取轨迹时间序列统计特征作为轨迹时间序列的特征,很好地表征了时间序列的整体特征。时间均值表示轨迹时间序列的签入时间波动范围,时间方差反映原始轨迹时间序列签入时间波动的幅度,位置众数表示轨迹时间序列签入点中出现次数最多的地点,如公式(5)。
(2)轨迹自适应聚类
在对轨迹数据进行处理的时候,通过对用户运动轨迹进行聚类,可以发掘用户的共同行为模式,填充轨迹稀疏数据集带来的信息缺失部分,进而可以完成用户行为预测。轨迹聚类是用户移动性识别和用户行为模式挖掘的基础,为高层次的场景理解与分析提供了语义描述信息,聚类时主要处理的是包含用户空间位置和时间信息的多尺度轨迹时间序列数据。
在给定的三个特征空间中,假定得到的聚类数目分别为{N1,N2,N3},我们将融合后的聚类数目设定为Ne=max{N1,N2,N3},以表示融合聚类第i个簇的聚类结果。多尺度特征融合与自适应聚类算法具体步骤如下所示,该算法的流程图如图2所示。
算法:多尺度特征融合与自适应聚类算法
输入:每一个特征空间的聚类结果{N1,N2,N3}
输出:融合聚类结果Ne
①Ne=max{N1,N2,N3}/*根据每个特征空间聚类结果计算出融合聚类类别数*/
②Fs=getClusteringSpace(Ne)/*选取一个聚类数目与融合聚类数目相同的聚类空间*/
③Fa=other(Fs)/*其他所有特征空间*/
④/*针对Fs中进行聚类*/
⑤/*找到Fa中与/>具有最多重叠元素的聚类*/
⑥/*更新融合聚类结果*/
⑦Circulate()/*循环步骤三和步骤四,对主要轨迹完成聚类*/
⑧/*计算剩余未分配轨迹与融合聚类之间的条件概率,其中Tu表示一条未分配的轨迹,∑e,k表示融合聚类k(k=1,2,…,Ne)的标准差,ξi,j表示第i(i=1,2,3)个特征空间的第j个聚类的向量均值*/
⑨/*将轨迹Tu分配给融合聚类*/
⑩Circulate()/*重复步骤五和步骤六,直到所有未分配轨迹全部分配完毕,得到最终融合聚类结果*/
本发明通过在每一个特征向量空间聚类的基础上,根据每个特征空间的聚类结果进行融合特征聚类,不仅能有效的缓解了早融合聚类的时候维数不统一带来的数学处理问题,同时多尺度特征融合使得聚类的结果更准确。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护的范围由所附的权利要求书及其等效物界定。
Claims (4)
1.一种多尺度特征融合与自适应聚类的轨迹预测方法,其特征在于,包括以下步骤:
S1:在每个单一的特征空间进行单特征聚类,得到多尺度特征聚类结果;
S2:对多尺度特征聚类结果进行融合;
S3:根据融合的轨迹聚类结果建立模型,对用户当前轨迹进行分类;
S4:使用类别中聚类中心作为预测候选集,依据预测候选集及模型预测后的数据对用户的轨迹进行预测;
所述方法整体通过一个模型实现,所述模型包括六层,从数据的流动方向依次为:轨迹切割层、轨迹特征提取层、轨迹归一化因果嵌入层、轨迹分类层、轨迹多尺度特征融合聚类层以及轨迹建模与预测层;
所述轨迹切割层:利用基于时间统计特性的自适应时间戳计算算法根据用户个性化特征确认每一个用户独特的切割时间戳,使用该时间戳将用户历史长轨迹切割为便于后期处理的短轨迹;
所述轨迹特征提取层:结合小波变换、多重分形和统计分析三种方法分别对用户轨迹进行多方位的特征提取;
所述轨迹归一化因果嵌入层:对特征空间下的每一个轨迹单特征进行因果向量嵌入,然后对嵌入向量进行归一化处理;
所述轨迹分类层:以归一化后轨迹序列作为输入,在特征空间下使用高斯混合模型对用户轨迹进行分类,得到特征空间中轨迹的g个类别;
所述轨迹多尺度特征融合聚类层:在已经分好类的每一个类别中,利用多尺度特征融合与自适应聚类算法得到每一个类别中轨迹聚类结果;
轨迹建模与预测层:使用随机森林获取用户当前轨迹属于历史轨迹不同类别的概率,选取概率最高的类别根据类别中聚类的不同权重从而得到用户当前轨迹属于不同聚类的概率,进而计算出预测的下一个POI。
2.根据权利要求1所述的一种多尺度特征融合与自适应聚类的轨迹预测方法,其特征在于,所述轨迹特征提取层具体为:使用小波变换对轨迹数据进行去噪操作,小波系数统计信息分析作为用户轨迹的一大特征,使用多重分形谱描述用户轨迹,获取相关系数作为用户轨迹的一大特征;统计分析用户轨迹时间均值和位置众数作为用户轨迹的一大特征。
3.根据权利要求1所述的一种多尺度特征融合与自适应聚类的轨迹预测方法,其特征在于,所述轨迹分类层中对用户轨迹进行分类包括两个步骤:一是对历史轨迹数据进行分析和挖掘,构建轨迹数据分类模型;二是利用构建的模型对未知类别的新数据进行划分。
4.根据权利要求1所述的一种多尺度特征融合与自适应聚类的轨迹预测方法,其特征在于,所述轨迹多尺度特征融合聚类层具体为:在每一个类别中以三种不同的特征分别使用基于密度的均值飘移聚类算法进行循环聚类,每一次循环出来的三个特征空间的结果采用多尺度特征融合与自适应聚类算法在聚类层进行融合,得到基于三个特征空间的融合聚类结果,记录聚类中心并赋予不同的权值,并将中心点与权重一起作为候选目标位置记录下来。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110806262.7A CN113535861B (zh) | 2021-07-16 | 2021-07-16 | 一种多尺度特征融合与自适应聚类的轨迹预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110806262.7A CN113535861B (zh) | 2021-07-16 | 2021-07-16 | 一种多尺度特征融合与自适应聚类的轨迹预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113535861A CN113535861A (zh) | 2021-10-22 |
CN113535861B true CN113535861B (zh) | 2023-08-11 |
Family
ID=78099702
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110806262.7A Active CN113535861B (zh) | 2021-07-16 | 2021-07-16 | 一种多尺度特征融合与自适应聚类的轨迹预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113535861B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105843919A (zh) * | 2016-03-24 | 2016-08-10 | 云南大学 | 一种基于多特征融合与聚类集成的移动对象轨迹聚类方法 |
CN109063754A (zh) * | 2018-07-18 | 2018-12-21 | 武汉大学 | 一种基于OpenStreetMap的遥感影像多特征联合分类方法 |
CN109947119A (zh) * | 2019-04-23 | 2019-06-28 | 东北大学 | 一种基于多传感器融合的移动机器人自主跟随系统及方法 |
CN111694913A (zh) * | 2020-06-05 | 2020-09-22 | 海南大学 | 一种基于卷积自编码器的船舶ais轨迹聚类方法和装置 |
CN112667763A (zh) * | 2020-12-29 | 2021-04-16 | 电子科技大学 | 一种基于自适应时间戳与多尺度特征提取的轨迹预测方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080288425A1 (en) * | 2007-05-17 | 2008-11-20 | Christian Posse | Methods and Apparatus for Reasoning About Information Fusion Approaches |
US9750433B2 (en) * | 2013-05-28 | 2017-09-05 | Lark Technologies, Inc. | Using health monitor data to detect macro and micro habits with a behavioral model |
US11912271B2 (en) * | 2019-11-07 | 2024-02-27 | Motional Ad Llc | Trajectory prediction from precomputed or dynamically generated bank of trajectories |
-
2021
- 2021-07-16 CN CN202110806262.7A patent/CN113535861B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105843919A (zh) * | 2016-03-24 | 2016-08-10 | 云南大学 | 一种基于多特征融合与聚类集成的移动对象轨迹聚类方法 |
CN109063754A (zh) * | 2018-07-18 | 2018-12-21 | 武汉大学 | 一种基于OpenStreetMap的遥感影像多特征联合分类方法 |
CN109947119A (zh) * | 2019-04-23 | 2019-06-28 | 东北大学 | 一种基于多传感器融合的移动机器人自主跟随系统及方法 |
CN111694913A (zh) * | 2020-06-05 | 2020-09-22 | 海南大学 | 一种基于卷积自编码器的船舶ais轨迹聚类方法和装置 |
CN112667763A (zh) * | 2020-12-29 | 2021-04-16 | 电子科技大学 | 一种基于自适应时间戳与多尺度特征提取的轨迹预测方法 |
Non-Patent Citations (1)
Title |
---|
移动社交网络中的位置轨迹挖掘及应用研究;陈明;《中国博士学位论文全文数据库信息科技辑》;I138-3 * |
Also Published As
Publication number | Publication date |
---|---|
CN113535861A (zh) | 2021-10-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113378632B (zh) | 一种基于伪标签优化的无监督域适应行人重识别方法 | |
CN108846835B (zh) | 基于深度可分离卷积网络的图像变化检测方法 | |
CN109671102B (zh) | 一种基于深度特征融合卷积神经网络的综合式目标跟踪方法 | |
CN110120218A (zh) | 基于gmm-hmm的高速公路大型车辆识别方法 | |
CN112347970B (zh) | 一种基于图卷积神经网络的遥感影像地物识别方法 | |
CN111046787A (zh) | 一种基于改进YOLO v3模型的行人检测方法 | |
CN110717554A (zh) | 图像识别方法、电子设备及存储介质 | |
CN112312541A (zh) | 一种无线定位方法及系统 | |
CN114627390B (zh) | 一种改进的主动学习遥感样本标记方法 | |
CN101710422B (zh) | 基于全局流形原型聚类算法与分水岭算法的图像分割方法 | |
CN113971815A (zh) | 基于奇异值分解特征增强的少样本目标检测方法 | |
CN112767447A (zh) | 基于深度霍夫优化投票的时敏单目标跟踪方法、存储介质和终端 | |
CN112101132B (zh) | 一种基于图嵌入模型和度量学习的交通状况预测方法 | |
CN115131580B (zh) | 基于注意力机制的空间目标小样本识别方法 | |
CN112381644A (zh) | 一种基于空间变量推理的信贷场景风险用户评估方法 | |
CN112990282A (zh) | 一种细粒度小样本图像的分类方法及装置 | |
CN109979194B (zh) | 基于马尔可夫链的重型车辆坡道爬行行为识别方法 | |
CN114860700A (zh) | 缺失轨迹填补方法及系统 | |
CN109145175B (zh) | 基于stacking集成学习算法的时空数据预测方法 | |
CN113535861B (zh) | 一种多尺度特征融合与自适应聚类的轨迹预测方法 | |
CN115345322B (zh) | 一种基于层级化元迁移的小样本雷达目标识别方法 | |
CN112667763B (zh) | 一种基于自适应时间戳与多尺度特征提取的轨迹预测方法 | |
CN113032688B (zh) | 针对社交网络用户在未来给定时间的访问位置预测方法 | |
CN113316080B (zh) | 基于Wi-Fi与图像融合指纹的室内定位方法 | |
CN115062708A (zh) | 一种基于轨迹偏差点嵌入和深度聚类的异常节点检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |