CN113190632A - 一种轨迹复原算法的模型建立方法及系统 - Google Patents
一种轨迹复原算法的模型建立方法及系统 Download PDFInfo
- Publication number
- CN113190632A CN113190632A CN202011540450.1A CN202011540450A CN113190632A CN 113190632 A CN113190632 A CN 113190632A CN 202011540450 A CN202011540450 A CN 202011540450A CN 113190632 A CN113190632 A CN 113190632A
- Authority
- CN
- China
- Prior art keywords
- value
- algorithm
- label
- coordinate
- establishing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/025—Services making use of location information using location based information parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/029—Location-based management or tracking services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Remote Sensing (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
技术领域
本发明属于轨迹复原领域,具体涉及一种轨迹复原算法的模型建立方法及系统。
背景技术
(1)当前通信数据库和云平台已经接轨,依据手机信号的实时定位技术已经开始商用,相关app已经投放在安卓下载平台,应用的前提是需要被测手机授权。
(2)云平台可以个性化定制操作系统、GPU以及应用软件等,阿里、腾讯、华为已经可以提供相应服务,客户可根据项目需要进行二次开发。
(3)在谈及轨迹算法之前,本文需要了解当前通信数据所受的制约。随着5G 商用化加快,公民手机及穿戴设备都可作为移动终端,海量的人员轨迹数据随之急剧增长,但受制于公民自我开关设备、区域禁用通信设备、信号采集周期过长以及通信设备本身故障等原因导致无法精确定位公民位置更无法确定公民行为。
(4)轨迹属于时序化数据的范畴,克服(3)中制约限制实质就是解决时序化插值的问题。D.M.Kreindler and C.J.Lumsden.The effects of the irregular sample andmissing data in time series analysis.Nonlinear Dynamical Systems Analysis forthe Behavioral Sciences Using Real Data,page 135,2012.Kreindler等假设数据是平滑的,在缺失值所在的时空区间上没有突然的波动,然后按照最近邻原则完成插值。显然这种假设已经大大降低模型泛化能力,一旦待插值数据平滑度不够,算法模型性能大幅降低甚至无法应用。
(5)H.-F.Yu,N.Rao,and I.S.Dhillon.Temporal regularized matrixfactorization for highdimensional time series prediction.In Advances inneural information processing systems,pages 847–855,2016.Yu等利用具有时间正则化的矩阵因式分解在定期采样的时间序列数据中计算缺失的值,但通常矩阵分解适用于静态数据,并且事先需假设矩阵具有较低的秩以降低计算负荷。但申请人在实际应用中容易发现,该方法的数据量与矩阵秩大小的平法成正比,应用范围十分受限,并且受静态数据的限制更是很难完成诸如天气、温度、实时轨迹等动态数据插值的预测。
(6)Che,Z.,Purushotham,S.,Cho,K.,Sontag,D.,&Liu,Y.(2018).RecurrentNeural Networks for Multivariate Time Series with Missing Values.ScientificReports, 8(1).doi:10.1038/s41598-018-24271-9.Che等将遮蔽矩阵及时间间隔矩阵也作为输入数据送入模型并且引入隐藏状态衰减项和输入衰减项以提高预测精度。但该方法并未对高缺失率(比如缺失率为90%)进行算法优劣试验,作者提供输入衰减项就是用来建立多变量之间关系,当缺失率过高,多变量之间建立错误的关系成为主导,当该关系被应用于模型不仅没有提高预测精度反而可能恶化模型的预测性能,所以作者得出GRU-D性能最优的结论需要给出缺失率上限值。
(7)W.Cao,D.Wang,J.Li,H.Zhou,L.Li,Y.Li,BRITS:Bidirectional recurrentimputation for time series,in:Adv.Neural Inf.Process.Syst.31,2018,pp.6774–6784.Cao等与(6)主体思路一致,都是数据驱动模型且完全抛开(4)及(5)等的事先假设,并且将天气质量数据、MIMIC数据及人类活动数据纳入训练和测试。但该算法同样没有解决高缺失率时最优算法是否还是BRIS模型的问题。申请人对其算法在缺失率达90%时测试发现,其算法性能排序为 RITS<BRIS<BRIS_I<RIS_I,BRIS模型性能只排倒数第二并非正数第一。另外该论文将天气质量数据纳入该算法适用范畴是不够严谨的,因为天气质量的样本之间存在关系,该算法没有体现出如何解决有关系样本的解决方案,实际上轨迹就是有关系样本。
发明内容
本申请提供一种轨迹复原算法的模型建立方法及系统,其有效解决有关系样本的轨迹复原问题。
为实现上述技术目的,本申请采取的技术方案为,一种轨迹复原算法的模型建立方法,采用SMRA_BRITS算法预估缺失值得到,包括,
获取轨迹基于时间戳上的原始观测值的多变量序列X,X={x1,x2...,xT};xt是第t个时间戳st对应的观测值,xt∈RD×1;t∈{1,2,...,T},T为大于0的正整数;
建立多变量序列中缺失值的遮蔽矩阵m,m=[m1,...,mt,...,mT],其中mt为第 t个序列点对应的遮蔽向量;D表示多维变量个数;
基于缺失值的时间戳与上一次真实观测值对应时间戳的差值构建时间间隔矩阵δ,δ=[δ1,...,δt,...,δT],其中δt为第t个序列点对应的时间间隔向量,δt∈RD×1;
通过收敛与回归得到轨迹复原算法模型。
A∈RH×D,a∈RH×1,H表示单个时序点对应隐藏单元的个数;A,a初始值均由高斯分布抽样确定,模型训练不断迭代更新A,a,训练结束则A,a值最终确定;
Θ为矩阵取内积符号,“||”代表纵向拼接;
ht∈RH×1,表示第t个时序点对应的隐藏层输出状态,ht-1表示第t-1个时序点对应的隐藏层输出状态,默认初始值h0由高斯分布抽样确定;
ht,B,C,d初始值均由高斯分布抽样确定,模型训练不断迭代更新ht,B,C,d,训练结束,ht,B,C,d最终确定;
通过该输入端衰减函数构建数值与数值的融合系数βt,βt∈RD×1,βt中每个元素的值介于0~1,含端点;F∈RD×2D,f∈RD×1,F,f初始值均由高斯分布抽样确定,模型训练不断迭代更新F,f,训练结束则F,f值最终确定;
Wz,bz初始值为高斯分布抽样取值,模型训练不断迭代更新Wz,bz,p,训练结束则Wz,bz,p值最终确定;
其中,wi,j是Wz中的一个元素,Wz∈RD×D,当i≠j,wi,j表示第j个变量对第 i个变量的影响系数;当i=j,wi,j取值为0。
yt=cross_entropy(Pt,ρt),
Pt∈RC×1,ρt∈RC×1,nt∈R1×1,nt代表时序点t对应的标签遮蔽向量值,C为行为标签类别个数,Pt代表时序点t对应的每一种可能的行为标签的概率预测值。ρt代表该标签真实值或默认值的One-Hot编码。cross_entropy代表交叉熵函数。针对该算法任意一个方向,m个顺序样本坐标损失函数与标签分类损失函数的加权损失函数为:
作为本申请改进的技术方案,融合该算法正反两个方向的损失函数为:
本申请的另一目的是提供一种轨迹复原监控系统,包括docker容器,所述 docker容器获得基于时间戳上的原始观测值的多变量序列即轨迹数据,内置有SMRA_BRITS算法预估缺失值,进行轨迹数据处理得到复原轨迹,并传递至PC 端以显示复原后的轨迹。
进一步地,所述轨迹数据来源于互联网,并被Oracle通信数据库存储;所述docker容器连接于所述Oracle通信数据库。
有益效果
(1)本申请设计了双向循环神经网络直接预测缺失值(包括位置缺失和行为标签缺失),无需事先假设数据分布等即可完成插值,模型泛化能力大幅增强。
(2)本申请将位置缺失的数据看成变量并参与算法后向传播通过迭代恢复缺失数据,并且在LSTM隐藏层及输入层设置衰减单元。目的是尽可能记住上一次实际观测值。因为对于本次缺失值预测影响最大的是上一次实际观测值,所以通过衰减单元赋予其较高权重,这样模型预测性能得到明显提高。
(3)本申请在同一个神经网络图谱中,同时完成缺失值的插值以及模型回归和分类。以往对存在缺失值的回归和分类分析中,很多学者将其分为二阶段即先通过最近邻、均值或神经网络算法等完成插值,然后将插值后的数据送入回归和分类模型。而本申请算法模型在一个阶段内就可同时完成上述二阶段的任务。
(4)针对有关系样本数据,本申请将前一个样本的输出状态及记忆状态作为初始值输入到紧邻样本对应的状态中,明显提高预测性能,且曲线平滑度更好。
(5)本申请同样建立了多维变量之间的关系,并且采用缺失率自适应策略。该策略就是赋予多维变量有关系和无关系各自权重,权重和为1,通过模型训练自动学习各自权重。最终实现无论缺失率为多少,SMRA_BRITS算法性能始终最优。
附图说明
图1为监控系统框架图。
图3为带有缺失值的多维数据示例图;
图中:estimated variable:预估的变量;
regression layer:缺失值及观测值的回归预测层;
recurrent layer:循环迭代层;
complement variable:插值后的变量;
Input value:输入值;
Missing Values:缺失值。
图4为LSTM网络结构图;
图中,Tanh:正切激活函数。
图5为LSTM网络衰减单元定位示意图;
图中,Hidden state decay term:隐藏层衰减单元;
Input decay term:输入层衰减单元;
MASK(m):遮蔽矩阵m;
IN(x):观测值x输入;
OUT(h):隐藏状态输出。
图6为通信数据预处理程序的流程图。
图7为SRITS_I算法实现的流程图。
图8为SBRITS_I算法程序的流程图
图9为SMRA_RITS算法程序的流程图。
图10为SMRA_BRITS算法程序的流程图。
图11为A缺失率为10%的插值前后的轨迹图原始图。
图12为A缺失率为10%的插值前后的轨迹图的插值图。
图13为A缺失率为10%的插值前后的绝对误差图。
图14为A缺失率为10%的插值前后的相对误差图。
图15为B缺失率为10%的插值前后的轨迹图原始图。
图16为B缺失率为10%的插值前后的轨迹图插值图。
图17为总体图解。
具体实施方式
只有解决了通信数据轨迹插值问题,基于移动通信数据云平台的轨迹复原监控系统才能真正建立,通信数据的价值比如轨迹复原的商用和非商用价值才能最大化。
(1)商用价值方面:首先是在交通运输行业,比如出租车行业可以提前知道市内公民轨迹和交通模式,最优化资源分配以达到最小空车率和最小用户等待时间,同理公交、地铁、飞机等交通运输可以依据人员历史通信轨迹数据提前做好资源分配。其次是餐饮、旅游、住宿行业,根据人员历史轨迹数据,预测出顾客的饮食、旅游以及住宿的喜恶类别、驻留时间和消费水平,以规划城市、景区布局,提前调控交通运输并最大限度增收避免资源浪费。最后是个性化服务行业,通信轨迹不再局限于人,凡是具有通信数据收发功能的载体及其附属物都可以享有此服务,不仅老人、儿童可以定制轨迹追踪和预警功能,手机、电脑、保险箱、车辆等等都可以外接或内置通信设备享受轨迹追踪和预警服务。
(2)非商用价值方面:首先是公卫方面,可根据算法对目标精确定位确认出第一梯队目标接触者,通过目标接触者移动数据继续延伸查找下一级目标接触者。其次是刑侦方面,只要确定目标的移动数据完全可以对其详细轨迹进行恢复以及未来轨迹进行预测,沿途提前做好搜查准备或布防。
特别说明,本文中未特别交代的参数均为模型训练过程中得到的参数,且模型训练过程中的初始值均为人为设定值。
为了更加精准的复原轨迹,本申请提出的一种轨迹复原算法的模型建立方法,采用SMRA_BRITS算法预估缺失值得到,包括,
获取轨迹基于时间戳上的原始观测值的多变量序列X, X={x1,x2,...,xt...,xT};xt是第t个时间戳st对应的观测值;t∈{1,2,...,T},T为大于0的正整数;
建立多变量序列中缺失值的遮蔽矩阵m,m=[m1,...,mt,...,mT],其中mt为第 t个序列点对应的遮蔽向量,mt∈RD×1;D表示多维变量个数;
基于缺失值的时间戳与上一次真实观测值对应时间戳的差值构建时间间隔矩阵δ,δ=[δ1,...,δt,...,δT],其中δt为第t个序列点对应的时间间隔向量,δt∈RD×1;
通过收敛与回归得到轨迹复原算法模型。
A∈RH×D,a∈RH×1,H表示单个时序点对应隐藏单元的个数;A,a初始值均由高斯分布抽样确定,模型训练不断迭代更新A,a,训练结束则A,a值最终确定;
Θ为矩阵取内积符号,“||”代表纵向拼接;
ht∈RH×1,表示第t个时序点对应的隐藏状态,ht-1∈RH×1,表示第t-1个时序点对应的隐藏状态,默认初始值h0由高斯分布抽样确定;
ht,B,C,d初始值均由高斯分布抽样确定,模型训练不断迭代更新ht,B,C,d,训练结束,ht,B,C,d最终确定;
通过该输入端衰减函数构建数值与数值的融合系数βt,βt∈RD×1,βt中每个元素的值介于0~1,含端点;F∈RD×2D,f∈RD×1,F,f初始值均由高斯分布抽样确定,模型训练不断迭代更新F,f,训练结束则F,f值最终确定;
Wz,bz初始值为高斯分布抽样取值,模型训练不断迭代更新Wz,bz,p,训练结束则Wz,bz,p值最终确定;
其中,wi,j是Wz中的一个元素,Wz∈RD×D,当i≠j,wi,j表示第j个变量对第 i个变量的影响系数;当i=j,wi,j取值为0。
yt=cross_entropy(Pt,ρt),
Pt∈RC×1,ρt∈RC×1,nt∈R1×1,nt代表时序点t对应的标签遮蔽向量值,C为行为标签类别个数,Pt代表时序点t对应的每一种可能的行为标签的概率预测值。ρt代表该标签真实值或默认值的One-Hot编码;cross_entropy代表交叉熵函数。针对该算法任意一个方向,m个顺序样本坐标损失函数与标签分类损失函数的加权损失函数为:
作为本申请改进的技术方案,融合该算法正反两个方向的损失函数为:
本申请的另一目的是提供一种轨迹复原监控系统,采用SMRA_BRITS算法进行轨迹数据处理得到复原轨迹;所述SMRA_BRITS算法包括权利要求1-6 任一所述的算法;
包括docker容器,所述docker容器获得基于时间戳上的原始观测值的多变量序列即轨迹数据,内置有SMRA_BRITS算法,进行轨迹数据处理得到复原轨迹,并传递至PC端以显示复原后的轨迹。
进一步地,所述轨迹数据来源于互联网,并被Oracle通信数据库存储;所述docker容器连接于所述Oracle通信数据库。
详述地,本申请提出SMRA_BRITS算法作为一种轨迹复原算法的模型建立方法,即样本有关系及缺失率自适应的双向循环时序化数据插值算法 (Sample-related andMissing Rate Adaptive Bidirectional Recurrent Imputation for Time Series)。本申请一种轨迹复原算法的模型建立方法的整体设计原理如下:
SMRA_BRITS算法实现
步骤(2)、(3)、(4)、(5)是SMRA_BRITS算法功能逐步完善的过程,为了比较新增功能对算法预测性能影响,本文会对各步骤新增功能后独立成为一种算法,将各算法在同一个数据集上进行训练和测试,以证明SMRA_BRITS算法优势。
(1)变量自定义
本文定义一个轨迹的坐标多变量序列X={x1,x2...,xt,...xT}作为观测值序列,时序点个数为T。第t个序列点的坐标观测值集合xt∈RD×1,观测值变量个数为D (即多维变量的个数)。 表示第t个序列点的第d个变量值。xt对应的时间戳用st表示。需要特别说明的是st之间的时间间隔并不是相同的。正如背景技术的(3)所述,xt很可能存在缺失值,因此本文引入坐标遮蔽矩阵m=[m1,...,mt,...,mT],其中mt为第t个序列点对应的遮蔽向量,mt∈RD×1,即mt为D行1列向量。使用表示mt中的第d个变量的遮蔽值,其表达式如公式(1)所示。
许多实际场景中出现连续多个缺失值的情形,所以需要构建衰减单元,因此本文引入坐标时间间隔矩阵δ=[δ1,...,δt,...,δT],其中δt为第t个序列点对应的时间间隔向量,δt∈RD×1,衰减单元的重要输入参数就是δt。使用表示时间间隔矩阵δt的第d个变量的时间间隔值,具体表达式如公式(2)所示。
上述xt,之间关系的图解说明如图2所示。由图2可以看出x1,...,x6对应的时间戳s1,...,s6分别为0,2,7,9,14,15,对应的遮蔽向量为m1,...,m6,对应的时间间隔向量为δ1,...,δ6。现在考察根据定义,对应的缺失值的上一次真实观测到的值是其时间戳之差同理可得其余值。
(2)建立正向循环神经网络
建立正循环神经网络是暂不考虑多维变量之间的关系,即不考虑时序点之间关系,但考虑单个时序点上多维变量之间关系,本文将其定义为SRITS_I算法,公式(10)、(11)的结果以及SRITS_I算法简单示意已经反应在图3中。
该图是一个样本数据,需要特别说明的是该图的输入来自上一次紧邻的样本的的输出,并且该图样本的输出要作为下一个样本的输入,所有样本按照测试人活动方向截取制作,训练和测试也必须按顺序进行,对于无关系样本没有上述限制也无需进行样本状态接力。
SRITS_I算法实质上是循环神经网络(RNN)的经典变体之一长短记忆网络 (LSTM)的改进,LSTM网络如图4所示。
LSTM是靠“门”的结构让信息有选择性地影响RNN每个点的状态。LSTM 隐藏状态函数ht如公式(3)所示。
ht=σ(Bht-1+Cxt+d) (3)
上式σ为sigmoid函数,ht-1,B,C,d初始值均由高斯分布抽样确定。
SRITS_I算法对LSTM的输入数据xt及输出状态ht-1进行改造,具体公式如下:
由公式(3)与(7)可以看出输入数据xt被改造成||mt,“||”代表纵向拼接,是时间戳st对应真实观测值mtΘxt以及缺失值的预测结果的矩阵之和。由公式(3)与(7)还可以看出ht-1被改造成Θ代表矩阵点乘,为时间戳st对应的衰减单元,公式(6)显示是δt减函数。正常来说,δt越大,ht-1受长时间缺失值的影响,包含的错误信息就越大,那么ht也相应失真,为了削弱ht-1错误信息影响,引入衰减单元δt越大,相应的ht-1Θγt也减小,比如ht-1Θγt减小到0,则公式(6)变为隐藏状态ht输出只受||mt影响,避免了失真。由于ht削弱了失真,相对容易收敛到准确值,那么模型收敛速度也会加快。在网络结构中具体位置如图3所示。公式(8)代表第t个时间序列对应的轨迹坐标损失函数具体为 是中的第d个元素;
本文不仅有公式(9)回归的预测还有各时序点上行为方式的预测,本申请以交通方式为例,每个时序点上的交通方式可能为走路、骑自行车、坐公交车、小汽车或出租车、火车、飞机以及其他这7类中的一种。每个样本总共包含L个时序点,我们定义标签的遮蔽矩阵n,n∈RL×1如公式(10)所示。
对于标签缺失的时序点默认初始值标签值为“其他”,在模型训练过程中进行迭代更新。使用One-Hot编码对7种交通方式编码结果如公式(11)所示。
公式(11)中,标签“走路”对应[1,0,0,0,0,0,0]T,“骑自行车”对应[0,1,0,0,0,0,0]T,其余标签以此类推。第t个时序点对应的输出Yt如公式12所示。
Yt=Ght+g (12)
Yt∈RC×1,G∈RC×H,g∈RC×1,G,g初始值为高斯分布抽样确定,模型训练迭代更新G,g。C表示交通方式类型的个数,本申请C=7。使用softmax函数将Yt的值映射到0-1之间的概率值,输出时序点t上的各可能交通方式的概率取值Pt如公式(13)所示。
Pt=softmax(Yt) (13)
Pt∈RC×1,将Pt,ρt输入到交叉熵损失函数cross_entropy就得到了时序点t对应的标签分类损失函数yt如公式(14)所示。
yt=cross_entropy(Pt,ρt) (14)
其中α,β分别代表轨迹定位和回归占损失函数的权重,表示第k个样本轨迹坐标回归的损失函数,表示第k个样本L个时序点标签分类的损失函数。当只关注定位时可以设置α=1,β=0,两者都关注时可以分别赋予0~1之间的权重。
(3)增加多维变量之间耦合关系
在步骤(2)基础上,将多维变量之间的关系考虑在内,即不仅要考虑时序点之间关系,还要考虑单个时序点上多维变量之间关系,但同时要妥善处理缺失率。缺失率较小,建立多维变量正确耦合关系大于错误耦合关系的影响,模型的性能仍然是提高的,当缺失率超过阈值,错误耦合关系超过正确耦合关系的影响,模型的性能很可能变得很低,因此本文在步骤(2)基础上做了三个方面的功能提升,本文把提升后的算法叫做SMRA_RITS算法。第一个提升是增加了输入端的衰减单元,具体位置如图5所示,右侧圆圈内的衰减单元即为新增输入端衰减单元,隐藏层的输出衰减单元以及输入端衰减单元都是为了加快收敛提高模型预测性能。
E∈RD×D,e∈RD×1,E,e初始值均由高斯分布抽样确定。
SMRA_RITS算法第二个提升是增加多维变量之间的耦合关系,为此构建对角全部为0的矩阵Wz如式(18)所示。
其中wi,j是Wz中的一个元素,Wz∈RD×D,当i≠j,wi,j表示第j个变量对第i个变量的影响系数;当i=j,wi,j取值为0。
Wz,bz初始值均由高斯分布抽样确定,在模型训练中迭代更新。
SMRA_RITS算法第三个提升是引进缺失率矩阵Rz其表达如式(20)所示。
0≤p≤1,将Rz带入公式(19)并改进得公式(21)。
Wz对角线为0的数据代表无关联,非对角线数据代表有关联。当缺失率较小则模型自主学习得到的p值变小,1-p值变大,则多变量之间耦合关系的权重得到增强,当缺失率变大则模型自主学习得到p值变大,1-p值变小,则多变量之间耦合关系的权重得到削减,如此算法模型可以避开高缺失率导致多变量耦合导致模型性能恶化的影响。是从多维变量之间耦合关系角度得到数值,可以称为纵向角度,本文还要兼顾具体某个变量历史数据,可以称为横向角度。所以必须要进行纵横角度的融合,因此本文使用βt作为纵向数据与横向数据的融合系数,其中,βt中的每个元素的取值介于0~1,含端值;其表达式如式(22)所示。
式中B,C,d初始值均由高斯分布抽样确定。为了加快收敛速度提高预测精度,需对公式(9)改进,改进后的结果如公式(26)所示。
其中α,β分别代表轨迹定位和回归占损失函数的权重,表示第k个样本轨迹坐标回归的损失函数,表示第k个样本L个时序点标签分类的损失函数。当只关注定位时可以设置α=1,β=0,两者都关注时可以分别赋予0~1之间的权重。
(4)增加反向循环神经网络不考虑多维关系
步骤(2)是单向循环神经网络,那么缺失值被迭代插值后与理论值构成的误差必须沿着正方向延迟到下一个实际观测值的出现,然后通过损失函数对该实测值误差进行后向传播以实现缺失值逐步收敛的目的。正如图3所示,内缺失值的迭代误差直到实际观测值x8的出现才能得到收敛。这种误差延迟收敛的弊端会造成收敛很慢,很可能导致模型训练不充分。为了加快收敛速度提高模型预测性能,本文在步骤(2)基础上增加反向循环神经网络,本文将其定义为 SBRITS_I算法,本质上是LSTM衍生算法在正反方向的叠加,缺失值的延迟误差在两个方向上完成误差的反向传播,大大提高收敛速度,而且受到来自正反两个实测值的信息的制约,其预测准确度更高。增加反向循环神经网络后,其损失函数就是正、反方向损失函数的均值,具体计算如公式(29)所示。
(5)增加反向循环神经网络考虑多维关系
本文可以在步骤(4)基础上将考虑多维变量关系或者在步骤(3)基础上增加反向循环神经网络得到SMRA_BRITS算法。在这里本文选择在步骤(3)基础上实现 SMRA_BRITS算法,只要将步骤(3)对应的SMRA_RITS算法在正反方便叠加,损失函数取均值即可完成SMRA_BRITS算法。
通过步骤(1)~(5)本文最终实现了SMRA_BRITS算法,并且将步骤(2)~(5)独立成算法用于评估新增功能对算法预测性能的提升以证明SMRA_BRITS算法的优势。
4、SMRA_BRITS算法程序的实现
SMRA_BRITS算法是基于SRITS_I算法、SBRITS_I、SMRA_RITS算法基础上完成的,本申请采用Pyhon语言实现数据处理及各算法编程。
(1)数据预处理程序的实现
图6是通信数据预处理程序的流程图。通信数据是时序化轨迹数据,其维度是3,分别是经度、维度和高度,待测轨迹总长度为T,样本长度为s0,则生成有关系样本个数为T-s0+1。本申请对单个样本进行标准化,所有样本分别按照自身数据完成数据标准化。在标准化数据基础上,对每个样本数据结构进行改造,按照遮蔽矩阵和时间间隔矩阵的定义公式,完成正向和反向矩阵的制作,最终输入到算法模型的数据是值矩阵、真实值遮蔽矩阵、未知值遮蔽矩阵和时间间隔矩阵。真实值遮蔽矩阵即被遮蔽的点是已知的,目的是用来测试算法精度的优劣,未知值遮蔽矩阵并不知道其真实值,只是由来完成插值预测功能。
(2)SRITS_I算法程序的实现
图7是SRITS_I算法实现的流程图。对于单向无关系算法SRITS_I算法,只考虑正向历史数据,损失函数分为待插值点相对误差或绝对误差以及各时序点上的标签误差,然后将两种误差加权求和并反向传播误差完成一次模型参数迭代运算,然后根据预设截止条件完成多次迭代后最终确定模型参数。本申请设置三种算法截止条件分别为训练次数、数据精度以及损失函数的梯度,默认为训练次数100次。
(3)SMRA_RITS算法程序的实现
图8是SMRA_RITS算法程序的流程图。与SRITS_I算法相比,增加了时间戳对应多维数据之间的耦合关系,目的是通过建立耦合关系增加待插值参数的预测精度。
(4)SBRITS_I算法程序的实现
图9是SBRITS_I算法程序的流程图。与SRITS_I算法相比,增加了反向样本数据,所以插值损失函数取正、反向的插值损失函数的均值。
(5)SMRA_BRITS算法程序的实现
图10是SMRA_BRITS算法程序的流程图。与SMRA_RITS算法相比,增加了反向样本数据,所以插值损失函数取正、反向的插值损失函数的均值。
实施例2
本申请的另一目的是提供一种轨迹复原监控系统,采用SMRA_BRITS算法进行轨迹数据处理得到复原轨迹;所述SMRA_BRITS算法包括前述的算法;
包括docker容器,所述docker容器获得基于时间戳上的原始观测值的多变量序列即轨迹数据,内置有SMRA_BRITS算法,进行轨迹数据处理得到复原轨迹,并传递至PC端以显示复原后的轨迹。
作为本申请改进的技术方案,所述轨迹数据来源于互联网,并被Oracle通信数据库存储;所述docker容器连接于所述Oracle通信数据库。
详述地,本申请通过Oracle通信数据库服务器、阿里云docker集成以及PC 端可视化监控界面的前后端设计,开发出轨迹复原的监控系统,监控系统框架如图1所示。
该监控框架具有如下技术特点。
(1)建立Oracle通信数据库用来存储数据,按照一备一用的模式,通过现有三大运营商的数据支持,完成数据同步。
(2)为了满足不同客户监控界面个性化功能定制,docker容器技术是最佳选 择,首先是其一次配置永久使用特点,软件被封装在docker镜像中,激活就可 使用,与容器外基础环境隔离,不受基础环境影响。其次是开发者针对不同用户 比如出租车司机、餐饮业老板、家庭用户等基于同一个镜像激活多个容器完成不 同用户的轨迹复原监控系统,这样既节省云平台成本又可以加快开发速度并简化 系统维护。
实施例3
(1)数据集简介
本申请采用GeoLife数据集模拟移动通信数据,该数据集共包含182人自 2007-2012年的共17,621轨迹。该数据集具体一个时序点上多维变量的个数为3 个,分别为经度、维度和高度,在182人中有69人带有行为标签包括走路、骑自行车、坐公交车、小汽车或出租车、火车、飞机以及其他共7类。本申请随机选取代号010的受测者的轨迹20080405112758.plt作为实施例A,选取轨迹 20081201003431.plt作为实施例B。
(2)环境配置
算法运行的硬件配置包括win10系统,i7-8550U CPU处理器,12G内存。软件环境包括python3.6,torch1.2.0+cpu。
(3)参数的设定
A实施例的训练的Epoch为100,B训练的Epoch为400,A、B的一次迭代所需的样本BATCH_SIZE为128,一个样本的长度L=32,多维变量维度D=3,隐藏层神经元个数RNN_HID_SIZE=64,α=1.0,β=0,学习率LEARNING_RATE 为0.1。所有样本的缺失率分别设定为10%、50%、90%,为了简化运算以及轨迹标签的限制,缺失率与真实数据值遮蔽矩阵随机空置率相等。
(4)A实施例
A缺失率为10%的插值前后的轨迹及误差图,如图11-14所示。同理可得缺失率为50%及90%相应的轨迹复原图及误差。从图中可以看出A轨迹平滑度好,所以在训练20个Epoch附近基本收敛,SMRA_BRITS算法性能最优,SRITS_I 算法性能相对最差,对于其余两种算法本文可以根据图表进一步确定性能大小关系,具体结果如表1所示。
表1 A不同缺失率的四个模型结果
MAE表示绝对平均误差,MRE表示相对平均误差。表1包含缺失率为10%,四种算法完成100个Epoch最终的相对误差和绝对误差,其实就是就是图13和图14最后结果,很明显四种算法的性能排序为SRITS_I算法 <SMRA_RITS<SBRITS_I<SMRA_BRITS。另外表1中还特别做了缺失率为90%的试验,试验结果表明通过采用缺失率自适应策略,解决了高缺失率多维耦合关系恶化预测性能的问题。从表1可以看出,高缺失率下SMRA_BRITS算法仍然最优。
(5)B实施例
B缺失率为10%的插值前后的轨迹图,如图15和图16所示。B轨迹同样是三维图且存在波峰、波谷平滑度非常差,常规插值方法处理非常困难。按照实例 A思路,本文同样可以得出四种算法排序仍然是SRITS_I算法 <SMRA_RITS<SBRITS_I<SMRA_BRITS。但其与实例A相比误差要大。
6.总体的图解
本申请的总体图解如图17所示。算法模型已经被封装在Docker镜像中,镜像及其系统等依赖一并上云,并根据业务需要激活成容器。容器之间彼此屏蔽,在容器内根据业务需要,增加前后端以实现轨迹显示、轨迹插值及预警等功能。容器1的受众群体是司机用户,算法提前绘制出潜在乘客轨迹图,司机可以提前预判乘客乘车点,减少乘客候车时间和空车时间,增加收入。容器2的受众群体是家庭用户,算法通过老人儿童手机信号可以定位老人儿童历史轨迹及预判不安全地域,及时将警报传送给家庭成员及社区管理人员,及时确定老人儿童地点。容器k受众群体是餐饮用户,算法可以提前预判餐饮用户所在区域的各时间点上的人流量,根据对应时间点上的人流量匹配服务人员数量及备货量,避免配置过度和配置不足带来的损失。容器n受众群体是追踪用户,算法可以根据目标手机信号恢复其历史轨迹及提前预知其移动路径,追踪人员可以有目的性搜查或提前布防。当然可以根据业务具体需要,生成具体容器。如果插值算法有更新,只需算法工程师对基础镜像进行更新封装,其余容器只需继承基础镜像功能即可,运维方便简洁,节约资源和成本。
Claims (10)
1.一种轨迹复原算法的模型建立方法,其特征在于,采用SMRA_BRITS算法预估缺失值得到,包括,
获取轨迹基于时间戳上的坐标的多变量序列X,X={x1,x2,...,xt...,xT};xt是第t个时间戳st对应的观测值,xt∈RD×1;t∈{1,2,...,T},T为大于0的正整数;
建立坐标多变量序列中的遮蔽矩阵m,m=[m1,...,mt,...,mT],其中mt为第t个序列点对应的遮蔽向量;D表示多维变量个数;
基于坐标缺失值的时间戳与上一次真实观测值对应时间戳的差值构建时间间隔矩阵δ,δ=[δ1,...,δt,...,δT],其中δt为第t个序列点对应的时间间隔向量,δt∈RD×1;
获取轨迹基于时间戳上的行为方式的标签序列ρ=[ρ1,...,ρt,...,ρT],ρt∈RC×1,ρt为第t个序列点标签值的One-Hot编码;标签的遮蔽矩阵n=[n1,...,nt,...,nT],nt∈R1×1;
通过坐标回归和标签分类损失函数加权和迭代更新确定坐标轨迹和行为方式标签的复原算法模型。
A∈RH×D,a∈RH×1,H表示单个时序点对应隐藏单元的个数;A,a初始值均由高斯分布抽样确定,模型训练不断迭代更新A,a,训练结束则A,a值最终确定;
Θ为矩阵取内积符号,“||”代表纵向拼接;
ht∈RH×1,表示第t个时序点对应的隐藏层输出状态,ht-1表示第t-1个时序点对应的隐藏层输出状态,默认初始值h0由高斯分布抽样确定;
ht,B,C,d初始值均由高斯分布抽样确定,模型训练不断迭代更新ht,B,C,d,训练结束,ht,B,C,d最终确定;
yt=cross_entropy(Pt,ρt),
Pt∈RC×1,ρt∈RC×1,nt∈R1×1,nt代表时序点t对应的标签遮蔽向量值,C为行为标签类别个数,Pt代表时序点t对应的每一种可能的行为标签的概率预测值;ρt代表该标签真实值或默认值的One-Hot编码;cross_entropy代表交叉熵函数;针对双向循环任意一个方向,m个顺序样本坐标损失函数与标签分类损失函数的加权损失函数为:
9.一种实现权利要求1-8任一所述的轨迹复原算法的模型建立方法的系统,其特征在于,
包括docker容器,所述docker容器获得基于时间戳上的原始观测值的多变量序列即轨迹数据,内置有SMRA_BRITS算法预估缺失值,进行轨迹数据处理得到复原轨迹,并传递至PC端以显示复原后的轨迹。
10.根据权利要求9所述的一种实现轨迹复原算法的模型建立方法的系统,其特征在于,所述轨迹数据来源于互联网,并被Oracle通信数据库存储;所述docker容器连接于所述Oracle通信数据库。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011540450.1A CN113190632B (zh) | 2020-12-23 | 2020-12-23 | 一种轨迹复原算法的模型建立方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011540450.1A CN113190632B (zh) | 2020-12-23 | 2020-12-23 | 一种轨迹复原算法的模型建立方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113190632A true CN113190632A (zh) | 2021-07-30 |
CN113190632B CN113190632B (zh) | 2023-08-15 |
Family
ID=76972654
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011540450.1A Active CN113190632B (zh) | 2020-12-23 | 2020-12-23 | 一种轨迹复原算法的模型建立方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113190632B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113822420A (zh) * | 2021-09-27 | 2021-12-21 | 闫鹏 | 基于容积二氧化碳图的死腔分数的模型建立方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110443288A (zh) * | 2019-07-19 | 2019-11-12 | 浙江大学城市学院 | 一种基于排序学习的轨迹相似性计算方法 |
US20200242446A1 (en) * | 2019-01-29 | 2020-07-30 | International Business Machines Corporation | Convolutional dynamic boltzmann machine for temporal event sequence |
CN111596366A (zh) * | 2020-06-24 | 2020-08-28 | 厦门大学 | 一种基于地震信号优化处理的波阻抗反演方法 |
CN112115550A (zh) * | 2020-09-13 | 2020-12-22 | 西北工业大学 | 基于Mogrifier-BiGRU的飞行器机动轨迹预测方法 |
-
2020
- 2020-12-23 CN CN202011540450.1A patent/CN113190632B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200242446A1 (en) * | 2019-01-29 | 2020-07-30 | International Business Machines Corporation | Convolutional dynamic boltzmann machine for temporal event sequence |
CN111488965A (zh) * | 2019-01-29 | 2020-08-04 | 国际商业机器公司 | 时间事件序列的卷积动态玻尔兹曼机 |
CN110443288A (zh) * | 2019-07-19 | 2019-11-12 | 浙江大学城市学院 | 一种基于排序学习的轨迹相似性计算方法 |
CN111596366A (zh) * | 2020-06-24 | 2020-08-28 | 厦门大学 | 一种基于地震信号优化处理的波阻抗反演方法 |
CN112115550A (zh) * | 2020-09-13 | 2020-12-22 | 西北工业大学 | 基于Mogrifier-BiGRU的飞行器机动轨迹预测方法 |
Non-Patent Citations (3)
Title |
---|
QIANLI MA等: "adversarial joint-learning recurrent neural network for incomplete time series classification", IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, vol. 44, no. 4, pages 1765 - 1776 * |
李劲松;易明俊;: "城市交通流量预测模型的研究", 微型电脑应用, vol. 36, no. 09, pages 92 - 96 * |
赖永炫;张璐;杨帆;卢卫;王田;: "基于时空相关属性模型的公交到站时间预测算法", 软件学报, vol. 31, no. 03, pages 648 - 662 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113822420A (zh) * | 2021-09-27 | 2021-12-21 | 闫鹏 | 基于容积二氧化碳图的死腔分数的模型建立方法及系统 |
CN113822420B (zh) * | 2021-09-27 | 2024-04-19 | 中国航天科工集团七三一医院 | 基于容积二氧化碳图的死腔分数的模型建立方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113190632B (zh) | 2023-08-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ma et al. | A hybrid CNN-LSTM model for aircraft 4D trajectory prediction | |
Choi et al. | TrajGAIL: Generating urban vehicle trajectories using generative adversarial imitation learning | |
Wu et al. | Quantifying uncertainty in deep spatiotemporal forecasting | |
US20210397926A1 (en) | Data representations and architectures, systems, and methods for multi-sensory fusion, computing, and cross-domain generalization | |
Choi et al. | Artificial neural network models for airport capacity prediction | |
Wu et al. | Long-term 4D trajectory prediction using generative adversarial networks | |
Saxena et al. | D-GAN: Deep generative adversarial nets for spatio-temporal prediction | |
KR102011788B1 (ko) | 계층적 시각 특징을 이용한 시각 질의 응답 장치 및 방법 | |
CN113518250A (zh) | 一种多媒体数据处理方法、装置、设备及可读存储介质 | |
Dai et al. | Spatio-temporal deep learning framework for traffic speed forecasting in IoT | |
CN116664719A (zh) | 一种图像重绘模型训练方法、图像重绘方法及装置 | |
Jia et al. | Attention-LSTM based prediction model for aircraft 4-D trajectory | |
CN114863348A (zh) | 基于自监督的视频目标分割方法 | |
Huang et al. | Aircraft trajectory prediction based on bayesian optimised temporal convolutional network–bidirectional gated recurrent unit hybrid neural network | |
CN113190632B (zh) | 一种轨迹复原算法的模型建立方法及系统 | |
CN112988851B (zh) | 反事实预测模型数据处理方法、装置、设备及存储介质 | |
Krauth et al. | Deep generative modelling of aircraft trajectories in terminal maneuvering areas | |
CN112261609B (zh) | 毫米波车联网资源分配方法、装置、电子设备及存储介质 | |
Hua et al. | Freeway traffic speed prediction under the intelligent driving environment: a deep learning approach | |
CN116523002A (zh) | 多源异构数据的动态图生成对抗网络轨迹预测方法和系统 | |
CN115937801A (zh) | 基于图卷积的车辆轨迹预测方法及装置 | |
CN115757828A (zh) | 一种基于辐射源知识图谱的空中目标意图识别方法 | |
Shao et al. | Self-aware trajectory prediction for safe autonomous driving | |
CN117273182A (zh) | 参数预测方法、预测服务器、预测系统及电子设备 | |
Xu et al. | A dt machine learning-based satellite orbit prediction for iot applications |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |