CN113190632A

CN113190632A - 一种轨迹复原算法的模型建立方法及系统

Info

Publication number: CN113190632A
Application number: CN202011540450.1A
Authority: CN
Inventors: 陈虎; 涂燕晖; 姚振杰; 陈一昕
Original assignee: Nanjing Future Networks Innovation Co ltd
Current assignee: Nanjing Future Networks Innovation Co ltd
Priority date: 2020-12-23
Filing date: 2020-12-23
Publication date: 2021-07-30
Anticipated expiration: 2040-12-23
Also published as: CN113190632B

Abstract

本发明属于轨迹复原领域，具体涉及一种轨迹复原算法的模型建立方法及系统，包括，获取轨迹基于时间戳上的坐标多变量序列；建立坐标多维变量的遮蔽矩阵，构建时间间隔矩阵；建立基于某个变量历史数据之间的关系，建立基于坐标多维变量之间耦合关系，以及得到的融合后数据

同时还包括获取轨迹基于时间戳上的行为方式的标签序列，建立标签的遮蔽矩阵；根据坐标的遮蔽矩阵、坐标的多变量序列、融合后数据

标签遮蔽矩阵以及标签序列建立坐标的预测值

和缺失标签的计算方法；通过坐标回归和标签分类损失函数加权和迭代更新确定坐标轨迹和行为方式标签的复原算法模型。模型训练采用有序样本输入有效解决有关系样本的轨迹复原问题。

Description

一种轨迹复原算法的模型建立方法及系统

技术领域

本发明属于轨迹复原领域，具体涉及一种轨迹复原算法的模型建立方法及系统。

背景技术

(1)当前通信数据库和云平台已经接轨，依据手机信号的实时定位技术已经开始商用，相关app已经投放在安卓下载平台，应用的前提是需要被测手机授权。

(2)云平台可以个性化定制操作系统、GPU以及应用软件等，阿里、腾讯、华为已经可以提供相应服务，客户可根据项目需要进行二次开发。

(3)在谈及轨迹算法之前，本文需要了解当前通信数据所受的制约。随着5G 商用化加快，公民手机及穿戴设备都可作为移动终端，海量的人员轨迹数据随之急剧增长，但受制于公民自我开关设备、区域禁用通信设备、信号采集周期过长以及通信设备本身故障等原因导致无法精确定位公民位置更无法确定公民行为。

(4)轨迹属于时序化数据的范畴，克服(3)中制约限制实质就是解决时序化插值的问题。D.M.Kreindler and C.J.Lumsden.The effects of the irregular sample andmissing data in time series analysis.Nonlinear Dynamical Systems Analysis forthe Behavioral Sciences Using Real Data,page 135,2012.Kreindler等假设数据是平滑的，在缺失值所在的时空区间上没有突然的波动，然后按照最近邻原则完成插值。显然这种假设已经大大降低模型泛化能力，一旦待插值数据平滑度不够，算法模型性能大幅降低甚至无法应用。

(5)H.-F.Yu,N.Rao,and I.S.Dhillon.Temporal regularized matrixfactorization for highdimensional time series prediction.In Advances inneural information processing systems,pages 847–855,2016.Yu等利用具有时间正则化的矩阵因式分解在定期采样的时间序列数据中计算缺失的值，但通常矩阵分解适用于静态数据，并且事先需假设矩阵具有较低的秩以降低计算负荷。但申请人在实际应用中容易发现，该方法的数据量与矩阵秩大小的平法成正比，应用范围十分受限，并且受静态数据的限制更是很难完成诸如天气、温度、实时轨迹等动态数据插值的预测。

(6)Che,Z.,Purushotham,S.,Cho,K.,Sontag,D.,&Liu,Y.(2018).RecurrentNeural Networks for Multivariate Time Series with Missing Values.ScientificReports, 8(1).doi:10.1038/s41598-018-24271-9.Che等将遮蔽矩阵及时间间隔矩阵也作为输入数据送入模型并且引入隐藏状态衰减项和输入衰减项以提高预测精度。但该方法并未对高缺失率(比如缺失率为90％)进行算法优劣试验，作者提供输入衰减项就是用来建立多变量之间关系，当缺失率过高，多变量之间建立错误的关系成为主导，当该关系被应用于模型不仅没有提高预测精度反而可能恶化模型的预测性能，所以作者得出GRU-D性能最优的结论需要给出缺失率上限值。

(7)W.Cao,D.Wang,J.Li,H.Zhou,L.Li,Y.Li,BRITS:Bidirectional recurrentimputation for time series,in:Adv.Neural Inf.Process.Syst.31,2018,pp.6774–6784.Cao等与(6)主体思路一致，都是数据驱动模型且完全抛开(4)及(5)等的事先假设，并且将天气质量数据、MIMIC数据及人类活动数据纳入训练和测试。但该算法同样没有解决高缺失率时最优算法是否还是BRIS模型的问题。申请人对其算法在缺失率达90％时测试发现，其算法性能排序为 RITS<BRIS<BRIS_I<RIS_I，BRIS模型性能只排倒数第二并非正数第一。另外该论文将天气质量数据纳入该算法适用范畴是不够严谨的，因为天气质量的样本之间存在关系，该算法没有体现出如何解决有关系样本的解决方案，实际上轨迹就是有关系样本。

发明内容

本申请提供一种轨迹复原算法的模型建立方法及系统，其有效解决有关系样本的轨迹复原问题。

为实现上述技术目的，本申请采取的技术方案为，一种轨迹复原算法的模型建立方法，采用SMRA_BRITS算法预估缺失值得到，包括，

获取轨迹基于时间戳上的原始观测值的多变量序列X，X＝{x₁,x₂...,x_T}；x_t是第t个时间戳s_t对应的观测值，x_t∈R^D×1；t∈{1,2,...,T}，T为大于0的正整数；

建立多变量序列中缺失值的遮蔽矩阵m，m＝[m₁,...,m_t,...,m_T]，其中m_t为第 t个序列点对应的遮蔽向量；D表示多维变量个数；

基于缺失值的时间戳与上一次真实观测值对应时间戳的差值构建时间间隔矩阵δ，δ＝[δ₁,...,δ_t,...,δ_T]，其中δ_t为第t个序列点对应的时间间隔向量，δ_t∈R^D×1；

建立基于某个变量历史数据之间的关系得到数值

以及建立基于多维变量之间耦合关系得到的数值

以及融合

与

得到的融合后数据

根据遮蔽矩阵m、原始观测值的多变量序列X以及融合后数据

建立缺失值的预测值

计算方法；

通过收敛与回归得到轨迹复原算法模型。

作为本申请改进的技术方案，基于某个变量历史数据之间关系得到的数值

包括，

根据时间间隔矩阵δ建立输出端衰减函数；输出端衰减函数

A∈R^H×D，a∈R^H×1，H表示单个时序点对应隐藏单元的个数；A,a初始值均由高斯分布抽样确定，模型训练不断迭代更新A,a，训练结束则A,a值最终确定；

并根据输出端衰减函数构建模型的隐藏状态函数h_t，

Θ为矩阵取内积符号，“||”代表纵向拼接；

h_t∈R^H×1，表示第t个时序点对应的隐藏层输出状态，h_t-1表示第t-1个时序点对应的隐藏层输出状态，默认初始值h₀由高斯分布抽样确定；

B∈R^H×H，m_t∈R^D×1，

C∈R^H×2D，d∈R^H×1，σ为sigmoid激活函数；

h_t,B,C,d初始值均由高斯分布抽样确定，模型训练不断迭代更新h_t,B,C,d，训练结束，h_t,B,C,d最终确定；

实现输出基于某个变量历史数据之间关系得到的数值

x_t∈R^D×1,

作为本申请改进的技术方案，计算出融合后的数据

包括，

根据时间间隔矩阵建立输入端衰减函数

输入端衰减函数为

E∈R^D×D，e∈R^D×1，E,e初始值均由高斯分布抽样确定，模型训练不断迭代更新E,e，训练结束则E,e值最终确定；

通过该输入端衰减函数构建数值

与数值

的融合系数β_t，

β_t∈R^D×1，β_t中每个元素的值介于0～1，含端点；

F∈R^D×2D，f∈R^D×1，F,f初始值均由高斯分布抽样确定，模型训练不断迭代更新F,f，训练结束则F,f值最终确定；

同时根据

计算出融合后的数据

作为本申请改进的技术方案，根据坐标遮蔽矩阵m、坐标的多变量序列X以及融合后数据

建立缺失值的预测值

计算方法是采用如下算法进行的：

作为本申请改进的技术方案，基于某个变量历史数据之间的关系得到数值

包括：

其中，W_x∈R^D×H,b_x∈R^D×1；W_x,b_x初始值均由高斯分布抽样确定，模型训练不断迭代更新W_x,b_x，训练结束则W_x,b_x值最终确定。

作为本申请改进的技术方案，建立基于多维变量之间耦合关系得到的数值

式中，

其中，R_z∈R^D×D，0≤p≤1，p初始值为 0；

W_z,b_z初始值为高斯分布抽样取值，模型训练不断迭代更新W_z,b_z,p，训练结束则W_z,b_z,p值最终确定；

其中，w_i,j是W_z中的一个元素，W_z∈R^D×D，当i≠j，w_i,j表示第j个变量对第 i个变量的影响系数；当i＝j，w_i,j取值为0。

作为本申请改进的技术方案，该算法属于双向循环神经网络，对于任意一个方向，样本长度为L的单个样本的坐标回归损失函数

为：

样本长度为L的单个样本的标签分类损失函数

为：

y_t＝cross_entropy(P_t,ρ_t)，

P_t∈R^C×1，ρ_t∈R^C×1，n_t∈R^1×1，n_t代表时序点t对应的标签遮蔽向量值，C为行为标签类别个数，P_t代表时序点t对应的每一种可能的行为标签的概率预测值。ρ_t代表该标签真实值或默认值的One-Hot编码。cross_entropy代表交叉熵函数。针对该算法任意一个方向，m个顺序样本坐标损失函数与标签分类损失函数的加权损失函数

为：

其中α,β分别代表轨迹定位和回归占损失函数的权重，

表示第k个样本轨迹坐标回归的损失函数，

表示第k个样本L个时序点标签分类的损失函数。

作为本申请改进的技术方案，融合该算法正反两个方向的损失函数为：

L_C代表该算法正反方向融合后的损失函数，

为该算法正向的损失函数，

为该算法反向的损失函数。

本申请的另一目的是提供一种轨迹复原监控系统，包括docker容器，所述 docker容器获得基于时间戳上的原始观测值的多变量序列即轨迹数据，内置有SMRA_BRITS算法预估缺失值，进行轨迹数据处理得到复原轨迹，并传递至PC 端以显示复原后的轨迹。

进一步地，所述轨迹数据来源于互联网，并被Oracle通信数据库存储；所述docker容器连接于所述Oracle通信数据库。

有益效果

(1)本申请设计了双向循环神经网络直接预测缺失值(包括位置缺失和行为标签缺失)，无需事先假设数据分布等即可完成插值，模型泛化能力大幅增强。

(2)本申请将位置缺失的数据看成变量并参与算法后向传播通过迭代恢复缺失数据，并且在LSTM隐藏层及输入层设置衰减单元。目的是尽可能记住上一次实际观测值。因为对于本次缺失值预测影响最大的是上一次实际观测值，所以通过衰减单元赋予其较高权重，这样模型预测性能得到明显提高。

(3)本申请在同一个神经网络图谱中，同时完成缺失值的插值以及模型回归和分类。以往对存在缺失值的回归和分类分析中，很多学者将其分为二阶段即先通过最近邻、均值或神经网络算法等完成插值，然后将插值后的数据送入回归和分类模型。而本申请算法模型在一个阶段内就可同时完成上述二阶段的任务。

(4)针对有关系样本数据，本申请将前一个样本的输出状态及记忆状态作为初始值输入到紧邻样本对应的状态中，明显提高预测性能，且曲线平滑度更好。

(5)本申请同样建立了多维变量之间的关系，并且采用缺失率自适应策略。该策略就是赋予多维变量有关系和无关系各自权重，权重和为1，通过模型训练自动学习各自权重。最终实现无论缺失率为多少，SMRA_BRITS算法性能始终最优。

附图说明

图1为监控系统框架图。

图2为x_t,

之间关系图。

图3为带有缺失值的多维数据示例图；

图中：estimated variable:预估的变量；

regression layer:缺失值及观测值的回归预测层；

recurrent layer:循环迭代层；

complement variable:插值后的变量；

Input value:输入值；

Missing Values:缺失值。

图4为LSTM网络结构图；

图中，Tanh：正切激活函数。

图5为LSTM网络衰减单元定位示意图；

图中，Hidden state decay term:隐藏层衰减单元；

Input decay term:输入层衰减单元；

MASK(m):遮蔽矩阵m；

IN(x):观测值x输入；

OUT(h):隐藏状态输出。

图6为通信数据预处理程序的流程图。

图7为SRITS_I算法实现的流程图。

图8为SBRITS_I算法程序的流程图

图9为SMRA_RITS算法程序的流程图。

图10为SMRA_BRITS算法程序的流程图。

图11为A缺失率为10％的插值前后的轨迹图原始图。

图12为A缺失率为10％的插值前后的轨迹图的插值图。

图13为A缺失率为10％的插值前后的绝对误差图。

图14为A缺失率为10％的插值前后的相对误差图。

图15为B缺失率为10％的插值前后的轨迹图原始图。

图16为B缺失率为10％的插值前后的轨迹图插值图。

图17为总体图解。

具体实施方式

只有解决了通信数据轨迹插值问题，基于移动通信数据云平台的轨迹复原监控系统才能真正建立，通信数据的价值比如轨迹复原的商用和非商用价值才能最大化。

(1)商用价值方面：首先是在交通运输行业，比如出租车行业可以提前知道市内公民轨迹和交通模式，最优化资源分配以达到最小空车率和最小用户等待时间，同理公交、地铁、飞机等交通运输可以依据人员历史通信轨迹数据提前做好资源分配。其次是餐饮、旅游、住宿行业，根据人员历史轨迹数据，预测出顾客的饮食、旅游以及住宿的喜恶类别、驻留时间和消费水平，以规划城市、景区布局，提前调控交通运输并最大限度增收避免资源浪费。最后是个性化服务行业，通信轨迹不再局限于人，凡是具有通信数据收发功能的载体及其附属物都可以享有此服务，不仅老人、儿童可以定制轨迹追踪和预警功能，手机、电脑、保险箱、车辆等等都可以外接或内置通信设备享受轨迹追踪和预警服务。

(2)非商用价值方面：首先是公卫方面，可根据算法对目标精确定位确认出第一梯队目标接触者，通过目标接触者移动数据继续延伸查找下一级目标接触者。其次是刑侦方面，只要确定目标的移动数据完全可以对其详细轨迹进行恢复以及未来轨迹进行预测，沿途提前做好搜查准备或布防。

特别说明，本文中未特别交代的参数均为模型训练过程中得到的参数，且模型训练过程中的初始值均为人为设定值。

为了更加精准的复原轨迹，本申请提出的一种轨迹复原算法的模型建立方法，采用SMRA_BRITS算法预估缺失值得到，包括，

获取轨迹基于时间戳上的原始观测值的多变量序列X， X＝{x₁,x₂,...,x_t...,x_T}；x_t是第t个时间戳s_t对应的观测值；t∈{1,2,...,T}，T为大于0的正整数；

建立多变量序列中缺失值的遮蔽矩阵m，m＝[m₁,...,m_t,...,m_T]，其中m_t为第 t个序列点对应的遮蔽向量，m_t∈R^D×1；D表示多维变量个数；

建立基于某个变量历史数据之间的关系得到数值

以及建立基于多维变量之间耦合关系得到的数值

以及融合

与

得到的融合后数据

根据遮蔽矩阵m、原始观测值的多变量序列X以及融合后数据

建立缺失值的预测值

计算方法；

通过收敛与回归得到轨迹复原算法模型。

包括，

根据时间间隔矩阵δ建立输出端衰减函数；输出端衰减函数

并根据输出端衰减函数构建模型的隐藏状态函数

Θ为矩阵取内积符号，“||”代表纵向拼接；

h_t∈R^H×1，表示第t个时序点对应的隐藏状态，h_t-1∈R^H×1，表示第t-1个时序点对应的隐藏状态，默认初始值h₀由高斯分布抽样确定；

B∈R^H×H，m_t∈R^D×1，

C∈R^H×2D，d∈R^H×1，σ为sigmoid激活函数；

实现输出基于某个变量历史数据之间关系得到的数值

x_t∈R^D×1,

作为本申请改进的技术方案，计算出融合后的数据

包括，

根据时间间隔矩阵建立输入端衰减函数

输入端衰减函数为

通过该输入端衰减函数构建数值

与数值

的融合系数β_t，

β_t∈R^D×1，β_t中每个元素的值介于0～1，含端点；

同时根据

计算出融合后的数据

作为本申请改进的技术方案，根据遮蔽矩阵m、原始观测值的多变量序列X 以及融合后数据

建立缺失值的预测值

计算方法是采用如下算法进行的：

包括：

式中，

其中，R_z∈R^D×D，0≤p≤1，p初始值为 0；

为：

样本长度为L的单个样本的标签分类损失函数

为：

y_t＝cross_entropy(P_t,ρ_t)，

P_t∈R^C×1，ρ_t∈R^C×1，n_t∈R^1×1，n_t代表时序点t对应的标签遮蔽向量值，C为行为标签类别个数，P_t代表时序点t对应的每一种可能的行为标签的概率预测值。ρ_t代表该标签真实值或默认值的One-Hot编码；cross_entropy代表交叉熵函数。针对该算法任意一个方向，m个顺序样本坐标损失函数与标签分类损失函数的加权损失函数

为：

其中α,β分别代表轨迹定位和回归占损失函数的权重，

表示第k个样本轨迹坐标回归的损失函数，

表示第k个样本L个时序点标签分类的损失函数。

L_C代表该算法正反方向融合后的损失函数，

为该算法正向的损失函数，

为该算法反向的损失函数。

本申请的另一目的是提供一种轨迹复原监控系统，采用SMRA_BRITS算法进行轨迹数据处理得到复原轨迹；所述SMRA_BRITS算法包括权利要求1－6 任一所述的算法；

包括docker容器，所述docker容器获得基于时间戳上的原始观测值的多变量序列即轨迹数据，内置有SMRA_BRITS算法，进行轨迹数据处理得到复原轨迹，并传递至PC端以显示复原后的轨迹。

详述地，本申请提出SMRA_BRITS算法作为一种轨迹复原算法的模型建立方法，即样本有关系及缺失率自适应的双向循环时序化数据插值算法 (Sample-related andMissing Rate Adaptive Bidirectional Recurrent Imputation for Time Series)。本申请一种轨迹复原算法的模型建立方法的整体设计原理如下：

SMRA_BRITS算法实现

步骤(2)、(3)、(4)、(5)是SMRA_BRITS算法功能逐步完善的过程，为了比较新增功能对算法预测性能影响，本文会对各步骤新增功能后独立成为一种算法，将各算法在同一个数据集上进行训练和测试，以证明SMRA_BRITS算法优势。

(1)变量自定义

本文定义一个轨迹的坐标多变量序列X＝{x₁,x₂...,x_t,...x_T}作为观测值序列，时序点个数为T。第t个序列点的坐标观测值集合x_t∈R^D×1，观测值变量个数为D (即多维变量的个数)。

表示第t个序列点的第d个变量值。x_t对应的时间戳用s_t表示。需要特别说明的是s_t之间的时间间隔并不是相同的。正如背景技术的(3)所述，x_t很可能存在缺失值，因此本文引入坐标遮蔽矩阵m＝[m₁,...,m_t,...,m_T]，其中m_t为第t个序列点对应的遮蔽向量，m_t∈R^D×1，即m_t为D行1列向量。使用

表示m_t中的第d个变量的遮蔽值，其表达式如公式(1)所示。

许多实际场景中出现连续多个缺失值的情形，所以需要构建衰减单元，因此本文引入坐标时间间隔矩阵δ＝[δ₁,...,δ_t,...,δ_T]，其中δ_t为第t个序列点对应的时间间隔向量，δ_t∈R^D×1，衰减单元的重要输入参数就是δ_t。使用

表示时间间隔矩阵δ_t的第d个变量的时间间隔值，具体表达式如公式(2)所示。

上述x_t,

之间关系的图解说明如图2所示。由图2可以看出x₁,...,x₆对应的时间戳s₁,...,s₆分别为0，2，7，9，14，15，对应的遮蔽向量为m₁,...,m₆，对应的时间间隔向量为δ₁,...,δ₆。现在考察

根据定义，

对应的缺失值

的上一次真实观测到的值是

其时间戳之差

同理可得其余

值。

(2)建立正向循环神经网络

建立正循环神经网络是暂不考虑多维变量之间的关系，即不考虑时序点之间关系，但考虑单个时序点上多维变量之间关系，本文将其定义为SRITS_I算法，公式(10)、(11)的结果以及SRITS_I算法简单示意已经反应在图3中。

该图是一个样本数据，需要特别说明的是该图的输入来自上一次紧邻的样本的的输出，并且该图样本的输出要作为下一个样本的输入，所有样本按照测试人活动方向截取制作，训练和测试也必须按顺序进行，对于无关系样本没有上述限制也无需进行样本状态接力。

SRITS_I算法实质上是循环神经网络(RNN)的经典变体之一长短记忆网络 (LSTM)的改进，LSTM网络如图4所示。

LSTM是靠“门”的结构让信息有选择性地影响RNN每个点的状态。LSTM 隐藏状态函数h_t如公式(3)所示。

h_t＝σ(Bh_t-1+Cx_t+d) (3)

上式σ为sigmoid函数，h_t-1,B,C,d初始值均由高斯分布抽样确定。

SRITS_I算法对LSTM的输入数据x_t及输出状态h_t-1进行改造，具体公式如下：

由公式(3)与(7)可以看出输入数据x_t被改造成

||m_t，“||”代表纵向拼接，

是时间戳s_t对应真实观测值m_tΘx_t以及缺失值的预测结果

的矩阵之和。由公式(3)与(7)还可以看出h_t-1被改造成

Θ代表矩阵点乘，

为时间戳s_t对应的衰减单元，公式(6)显示

是δ_t减函数。正常来说，δ_t越大，h_t-1受长时间缺失值的影响，包含的错误信息就越大，那么h_t也相应失真，为了削弱h_t-1错误信息影响，引入衰减单元

δ_t越大，相应的h_t-1Θγ_t也减小，比如h_t-1Θγ_t减小到0，则公式(6)变为

隐藏状态h_t输出只受

||m_t影响，避免了失真。由于h_t削弱了失真，相对容易收敛到准确值，那么模型收敛速度也会加快。

在网络结构中具体位置如图3所示。公式(8)代表第t个时间序列对应的轨迹坐标损失函数

具体为

是

中的第d个元素；

则包含L个时间戳的单个样本轨迹坐标的损失函数

如公式(9)所示。

本文不仅有公式(9)回归的预测还有各时序点上行为方式的预测，本申请以交通方式为例，每个时序点上的交通方式可能为走路、骑自行车、坐公交车、小汽车或出租车、火车、飞机以及其他这7类中的一种。每个样本总共包含L个时序点，我们定义标签的遮蔽矩阵n,n∈R^L×1如公式(10)所示。

对于标签缺失的时序点默认初始值标签值为“其他”，在模型训练过程中进行迭代更新。使用One-Hot编码对7种交通方式编码结果如公式(11)所示。

公式(11)中，标签“走路”对应[1,0,0,0,0,0,0]^T，“骑自行车”对应[0,1,0,0,0,0,0]^T，其余标签以此类推。第t个时序点对应的输出Y_t如公式12所示。

Y_t＝Gh_t+g (12)

Y_t∈R^C×1,G∈R^C×H,g∈R^C×1，G,g初始值为高斯分布抽样确定，模型训练迭代更新G,g。C表示交通方式类型的个数，本申请C＝7。使用softmax函数将Y_t的值映射到0-1之间的概率值，输出时序点t上的各可能交通方式的概率取值P_t如公式(13)所示。

P_t＝softmax(Y_t) (13)

P_t∈R^C×1，将P_t,ρ_t输入到交叉熵损失函数cross_entropy就得到了时序点t对应的标签分类损失函数y_t如公式(14)所示。

y_t＝cross_entropy(P_t,ρ_t) (14)

ρ_t∈R^C×1，ρ_t表示时序点t对应的标签One-Hot编码向量，则包含L个时序点的单个样本标签分类损失函数

如公式(15)所示。

L表示单个样本包含时序点的个数。则m个样本的损失函数

如公式(16) 所示。

其中α,β分别代表轨迹定位和回归占损失函数的权重，

表示第k个样本轨迹坐标回归的损失函数，

表示第k个样本L个时序点标签分类的损失函数。当只关注定位时可以设置α＝1,β＝0，两者都关注时可以分别赋予0～1之间的权重。

(3)增加多维变量之间耦合关系

在步骤(2)基础上，将多维变量之间的关系考虑在内，即不仅要考虑时序点之间关系，还要考虑单个时序点上多维变量之间关系，但同时要妥善处理缺失率。缺失率较小，建立多维变量正确耦合关系大于错误耦合关系的影响，模型的性能仍然是提高的，当缺失率超过阈值，错误耦合关系超过正确耦合关系的影响，模型的性能很可能变得很低，因此本文在步骤(2)基础上做了三个方面的功能提升，本文把提升后的算法叫做SMRA_RITS算法。第一个提升是增加了输入端的衰减单元，具体位置如图5所示，右侧圆圈内的衰减单元即为新增输入端衰减单元，隐藏层的输出衰减单元以及输入端衰减单元都是为了加快收敛提高模型预测性能。

新增输入端衰减单元

如公式(17)所示。

E∈R^D×D，e∈R^D×1，E,e初始值均由高斯分布抽样确定。

SMRA_RITS算法第二个提升是增加多维变量之间的耦合关系，为此构建对角全部为0的矩阵W_z如式(18)所示。

其中w_i,j是W_z中的一个元素，W_z∈R^D×D，当i≠j，w_i,j表示第j个变量对第i个变量的影响系数；当i＝j，w_i,j取值为0。

那么仅根据多维变量之间关联性得到插值后的值

其表达式如式(19)所示。

W_z,b_z初始值均由高斯分布抽样确定，在模型训练中迭代更新。

SMRA_RITS算法第三个提升是引进缺失率矩阵R_z其表达如式(20)所示。

0≤p≤1，将R_z带入公式(19)并改进得公式(21)。

W_z对角线为0的数据代表无关联，非对角线数据代表有关联。当缺失率较小则模型自主学习得到的p值变小，1-p值变大，则多变量之间耦合关系的权重得到增强，当缺失率变大则模型自主学习得到p值变大，1-p值变小，则多变量之间耦合关系的权重得到削减，如此算法模型可以避开高缺失率导致多变量耦合导致模型性能恶化的影响。

是从多维变量之间耦合关系角度得到数值，可以称为纵向角度，本文还要兼顾具体某个变量历史数据，可以称为横向角度。所以必须要进行纵横角度的融合，因此本文使用β_t作为纵向数据

与横向数据

的融合系数，其中，β_t中的每个元素的取值介于0～1,含端值；其表达式如式(22)所示。

F∈R^D×2D，f∈R^D×1，F,f初始值均由高斯分布抽样确定。纵、横数据融合成数据

其表达式如式(23)所示。

与SRITS_I算法的公式(5)、(7)原理相同，可以通过公式(24)-(25)计算出时间戳s_t对应的预测值

及隐藏层的状态输出h_t。

式中B,C,d初始值均由高斯分布抽样确定。为了加快收敛速度提高预测精度，需对公式(9)改进，改进后的结果如公式(26)所示。

公式(26)的目的是迫使x_t分别与

保持一致以加快收敛。则包含L个时间戳的单个样本轨迹坐标的损失函数

如公式(27)所示。

由于步骤(3)的标签分类损失函数与步骤(2)完全相同，所以最终得到m个样本的损失函数

如公式(28)所示。

其中α,β分别代表轨迹定位和回归占损失函数的权重，

表示第k个样本轨迹坐标回归的损失函数，

(4)增加反向循环神经网络不考虑多维关系

步骤(2)是单向循环神经网络，那么缺失值被迭代插值后与理论值构成的误差必须沿着正方向延迟到下一个实际观测值的出现，然后通过损失函数

对该实测值误差进行后向传播以实现缺失值逐步收敛的目的。正如图3所示，

内缺失值的迭代误差直到实际观测值x₈的出现才能得到收敛。这种误差延迟收敛的弊端会造成收敛很慢，很可能导致模型训练不充分。为了加快收敛速度提高模型预测性能，本文在步骤(2)基础上增加反向循环神经网络，本文将其定义为 SBRITS_I算法，本质上是LSTM衍生算法在正反方向的叠加，缺失值的延迟误差在两个方向上完成误差的反向传播，大大提高收敛速度，而且受到来自正反两个实测值的信息的制约，其预测准确度更高。增加反向循环神经网络后，其损失函数就是正、反方向损失函数的均值，具体计算如公式(29)所示。

L_C代表双向循环神经网络的损失函数，

为正向循环神经网络的损失函数，

为正向循环神经网络的损失函数。

(5)增加反向循环神经网络考虑多维关系

本文可以在步骤(4)基础上将考虑多维变量关系或者在步骤(3)基础上增加反向循环神经网络得到SMRA_BRITS算法。在这里本文选择在步骤(3)基础上实现 SMRA_BRITS算法，只要将步骤(3)对应的SMRA_RITS算法在正反方便叠加，损失函数取均值即可完成SMRA_BRITS算法。

通过步骤(1)～(5)本文最终实现了SMRA_BRITS算法，并且将步骤(2)～(5)独立成算法用于评估新增功能对算法预测性能的提升以证明SMRA_BRITS算法的优势。

4、SMRA_BRITS算法程序的实现

SMRA_BRITS算法是基于SRITS_I算法、SBRITS_I、SMRA_RITS算法基础上完成的，本申请采用Pyhon语言实现数据处理及各算法编程。

(1)数据预处理程序的实现

图6是通信数据预处理程序的流程图。通信数据是时序化轨迹数据，其维度是3，分别是经度、维度和高度，待测轨迹总长度为T，样本长度为s0，则生成有关系样本个数为T-s0+1。本申请对单个样本进行标准化，所有样本分别按照自身数据完成数据标准化。在标准化数据基础上，对每个样本数据结构进行改造，按照遮蔽矩阵和时间间隔矩阵的定义公式，完成正向和反向矩阵的制作，最终输入到算法模型的数据是值矩阵、真实值遮蔽矩阵、未知值遮蔽矩阵和时间间隔矩阵。真实值遮蔽矩阵即被遮蔽的点是已知的，目的是用来测试算法精度的优劣，未知值遮蔽矩阵并不知道其真实值，只是由来完成插值预测功能。

(2)SRITS_I算法程序的实现

图7是SRITS_I算法实现的流程图。对于单向无关系算法SRITS_I算法，只考虑正向历史数据，损失函数分为待插值点相对误差或绝对误差以及各时序点上的标签误差，然后将两种误差加权求和并反向传播误差完成一次模型参数迭代运算，然后根据预设截止条件完成多次迭代后最终确定模型参数。本申请设置三种算法截止条件分别为训练次数、数据精度以及损失函数的梯度，默认为训练次数100次。

(3)SMRA_RITS算法程序的实现

图8是SMRA_RITS算法程序的流程图。与SRITS_I算法相比，增加了时间戳对应多维数据之间的耦合关系，目的是通过建立耦合关系增加待插值参数的预测精度。

(4)SBRITS_I算法程序的实现

图9是SBRITS_I算法程序的流程图。与SRITS_I算法相比，增加了反向样本数据，所以插值损失函数取正、反向的插值损失函数的均值。

(5)SMRA_BRITS算法程序的实现

图10是SMRA_BRITS算法程序的流程图。与SMRA_RITS算法相比，增加了反向样本数据，所以插值损失函数取正、反向的插值损失函数的均值。

实施例2

本申请的另一目的是提供一种轨迹复原监控系统，采用SMRA_BRITS算法进行轨迹数据处理得到复原轨迹；所述SMRA_BRITS算法包括前述的算法；

作为本申请改进的技术方案，所述轨迹数据来源于互联网，并被Oracle通信数据库存储；所述docker容器连接于所述Oracle通信数据库。

详述地，本申请通过Oracle通信数据库服务器、阿里云docker集成以及PC 端可视化监控界面的前后端设计，开发出轨迹复原的监控系统，监控系统框架如图1所示。

该监控框架具有如下技术特点。

(1)建立Oracle通信数据库用来存储数据，按照一备一用的模式，通过现有三大运营商的数据支持，完成数据同步。

(2)为了满足不同客户监控界面个性化功能定制，docker容器技术是最佳选择，首先是其一次配置永久使用特点，软件被封装在docker镜像中，激活就可使用，与容器外基础环境隔离，不受基础环境影响。其次是开发者针对不同用户比如出租车司机、餐饮业老板、家庭用户等基于同一个镜像激活多个容器完成不同用户的轨迹复原监控系统，这样既节省云平台成本又可以加快开发速度并简化系统维护。

实施例3

(1)数据集简介

本申请采用GeoLife数据集模拟移动通信数据，该数据集共包含182人自 2007-2012年的共17,621轨迹。该数据集具体一个时序点上多维变量的个数为3 个，分别为经度、维度和高度，在182人中有69人带有行为标签包括走路、骑自行车、坐公交车、小汽车或出租车、火车、飞机以及其他共7类。本申请随机选取代号010的受测者的轨迹20080405112758.plt作为实施例A，选取轨迹 20081201003431.plt作为实施例B。

(2)环境配置

算法运行的硬件配置包括win10系统，i7-8550U CPU处理器，12G内存。软件环境包括python3.6，torch1.2.0+cpu。

(3)参数的设定

A实施例的训练的Epoch为100，B训练的Epoch为400，A、B的一次迭代所需的样本BATCH_SIZE为128，一个样本的长度L＝32，多维变量维度D＝3，隐藏层神经元个数RNN_HID_SIZE＝64，α＝1.0,β＝0，学习率LEARNING_RATE 为0.1。所有样本的缺失率分别设定为10％、50％、90％，为了简化运算以及轨迹标签的限制，缺失率与真实数据值遮蔽矩阵随机空置率相等。

(4)A实施例

A缺失率为10％的插值前后的轨迹及误差图，如图11-14所示。同理可得缺失率为50％及90％相应的轨迹复原图及误差。从图中可以看出A轨迹平滑度好，所以在训练20个Epoch附近基本收敛，SMRA_BRITS算法性能最优，SRITS_I 算法性能相对最差，对于其余两种算法本文可以根据图表进一步确定性能大小关系，具体结果如表1所示。

表1 A不同缺失率的四个模型结果

MAE表示绝对平均误差，MRE表示相对平均误差。表1包含缺失率为10％，四种算法完成100个Epoch最终的相对误差和绝对误差，其实就是就是图13和图14最后结果，很明显四种算法的性能排序为SRITS_I算法 <SMRA_RITS<SBRITS_I<SMRA_BRITS。另外表1中还特别做了缺失率为90％的试验，试验结果表明通过采用缺失率自适应策略，解决了高缺失率多维耦合关系恶化预测性能的问题。从表1可以看出，高缺失率下SMRA_BRITS算法仍然最优。

(5)B实施例

B缺失率为10％的插值前后的轨迹图，如图15和图16所示。B轨迹同样是三维图且存在波峰、波谷平滑度非常差，常规插值方法处理非常困难。按照实例 A思路，本文同样可以得出四种算法排序仍然是SRITS_I算法 <SMRA_RITS<SBRITS_I<SMRA_BRITS。但其与实例A相比误差要大。

6.总体的图解

本申请的总体图解如图17所示。算法模型已经被封装在Docker镜像中，镜像及其系统等依赖一并上云，并根据业务需要激活成容器。容器之间彼此屏蔽，在容器内根据业务需要，增加前后端以实现轨迹显示、轨迹插值及预警等功能。容器1的受众群体是司机用户，算法提前绘制出潜在乘客轨迹图，司机可以提前预判乘客乘车点，减少乘客候车时间和空车时间，增加收入。容器2的受众群体是家庭用户，算法通过老人儿童手机信号可以定位老人儿童历史轨迹及预判不安全地域，及时将警报传送给家庭成员及社区管理人员，及时确定老人儿童地点。容器k受众群体是餐饮用户，算法可以提前预判餐饮用户所在区域的各时间点上的人流量，根据对应时间点上的人流量匹配服务人员数量及备货量，避免配置过度和配置不足带来的损失。容器n受众群体是追踪用户，算法可以根据目标手机信号恢复其历史轨迹及提前预知其移动路径，追踪人员可以有目的性搜查或提前布防。当然可以根据业务具体需要，生成具体容器。如果插值算法有更新，只需算法工程师对基础镜像进行更新封装，其余容器只需继承基础镜像功能即可，运维方便简洁，节约资源和成本。

Claims

1.一种轨迹复原算法的模型建立方法，其特征在于，采用SMRA_BRITS算法预估缺失值得到，包括，

获取轨迹基于时间戳上的坐标的多变量序列X，X＝{x₁,x₂,...,x_t...,x_T}；x_t是第t个时间戳s_t对应的观测值，x_t∈R^D×1；t∈{1,2,...,T}，T为大于0的正整数；

建立坐标多变量序列中的遮蔽矩阵m，m＝[m₁,...,m_t,...,m_T]，其中m_t为第t个序列点对应的遮蔽向量；D表示多维变量个数；

基于坐标缺失值的时间戳与上一次真实观测值对应时间戳的差值构建时间间隔矩阵δ，δ＝[δ₁,...,δ_t,...,δ_T]，其中δ_t为第t个序列点对应的时间间隔向量，δ_t∈R^D×1；

建立基于某个变量历史数据之间的关系得到数值

以及建立基于坐标多维变量之间耦合关系得到的数值

以及融合

与

得到的融合后数据

获取轨迹基于时间戳上的行为方式的标签序列ρ＝[ρ₁,...,ρ_t,...,ρ_T]，ρ_t∈R^C×1，ρ_t为第t个序列点标签值的One-Hot编码；标签的遮蔽矩阵n＝[n₁,...,n_t,...,n_T]，n_t∈R^1×1；

根据坐标遮蔽矩阵m、坐标多变量序列X、标签遮蔽矩阵n、标签序列ρ以及融合后数据

建立坐标的预测值

及缺失标签的复原模型；

通过坐标回归和标签分类损失函数加权和迭代更新确定坐标轨迹和行为方式标签的复原算法模型。

2.根据权利要求1所述的一种轨迹复原算法的模型建立方法，其特征在于，基于某个变量历史数据之间关系得到的数值

包括，

根据时间间隔矩阵δ建立输出端衰减函数

输出端衰减函数

并根据输出端衰减函数构建模型的隐藏状态函数h_t，

Θ为矩阵取内积符号，“||”代表纵向拼接；

B∈R^H×H，m_t∈R^D×1，

C∈R^H×2D，d∈R^H×1，σ为sigmoid激活函数；

实现输出基于某个变量历史数据之间关系得到的数值

x_t∈R^D×1,

3.根据权利要求1所述的一种轨迹复原算法的模型建立方法，其特征在于，计算出融合后的数据

包括，

根据时间间隔矩阵建立输入端衰减函数

输入端衰减函数为

通过该输入端衰减函数构建数值

与数值

的融合系数β_t，

β_t∈R^D×1，β_t中每个元素的值介于0～1，含端点；

同时根据

计算出融合后的数据

4.根据权利要求1所述的一种轨迹复原算法的模型建立方法，其特征在于，根据坐标遮蔽矩阵m、坐标的多维变量序列X以及融合后数据

建立缺失值的预测值

计算方法是采用如下算法进行的：

5.根据权利要求1所述的一种轨迹复原算法的模型建立方法，其特征在于，基于某个变量历史数据之间的关系得到数值

包括：

6.根据权利要求1所述的一种轨迹复原算法的模型建立方法，其特征在于，建立基于多维变量之间耦合关系得到的数值

式中，

其中，R_z∈R^D×D，0≤p≤1，p初始值为0；

其中，w_i,j是W_z中的一个元素，W_z∈R^D×D，当i≠j，w_i,j表示第j个变量对第i个变量的影响系数；当i＝j，w_i,j取值为0。

7.根据权利要求1所述的一种轨迹复原算法的模型建立方法。该算法属于双向循环神经网络，对于任意一个方向，其特征在于，样本长度为L的单个样本的坐标回归损失函数

为：

样本长度为L的单个样本的标签分类损失函数

为：

y_t＝cross_entropy(P_t,ρ_t)，

P_t∈R^C×1，ρ_t∈R^C×1，n_t∈R^1×1，n_t代表时序点t对应的标签遮蔽向量值，C为行为标签类别个数，P_t代表时序点t对应的每一种可能的行为标签的概率预测值；ρ_t代表该标签真实值或默认值的One-Hot编码；cross_entropy代表交叉熵函数；针对双向循环任意一个方向，m个顺序样本坐标损失函数与标签分类损失函数的加权损失函数

为：

其中α,β分别代表轨迹定位和回归占损失函数的权重，

表示第k个样本轨迹坐标回归的损失函数，

表示第k个样本L个时序点标签分类的损失函数。

8.根据权利要求1所述的一种轨迹复原算法的模型建立方法，该算法融合正反两个方向的损失函数，其特征在于：

L_C代表双向的加权损失函数，

为正向的加权损失函数，

为反向的加权损失函数。

9.一种实现权利要求1-8任一所述的轨迹复原算法的模型建立方法的系统，其特征在于，

包括docker容器，所述docker容器获得基于时间戳上的原始观测值的多变量序列即轨迹数据，内置有SMRA_BRITS算法预估缺失值，进行轨迹数据处理得到复原轨迹，并传递至PC端以显示复原后的轨迹。

10.根据权利要求9所述的一种实现轨迹复原算法的模型建立方法的系统，其特征在于，所述轨迹数据来源于互联网，并被Oracle通信数据库存储；所述docker容器连接于所述Oracle通信数据库。