CN115359437A

CN115359437A - 一种基于语义轨迹的伴随车辆识别方法

Info

Publication number: CN115359437A
Application number: CN202211004516.4A
Authority: CN
Inventors: 王蓉; 刘欣萍; 肖云鹏; 贾朝龙; 王�华; 罗楠楠; 赵雪
Original assignee: Chongqing University of Post and Telecommunications
Current assignee: Chongqing University of Post and Telecommunications
Priority date: 2022-08-22
Filing date: 2022-08-22
Publication date: 2022-11-18

Abstract

本发明提出了一种基于语义轨迹的伴随车辆识别方法，属于智能交通应用技术领域，所述方法包括对交通轨迹数据集进行处理得到车辆时序轨迹序列，采用MFDC算法进行轨迹数据补全，得到车辆补偿轨迹序列；对轨迹语义词汇表与车辆补偿轨迹序列进行特征匹配，得到语义轨迹补偿序列；计算车辆补偿轨迹序列的上下文轨迹点的拐点夹角，优化语义轨迹补偿序列；采用AT2VEC对优化后的语义轨迹补偿序列进行向量化处理，生成语义轨迹向量；采用TP‑BILSTM算法对语义轨迹向量进行轨迹点补偿，并利用多特征注意力机制提取出具有特征影响力的语义轨迹向量；计算出不同车辆的语义轨迹向量之间的相似度，并根据独热编码识别出同类别的伴随车辆。

Description

一种基于语义轨迹的伴随车辆识别方法

技术领域

本发明属于智能交通应用技术领域，涉及车辆轨迹数据处理，具体涉及一种基于语义轨迹的伴随车辆识别方法。

背景技术

近年来，迅速增长的车辆规模给我国的交通路网空间和创建节约能源、绿色环保等号召带来了极大的挑战，并且随着全球定位技术、传感器网络和智能移动终端的发展，海量的轨迹信息数据冗余在终端中，这些无人问津的数据中往往拥有着隐藏价值。所以，如何充分的使用交通轨迹数据，摄取到对政府商业开发和对公共交通管控等诸多方面的有用信息成为重要的关注点。

与此同时，伴随车挖掘对于实现智能交通扮演着重要的角色。通过各种方法和技术分析对交通数据进行深度挖掘，实现对未来路况等一系列情况进行预测和分析，有助于研究人类行为模式、交通物流、动物习性以及市场营销等。随着大数据时代的到来，从这些海量的时空轨迹数据中发现隐藏的知识和“有趣”的轨迹模式有重要意义。例如，挖掘出具有相同轨迹模式的卡车有助于物流规划；挖掘上班族上班路线的共同路段有助于公共交通的规划等。挖掘伴随模式是一种有效的分析时空轨迹模式的方法，即挖掘一起运动的超过设定时间长度阈值的移动对象群体。时空轨迹伴随模式是时空数据轨迹模式中重要的组成部分，其在挖掘具有相同或相似运动模式的移动对象群体等方面有着广泛的应用。

近年来，许多学者对伴随车挖掘模型进行了大量的研究。第一类，许多学者提出了不同的伴随模式，根据不同伴随模式对移动对象在时空约束从而通过不同聚类方法实现伴随车挖掘。第二类，学者们通过轨迹空间距离函数来测量不同轨迹之间的相似度，通过轨迹相似度来分类伴随车组。如面向全局匹配的轨迹点相似性度量方法、面向局部匹配的轨迹点相似性度量方法。第三类，学者开始研究流式交通数据的处理并且研究如何把语义信息融合到时空特征中并通过轨迹相似性来度量轨迹之间相似性来挖掘伴随车。通过给轨迹点添加语义并对多特征进行向量化计算轨迹相似性，从而实现伴随车挖掘。第四类，基于多数据流中的频繁伴随模式挖掘算法。通过对轨迹数据流构建树索引结构来挖掘频繁元素集合实现伴随车挖掘。

然而在现有技术中，存在轨迹点特征数据缺失和轨迹点缺失的问题。针对轨迹点特征数据缺失的问题，几乎所有的研究者都在数据预处理阶段将此类含噪声的数据清洗掉，但是含噪声的数据仍是车辆轨迹序列保持完整性的重要组成部分。针对轨迹点缺失的问题，许多学者提出了不同的神经网络模型对轨迹序列进行补偿。比如，利用GRU神经网络模型对车辆轨迹序列进行上下文轨迹点建模，并在模型内部嵌入注意力机制提高不同特征的贡献程度，从而实现对轨迹点缺失的轨迹序列进行补偿；利用LSTM模型对时序轨迹序列进行建模学习上下文轨迹点的相关性，并且在LSTM模型内部嵌入多特征注意力机制，从而根据学习后的模型对输入轨迹进行轨迹点补偿；与此类似，还有学者使用CNN神经网络模型进行建模学习，并引入注意力机制实现轨迹点补偿。以上研究者虽然在同行车分类任务中取得了不错的效果，但是以上神经网络模型建模时只能对正向轨迹序列进行建模，当对缺失的轨迹点进行补偿的候选补偿轨迹点有多个时，那么从中选取某个轨迹点进行补偿就存在不确定性。

发明内容

基于现有技术存在的问题，本发明聚焦于交通轨迹数据的异质性、不完整性问题，提出一种基于语义轨迹的伴随车辆识别方法，意于提高轨迹相似度准确性。首先，针对轨迹点特征数据缺失问题，通过对不同特征的轨迹序列进行动态捕捉实现数据补全。然后，在模型中引入语义特征，通过BiLSTM模型的前向和反向神经网络捕捉轨迹语义特征潜在的关联，从而实现轨迹点缺失的补偿。这不仅可以有效的挖掘车辆真实的行驶轨迹，也能分析出车辆的行为模式。所述方法包括以下步骤：

获取交通轨迹数据集和轨迹语义词汇表；

其中，所述交通轨迹数据集至少包括纬度特征、经度特征、时间特征、车牌特征、车身颜色特征、车辆品牌特征和车辆类别特征；所述轨迹语义词汇表包括轨迹访问点的经度信息、纬度信息以及相应的语义信息；

对所述交通轨迹数据集进行处理，基于车辆不同特征得到车辆时序轨迹序列；

采用多特征匹配的数据补全方法对所述车辆时序轨迹序列进行轨迹数据补全，得到车辆补偿轨迹序列；

对所述轨迹语义词汇表与所述车辆补偿轨迹序列进行特征匹配，将轨迹语义词汇表中的值作为车辆轨迹点的语义标签，得到语义轨迹补偿序列；

计算出所述车辆补偿轨迹序列的上下文轨迹点的拐点夹角，利用拐点特征优化所述语义轨迹补偿序列；

采用多特征向量化模型对优化后的语义轨迹补偿序列进行向量化处理，提取出语义轨迹补偿序列的空间特征向量、时间特征向量、拐点特征向量和语义特征向量，将各个特征向量进行融合，生成语义轨迹向量；

将所述语义轨迹向量按照轨迹对输入到基于多特征注意力机制的双向BILSTM模型中，利用注意力机制学习上下文轨迹点，并对轨迹点进行补偿，从而输出补偿后的语义轨迹向量；

计算出不同车辆的语义轨迹向量之间的相似度，根据所述相似度进行独热编码，根据独热编码状态识别出同类别的伴随车辆。

本发明的有益效果：

本发明通过轨迹数据补全和轨迹点补偿两种补偿方法解决轨迹数据异质性问题。通过解决轨迹数据异质性问题提高伴随车识别方法的性能。从而通过识别出车辆的伴随行为模式，反映社会发展规律和人们生活习惯。因此，本发明可以应用于交通安全、物流规划、轨迹聚类和轨迹行驶路线预测。

附图说明

图1是本发明实施例中基于语义轨迹的伴随车辆识别方法流程图；

图2是本发明实施例基于不同轨迹特征的轨迹序列进行动态捕捉机制图；

图3是本发明实施例补偿轨迹向量化机制图；

图4是本发明实施例语义补偿轨迹及其轨迹语义建模过程图；

图5是本发明实施例伴随车分类机制图。

具体实施方式

为了更好地阐述本发明的技术方案并使优点更加简明清晰，下面先对本发明要解决的问题进行具体解释，再参照说明书附图，对本发明的具体实施方式做进一步详细说明。

为了解决伴随车辆识别过程中所涉及的交通轨迹数据的异质性和不完整性的问题，本发明通过语义轨迹表示、语义轨迹特征提取以及语义轨迹建模三个完成来实现伴随车辆识别分类的问题，以下将结合具体实施例来说明本发明的识别方法。

图1是本发明实施例中基于语义轨迹的伴随车辆识别方法流程图；如图1所示，所述方法包括：

S1、获取交通轨迹数据集和轨迹语义词汇表；

S2、对所述交通轨迹数据集进行处理，基于车辆不同特征得到车辆时序轨迹序列；

S3、采用多特征匹配的数据补全方法(Multi Feature Data Completion，MFDC)对所述车辆时序轨迹序列进行轨迹数据补全，得到车辆补偿轨迹序列；

S4、对所述轨迹语义词汇表与所述车辆补偿轨迹序列进行特征匹配，将轨迹语义词汇表中的值作为车辆轨迹点的语义标签，得到语义轨迹补偿序列；

S5、计算出所述车辆补偿轨迹序列的上下文轨迹点的拐点夹角，利用拐点特征优化所述语义轨迹补偿序列；

S6、采用多特征向量化模型对优化后的语义轨迹补偿序列进行向量化处理，提取出语义轨迹补偿序列的空间特征向量、时间特征向量、拐点特征向量和语义特征向量，将各个特征向量进行融合，生成语义轨迹向量；

S7、将所述语义轨迹向量按照轨迹对输入到基于多特征注意力机制的双向BILSTM模型中，利用注意力机制学习上下文轨迹点，并对轨迹点进行补偿，从而输出补偿后的语义轨迹向量；

S8、计算出不同车辆的语义轨迹向量之间的相似度，根据所述相似度进行独热编码，根据独热编码状态识别出同类别的伴随车辆。

在本发明实施例中，所述步骤S1中，所述轨迹语义词汇表是所述交通轨迹数据集的衍生记录表，两者构成整个模型的输入。在本发明实施例中，所述交通轨迹数据集至少包括纬度特征、经度特征、时间特征、车牌特征、车身颜色特征、车辆品牌特征和车辆类别特征；所述轨迹语义词汇表包括轨迹访问点的经度信息和、纬度信息以及相应的语义信息。

所述交通轨迹数据集可以记录车辆的车牌、车辆的经纬度定位、车辆的车身颜色、车辆的品牌等信息，其中每一辆车的记录详情可以如公式(1)表示，整个交通轨迹数据集由公式(2)所示。

C_V(i)＝{V_id(i),V_lat(i),V_lng(i),V_t(i),V_c(i),V_ca(i)} (1)

C_V＝{C_V(1),C_V(2),…,C_V(n)} (2)

其中C_V(i)，i∈(1，2，…,n)表示交通轨迹数据集中第i行记录的车辆轨迹点数据；n表示交通轨迹数据集的长度；V_id(i)，V_lat(i)，V_lng(i)，V_t(i)，V_c(i)，V_ca(i)分别表示第i行记录的车辆轨迹点数据的车牌特征，纬度特征，经度特征，时间特征、车身颜色和车辆类别特征。

所述轨迹语义词汇表的构建是通过POI(Point of Information)操作读取轨迹访问点坐标信息，该轨迹语义词汇表记录了所有轨迹访问点经纬度的语义信息，轨迹语义词汇表可以如下进行表示：

C_s(i)＝{V_lat(i),V_lng(i),V_se(i)} (3)

C_s＝{C_s(1),C_s(2),…,C_s(n)} (4)

其中C_s(i)，i∈(1，2，…,n)表示轨迹语义词汇表第i行的语义信息；n表示轨迹语义词汇表的长度；V_lat(i)，V_lng(i)，V_se(i)分别表示第i行的语义信息中的经度、纬度和语义标签特征。

在本发明实施例中，所述步骤S2中，所述交通轨迹数据集具有多种不同特征，因此可以按照车辆的不同车辆来生成车辆时序轨迹序列；具体的：

以时间特征作为索引，以对车牌特征为查询条件获得车牌时轨迹序列：

其中，i表示数据集中的第i个车牌的车辆；

表示第i个车辆的车牌时轨迹序列；P_j表示该车牌时轨迹序列的第j个轨迹访问点，其中j∈(1,2,…,n)。

以时间特征作为索引，以车身颜色特征和品牌特征作为查询条件获得车辆附属属性时轨迹序列；

其中，

表示第i个车辆附属属性时轨迹序列，P_j表示该车牌时轨迹序列的第j个轨迹访问点，其中j∈(1,2,...,m)。

在本发明实施例中，图2是本发明实施例基于不同轨迹特征的轨迹序列进行动态捕捉机制图，如图2所示，所述步骤S3中，针对步骤S2生成的车辆时序轨迹序列

和

进行轨迹点全局匹配，利用轨迹间动态匹配算法以动态捕捉的方式进行轨迹数据补全，从而得到车辆补偿轨迹序列T_com。

T_com＝{T₁,T₂,…,T_N} (7)

T_i＝{V_id(i),V_lat(i),V_lng(i),V_t(i)} (8)

其中T_i表示车辆补偿轨迹序列的i个轨迹点；N表示车辆补偿轨迹序列的长度；V_id(i)，V_lat(i)，V_lng(i)，V_t(i)表示第i个轨迹点的车牌、纬度、经度和时间特征。

MFDC算法主要解决车辆轨迹点存在数据缺失。由于轨迹点数据缺失会导致车辆序列与实际轨迹数据不匹配，从而影响轨迹相似度计算。MFDC算法的基本原理是基于车辆不同特征获取到轨迹序列，通过对不同轨迹序列的轨迹点进行特征动态匹配，从而实现对车辆车牌等特征进行轨迹点数据补全，能够有效解决轨迹间数据异质性的问题。

在本发明实施例中，在步骤S4中，根据已经构建好的轨迹语义词汇表和轨迹补偿序列中的经纬度进行特征匹配，也即是将轨迹语义词汇表的经度信息和纬度信息与所述车辆补偿轨迹序列的纬度特征和经度特征进行特征匹配，这里可以将轨迹语义词汇表中的经纬信息和车辆补偿轨迹序列中的经纬信息进行一一匹配，当经纬信息匹配成功后，则表明两者的轨迹点是同一轨迹点，就可以将轨迹语义词汇表的语义信息值赋值给车辆补偿轨迹序列中各个车辆轨迹点的语义标签，为所述车辆补偿轨迹序列生成语义轨迹补偿序列。因此，语义轨迹补偿序列就表示为T_s：

T_s＝{T₁,T₂,…,T_N} (9)

T_k＝{V_id(k),V_lat(k),V_lng(k),V_t(k),V_s(k),V_T(k)} (10)

其中T_k表示语义轨迹序列的k个轨迹点；N表示语义轨迹序列的长度；V_s(k)表示车辆V_id(k)轨迹序列的语义标签特征。V_T(k)表示车辆V_id(k)轨迹序列的轨迹拐点特征。

在本发明实施例中，在步骤S5中，根据上一步得到的车辆补偿轨迹序列T_com，通过计算T_com中的上下文轨迹点的拐点夹角Θ(i)，就可以构建出路网拐点记录表C_T，这个路网拐点记录表可以用来优化语义轨迹补偿序列。

C_T(j)＝{V_lat(j),V_lng(j),V_T(j)} (15)

C_T＝{C_T(1),C_T(2),…,C_T(N)} (16)

可以理解的是，在本发明实施例中，通过在语义轨迹点的空间特征中引入拐点特征，让轨迹点同时具有空间特征、时间特征、拐点特征和语义特征，因此，此时的语义轨迹补偿序列就可以作为优化后的且具有拐点特征的语义轨迹补偿序列。

在本发明实施例中，在步骤S6中，本发明构建了AT2Vec模型对语义轨迹特征进行提取。该模型主要分为四个模块，分别是语义特征提取、空间特征提取、拐点特征提取、时间特征提取。考虑到语义轨迹的特征多元性和数据类型的多样性。因此，通过构建不同特征的词嵌入向量实现语义轨迹的向量化，如图3所示，具体如下：

空间特征提取。针对由纬度V_lat和经度V_lng组成的空间特征，采用网格法将空间特征进行离散化，获得语义补偿轨迹点在空间网格上的位置编码V_sp。其中，网格公差值d_lat，d_lng由数据集中最大的空间跨度决定和轨迹序列的长度决定，如式(16)所示。

式中Δd_lat、Δd_lng分别表示网格的纬度公差值和经度公差值。lng_max，lng_max表示所有轨迹访问点中的经度最大值和最小值。lat_max，lat_min表示所有轨迹访问点中的纬度最大值和最小值格，其拐点对应的网格值就作为位置编码V_sp。再将所有语义轨迹序列T_s的空间位置编码特征输入到skipGram空间特征嵌入模型，通过最大化公式(18)实现每个网格单元向量化。

式中，N表示轨迹的长度；w表示滑动窗口的大小；c_t+j表示当前滑动窗口j的单元格c_t的相邻单元格，并且可通过softmax函数计算相邻单元格的概率，表示为：

式中，c_j表示当前单元格c_i的轨迹上下文单元格；v表示单元格的向量；从而实现轨迹的空间特征嵌入f_sp。

式中，

表示skipGram算法对语义轨迹序列的空间特征进行词嵌入后的特征向量表示，其中

表示任意一条轨迹T_s中第k个轨迹访点的空间特征向量。

针对时间特征，采用时间切片将语义轨迹点的时间戳映射到时间单元格进行离散化，获得语义轨迹点在时间单元上的位置编码V_t。

式中δ_t表示所有轨迹序列的时间跨度；m表示所有补偿轨迹序列中轨迹访问点数的最大值。再将所有语义轨迹序列T_s的时间戳位置编码特征输入到skipGram时间特征嵌入模型。因此，获得T_s的时间特征向量f_t。

式中

表示语义轨迹序列中第k个轨迹访问点的时间特征向量。

根据人们日常生活活动地可以将其分为9种不同的属性，分别是交通枢纽、商业场所、行政区场所、小型消费场所、运动场所、学校场所、办公场所、打卡地场所、停留区。通过Glove模型学习语义标签的向量表达式，并通过最小化Glove模型的损失函数学习出最优的向量表达式，表示为：

式中w_i,w_k表示关键词i,j的词向量；b_i,b_k表示偏差项；f是权重函数；针对语义特征V_s作为该模型的输入，通过Glove模型进行词嵌入得到该语义特征的向量V_s。从而获得T_s的语义特征向量f_s。

式中

表示语义轨迹序列中第k个轨迹访问点的语义特征向量。

针对轨迹拐点特征，将语义轨迹序列T_s的轨迹拐点特征输入到skipGram拐点特征嵌入模型，获得T_s的拐点特征向量f_T。

式中

表示语义轨迹序列中第k个轨迹访问点的拐点特征向量。

将上述特征向量化后，通过语义特征向量连接操作实现语义特征融合。因此，语义轨迹T_s中的任意轨迹点T_k经词嵌入后可以由语义轨迹向量T_s中的T_k进行向量表示：

T_k＝contact(f_t(k),f_s(k),f_sp(k),f_T(k)) (26)

T_s＝{T₁,T₂,…,T_N} (27)

式中，T_s表示语义轨迹序列的表征向量；T_k表示T_s中第k个轨迹访问点的语义特征向量，其中k∈(1，2，…,N)；contact()表示等距离向量连接符；f_s(k)，f_t(k)，f_sp(k)，f_T(k)依次表示第k个轨迹访问点的语义特征向量，时间特征向量，空间特征向量，拐点特征向量。

在本发明实施例中，步骤S7中，需要构建出模型来提取出经过轨迹点补偿后，且具有特征影响力的语义轨迹向量。本发明的模型是基于seq2seq模型并在其编码器和解码器部分采用双向BILSTM组成。将低采样语义轨迹向量和对应的高采样语义轨迹向量构成轨迹对，将低采样语义轨迹向量作为编码器输入，将高采样语义轨迹向量作为解码器输入，目标是通过最小化相应的高采样语义轨迹向量的重构误差来学习低采样语义轨迹向量；通过挖掘出上下文轨迹点之间的时空、语义、拐点特征的相关性，构建TP-BILSTM模型的中间向量。同时，针对时空、语义、拐点特征引入了注意力机制用于关注不同特征对计算轨迹相似度的影响力，如图4所示。

通过对语义轨迹向量T_s进行轨迹向量点抽样获得低采样轨迹向量T_sl，将语义轨迹向量T_s作为高采样轨迹向量T_sh。将T_sl作为以BiLSTM神经网络模型为编码器的输入，将T_sh作为以BiLSTM神经网络模型为解码器的输出，来训练TP-BiLSTM神经网络模型。通过BiLSTM模型对轨迹特征f_s(k)，f_t(k)，f_sp(k)，f_T(k)学习得到上下文轨迹点之间的依赖关系，得到将输入的低采样轨迹向量到输出的真实轨迹向量所映射的中间向量T_m。其中中间向量T_m是由编码器BiLTSM模型的隐藏层矩阵α和解码器BiLTSM模型的隐藏层β拼接而成。

考虑到T_sl语义轨迹向量被压缩为固定长度后导致语义向量信息部分失真以及实现轨迹补偿，因此在encoder编码器阶段引入多特征注意力机制MT-Attention。通过encoder编码对T_sl进行编码得到

编码向量，给定

的某个输入，并将其时间、空间、语义和拐点映射到3个高维空间Q、K、R权重矩阵，通过三个高维空间挖掘轨迹点的时空、语义与拐点之间的依赖关系。

多特征注意力机制的具体实现方法利用上一层神经网络的隐藏状态和记忆单元状态值计算当前时刻的细胞状态来计算特征权重矩阵值ω_ij，再通过softmax函数对权重值实现归一化处理：

ω_tj＝β₁tanh(Ξ⁽¹⁾[h_t-1,q_t-1]+Ξ⁽²⁾T(.,j)+α₁) (29)

其中，T(.,j)表示在轨迹多特征注意力机制中，从轨迹特征矩阵中提取的第j个轨迹访问点的三维特征向量。

表示模型学习到的参数矩阵；d表示特征因子的维数。最后根据权重值ω_ij和轨迹特征矩阵T_s计算得到语义轨迹的时空、语义和拐点特征的注意力矩阵E_p。

T(i,.)＝{T(i,1)α_t1,T(i,2)α_t2,…,T(i,T)α_tT} (31)

E_p＝{T(1,.),T(2,.),…,T(4d,.)} (32)

式中T(n,.)表示注意力嵌入矩阵的第n行向量表示。T(i,j),j∈(1,2,…,T)表示注意力嵌入矩阵的第i行，第j列元素。

构建完MT-Attention注意力机制后，将目标采样轨迹T_sl作为encoder的输入，中间向量T_m将其转换成真实轨迹向量T_sh。从而解决了轨迹点缺失对根据轨迹相似度挖掘伴随车导致不准确的问题，实现了轨迹补偿。

TP-BILSTM模型是基于seq2seq模型构建。TP-BILSTM模型通过对输入的低采样语义轨迹向量进行编码，并且嵌入MT-Attention强化语义特征向量因子，再将模型学习到的上下文中间向量作为解码器的输入，同时利用上一时刻的输出值和上一时刻的递归状态进行计算，最终生成解码器输出的新语义轨迹向量。值得一提的是，在训练阶段，编码器和解码器都采用了BILSTM神经网络模型。在编码器部分，嵌入了多特征注意力机制的BILSTM模型，通过正向和反向神经网络重点学习低采样语义轨迹向量的正向语义特征关系和反向语义特征的上下文关系，并将提取到的特征向量作为编码器的输出；嵌入MT-Attention对编码器输出的向量进行处理，从而提高语义轨迹向量中语义特征向量对轨迹相似度的影响力。在解码器部分，将高采样语义轨迹向量作为BILSTM模型的输入，通过正向和反向神经网络学习向量的上下文关系并将学习后向量作为编码器的学习目标，从而构建TP-BILSTM模型的上下文中间向量。在测试阶段，将低采样语义轨迹向量T_sl作为TP-BILSTM模型的输入，先经过多特征注意力矩阵E_p强化特征因子的影响力，再通过具有时空和语义相关性的上下文中间矩阵T_m生成语义轨迹向量T_sh，生成的T_sh就是低采样轨迹经过轨迹点补偿后的语义轨迹向量。为了区分不同车辆的语义轨迹向量的表示，本文将T_sh以

代替。同理，将其余的语义轨迹向量也作为TP-LSTM模型的地位采样轨迹输入，按照以上描述将输入映射成为补偿后的语义轨迹向量

在本发明实施例中，步骤S8中，如图5所示，需要获取不同车辆的语义轨迹向量

先将每个车辆的各个语义轨迹向量

进行归一化，再利用曼哈顿法或者其他相似度距离算法来计算不同车辆的轨迹语义向量之间的相似度，最终实现伴随车辆的识别分类任务。

其中，i表示softmax层的输出节点编号；N输入向量的维度；TSM(i)表示输入第i个向量经归一化处理后的输出值。因此归一化后的轨迹向量可以如下表示：

其中

表示以id为车牌号的轨迹向量

归一化后的向量表示。以id为车牌号的车辆其行驶轨迹的第k个轨迹点；

表示轨迹点k的时间、空间、语义特征的归一化输出值。

因此，归一化后的轨迹向量之间的相似度距离可以由如下公式进行表示：

其中，T_i，T_j表示轨迹i和轨迹j；N表示T_i，T_j的最长轨迹点数。

根据对不同轨迹之间的相似度d(T_i,T_j)绘制热力图。以车牌号作为热力图的横纵坐标，将车辆与车辆之间的轨迹相似度进行可视化操作。通过热力图的某一行或列所体现的相似程度，从而实现伴随车识别。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.一种基于语义轨迹的伴随车辆识别方法，其特征在于，所述方法包括：

获取交通轨迹数据集和轨迹语义词汇表；所述交通轨迹数据集至少包括纬度特征、经度特征、时间特征、车牌特征、车身颜色特征、车辆品牌特征和车辆类别特征；所述轨迹语义词汇表包括轨迹访问点的经度信息、纬度信息以及相应的语义信息；

2.根据权利要求1所述的一种基于语义轨迹的伴随车辆识别方法，其特征在于，采用多特征匹配的数据补全方法对所述车辆时序轨迹序列进行轨迹数据补全包括以所述时间特征为索引，以车牌特征为查询条件获得车牌时轨迹序列，以所述时间特征为索引，以车身颜色特征和车辆品牌特征为查询条件，获得车辆附属属性时轨迹序列；对所述车牌时轨迹序列和所述车辆附属属性时轨迹序列进行全局匹配，通过动态捕捉进行轨迹数据补全，获得车辆补偿轨迹序列。

3.根据权利要求1所述的一种基于语义轨迹的伴随车辆识别方法，其特征在于，对所述轨迹语义词汇表与所述车辆补偿轨迹序列进行特征匹配，将轨迹语义词汇表中的值作为车辆轨迹点的语义标签，得到语义轨迹补偿序列包括将轨迹语义词汇表的经度信息和纬度信息与所述车辆补偿轨迹序列的纬度特征和经度特征进行特征匹配，将轨迹语义词汇表的语义信息值作为车辆补偿轨迹序列中各个车辆轨迹点的语义标签，为所述车辆补偿轨迹序列生成语义轨迹补偿序列。

4.根据权利要求1所述的一种基于语义轨迹的伴随车辆识别方法，其特征在于，计算出所述车辆补偿轨迹序列的上下文轨迹点的拐点夹角，利用拐点特征优化所述语义轨迹补偿序列包括在语义轨迹点的空间特征中引入拐点特征，生成具有拐点特征的语义轨迹补偿序列。

5.根据权利要求1或4所述的一种基于语义轨迹的伴随车辆识别方法，其特征在于，所述车辆补偿轨迹序列的上下文轨迹点的拐点夹角的计算公式表示为：

6.根据权利要求1所述的一种基于语义轨迹的伴随车辆识别方法，其特征在于，采用多特征向量化模型对优化后的语义轨迹补偿序列进行向量化处理包括采用网格法将空间特征进行离散化，获得语义轨迹点在空间网格的位置编码；将语义轨迹补偿序列中空间网格的位置编码输入到skipGram空间特征嵌入模型中，将网格单元向量化，将语义轨迹点的上下文特征映射到空间单元格中，从而提取出语义轨迹补偿序列的空间特征向量；采用时间切片将语义轨迹点的时间戳映射到时间单元格上进行离散化，获得语义轨迹点在时间单元上的位置编码；将语义轨迹补偿序列中时间戳的位置编码特征输入到skipGram时间特征嵌入模型中，从而获得语义轨迹补偿序列的时间特征向量；将用户日常生活活动地划分为多个属性，将不同属性分别作为相应的语义标签，将各个语义标签输入到Glove模型中学习语义标签的向量表达式，从而获得语义轨迹补偿序列的语义特征向量；将语义轨迹补偿序列的拐点特征输入到skipGram拐点特征嵌入模型中，从而获得拐点特征向量。

7.根据权利要求1所述的一种基于语义轨迹的伴随车辆识别方法，其特征在于，对轨迹点进行补偿的过程包括将所述语义轨迹向量作为高采样轨迹向量，将所述语义轨迹向量进行轨迹向量点抽样获得低采样轨迹向量；将所述低采样轨迹向量的轨迹对作为双向BILSTM模型的编码器输入，利用多特征注意力机制学习具有特征影响力的上下文轨迹点，利用学习到的上下文轨迹点进行轨迹点补偿，并将补偿后的低采样轨迹向量的轨迹对作为双向BILSTM模型的解码器输出；通过优化补偿后的低采样轨迹向量与高采样轨迹向量之间的距离，训练基于多特征注意力机制的双向BILSTM神经网络模型；利用训练完成的基于多特征注意力机制的双向BILSTM神经网络模型对所述语义轨迹向量的所有轨迹点进行补偿，更新所述语义轨迹向量。

8.根据权利要求1所述的一种基于语义轨迹的伴随车辆识别方法，其特征在于，所述计算出不同车辆的语义轨迹向量之间的相似度包括对基于多特征注意力机制的双向BILSTM模型中处理后的语义轨迹向量进行归一化，利用相似度算法计算出不同车辆之间的语义轨迹向量之间的相似度；对当前车辆与目标车辆之间的相似度进行独热编码，当热力图的某一行或者某一列的相似度超过预设阈值时，则识别出目标车辆为当前车辆的伴随车辆。