CN115359437A - 一种基于语义轨迹的伴随车辆识别方法 - Google Patents
一种基于语义轨迹的伴随车辆识别方法 Download PDFInfo
- Publication number
- CN115359437A CN115359437A CN202211004516.4A CN202211004516A CN115359437A CN 115359437 A CN115359437 A CN 115359437A CN 202211004516 A CN202211004516 A CN 202211004516A CN 115359437 A CN115359437 A CN 115359437A
- Authority
- CN
- China
- Prior art keywords
- track
- semantic
- sequence
- vehicle
- compensation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 239000013598 vector Substances 0.000 claims abstract description 127
- 230000007246 mechanism Effects 0.000 claims abstract description 16
- 238000012545 processing Methods 0.000 claims abstract description 9
- 238000005070 sampling Methods 0.000 claims description 23
- 238000003062 neural network model Methods 0.000 claims description 10
- 230000002457 bidirectional effect Effects 0.000 claims description 8
- 238000010586 diagram Methods 0.000 claims description 7
- 238000013507 mapping Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 4
- 230000000694 effects Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 2
- 238000012549 training Methods 0.000 claims description 2
- 239000011159 matrix material Substances 0.000 description 10
- 238000005065 mining Methods 0.000 description 10
- 101100167360 Drosophila melanogaster chb gene Proteins 0.000 description 8
- 238000013528 artificial neural network Methods 0.000 description 7
- 238000000605 extraction Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000009412 basement excavation Methods 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000000691 measurement method Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 210000003127 knee Anatomy 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000004080 punching Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
- G06V20/54—Surveillance or monitoring of activities, e.g. for recognising suspicious objects of traffic, e.g. cars on the road, trains or boats
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/761—Proximity, similarity or dissimilarity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/08—Detecting or categorising vehicles
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提出了一种基于语义轨迹的伴随车辆识别方法,属于智能交通应用技术领域,所述方法包括对交通轨迹数据集进行处理得到车辆时序轨迹序列,采用MFDC算法进行轨迹数据补全,得到车辆补偿轨迹序列;对轨迹语义词汇表与车辆补偿轨迹序列进行特征匹配,得到语义轨迹补偿序列;计算车辆补偿轨迹序列的上下文轨迹点的拐点夹角,优化语义轨迹补偿序列;采用AT2VEC对优化后的语义轨迹补偿序列进行向量化处理,生成语义轨迹向量;采用TP‑BILSTM算法对语义轨迹向量进行轨迹点补偿,并利用多特征注意力机制提取出具有特征影响力的语义轨迹向量;计算出不同车辆的语义轨迹向量之间的相似度,并根据独热编码识别出同类别的伴随车辆。
Description
技术领域
本发明属于智能交通应用技术领域,涉及车辆轨迹数据处理,具体涉及一种基于语义轨迹的伴随车辆识别方法。
背景技术
近年来,迅速增长的车辆规模给我国的交通路网空间和创建节约能源、绿色环保等号召带来了极大的挑战,并且随着全球定位技术、传感器网络和智能移动终端的发展,海量的轨迹信息数据冗余在终端中,这些无人问津的数据中往往拥有着隐藏价值。所以,如何充分的使用交通轨迹数据,摄取到对政府商业开发和对公共交通管控等诸多方面的有用信息成为重要的关注点。
与此同时,伴随车挖掘对于实现智能交通扮演着重要的角色。通过各种方法和技术分析对交通数据进行深度挖掘,实现对未来路况等一系列情况进行预测和分析,有助于研究人类行为模式、交通物流、动物习性以及市场营销等。随着大数据时代的到来,从这些海量的时空轨迹数据中发现隐藏的知识和“有趣”的轨迹模式有重要意义。例如,挖掘出具有相同轨迹模式的卡车有助于物流规划;挖掘上班族上班路线的共同路段有助于公共交通的规划等。挖掘伴随模式是一种有效的分析时空轨迹模式的方法,即挖掘一起运动的超过设定时间长度阈值的移动对象群体。时空轨迹伴随模式是时空数据轨迹模式中重要的组成部分,其在挖掘具有相同或相似运动模式的移动对象群体等方面有着广泛的应用。
近年来,许多学者对伴随车挖掘模型进行了大量的研究。第一类,许多学者提出了不同的伴随模式,根据不同伴随模式对移动对象在时空约束从而通过不同聚类方法实现伴随车挖掘。第二类,学者们通过轨迹空间距离函数来测量不同轨迹之间的相似度,通过轨迹相似度来分类伴随车组。如面向全局匹配的轨迹点相似性度量方法、面向局部匹配的轨迹点相似性度量方法。第三类,学者开始研究流式交通数据的处理并且研究如何把语义信息融合到时空特征中并通过轨迹相似性来度量轨迹之间相似性来挖掘伴随车。通过给轨迹点添加语义并对多特征进行向量化计算轨迹相似性,从而实现伴随车挖掘。第四类,基于多数据流中的频繁伴随模式挖掘算法。通过对轨迹数据流构建树索引结构来挖掘频繁元素集合实现伴随车挖掘。
然而在现有技术中,存在轨迹点特征数据缺失和轨迹点缺失的问题。针对轨迹点特征数据缺失的问题,几乎所有的研究者都在数据预处理阶段将此类含噪声的数据清洗掉,但是含噪声的数据仍是车辆轨迹序列保持完整性的重要组成部分。针对轨迹点缺失的问题,许多学者提出了不同的神经网络模型对轨迹序列进行补偿。比如,利用GRU神经网络模型对车辆轨迹序列进行上下文轨迹点建模,并在模型内部嵌入注意力机制提高不同特征的贡献程度,从而实现对轨迹点缺失的轨迹序列进行补偿;利用LSTM模型对时序轨迹序列进行建模学习上下文轨迹点的相关性,并且在LSTM模型内部嵌入多特征注意力机制,从而根据学习后的模型对输入轨迹进行轨迹点补偿;与此类似,还有学者使用CNN神经网络模型进行建模学习,并引入注意力机制实现轨迹点补偿。以上研究者虽然在同行车分类任务中取得了不错的效果,但是以上神经网络模型建模时只能对正向轨迹序列进行建模,当对缺失的轨迹点进行补偿的候选补偿轨迹点有多个时,那么从中选取某个轨迹点进行补偿就存在不确定性。
发明内容
基于现有技术存在的问题,本发明聚焦于交通轨迹数据的异质性、不完整性问题,提出一种基于语义轨迹的伴随车辆识别方法,意于提高轨迹相似度准确性。首先,针对轨迹点特征数据缺失问题,通过对不同特征的轨迹序列进行动态捕捉实现数据补全。然后,在模型中引入语义特征,通过BiLSTM模型的前向和反向神经网络捕捉轨迹语义特征潜在的关联,从而实现轨迹点缺失的补偿。这不仅可以有效的挖掘车辆真实的行驶轨迹,也能分析出车辆的行为模式。所述方法包括以下步骤:
获取交通轨迹数据集和轨迹语义词汇表;
其中,所述交通轨迹数据集至少包括纬度特征、经度特征、时间特征、车牌特征、车身颜色特征、车辆品牌特征和车辆类别特征;所述轨迹语义词汇表包括轨迹访问点的经度信息、纬度信息以及相应的语义信息;
对所述交通轨迹数据集进行处理,基于车辆不同特征得到车辆时序轨迹序列;
采用多特征匹配的数据补全方法对所述车辆时序轨迹序列进行轨迹数据补全,得到车辆补偿轨迹序列;
对所述轨迹语义词汇表与所述车辆补偿轨迹序列进行特征匹配,将轨迹语义词汇表中的值作为车辆轨迹点的语义标签,得到语义轨迹补偿序列;
计算出所述车辆补偿轨迹序列的上下文轨迹点的拐点夹角,利用拐点特征优化所述语义轨迹补偿序列;
采用多特征向量化模型对优化后的语义轨迹补偿序列进行向量化处理,提取出语义轨迹补偿序列的空间特征向量、时间特征向量、拐点特征向量和语义特征向量,将各个特征向量进行融合,生成语义轨迹向量;
将所述语义轨迹向量按照轨迹对输入到基于多特征注意力机制的双向BILSTM模型中,利用注意力机制学习上下文轨迹点,并对轨迹点进行补偿,从而输出补偿后的语义轨迹向量;
计算出不同车辆的语义轨迹向量之间的相似度,根据所述相似度进行独热编码,根据独热编码状态识别出同类别的伴随车辆。
本发明的有益效果:
本发明通过轨迹数据补全和轨迹点补偿两种补偿方法解决轨迹数据异质性问题。通过解决轨迹数据异质性问题提高伴随车识别方法的性能。从而通过识别出车辆的伴随行为模式,反映社会发展规律和人们生活习惯。因此,本发明可以应用于交通安全、物流规划、轨迹聚类和轨迹行驶路线预测。
附图说明
图1是本发明实施例中基于语义轨迹的伴随车辆识别方法流程图;
图2是本发明实施例基于不同轨迹特征的轨迹序列进行动态捕捉机制图;
图3是本发明实施例补偿轨迹向量化机制图;
图4是本发明实施例语义补偿轨迹及其轨迹语义建模过程图;
图5是本发明实施例伴随车分类机制图。
具体实施方式
为了更好地阐述本发明的技术方案并使优点更加简明清晰,下面先对本发明要解决的问题进行具体解释,再参照说明书附图,对本发明的具体实施方式做进一步详细说明。
为了解决伴随车辆识别过程中所涉及的交通轨迹数据的异质性和不完整性的问题,本发明通过语义轨迹表示、语义轨迹特征提取以及语义轨迹建模三个完成来实现伴随车辆识别分类的问题,以下将结合具体实施例来说明本发明的识别方法。
图1是本发明实施例中基于语义轨迹的伴随车辆识别方法流程图;如图1所示,所述方法包括:
S1、获取交通轨迹数据集和轨迹语义词汇表;
S2、对所述交通轨迹数据集进行处理,基于车辆不同特征得到车辆时序轨迹序列;
S3、采用多特征匹配的数据补全方法(Multi Feature Data Completion,MFDC)对所述车辆时序轨迹序列进行轨迹数据补全,得到车辆补偿轨迹序列;
S4、对所述轨迹语义词汇表与所述车辆补偿轨迹序列进行特征匹配,将轨迹语义词汇表中的值作为车辆轨迹点的语义标签,得到语义轨迹补偿序列;
S5、计算出所述车辆补偿轨迹序列的上下文轨迹点的拐点夹角,利用拐点特征优化所述语义轨迹补偿序列;
S6、采用多特征向量化模型对优化后的语义轨迹补偿序列进行向量化处理,提取出语义轨迹补偿序列的空间特征向量、时间特征向量、拐点特征向量和语义特征向量,将各个特征向量进行融合,生成语义轨迹向量;
S7、将所述语义轨迹向量按照轨迹对输入到基于多特征注意力机制的双向BILSTM模型中,利用注意力机制学习上下文轨迹点,并对轨迹点进行补偿,从而输出补偿后的语义轨迹向量;
S8、计算出不同车辆的语义轨迹向量之间的相似度,根据所述相似度进行独热编码,根据独热编码状态识别出同类别的伴随车辆。
在本发明实施例中,所述步骤S1中,所述轨迹语义词汇表是所述交通轨迹数据集的衍生记录表,两者构成整个模型的输入。在本发明实施例中,所述交通轨迹数据集至少包括纬度特征、经度特征、时间特征、车牌特征、车身颜色特征、车辆品牌特征和车辆类别特征;所述轨迹语义词汇表包括轨迹访问点的经度信息和、纬度信息以及相应的语义信息。
所述交通轨迹数据集可以记录车辆的车牌、车辆的经纬度定位、车辆的车身颜色、车辆的品牌等信息,其中每一辆车的记录详情可以如公式(1)表示,整个交通轨迹数据集由公式(2)所示。
CV(i)={Vid(i),Vlat(i),Vlng(i),Vt(i),Vc(i),Vca(i)} (1)
CV={CV(1),CV(2),…,CV(n)} (2)
其中CV(i),i∈(1,2,…,n)表示交通轨迹数据集中第i行记录的车辆轨迹点数据;n表示交通轨迹数据集的长度;Vid(i),Vlat(i),Vlng(i),Vt(i),Vc(i),Vca(i)分别表示第i行记录的车辆轨迹点数据的车牌特征,纬度特征,经度特征,时间特征、车身颜色和车辆类别特征。
所述轨迹语义词汇表的构建是通过POI(Point of Information)操作读取轨迹访问点坐标信息,该轨迹语义词汇表记录了所有轨迹访问点经纬度的语义信息,轨迹语义词汇表可以如下进行表示:
Cs(i)={Vlat(i),Vlng(i),Vse(i)} (3)
Cs={Cs(1),Cs(2),…,Cs(n)} (4)
其中Cs(i),i∈(1,2,…,n)表示轨迹语义词汇表第i行的语义信息;n表示轨迹语义词汇表的长度;Vlat(i),Vlng(i),Vse(i)分别表示第i行的语义信息中的经度、纬度和语义标签特征。
在本发明实施例中,所述步骤S2中,所述交通轨迹数据集具有多种不同特征,因此可以按照车辆的不同车辆来生成车辆时序轨迹序列;具体的:
以时间特征作为索引,以对车牌特征为查询条件获得车牌时轨迹序列:
以时间特征作为索引,以车身颜色特征和品牌特征作为查询条件获得车辆附属属性时轨迹序列;
在本发明实施例中,图2是本发明实施例基于不同轨迹特征的轨迹序列进行动态捕捉机制图,如图2所示,所述步骤S3中,针对步骤S2生成的车辆时序轨迹序列和进行轨迹点全局匹配,利用轨迹间动态匹配算法以动态捕捉的方式进行轨迹数据补全,从而得到车辆补偿轨迹序列Tcom。
Tcom={T1,T2,…,TN} (7)
Ti={Vid(i),Vlat(i),Vlng(i),Vt(i)} (8)
其中Ti表示车辆补偿轨迹序列的i个轨迹点;N表示车辆补偿轨迹序列的长度;Vid(i),Vlat(i),Vlng(i),Vt(i)表示第i个轨迹点的车牌、纬度、经度和时间特征。
MFDC算法主要解决车辆轨迹点存在数据缺失。由于轨迹点数据缺失会导致车辆序列与实际轨迹数据不匹配,从而影响轨迹相似度计算。MFDC算法的基本原理是基于车辆不同特征获取到轨迹序列,通过对不同轨迹序列的轨迹点进行特征动态匹配,从而实现对车辆车牌等特征进行轨迹点数据补全,能够有效解决轨迹间数据异质性的问题。
在本发明实施例中,在步骤S4中,根据已经构建好的轨迹语义词汇表和轨迹补偿序列中的经纬度进行特征匹配,也即是将轨迹语义词汇表的经度信息和纬度信息与所述车辆补偿轨迹序列的纬度特征和经度特征进行特征匹配,这里可以将轨迹语义词汇表中的经纬信息和车辆补偿轨迹序列中的经纬信息进行一一匹配,当经纬信息匹配成功后,则表明两者的轨迹点是同一轨迹点,就可以将轨迹语义词汇表的语义信息值赋值给车辆补偿轨迹序列中各个车辆轨迹点的语义标签,为所述车辆补偿轨迹序列生成语义轨迹补偿序列。因此,语义轨迹补偿序列就表示为Ts:
Ts={T1,T2,…,TN} (9)
Tk={Vid(k),Vlat(k),Vlng(k),Vt(k),Vs(k),VT(k)} (10)
其中Tk表示语义轨迹序列的k个轨迹点;N表示语义轨迹序列的长度;Vs(k)表示车辆Vid(k)轨迹序列的语义标签特征。VT(k)表示车辆Vid(k)轨迹序列的轨迹拐点特征。
在本发明实施例中,在步骤S5中,根据上一步得到的车辆补偿轨迹序列Tcom,通过计算Tcom中的上下文轨迹点的拐点夹角Θ(i),就可以构建出路网拐点记录表CT,这个路网拐点记录表可以用来优化语义轨迹补偿序列。
CT(j)={Vlat(j),Vlng(j),VT(j)} (15)
CT={CT(1),CT(2),…,CT(N)} (16)
其中,i∈(1,2,…,T),T表示车辆补偿轨迹序列中轨迹点的个数;|Ni-1Ni|表示轨迹点i-1与轨迹点i之间的距离,|Ni+1Ni|轨迹点i+1与轨迹点i之间的距离,|Ni-1Ni+1|轨迹点i-1与轨迹点i+1之间的距离;Ni-1(xi-1,yi-1)、Ni(xi,yi)、Ni+1(xi+1,yi+1)表示上下文轨迹点及其经纬度;j∈(1,2,…,N),N表示补偿轨迹序列的长度;Vlat(j),Vlng(j),VT(j)表示轨迹点的纬度、经度和拐点特征;
可以理解的是,在本发明实施例中,通过在语义轨迹点的空间特征中引入拐点特征,让轨迹点同时具有空间特征、时间特征、拐点特征和语义特征,因此,此时的语义轨迹补偿序列就可以作为优化后的且具有拐点特征的语义轨迹补偿序列。
在本发明实施例中,在步骤S6中,本发明构建了AT2Vec模型对语义轨迹特征进行提取。该模型主要分为四个模块,分别是语义特征提取、空间特征提取、拐点特征提取、时间特征提取。考虑到语义轨迹的特征多元性和数据类型的多样性。因此,通过构建不同特征的词嵌入向量实现语义轨迹的向量化,如图3所示,具体如下:
空间特征提取。针对由纬度Vlat和经度Vlng组成的空间特征,采用网格法将空间特征进行离散化,获得语义补偿轨迹点在空间网格上的位置编码Vsp。其中,网格公差值dlat,dlng由数据集中最大的空间跨度决定和轨迹序列的长度决定,如式(16)所示。
式中Δdlat、Δdlng分别表示网格的纬度公差值和经度公差值。lngmax,lngmax表示所有轨迹访问点中的经度最大值和最小值。latmax,latmin表示所有轨迹访问点中的纬度最大值和最小值格,其拐点对应的网格值就作为位置编码Vsp。再将所有语义轨迹序列Ts的空间位置编码特征输入到skipGram空间特征嵌入模型,通过最大化公式(18)实现每个网格单元向量化。
式中,N表示轨迹的长度;w表示滑动窗口的大小;ct+j表示当前滑动窗口j的单元格ct的相邻单元格,并且可通过softmax函数计算相邻单元格的概率,表示为:
式中,cj表示当前单元格ci的轨迹上下文单元格;v表示单元格的向量;从而实现轨迹的空间特征嵌入fsp。
针对时间特征,采用时间切片将语义轨迹点的时间戳映射到时间单元格进行离散化,获得语义轨迹点在时间单元上的位置编码Vt。
式中δt表示所有轨迹序列的时间跨度;m表示所有补偿轨迹序列中轨迹访问点数的最大值。再将所有语义轨迹序列Ts的时间戳位置编码特征输入到skipGram时间特征嵌入模型。因此,获得Ts的时间特征向量ft。
根据人们日常生活活动地可以将其分为9种不同的属性,分别是交通枢纽、商业场所、行政区场所、小型消费场所、运动场所、学校场所、办公场所、打卡地场所、停留区。通过Glove模型学习语义标签的向量表达式,并通过最小化Glove模型的损失函数学习出最优的向量表达式,表示为:
式中wi,wk表示关键词i,j的词向量;bi,bk表示偏差项;f是权重函数;针对语义特征Vs作为该模型的输入,通过Glove模型进行词嵌入得到该语义特征的向量Vs。从而获得Ts的语义特征向量fs。
针对轨迹拐点特征,将语义轨迹序列Ts的轨迹拐点特征输入到skipGram拐点特征嵌入模型,获得Ts的拐点特征向量fT。
将上述特征向量化后,通过语义特征向量连接操作实现语义特征融合。因此,语义轨迹Ts中的任意轨迹点Tk经词嵌入后可以由语义轨迹向量Ts中的Tk进行向量表示:
Tk=contact(ft(k),fs(k),fsp(k),fT(k)) (26)
Ts={T1,T2,…,TN} (27)
式中,Ts表示语义轨迹序列的表征向量;Tk表示Ts中第k个轨迹访问点的语义特征向量,其中k∈(1,2,…,N);contact()表示等距离向量连接符;fs(k),ft(k),fsp(k),fT(k)依次表示第k个轨迹访问点的语义特征向量,时间特征向量,空间特征向量,拐点特征向量。
在本发明实施例中,步骤S7中,需要构建出模型来提取出经过轨迹点补偿后,且具有特征影响力的语义轨迹向量。本发明的模型是基于seq2seq模型并在其编码器和解码器部分采用双向BILSTM组成。将低采样语义轨迹向量和对应的高采样语义轨迹向量构成轨迹对,将低采样语义轨迹向量作为编码器输入,将高采样语义轨迹向量作为解码器输入,目标是通过最小化相应的高采样语义轨迹向量的重构误差来学习低采样语义轨迹向量;通过挖掘出上下文轨迹点之间的时空、语义、拐点特征的相关性,构建TP-BILSTM模型的中间向量。同时,针对时空、语义、拐点特征引入了注意力机制用于关注不同特征对计算轨迹相似度的影响力,如图4所示。
通过对语义轨迹向量Ts进行轨迹向量点抽样获得低采样轨迹向量Tsl,将语义轨迹向量Ts作为高采样轨迹向量Tsh。将Tsl作为以BiLSTM神经网络模型为编码器的输入,将Tsh作为以BiLSTM神经网络模型为解码器的输出,来训练TP-BiLSTM神经网络模型。通过BiLSTM模型对轨迹特征fs(k),ft(k),fsp(k),fT(k)学习得到上下文轨迹点之间的依赖关系,得到将输入的低采样轨迹向量到输出的真实轨迹向量所映射的中间向量Tm。其中中间向量Tm是由编码器BiLTSM模型的隐藏层矩阵α和解码器BiLTSM模型的隐藏层β拼接而成。
考虑到Tsl语义轨迹向量被压缩为固定长度后导致语义向量信息部分失真以及实现轨迹补偿,因此在encoder编码器阶段引入多特征注意力机制MT-Attention。通过encoder编码对Tsl进行编码得到编码向量,给定的某个输入,并将其时间、空间、语义和拐点映射到3个高维空间Q、K、R权重矩阵,通过三个高维空间挖掘轨迹点的时空、语义与拐点之间的依赖关系。
多特征注意力机制的具体实现方法利用上一层神经网络的隐藏状态和记忆单元状态值计算当前时刻的细胞状态来计算特征权重矩阵值ωij,再通过softmax函数对权重值实现归一化处理:
ωtj=β1tanh(Ξ(1)[ht-1,qt-1]+Ξ(2)T(.,j)+α1) (29)
其中,T(.,j)表示在轨迹多特征注意力机制中,从轨迹特征矩阵中提取的第j个轨迹访问点的三维特征向量。表示模型学习到的参数矩阵;d表示特征因子的维数。最后根据权重值ωij和轨迹特征矩阵Ts计算得到语义轨迹的时空、语义和拐点特征的注意力矩阵Ep。
T(i,.)={T(i,1)αt1,T(i,2)αt2,…,T(i,T)αtT} (31)
Ep={T(1,.),T(2,.),…,T(4d,.)} (32)
式中T(n,.)表示注意力嵌入矩阵的第n行向量表示。T(i,j),j∈(1,2,…,T)表示注意力嵌入矩阵的第i行,第j列元素。
构建完MT-Attention注意力机制后,将目标采样轨迹Tsl作为encoder的输入,中间向量Tm将其转换成真实轨迹向量Tsh。从而解决了轨迹点缺失对根据轨迹相似度挖掘伴随车导致不准确的问题,实现了轨迹补偿。
TP-BILSTM模型是基于seq2seq模型构建。TP-BILSTM模型通过对输入的低采样语义轨迹向量进行编码,并且嵌入MT-Attention强化语义特征向量因子,再将模型学习到的上下文中间向量作为解码器的输入,同时利用上一时刻的输出值和上一时刻的递归状态进行计算,最终生成解码器输出的新语义轨迹向量。值得一提的是,在训练阶段,编码器和解码器都采用了BILSTM神经网络模型。在编码器部分,嵌入了多特征注意力机制的BILSTM模型,通过正向和反向神经网络重点学习低采样语义轨迹向量的正向语义特征关系和反向语义特征的上下文关系,并将提取到的特征向量作为编码器的输出;嵌入MT-Attention对编码器输出的向量进行处理,从而提高语义轨迹向量中语义特征向量对轨迹相似度的影响力。在解码器部分,将高采样语义轨迹向量作为BILSTM模型的输入,通过正向和反向神经网络学习向量的上下文关系并将学习后向量作为编码器的学习目标,从而构建TP-BILSTM模型的上下文中间向量。在测试阶段,将低采样语义轨迹向量Tsl作为TP-BILSTM模型的输入,先经过多特征注意力矩阵Ep强化特征因子的影响力,再通过具有时空和语义相关性的上下文中间矩阵Tm生成语义轨迹向量Tsh,生成的Tsh就是低采样轨迹经过轨迹点补偿后的语义轨迹向量。为了区分不同车辆的语义轨迹向量的表示,本文将Tsh以代替。同理,将其余的语义轨迹向量也作为TP-LSTM模型的地位采样轨迹输入,按照以上描述将输入映射成为补偿后的语义轨迹向量
在本发明实施例中,步骤S8中,如图5所示,需要获取不同车辆的语义轨迹向量先将每个车辆的各个语义轨迹向量进行归一化,再利用曼哈顿法或者其他相似度距离算法来计算不同车辆的轨迹语义向量之间的相似度,最终实现伴随车辆的识别分类任务。
其中,i表示softmax层的输出节点编号;N输入向量的维度;TSM(i)表示输入第i个向量经归一化处理后的输出值。因此归一化后的轨迹向量可以如下表示:
因此,归一化后的轨迹向量之间的相似度距离可以由如下公式进行表示:
其中,Ti,Tj表示轨迹i和轨迹j;N表示Ti,Tj的最长轨迹点数。
根据对不同轨迹之间的相似度d(Ti,Tj)绘制热力图。以车牌号作为热力图的横纵坐标,将车辆与车辆之间的轨迹相似度进行可视化操作。通过热力图的某一行或列所体现的相似程度,从而实现伴随车识别。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (8)
1.一种基于语义轨迹的伴随车辆识别方法,其特征在于,所述方法包括:
获取交通轨迹数据集和轨迹语义词汇表;所述交通轨迹数据集至少包括纬度特征、经度特征、时间特征、车牌特征、车身颜色特征、车辆品牌特征和车辆类别特征;所述轨迹语义词汇表包括轨迹访问点的经度信息、纬度信息以及相应的语义信息;
对所述交通轨迹数据集进行处理,基于车辆不同特征得到车辆时序轨迹序列;
采用多特征匹配的数据补全方法对所述车辆时序轨迹序列进行轨迹数据补全,得到车辆补偿轨迹序列;
对所述轨迹语义词汇表与所述车辆补偿轨迹序列进行特征匹配,将轨迹语义词汇表中的值作为车辆轨迹点的语义标签,得到语义轨迹补偿序列;
计算出所述车辆补偿轨迹序列的上下文轨迹点的拐点夹角,利用拐点特征优化所述语义轨迹补偿序列;
采用多特征向量化模型对优化后的语义轨迹补偿序列进行向量化处理,提取出语义轨迹补偿序列的空间特征向量、时间特征向量、拐点特征向量和语义特征向量,将各个特征向量进行融合,生成语义轨迹向量;
将所述语义轨迹向量按照轨迹对输入到基于多特征注意力机制的双向BILSTM模型中,利用注意力机制学习上下文轨迹点,并对轨迹点进行补偿,从而输出补偿后的语义轨迹向量;
计算出不同车辆的语义轨迹向量之间的相似度,根据所述相似度进行独热编码,根据独热编码状态识别出同类别的伴随车辆。
2.根据权利要求1所述的一种基于语义轨迹的伴随车辆识别方法,其特征在于,采用多特征匹配的数据补全方法对所述车辆时序轨迹序列进行轨迹数据补全包括以所述时间特征为索引,以车牌特征为查询条件获得车牌时轨迹序列,以所述时间特征为索引,以车身颜色特征和车辆品牌特征为查询条件,获得车辆附属属性时轨迹序列;对所述车牌时轨迹序列和所述车辆附属属性时轨迹序列进行全局匹配,通过动态捕捉进行轨迹数据补全,获得车辆补偿轨迹序列。
3.根据权利要求1所述的一种基于语义轨迹的伴随车辆识别方法,其特征在于,对所述轨迹语义词汇表与所述车辆补偿轨迹序列进行特征匹配,将轨迹语义词汇表中的值作为车辆轨迹点的语义标签,得到语义轨迹补偿序列包括将轨迹语义词汇表的经度信息和纬度信息与所述车辆补偿轨迹序列的纬度特征和经度特征进行特征匹配,将轨迹语义词汇表的语义信息值作为车辆补偿轨迹序列中各个车辆轨迹点的语义标签,为所述车辆补偿轨迹序列生成语义轨迹补偿序列。
4.根据权利要求1所述的一种基于语义轨迹的伴随车辆识别方法,其特征在于,计算出所述车辆补偿轨迹序列的上下文轨迹点的拐点夹角,利用拐点特征优化所述语义轨迹补偿序列包括在语义轨迹点的空间特征中引入拐点特征,生成具有拐点特征的语义轨迹补偿序列。
6.根据权利要求1所述的一种基于语义轨迹的伴随车辆识别方法,其特征在于,采用多特征向量化模型对优化后的语义轨迹补偿序列进行向量化处理包括采用网格法将空间特征进行离散化,获得语义轨迹点在空间网格的位置编码;将语义轨迹补偿序列中空间网格的位置编码输入到skipGram空间特征嵌入模型中,将网格单元向量化,将语义轨迹点的上下文特征映射到空间单元格中,从而提取出语义轨迹补偿序列的空间特征向量;采用时间切片将语义轨迹点的时间戳映射到时间单元格上进行离散化,获得语义轨迹点在时间单元上的位置编码;将语义轨迹补偿序列中时间戳的位置编码特征输入到skipGram时间特征嵌入模型中,从而获得语义轨迹补偿序列的时间特征向量;将用户日常生活活动地划分为多个属性,将不同属性分别作为相应的语义标签,将各个语义标签输入到Glove模型中学习语义标签的向量表达式,从而获得语义轨迹补偿序列的语义特征向量;将语义轨迹补偿序列的拐点特征输入到skipGram拐点特征嵌入模型中,从而获得拐点特征向量。
7.根据权利要求1所述的一种基于语义轨迹的伴随车辆识别方法,其特征在于,对轨迹点进行补偿的过程包括将所述语义轨迹向量作为高采样轨迹向量,将所述语义轨迹向量进行轨迹向量点抽样获得低采样轨迹向量;将所述低采样轨迹向量的轨迹对作为双向BILSTM模型的编码器输入,利用多特征注意力机制学习具有特征影响力的上下文轨迹点,利用学习到的上下文轨迹点进行轨迹点补偿,并将补偿后的低采样轨迹向量的轨迹对作为双向BILSTM模型的解码器输出;通过优化补偿后的低采样轨迹向量与高采样轨迹向量之间的距离,训练基于多特征注意力机制的双向BILSTM神经网络模型;利用训练完成的基于多特征注意力机制的双向BILSTM神经网络模型对所述语义轨迹向量的所有轨迹点进行补偿,更新所述语义轨迹向量。
8.根据权利要求1所述的一种基于语义轨迹的伴随车辆识别方法,其特征在于,所述计算出不同车辆的语义轨迹向量之间的相似度包括对基于多特征注意力机制的双向BILSTM模型中处理后的语义轨迹向量进行归一化,利用相似度算法计算出不同车辆之间的语义轨迹向量之间的相似度;对当前车辆与目标车辆之间的相似度进行独热编码,当热力图的某一行或者某一列的相似度超过预设阈值时,则识别出目标车辆为当前车辆的伴随车辆。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211004516.4A CN115359437A (zh) | 2022-08-22 | 2022-08-22 | 一种基于语义轨迹的伴随车辆识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211004516.4A CN115359437A (zh) | 2022-08-22 | 2022-08-22 | 一种基于语义轨迹的伴随车辆识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115359437A true CN115359437A (zh) | 2022-11-18 |
Family
ID=84003246
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211004516.4A Pending CN115359437A (zh) | 2022-08-22 | 2022-08-22 | 一种基于语义轨迹的伴随车辆识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115359437A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117709394A (zh) * | 2024-02-06 | 2024-03-15 | 华侨大学 | 车辆轨迹预测模型训练方法、多模型迁移预测方法及装置 |
-
2022
- 2022-08-22 CN CN202211004516.4A patent/CN115359437A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117709394A (zh) * | 2024-02-06 | 2024-03-15 | 华侨大学 | 车辆轨迹预测模型训练方法、多模型迁移预测方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114067160B (zh) | 基于嵌入平滑图神经网络的小样本遥感图像场景分类方法 | |
CN108629978B (zh) | 一种基于高维路网和循环神经网络的交通轨迹预测方法 | |
CN110414432B (zh) | 对象识别模型的训练方法、对象识别方法及相应的装置 | |
CN111400620B (zh) | 基于时空嵌入Self-Attention的用户轨迹位置预测方法 | |
CN109034448B (zh) | 基于车辆轨迹语义分析和深度信念网络的轨迹预测方法 | |
CN112527938A (zh) | 基于自然语言理解的中文poi匹配方法 | |
Jin et al. | Transformer-based map-matching model with limited labeled data using transfer-learning approach | |
CN110072183B (zh) | 基于群智感知的被动式定位指纹库构建方法 | |
CN113068131B (zh) | 一种用户移动方式和轨迹的预测方法、装置、设备及存储介质 | |
CN115545758B (zh) | 城市服务设施自适应增量选址的方法和系统 | |
CN115359437A (zh) | 一种基于语义轨迹的伴随车辆识别方法 | |
Tsiligkaridis et al. | Personalized destination prediction using transformers in a contextless data setting | |
CN110990678B (zh) | 基于增强型循环神经网络的轨迹相似性计算方法 | |
CN115205905A (zh) | 一种应用于煤矿井下工种识别的员工移动模式学习方法 | |
CN115690549A (zh) | 一种基于并联交互架构模型实现多维度特征融合的目标检测方法 | |
CN118155746A (zh) | 一种预测分子性质的双通道对比模型 | |
CN117874448A (zh) | 一种基于Transformer的时空气象预测方法 | |
CN113743239A (zh) | 行人重识别方法、装置及电子设备 | |
Tsintotas et al. | Online Appearance-Based Place Recognition and Mapping: Their Role in Autonomous Navigation | |
Zhang et al. | LIFE: Learning individual features for multivariate time series prediction with missing values | |
Aparna et al. | Spatio-temporal data clustering using deep learning: A review | |
CN117390506A (zh) | 一种基于网格编码与TextRCNN的船舶路径分类方法 | |
CN113420821A (zh) | 一种基于标记和特征局部相关性的多标记学习方法 | |
CN115062708A (zh) | 一种基于轨迹偏差点嵌入和深度聚类的异常节点检测方法 | |
Song et al. | Human behavior recognition based on multi-feature fusion of image |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |