CN116341721B - 一种基于车辆轨迹的运行目的地预测方法及系统 - Google Patents
一种基于车辆轨迹的运行目的地预测方法及系统 Download PDFInfo
- Publication number
- CN116341721B CN116341721B CN202310191151.9A CN202310191151A CN116341721B CN 116341721 B CN116341721 B CN 116341721B CN 202310191151 A CN202310191151 A CN 202310191151A CN 116341721 B CN116341721 B CN 116341721B
- Authority
- CN
- China
- Prior art keywords
- entity
- track
- entities
- destination
- representing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000007477 logistic regression Methods 0.000 claims abstract description 9
- 230000029305 taxis Effects 0.000 claims abstract description 9
- 238000011144 upstream manufacturing Methods 0.000 claims description 9
- 239000011159 matrix material Substances 0.000 claims description 8
- 230000007774 longterm Effects 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 5
- 239000013598 vector Substances 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 4
- 238000012549 training Methods 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 3
- 238000007418 data mining Methods 0.000 abstract description 2
- 230000002457 bidirectional effect Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000005096 rolling process Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 241001601331 Sphingomonas taxi Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2474—Sequence data queries, e.g. querying versioned data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0645—Rental transactions; Leasing transactions
-
- G06Q50/40—
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Abstract
本发明公开了一种基于车辆轨迹的运行目的地预测方法及系统,涉及大数据挖掘技术领域,该方法包括以下步骤:获取出租车的历史轨迹,按时间顺序组成起点、车道、交叉口与目的地四个空间本体集合及其关系集合;将其组成多个三元组,构建轨迹知识图谱;采用关系图卷积网络通过不同的空间关系类型分别对多个三元组中的多个实体进行卷积,得到轨迹知识图谱中多个实体嵌入表示;将其按轨迹序列进行排列,将排列后的多个实体嵌入表示输入到门控递归单元模型中;将门控递归单元模型的输出结果和元数据通过全连接层,使用多分类逻辑回归模型对目的地进行预测。本发明可以捕捉轨迹数据中的空间位置拓扑结构,也可以捕捉轨迹数据的动态时序变化。
Description
技术领域
本发明涉及大数据挖掘技术领域,特别是涉及一种基于车辆轨迹的运行目的地预测方法及系统。
背景技术
作为城市交通系统的重要组成部分,配备GPS的出租车可以被视为无处不在的移动传感器,不断探测城市的节奏和脉搏,并产生大量的轨迹数据。出租车目的地预测,即基于部分轨迹预测其目的地。准确、高效的出租车目的地预测对出租车合理调控和配置、个性化广告服务和城市交通智能规划起重要作用。
现有的出租车目的地预测方法可分为基于马尔科夫模型及其变体和基于深度学习模型预测方法两大类。基于马尔科夫模型及其变体的方法使用马尔可夫转移矩阵乘法获得两个位置之间的转移概率,进而确定未来最可能达到的位置。基于深度学习的目的地预测方法是将目的地预测转化为多分类任务。具体来讲,将出租车轨迹数据看作图片或时序序列,利用CNN、RNN或LSTM等模型预测目的地。
但是基于马尔科夫模型及其变体的方法存在冷启动、无法捕捉轨迹数据中的位置长期依赖性和时空特征等问题。基于CNN的预测方法虽然为轨迹的空间信息进行了建模,但忽视了轨迹中的时序特征;基于RNN或LSTM的方法较好的利用了轨迹中的时序信息,但不足以明确显示轨迹的二维空间特征,比如经过的路段和交叉口数量等。
发明内容
本发明提供了一种基于车辆轨迹的运行目的地预测方法及系统,可以解决现有技术中存在的问题。
本发明提供一种基于车辆轨迹的运行目的地预测方法,包括以下步骤:
获取出租车的历史轨迹和元数据,将历史轨迹按时间顺序组成起点O、车道L、交叉口I与目的地D四个空间本体集合及其关系集合;
将四个空间本体集合及其关系集合组成多个三元组,通过多个三元组构建轨迹知识图谱;
采用关系图卷积网络通过不同的空间关系类型分别对多个三元组中的多个实体进行卷积,得到轨迹知识图谱中多个实体嵌入表示;
将多个实体嵌入表示按轨迹序列进行排列,将排列后的多个实体嵌入表示输入到门控递归单元模型中,对其时序特征进行捕捉;
将门控递归单元模型的输出结果和元数据通过全连接层,使用多分类逻辑回归模型对目的地进行预测。
优选的,所述四个空间本体集合为C,C={O,L,I,D};四个空间本体关系集合为R,R={origin_link,link_intersection,intersection_link,link_destination},其中origin_link表示起始关系集合,link_intersection表示车道到交叉口连接关系集合,intersection__link表示车道到交叉口连接关系集合,link_destination表示车道到目的地的终止关系集合。
优选的,所述三元组为{<hi,ri,ti>|ti,hi∈C,ri∈R},hi和tj均属于空间实体,分别表示头实体和尾实体,ri表示从头实体到尾实体的空间关系。
优选的,采用关系图卷积网络通过不同的空间关系类型分别对多个三元组中的多个实体进行卷积,得到轨迹知识图谱中多个实体嵌入表示,具体包括以下步骤:
对不同的关系类型训练不同的权重矩阵;
将某一空间本体作为中心实体,找出与该空间本体有任何空间关系的上下游实体并进行卷积,结合不同的权重矩阵得到具有空间的各个实体的嵌入表示。
优选的,使用两层R-GCN来生成轨迹知识图谱中各实体的嵌入表示:
式中,vi表示各个实体,vi∈{O,I,L,D},v’i表示各个中心实体的嵌入表示,表示第一层的随机初始化值,/>表示邻居实体在第一层与第二层的嵌入表示,Nr i表示关系r下与实体vi连边的邻居实体,ci,r表示归一化常数,ci,r=|Nr i|,Wr (0)、Wr (1)、W0 (0)、W0 (1)表示第一层与第二层中不同关系下的权重矩阵,σ代表激活函数。
优选的,将多个实体嵌入表示按轨迹序列进行排列,将排列后的多个实体嵌入表示输入到门控递归单元模型中,对其时序特征进行捕捉,具体包括以下步骤:
将多个实体嵌入表示v’i按轨迹序列进行排列,获得出租车轨迹路径的表示P’;
将P’输入至门控递归单元模型;
门控递归单元模型通过重置门捕获P’的短期依赖关系,通过更新门捕获P’的长期依赖关系;
根据t-1时刻传递下来的不同时间范围内的依赖关系和当前轨迹信息,获取时间t的输出与传递到下一节点的依赖关系。
优选的,将P’输入至门控递归单元模型进行时序特征的捕捉,通过下式进行表示:
ut=σ(Wu[Pt'2,ht-1]+bu)
rt=σ(Wr[Pt'2,ht-1]+br)
ct=tanh(Wc[Pt'2,rt*ht-1]+bc)
ht=ut*ht-1+(1-ut)*ct)
式中,rt表示重置门,ut表示更新门,ct表示在时间t存储的存储器内容,ht表示时间t的输出状态,ht-1表示时间t-1的隐藏状态,Pt’表示时间t的轨迹节点信息,w表示权重矩阵,b表示向量。
优选的,所述元数据包括一天中的时间、节假日、工作日以及轨迹出发时间。
一种基于车辆轨迹的运行目的地预测系统,包括:
数据获取模块,用于获取出租车的历史轨迹和元数据,将历史轨迹按时间顺序组成起点O、车道L、交叉口I与目的地D四个空间本体集合及其关系集合;
轨迹知识图谱构建模块,用于将四个空间本体集合及其关系集合组成多个三元组,通过多个三元组构建轨迹知识图谱;
空间实体学习模块,用于采用关系图卷积网络通过不同的空间关系类型分别对多个三元组中的多个实体进行卷积,得到轨迹知识图谱中多个实体嵌入表示;
时序特征学习模块,用于将多个实体嵌入表示按轨迹序列进行排列,将排列后的多个实体嵌入表示输入到门控递归模块模型中,对其时序特征进行捕捉;
预测模块,用于将门控递归单元模型的输出结果和元数据通过全连接层,使用多分类逻辑回归模型对目的地进行预测。
与现有技术相比,本发明的有益效果是:
本发明首先为出租车轨迹数据构建了知识图谱,为目的地预测提供丰富和多元的交通语义信息,然后使用R-GCN通过实体间的关系传播知识图谱中相邻节点(即本体)间的特征,得到具有节点自身特征以及与周围节点空间位置特征的嵌入表示,再利用GRU模型捕获轨迹中不同位置的时序特征。既可以捕捉轨迹数据中的空间位置拓扑结构,获取空间相关性;也可以捕捉轨迹数据的动态时序变化,获取时间依赖性。最后加入时间信息的元数据,使用多分类逻辑回归得到在每类目的地的概率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的一种基于车辆轨迹的运行目的地预测方法流程图;
图2为本发明的车道小段的示意图;
图3为本发明的基于车道的交叉口的示意图;
图4为本发明的轨迹知识图谱本体示意图;
图5为本发明的一种基于车辆轨迹的运行目的地预测系统的流程图;
图6为本发明的针对轨迹知识图谱进行空间特征表示学习的具体流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参照图1,本发明提供了一种基于车辆轨迹的运行目的地预测方法,包括以下步骤:
第一步:获取出租车的历史轨迹,按时间顺序组成起点O、车道L、交叉口I与目的地D四个空间本体集合及其关系集合。
出租车是运行在道路网络上的。对轨迹数据的空间信息进行建模首先需要对路网进行建模。现有大部分研究工作将路口、路口之间的路段作为研究对象。然而,现实中同一路段上具有多车道。因此,本发明以车道(link)作为基本处理单元。图2展示了一个包括路口和路段(包括单向车道和双向车道)的路网示意图,其中含有3个路口(即i1、i2和i3),13个车道(即l1至l13)。i2与i3之间的是双向单车道,即包括l5和l10。l6、l7、l8和l9是双向四车道。
有了车道,将路网上的路口定义为基于车道的交叉口集合。以十字路口为例进行定义,但也可适用于其他的路口类型。一个十字路口(intersection)I包括4个方向,即东(E)、南(S)、西(W)、北(N)。一般的,在每一个交叉口方向上的具有流入(Infow)和流出(outfow)2个子方向。因此,一个路口包括8个方向的车道。
参照图3,给定一个路口I,其8个方向的车道集合记为I={CNI,CNO,CSI,CSO,CWI,CWO,CEI,CEO}。(CNI,CNO)表示以路口为基准,在其北面方向上的流入、流出的车道集合,一个方向上可能存在多车道的情况。同理,(CSI,CSO)(CWI,CWO)、(CEI,CEO)是其南面(西面、东面)方向上的流入、流出车道集合。因此,一个基于车道的交叉口可以被定义为在交通规则允许的情况下,任意两个车道组成的序列,形式化的记为<Li,Lj>,其中Li∈L,Lj∈L,i≠j。I是8个方向下的任意一条车道。
以路口I2为例,CNI={l3},CNO={l4},CSI={l11},CSO={l12},CWI={l13},CWO={l2},CEI={l5},CEO={l10}。<l5,l10>表示从车道l5到车道l10的车道级别交叉口。此外<l5,l10>代表掉头,即出租车从车道l5转向车道l10。直观上,车辆轨迹是由车道和车道交叉口组成的序列。
一条基于车道的车辆轨迹表示为T=(L,I),其中L是轨迹T中经过的车道集合,记为L={Li};I是轨迹经过的车道交叉口集合,记为I={<Lj,Lj>|Lj∈L,1≤j≤|L|-1},其中<Lj,Lj>表示从车道Lj到车道lj的车道交叉口。
例如,T={{l5,l2,l1},{<i2,i1>}}表示轨迹T经过3个车道、2个车道交叉口。
分析出租车轨迹不难发现,一条车辆轨迹中反映了乘客的上车位置即起点、下车位置即目的地,经过的车道和车道交叉口。
(1)起点和目的地:不同的起点会对目的地的偏好会有影响,例如起点为商业区,终点更可能为住宅区;而起点为住宅区,那么目的地可能会有更多的选择公园、商场、超市等等。此外时间与起点的综合考虑也会影响到目的地预测,因为即使从相同的起始点出发,取决于工作日或者是双休日,出租车目的地可能是截然不同的。(2)路网结构:即使在同一个时间段同一个地点出发的车辆,如果选择了不同的前行方向,也会有不同目的地。轨迹的选择即取决于路网结构,不同的路网结构可以决定出行轨迹的不同模式。而路网结构是由车道和交叉口所组成的,车辆在行驶中会对某些车道小段有偏好或者轨迹中红绿灯个数及等待时间也会对车辆行驶形成影响。
通过将轨迹数据中所包含的如车道方向、上下游等信息、通行中的相互关联融入到轨迹知识图谱之中,从而实现路网结构的刻画以供接下来的使用。
因此,出租车轨迹中包含的空间本体有起点O、车道L、交叉口I、目的地D。在出租车轨迹数据中,空间本体之间具有4种有意义的关系:
(1)起始关系,即起点到车道<O,L>,用户可以在一条车道的任意位置上车,将这条车道作为起点。特别的,如果交叉口作为起点,则认为其在运动方向车道作为起点。例如,在上面的轨迹T例子中,车道L2为起点。
(2)终点关系,即车道到目的地<L,D>。用户可以在车道的任意位置下车作为目的地。如果用户在交叉口作为目的地,则认为其在运动方向车道作为目的地。
(3)车道到交叉口的连接关系,即<L,I>,表示车辆从车道行驶到了交叉口。从交叉口的角度,<L,I>代表流入。
(4)交叉口到车道的连接关系,即<I,L>表示从交叉口行驶至直接相连的车道。从交叉口的角度,<I,L>代表流出。
参照图4,将轨迹知识图谱本体表示为TOntology=(C,R),其中空间实体集合C由四个不同集合组成,记为C={O,L,I,D},其中,S表示起点集合,L表示车道集合,I表示交叉口集合,D表示目的地集合。R即空间关系集合,R={origin_link,link_intersection,intersection_link,link_destination},其中origin_link表示起始关系集合,形式化的表示为origin_link={<O,L>|O∈O,L∈L};link_intersection表示车道到交叉口连接关系集合,形式化的表示为link_intersection={<L,I>|L∈L,I∈I};intersection_link表示车道到交叉口连接关系集合,形式化的表示为intersection_link{<I,L>|L∈L,I∈I}、link_destination表示车道到目的地的终止关系,形式化的表示为link_destination={<L,D>|D∈D,L∈L}。
第二步:将四个空间本体集合及其关系集合组成多个三元组,通过多个三元组构建轨迹知识图谱。
轨迹知识图谱以三元组进行表示和存储,即TRKG={<hi,ri,ti>|Ei,hi∈C,r∈R},,hi和tj均属于空间实体,分别表示头实体和尾实体,ri表示从头实体到尾实体的空间关系。例如三元组(l2,link_intersection,i2)表示从车道l2行驶至交叉口i2。
轨迹过短会使数据信息量过少,不足以学习轨迹的时空特征;轨迹过长会使其复杂度增加,不利于数据分析的进行。因此删除时间及长度过长或过短的轨迹。对于清洗后的每个订单走过轨迹序列,按时间顺序组成起点、车道、交叉口与目的地的集合。判断连边类型,组成三元组,建轨迹知识图谱TRKG。
第三步:采用关系图卷积网络通过不同的空间关系类型分别对多个三元组中的多个实体进行卷积,得到轨迹知识图谱中多个实体嵌入表示。
知识图谱嵌入是使用嵌入表示知识图谱中的实体和关系。具体来说,将知识图谱中的实体和关系投影至低维连续空间中,获得一个分布式表示。通过知识图谱的嵌入可以获得图谱中不同实体之间的关联关系等更复杂性的特征,为下游应用铺平道路。针对于出租车目的地预测的任务,对知识图谱进行嵌入目的是为了得到具有空间关联的各实体的向量表示,使用关系图卷积网络R-GCN,其本质是利用图卷积网络的方法,对不同的关系类型训练不同的权重矩阵,然后获取不同关系下的上下游实体进行卷积,可以实现对轨迹知识图谱中存在的多种不同关系的邻居,分别进行空间特征的捕捉的特点。可更好的捕捉到轨迹知识图谱中实体的空间关系,并使同种类型的实体通过不同的关系进行卷积得到的向量也会具有较大的区别。
针对轨迹知识图谱进行空间特征表示学习中一层的具体实现如图6所示,黑框中为部分轨迹知识图谱,其中l1是车道,作为中心实体。R-GCN模型通过将l1作为中心实体,获得不同关系下的上下游邻居实体,即找出对于l1有起始关系origin_intersection、终止关系intersection_destination以及交叉口与车道之间的连接关系link_intersection、intersection_link下的各种不同实体,并且考虑出边以及入边关系。在上述关系下分别找出邻居实体,并建立不同的权重矩阵来刻画对l1的影响,这样经过卷积整合邻居特征以及自身特征得到对l1的嵌入l’1。得到具有空间及自身特征的各实体表示,用于进一步时间特征的学习。
使用两层R-GCN来生成轨迹知识图谱中各实体的嵌入表示:
式中,vi表示各个实体,vi∈{O,I,L,D},v’i表示各个中心实体的嵌入表示,表示第一层的随机初始化值,/>表示邻居实体在第一层与第二层的嵌入表示,Nr i表示关系r下与实体vi连边的邻居实体,ci,r表示归一化常数,ci,r=|Nr i|,Wr (0)、Wr (1)、W0 (0)、W0 (1)表示第一层与第二层中不同关系下的权重矩阵。
第四步:将多个实体嵌入表示按轨迹序列进行排列,将排列后的多个实体嵌入表示输入到门控递归单元模型中,对其时序特征进行捕捉。
针对出租车目的地的预测任务,还需要对出行产生的轨迹时间序列进行分析。因此将上一个模块获得的具有空间语义的实体嵌入表示按轨迹序列排列拼接,输入到门控递归单元模型GRU中,通过GRU单元的更新门和重置门获得历史轨迹的时间状态信息并忽略不重要的时间状态信息,获得轨迹的时间特征。
将多个实体嵌入表示按轨迹序列进行排列,将排列后的多个实体嵌入表示输入到门控递归单元模型中,对其时序特征进行捕捉,具体包括以下步骤:
将多个实体嵌入表示v’i按轨迹序列进行排列,获得出租车轨迹路径的表示P’;
将P’输入至门控递归单元模型;
门控递归单元模型通过重置门捕获P’的短期依赖关系,通过更新门捕获P’的长期依赖关系;
根据t-1时刻传递下来的不同时间范围内的依赖关系和当前轨迹信息,获取时间t的输出与传递到下一节点的依赖关系。
将P’送入GRU中进行时序特征的捕捉,通过下式进行表示:
ut=σ(Wu[Pt'2,ht-1]+bu)
rt=σ(Wr[Pt'2,ht-1]+br)
ct=tanh(Wc[Pt'2,rt*ht-1]+bc)
ht=ut*ht-1+(1-ut)*ct)
式中,rt为重置门,ut是更新门,ct是在时间t存储的存储器内容,ht是时间t的输出状态,ht-1表示时间t-1的隐藏状态,Pt’表示时间t的轨迹节点信息,w、b为权重矩阵和向量。
通过仔细选择输入来改变记忆单元的状态,并根据手头的任务记住或忘记其先前的状态,从而实现了长期的时间演化图记忆。
第五步:将门控递归单元模型的输出结果和元数据通过全连接层,使用多分类逻辑回归对最终轨迹目的地进行预测。
除了轨迹信息,还需提供上下文信息的元数据,即一天中的时间、节假日或工作日以及轨迹出发时间,这些上下文信息可增加对目的地的预测的准确性。在输出层中将GRU的输出结果与出发时间一起送至全连接层,获得最终轨迹目的地预测。
本发明的目的地预测是一个多分类预测问题,将目的地集合作为标签集。因此,采用交叉熵损失函数作为损失函数,定义如下:
其中元素pi表示轨迹属于第i类目的地的概率。y=[y0,...yc-1];c是目的地标签集合,即c∈D。
参照图5,基于同一个发明构思,本发明还提供一种基于车辆轨迹的运行目的地预测系统,包括数据获取模块、轨迹知识图谱构建模块、空间实体学习模块、时序特征学习模块和预测模块。数据获取模块用于获取出租车的历史轨迹和元数据,将历史轨迹按时间顺序组成起点O、车道L、交叉口I与目的地D四个空间本体集合及其关系集合。轨迹知识图谱构建模块用于将四个空间本体集合及其关系集合组成多个三元组,通过多个三元组构建轨迹知识图谱。空间实体学习模块用于采用关系图卷积网络通过不同的空间关系类型分别对多个三元组中的多个实体进行卷积,得到轨迹知识图谱中多个实体嵌入表示。时序特征学习模块,用于将多个实体嵌入表示按轨迹序列进行排列,将排列后的多个实体嵌入表示输入到门控递归模块模型中,对其时序特征进行捕捉。预测模块用于将门控递归单元模型的输出结果和元数据输入至全连接层,使用多分类逻辑回归模型对最终轨迹目的地进行预测。
实施例
为了验证本发明提出方法的有效性,将其与几个传统的算法进行比较。
使用中国在线打车公司滴滴出行,在深圳收集的出租车出行数据集。选取8月23日至8月29日的一周数据,其中70%作为训练数据集,30%作为测试数据集。表1列出了数据集的统计数据。表2列出构建的轨迹知识图谱的统计信息。
表1数据集统计信息
表2轨迹知识图谱统计信息
为了评估提出的方法的性能,使用平均预测精度(MPA@k)进行评估。MPA@k定义为:其中#hit trajs@k表示在top-k预测中包含正确目的地的轨迹条数,#test trajs表示总轨迹条数。指标越大,模型的性能越好。在本实施例中,选择k=1,5,10,20。
利用马尔可夫模型建立轨迹中各位置之间的转移关系,计算到达所有可达目的地的概率,并将最高概率的前k个位置将被输出为最可能的目的地。
利用双向LSTM层与注意机制,其中双向LSTM用来学习轨迹中前后位置的时序依存特征,而注意力机制捕捉与目的地具有强相关性的位置及其特征。将最高概率的前k个位置将被输出为最可能的目的地。
利用多层感知器(MLP),输入轨迹的开始k个点和最后k个点,并使用元数据,例如date,time等,输出每种目的地上的的概率分布。
先使用自适应注意力网络来建模轨迹位置的不同特征,再利用LSTM模拟先前位置对当前位置的长期和短期影响,捕捉轨迹数据中的时序依赖性,最后多类逻辑回归得到每种目的地上的的概率分布。
实现细节:在预处理阶段,首先选取深圳收集的2020年8月23日-8月29日一周的出租车出行数据。然后,去除过长以及过短的轨迹,此时数据集为原来的94.1%。根据4.1中的算法构建轨迹知识图谱后使用R-GCN对轨迹知识图谱进行嵌入表示,其中将嵌入维度设为节点数*100,使用两层R-GCN,输出层维度为节点数*10。接着使用GRU对轨迹进行时间特征学习,并加入时间信息(使用one-hot编码节假日、工作日以及轨迹开始时间),最后采用多分类得到所有目的地的概率分布。此外,将学习率设置为0.001,批次大小设置为100并采用Adam来优化模型中的参数。
表3显示了本发明的方法和7种基线算法在MPA@k评估的实验结果。其中使用行程的70%(前缀轨迹的长度)来预测轨迹目的地。其他基线算法的参数分别遵循其论文中的最佳设置。
表3不同算法的实验结果
根据实验结果,我们有以下观察结果。TOP显示所有设置下的最佳预测性能。随着k的增加,所有方法的平均预测精度都会增加。当k=20时,TOP的平均预测精度可以达到几乎80%。将其他三种方法与我们的TOP进行比较,基于神经网络的方法TALL和LATL比SubSyn具有更好的预测精度。我们提出的TOP显示了最佳性能。
例如,MPA@10TOP、TALL和LATL的误差分别比SubSyn高2.5%、10.1%和18.1%。这主要是由于SubSyn难以处理复杂的时间序列数据。同时,隐藏在轨迹中的空间相关性没有被利用,时空特征也没有被利用。比较其他三种方法,TALL、LATL和TOP都使用LSTM或GRU来学习时间特征。在空间方面,TALL使用注意力机制来学习空间特征,而LATL和TOP都使用图形结构来捕捉空间特征。在那里,TALL的MPA略低。毕竟,出租车在路网上行驶。图形模型有利于空间相关性学习。
对于基于图的方法,TOP的MPA略高于LATL的MPA。这是因为轨迹知识图使用不同的空间实体来表示空间对象,以及不同的空间关系来表示空间物体之间的关联。R-GCN充分利用了中心实体和邻居实体的特征。挖掘更多的空间语义。相比之下,LATL中使用的自适应注意网络仅反映道路网络拓扑。因此,LATL的MPA低于TOP。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (5)
1.一种基于车辆轨迹的运行目的地预测方法,其特征在于,包括以下步骤:
获取出租车的历史轨迹和元数据,将历史轨迹按时间顺序组成起点O、车道L、交叉口I与目的地D四个空间本体集合及其关系集合;
所述四个空间本体集合为C,C={O,L,I,D};四个空间本体关系集合为R,R={origin_link,link_intersection,intersection_link,link_destination},其中origin_link表示起始关系集合,link_intersection表示车道到交叉口连接关系集合,intersection_link表示交叉口到车道连接关系集合,link_destination表示车道到目的地的终止关系集合;
将四个空间本体集合及其关系集合组成多个三元组,通过多个三元组构建轨迹知识图谱;
所述三元组为{<hi,ri,ti>|ti,hi∈C,ri∈R},hi和tj均属于空间实体,分别表示头实体和尾实体,ri表示从头实体到尾实体的空间关系;
采用关系图卷积网络通过不同的空间关系类型分别对多个三元组中的多个实体进行卷积,得到轨迹知识图谱中多个实体嵌入表示;
将多个实体嵌入表示按轨迹序列进行排列,将排列后的多个实体嵌入表示输入到门控递归单元模型中,对其时序特征进行捕捉;
将门控递归单元模型的输出结果和元数据通过全连接层,使用多分类逻辑回归模型对目的地进行预测;
采用关系图卷积网络通过不同的空间关系类型分别对多个三元组中的多个实体进行卷积,得到轨迹知识图谱中多个实体嵌入表示,具体包括以下步骤:
对不同的关系类型训练不同的权重矩阵;
将某一空间本体作为中心实体,找出与该空间本体有任何空间关系的上下游实体并进行卷积,结合不同的权重矩阵得到具有空间的各个实体的嵌入表示;
使用两层R-GCN来生成轨迹知识图谱中各实体的嵌入表示:
式中,vi表示各个实体,vi∈{O,I,L,D},v’i表示各个中心实体的嵌入表示,表示第一层的随机初始化值,/>表示邻居实体在第一层与第二层的嵌入表示,Nr i表示关系r下与实体vi连边的邻居实体,ci,r表示归一化常数,ci,r=|Nr i|,Wr (0)、Wr (1)、W0 (0)、W0 (1)表示第一层与第二层中不同关系下的权重矩阵,σ代表激活函数。
2.如权利要求1所述的一种基于车辆轨迹的运行目的地预测方法,其特征在于,将多个实体嵌入表示按轨迹序列进行排列,将排列后的多个实体嵌入表示输入到门控递归单元模型中,对其时序特征进行捕捉,具体包括以下步骤:
将多个实体嵌入表示v’i按轨迹序列进行排列,获得出租车轨迹路径的表示P’;
将P’输入至门控递归单元模型;
门控递归单元模型通过重置门捕获P’的短期依赖关系,通过更新门捕获P’的长期依赖关系;
根据t-1时刻传递下来的不同时间范围内的依赖关系和当前轨迹信息,获取时间t的输出与传递到下一节点的依赖关系。
3.如权利要求2所述的一种基于车辆轨迹的运行目的地预测方法,其特征在于,将P’输入至门控递归单元模型进行时序特征的捕捉,通过下式进行表示:
ut=σ(Wu[Pt'2,ht-1]+bu)
rt=σ(Wr[Pt'2,ht-1]+br)
ct=tanh(Wc[Pt'2,rt*ht-1]+bc)
ht=ut*ht-1+(1-ut)*ct
式中,rt表示重置门,ut表示更新门,ct表示在时间t存储的存储器内容,ht表示时间t的输出状态,ht-1表示时间t-1的隐藏状态,Pt’表示时间t的轨迹节点信息,w表示权重矩阵,b表示向量。
4.如权利要求1所述的一种基于车辆轨迹的运行目的地预测方法,其特征在于,所述元数据包括一天中的时间、节假日、工作日以及轨迹出发时间。
5.一种基于车辆轨迹的运行目的地预测系统,其特征在于,包括:
数据获取模块,用于获取出租车的历史轨迹和元数据,将历史轨迹按时间顺序组成起点O、车道L、交叉口I与目的地D四个空间本体集合及其关系集合;
所述四个空间本体集合为C,C={O,L,I,D};四个空间本体关系集合为R,R={origin_link,link_intersection,intersection_link,link_destination},其中origin_link表示起始关系集合,link_intersection表示车道到交叉口连接关系集合,intersection_link表示交叉口到车道连接关系集合,link_destination表示车道到目的地的终止关系集合;
轨迹知识图谱构建模块,用于将四个空间本体集合及其关系集合组成多个三元组,通过多个三元组构建轨迹知识图谱;
所述三元组为{<hi,ri,ti>|ti,hi∈C,ri∈R},hi和tj均属于空间实体,分别表示头实体和尾实体,ri表示从头实体到尾实体的空间关系;
空间实体学习模块,用于采用关系图卷积网络通过不同的空间关系类型分别对多个三元组中的多个实体进行卷积,得到轨迹知识图谱中多个实体嵌入表示;
时序特征学习模块,用于将多个实体嵌入表示按轨迹序列进行排列,将排列后的多个实体嵌入表示输入到门控递归单元模型中,对其时序特征进行捕捉;
预测模块,用于将门控递归单元模型的输出结果和元数据通过全连接层,使用多分类逻辑回归模型对目的地进行预测;
采用关系图卷积网络通过不同的空间关系类型分别对多个三元组中的多个实体进行卷积,得到轨迹知识图谱中多个实体嵌入表示,具体包括以下步骤:
对不同的关系类型训练不同的权重矩阵;
将某一空间本体作为中心实体,找出与该空间本体有任何空间关系的上下游实体并进行卷积,结合不同的权重矩阵得到具有空间的各个实体的嵌入表示;
使用两层R-GCN来生成轨迹知识图谱中各实体的嵌入表示:
式中,vi表示各个实体,vi∈{O,I,L,D},v’i表示各个中心实体的嵌入表示,表示第一层的随机初始化值,/>表示邻居实体在第一层与第二层的嵌入表示,Nr i表示关系r下与实体vi连边的邻居实体,ci,r表示归一化常数,ci,r=|Nr i|,Wr (0)、Wr (1)、W0 (0)、W0 (1)表示第一层与第二层中不同关系下的权重矩阵,σ代表激活函数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310191151.9A CN116341721B (zh) | 2023-03-02 | 2023-03-02 | 一种基于车辆轨迹的运行目的地预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310191151.9A CN116341721B (zh) | 2023-03-02 | 2023-03-02 | 一种基于车辆轨迹的运行目的地预测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116341721A CN116341721A (zh) | 2023-06-27 |
CN116341721B true CN116341721B (zh) | 2023-10-31 |
Family
ID=86884988
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310191151.9A Active CN116341721B (zh) | 2023-03-02 | 2023-03-02 | 一种基于车辆轨迹的运行目的地预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116341721B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110555018A (zh) * | 2019-07-29 | 2019-12-10 | 浙江工业大学 | 一种交通流量补全与预测方法 |
CN111613048A (zh) * | 2019-02-26 | 2020-09-01 | 北京嘀嘀无限科技发展有限公司 | 车道信息检测方法、装置、电子设备及存储介质 |
CN113065074A (zh) * | 2021-04-02 | 2021-07-02 | 大连理工大学 | 一种基于知识图谱和自注意力机制的轨迹目的地预测的方法 |
CN114802296A (zh) * | 2022-03-17 | 2022-07-29 | 浙江工业大学 | 一种基于动态交互图卷积的车辆轨迹预测方法 |
CN115009275A (zh) * | 2022-08-08 | 2022-09-06 | 北京理工大学前沿技术研究院 | 面向城市场景下车辆轨迹预测方法、系统及存储介质 |
CN115169239A (zh) * | 2022-07-22 | 2022-10-11 | 福州大学 | 融合卷积、注意力和mlp的行程目的地预测方法 |
WO2022214414A1 (de) * | 2021-04-07 | 2022-10-13 | Zf Friedrichshafen Ag | Computerimplementiertes verfahren, computerprogramm und anordnung zum vorhersagen und planen von trajektorien |
WO2022222095A1 (zh) * | 2021-04-22 | 2022-10-27 | 深圳元戎启行科技有限公司 | 轨迹预测方法、装置、计算机设备和存储介质 |
CN115391563A (zh) * | 2022-09-01 | 2022-11-25 | 广东工业大学 | 一种基于多源异构数据融合的知识图谱链路预测方法 |
-
2023
- 2023-03-02 CN CN202310191151.9A patent/CN116341721B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111613048A (zh) * | 2019-02-26 | 2020-09-01 | 北京嘀嘀无限科技发展有限公司 | 车道信息检测方法、装置、电子设备及存储介质 |
CN110555018A (zh) * | 2019-07-29 | 2019-12-10 | 浙江工业大学 | 一种交通流量补全与预测方法 |
CN113065074A (zh) * | 2021-04-02 | 2021-07-02 | 大连理工大学 | 一种基于知识图谱和自注意力机制的轨迹目的地预测的方法 |
WO2022214414A1 (de) * | 2021-04-07 | 2022-10-13 | Zf Friedrichshafen Ag | Computerimplementiertes verfahren, computerprogramm und anordnung zum vorhersagen und planen von trajektorien |
WO2022222095A1 (zh) * | 2021-04-22 | 2022-10-27 | 深圳元戎启行科技有限公司 | 轨迹预测方法、装置、计算机设备和存储介质 |
CN114802296A (zh) * | 2022-03-17 | 2022-07-29 | 浙江工业大学 | 一种基于动态交互图卷积的车辆轨迹预测方法 |
CN115169239A (zh) * | 2022-07-22 | 2022-10-11 | 福州大学 | 融合卷积、注意力和mlp的行程目的地预测方法 |
CN115009275A (zh) * | 2022-08-08 | 2022-09-06 | 北京理工大学前沿技术研究院 | 面向城市场景下车辆轨迹预测方法、系统及存储介质 |
CN115391563A (zh) * | 2022-09-01 | 2022-11-25 | 广东工业大学 | 一种基于多源异构数据融合的知识图谱链路预测方法 |
Non-Patent Citations (3)
Title |
---|
出租车目的地预测的深度学习方法;崔淑敏 等;计算机工程与科学(第01期);全文 * |
基于轨迹大数据的司机出行知识图谱构建与实现;李璇 等;地理空间信息;第21卷(第1期);第32-35, 130页 * |
路网空间下基于马尔可夫决策过程的异常车辆轨迹检测算法;毛江云 等;计算机学报(第08期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116341721A (zh) | 2023-06-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang et al. | Trafficgan: Network-scale deep traffic prediction with generative adversarial nets | |
Peng et al. | Spatial temporal incidence dynamic graph neural networks for traffic flow forecasting | |
Chu et al. | Deep multi-scale convolutional LSTM network for travel demand and origin-destination predictions | |
Yuan et al. | A survey of traffic prediction: from spatio-temporal data to intelligent transportation | |
Mori et al. | A review of travel time estimation and forecasting for advanced traveller information systems | |
CN115565369A (zh) | 一种基于超图的时空超图卷积交通流量预测方法及系统 | |
Liu et al. | Exploiting spatiotemporal correlations of arrive-stay-leave behaviors for private car flow prediction | |
Xu et al. | AGNP: Network-wide short-term probabilistic traffic speed prediction and imputation | |
Wang et al. | TransGAT: A dynamic graph attention residual networks for traffic flow forecasting | |
Wang et al. | Inferring intersection traffic patterns with sparse video surveillance information: An st-gan method | |
Jiang et al. | Pedestrian volume prediction with high spatiotemporal granularity in urban areas by the enhanced learning model | |
Hasan et al. | Perception sensors based fusion system and method for controlling vehicle | |
Xu et al. | Urban short-term traffic speed prediction with complicated information fusion on accidents | |
Xu et al. | STDR: a deep learning method for travel time estimation | |
Zhao et al. | Lane line detection based on the codec structure of the attention mechanism | |
Xing et al. | STGs: construct spatial and temporal graphs for citywide crowd flow prediction | |
Kong et al. | Mobility trajectory generation: a survey | |
CN116341721B (zh) | 一种基于车辆轨迹的运行目的地预测方法及系统 | |
Zhao et al. | Developing a multiview spatiotemporal model based on deep graph neural networks to predict the travel demand by bus | |
Ramadan et al. | Traffic forecasting using temporal line graph convolutional network: Case study | |
Taguchi et al. | Online estimation and prediction of large-scale network traffic from sparse probe vehicle data | |
Mittal et al. | Analysis and designing of proposed intelligent road traffic congestion control system with image mosaicking technique | |
Gupta et al. | LSTM based real-time smart parking system | |
He et al. | Dyna-PTM: OD-enhanced GCN for metro passenger flow prediction | |
He et al. | Crowd-Sensing Enhanced Parking Patrol Using Sharing Bikes’ Trajectories |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |