CN117116048A - 基于知识表示模型和图神经网络的知识驱动交通预测方法 - Google Patents

基于知识表示模型和图神经网络的知识驱动交通预测方法 Download PDF

Info

Publication number
CN117116048A
CN117116048A CN202311088919.6A CN202311088919A CN117116048A CN 117116048 A CN117116048 A CN 117116048A CN 202311088919 A CN202311088919 A CN 202311088919A CN 117116048 A CN117116048 A CN 117116048A
Authority
CN
China
Prior art keywords
traffic
knowledge
graph
convolution
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311088919.6A
Other languages
English (en)
Inventor
周毅
刘奕含
宁念文
吕怡宁
石华光
张延宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Henan University
Original Assignee
Henan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Henan University filed Critical Henan University
Priority to CN202311088919.6A priority Critical patent/CN117116048A/zh
Publication of CN117116048A publication Critical patent/CN117116048A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • G06F18/15Statistical pre-processing, e.g. techniques for normalisation or restoring missing data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/042Knowledge-based neural networks; Logical representations of neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0137Measuring and analyzing of parameters relative to traffic conditions for specific applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Analytical Chemistry (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Chemical & Material Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Educational Administration (AREA)
  • Primary Health Care (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明提出了一种基于知识表示模型和图神经网络的知识驱动交通预测方法,步骤为:对采集到的交通数据进行预处理,根据传感器节点的位置构建交通路网拓扑图;将交通路网拓扑图中知识图谱中的实体和关系转换为低维向量,通过门控特征融合模块根据外部因素的重要性自适应且动态地将外部因素与交通特征进行融合并更新;将更新后的交通特征和邻接矩阵输入图卷积GCN;通过时空联合捕捉模块的扩张因果卷积对时间级与空间级上的交通特征联合捕捉生成预测速度;根据损失函数训练交通预测模型,进行测试得到预测的交通速度。本发明根据外部因素的重要性,自适应地对交通特征进行融合并动态更新,从而更好地反映交通特征的变化,提高了预测模型的准确性。

Description

基于知识表示模型和图神经网络的知识驱动交通预测方法
技术领域
本发明涉及交通预测的技术领域,尤其涉及一种基于知识表示模型和图神经网络的知识驱动交通预测方法。
背景技术
在城市化与机动化共同发展的今天,缓解交通拥堵成为各个城市交通管理工作中的当务之急。针对该问题进行道路交通预测,对城市交通控制系统以及交通管理系统具有重要的理论价值和现实意义。并且,准确的交通预测能够加强车辆、道路、管理部门和出行者之间的关系,进而提高交通运输效率。
随着智能交通系统的迅猛发展,先进的数据通讯技术、信息技术及控制技术被应用于地面交通管理系统中,扩大了交通管理系统的作用范围,并提升了实时性、准确性和效率。使得人们能够分析和研究产生的大量数据,以改善城市交通状况。目前,车载GPS、道路传感器和智能交通摄像机在城市道路上日益普及,这些智能设备能够收集数据并为交通管理系统提供辅助。此外,许多位置服务网站也提供了相关的接口,以供研究人员获得交通领域信息,如地理数据、兴趣点、道路网络、交通状况等信息。此外,通过爬虫或NLP(自然语言处理)等技术也可以获取与交通状况密切相关的因素信息,例如天气数据等。
面对城市交通信息化的加剧和智能化发展的时代要求,全面理解城市交通并将其视为解决问题的前提和核心关键变得至关重要。尽管交通系统智能化常通过数据驱动的方法实现,但多源数据融合是一个亟需解决的挑战。仅采用单纯的数据驱动分析方法会忽略先验知识,限制结果的准确性。因此,为了有效预测交通状况,融合多源数据并有效应用外部知识变得至关重要。探索如何有效表达城市交通知识和数字孪生城市交通,辅助公众更深入地认知和理解城市交通已成为智慧交通、智慧城市发展中急需解决的难题。这需要提升对城市交通的认知,结合领域知识和实际情境,以增强交通决策的科学性和准确性,同时利用数字孪生技术等手段模拟和仿真城市交通,更好地理解交通系统的复杂性和影响因素,为决策者提供数据支持和指导。因此,融合多源数据和利用外部知识,以促进对城市交通的全面认知与理解,是推动智慧交通和智慧城市可持续发展的关键。
申请号为202111465207.2的发明专利公开了一种多层时空交通知识图谱重建的交通预测方法,基于待预测区域的交通道路网数据构建交通知识图谱路网层,并基于所述待预测区域的实时路况数据、所述交通道路网数据和训练后的ST-GCN模型计算得到交通流量预测值;根据所述交通流量预测值对所述交通知识图谱路网层进行重建,得到交通知识图谱流量层;利用Mean-Shift算法对所述交通知识图谱流量层的流量数据进行聚类,得到聚类数据,并根据所述聚类数据对所述交通知识图谱流量层进行重建,得到交通知识图谱功能层;基于所述交通知识图谱功能层对所述待预测区域进行功能划分,基于功能划分后的结果对所述待预测区域的交通进行预测。上述发明通过融合待预测区域的交通道路网数据和实时路况数据,构建一个多层交通知识图谱并将其分为路网层、流量层和功能层,该交通知识图谱通过感知其他节点的信息作为补充,实现对未来短时间交通流量更准确的预测。但是上述发明通过构建属性矩阵来考虑外部因素对交通态势的影响,仅依靠获取到的外部因素的特征进而与交通特征进行拼接并不能够充分融合两者之间的关系,不同特征之间可能存在复杂的非线性关系,简单的拼接操作无法有效地捕捉到这些关系,导致融合结果失去了综合性和有效性。
发明内容
针对现有交通流量预测方法无法有效地捕捉外部因素和交通特征,准确率较低的技术问题,本发明提出一种基于知识表示模型和图神经网络的知识驱动交通预测方法,实现对时间特征及空间特征的联合捕捉,从而提升交通预测模型的准确率。
为了达到上述目的,本发明的技术方案是这样实现的:一种基于知识表示模型和图神经网络的知识驱动交通预测方法,其步骤如下:
S1:对某一时间段内传感器采集到的交通数据进行预处理得到交通特征,根据传感器节点的位置信息构建交通路网拓扑图,获取数据集。
S2:将数据集分为训练集及测试集;
S3:将交通预测问题看作是根据交通路网拓扑图的基于深度学习模型的学习函数,计算未来一段时间的流量特征;
S4:采用知识嵌入模型将交通路网拓扑图中知识图谱中的实体和关系转换为低维向量,通过交通预测模型的门控特征融合模块根据外部因素的重要性自适应且动态地将外部因素与交通特征进行融合并更新;
S5:将更新后的交通特征和交通路网拓扑图的邻接矩阵输入图卷积GCN,得到路段的表示向量;通过交通预测模型的时空联合捕捉模块的扩张因果卷积对时间级与空间级上的交通特征联合捕捉,生成预测速度;
S6:将训练集输入交通预测模型中,根据损失函数训练交通预测模型,在测试集中对交通预测模型进行测试,得到预测的交通速度。
优选地,以15分钟为间隔,通过交通路网中传感器来采集和记录交通数据,对交通数据进行数据清洗、去噪或补充缺失值后,提取交通数据的特征作为交通特征;提取交通数据的特征的方法为:统计学方法、时空分析方法或机器学习方法。
构建交通路网拓扑图的方法为:为每个传感器节点分配唯一的编号,根据传感器节点的位置信息,计算相邻传感器节点之间的距离,根据距离构建交通路网的拓扑结构;
使用传感器捕捉到的车速信息以及通过计算路网中相邻传感器节点间的距离和连接关系构建邻接矩阵,整理为数据集。
优选地,所述流量特征为:y=f(X,A,G);其中,(X,A,G)为交通路网拓扑图,表示城市的交通特征矩阵,包含了交通信息的特征属性,A表示交通路网拓扑图的邻接矩阵,G表示交通知识图谱,f为学习函数;
邻接矩阵中的元素Anm表示邻接矩阵A中第n行、第m列的元素,若传感器节点n与传感器节点m之间存在邻接关系,则邻接矩阵A中的第(n,m)和第(m,n)元素为1,否则为0;H表示节点属性特征的数量,N为道路数量。
优选地,所述知识嵌入模型TransR对构建的交通知识图谱进行预训练为:
Xembedding=TransR{(h,r,t)∪(h,att,att_val)};
其中,Xembedding表示路段的语义表示,用于更新交通特征进而输入至时空联合捕捉模块中;(h,r,t)表示实体-关系类三元组,(h,att,att_val)表示实体-属性类三元组,h表示头实体,t表示尾实体,r表示头实体与尾实体间的关系,att表示属性,att_val表示属性值。
优选地,所述门控特征融合模块通过一维扩张卷积及激活函数对动静态因素进行特征提取,并根据交通态势的重要性进行特征选择;所述时空联合捕捉模块结合门控循环网络GRU和扩张因果卷积操作联合捕捉时空特征,利用扩张因果卷积代替门控循环网络GRU中的全连接层,以在时空维度上捕捉特征依赖关系;通过扩张因果卷积操作获取更大的感受野,捕捉时序数据中的长程依赖关系;在时序和空间维度上同时捕捉特征演化和相关性。
优选地,根据外部因素的多样性,将外部因素分为静态因素和动态因素,动态因素包括天气状态,静态因素包括兴趣点和路段关系;采用知识嵌入模型TransR对静态因素的三元组进行嵌入表示得到静态的嵌入向量Xsev;采用知识嵌入模型TransR对动态因素的三元组进行嵌入表示得到动态的嵌入向量Xdev;分别采用一维扩张卷积对交通特征进行特征提取,得到更新后的交通特征:Xst=*dc(XsevXt)tanh,Xdt=*dc(XdevXt)tanh;其中,*dc表示一维扩张卷积操作,Xt表示原始的路段特征,tanh表示激活函数;将嵌入向量Xsev与Xdev通过激活函数依据各因素对交通态势的重要性进行特征选择分别获得权重信息:Xs=σXsev,Xd=σXdev;σ为sigmoid激活函数;则输出更新后的交通特征
优选地,所述图卷积GCN捕捉交通路网拓扑图的拓扑关系及特征构建交通网络的图结构,将节点和边分配初始特征表示,利用图卷积操作在节点之间传播和聚合特征,通过多层叠加逐步扩展节点特征的感受野;
通过图卷积GCN得到各路段的表示向量:其中/>为包含自连接的邻接矩阵,IN为单位矩阵,/>为邻接矩阵/>的度矩阵,Wl表示第l层卷积的可训练权重矩阵参数;Θ表示ReLU函数,h′l+1表示第l+1层的节点特征矩阵;h′l表示第l层的节点特征矩阵,每行对应一个节点的特征向量;在卷积的第一层中,h′l为通过门控特征融合模块之后的交通特征/>
优选地,所述时空联合捕捉模块的处理过程为:利用扩张因果卷积操作代替传统门控循环网络GRU中的全连接层,得到当前时刻编码器的隐藏状态h(t);将得到的隐藏状态h(t)输出至全连接层,全连接层通过学习权重和偏置生成预测速度
优选地,所述隐藏状态h(t)的计算方法为:
h(t)=u(t)⊙h(t-1)+(1-u(t))⊙c(t)
其中,*dc中定义的扩张因果卷积,⊙表示Hadamard乘积,r(t)与u(t)分别为GRU的复位门与更新门,用于选择或遗忘记忆,σ(·)及tanh(·)均为激活函数,X1 (t)与h(t)分别为当前时刻的交通状态信息及输出信息,h(t-1)表示t-1时刻输出的隐藏状态信息,c(t)是当前时刻记忆单元存储的交通信息,Wu、Wr、Wc以及bu、br、bc分别表示GRU中更新门、重置门以及记忆单元在训练过程中的权重和偏置。
优选地,所述扩张因果卷积操作为:其中,n为用于控制跳跃距离的扩张因子,k为卷积核大小,g(m)表示滤波器,x(t-n×m)表示一维序列输入,dcc(x,g)表示输入与滤波器在t时刻的扩张因果卷积的运算结果;
所述损失函数训练模型:其中,/>表示预测速度,YT表示通过道路传感器获取的真实交通速度值,λ为正则化超参数,Lreg表示减少过拟合风险并提高泛化能力的L2正则化项。
相比于传统的交通流量预测方法,本发明的有益效果:本发明适用于城市交通领域的流量预测任务,能够合理调度城市交通资源,提高城市交通效率。本发明首先在模型中采用了知识表示学习方法的知识嵌入模型TranR,能够通过学习多个关系矩阵来表示不同类型的关系,从而更好地捕捉交通数据中的复杂关联。本发明通过将实体和关系投影到不同的向量空间中,使得不同关系的表示彼此独立,这种分离的表示方式提供了更高的可解释性,使得能够更好地理解不同关系对交通预测的影响;设计了门控特征融合模块(GFFM),能够根据外部因素各自部分的重要性自适应且动态地将外部因素与交通特征进行更新融合,通过门控权重明确地表示每个特征对最终融合结果的贡献度,使得模块具有较好的可解释性。相比于传统的交通流量预测方法,本发明能够同时考虑了外部因素对交通特征的影响,并采用知识表示学习方法来获取影响交通态势的外部因素的表示向量,从而充分考虑了外部因素对交通特征的影响程度;通过动态地依据外部因素的重要性对交通特征进行融合和更新;本发明根据外部因素的重要性,自适应地对交通特征进行融合并动态更新,从而更好地反映交通特征的变化,提高了预测模型的准确性。本发明采用扩张因果卷积代替门控循环单元内的全连接层,实现对时间特征及空间特征的联合捕捉,能够更好地理解和利用数据中的时空相关性,从而提升交通预测模型的准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的流程图。
图2是本发明的模型结构示意图。
图3是本发明的门控特征融合的结构示意图。
图4是本发明的时空特征联合捕捉结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,一种基于知识表示模型和图神经网络的知识驱动交通预测方法,其步骤如下:
S1:对某一时间段内传感器采集到的交通数据进行预处理得到所需特征,根据传感器节点的位置信息构建交通路网拓扑图,获取数据集。
预处理的过程为:以15分钟为间隔,通过交通路网中传感器来采集和记录交通数据,提取交通数据样本的特征。首先对原始交通数据进行清洗与处理,包括数据清洗、去噪、补充缺失值等;然后通过特征提取得到所需特征,如平均车速、车辆流量等,可以使用统计学方法、时空分析方法或机器学习方法来进行抽取;接着为每个传感器节点分配唯一的编号,确保每个节点都有一个独特的标识符,以便后续的处理和分析。根据传感器节点的位置信息,计算相邻传感器节点之间的距离。通过计算该距离可以构建交通路网的拓扑结构,从而揭示道路之间的连接关系和交通流动。最终,使用传感器捕捉到的车速信息以及通过计算路网中相邻节点间的距离和连接关系构建邻接矩阵,整理为数据集,以供后续建模使用。
S2:将预处理后的数据集分为训练集及测试集,分别用于训练模型以及对训练结束的模型进行测试。
训练集占数据集中总数据的80%,测试集中的数据占数据集中总数据的20%。
S3:将交通预测问题看作是根据交通路网拓扑图的基于深度学习模型的学习函数f,从而计算未来一段时间的流量特征:y=f(X,A,G);其中X表示城市交通特征矩阵,包含了交通信息的特征属性,A表示交通路网拓扑图的邻接矩阵,G表示交通知识图谱。知识图谱以关系三元组和属性三元组为单元的形式进行表示:{头实体,关系,尾实体}、{头实体,属性,属性值}。例如{90217,邻接,90218}、{90217,餐饮服务,9}以及{2015/1/25/10:00,天气,暴雨}分别表示道路ID为90217的路段与道路ID为90218的路段之间的连接关系为邻接关系,道路ID为90217的路段附近有9家餐饮服务的兴趣点,2015年1月5日10:00的天气状态为暴雨。以三元组为单位,最终形成一个完整的知识网络。
步骤S3中的邻接矩阵其中Anm表示邻接矩阵A中第n行第m列的元素。若传感器节点n与传感器节点m之间存在邻接关系,则矩阵中的第(n,m)和第(m.n)元素为1,否则为0。路网拓扑图(X,A,G)中的/>为城市交通特征矩阵,H表示节点属性特征的数量,N为道路数量。其中,节点属性即每条路段以15分钟为间隔所捕捉到的速度信息,节点属性特征的数量H与道路数量N共同构建城市交通特征矩阵/>
S4:通过门控特征融合模块根据外部因素的重要性自适应且动态地将外部因素与交通特征Xt进行融合并更新。其中门控特征融合模块通过一维扩张卷积及激活函数对动静态因素进行特征提取,并根据交通态势的重要性进行特征选择。
采用知识嵌入模型TransR将交通知识图谱中的实体和关系转换为低维向量,进而在向量空间内通过向量间的距离来衡量实体间的语义关系。
采用知识嵌入模型TransR对构建的交通知识图谱进行预训练的公式为:
Xembedding=TransR{(h,r,t)∪(h,att,att_val)};
其中,Xembedding表示路段的语义表示,用于后续更新交通特征进而输入至时空网络预测模型中。(h,r,t)与(h,att,att_val)表示两类三元组表示形式:实体-关系类与实体-属性类。其中,h表示头实体,t表示尾实体,r表示头实体与尾实体间的关系,att表示att的属性,att_val表示属性值。TransR算法将实体间的关系向量视为从头实体到尾实体的向量平移操作。对于每个三元组(t1,r,t2),其中位于实体空间的头实体及尾实体经过投射矩阵投射到关系空间中。具体来说,对于每个关系r,通过设置一种投影矩阵/>来实现将实体从实体空间到关系空间的投影转换:t1r=t1Nr,t2r=t2Nr。对应的用于衡量两投射向量之间距离的得分函数定义为:/>其中‖·‖表示向量距离的计算方法为L2范数。具体来说,通过计算实体或关系之间的得分,用于衡量它们之间的关系强度或相似程度,通常越高的得分表示实体和关系之间越相关。此外,需要对嵌入t1、r、t2的范数施加约束:‖t12≤1,‖r‖2≤1,||t2||2≤1,||t1Nr||2≤1,||t2Nr||2≤1。
本发明中共收集到包含兴趣点信息、天气信息以及路段关系信息的三元组共计464956个,采用TransR算法将三元组中的实体和关系映射到向量空间中的低维向量,以捕捉实体和关系之间的语义关系,然后输入至后续的门控特征融合模块中,进而进行预测任务。具体而言,这些方法通常通过优化损失函数来学习向量表示,在训练过程中,使得具有关联的实体和关系在向量空间中更加接近。通过学习到的向量表示,实体和关系之间的语义关系可以在向量空间内得到体现。在向量空间内通过向量间的距离来衡量实体间的语义关系可以实现相似性度量的功能,较接近的向量表示它们在语义上更相似,可以用于快速发现与某个实体相似的实体。
根据外部因素的多样性,将外部因素分为静态因素(兴趣点、路段关系)和动态因素(天气状态)。通过知识嵌入模型TransR将静态因素和动态因素的实体及关系语义信息映射至向量空间。具体而言,通过捕捉到的静态因素相关三元组,例如{90217,餐饮服务,9},以及路段关系相关三元组,例如{90217,邻接,90218}采用TransR算法进行嵌入表示,得到静态嵌入向量,相应的嵌入向量表示为Xsev。同理,通过捕捉到的动态因素相关三元组,例如{2015/1/14_13:00,天气,雾}采用TransR算法进行嵌入表示,得到动态嵌入向量,相应的嵌入向量表示为Xdev。静态因素的知识嵌入与动态因素的知识嵌入分别采用一维扩张卷积对交通流量特征进行特征提取。由于一维扩张卷积具有多尺度感受野的特点,故可以通过不同的卷积核大小捕捉不同时间跨度下的时序信息,有效地提取交通流量的时序特征。此外,一维扩张卷积具有参数共享的特性。通过共享卷积核权重,可以减少需要学习的参数数量,从而降低模型的复杂度并加快计算速度。这在处理交通流量具有大规模空间维度的数据时非常重要,能够提高模型的效率。进而通过激活函数sigmoid依据各因素对交通态势的重要性进行特征选择,以获得权重信息。最终,模块输出为更新后的交通特征通过将外部因素融合到交通特征中实现了更准确的信息捕获,提高了交通特征的建模能力和预测准确性。
静态因素与动态因素的知识嵌入分别表示为嵌入向量Xsev、Xdev,分别采用一维扩张卷积对交通流量特征进行特征提取:Xst=*dc(XsevXt)tanh,Xdt=*dc(XdevXt)tanh。其中,*dc表示一维扩张卷积操作,Xt表示原始的路段特征,tanh表示激活函数。通过以上操作得到更新后的交通特征Xst、Xdt。将嵌入向量Xsev与Xdev通过激活函数依据各因素对交通态势的重要性进行特征选择,以获得权重信息:Xs=σXsev,Xd=σXdev。σ为激活函数sigmoid。最终输出的交通特征为X1 (t)=[XstXs,XdtXd]。
如图2所示为本发明的交通预测模型结构示意图,模型整体框架包括门控特征融合模块以及时空特征联合捕捉模块。首先对交通路段特征依据外部知识进行融合并更新,其中外部知识首先通过知识图谱三元组进行表现,进而采用知识表示学习算法TransR得到嵌入后的表示向量。其中涉及到的知识表示方法为所述的步骤S4.1中的TransR方法,其构建交通知识图谱的预训练公式为:Xembedding=TransR{(h,r,t)∪(h,att,att_val)},其中Xembedding表示路段的语义表示,(h,r,t)表示实体-关系类三元组,(h,att,att_val)表示实体-属性类三元组。
如图3所示为本发明的门控特征融合模块的结构示意图,其中包括扩张卷积操作以及特征选择操作。前者能够有效地捕捉输入序列的局部关联信息,提高模型对于时序数据的建模能力。后者依据外部因素的重要性进行特征选择,可以自适应地对不同外部因素进行权重调整,以实现更准确的特征融合和交通特征更新。所述的步骤S4.2中的静态因素与动态因素的知识嵌入分别表示为Xsev、Xdev。分别采用一维扩张卷积对交通流量特征进行特征提取,通过扩大卷积核的感受野捕捉更长程的上下文信息,使得模型能够更全面地分析输入的特征序列,其计算过程为:Xst=*dc(XsevXt)tanh,Xdt=*dc(XdevXt)tanh。其中,全连接层用于对输入的特征进行线性变换和维度映射,将输入数据的维度调整为适合后续处理的形式,以便进行特征的抽取和融合操作。将嵌入向量Xsev与Xdev通过sigmoid函数根据各因素对交通态势的重要性进行特征选择:Xs=σXsev,Xd=σXdev。最终输出的交通特征为
S4.3:使用更新后的交通特征和邻接矩阵A作为图卷积GCN的输入。采用图卷积GCN可以捕捉交通网络的拓扑关系及特征,通过构建交通网络的图结构,将节点和边分配初始特征表示,利用图卷积操作在节点之间传播和聚合特征,通过多层叠加逐步扩展节点特征的感受野,从而实现对交通网络的拓扑关系和特征的学习和应用。通过GCN可以得到各路段的表示向量:/>其中/>为包含自连接的邻接矩阵,IN为单位矩阵,/>为邻接矩阵/>的度矩阵,Wl表示第l层卷积的可训练权重矩阵参数。Θ表示ReLU函数,h′l+1表示第l+1层的节点特征矩阵,即经过一次图卷积操作后的新特征。h′l表示第l层的节点特征矩阵,每行对应一个节点的特征向量。在卷积的第一层中,h′l为通过门控特征融合模块之后的交通特征/>即/>
S5:通过时空联合捕捉模块实现对时间级与空间级上的交通特征联合捕捉。
S5.1:更新后的交通特征与邻接矩阵A首先通过步骤S4.3中的图卷积GCN捕捉交通网络的拓扑关系与特征,得到各路段的表示向量。利用扩张因果卷积操作代替传统门控循环网络GRU中的全连接层,得到当前时刻编码器的隐藏状态h(t)
如图4所示为本发明的时空特征联合捕捉结构示意图。该模块结合了GRU和扩张因果卷积操作来联合捕捉时空特征。利用扩张因果卷积代替GRU中的全连接层,以在时空维度上捕捉特征依赖关系。通过扩张因果卷积操作,模块可以获取更大的感受野,捕捉时序数据中的长程依赖关系。该模块在时序和空间维度上同时捕捉特征演化和相关性。
采用的扩张因果卷积操作的公式为:其中n为用于控制跳跃距离的扩张因子,k为卷积核大小。g(m)表示滤波器,x(t-n×m)表示一维序列输入,dcc(x,g)表示输入与滤波器在t时刻的扩张因果卷积的运算结果。其计算过程是先对t时刻以及t时刻之前的输入以大小为n-1的间隔进行采样,进而与卷积核g(m)相乘计算内积,以此使得输出是由当前输入及其之前的输入决定。采用扩张因果卷积代替GRU中的全连接层的操作的具体计算过程为:
h(t)=u(t)⊙h(t-1)+(1-u(t))⊙c(t)
其中,*dc中定义的扩张因果卷积,⊙表示Hadamard乘积,r(t)与u(t)分别为GRU的复位门与更新门,用于选择或遗忘记忆,σ(·)及tanh(·)均为激活函数,X1 (t)与h(t)分别为当前时刻的交通状态信息及输出信息,h(t-1)表示t-1时刻输出的隐藏状态信息,c(t)是当前时刻记忆单元存储的交通信息,Wu、Wr、Wc以及bu、br、bc分别表示GRU中更新门、重置门以及记忆单元在训练过程中的权重和偏置。
S5.2:通过时空特征联合捕捉模块得到的隐藏状态h(t)输出至全连接层,用以生成预测速度其中全连接层可以通过学习适当的权重和偏置,将前面神经网络层提取到的高级特征映射转换为最终的预测结果。可以把前面层抽象提取的特征与输出目标之间建立起有效的联系。
本发明通过图卷积(GCN)、扩张因果卷积(Dilated Causal Convolution)与门控循环单元(GRU)相结合进行时空特征的联合捕捉能够更加有效地处理图结构数据,捕捉路网节点之间的关系和局部结构信息。通过使用图卷积(GCN)模型,将路网表示为图结构,以捕获节点之间的关系和局部结构信息。然后通过使用扩张因果卷积(Dilated CausalConvolution)替代传统的全连接层,实现对时空特征的联合捕捉。此外,能够扩大模型的感受野,并且在保持因果关系的同时,同时考虑更远距离的上下文信息。通过将扩张因果卷积应用于图结构数据中的时空特征,可以更好地捕捉路网节点之间的相关性和局部结构信息,进而提高模型对时空动态变化的建模能力。这种方法为时空特征提供更加有效的联合捕捉方式,从而提升了交通预测模型的性能。
S6:将训练集输入交通预测模型中,根据损失函数训练模型:其中,/>表示预测速度,YT表示通过道路传感器获取的真实交通速度值,λ为正则化超参数,Lreg表示减少过拟合风险并提高泛化能力的L2正则化项。在测试集中对模型进行测试。
在训练阶段,通过得到模型的预测输出结果与传感器采集的真实数据样本,根据损失函数训练模型:
本发明提供了一种基于知识表示模型和图神经网络的知识驱动交通预测方法,适用于城市交通领域的流量预测任务。能够合理调度城市交通资源,提高城市交通效率,并相比传统的交通流量预测方法,本发明能够同时考虑对交通特征影响较大的外部因素。通过知识表示学习方法得到影响交通态势的外部因素的表示向量,从而充分考虑了外部因素对交通特征的影响程度。此外,本发明根据外部因素的重要性,自适应地对交通特征进行融合并动态更新,从而更好地反映交通特征的变化,提高了预测模型的准确性。采用扩张因果卷积替代门控循环单元内的全连接层,实现了对时间特征和空间特征的联合捕捉,能够更好地理解和利用数据中的时空相关性,从而提升了交通预测模型的准确率。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于知识表示模型和图神经网络的知识驱动交通预测方法,其特征在于,其步骤如下:
S1:对某一时间段内传感器采集到的交通数据进行预处理得到交通特征,根据传感器节点的位置信息构建交通路网拓扑图,获取数据集;
S2:将数据集分为训练集及测试集;
S3:将交通预测问题看作是根据交通路网拓扑图的基于深度学习模型的学习函数,计算未来一段时间的流量特征;
S4:采用知识嵌入模型将交通路网拓扑图中知识图谱中的实体和关系转换为低维向量,通过交通预测模型的门控特征融合模块根据外部因素的重要性自适应且动态地将外部因素与交通特征进行融合并更新;
S5:将更新后的交通特征和交通路网拓扑图的邻接矩阵输入图卷积GCN,得到路段的表示向量;通过交通预测模型的时空联合捕捉模块的扩张因果卷积对时间级与空间级上的交通特征联合捕捉,生成预测速度;
S6:将训练集输入交通预测模型中,根据损失函数训练交通预测模型,在测试集中对交通预测模型进行测试,得到预测的交通速度。
2.根据权利要求1所述的基于知识表示模型和图神经网络的知识驱动交通预测方法,其特征在于,以15分钟为间隔,通过交通路网中传感器来采集和记录交通数据,对交通数据进行数据清洗、去噪或补充缺失值后,提取交通数据的特征作为交通特征;提取交通数据的特征的方法为:统计学方法、时空分析方法或机器学习方法;
构建交通路网拓扑图的方法为:为每个传感器节点分配唯一的编号,根据传感器节点的位置信息,计算相邻传感器节点之间的距离,根据距离构建交通路网的拓扑结构;
使用传感器捕捉到的车速信息以及通过计算路网中相邻传感器节点间的距离和连接关系构建邻接矩阵,整理为数据集。
3.根据权利要求2所述的基于知识表示模型和图神经网络的知识驱动交通预测方法,其特征在于,所述流量特征为:y=f(X,A,G);其中,(X,A,G)为交通路网拓扑图,表示城市的交通特征矩阵,包含了交通信息的特征属性,A表示交通路网拓扑图的邻接矩阵,G表示交通知识图谱,f为学习函数;
邻接矩阵中的元素Anm表示邻接矩阵A中第n行、第m列的元素,若传感器节点n与传感器节点m之间存在邻接关系,则邻接矩阵A中的第(n,m)和第(m,n)元素为1,否则为0;H表示节点属性特征的数量,N为道路数量。
4.根据权利要求3所述的基于知识表示模型和图神经网络的知识驱动交通预测方法,其特征在于,所述知识嵌入模型TransR对构建的交通知识图谱进行预训练为:
Xembedding=TransR{(h,r,t)∪(h,att,att_val)};
其中,Xembedding表示路段的语义表示,用于更新交通特征进而输入至时空联合捕捉模块中;(h,r,t)表示实体-关系类三元组,(h,att,att_val)表示实体-属性类三元组,h表示头实体,t表示尾实体,r表示头实体与尾实体间的关系,att表示属性,att_val表示属性值。
5.根据权利要求1-4中任意一项所述的基于知识表示模型和图神经网络的知识驱动交通预测方法,其特征在于,所述门控特征融合模块通过一维扩张卷积及激活函数对动静态因素进行特征提取,并根据交通态势的重要性进行特征选择;所述时空联合捕捉模块结合门控循环网络GRU和扩张因果卷积操作联合捕捉时空特征,利用扩张因果卷积代替门控循环网络GRU中的全连接层,以在时空维度上捕捉特征依赖关系;通过扩张因果卷积操作获取更大的感受野,捕捉时序数据中的长程依赖关系;在时序和空间维度上同时捕捉特征演化和相关性。
6.根据权利要求5所述的基于知识表示模型和图神经网络的知识驱动交通预测方法,其特征在于,根据外部因素的多样性,将外部因素分为静态因素和动态因素,动态因素包括天气状态,静态因素包括兴趣点和路段关系;采用知识嵌入模型TransR对静态因素的三元组进行嵌入表示得到静态的嵌入向量Xsev;采用知识嵌入模型TransR对动态因素的三元组进行嵌入表示得到动态的嵌入向量Xdev;分别采用一维扩张卷积对交通特征进行特征提取,得到更新后的交通特征:Xst=*dc(XsevXt)tanh,Xdt=*dc(XdevXt)tanh;其中,*dc表示一维扩张卷积操作,Xt表示原始的路段特征,tanh表示激活函数;将嵌入向量Xsev与Xdev通过激活函数依据各因素对交通态势的重要性进行特征选择分别获得权重信息:Xs=σXsev,Xd=σXdev;σ为sigmoid激活函数;则输出更新后的交通特征
7.根据权利要求6所述的基于知识表示模型和图神经网络的知识驱动交通预测方法,其特征在于,所述图卷积GCN捕捉交通路网拓扑图的拓扑关系及特征构建交通网络的图结构,将节点和边分配初始特征表示,利用图卷积操作在节点之间传播和聚合特征,通过多层叠加逐步扩展节点特征的感受野;
通过图卷积GCN得到各路段的表示向量:其中/>为包含自连接的邻接矩阵,IN为单位矩阵,/>为邻接矩阵/>的度矩阵,Wl表示第l层卷积的可训练权重矩阵参数;Θ表示ReLU函数,h'l+1表示第l+1层的节点特征矩阵;h'l表示第l层的节点特征矩阵,每行对应一个节点的特征向量;在卷积的第一层中,h'l为通过门控特征融合模块之后的交通特征/>
8.根据权利要求1-4、6、7中任意一项所述的基于知识表示模型和图神经网络的知识驱动交通预测方法,其特征在于,所述时空联合捕捉模块的处理过程为:利用扩张因果卷积操作代替传统门控循环网络GRU中的全连接层,得到当前时刻编码器的隐藏状态h(t);将得到的隐藏状态h(t)输出至全连接层,全连接层通过学习权重和偏置生成预测速度
9.根据权利要求8所述的基于知识表示模型和图神经网络的知识驱动交通预测方法,其特征在于,所述隐藏状态h(t)的计算方法为:
h(t)=u(t)⊙h(t-1)+(1-u(t))⊙c(t)
其中,★dc中定义的扩张因果卷积,⊙表示Hadamard乘积,r(t)与u(t)分别为GRU的复位门与更新门,用于选择或遗忘记忆,σ(·)及tanh(·)均为激活函数,/>与h(t)分别为当前时刻的交通状态信息及输出信息,h(t-1)表示t-1时刻输出的隐藏状态信息,c(t)是当前时刻记忆单元存储的交通信息,Wu、Wr、Wc以及bu、br、bc分别表示GRU中更新门、重置门以及记忆单元在训练过程中的权重和偏置。
10.根据权利要求9所述的基于知识表示模型和图神经网络的知识驱动交通预测方法,其特征在于,所述扩张因果卷积操作为:其中,n为用于控制跳跃距离的扩张因子,k为卷积核大小,g(m)表示滤波器,x(t-n×m)表示一维序列输入,dcc(x,g)表示输入与滤波器在t时刻的扩张因果卷积的运算结果;
所述损失函数训练模型:其中,/>表示预测速度,YT表示通过道路传感器获取的真实交通速度值,λ为正则化超参数,Lreg表示减少过拟合风险并提高泛化能力的L2正则化项。
CN202311088919.6A 2023-08-28 2023-08-28 基于知识表示模型和图神经网络的知识驱动交通预测方法 Pending CN117116048A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311088919.6A CN117116048A (zh) 2023-08-28 2023-08-28 基于知识表示模型和图神经网络的知识驱动交通预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311088919.6A CN117116048A (zh) 2023-08-28 2023-08-28 基于知识表示模型和图神经网络的知识驱动交通预测方法

Publications (1)

Publication Number Publication Date
CN117116048A true CN117116048A (zh) 2023-11-24

Family

ID=88801672

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311088919.6A Pending CN117116048A (zh) 2023-08-28 2023-08-28 基于知识表示模型和图神经网络的知识驱动交通预测方法

Country Status (1)

Country Link
CN (1) CN117116048A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117854321A (zh) * 2024-03-07 2024-04-09 北京建筑大学 基于交通环境提前感知的交通事故风险预测方法及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117854321A (zh) * 2024-03-07 2024-04-09 北京建筑大学 基于交通环境提前感知的交通事故风险预测方法及系统

Similar Documents

Publication Publication Date Title
CN109887282B (zh) 一种基于层级时序图卷积网络的路网交通流预测方法
WO2021147325A1 (zh) 一种物体检测方法、装置以及存储介质
CN110717627B (zh) 一种基于对偶图框架的全量交通预测方法
CN109858390A (zh) 基于端到端时空图学习神经网络的人体骨架的行为识别方法
CN111291809B (zh) 一种处理装置、方法及存储介质
CN111860951A (zh) 一种基于动态超图卷积网络的轨道交通客流预测方法
CN110570035B (zh) 同时建模时空依赖性和每日流量相关性的人流量预测系统
US20230215166A1 (en) Few-shot urban remote sensing image information extraction method based on meta learning and attention
CN109033107A (zh) 图像检索方法和装置、计算机设备和存储介质
CN113313232B (zh) 一种基于预训练和图神经网络的功能脑网络分类方法
CN113628249A (zh) 基于跨模态注意力机制与孪生结构的rgbt目标跟踪方法
Venkatesh et al. Rainfall prediction using generative adversarial networks with convolution neural network
CN112434723B (zh) 一种基于注意力网络的日/夜间图像分类及物体检测方法
CN111047078A (zh) 交通特征预测方法、系统及存储介质
CN117237559B (zh) 面向数字孪生城市的三维模型数据智能分析方法及系统
CN117116048A (zh) 基于知识表示模型和图神经网络的知识驱动交通预测方法
CN115936069A (zh) 一种基于时空注意力网络的交通流预测方法
CN112862084B (zh) 基于深度迁移融合学习的交通流量预测方法
CN117217779A (zh) 预测模型的训练方法、装置及信息预测方法、装置
Zhong A convolutional neural network based online teaching method using edge-cloud computing platform
CN111260121B (zh) 一种基于深度瓶颈残差网络的城市范围的人流量预测方法
AU2019100967A4 (en) An environment perception system for unmanned driving vehicles based on deep learning
Huo et al. Tensor-based cooperative control for large scale multi-intersection traffic signal using deep reinforcement learning and imitation learning
Kotapati et al. Deep learning-enhanced hybrid fruit fly optimization for intelligent traffic control in smart urban communities
Wu et al. Learning spatial–temporal pairwise and high-order relationships for short-term passenger flow prediction in urban rail transit

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination