CN113065690B - 一种交通预测方法及装置 - Google Patents
一种交通预测方法及装置 Download PDFInfo
- Publication number
- CN113065690B CN113065690B CN202110297442.7A CN202110297442A CN113065690B CN 113065690 B CN113065690 B CN 113065690B CN 202110297442 A CN202110297442 A CN 202110297442A CN 113065690 B CN113065690 B CN 113065690B
- Authority
- CN
- China
- Prior art keywords
- traffic
- stations
- matrix
- traffic information
- station
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 239000011159 matrix material Substances 0.000 claims abstract description 121
- 230000007704 transition Effects 0.000 claims abstract description 45
- 238000013507 mapping Methods 0.000 claims abstract description 36
- 238000012546 transfer Methods 0.000 claims abstract description 18
- 238000004422 calculation algorithm Methods 0.000 claims description 16
- 238000010276 construction Methods 0.000 claims description 12
- 238000011524 similarity measure Methods 0.000 claims description 6
- 238000005259 measurement Methods 0.000 claims description 5
- 239000013598 vector Substances 0.000 claims description 5
- 230000002123 temporal effect Effects 0.000 claims description 3
- 230000003993 interaction Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000012360 testing method Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 235000003801 Castanea crenata Nutrition 0.000 description 1
- 244000209117 Castanea crenata Species 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000002354 daily effect Effects 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
- G08G1/0129—Traffic data processing for creating historical data or processing based on historical data
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Data Mining & Analysis (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Life Sciences & Earth Sciences (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Probability & Statistics with Applications (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了一种交通预测方法及装置,根据交通站点的历史交通信息序列的隶属度值构建交通站点间的邻接矩阵,采用马尔可夫链对分位数箱之间的状态转移进行计数,计数得到的转移频率值按照交通站点的排列顺序进行排列,生成t时刻的马尔可夫转移矩阵;建立t时刻的马尔可夫转移矩阵与站点序列之间的映射关系,得到相应的映射矩阵,将所述站点序列与映射矩阵进行组合,得到交通站点特征矩阵;将获得的所述邻接矩阵和特征矩阵输入到构建好的深度预测混合模型中,预测出交通站点未来的交通信息。本发明能够在不增加外部变量的情况下表示所有站点之间动态的空间相关性,可以同时考虑所有站点的全局和局部交通信息,从而有效提升了预测性能。
Description
技术领域
本发明属于智能交通管理技术领域,尤其涉及一种交通预测方法及装置。
背景技术
智能交通系统(ITSs)的快速发展为交通管理、交通控制、路线规划等城市交通服务提供了诸多便利。交通预测作为智能交通系统的重要组成部分,受到了越来越多的关注。交通预测的目标是通过分析城市道路的历史交通信息(如交通流量和交通速度),挖掘潜在的交通模式,预测未来的交通信息。
通常,准确的交通预测会受到交通信息数据的时间相关性和空间相关性的影响。例如,在时间相关性方面,不仅两个相邻时间间隔的交通流具有一定的相似性,每天同一时刻的交通流也具有一定的周期性。在空间相关性方面,两个相邻站点的交通流的相似度比两个相距较远站点的交通流的相似度更高。
从交通数据中提取时间和空间的相关性特征并进行交通预测,一直以来都是本领域技术人员所热衷于研究的课题。然而,传统的基于图卷积网络GCN的交通预测方法主要是根据站点间的连通性或站点间的距离来构造邻接矩阵以量化站点间的空间相关性。在日常生活中,站点之间的空间相关性不仅与它们间的距离有关,还与其周围的环境有关。例如,在夜间,靠近居民区的站点与靠近商业区的站点之间的交通特征具有较高的相似性,但两个站点之间可能距离较远。因此,仅基于站点间的空间距离构造邻接矩阵的方法往往会丢失相距较远的站点间的空间特征信息。另外,在GCN的卷积操作阶段,现有技术方案主要集中于利用各站点的交通信息作为站点特征进行站点间的信息交互。然而,由于GCN的卷积滤波器的步长有限,GCN只能利用少数几个站点的交通信息来更新站点之间的连接权重,难以充分地表示和提取相关站点之间的全局空间特征关系。
基于上述原因,现有技术方案的预测准确度还需要进一步的提高。
发明内容
本申请的目的是提供一种交通预测方法及装置,以克服背景技术中所指出的问题,降低预测误差,提升交通预测的准确度。
为了实现上述目的,本申请技术方案如下:
一种交通预测方法,用于预测交通站点的交通信息,包括:
采用模糊C均值聚类算法对所有交通站点的历史交通信息序列进行聚类,根据交通站点的历史交通信息序列的隶属度值构建交通站点间的邻接矩阵;
将交通站点在t时刻的交通信息按照交通站点的排列顺序排列为站点序列,基于分位数将每个站点在t时刻的交通信息值分配到相应的分位数箱;
采用马尔可夫链对分位数箱之间的状态转移进行计数,计数得到的转移频率值按照交通站点的排列顺序进行排列,生成t时刻的马尔可夫转移矩阵;
建立t时刻的马尔可夫转移矩阵与站点序列之间的映射关系,得到相应的映射矩阵,将所述站点序列与映射矩阵进行组合,得到交通站点特征矩阵;
将获得的所述邻接矩阵和特征矩阵输入到构建好的深度预测混合模型中,预测出交通站点未来的交通信息。
进一步的,所述采用模糊C均值聚类算法对所有交通站点的历史交通信息序列进行聚类,根据交通站点的历史交通信息序列的隶属度值构建交通站点间的邻接矩阵,包括:
采用模糊C均值聚类算法对所有交通站点的历史交通信息序列进行聚类,并采用如下公式计算各个聚类中每个交通站点的历史交通信息序列的隶属度值:
其中,ui,j表示第i个交通站点的交通信息序列对于第j个聚类的隶属度值,Xi表示第i个交通站点的交通信息序列,Cj表示第j个聚类中心,α表示用于控制生成聚类模糊性的权重指数,d(Xi,Cj)表示第i个站点的交通信息序列与第j个聚类中心的相似性度量,d(Xi,Ck)表示第i个站点的交通信息序列与第k个聚类中心的相似性度量,m为聚类的总数,i、j、k为序号,n为交通站点总数;
对于任意交通站点s1和s2,利用如下公式计算它们之间的链接关系As1,s2:
以交通站点间的链接关系构建交通站点间的邻接矩阵。
进一步的,所述t时刻的马尔可夫转移矩阵为:
其中,Mt为t时刻的马尔可夫转移矩阵,t时刻的马尔可夫转移矩阵Mt中的任一元素Ms1,s2表示s2站点的交通信息值所属的分位数箱中的点转移至s1站点的交通信息值所属的分位数箱中的点的频率,s1和s2表示任意两个交通站点。
进一步的,所述映射矩阵为:
进一步的,所述深度预测混合模型包括两层堆叠的LGCN网络。
本申请还提出了一种交通预测装置,用于预测交通站点的交通信息,包括:
模糊图生成模块,用于采用模糊C均值聚类算法对所有交通站点的历史交通信息序列进行聚类,并根据交通站点的历史交通信息序列的隶属度值构建交通站点间的邻接矩阵;
节点特征构造模块,用于将交通站点在t时刻的交通信息按照交通站点的排列顺序排列为站点序列,基于分位数将每个站点在t时刻的交通信息值分配到相应的分位数箱;采用马尔可夫链对分位数箱之间的状态转移进行计数,计数得到的转移频率值按照交通站点的排列顺序进行排列,生成t时刻的马尔可夫转移矩阵;建立t时刻的马尔可夫转移矩阵与站点序列之间的映射关系,得到相应的映射矩阵,将所述站点序列与映射矩阵进行组合,得到交通站点特征矩阵;
预测模块,用于将获得的所述邻接矩阵和特征矩阵输入到构建好的深度预测混合模型中,预测出交通站点未来的交通信息。
进一步的,所述模糊图生成模块,采用模糊C均值聚类算法对所有交通站点的历史交通信息序列进行聚类,根据交通站点的历史交通信息序列的隶属度值构建交通站点间的邻接矩阵,执行如下操作:
采用模糊C均值聚类算法对所有交通站点的历史交通信息序列进行聚类,并采用如下公式计算各个聚类中每个交通站点的历史交通信息序列的隶属度值:
其中,ui,j表示第i个交通站点的交通信息序列对于第j个聚类的隶属度值,Xi表示第i个交通站点的交通信息序列,Cj表示第j个聚类中心,α表示用于控制生成聚类模糊性的权重指数,d(Xi,Cj)表示第i个站点的交通信息序列与第j个聚类中心的相似性度量,d(Xi,Ck)表示第i个站点的交通信息序列与第k个聚类中心的相似性度量,m为聚类的总数,i、j、k为序号,n为交通站点总数;
对于任意交通站点s1和s2,利用如下公式计算它们之间的链接关系As1,s2:
以交通站点间的链接关系构建交通站点间的邻接矩阵。
进一步的,所述t时刻的马尔可夫转移矩阵为:
其中,Mt为t时刻的马尔可夫转移矩阵,t时刻的马尔可夫转移矩阵Mt中的任一元素Ms1,s2表示s2站点的交通信息值所属的分位数箱中的点转移至s1站点的交通信息值所属的分位数箱中的点的频率,s1和s2表示任意两个交通站点。
进一步的,所述映射矩阵为:
进一步的,所述深度预测混合模型包括两层堆叠的LGCN网络。
本申请提出的一种交通预测方法及装置,采用基于FCM的图生成方法能够客观、灵活地表示站点间的链接关系,将马尔可夫模型推广到分析同一时间点各站点的交通流之间的状态转移关系,并用该状态转移关系来表示各站点之间动态的相关性,所构造的节点特征矩阵能够在不增加外部变量的情况下表示所有站点之间动态的空间相关性,从而使得GCN在卷积运算过程中能够同时考虑全局和局部的站点信息。
附图说明
图1为本申请实施例交通预测方法流程图;
图2为本申请实施例深度预测混合模型示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅用以解释本申请,并不用于限定本申请。
本申请提供的一种交通预测方法及装置,用于预测交通站点的交通信息,交通信息包括交通流量或交通速度等。在本申请的具体实施例中,交通网络用加权图G=(V,E,A)表示,其中V为图节点的有限集,表示交通网络中的n个交通站点;E为图边的集合,表示交通站点间的链接关系;为图的加权邻接矩阵,表示所有交通站点之间的相关性强度。G的节点特征可以用一个矩阵Fn×d来表示,其中d是节点特征的维度,t时刻的节点特征矩阵用Ft来表示。
交通预测问题可以定义为:通过学习基于交通网络图G和节点特征矩阵F的映射函数H(·),预测整个交通网络图中所有站点未来T个时间点的交通信息,如公式(1)所示:
其中,T'表示历史时间序列的时间窗大小,Yt+T表示未来t+T时刻所有站点流量信息的预测值,T表示预测序列的时间窗大小。
在一个实施例中,如图1所示,提供了一种交通预测方法,包括:
步骤S110、采用模糊C均值聚类算法对所有交通站点的历史交通信息序列进行聚类,根据交通站点的历史交通信息序列的隶属度值构建交通站点间的邻接矩阵。
本实施例用邻接矩阵表示交通站点间的链接关系。现有技术中大多是基于交通站点间的空间距离构造邻接矩阵。然而,在实际的交通网络中,基于距离的邻接矩阵构造方法往往会导致交通站点之间的链接关系的错误表示。例如,S1、S2和S3是三个位于不同位置的交通站点,S2比S3更接近S1,然而因为S3站点和S1站点在同一条公路上,所以它们的交通模式更加相似。此外,利用距离来衡量不同交通站点之间复杂而模糊的空间相关性是非常困难的。因此,本申请提出了一种新的基于FCM的图生成方法来增强交通站点间链接关系的表示能力。模糊C均值聚类算法FCM被广泛用于解决各种分类和回归问题,FCM利用隶属度来刻画对象与簇之间的模糊逻辑关系,因此能够更客观地表达不同对象之间的内在关联。本申请利用FCM分析各站点的历史交通序列间的模糊逻辑关系,并根据聚类结果生成相应的模糊图。
本实施例采用模糊C均值聚类算法对所有交通站点的历史交通信息序列进行聚类,并采用如下公式计算各个聚类中每个交通站点的历史交通信息序列的隶属度值:
其中,ui,j表示第i个交通站点的交通信息序列对于第j个聚类的隶属度值,Xi表示第i个交通站点的交通信息序列,Cj表示第j个聚类中心,α表示用于控制生成聚类模糊性的权重指数,d(Xi,Cj)表示第i个站点的交通信息序列与第j个聚类中心的相似性度量,d(Xi,Ck)表示第i个站点的交通信息序列与第k个聚类中心的相似性度量,m为聚类的总数,i、j、k为序号,n为交通站点总数;
对于任意交通站点s1和s2,利用如下公式计算它们之间的链接关系As1,s2:
以交通站点间的链接关系构建交通站点间的邻接矩阵。
具体的,令X={Xi|i=1,2,...,n}表示所有交通站点的历史交通信息序列的集合,每个交通站点的历史交通信息序列包括历史多个时刻的交通信息(交通信息序列中的交通信息数量越多,效果越好,本实施例每个交通站点序列中交通信息数量为8000个),令C={Cj|j=1,2,...,m}表示FCM的聚类中心集,其中i和j分别为交通站点和聚类中心的索引值,m为聚类总数。利用公式(2)以及基于FCM的迭代计算,可以得到各个聚类中每个交通站点的历史交通信息序列的隶属度值,该隶属度受等式(3)所约束。最后利用公式(4)构建交通站点间的邻接矩阵A,在公式(4)中,s1和s2表示交通站点的索引值;As1,s2为邻接矩阵A的元素值,表示交通站点s1和s2之间的模糊链接关系。从上述公式可以看出,本申请所提出的基于FCM的图生成方法能够客观、灵活地表示交通站点间的链接关系。
步骤S120、将交通站点在t时刻的交通信息按照交通站点的排列顺序排列为站点序列,基于分位数将每个站点在t时刻的交通信息值分配到相应的分位数箱。
节点特征用于表示交通网络图中每个交通站点(简称为站点)的特征信息,节点特征的构造是GCN实现站点间信息交互的前提条件。现有技术主要利用每个站点自身的交通信息作为节点特征。这些传统的节点特征构造方法导致GCN在对两个具有链接关系的节点进行卷积运算时,难以从全局角度同时考虑所有站点的空间相关性。例如,卷积滤波器步长为2时GCN的信息交互过程中,在中心站点P执行完步长为2的卷积运算之后,由步长在2以内的交通站点的交通流信息可以用来更新站点P与其相邻站点之间的链接权重,而之外的其他交通站点的交通流信息则不能用。
显然,除了空间相关性之外,某些站点之间还存在其它类型的相关性,这些相关性在不同的时间点具有动态的变化特征。因此,本申请提出了一种基于马尔可夫编码的节点特征构造方法,通过充分利用多个相关站点的交通流信息来提升GCN卷积运算的可靠性。马尔可夫模型能有效地刻画时间序列中各变量的状态转移关系,已被广泛应用于解决各种时间序列预测任务。本申请将马尔可夫模型推广到分析同一时间点各站点的交通流之间的状态转移关系,并用该状态转移关系来表示各站点之间动态的相关性。具体来说,将固定顺序的站点序列看作一个时间序列,用序列值之间的状态转换关系来模拟时间序列中变量之间的状态转换关系。
本步骤用来进行站点序列离散化处理,首先,生成t时刻的站点序列其中,/>表示第s个站点的交通信息值。值得注意的是,站点的排列顺序在所有时刻均保持不变。然后,基于分位数对站点序列进行离散化处理。即给定分位箱个数Q,分析站点序列SSt,可以生成一组分位数箱的集合:QB={q1,q2,...,qQ}。每个站点在t时刻的交通信息值都会被分配到相应的分位数箱中。
步骤S130、采用马尔可夫链对分位数箱之间的状态转移进行计数,计数得到的转移频率值按照交通站点的排列顺序进行排列,生成t时刻的马尔可夫转移矩阵。
根据生成的站点序列和相应的分位数箱的分配结果,每个站点在t时刻的交通信息值都会被分配到相应的分位数箱中。
对于任何两个站点之间,例如第s-1个与第s个站点之间,采用一阶马尔可夫链对分位数箱之间的状态转移进行计数,并生成t时刻Q×Q大小的加权马尔可夫转移矩阵Wt,如公式(5)所示:
矩阵Wt包含了t时刻所有站点相应的分位数箱之间的状态转移频率。其中,是矩阵Wt中的一个元素,表示第s-1个站点的交通信息值所属的分位数箱Q中的点转移至第s个站点的交通信息值所属的分位数箱1中的点的频率(也表示为/>)。分位数箱中点的个数取决于站点序列SSt中有多少个交通信息值被分配给相应的分位数箱。
对公式(5)的状态转移矩阵进行扩展,扩展到所有的交通站点,并按照交通站点的排列顺序进行排列,可以得到所有站点t时刻的马尔可夫转移矩阵。
本实施例为了更精确地表示t时刻站点序列中每个站点之间的状态转移关系,本申请通过将每个转移频率值沿着站点顺序进行分配,得到扩展后的马尔可夫转移矩阵Mt。Mt包含了所有站点之间动态的相关性,如公式(6)所示:
其中,t时刻的马尔可夫转移矩阵Mt中的任一元素Ms1,s2表示s2站点的交通信息值所属的分位数箱中的点转移至s1站点的交通信息值所属的分位数箱中的点的频率,s1和s2表示任意两个交通站点。g1...gn∈[1,Q]分别是s1站点至sn站点对应分位数箱的索引值。
步骤S140、建立t时刻的马尔可夫转移矩阵与站点序列之间的映射关系,得到相应的映射矩阵,将所述站点序列与映射矩阵进行组合,得到交通站点特征矩阵。
为了能够利用交通信息数据中站点间的状态转移关系,进一步建立了马尔可夫转移矩阵Mt与站点序列SSt之间的映射关系,得到相应的映射矩阵MRt,如公式(7)和公式(8)所示:
其中,是MRt中的一个元素,表示如果t时刻s1站点和s2站点之间存在状态转移关系,则使用s1站点和s2站点的交通信息值来计算矩阵Mt对应位置的转移频率的映射值,并将该映射值作为s1站点的一个节点特征。进一步,对于矩阵MRt的第s1行,将所有映射值作为第s1站点的节点特征向量。此外,为了使映射矩阵包含每个站点自身的交通信息,将矩阵MRt与原始站点序列SSt进一步组合,得到节点特征矩阵Ft,如公式(9)所示:
Ft=[SSt,MRt] (9)
其中[]表示矩阵的列合并操作。
通过执行步骤S120-140,所构造的节点特征矩阵能够在不增加外部变量的情况下表示所有站点之间动态的空间相关性,从而使得GCN在卷积运算过程中能够同时考虑全局和局部的站点信息。
步骤S150、将获得的所述邻接矩阵和特征矩阵输入到构建好的深度预测混合模型中,预测出交通站点未来的交通信息。
为了提取交通网络中所有站点之间复杂的动态时空相关特征,本申请提出了一种GCN和LSTM相结合的深度预测混合模型(LGCN)。与CNN相比,GCN能够直接对图数据进行卷积操作以充分提取交通网络中复杂的空间相关性特征。相反,LSTM通过门结构来存储时间序列的历史特征信息,已被证明能够有效提取交通模式的动态的时间相关性特征。因此,通过GCN和LSTM的优势互补,LGCN模型可以同时提取交通数据的时空相关性特征,提高交通预测的准确度。
可选的,LGCN的网络架构如图2所示,深度预测混合模型包括两层堆叠的LGCN网络,LGCN的输入为T'个历史时间点的模糊图(邻接矩阵A)和节点特征矩阵F。首先,利用GCN对输入数据进行卷积运算以提取出空间特征向量,再将空间特征向量作为LSTM的输入以提取时间特征。通过堆叠两层LGCN,提取得到时空特征和模型输出。LGCN的输出是一张图,图节点的特征维数为T,表示未来T个时间点上每个站点的交通信息值。本申请采用两层堆叠的LGCN结构,提高了深度预测混合模型的预测精度。
如图2所示,将邻接矩阵A及历史时刻特征矩阵序列Ft-T'+1,...,Ft-1,Ft输入到深度预测混合模型中,得到预测的所有站点流量信息的预测值Yt+1,Yt+2,...,Yt+T,其中,T'表示历史时间序列的时间窗大小,Yt+T表示未来t+T时刻所有站点流量信息的预测值,T表示预测序列的时间窗大小。
此外,为了提升GCN的计算效率,本申请深度预测混合模型使用了基于切比雪夫多项式的K阶局部滤波器,参数K通过试错法确定为2。
在一个实施例中,本申请还提供了一种交通预测装置,包括:
模糊图生成模块,用于采用模糊C均值聚类算法对所有交通站点的历史交通信息序列进行聚类,根据交通站点的历史交通信息序列的隶属度值构建交通站点间的邻接矩阵;
节点特征构造模块,用于将交通站点在t时刻的交通信息按照交通站点的排列顺序排列为站点序列,基于分位数将每个站点在t时刻的交通信息值分配到相应的分位数箱;采用马尔可夫链对分位数箱之间的状态转移进行计数,计数得到的转移频率值按照交通站点的排列顺序进行排列,生成t时刻的马尔可夫转移矩阵;建立t时刻的马尔可夫转移矩阵与站点序列之间的映射关系,得到相应的映射矩阵,将所述站点序列与映射矩阵进行组合,得到交通节点特征矩阵;
预测模块,用于将获得的所述邻接矩阵和特征矩阵输入到构建好的深度预测混合模型中,预测出交通站点未来的交通信息。
关于交通预测装置的具体限定可以参见上文中对于交通预测方法的限定,在此不再赘述。上述交通预测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
存储器和处理器之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件互相之间可以通过一条或多条通讯总线或信号线实现电性连接。存储器中存储有可在处理器上运行的计算机程序,所述处理器通过运行存储在存储器内的计算机程序,从而实现本发明实施例中的网络拓扑布局方法。
其中,所述存储器可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器用于存储程序,所述处理器在接收到执行指令后,执行所述程序。
所述处理器可能是一种集成电路芯片,具有数据的处理能力。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等。可以实现或者执行本发明实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本申请还选用了三组真实的交通数据集、四种评估指标和八个基准模型进行实验对比与分析,从时空相关性建模的有效性、长短期预测能力和模型参数的影响等三个角度对本申请所提出预测方法(SFGCNM)进行了全面评估。所有实验均在一台操作系统为64位、运行内存为32GB、处理器为英特尔酷睿i7-8700k、3.7GHz的电脑上进行,开发环境为Python3.6。试验数据收集自加州交通部的三组真实交通流数据集(记为PeMSD4、PeMSD7和PeMSD8)被用来验证SFGCNM模型的准确度和实用性。数据集通过Caltrans性能测量系统(PEMS)1收集,该系统有39000多个站点(探测器),能够收集各种交通数据,如交通流量、交通速度和交通占用率等。
为了验证所提出的预测方法的优越性,本申请使用了8个基准模型进行模型对比。这八个基准模型涵盖了统计学模型(HA)、机器学习模型(SVR)、深度学习模型(CLSTM和DL-STF)和基于GCN的模型(T-GCN、GCN、DLGCN和FLGCN)等四类预测模型,以确保模型对比的可靠性。值得注意的是,FLGCN也是本申请提出的一种预测模型。它与SFGCNM的不同之处在于FLGCN没有使用本申请提出的节点特征构造方法,但它的图生成方法和网络框架结构与SFGCNM均相同,即该模型基于FCM聚类生成交通网络图,然后采用各个站点的交通流作为相应的节点特征来预测未来时刻的交通流。
通过对比SFGCNM和FLGCN的预测性能,可以验证基于马尔可夫编码的节点特征构造方法的有效性。SFGCNM在构造节点特征时考虑了各站点之间的状态转移关系,使得GCN在卷积运算过程中可以同时考虑所有站点的全局和局部交通信息,从而有效提升了模型的预测性能。对于不同的数据集,SFGCNM的所有指标在不同预测时长上都优于FLGCN。例如,对于PeMSD4数据集的45分钟交通流预测任务,SFGCNM的MAE、RMSE和SMAPE值分别比FLGCN低0.506、0.781和0.334。对于PeMSD7数据集的45min交通流预测任务,SFGCNM的MAE、RMSE和SMAPE值分别比FLGCN低1.307、2.146和0.767。
为了验证本申请提出的模糊图生成方法能否有效表示交通网络中站点间的链接关系,本申请将基于FCM的图生成方法与传统的基于站点间距离的图生成方法进行了比较。试验结果显示,尽管以上两种方法都可以表示站点之间的链接关系,但是使用距离来计算站点之间的链接强度,难以衡量站点之间复杂且模糊的空间相关性。相反,基于FCM的图生成方法不仅能够客观地反映各站点间链接关系的强弱,而且能够表达站点间复杂的链接关系。因此,与基于距离的图生成方法相比,本申请提出的基于FCM的图生成方法可以进一步提高模型的预测性能。例如,对于PeMSD4数据集的30分钟交通流预测任务,FLGCN和DLGCN的RMSE(SMAPE)值分别为31.657(10.419)和32.029(10.462)。对于PeMSD8数据集的15分钟交通流预测任务,FLGCN和DLGCN的MAE(R2)值分别为17.459(96.845)和18.172(96.673)。
此外,通过对比SFGCNM和FLGCN的预测性能,可以验证基于马尔可夫编码的节点特征构造方法的有效性。SFGCNM在构造节点特征时考虑了各站点之间的状态转移关系,使得GCN在卷积运算过程中可以同时考虑所有站点的全局和局部交通信息,从而有效提升了模型的预测性能。试验结果表明,对于不同的数据集,SFGCNM的所有指标在不同预测时长上都优于FLGCN。例如,对于PeMSD4数据集的45分钟交通流预测任务,SFGCNM的MAE、RMSE和SMAPE值分别比FLGCN低0.506、0.781和0.334。对于PeMSD7数据集的45min交通流预测任务,SFGCNM的MAE、RMSE和SMAPE值分别比FLGCN低1.307、2.146和0.767。
此外,通过将SFGCNM与其它基准模型(HA、SVR、CLSTM、DL-STF、T-GCN和GCN)进行比较,可以验证时空相关性建模的有效性。与其它基准模型相比,SFGCNM不仅利用GCN来提取交通网络中复杂的空间相关性特征,而且采用了基于FCM的模糊图生成方法和基于马尔可夫编码的节点特征构造方法,可以获取更准确的预测结果。例如,对于PeMSD7数据集的15分钟交通流预测任务,HA、SVR、CLSTM、DL-STF、T-GCN、GCN和SFGCNM的MAE值分别为31.494、28.220、20.256、21.937、21.199、21.046和19.743。对于PeMSD8数据集的30分钟交通流预测任务,HA、SVR、CLSTM、DL-STF、T-GCN、GCN和SFGCNM的SMAPE值分别为19.035、14.726、9.937、10.461、11.742、11.180和9.230。
通过对实验结果的分析和讨论,可以得出以下结论:
1)、与其它基准模型相比,本申请提出的预测方法具有优越的时空特征提取能力,能够有效捕获交通数据中复杂、动态的时空相关特征。
2)、本申请提出的预测方法能够充分利用LSTM和GCN分别在时间和空间上的特征提取能力,在解决短期和长期交通预测任务时具有良好的性能。
3)、本申请提出的基于FCM的交通网络图生成方法能够有效表示交通网络中不同站点之间异质的链接关系。
4)、本申请提出的基于马尔可夫编码的节点特征构造方法能够更全面的支持站点间的信息交互。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (6)
1.一种交通预测方法,用于预测交通站点的交通信息,其特征在于,所述交通预测方法,包括:
采用模糊C均值聚类算法对所有交通站点的历史交通信息序列进行聚类,根据交通站点的历史交通信息序列的隶属度值构建交通站点间的邻接矩阵;
将交通站点在t时刻的交通信息按照交通站点的排列顺序排列为站点序列,基于分位数将每个站点在t时刻的交通信息值分配到相应的分位数箱;
采用马尔可夫链对分位数箱之间的状态转移进行计数,计数得到的转移频率值按照交通站点的排列顺序进行排列,生成t时刻的马尔可夫转移矩阵;
建立t时刻的马尔可夫转移矩阵与站点序列之间的映射关系,得到相应的映射矩阵,将所述站点序列与映射矩阵进行组合,得到交通站点特征矩阵;
将获得的所述邻接矩阵和特征矩阵输入到构建好的GCN和LSTM相结合的深度预测混合模型中,预测出交通站点未来的交通信息;
其中,所述t时刻的马尔可夫转移矩阵为:
其中,Mt为t时刻的马尔可夫转移矩阵,t时刻的马尔可夫转移矩阵Mt中的任一元素Ms1,s2表示s2站点的交通信息值所属的分位数箱中的点转移至s1站点的交通信息值所属的分位数箱中的点的频率,s1和s2表示任意两个交通站点;
所述映射矩阵为:
2.根据权利要求1所述的交通预测方法,其特征在于,所述采用模糊C均值聚类算法对所有交通站点的历史交通信息序列进行聚类,根据交通站点的历史交通信息序列的隶属度值构建交通站点间的邻接矩阵,包括:
采用模糊C均值聚类算法对所有交通站点的历史交通信息序列进行聚类,并采用如下公式计算各个聚类中每个交通站点的历史交通信息序列的隶属度值:
其中,ui,j表示第i个交通站点的交通信息序列对于第j个聚类的隶属度值,Xi表示第i个交通站点的交通信息序列,Cj表示第j个聚类中心,α表示用于控制生成聚类模糊性的权重指数,d(Xi,Cj)表示第i个站点的交通信息序列与第j个聚类中心的相似性度量,d(Xi,Ck)表示第i个站点的交通信息序列与第k个聚类中心的相似性度量,m为聚类的总数,i、j、k为序号,n为交通站点总数;
对于任意交通站点s1和s2,利用如下公式计算它们之间的链接关系As1,s2:
以交通站点间的链接关系构建交通站点间的邻接矩阵。
3.根据权利要求1所述的交通预测方法,其特征在于,所述深度预测混合模型包括两层堆叠的LGCN网络,每层LGCN包括GCN和LSTM,利用GCN对输入数据进行卷积运算以提取出空间特征向量,再将空间特征向量作为LSTM的输入以提取时间特征。
4.一种交通预测装置,用于预测交通站点的交通信息,其特征在于,所述交通预测装置,包括:
模糊图生成模块,用于采用模糊C均值聚类算法对所有交通站点的历史交通信息序列进行聚类,并根据交通站点的历史交通信息序列的隶属度值构建交通站点间的邻接矩阵;
节点特征构造模块,用于将交通站点在t时刻的交通信息按照交通站点的排列顺序排列为站点序列,基于分位数将每个站点在t时刻的交通信息值分配到相应的分位数箱;采用马尔可夫链对分位数箱之间的状态转移进行计数,计数得到的转移频率值按照交通站点的排列顺序进行排列,生成t时刻的马尔可夫转移矩阵;建立t时刻的马尔可夫转移矩阵与站点序列之间的映射关系,得到相应的映射矩阵,将所述站点序列与映射矩阵进行组合,得到交通站点特征矩阵;
预测模块,用于将获得的所述邻接矩阵和特征矩阵输入到构建好的GCN和LSTM相结合的深度预测混合模型中,预测出交通站点未来的交通信息;
其中,所述t时刻的马尔可夫转移矩阵为:
其中,Mt为t时刻的马尔可夫转移矩阵,t时刻的马尔可夫转移矩阵Mt中的任一元素Ms1,s2表示s2站点的交通信息值所属的分位数箱中的点转移至s1站点的交通信息值所属的分位数箱中的点的频率,s1和s2表示任意两个交通站点;
所述映射矩阵为:
5.根据权利要求4所述的交通预测装置,其特征在于,所述模糊图生成模块,采用模糊C均值聚类算法对所有交通站点的历史交通信息序列进行聚类,根据交通站点的历史交通信息序列的隶属度值构建交通站点间的邻接矩阵,执行如下操作:
采用模糊C均值聚类算法对所有交通站点的历史交通信息序列进行聚类,并采用如下公式计算各个聚类中每个交通站点的历史交通信息序列的隶属度值:
其中,ui,j表示第i个交通站点的交通信息序列对于第j个聚类的隶属度值,Xi表示第i个交通站点的交通信息序列,Cj表示第j个聚类中心,α表示用于控制生成聚类模糊性的权重指数,d(Xi,Cj)表示第i个站点的交通信息序列与第j个聚类中心的相似性度量,d(Xi,Ck)表示第i个站点的交通信息序列与第k个聚类中心的相似性度量,m为聚类的总数,i、j、k为序号,n为交通站点总数;
对于任意交通站点s1和s2,利用如下公式计算它们之间的链接关系As1,s2:
以交通站点间的链接关系构建交通站点间的邻接矩阵。
6.根据权利要求4所述的交通预测装置,其特征在于,所述深度预测混合模型包括两层堆叠的LGCN网络,每层LGCN包括GCN和LSTM,利用GCN对输入数据进行卷积运算以提取出空间特征向量,再将空间特征向量作为LSTM的输入以提取时间特征。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110297442.7A CN113065690B (zh) | 2021-03-19 | 2021-03-19 | 一种交通预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110297442.7A CN113065690B (zh) | 2021-03-19 | 2021-03-19 | 一种交通预测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113065690A CN113065690A (zh) | 2021-07-02 |
CN113065690B true CN113065690B (zh) | 2023-06-30 |
Family
ID=76562609
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110297442.7A Active CN113065690B (zh) | 2021-03-19 | 2021-03-19 | 一种交通预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113065690B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115938112A (zh) * | 2022-11-23 | 2023-04-07 | 华侨大学 | 交通需求预测方法、系统、电子设备及计算机存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106530715A (zh) * | 2016-12-24 | 2017-03-22 | 浙江工业大学 | 基于模糊马尔可夫过程的路网交通状态预测方法 |
CN107426703A (zh) * | 2017-08-24 | 2017-12-01 | 北京邮电大学 | 一种在室外人流密集场所基于模糊聚类的移动性预测方法 |
CN109377761A (zh) * | 2018-12-10 | 2019-02-22 | 南京理工大学 | 基于马尔可夫链模型的交通因子网络构建方法 |
WO2020164740A1 (en) * | 2019-02-15 | 2020-08-20 | Huawei Technologies Co., Ltd. | Methods and systems for automatically selecting a model for time series prediction of a data stream |
CN112289034A (zh) * | 2020-12-29 | 2021-01-29 | 四川高路交通信息工程有限公司 | 基于多模态时空数据的深度神经网络鲁棒交通预测方法 |
-
2021
- 2021-03-19 CN CN202110297442.7A patent/CN113065690B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106530715A (zh) * | 2016-12-24 | 2017-03-22 | 浙江工业大学 | 基于模糊马尔可夫过程的路网交通状态预测方法 |
CN107426703A (zh) * | 2017-08-24 | 2017-12-01 | 北京邮电大学 | 一种在室外人流密集场所基于模糊聚类的移动性预测方法 |
CN109377761A (zh) * | 2018-12-10 | 2019-02-22 | 南京理工大学 | 基于马尔可夫链模型的交通因子网络构建方法 |
WO2020164740A1 (en) * | 2019-02-15 | 2020-08-20 | Huawei Technologies Co., Ltd. | Methods and systems for automatically selecting a model for time series prediction of a data stream |
CN112289034A (zh) * | 2020-12-29 | 2021-01-29 | 四川高路交通信息工程有限公司 | 基于多模态时空数据的深度神经网络鲁棒交通预测方法 |
Non-Patent Citations (4)
Title |
---|
Dynamic Hidden Markov Model for Metropolitan Traffic Flow Prediction;Zihan Li 等;《2020 IEEE 92nd Vehicular Technology Conference (VTC2020-Fall)》;1-5 * |
Spatiotemporal fuzzy-graph convolutional network model with dynamic feature encoding for traffic forecasting;Zhang, Shuai 等;Knowledge-Based Systems;第231卷;1-14 * |
基于CNN-SVR混合深度学习模型的短时交通流预测;罗文慧 等;《交通运输系统工程与信息》;第17卷(第5期);68-74 * |
基于聚类分析和马尔科夫模型的交通状态预测;郭骁炜 等;《公路》;第64卷(第08期);304-309 * |
Also Published As
Publication number | Publication date |
---|---|
CN113065690A (zh) | 2021-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liu et al. | Contextualized spatial–temporal network for taxi origin-destination demand prediction | |
CN110969854A (zh) | 一种交通流量的预测方法、系统及终端设备 | |
Du et al. | Traffic demand prediction based on dynamic transition convolutional neural network | |
CN103077604B (zh) | 交通传感器管理方法和系统 | |
Bargiela et al. | Recursive information granulation: aggregation and interpretation issues | |
CN113762595B (zh) | 通行时间预测模型训练方法、通行时间预测方法及设备 | |
WO2022227303A1 (zh) | 信息处理方法、装置、计算机设备及存储介质 | |
CN106595665A (zh) | 一种障碍空间中移动对象时空轨迹的预测方法 | |
Li et al. | Estimating urban traffic states using iterative refinement and wardrop equilibria | |
CN114495492B (zh) | 一种基于图神经网络的交通流预测方法 | |
CN105574541A (zh) | 一种基于紧密度排序的网络社区发现方法 | |
Chu et al. | Feature selection using approximated high-order interaction components of the Shapley value for boosted tree classifier | |
CN113065690B (zh) | 一种交通预测方法及装置 | |
Xia et al. | A parallel grid-search-based SVM optimization algorithm on Spark for passenger hotspot prediction | |
Ganapathy et al. | Prediction of traffic volume by mining traffic sequences using travel time based PrefixSpan | |
CN113643532A (zh) | 一种区域交通的预测方法以及设备 | |
CN114418189A (zh) | 水质等级预测方法、系统、终端设备及存储介质 | |
CN110019845A (zh) | 一种基于知识图谱的社区演化分析方法及装置 | |
Habib et al. | Optimizing traveling salesman problem using tabu search metaheuristic algorithm with Pythagorean fuzzy uncertainty | |
Chen et al. | Digital twin mobility profiling: A spatio-temporal graph learning approach | |
Rong et al. | An interdisciplinary survey on origin-destination flows modeling: Theory and techniques | |
CN103313384A (zh) | 一种基于信息一致性的无线传感网络目标跟踪方法 | |
Cerqueira et al. | Integrative analysis of traffic and situational context data to support urban mobility planning | |
Galba et al. | Public transportation bigdata clustering | |
CN112907056B (zh) | 一种基于图神经网络的城市管理投诉事件预测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |