CN114169649A - 一种基于时空数据嵌入的交通流量预测方法 - Google Patents

一种基于时空数据嵌入的交通流量预测方法 Download PDF

Info

Publication number
CN114169649A
CN114169649A CN202210050814.0A CN202210050814A CN114169649A CN 114169649 A CN114169649 A CN 114169649A CN 202210050814 A CN202210050814 A CN 202210050814A CN 114169649 A CN114169649 A CN 114169649A
Authority
CN
China
Prior art keywords
traffic flow
time
data
matrix
embedding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210050814.0A
Other languages
English (en)
Inventor
张帅
竺堃
张文宇
胡泽乾
徐纪元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Finance and Economics
Original Assignee
Zhejiang University of Finance and Economics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Finance and Economics filed Critical Zhejiang University of Finance and Economics
Publication of CN114169649A publication Critical patent/CN114169649A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Economics (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Primary Health Care (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种基于时空数据嵌入的交通流量预测方法,包括:获取历史交通流量数据;基于历史交通流量数据执行时空数据嵌入,包括:交通流量的区间表示:确定的每个交通流量所属区间以转化为对应交通流量区间;交通流量向量的生成:取所有交通流量区间作为输入数据,采用Word2vec模型将输入数据转换为嵌入数据,即对应的交通流量向量;基于交通流量向量提取时间特征得节点特征矩阵、提取电警设备之间的相关性得动态关联图;将节点特征矩阵和动态关联图输入图卷积神经网络,得到图卷积神经网络输出的预测结果。该方法可量化和度量交通流量之间隐含的相关性,提取高层次时间特征和动态关联图以进行有效建模,获得准确稳定的交通流量预测。

Description

一种基于时空数据嵌入的交通流量预测方法
技术领域
本申请属于交通流量预测技术领域,具体涉及一种基于时空数据嵌入的交通流量预测方法。
背景技术
交通流量预测是时空预测中的一项典型任务,其目的是根据历史的交通流量来预测未来的交通流量。交通流量预测不仅可以预测潜在的道路拥堵来帮助管理者及时引导交通,还可以帮助出行者提前计划或调整出行路线。因此,实现准确、稳定的交通流量预测势在必行。然而,由于交通流量具有复杂的时空依赖性,获取精确的交通流量预测结果仍然是一个巨大的挑战。
目前,深度学习已经被广泛地应用于各个领域,因为它可以结合简单但非线性的模块来生成原始输入数据的多层次深度表示。最近,基于卷积神经网络(CNN)或图卷积神经网络(GCN)的高级深度学习模型已经被成功地应用于交通预测中。具体而言,基于CNN的模型将交通网络视为一幅图像,并在欧几里得空间(如二维矩阵或规则网格)中提取空间特征。基于GCN的模型将交通网络视为一个图结构,其中节点代表传感器(电警设备),权重代表传感器之间的相关性,并通过对交通网络的非欧几里得拓扑结构进行编码来提取空间特征。与基于图像结构的CNN相比,GCN能够更好地利用交通网络固有的拓扑结构和传感器之间的异质相关性,从而获得更好的预测结果。
然而,CNN模型中简单的图像无法准确地表示交通网络的真实结构,因为交通网络具有不规则的非欧几里得拓扑结构。因此,传统的CNN无法有效地提取交通网络复杂的空间特征。其次,尽管大多数现有的基于GCN的研究能够获得较好的预测结果,但其只是构建了一个包含固定权重的静态图,无法准确地反映随时间变化而发生改变的传感器之间的相关性。因此,现有的关于深度学习的交通流量预测研究仍然存在一些不足。
发明内容
本申请的目的在于提供一种基于时空数据嵌入的交通流量预测方法,实现准确稳定的交通流量预测。
为实现上述目的,本申请所采取的技术方案为:
一种基于时空数据嵌入的交通流量预测方法,包括:
步骤1、获取历史交通流量数据:采集N个电警设备M个时间点的交通流量作为历史交通流量数据;
步骤2、基于历史交通流量数据执行时空数据嵌入,包括:
步骤2.1、交通流量的区间表示:
步骤2.1.1、取历史交通流量数据中交通流量的最大值和最小值作为交通流量范围的上限和下限,并将交通流量范围等距划分为P个区间,区间符号Di代表第i个区间,1≤i≤P;
步骤2.1.2、确定历史交通流量数据中的每个交通流量的所属区间,并将每个交通流量表示为其所属区间的区间符号以转化为对应的交通流量区间;
步骤2.2、交通流量向量的生成:
步骤2.2.1、取历史交通流量数据中预设的时间步长内所有的交通流量区间作为输入数据,记为
Figure BDA0003474221620000021
其中T表示时间步长,采用Word2vec模型将输入数据
Figure BDA0003474221620000022
转换为嵌入数据
Figure BDA0003474221620000023
其中Z表示交通流量向量的嵌入维度,即得到对应的交通流量向量;
步骤3、基于时空数据嵌入后得到的交通流量向量提取时间特征得到节点特征矩阵;
步骤4、基于时空数据嵌入后得到的交通流量向量提取电警设备之间的相关性得到动态关联图;
步骤5、将所述节点特征矩阵和动态关联图输入图卷积神经网络GCN中,得到图卷积神经网络GCN输出的预测结果,所述预测结果为所有电警设备未来T′个时间点的交通流量。
以下还提供了若干可选方式,但并不作为对上述总体方案的额外限定,仅仅是进一步的增补或优选,在没有技术或逻辑矛盾的前提下,各可选方式可单独针对上述总体方案进行组合,还可以是多个可选方式之间进行组合。
优选地,所述区间Di的下界vri,l和上界vri,u计算如下:
Figure BDA0003474221620000024
Figure BDA0003474221620000031
式中,vrmin和vrmax分别表示交通流量范围的下限和上限。
优选地,所述基于时空数据嵌入后得到的交通流量向量提取时间特征得到节点特征矩阵,包括:
步骤3.1、以不同电警设备对嵌入数据
Figure BDA0003474221620000032
进行划分,划分得到N个嵌入矩阵
Figure BDA0003474221620000033
步骤3.2、取滤波器组,该滤波器组中包含高度为H1,H2,…,HG的G种不同高度,且每种高度具有R个滤波器;
步骤3.3、采用不同高度的滤波器对每个嵌入矩阵进行时间特征提取得到多个特征图,将所有特征图连接并展开后得到高层次的时间特征
Figure BDA0003474221620000034
其中LT表示时间特征的长度;
步骤3.4、将所有嵌入矩阵对应的高层次的时间特征进行连接得到节点特征矩阵
Figure BDA0003474221620000035
优选地,所述采用不同高度的滤波器对每个嵌入矩阵进行时间特征提取得到多个特征图,包括:
步骤3.3.1、选择高度为Hg的R个滤波器,g=1,2,…,G,对第n个嵌入矩阵
Figure BDA0003474221620000036
进行时间特征提取,n=1,2,…,N,取嵌入矩阵Wn中第d行到第e行的元素得到的嵌入矩阵Wn的子矩阵
Figure BDA0003474221620000037
步骤3.3.2、设置滤波器的宽度为交通流量向量的嵌入维度Z,则高度为Hg的滤波器可表示为
Figure BDA0003474221620000038
步骤3.3.3、对子矩阵
Figure BDA0003474221620000039
分别应用其一滤波器
Figure BDA00034742216200000310
以获得相应的特征图FM,应用公式如下:
fms=f(θ⊙Wn[s:s+Hg-1]+bs),s=1,2,…,T-Hg+1
Figure BDA00034742216200000311
式中,fms表示特征图FM的第s个组成部分,f(·)表示激活函数,⊙表示子矩阵和滤波器之间的点积,bs表示偏置项。
优选地,所述基于时空数据嵌入后得到的交通流量向量提取电警设备之间的相关性得到动态关联图,包括:
步骤4.1、计算电警设备的平均交通流量向量:
Figure BDA0003474221620000041
式中,
Figure BDA0003474221620000042
表示第x个电警设备在时间步长T内的平均交通流量向量;T表示时间步长;
Figure BDA0003474221620000043
表示在时间步长T内第x个电警设备的第t个交通流量向量;
步骤4.2、计算第x个电警设备和第y个电警设备的相似度:
Figure BDA0003474221620000044
式中,Sim(x,y)为第x个电警设备和第y个电警设备的相似度,y=1,2,…,N,
Figure BDA0003474221620000045
Figure BDA0003474221620000046
分别表示平均交通流量向量
Figure BDA0003474221620000047
Figure BDA0003474221620000048
的第z个分量;
步骤4.3、计算第x个电警设备和第y个电警设备之间的距离Disx,y
步骤4.4、基于第x个电警设备和第y个电警设备的相似度和距离得到动态相关性:
Figure BDA0003474221620000049
式中,Ax,y表示第x个电警设备和第y个电警设备之间的动态相关性,α和β表示权值系数;σ1表示相似度的标准差;σ2表示距离的标准差;ε表示阈值;
步骤4.5、获得动态关联图,所述动态关联图为不同时间段计算得到的加权邻接矩阵A的组合,时间段的时间跨度对应时间步长,所述加权邻接矩阵A为以Ax,y为元素的N×N维矩阵。
本申请提供的基于时空数据嵌入的交通流量预测方法,将原始的交通流量数据映射到向量空间中,并将每个交通流量数据转化为相应的向量表示以量化和度量交通流量之间隐含的相关性。此外,充分利用交通流量向量中包含的关联信息以获取高层次的时间特征,并且为不同的时间段生成不同的动态关联图,从而对电警设备之间的动态相关性进行有效建模,进而实现非欧几里得空间特征的深度提取,以获取准确、稳定的交通流量预测结果。
附图说明
图1为本申请的基于时空数据嵌入的交通流量预测方法的流程图;
图2为本申请交通流量的区间表示流程图;
图3为本申请提取时间特征的流程图;
图4为本申请实验中CLTFP、GCN、STGCN和STDE-DGCN模型在24小时中的预测误差示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是在于限制本申请。
其中一个实施例中,针对现有大部分研究都忽略了交通流量之间隐含的相关性,难以有效地提取深层次的时空依赖特征。且大多数研究仅仅构建一个由固定权重组成的静态图来表示传感器之间的相关性,忽略了电警设备之间的相关性会随时间变化而发生改变的事实,本实施例提出一种基于时空数据嵌入的交通流量预测方法。
交通流量预测的任务是根据交通网络中观测到的历史交通流量数据来预测未来的交通流量。为了形式化地表示交通流量预测问题,本实施例首先定义了一些关键的概念:
定义1:交通网络图。使用加权无向图G=(V,E,A)来表示交通网络,其中V代表一组图节点;E代表一组边,表示传感器之间的连通性;
Figure BDA0003474221620000051
代表一个加权邻接矩阵,表示传感器之间的相关性。
定义2:特征矩阵。在图G上观测到的交通流量由特征矩阵
Figure BDA0003474221620000052
表示,其中R代表每个节点包含的特征数量。特别地,
Figure BDA0003474221620000053
被用来表示t时刻的特征矩阵。
因此根据上述定义,可以将交通预测问题看作:根据交通网络图G和特征矩阵X来学习映射函数F,并通过公式(1)来预测未来T′个时刻所有传感器的交通流量。
[Yt+1,Yt+2,…,Yt+T′]=F(G;[Xt-T+1,Xt-T+2,…,Xt]) (1)
其中,T表示历史时间段的序列长度,即时间步长,
Figure BDA0003474221620000061
表示模型在t+1时刻预测的所有传感器的交通流量。
具体的,如图1所示,本实施例的基于时空数据嵌入的交通流量预测方法,包括以下步骤:
步骤1、获取历史交通流量数据:采集N个电警设备M个时间点的交通流量作为历史交通流量数据。
步骤2、基于历史交通流量数据执行时空数据嵌入。
在时空数据嵌入中,首先以区间的形式表示每个交通流量的值,并提出了一种STD2vec方法来生成包含一系列交通流量向量的向量空间。
步骤2.1、交通流量的区间表示。
由于观测到的交通流量中存在一些出现频率较低的值,这不仅会产生较高的计算成本,而且会降低嵌入的交通流量向量的质量。因此,为了降低嵌入表示的复杂度和获得高质量的交通流量向量,本实施例将数值接近的交通流量分组在一起并用统一的区间符号来表示。如图2所示,具体包括以下步骤:
步骤2.1.1、取历史交通流量数据中交通流量的最大值和最小值作为交通流量范围的上限和下限,并将交通流量范围等距划分为P个区间,区间符号Di代表第i个区间,1≤i≤P,其中区间Di的下界vri,l和上界vri,u计算如下:
Figure BDA0003474221620000062
Figure BDA0003474221620000063
式中,vrmin和vrmax分别表示交通流量范围的下限和上限。
步骤2.1.2、确定历史交通流量数据中的每个交通流量的所属区间,并将每个交通流量表示为其所属区间的区间符号以转化为对应的交通流量区间。
步骤2.2、交通流量向量的生成。
步骤2.2.1、取历史交通流量数据中预设的时间步长内所有的交通流量区间作为输入数据,记为
Figure BDA0003474221620000064
其中T表示时间步长,采用Word2vec模型将输入数据
Figure BDA0003474221620000071
转换为嵌入数据
Figure BDA0003474221620000072
其中Z表示交通流量向量的嵌入维度,即得到对应的交通流量向量。
一个文档包含了一系列单词,而一个传感器包含了一系列不同历史时间点的交通流量区间。根据这种类比关系,本实施例的STD2vec方法将每个时间点的交通流量区间视为一个单词,并将每个包含交通流量区间的传感器视为一个文档。然后,STD2vec方法采用Word2vec模型以生成一个向量空间,该向量空间包含了交通流量区间的关联信息。最后,根据所生成的向量空间,每个交通流量区间被转换成相应的交通流量向量。使用时空数据嵌入中生成的向量空间将输入数据从二维(即传感器和时间步长)转换为三维(即传感器、时间步长和向量维度)。如以每5分钟获取一次,则一天包含288个时间点,即M=288,时间步长可根据实际需求确定,如为12。
Word2vec模型是将单词转换为单词向量的最有效的方法之一,该方法通过生成一个嵌入空间来使语义相似的单词在该空间中距离相近,然后学习各单词的向量表示。Word2vec可以由两种不同的模型实现:CBOW模型和Skip-Gram模型。本实施例采用了Skip-Gram模型,因为当训练数据足够时,Skip-Gram模型通常会表现出更好的性能。
在获得交通流量向量之后,两个交通流量之间的相关性可以通过它们的向量来计算。此外,可以通过类比两个词向量之间的高相关性来说明两个交通流量向量之间的高相关性。具体而言,两个高度相关的词向量是指这两个词在文档中经常相邻出现,或者它们周围的词高度相关。类似地,两个交通流量向量之间的高度相关性可以由两种解释来说明。第一种是这两个交通流量通常沿着时间维度相邻出现,这表示它们之间存在短期时间相关性。第二种是这两个交通流量之间的时间跨度较大,但它们周围的交通流量在时间维度上高度相关,从而使这两个交通流量高度相关,这表示它们之间存在长期时间相关性。
因此,与原始的交通流量相比,采用本实施例STD2vec方法所生成的交通流量向量同时包含了短期相关性和长期时间相关性,有利于深度学习模型进一步提取深层次的时空依赖特征。
步骤3、基于时空数据嵌入后得到的交通流量向量提取时间特征得到节点特征矩阵。
实施例提取时间特征包括以下步骤:
步骤3.1、以不同电警设备对嵌入数据
Figure BDA0003474221620000081
进行划分,划分得到N个嵌入矩阵
Figure BDA0003474221620000082
步骤3.2、取滤波器组,该滤波器组中包含高度为H1,H2,…,HG的G种不同高度,且每种高度具有R个滤波器;
步骤3.3、采用不同高度的滤波器对每个嵌入矩阵进行时间特征提取得到多个特征图,将所有特征图连接并展开后得到高层次的时间特征
Figure BDA0003474221620000083
其中LT表示时间特征的长度。时间特征的维度是1*X,X即为这里的LT,为时间特征的长度;
步骤3.3.1、选择高度为Hg的R个滤波器,g=1,2,…,G,对第n个嵌入矩阵
Figure BDA0003474221620000084
进行时间特征提取,n=1,2,…,N,取嵌入矩阵Wn中第d行到第e行的元素得到的嵌入矩阵Wn的子矩阵
Figure BDA0003474221620000085
步骤3.3.2、设置滤波器的宽度为交通流量向量的嵌入维度Z,则高度为Hg的滤波器可表示为
Figure BDA0003474221620000086
步骤3.3.3、对子矩阵
Figure BDA0003474221620000087
分别应用其一滤波器
Figure BDA0003474221620000088
以获得相应的特征图FM,应用公式如下:
fms=f(θ⊙Wn[s:s+Hg-1]+bs),s=1,2,…,T-Hg+1 (4)
Figure BDA0003474221620000089
式中,fms表示特征图FM的第s个组成部分,f(·)表示激活函数,⊙表示子矩阵和滤波器之间的点积,bs表示偏置项。
步骤3.4、将所有嵌入矩阵对应的高层次的时间特征进行连接得到节点特征矩阵
Figure BDA00034742216200000810
步骤4、基于时空数据嵌入后得到的交通流量向量提取电警设备之间的相关性得到动态关联图。
图生成方法对于GCN的特征提取能力至关重要,现有的研究主要使用传感器之间的距离来构建一个具有固定权重的静态图,忽略了传感器之间的相关性会随时间变化而发生改变的事实。因此本实施例提出了一种新的图生成方法来为不同的时间段生成不同的动态关联图,从而帮助GCN对传感器之间的动态相关性进行有效建模。
步骤4.1、计算电警设备的平均交通流量向量:
Figure BDA0003474221620000091
式中,
Figure BDA0003474221620000092
表示第x个电警设备在时间步长T内的平均交通流量向量;T表示时间步长;
Figure BDA0003474221620000093
表示在时间步长T内第x个电警设备的第t个交通流量向量;
步骤4.2、计算第x个电警设备和第y个电警设备的相似度:
Figure BDA0003474221620000094
式中,Sim(x,y)为第x个电警设备和第y个电警设备的相似度,y=1,2,…,N,
Figure BDA0003474221620000095
Figure BDA0003474221620000096
分别表示平均交通流量向量
Figure BDA0003474221620000097
Figure BDA0003474221620000098
的第z个分量;
步骤4.3、计算第x个电警设备和第y个电警设备之间的距离Disx,y。此处距离Disx,y根据传感器(电警设备)的地理位置计算,即直接根据电警设备之间的实际地理位置坐标计算得到;
步骤4.4、使用基于阈值的高斯核来计算动态关联图对应的加权邻接矩阵A,即根据第x个电警设备和第y个电警设备的相似度和距离得到动态相关性:
Figure BDA0003474221620000099
式中,Ax,y表示第x个电警设备和第y个电警设备之间的动态相关性,也代表加权邻接矩阵A中的元素,α和β表示权值系数;σ1表示相似度的标准差;σ2表示距离的标准差;ε表示阈值;
步骤4.5、获得动态关联图,所述动态关联图为不同时间段计算得到的加权邻接矩阵A的组合,时间段的时间跨度对应时间步长,所述加权邻接矩阵A为以Ax,y为元素的N×N维矩阵。
步骤5、将所述节点特征矩阵和动态关联图输入图卷积神经网络GCN中,得到图卷积神经网络GCN输出的预测结果,所述预测结果为所有电警设备未来T′个时间点的交通流量。T′可以根据实际情况确定。
本实施例中的GCN采用频谱公式来编码图结构和节点特征,为现有技术,在此不再赘述。归一化的邻接矩阵
Figure BDA0003474221620000101
的定义如公式(9)所示:
Figure BDA0003474221620000102
式中,
Figure BDA0003474221620000103
代表度矩阵。本文中的图卷积的整个运算过程可以使用公式(10)来表示:
Figure BDA0003474221620000104
式中,F(q)、W1 (q)、W2 (q)和LM(q)分别表示第q层的隐藏特征,两种权重参数和归一化邻接矩阵。
Figure BDA0003474221620000105
代表单位矩阵,U表示第一层的输入特征,ReLU(Nair and Hinton 2010)表示激活函数。关于GCN的详细描述可以参考论文Kipf和Welling(2016)。
在另一个实施例中,通过实验进一步验证本实施例提出的流量预测方法的有效性:
1、数据描述和预处理
本实施例在两组真实的交通数据集PeMSD7和PeMSD8上验证所提出模型的性能,这两组数据集来自加利福尼亚运输机构性能测量系统(PeMS)(http://pems.dot.ca.gov/),该系统通过美国加利福尼亚州的39000多个传感器连续实时地收集交通数据。在本数据集中,每五分钟检索一次交通数据,因此每个传感器每天包含288个时间点。
数据集PeMSD7包含来自洛杉矶县的交通数据。本实施例选择了150个传感器并提取了2017年6月1日至2017年6月30日这一个月的交通流量进行实验,并将20天的数据作为训练集,5天的数据作为验证集,5天的数据作为测试集。
数据集PeMSD8包含来自圣贝纳迪诺的交通数据。本实施例选择了102个传感器并提取了2017年6月1日至2017年7月31日这两个月的交通流量进行实验,并将41天的数据作为训练集,10天的数据作为验证集,10天的数据作为测试集。
2、评估指标
为了评估所提出方法的性能,本实施例采用了三种广泛使用的统计指标,包括平均绝对误差(MAE),平均方根误差(RMSE)和平均绝对百分比误差(MAPE)。它们的公式定义如下:
Figure BDA0003474221620000111
Figure BDA0003474221620000112
Figure BDA0003474221620000113
式中,
Figure BDA0003474221620000114
和yt分别表示时间点t的预测值和真实值,n表示测试样本的大小。
3、比较对象
为了验证本申请所提出的基于时空数据嵌入的交通流量预测方法(简称STDE-DGCN模型)的优越性,本实施例选择了以下几种基线模型进行比较:
1)HA:历史平均法,利用12个历史时间点的平均交通流量来预测下一个时间点的流量。
2)SVR(Wu等,2004):支持向量回归(SVR)是一种广泛使用的机器学习方法。本文将惩罚参数和容忍度设置为0.1和0.03.
3)LSTM(Ma等,2015):长短时记忆网络(LSTM)包含一个LSTM层,该层具有64个神经元。最终的预测结果通过一个全连接层获得。
4)Image-CNN(Ma等,2017):它用图像(二维矩阵)来表示时空数据,并利用多个卷积层提取时空特征。
5)ConvLSTM(Shi等,2015):它是一个扩展的全连接LSTM,且具有嵌入式卷积层,可以同时提取空间特征和时间特征。
6)CLTFP(Wu和Tan,2016):它分别使用CNN和LSYM提取空间和时间特征,并将它们融合以获得高级的时空特征。
7)GCN(Kipf和Welling,2016):它利用传感器之间的距离生成GCN的静态交通网络图,并将每个传感器的历史交通流量作为相应的节点特征。
8)STGCN(Yu等,2018):它利用传感器之间的距离生成GCN的静态交通网络图,并通过具有门控机制的完整卷积结构提取时空特征。
4、参数设置
在时空数据嵌入中,交通流量区间的数量为200,交通流量区间的下界和上界分别设置为0和1000。Word2vec的窗口大小为5,向量维度为100。在时间特征提取中,构建了四种类型的滤波器,其高度分别为3、5、7和9且每种高度的滤波器都有32个。在空间特征提取中,基于阈值的高斯核α、β和ε均被设置为0.5;GCN的层数为4,前三层包含64个神经元,最后一层的神经元个数等于预测范围的长度。滤波器和GCN的激活函数都是ReLU。采用RMSprop优化器来训练STDE-DGCN模型,且采用均方差数作为目标函数。
为了确保实验比较的公平性,我们为基线模型和STDE-DGCN模型设置了相同的实验参数:将历史时间段的序列长度(时间步长)设置为12,训练代数设置为100,批量大小设置为64,初始学习率设置为0.001,并采用早停法来防止模型过拟合。
5、实验结果
以数据集PeMSD7和PeMSD8为历史数据基础,记录STDE-DGCN模型和所有基线模型在PeMSD7和PeMSD8数据集上的预测结果如表1所示。
表1两组数据集中不同模型的预测结果
Figure BDA0003474221620000121
由表1可以看出,预测范围分别为15分钟(3个时间步长)、30分钟(6个时间步长)和1小时(12个时间步长)。显然,深度学习模型LSTM、Image-CNN、ConvLSTM、CLTFP、STGCN和STDE-DGCN的性能优于具有简单架构的模型,例如HA和SVR,这说明深度学习模型更适合处理复杂的时空数据。
与ConvLSTM、CLTFP、STGCN和STDE-DGCN相比,LSTM和Image-CNN的预测误差更高,因为它们只侧重于提取时间特征或空间特征,这说明交通流量的时间特征和空间特征都会影响交通流量预测的准确性。
与ConvLSTM和CLTFP相比,基于GCN的模型GCN、STGCN和STDE-DGCN性能更好,这说明交通网络的非欧几里得拓扑结构对模型的预测性能是至关重要的。
在基于GCN的模型中,STDE-DGCN在所有评价指标上都优于GCN和STGCN,因为只有STDE-DGCN可以对传感器之间的动态相关性进行有效建模,并全面地利用交通流量之间隐含的相关性。
另外,图4展示了表1中四个最佳模型(CLTFP、GCN、STGCN和STDE-DGCN)在24小时中的预测误差。结果表明,STDE-DGCN获得的MAE、RMSE和MAPE均低于CLTFP、GCN和STGCN,特别是在高峰期(即8:00和17:00)。例如,对于PeMSD7,CLTFP在17:00的MAE约为40,而STDE-DGCN在17:00的MAE仅约为23。对于PeMSD8,STGCN在8:00的RMSE约为21,而STDE-DGCN在8:00的RMSE约为18。此外,STDE-DGCN的预测误差在所有时间点的波动都较小,这表明STDE-DGCN模型具有更好的准确性和稳定性。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (5)

1.一种基于时空数据嵌入的交通流量预测方法,其特征在于,所述基于时空数据嵌入的交通流量预测方法,包括:
步骤1、获取历史交通流量数据:采集N个电警设备M个时间点的交通流量作为历史交通流量数据;
步骤2、基于历史交通流量数据执行时空数据嵌入,包括:
步骤2.1、交通流量的区间表示:
步骤2.1.1、取历史交通流量数据中交通流量的最大值和最小值作为交通流量范围的上限和下限,并将交通流量范围等距划分为P个区间,区间符号Di代表第i个区间,1≤i≤P;
步骤2.1.2、确定历史交通流量数据中的每个交通流量的所属区间,并将每个交通流量表示为其所属区间的区间符号以转化为对应的交通流量区间;
步骤2.2、交通流量向量的生成:
步骤2.2.1、取历史交通流量数据中预设的时间步长内所有的交通流量区间作为输入数据,记为
Figure FDA0003474221610000013
其中T表示时间步长,采用Word2vec模型将输入数据
Figure FDA0003474221610000015
转换为嵌入数据
Figure FDA0003474221610000014
其中Z表示交通流量向量的嵌入维度,即得到对应的交通流量向量;
步骤3、基于时空数据嵌入后得到的交通流量向量提取时间特征得到节点特征矩阵;
步骤4、基于时空数据嵌入后得到的交通流量向量提取电警设备之间的相关性得到动态关联图;
步骤5、将所述节点特征矩阵和动态关联图输入图卷积神经网络GCN中,得到图卷积神经网络GCN输出的预测结果,所述预测结果为所有电警设备未来T′个时间点的交通流量。
2.如权利要求1所述的基于时空数据嵌入的交通流量预测方法,其特征在于,所述区间Di的下界vri,l和上界vri,u计算如下:
Figure FDA0003474221610000011
Figure FDA0003474221610000012
式中,vrmin和vrmax分别表示交通流量范围的下限和上限。
3.如权利要求1所述的基于时空数据嵌入的交通流量预测方法,其特征在于,所述基于时空数据嵌入后得到的交通流量向量提取时间特征得到节点特征矩阵,包括:
步骤3.1、以不同电警设备对嵌入数据
Figure FDA0003474221610000021
进行划分,划分得到N个嵌入矩阵
Figure FDA0003474221610000022
步骤3.2、取滤波器组,该滤波器组中包含高度为H1,H2,...,HG的G种不同高度,且每种高度具有R个滤波器;
步骤3.3、采用不同高度的滤波器对每个嵌入矩阵进行时间特征提取得到多个特征图,将所有特征图连接并展开后得到高层次的时间特征
Figure FDA0003474221610000023
其中LT表示时间特征的长度;
步骤3.4、将所有嵌入矩阵对应的高层次的时间特征进行连接得到节点特征矩阵
Figure FDA0003474221610000024
4.如权利要求3所述的基于时空数据嵌入的交通流量预测方法,其特征在于,所述采用不同高度的滤波器对每个嵌入矩阵进行时间特征提取得到多个特征图,包括:
步骤3.3.1、选择高度为Hg的R个滤波器,g=1,2,...,G,对第n个嵌入矩阵
Figure FDA0003474221610000025
进行时间特征提取,n=1,2,...,N,取嵌入矩阵Wn中第d行到第e行的元素得到的嵌入矩阵Wn的子矩阵
Figure FDA0003474221610000026
步骤3.3.2、设置滤波器的宽度为交通流量向量的嵌入维度Z,则高度为Hg的滤波器可表示为
Figure FDA0003474221610000027
步骤3.3.3、对子矩阵
Figure FDA0003474221610000028
分别应用其一滤波器
Figure FDA0003474221610000029
以获得相应的特征图FM,应用公式如下:
fms=f(θ⊙Wn[s:s+Hg-1]+bs),s=1,2,...,T-Hg+1
Figure FDA00034742216100000210
式中,fms表示特征图FM的第s个组成部分,f(·)表示激活函数,⊙表示子矩阵和滤波器之间的点积,bs表示偏置项。
5.如权利要求1所述的基于时空数据嵌入的交通流量预测方法,其特征在于,所述基于时空数据嵌入后得到的交通流量向量提取电警设备之间的相关性得到动态关联图,包括:
步骤4.1、计算电警设备的平均交通流量向量:
Figure FDA0003474221610000031
式中,
Figure FDA0003474221610000032
表示第x个电警设备在时间步长T内的平均交通流量向量;T表示时间步长;
Figure FDA0003474221610000033
表示在时间步长T内第x个电警设备的第t个交通流量向量;
步骤4.2、计算第x个电警设备和第y个电警设备的相似度:
Figure FDA0003474221610000034
式中,Sim(x,y)为第x个电警设备和第y个电警设备的相似度,y=1,2,...,N,
Figure FDA0003474221610000035
Figure FDA0003474221610000036
分别表示平均交通流量向量
Figure FDA0003474221610000037
Figure FDA0003474221610000038
的第z个分量;
步骤4.3、计算第x个电警设备和第y个电警设备之间的距离Disx,y
步骤4.4、基于第x个电警设备和第y个电警设备的相似度和距离得到动态相关性:
Figure FDA0003474221610000039
式中,Ax,y表示第x个电警设备和第y个电警设备之间的动态相关性,α和β表示权值系数;σ1表示相似度的标准差;σ2表示距离的标准差;ε表示阈值;
步骤4.5、获得动态关联图,所述动态关联图为不同时间段计算得到的加权邻接矩阵A的组合,时间段的时间跨度对应时间步长,所述加权邻接矩阵A为以Ax,y为元素的N×N维矩阵。
CN202210050814.0A 2021-09-14 2022-01-17 一种基于时空数据嵌入的交通流量预测方法 Pending CN114169649A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202111074335 2021-09-14
CN2021110743354 2021-09-14

Publications (1)

Publication Number Publication Date
CN114169649A true CN114169649A (zh) 2022-03-11

Family

ID=80489488

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210050814.0A Pending CN114169649A (zh) 2021-09-14 2022-01-17 一种基于时空数据嵌入的交通流量预测方法

Country Status (1)

Country Link
CN (1) CN114169649A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115225371A (zh) * 2022-07-18 2022-10-21 四川大学 一种基于对比学习的网络靶场背景流量分布式生成方法
CN115512545A (zh) * 2022-09-30 2022-12-23 浙江财经大学 一种基于时空动态图卷积网络的交通速度预测方法
CN115578861A (zh) * 2022-10-14 2023-01-06 东南大学 一种基于嵌入式特征选择策略的高速公路交通流预测方法
CN116153089A (zh) * 2023-04-24 2023-05-23 云南大学 基于时空卷积与动态图的交通流量预测系统及方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115225371A (zh) * 2022-07-18 2022-10-21 四川大学 一种基于对比学习的网络靶场背景流量分布式生成方法
CN115225371B (zh) * 2022-07-18 2023-03-17 四川大学 一种基于对比学习的网络靶场背景流量分布式生成方法
CN115512545A (zh) * 2022-09-30 2022-12-23 浙江财经大学 一种基于时空动态图卷积网络的交通速度预测方法
CN115512545B (zh) * 2022-09-30 2023-06-27 浙江财经大学 一种基于时空动态图卷积网络的交通速度预测方法
CN115578861A (zh) * 2022-10-14 2023-01-06 东南大学 一种基于嵌入式特征选择策略的高速公路交通流预测方法
CN115578861B (zh) * 2022-10-14 2023-10-10 东南大学 一种基于嵌入式特征选择策略的高速公路交通流预测方法
CN116153089A (zh) * 2023-04-24 2023-05-23 云南大学 基于时空卷积与动态图的交通流量预测系统及方法

Similar Documents

Publication Publication Date Title
Hafeez et al. Electric load forecasting based on deep learning and optimized by heuristic algorithm in smart grid
CN114169649A (zh) 一种基于时空数据嵌入的交通流量预测方法
Assem et al. Urban water flow and water level prediction based on deep learning
CN115240425B (zh) 一种基于多尺度时空融合图网络的交通预测方法
Bhardwaj et al. Estimation of solar radiation using a combination of Hidden Markov Model and generalized Fuzzy model
CN109583565A (zh) 基于注意力模型长短时记忆网络的洪水预测方法
Chen et al. Groundwater level prediction using SOM-RBFN multisite model
CN111553543A (zh) 基于TPA-Seq2Seq的电力负荷预测方法及相关组件
Terzi Monthly Rainfall Estimation Using Data‐Mining Process
Massaoudi et al. Performance evaluation of deep recurrent neural networks architectures: Application to PV power forecasting
Chen et al. Physics-guided graph meta learning for predicting water temperature and streamflow in stream networks
Lee et al. An efficient prediction for heavy rain from big weather data using genetic algorithm
Vuyyuru et al. A novel weather prediction model using a hybrid mechanism based on MLP and VAE with fire-fly optimization algorithm
Zhuang et al. Long-lead prediction of extreme precipitation cluster via a spatiotemporal convolutional neural network
Maity et al. Potential of Deep Learning in drought assessment by extracting information from hydrometeorological precursors
CN115935796A (zh) 一种基于时空异质的和同步的图卷积网络交通流预测方法
Souto et al. A spatiotemporal ensemble approach to rainfall forecasting
CN112801063A (zh) 神经网络系统和基于神经网络系统的图像人群计数方法
CN115544239A (zh) 一种基于深度学习模型的布局偏好预测方法
CN116844041A (zh) 一种基于双向卷积时间自注意力机制的耕地提取方法
CN113111716A (zh) 一种基于深度学习的遥感影像半自动标注方法和装置
CN115641720A (zh) 基于时空融合图神经网络的交通预测方法及系统
CN117271899A (zh) 一种基于时空感知的兴趣点推荐方法
Luo et al. Robust precipitation bias correction through an ordinal distribution autoencoder
Xu et al. Time series prediction via recurrent neural networks with the information bottleneck principle

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination