CN112309112B - 一种基于GraphSAGE-GAN的交通路网数据修复方法 - Google Patents

一种基于GraphSAGE-GAN的交通路网数据修复方法 Download PDF

Info

Publication number
CN112309112B
CN112309112B CN202010945175.5A CN202010945175A CN112309112B CN 112309112 B CN112309112 B CN 112309112B CN 202010945175 A CN202010945175 A CN 202010945175A CN 112309112 B CN112309112 B CN 112309112B
Authority
CN
China
Prior art keywords
data
network
road network
detector
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010945175.5A
Other languages
English (en)
Other versions
CN112309112A (zh
Inventor
徐东伟
魏臣臣
丁加丽
周磊
林臻谦
金燕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN202010945175.5A priority Critical patent/CN112309112B/zh
Publication of CN112309112A publication Critical patent/CN112309112A/zh
Application granted granted Critical
Publication of CN112309112B publication Critical patent/CN112309112B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • G08G1/0129Traffic data processing for creating historical data or processing based on historical data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Abstract

一种基于GraphSAGE‑GAN的交通路网数据修复方法,首先根据路网中检测器的历史数据计算路网检测器之间的相关性,得到路网相关性矩阵,然后根据得到的路网相关性矩阵构建基于时间相关性的路网结构。其次,利用GraphSAGE提取构建路网结构的潜在时空特征,最后将提取的时空特征作为生成对抗网络中生成器的输入,使其通过生成对抗网络的对抗训练,生成器能够根据经GraphSAGE提取的时空特征生成完整的的路网交通状态信息,从而实现路网交通状态数据的修复。本发明可以深度挖掘路网交通状态检测器之间的空间特征,有效提高路网交通状态修复的精度。

Description

一种基于GraphSAGE-GAN的交通路网数据修复方法
技术领域
本发明涉及一种基于GraphSAGE-GAN的交通路网数据修复方法,本发明属于智能交通领域。
背景技术
构建智慧交通城市过程中,道路的交通状态数据有着核心的作用,完整的数据能够更好的使得道路管理者获得精确的路网交通状态信息,从而更好地调控路网的运行状态。然而在现实中,道路检测器的自身故障,以及各种不可抗因素(如:地震,洪水造成的道路交通状态检测器断电等)造成道路检测器获取的交通状态信息并不是完整的。因此,针对路网交通状态数据,采用数据修复算法对缺失数据进行插补,保证路网交通状态数据的完整性有着至关重要的意义。
现阶段的道路交通预测方法主要有:历史平均法,K近邻法,降噪自编码器算法,生成对抗网络插补算法等;存在的技术缺陷:无法深度挖掘路网交通状态检测器之间的空间特征,路网交通状态修复的精度较低。
发明内容
为了克服现有技术的不足,本发明提供一种基于GraphSAGE-GAN的交通路网数据修复方法,可以深度挖掘路网交通状态检测器之间的空间特征,有效提高路网交通状态修复的精度。
本发明解决其技术问题所采用的技术方案是:
一种基于GraphSAGE-GAN的交通路网数据修复方法,包括以下步骤:
步骤1根据路网检测器历史交通状态数据,计算路网检测器之间的相关性系数,并根据检测器之间的相关性系数大小关系,构建基于时间相关性的路网结构并替代原始基于空间分布关系的路网结构;
步骤2利用GraphSAGE聚合检测器以及与其相连的邻居检测器的交通状态数据,实现基于时间相关性的路网结构提取路网检测器之间的时空特征信息;
步骤3构建生成对抗网络,并将经GraphSAGE提取的时空特征作为生成器的输入,定义生成对抗网络中生成器与判别器的损失函数,使得经生成器与判别器的对抗训练后,生成器能够根据输入的时空特征信息生成完整的路网交通状态数据;
步骤4将路网交通状态数据划分为训练集与测试集,并根据训练集数据对GraphSAGE-GAN网络模型进行训练,最终采用测试集对网络模型性能进行评估。
进一步,所述步骤1的过程如下:
过程如下:
1.1构建交通路网,并创建路网交通状态矩阵
构建交通路网,采用图的形式表示为:G=(V,E),其中 V={v1,v2,v3,...,vN},|V|=N,
Figure BDA0002675076470000021
且:
Figure BDA0002675076470000022
其中N为路网中检测器的总数目,在路网中表示为节点的总数, E表示为网络中节点之间的联系关系,表示路网中任意两个节点是否存在连边关系,针对每个检测器节点vi(i∈1,2,3,…,N),其历史数据记为:xi=[xi1,xi2,xi3,…,xiT],T为记录历史数据的数目,xit为第i个检测器节点vi在第t时刻的交通状态数据;
创建路网交通状态矩阵:构建路网交通状态矩阵XN×F (F=1,2,3,…,T),其中F为每个节点的特征个数,该特征表示为检测器节点部分的历史数据。同时创建掩膜MN×F矩阵记录路网中数据缺失位置,掩膜矩阵MN×F为(0,1)二值矩阵,其中mij(i=1,2,…,N,j=1,2,…,F) 记录第i个检测器的第j个特征元素的值是否缺失:
Figure BDA0002675076470000031
将原始路网交通状态矩阵X与掩膜矩阵M对应元素相乘,得到含有缺失数据的交通路网状态数据
Figure BDA0002675076470000032
1.2计算检测器节点之间相关性系数
针对每个检测器节点的历史数据,采用皮尔逊相关性系数计算公式,计算不同节点之间的时间相关性,第i个检测器vi与第j个检测器vj之间的皮尔逊相关性系数rij计算公式为:
Figure DEST_PATH_FDA0002675076460000023
其中K为计算皮尔逊相关性系数时选取的每个检测器节点历史交通状态数据长度,通过计算不同检测器之间的皮尔逊相关性系数,得到路网G的N×N的皮尔逊相关性系数矩阵
Figure BDA0002675076470000034
1.3根据路网的相关性系数矩阵,重构路网结构
对于每个检测器节点,令该检测器和与该检测器的皮尔逊相关性系数较大的其余p*N个检测器之间创建连边,重新构建基于时间相关性的路网结构,记重构后的路网记为:G′=(V,A),其中p为选取最相关检测器节点的比例,p∈(0,1).
Figure BDA0002675076470000041
aij表示重构后的路网矩阵中vi检测器节点与vj检测器节点的连边关系:
Figure BDA0002675076470000042
再进一步,所述步骤2的过程如下:
根据构建的基于时间相关性的路网结构,针对每个检测器节点
Figure BDA0002675076470000043
的邻居节点特征,采用均值聚合的方法聚合空间信息,若进行 Z层均值聚合,则聚合计算公式为:
Figure BDA0002675076470000044
Figure DEST_PATH_FDA0002675076460000031
其中
Figure BDA0002675076470000046
表示为对于节点vi经GraphSAGE提取的第z层特征,
Figure BDA0002675076470000047
表示为与节点vi相连的节点集合,即邻居节点集合;sum表示为求邻居节点集合在不同特征属性上的特征和;
Figure BDA0002675076470000048
为邻居节点个数;
Figure BDA0002675076470000049
为节点v的邻居集合
Figure BDA00026750764700000410
的第(z-1)层均值聚合特征;CONCAT表示为特征合并;σ表示为激活函数;Wi z为对第i个检测器进行聚合时模型需要训练的权重参数;
对路网中所有节点进行Z层GraphSAGE均值聚合后,对于每个检测器节点vi得到该节点的聚合特征
Figure BDA00026750764700000411
路网的聚合特征
Figure BDA00026750764700000412
所述步骤3的过程如下:
生成对抗网络由生成器G与判别器D构成,将经GraphSAGE均值聚合的路网特征作为生成对抗网络中生成器的输入,输出为完整交通路网交通状态矩阵;具有LG层全连接层的生成器的模型结构计算公式为:
Figure BDA0002675076470000051
Figure BDA0002675076470000052
其中l=1,2,…,LG
Figure BDA0002675076470000053
为生成器提取的第l层特征;σ为激活函数;Wl G
Figure BDA0002675076470000054
为第l层需要训练的权重及偏差参数;
Figure BDA0002675076470000055
为生成器的输出层,f为激活函数,
Figure BDA0002675076470000056
为生成器的输出层需要训练的权重及偏差参数;
具有LD层全连接层的判别器的模型结构计算公式为:
Figure BDA0002675076470000057
Figure BDA0002675076470000058
其中l=1,2,…,LD,若判别器作用于对生成器生成数据进行判别时,
Figure BDA0002675076470000059
此时判别器的输出记为
Figure BDA00026750764700000510
若判别器作用于对真实数据进行判别时,
Figure BDA00026750764700000511
此时判别器的输出记为
Figure BDA00026750764700000512
为判别器提取的第l层特征;σ为激活函数;Wl D
Figure BDA00026750764700000513
为判别器的第l层需要训练的权重及偏差参数;
Figure BDA00026750764700000514
为判别器的输出层,
Figure BDA00026750764700000515
为判别器的输出层需要训练的权重及偏差参数;
其中,由于原始GAN存在训练困难的问题,因此采用Wasserstein GAN(WGAN)对GAN进行训练,定义生成器与判别器的损失函数LossG,LossD分别为:
Figure DEST_PATH_FDA0002675076460000043
Figure BDA0002675076470000062
其中α为重构误差系数,
Figure BDA0002675076470000063
表示生成器G对于输入
Figure BDA0002675076470000064
时的输出,即为经GraphSAGE-GAN进行数据修复后的数据。
所述步骤4的过程如下:
将路网交通状态历史数据按照比例划分成训练集与测试集,划分比例记为a∈(0,1),则表示训练集样本个数占总数据集样本个数的比例为a。将训练数据作为构建的GraphSAGE-GAN模型的输入,通过模型优化器不断优化模型参数,直至模型收敛,最终得到完成训练后的模型结构;然后采用测试集作为模型的输入,获得模型的预测值,并根据相关指标针对模型预测值与模型真实值之间的误差进行评估;。其中采用相关指标:平均绝对误差MAE,均方根误差RMSE,平均绝对百分比误差MAPE对模型性能进行评价,计算公式分别为:
Figure BDA0002675076470000065
Figure DEST_PATH_FDA0002675076460000048
Figure BDA0002675076470000067
其中S代表测试数据集的样本个数,每个样本的形状均为N×F,Mi表示第i个样本的掩膜矩阵,其中
Figure BDA0002675076470000071
表示测试集中第i个样本中的第j个节点在第k个特征处的数据是否缺失,若为1则表示该处缺失,反之,表示该处不缺失。X为真实完整交通状态数据集,
Figure BDA0002675076470000072
为模型的预测值。
本发明的技术构思为:首先根据路网中检测器的历史数据计算路网检测器之间的相关性,得到路网相关性矩阵,然后根据得到的路网相关性矩阵构建基于时间相关性的路网结构。其次,利用GraphSAGE提取构建路网结构的潜在时空特征,最后将提取的时空特征作为生成对抗网络中生成器的输入,使其通过生成对抗网络的对抗训练,生成器能够根据经GraphSAGE提取的时空特征生成完整的的路网交通状态信息,从而实现路网交通状态数据的修复。
本发明通过计算路网检测器之间的历史交通状态数据计算检测器之间的相关性系数,并构建基于时间相关性的路网结构,采用GraphSAGE对路网检测器的空间上的信息进行聚合,可以充分挖掘路网的时空特征信息,并利用生成对抗网络从GraphSAGE提取的时空特征中生成完整的路网交通状态数据,可以有效提高路网交通状态数据修复的精度。
本发明的有益效果主要表现在:(1)构建新的基于相关性的路网结构代替原始的基于空间分布关系的路网结构,并利用GraphSAGE对检测器的时空特征信息进行聚合,实验表明可以充分挖掘路网的时空特征。(2)采用生成对抗网络根据GraphSAGE提取的时空特征生成完整的路网交通状态数据,通过生成器与判别器的对抗训练,充分利用了生成对抗网络强大的生成数据分布能力,实验表明可以有效提高路网交通状态数据修复的精度。
附图说明
图1是GraphSAGE-GAN网络模型结构图。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1,一种基于GraphSAGE-GAN的交通路网数据修复方法,包括以下步骤:
步骤1.根据路网检测器历史交通状态数据,计算路网检测器之间的相关性系数,并根据检测器之间的相关性系数大小关系,构建基于时间相关性的路网结构并替代原始基于空间分布关系的路网结构,过程如下:
1.1构建交通路网,并创建路网交通状态矩阵
构建交通路网,采用图的形式表示为:G=(V,E),其中 V={v1,v2,v3,…,vN},|V|=N,
Figure BDA0002675076470000081
且:
Figure BDA0002675076470000082
其中N为路网中检测器的总数目,在路网中表示为节点的总数, E表示为网络中节点之间的联系关系,表示路网中任意两个节点是否存在连边关系,针对每个检测器节点vi(i∈1,2,3,…,N),其历史数据记为:xi=[xi1,xi2,xi3,…,xiT],T为记录历史数据的数目,xit为第i个检测器节点vi在第t时刻的交通状态数据;
创建路网交通状态矩阵:构建路网交通状态矩阵XN×F (F=1,2,3,…,T),其中F为每个节点的特征个数,该特征表示为检测器节点部分的历史数据。同时创建掩膜MN×F矩阵记录路网中数据缺失位置,掩膜矩阵MN×F为(0,1)二值矩阵,其中mij(i=1,2,…,N,j=1,2,…,F) 记录第i个检测器的第j个特征元素的值是否缺失:
Figure BDA0002675076470000091
将原始路网交通状态矩阵X与掩膜矩阵M对应元素相乘,得到含有缺失数据的交通路网状态数据
Figure BDA0002675076470000092
1.2计算检测器节点之间相关性系数
针对每个检测器节点的历史数据,采用皮尔逊相关性系数计算公式,计算不同节点之间的时间相关性,第i个检测器vi与第j个检测器vj之间的皮尔逊相关性系数rij计算公式为:
Figure 213314DEST_PATH_FDA0002675076460000023
其中K为计算皮尔逊相关性系数时选取的每个检测器节点历史交通状态数据长度。通过计算不同检测器之间的皮尔逊相关性系数,得到路网G的N×N的皮尔逊相关性系数矩阵
Figure BDA0002675076470000094
1.3根据路网的相关性系数矩阵,重构路网结构
对于每个检测器节点,令该检测器和与该检测器的皮尔逊相关性系数较大的其余p*N(对求得的结果进行取整)个检测器之间创建连边,重新构建基于时间相关性的路网结构,记重构后的路网记为: G′=(V,A),其中p为选取最相关检测器节点的比例,p∈(0,1).
Figure BDA0002675076470000095
aij表示重构后的路网矩阵中vi检测器节点与vj检测器节点的连边关系:
Figure BDA0002675076470000101
步骤2.利用GraphSAGE聚合检测器以及与其相连的邻居检测器的交通状态数据,实现基于时间相关性的路网结构提取路网检测器之间的时空特征信息,过程如下:
根据构建的基于时间相关性的路网结构,针对每个检测器节点
Figure BDA0002675076470000102
的邻居节点特征,采用均值聚合的方法聚合空间信息,若进行 Z层均值聚合,则聚合计算公式为:
Figure BDA0002675076470000103
Figure 130455DEST_PATH_FDA0002675076460000031
其中
Figure BDA0002675076470000105
表示为对于节点vi经GraphSAGE提取的第z层特征,
Figure BDA0002675076470000106
表示为与节点vi相连的节点集合,即邻居节点集合;sum表示为求邻居节点集合在不同特征属性上的特征和;
Figure BDA0002675076470000107
为邻居节点个数;
Figure BDA0002675076470000108
为节点v的邻居集合
Figure BDA0002675076470000109
的第(z-1)层均值聚合特征;CONCAT表示为特征合并;σ表示为激活函数;Wi z为对第i个检测器进行聚合时模型需要训练的权重参数;
对路网中所有节点进行Z层GraphSAGE均值聚合后,对于每个检测器节点vi得到该节点的聚合特征
Figure BDA00026750764700001010
路网的聚合特征
Figure BDA00026750764700001011
步骤3.构建生成对抗网络,并将经GraphSAGE提取的时空特征作为生成器的输入,定义生成对抗网络中生成器与判别器的损失函数,使得经生成器与判别器的对抗训练后,生成器能够根据输入的时空特征信息生成完整的路网交通状态数据,过程如下:
生成对抗网络由生成器G与判别器D构成,将经GraphSAGE均值聚合的路网特征作为生成对抗网络中生成器的输入,输出为完整交通路网交通状态矩阵。具有LG层全连接层的生成器的模型结构计算公式为:
Figure BDA0002675076470000111
Figure BDA0002675076470000112
其中l=1,2,…,LG
Figure BDA0002675076470000113
为生成器提取的第l层特征;σ为激活函数;Wl G
Figure BDA0002675076470000114
为第l层需要训练的权重及偏差参数;
Figure BDA0002675076470000115
为生成器的输出层,f为激活函数,
Figure BDA0002675076470000116
为生成器的输出层需要训练的权重及偏差参数。
具有LD层全连接层的判别器的模型结构计算公式为:
Figure BDA0002675076470000117
Figure BDA0002675076470000118
其中l=1,2,…,LD,若判别器作用于对生成器生成数据进行判别时,
Figure BDA0002675076470000119
此时判别器的输出记为
Figure BDA00026750764700001110
若判别器作用于对真实数据进行判别时,
Figure BDA00026750764700001111
此时判别器的输出记为
Figure BDA00026750764700001112
为判别器提取的第l层特征;σ为激活函数;Wl D
Figure BDA00026750764700001113
为判别器的第l层需要训练的权重及偏差参数;
Figure BDA00026750764700001114
为判别器的输出层,
Figure BDA00026750764700001115
为判别器的输出层需要训练的权重及偏差参数。
其中,由于原始GAN存在训练困难的问题,因此采用Wasserstein GAN(WGAN)对GAN进行训练。定义生成器与判别器的损失函数LossG,LossD分别为:
Figure 910192DEST_PATH_FDA0002675076460000043
Figure BDA0002675076470000122
其中α为重构误差系数,
Figure BDA0002675076470000123
表示生成器G对于输入
Figure BDA0002675076470000124
时的输出,即为经GraphSAGE-GAN进行数据修复后的数据。
步骤4.将路网交通状态数据划分为训练集与测试集,并根据训练集数据对GraphSAGE-GAN网络模型进行训练,最终用测试集对网络模型性能进行评估,过程如下:
将路网交通状态历史数据按照比例划分成训练集与测试集,划分比例记为a∈(0,1),则表示训练集样本个数占总数据集样本个数的比例为a。将训练数据作为构建的GraphSAGE-GAN模型的输入,通过模型优化器不断优化模型参数,直至模型收敛,最终得到完成训练后的模型结构。然后采用测试集作为模型的输入,获得模型的预测值,并根据相关指标针对模型预测值与模型真实值之间的误差进行评估。其中采用相关指标:平均绝对误差(MAE),均方根误差(RMSE),平均绝对百分比误差(MAPE)对模型性能进行评价,计算公式分别为:
Figure BDA0002675076470000125
Figure 305401DEST_PATH_FDA0002675076460000048
Figure BDA0002675076470000131
其中S代表测试数据集的样本个数,每个样本的形状均为N×F,Mi表示第i个样本的掩膜矩阵,其中
Figure BDA0002675076470000132
表示测试集中第i个样本中的第j个节点在第k个特征处的数据是否缺失,若为1则表示该处缺失,反之,表示该处不缺失。X为真实完整交通状态数据集,
Figure BDA0002675076470000133
为模型的预测值。
实例:实际实验中的数据,实施过程如下:
(1)实验数据选取
实验数据集采用西雅图高速路网共计323个检测器在2015年全年的速度数据,数据采样间隔为5分钟。
(2)参数确定
路网检测器节点个数N=323,每个节点的特征个数F=12;构建基于时间相关性的路网结构计算皮尔逊相关性系数时,选取的每个检测器节点历史交通状态数据长度K=288×7=2016,皮尔逊相关性系数较大的检测器节点的选取比例设置为p=0.01;GraphSAGE均值聚合的层数是Z=2,每一层的隐藏单元个数分别为64,128,激活函数σ为ReLU激活函数,σ(x)=max(0,x),激活函数f为sigmoid激活函数, f(x)=(1+e-x)-1;生成对抗网络中生成器与判别器均由2层全连接网络构成,生成器中隐藏单元个数分别为64,128,判别器网络的隐藏单元个数分别为128,64,重构误差系数α=100;训练集与测试集划分比例a=0.8;模型训练优化器为RMSprop优化器。
为了模型真实情况的数据缺失状态,数据缺失类型设置为完全随机缺失,与时间上随机缺失,并将数据缺失比例范围设置为0.1至0.7,间隔为0.1。
随机缺失状态中,针对每个样本,掩膜矩阵M中有着随机分布的
Figure BDA0002675076470000141
个0,代表数据随机缺失的位置,|M|=N×F,
Figure BDA0002675076470000142
为数据随机缺失比例。
时间上缺失状态中,针对每个样本,掩膜矩阵M中有着随机分布的
Figure BDA0002675076470000143
列全为0,表示该时刻数据缺失。
(3)实验结果
根据设置的不同确实模式,不同确实比例下的修复的误差如表1所示:
Figure BDA0002675076470000144
表1。

Claims (4)

1.一种基于GraphSAGE-GAN的交通路网数据修复方法,其特征在于,所述方法包括以下步骤:
步骤1根据路网检测器历史交通状态数据,计算路网检测器之间的相关性系数,并根据检测器之间的相关性系数大小关系,构建基于时间相关性的路网结构并替代原始基于空间分布关系的路网结构;
步骤2利用GraphSAGE聚合检测器以及与其相连的邻居检测器的交通状态数据,实现基于时间相关性的路网结构提取路网检测器之间的时空特征信息;
步骤3构建生成对抗网络,并将经GraphSAGE提取的时空特征作为生成器的输入,定义生成对抗网络中生成器与判别器的损失函数,使得经生成器与判别器的对抗训练后,生成器能够根据输入的时空特征信息生成完整的路网交通状态数据;
步骤4将路网交通状态数据划分为训练集与测试集,并根据训练集数据对GraphSAGE-GAN网络模型进行训练,最终采用测试集对网络模型性能进行评估;
所述步骤1的过程如下:
过程如下:
1.1构建交通路网,并创建路网交通状态矩阵
构建交通路网,采用图的形式表示为:G=(V,E),其中V={v1,v2,v3,...,vN},
Figure FDA0003151394850000011
且:
Figure FDA0003151394850000012
其中N为路网中检测器的总数目,在路网中表示为节点的总数,E表示为网络中节点之间的联系关系,表示路网中任意两个节点是否存在连边关系,针对每个检测器节点vi(i∈1,2,3,…,N),其历史数据记为:xi=[xi1,xi2,xi3,…,xiT],T为记录历史数据的数目,xit为第i个检测器节点vi在第t时刻的交通状态数据;
创建路网交通状态矩阵:构建路网交通状态矩阵XN×F(F=1,2,3,…,T),其中F为每个节点的特征个数,该特征表示为检测器节点部分的历史数据,同时创建掩膜MN×F矩阵记录路网中数据缺失位置,掩膜矩阵MN×F为(0,1)二值矩阵,其中mij(i=1,2,…,N,j=1,2,…,F)记录第i个检测器的第j个特征元素的值是否缺失:
Figure FDA0003151394850000021
将原始路网交通状态矩阵X与掩膜矩阵M对应元素相乘,得到含有缺失数据的交通路网状态数据
Figure FDA0003151394850000022
1.2计算检测器节点之间相关性系数
针对每个检测器节点的历史数据,采用皮尔逊相关性系数计算公式,计算不同节点之间的时间相关性,第i个检测器vi与第j个检测器vj之间的皮尔逊相关性系数rij计算公式为:
Figure FDA0003151394850000023
其中K为计算皮尔逊相关性系数时选取的每个检测器节点历史交通状态数据长度,通过计算不同检测器之间的皮尔逊相关性系数,得到路网G的N×N的皮尔逊相关性系数矩阵
Figure FDA0003151394850000024
1.3根据路网的相关性系数矩阵,重构路网结构
对于每个检测器节点,令该检测器和与该检测器的皮尔逊相关性系数较大的其余p*N个检测器之间创建连边,重新构建基于时间相关性的路网结构,将重构后的路网记为:G′=(V,A),其中p为选取最相关检测器节点的比例,p∈(0,1).
Figure FDA0003151394850000025
aij表示重构后的路网矩阵中vi检测器节点与vj检测器节点的连边关系:
Figure FDA0003151394850000026
2.如权利要求1所述的基于GraphSAGE-GAN的交通路网数据修复方法,其特征在于,所述步骤2的过程如下:
根据构建的基于时间相关性的路网结构,针对每个检测器节点
Figure FDA0003151394850000027
的邻居节点特征,采用均值聚合的方法聚合空间信息,若进行Z层均值聚合,则聚合计算公式为:
Figure FDA0003151394850000028
Figure FDA0003151394850000031
其中
Figure FDA0003151394850000032
表示为对于节点vi经GraphSAGE提取的第z层特征,
Figure FDA0003151394850000033
Figure FDA0003151394850000034
表示为与节点vi相连的节点集合,即邻居节点集合;sum表示为求邻居节点集合在不同特征属性上的特征和;
Figure FDA0003151394850000035
为邻居节点个数;
Figure FDA0003151394850000036
为节点v的邻居集合
Figure FDA0003151394850000037
的第(z-1)层均值聚合特征;CONCAT表示为特征合并;σ表示为激活函数;Wi z为对第i个检测器进行聚合时模型需要训练的权重参数;
对路网中所有节点进行Z层GraphSAGE均值聚合后,对于每个检测器节点vi得到该节点的聚合特征
Figure FDA0003151394850000038
路网的聚合特征
Figure FDA0003151394850000039
3.如权利要求1所述的基于GraphSAGE-GAN的交通路网数据修复方法,其特征在于,所述步骤3的过程如下:
生成对抗网络由生成器G与判别器D构成,将经GraphSAGE均值聚合的路网特征作为生成对抗网络中生成器的输入,输出为完整交通路网交通状态矩阵;具有LG层全连接层的生成器的模型结构计算公式为:
Figure FDA00031513948500000310
Figure FDA00031513948500000311
其中l=1,2,…,LG
Figure FDA00031513948500000312
Figure FDA00031513948500000313
为生成器提取的第l层特征;σ为激活函数;Wl G
Figure FDA00031513948500000314
为第l层需要训练的权重及偏差参数;
Figure FDA00031513948500000315
为生成器的输出层,f为激活函数,
Figure FDA00031513948500000316
为生成器的输出层需要训练的权重及偏差参数;
具有LD层全连接层的判别器的模型结构计算公式为:
Figure FDA00031513948500000317
Figure FDA00031513948500000318
其中l=1,2,…,LD,若判别器作用于对生成器生成数据进行判别时,
Figure FDA00031513948500000319
此时判别器的输出记为
Figure FDA00031513948500000320
若判别器作用于对真实数据进行判别时,
Figure FDA00031513948500000321
此时判别器的输出记为
Figure FDA00031513948500000322
Figure FDA00031513948500000323
为判别器提取的第l层特征;σ为激活函数;Wl D
Figure FDA00031513948500000324
为判别器的第l层需要训练的权重及偏差参数;
Figure FDA0003151394850000041
为判别器的输出层,
Figure FDA0003151394850000042
为判别器的输出层需要训练的权重及偏差参数;
其中,由于原始GAN存在训练困难的问题,因此采用Wasserstein GAN(WGAN)对GAN进行训练,定义生成器与判别器的损失函数LossG,LossD分别为:
Figure FDA0003151394850000043
Figure FDA0003151394850000044
其中α为重构误差系数,
Figure FDA0003151394850000045
表示生成器G对于输入
Figure FDA0003151394850000046
时的输出,即为经GraphSAGE-GAN进行数据修复后的数据。
4.如权利要求1所述的基于GraphSAGE-GAN的交通路网数据修复方法,其特征在于,所述步骤4的过程如下:
将路网交通状态历史数据按照比例划分成训练集与测试集,划分比例记为a∈(0,1),则表示训练集样本个数占总数据集样本个数的比例为a,将训练数据作为构建的GraphSAGE-GAN模型的输入,通过模型优化器不断优化模型参数,直至模型收敛,最终得到完成训练后的模型结构;然后采用测试集作为模型的输入,获得模型的预测值,并根据相关指标针对模型预测值与模型真实值之间的误差进行评估;其中采用相关指标:平均绝对误差MAE,均方根误差RMSE和平均绝对百分比误差MAPE对模型性能进行评价,计算公式分别为:
Figure FDA0003151394850000047
Figure FDA0003151394850000048
Figure FDA0003151394850000051
其中S代表测试数据集的样本个数,每个样本的形状均为N×F,Mi表示第i个样本的掩膜矩阵,其中
Figure FDA0003151394850000052
Figure FDA0003151394850000053
表示测试集中第i个样本中的第j个节点在第k个特征处的数据是否缺失,若为1则表示该处缺失,反之,表示该处不缺失,X为真实完整交通状态数据集,
Figure FDA0003151394850000054
为模型的预测值。
CN202010945175.5A 2020-09-10 2020-09-10 一种基于GraphSAGE-GAN的交通路网数据修复方法 Active CN112309112B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010945175.5A CN112309112B (zh) 2020-09-10 2020-09-10 一种基于GraphSAGE-GAN的交通路网数据修复方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010945175.5A CN112309112B (zh) 2020-09-10 2020-09-10 一种基于GraphSAGE-GAN的交通路网数据修复方法

Publications (2)

Publication Number Publication Date
CN112309112A CN112309112A (zh) 2021-02-02
CN112309112B true CN112309112B (zh) 2021-10-29

Family

ID=74483889

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010945175.5A Active CN112309112B (zh) 2020-09-10 2020-09-10 一种基于GraphSAGE-GAN的交通路网数据修复方法

Country Status (1)

Country Link
CN (1) CN112309112B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113033619A (zh) * 2021-03-04 2021-06-25 浙江工业大学 一种基于dvgae-gan的交通路网数据修复方法
CN113129585B (zh) * 2021-03-05 2022-03-01 浙江工业大学 基于重构交通网络的图聚合机制的道路交通流预测方法
CN114399901B (zh) * 2022-01-04 2022-12-13 青岛海信网络科技股份有限公司 一种控制交通系统的方法和设备
CN114944057B (zh) * 2022-04-21 2023-07-25 中山大学 一种路网交通流量数据的修复方法与系统
CN116170237B (zh) * 2023-04-25 2023-07-25 南京众智维信息科技有限公司 一种融合gnn和acgan的入侵检测方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11218498B2 (en) * 2018-09-05 2022-01-04 Oracle International Corporation Context-aware feature embedding and anomaly detection of sequential log data using deep recurrent neural networks
CN110018927A (zh) * 2019-01-28 2019-07-16 北京工业大学 基于生成对抗网络的交通数据修复方法
CN110555018B (zh) * 2019-07-29 2021-12-17 浙江工业大学 一种交通流量补全与预测方法
CN110738326B (zh) * 2019-09-24 2020-12-04 深圳创新奇智科技有限公司 一种人工智能服务系统模型的选择方法和装置
CN110942624B (zh) * 2019-11-06 2020-12-01 浙江工业大学 一种基于sae-gan-sad的路网交通数据修复方法
CN111179591B (zh) * 2019-12-30 2021-02-26 银江股份有限公司 一种路网交通时序特征数据质量诊断与修复方法
CN111540193B (zh) * 2020-03-13 2022-07-26 华南理工大学 一种基于图卷积时序生成对抗网络的交通数据修复方法

Also Published As

Publication number Publication date
CN112309112A (zh) 2021-02-02

Similar Documents

Publication Publication Date Title
CN112309112B (zh) 一种基于GraphSAGE-GAN的交通路网数据修复方法
CN109285346B (zh) 一种基于关键路段的城市路网交通状态预测方法
Rajurkar et al. Artificial neural networks for daily rainfall—runoff modelling
CN112350876A (zh) 一种基于图神经网络的网络流量预测方法
CN110942624B (zh) 一种基于sae-gan-sad的路网交通数据修复方法
CN113032238B (zh) 基于应用知识图谱的实时根因分析方法
CN110580727B (zh) 信息流与梯度流增加的深度v型密集网络成像方法
CN110018927A (zh) 基于生成对抗网络的交通数据修复方法
CN111785014A (zh) 一种基于dtw-rgcn的路网交通数据修复的方法
CN106452825A (zh) 一种基于改进决策树的配用电通信网告警关联分析方法
CN110490219B (zh) 一种基于纹理约束的U-net网络进行地震数据重建的方法
CN107240136A (zh) 一种基于深度学习模型的静态图像压缩方法
CN103905246A (zh) 基于分组遗传算法的链路预测方法
CN116505665A (zh) 一种电网配电线路的故障监测方法及系统
CN114154405A (zh) 一种基于条件式Wasserstein生成对抗网络的电机故障数据增强方法
CN112862065A (zh) 一种基于多任务图神经网络的电网支路参数辨识方法
CN115862324A (zh) 一种智慧交通的时空同步图卷积神经网络及交通预测方法
CN112365139A (zh) 一种图卷积神经网络下的人群危险程度分析方法
Zhou et al. Can an influence graph driven by outage data determine transmission line upgrades that mitigate cascading blackouts?
CN113033619A (zh) 一种基于dvgae-gan的交通路网数据修复方法
CN110457295A (zh) 基于社会关系感知的时序数据补全系统
CN117093830A (zh) 一种考虑局部与全局的用户负荷数据修复方法
CN115953902A (zh) 一种基于多视图时空图卷积网络的交通流预测方法
CN112488805B (zh) 基于多元回归时间序列分析的长租市场预警方法
CN115423041A (zh) 一种基于深度学习的边缘云故障预测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant