CN108805418B - 一种基于生成式对抗网络的交通数据填充方法 - Google Patents

一种基于生成式对抗网络的交通数据填充方法 Download PDF

Info

Publication number
CN108805418B
CN108805418B CN201810496222.5A CN201810496222A CN108805418B CN 108805418 B CN108805418 B CN 108805418B CN 201810496222 A CN201810496222 A CN 201810496222A CN 108805418 B CN108805418 B CN 108805418B
Authority
CN
China
Prior art keywords
data
network
output
generated
generation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810496222.5A
Other languages
English (en)
Other versions
CN108805418A (zh
Inventor
郑海峰
李智敏
林凯彤
冯心欣
陈忠辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuzhou University
Original Assignee
Fuzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuzhou University filed Critical Fuzhou University
Priority to CN201810496222.5A priority Critical patent/CN108805418B/zh
Publication of CN108805418A publication Critical patent/CN108805418A/zh
Application granted granted Critical
Publication of CN108805418B publication Critical patent/CN108805418B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明涉及一种基于生成式对抗网络的交通数据填充方法,将3D卷积神经网络与生成式对抗网络相结合,构造一种3DConvGAN模型,首先利用历史数据训练3DConvGAN模型,并采用3D卷积神经网络对临近时刻的数据进行时空特征提取;其次设置衡量已知点的真实数据和生成数据之间的差异,通过最小化损失函数来获取生成网络的最优输入;最后,使用最优输入通过生成网络获取最优的生成数据,以实现交通数据的恢复。本发明克服了现有技术不能充分利用交通数据的历史信息与时空特征的不足,充分利用历史的交通数据并有效地提取交通数据的时空特性,从而提升了交通数据的恢复精确度。

Description

一种基于生成式对抗网络的交通数据填充方法
技术领域
本发明涉及智能交通领域和深度学习领域,特别是一种基于生成式对抗网络的交通数据填充方法。
背景技术
在智能交通系统中,交通数据采集是一个重要的部分。主要的交通数据采集方式包括:感应线圈检测器、红外线检测器等定点检测器采集,或是利用全球定位系统(GPS)、手机通信等设备动态监测。然而,由于设备损坏、数据传输异常等问题,均会导致采集到的交通数据存在数据缺失的情况。带缺失的交通数据不仅降低了数据的研究价值,而且影响后续的研究工作。如何对缺失的交通数据进行有效地恢复,保证数据的完整性对智能交通系统的工作起着至关重要的作用。
到目前为止,交通数据恢复的主要方法有历史插值法、样条/回归插值法、自回归积分移动平均模型、基于矩阵填充方法和基于张量填充方法等。交通数据具有时间相关性和空间相关性。空间相关性是指某个时刻不同位置的交通数据会相互影响,距离越靠近,其影响程度越大。时间相关性可分为周期性和趋势性,周期性是指不同天同一时刻的交通数据相似,趋势性是指临近时刻的交通数据呈现趋势性变化。在之前的交通数据恢复模型中存在很多缺点,如恢复算法过于简单,无法处理复杂的缺失情况;数据的时刻特征提取不充分或算法无法充分利用历史数据导致恢复精度低。
发明内容
有鉴于此,本发明的目的是提出一种基于生成式对抗网络的交通数据填充方法,可以克服现有技术不能充分利用交通数据的时空特征和数据的历史信息的缺点,利用生成模型可恢复多种缺失数据,并提高恢复的精确度。
本发明采用以下方案实现:一种基于生成式对抗网络的交通数据填充方法,具体包括以下步骤:
步骤S1:构建生成式对抗网络,所述生成式对抗网络包括生成网络与鉴别网络;
步骤S2:将噪声输入通过生成网络获取张量形式的输出数据,其中所述生成网络的输出为生成数据;
步骤S3:使用鉴别网络区分真实数据与生成数据的差异;
步骤S4:使用历史数据训练所述生成式对抗网络;
步骤S5:使用已知点的实际数据和生成网络的输出进行比较,反向更新生成网络的输入,得到最优输入;
步骤S6:采用步骤S5得到的最优输入计算未知点的数据,得到完整的数据。
进一步地,步骤S1中,
所述生成网络的第一层是6144大小的全连接层,后续四层是三维的微步卷积层,其中卷积核大小为2×4×4;
所述鉴别网络的前四层是用于提取数据的时空特征的三维卷积层,随后是全连接层,其中,所述卷积层的卷积核大小为2×4×4。
进一步地,所述步骤S2包括以下步骤:
步骤S21:将100维的噪声作为所述生成网络的输入,所述100维的噪声通过第一层全连接层之后得到一个6144×1的输出,将6144×1的输出重塑成3×2×2×512大小的张量;
步骤S22:将3×2×2×512大小的张量通过每一层三维微步卷积层时,时间维的大小不变,空间维的大小翻倍,通道数减半,最后所述生成网络输出一个3×32×32×1的生成数据。
进一步地,步骤S3为:将数据通过鉴别网络得到一个用于衡量数据的真实度的输出;若输入的是真实数据,则鉴别网络的输出接近1,若输入的是生成数据,则鉴别网络的输出接近0。
进一步地,步骤S4包括以下步骤:
步骤S41:将历史数据输入到鉴别网络中,得到一个二进制值的输出,其中0代表假数据,1代表真数据;在这个过程中鉴别网络不断更新参数以得到最接近1的输出;
步骤S42:生成网络通过更新参数学习历史数据的概率分布,使得输出的生成数据接近真数据;同时,鉴别网络再次更新参数以获得一个最接近0的输出;
其中,所述生成网络与鉴别网络中参数的更新过程为一个二元极小极大博弈的过程,即目标函数最大化和最小化交替的过程,其目标函数公式如下:
Figure BDA0001669003640000031
式中,p(x)表示真实数据的分布,D(x)表示真实数据通过鉴别网络的输出,z表示生成网络的输入,G(z)表示生成网络的输出数据,D(G(z))表示生成数据通过鉴别网络的输出;
Figure BDA0001669003640000032
表示鉴别网络D对来自真实分布数据的评分的期望,
Figure BDA0001669003640000033
表示鉴别网络D对来自生成数据的评分的期望。
进一步地,所述步骤S5包括以下步骤:
步骤S51:设置损失函数,用以衡量已知点的真实数据和生成数据之间的差异,所述损失函数的公式如下:
Lc(z)=||M⊙G(z)-M⊙y||1
式中,⊙表示元素相乘,M是一个只含有0、1元素的张量并用以代表已知点的位置,y表示的是真实数据;
步骤S52:最小化损失函数获取最佳的生成网络输入
Figure BDA0001669003640000035
即最优输入,其公式如下:
Figure BDA0001669003640000034
进一步地,步骤S6包括以下步骤:
步骤S61:使用最优输入通过生成网络得到最优的生成数据
Figure BDA0001669003640000042
步骤S62:将已知点的数据用真实数据填充,未知点的数据使用步骤S61得到的最优的生成数据填充,采用下式得到完整的数据Xreconstant
Figure BDA0001669003640000041
与现有技术相比,本发明有以下有益效果:本发明提出的一种基于生成式对抗网络的交通数据填充方法,充分利用历史数据并结合交通数据的时空特征,可提高数据的恢复精度。同时本发明结合生成模型,可恢复多种的缺失数据,提高了模型的适用性。
附图说明
图1为本发明实施例的生成式对抗网络的示意图。
图2为本发明实施例的整体步骤的示意图。
图3为在MCAR缺失情况下,本发明实施例的恢复误差与其他算法的结果对比示意图。
图4为在MAR缺失情况下,本发明实施例的恢复误差与其他算法的结果对比示意图。
图5为在MNAR缺失情况下,本发明实施例的恢复误差与其他算法的结果对比示意图。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
如图1以及图2所示,本实施例提供了一种基于生成式对抗网络的交通数据填充方法,具体包括以下步骤:
步骤S1:构建生成式对抗网络,所述生成式对抗网络包括生成网络与鉴别网络;
步骤S2:将噪声输入通过生成网络获取张量形式的输出数据,其中所述生成网络的输出为生成数据;
步骤S3:使用鉴别网络区分真实数据与生成数据的差异;
步骤S4:使用历史数据训练所述生成式对抗网络;
步骤S5:使用已知点的实际数据和生成网络的输出进行比较,反向更新生成网络的输入,得到最优输入;
步骤S6:采用步骤S5得到的最优输入计算未知点的数据,得到完整的数据。
在本实施例中,步骤S1中,
所述生成网络的第一层是6144大小的全连接层,后续四层是三维的微步卷积层,其中卷积核大小为2×4×4(时间×宽×高);
所述鉴别网络的前四层是用于提取数据的时空特征的三维卷积层,随后是全连接层,其中,所述卷积层的卷积核大小为2×4×4(时间×宽×高)。
在本实施例中,所述步骤S2包括以下步骤:
步骤S21:将100维的噪声作为所述生成网络的输入,所述100维的噪声通过第一层全连接层之后得到一个6144×1的输出,将6144×1的输出重塑成3×2×2×512大小的张量;
步骤S22:将3×2×2×512大小的张量通过每一层三维微步卷积层时,时间维的大小不变,空间维的大小翻倍,通道数减半,最后所述生成网络输出一个3×32×32×1的生成数据。
在本实施例中,步骤S3为:将数据通过鉴别网络得到一个用于衡量数据的真实度的输出;若输入的是真实数据,则鉴别网络的输出接近1,若输入的是生成数据,则鉴别网络的输出接近0。
在本实施例中,步骤S4包括以下步骤:
步骤S41:将历史数据输入到鉴别网络中,得到一个二进制值的输出,其中0代表假数据,1代表真数据;在这个过程中鉴别网络不断更新参数以得到最接近1的输出;
步骤S42:生成网络通过更新参数学习历史数据的概率分布,使得输出的生成数据接近真数据;同时,鉴别网络再次更新参数以获得一个最接近0的输出;
其中,所述生成网络与鉴别网络中参数的更新过程为一个二元极小极大博弈的过程,即目标函数最大化和最小化交替的过程,其目标函数公式如下:
Figure BDA0001669003640000061
式中,p(x)表示真实数据的分布,D(x)表示真实数据通过鉴别网络的输出,z表示生成网络的输入,G(z)表示生成网络的输出数据,D(G(z))表示生成数据通过鉴别网络的输出;
Figure BDA0001669003640000062
表示鉴别网络D对来自真实分布数据的评分的期望,
Figure BDA0001669003640000063
表示鉴别网络D对来自生成数据的评分的期望。
在本实施例中,所述步骤S5包括以下步骤:
步骤S51:设置损失函数,用以衡量已知点的真实数据和生成数据之间的差异,所述损失函数的公式如下:
Lc(z)=||M⊙G(z)-M⊙y||1
式中,⊙表示元素相乘,M是一个只含有0、1元素的张量并用以代表已知点的位置,y表示的是真实数据;
步骤S52:最小化损失函数获取最佳的生成网络输入
Figure BDA0001669003640000073
即最优输入,其公式如下:
Figure BDA0001669003640000071
在本实施例中,步骤S6包括以下步骤:
步骤S61:使用最优输入通过生成网络得到最优的生成数据
Figure BDA0001669003640000074
步骤S62:将已知点的数据用真实数据填充,未知点的数据使用步骤S61得到的最优的生成数据填充,采用下式得到完整的数据Xreconstant
Figure BDA0001669003640000075
特别的,本实施例与其他算法的实验对比过程及结果如下:
步骤一:模拟存在的三种交通数据缺失情况:完全随机缺失(Missing Completelyat Random,MCAR)、随机缺失(Missing at Random,MAR)、不随机缺失(Missing Not atRandom)。
步骤二:设置模型的恢复性能评价指标是相对平方误差(Relative SquareError,RSE)其公式如下:
Figure BDA0001669003640000072
步骤三:为说明本发明实施例所提出方法的可行性和普适性,将框架恢复精度进一步与现有方法如KNN、TenALS、Bayesian CP factorization、Tmac的恢复精度进行比较,分别如图3、图4以及图5所示,其中,本实施例的生成式对抗网络模型为3DConvGAN模型。
上述分析说明,本实施例所提出的一种基于生成式对抗网络的交通数据填充方法,在三种缺失情况下,均能获得比现有方法更高的恢复精度,具有一定的参考价值和实际经济效益。
以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。

Claims (1)

1.一种基于生成式对抗网络的交通数据填充方法,其特征在于:包括以下步骤:
步骤S1:构建生成式对抗网络,所述生成式对抗网络包括生成网络与鉴别网络;
步骤S2:将噪声输入通过生成网络获取张量形式的输出数据,其中所述生成网络的输出为生成数据;
步骤S3:使用鉴别网络区分真实数据与生成数据的差异;
步骤S4:使用历史数据训练所述生成式对抗网络;
步骤S5:使用已知点的实际数据和生成网络的输出进行比较,反向更新生成网络的输入,得到最优输入;
步骤S6:采用步骤S5得到的最优输入计算未知点的数据,得到完整的数据;
步骤S1中,
所述生成网络的第一层是6144大小的全连接层,后续四层是三维的微步卷积层,其中卷积核大小为2×4×4;
所述鉴别网络的前四层是用于提取数据的时空特征的三维卷积层,随后是全连接层,其中,卷积核大小为2×4×4;
所述步骤S2包括以下步骤:
步骤S21:将100维的噪声作为所述生成网络的输入,所述100维的噪声通过第一层全连接层之后得到一个6144×1的输出,将6144×1的输出重塑成3×2×2×512大小的张量;
步骤S22:将3×2×2×512大小的张量通过每一层三维微步卷积层时,时间维的大小不变,空间维的大小翻倍,通道数减半,最后所述生成网络输出一个3×32×32×1的生成数据;
步骤S3为:将数据通过鉴别网络得到一个用于衡量数据的真实度的输出;若输入的是真实数据,则鉴别网络的输出接近1,若输入的是生成数据,则鉴别网络的输出接近0;
步骤S4包括以下步骤:
步骤S41:将历史数据输入到鉴别网络中,得到一个二进制值的输出,其中0代表假数据,1代表真数据;在这个过程中鉴别网络不断更新参数以得到最接近1的输出;
步骤S42:生成网络通过更新参数学习历史数据的概率分布,使得输出的生成数据接近真数据;同时,鉴别网络再次更新参数以获得一个最接近0的输出;
其中,所述生成网络与鉴别网络中参数的更新过程为一个二元极小极大博弈的过程,即目标函数最大化和最小化交替的过程,其目标函数公式如下:
Figure FDA0003123420590000021
式中,p(x)表示真实数据的分布,D(x)表示真实数据通过鉴别网络的输出,z表示生成网络的输入,G(z)表示生成网络的输出数据,D(G(z))表示生成数据通过鉴别网络的输出;
Figure FDA0003123420590000022
表示鉴别网络D对来自真实分布数据的评分的期望,
Figure FDA0003123420590000023
表示鉴别网络D对来自生成数据的评分的期望;
所述步骤S5包括以下步骤:
步骤S51:设置损失函数,用以衡量已知点的真实数据和生成数据之间的差异,所述损失函数的公式如下:
Lc(z)=||M⊙G(z)-M⊙y||1
式中,⊙表示元素相乘,M是一个只含有0、1元素的张量并用以代表已知点的位置,y表示的是真实数据;
步骤S52:最小化损失函数获取最佳的生成网络输入
Figure FDA0003123420590000024
即最优输入,其公式如下:
Figure FDA0003123420590000025
步骤S6包括以下步骤:
步骤S61:使用最优输入通过生成网络得到最优的生成数据
Figure FDA0003123420590000026
步骤S62:将已知点的数据用真实数据填充,未知点的数据使用步骤S61得到的最优的生成数据填充,采用下式得到完整的数据Xreconstant
Figure FDA0003123420590000027
CN201810496222.5A 2018-05-22 2018-05-22 一种基于生成式对抗网络的交通数据填充方法 Active CN108805418B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810496222.5A CN108805418B (zh) 2018-05-22 2018-05-22 一种基于生成式对抗网络的交通数据填充方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810496222.5A CN108805418B (zh) 2018-05-22 2018-05-22 一种基于生成式对抗网络的交通数据填充方法

Publications (2)

Publication Number Publication Date
CN108805418A CN108805418A (zh) 2018-11-13
CN108805418B true CN108805418B (zh) 2021-08-31

Family

ID=64092803

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810496222.5A Active CN108805418B (zh) 2018-05-22 2018-05-22 一种基于生成式对抗网络的交通数据填充方法

Country Status (1)

Country Link
CN (1) CN108805418B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109493599A (zh) * 2018-11-16 2019-03-19 南京航空航天大学 一种基于生成式对抗网络的短时交通流预测方法
CN109639479B (zh) * 2018-12-07 2020-10-20 北京邮电大学 基于生成对抗网络的网络流量数据增强方法及装置
CN110782397B (zh) * 2018-12-13 2020-08-28 北京嘀嘀无限科技发展有限公司 一种图像处理方法、生成式对抗网络、电子设备及存储介质
CN109657149A (zh) * 2018-12-25 2019-04-19 合肥学院 一种基于生成对抗网络和双聚类的推荐方法及系统
CN110018927A (zh) * 2019-01-28 2019-07-16 北京工业大学 基于生成对抗网络的交通数据修复方法
CN110164128B (zh) * 2019-04-23 2020-10-27 银江股份有限公司 一种城市级智能交通仿真系统
CN110955651A (zh) * 2019-11-28 2020-04-03 武汉科技大学 基于深度卷积生成式对抗网络的电机故障数据的增强方法
CN111540193B (zh) * 2020-03-13 2022-07-26 华南理工大学 一种基于图卷积时序生成对抗网络的交通数据修复方法
CN112259247B (zh) * 2020-10-22 2022-08-23 平安科技(深圳)有限公司 对抗网络训练、医疗数据补充方法、装置、设备及介质
CN113505876A (zh) * 2021-06-11 2021-10-15 国网浙江省电力有限公司嘉兴供电公司 一种基于生成式对抗网络的高压断路器故障诊断方法
CN115019510B (zh) * 2022-06-29 2024-01-30 华南理工大学 一种基于动态自适应生成对抗网络的交通数据修复方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107220600B (zh) * 2017-05-17 2019-09-10 清华大学深圳研究生院 一种基于深度学习的图片生成方法及生成对抗网络
CN107133934B (zh) * 2017-05-18 2020-03-17 北京小米移动软件有限公司 图像补全方法及装置
CN107945118B (zh) * 2017-10-30 2021-09-28 南京邮电大学 一种基于生成式对抗网络的人脸图像修复方法

Also Published As

Publication number Publication date
CN108805418A (zh) 2018-11-13

Similar Documents

Publication Publication Date Title
CN108805418B (zh) 一种基于生成式对抗网络的交通数据填充方法
CN109800648B (zh) 基于人脸关键点校正的人脸检测识别方法及装置
CN108447080B (zh) 基于分层数据关联和卷积神经网络的目标跟踪方法、系统和存储介质
CN111274916B (zh) 人脸识别方法和人脸识别装置
CN108416258B (zh) 一种基于人体部位模型的多人体跟踪方法
CN106780631B (zh) 一种基于深度学习的机器人闭环检测方法
CN107424161B (zh) 一种由粗至精的室内场景图像布局估计方法
Liu et al. Indexing visual features: Real-time loop closure detection using a tree structure
CN112084895B (zh) 一种基于深度学习的行人重识别方法
CN111401303B (zh) 一种身份与视角特征分离的跨视角步态识别方法
CN109492589A (zh) 通过二进制特征与联合层叠结构融合的人脸识别工作方法以及智能芯片
CN110751076B (zh) 车辆检测方法
Tsintotas et al. DOSeqSLAM: Dynamic on-line sequence based loop closure detection algorithm for SLAM
CN108108716A (zh) 一种基于深度信念网络的回环检测方法
CN113269070A (zh) 融合全局和局部特征的行人重识别方法、存储器及处理器
CN110349176B (zh) 基于三重卷积网络和感知干扰学习的目标跟踪方法和系统
CN116222577A (zh) 闭环检测方法、训练方法、系统、电子设备及存储介质
CN111242028A (zh) 基于U-Net的遥感图像地物分割方法
CN116946610B (zh) 一种智能仓储系统货物拾取方法及装置
CN108898527B (zh) 一种基于有损测量的生成模型的交通数据填充方法
CN112528554A (zh) 一种适于多发多源火箭试验数据的数据融合方法及系统
CN117079272A (zh) 一种结合手工特征和学习特征的弹底窝痕特征识别方法
CN116030511A (zh) 一种基于ToF的三维人脸识别方法
CN116167008A (zh) 基于数据增强的物联感知云数据中心异常定位方法
CN115496935A (zh) 一种基于可形变卷积的高光谱图像分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant