CN116128082A - 高速公路交通流量预测方法及电子设备 - Google Patents
高速公路交通流量预测方法及电子设备 Download PDFInfo
- Publication number
- CN116128082A CN116128082A CN202111326656.9A CN202111326656A CN116128082A CN 116128082 A CN116128082 A CN 116128082A CN 202111326656 A CN202111326656 A CN 202111326656A CN 116128082 A CN116128082 A CN 116128082A
- Authority
- CN
- China
- Prior art keywords
- variable
- sequence data
- data
- hidden
- flow
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000012544 monitoring process Methods 0.000 claims abstract description 9
- 238000009826 distribution Methods 0.000 claims description 79
- 230000006870 function Effects 0.000 claims description 23
- 238000013528 artificial neural network Methods 0.000 claims description 18
- 238000005070 sampling Methods 0.000 claims description 15
- 238000013507 mapping Methods 0.000 claims description 13
- 125000004122 cyclic group Chemical group 0.000 claims description 7
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 6
- 230000003044 adaptive effect Effects 0.000 claims description 5
- 238000012937 correction Methods 0.000 claims description 4
- 230000009466 transformation Effects 0.000 claims description 4
- 230000005856 abnormality Effects 0.000 abstract description 4
- 230000007774 longterm Effects 0.000 abstract description 3
- 238000003860 storage Methods 0.000 description 30
- 238000012549 training Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 11
- 238000004590 computer program Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 6
- 238000005457 optimization Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 description 2
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000011478 gradient descent method Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 241000288105 Grus Species 0.000 description 1
- 206010039203 Road traffic accident Diseases 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000002547 anomalous effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- General Health & Medical Sciences (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Educational Administration (AREA)
- Biophysics (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Primary Health Care (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开一种高速公路交通流量预测方法,接收高速公路监测设备发送的采集到的高速公路过车数据,形成固定间隔时间的高速公路流量序列数据;通过变分门控递归单元自编码网络将所述流量序列数据及多维度之间关联性映射到隐空间,用于提取所述流量序列数据的长短期时间序列特征,将当前实时采集的数据输入到所述变分门控递归单元自编码网络,获得未来时刻的流量预测信息,可对设备异常、人为操作等因素引起的噪声具有一定的鲁棒性,进而表现出更加可靠、准确的流量预测性能。
Description
背景技术
随着高速公路的道路数目增大,出行民众的交通需求也在增加,随之带来的是高速公路的交通供需矛盾日益加剧,同时伴随着高速公路交通拥堵、不断出现的高速公路交通事故等问题已经成为高速公路稳定发展过程中的障碍。如何在高速公路上通过检测设备获取历史交通流量数据,并通过一系列的统计分析来预测未来时刻的交通流量变化状况,对高速公路安全管控有着极为重要的意义。
对高速公路路段流量进行可靠、准确的预测是对智慧型高速公路进行智能化管理的基础。在交通流量预测方面,大致分为两类方法,一类是基于统计数学模型,比如卡尔曼滤波、时间序列预测方法,一般适用于线性且平稳的时间序列数据;另外一类是人工智能模型,包括人工神经网络、支持向量机回归等,可有效挖掘非线性时间序列数据。
在对高速公路交通流量预测过程中,首先需要获取高速交通流量数据。目前,道路交通流量数据的采集主要依靠综合检测器、摄像头、线圈、地磁等。倘若要提高交通预测模型的准确度则需要大量的数据进行统计分析,那么持续准确的流量信息采集非常必要。但是,真实环境中可能因为设备故障、人为操作不当会导致数据丢失现象的发生,这会直接导致数据驱动的预测模型产生错误挖掘和预测。另外,凭借平移、尺度不变性特征,卷积神经网络也被用于挖掘交通流的时间和空间依赖,通过时序双重维度特征建模,改善了大尺度交通流量预测模型性能。然而,这类判别式深度学习模型依赖于大量数据以供神经网络训练,而且对于存在缺失及异常数据的流量预测建模来说,这类判别式深度学习模型无法提供鲁棒性预测性能。
发明内容
本公开示例性的实施方式中提供一种高速公路交通流量预测方法及电子设备,用于使得重构交通流量与真实交通流量更加相似,从而表现出更高的鲁棒的流量预测能力。
本公开的第一方面提供一种交通流量预测方法,所述方法包括:
接收高速公路监测设备发送的采集到的高速公路过车数据,形成固定间隔时间的高速公路流量序列数据;
将所述高速公路流量序列数据进行Z-score标准化,得到归一化的流量序列数据;
通过变分门控递归单元自编码网络将所述流量序列数据及多维度之间关联性映射到隐空间,用于提取所述流量序列数据的长短期时间序列特征,其中变分门控递归单元自编码网络通过变分推理来建模所述高速公路流量序列数据的概率分布,所述隐空间的变量的概率分布为连续的;
将当前实时采集的数据输入到所述变分门控递归单元自编码网络,获得未来时刻的流量预测信息。
在一个实施例中,变分门控递归单元自编码网络包括输入层,所述输入层用于接受所述归一化的流量序列数据x={x1,x2,…,xT},定义隐变量z和真实变量的联合分布为pθ(z;x),隐向量z从先验分布pθ(z)中采样得到,重构数据点x从以z为条件的分布pθ(x|z)中产生,其中pθ(x|z)表示已知隐变量z条件下所述归一化的流量序列数据x的分布。
在一个实施例中,变分门控递归单元自编码网络包括编码层,所述编码层用于对输入的流量序列数据x进行编码,获得所述隐变量z的特征分布,其中,向GRU循环神经网络输入流量序列数据x,GRU循环神经网络输出为编码向量henc,并通过线性变换得到隐变量z的高斯分布参数,包括均值μ和方差σ2,得到隐变量z的近似后验分布qφ(z|x)。
z=μ+σ×ε
在一个实施例中,变分门控递归单元自编码网络包括输出层,所述输出层通过一个全连接层将所述隐变量特征映射到目标输出,隐变量特征z映射到最后预测结果y,其中隐藏层单元数量为n1,具体映射为,
y=W3*z+b3
在一个实施例中,变分门控递归单元自编码网络的损失函数由第一损失函数和第二损失函数构成,其中,所述第一损失函数为负对数似然函数,用于衡量输入数据的重构误差,所述第二损失函数为真实分布和近似后验分布之间的KL散度(Kullback–Leiblerdivergence),用于衡量两个分布之间的相似度。
在一个实施例中,变分门控递归单元自编码网络采用自适应矩估计(AdaptiveMoment Estimation,Adam),Adam有动量项的RMSprop,利用梯度的一阶矩估计和二阶矩估计动态调整每个参数的学习率,经过偏置校正后,每一次迭代学习率都有确定范围。
本发明结合实际高速道路中的短期采集数据,用变分自编码器可将原始监测流量数据及多维度之间关联性映射到隐空间中,实现更深层次的时序特征提取;同时,变分自编码器可通过变分推理来建模高速公路流量数据的概率分布,而隐空间学习到的变量的概率分布为连续的,从而可对设备异常、人为操作等因素引起的噪声具有一定的鲁棒性,基于可靠的流量数据通过全连接神经网络来执行监督式预测模型学习,从而实现准确、鲁棒的高速公路流量预测模型。
附图说明
为了更清楚地说明本公开实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为根据本公开一个实施例中的交通流量预测方法的流程示意图;
图2为根据本公开一个实施例的交通流量预测方法的模型示意图;
图3为根据本公开一个实施例的门控递归单元的结构图;
图4为根据本公开一个实施例的电子设备的结构示意图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
本公开实施例中术语“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
本公开实施例描述的应用场景是为了更加清楚的说明本公开实施例的技术方案,并不构成对于本公开实施例提供的技术方案的限定,本领域普通技术人员可知,随着新应用场景的出现,本公开实施例提供的技术方案对于类似的技术问题,同样适用,其中,在本公开的描述中,除非另有说明,“多个”的含义是两个或两个以上。
本公开根据实际高速道路中的短期采集数据,通过结合变分自编码器和门控递归单元(Gated Recurrent Unit,GRU)循环神经网络来学习并构建符合真实高速公路交通流数据分布的潜在生成分布,在变分自编码器的编码和解码过程中考虑到交通流量数据具有时间序列变化特征,利用GRU循环神经网络来对未来交通流量进行序列表征和预测,一方面通过结合GRU循环神经网络,可有效提取数据的长短期时间序列特征;另一方面结合变分自编码器可将原始监测流量数据及多维度之间关联性映射到隐空间中,实现更深层次的时序特征提取;同时,变分自编码器可通过变分推理来建模高速公路流量数据的概率分布,而隐空间学习到的变量的概率分布为连续的,从而可对设备异常、人为操作等因素引起的噪声具有一定的鲁棒性。
本公开提供了一种高速公路交通流量预测方法,包括:
接收高速公路监测设备发送的采集到的高速公路过车数据,形成固定间隔时间的高速公路流量序列数据;
将所述高速公路流量序列数据进行Z-score标准化,得到归一化的流量序列数据;
通过变分门控递归单元自编码网络将所述流量序列数据及多维度之间关联性映射到隐空间,用于提取所述流量序列数据的长短期时间序列特征,其中变分门控递归单元自编码网络通过变分推理来建模所述高速公路流量序列数据的概率分布,所述隐空间的变量的概率分布为连续的;
将当前实时采集的数据输入到所述变分门控递归单元自编码网络,获得未来时刻的流量预测信息。
本实施例基于可靠的流量数据通过全连接神经网络来执行监督式预测模型学习,从而实现准确、鲁棒的高速公路流量预测模型。
另一个实施例,如图1所示,执行流量数据获取模块S1,通过高速公路监测设备比如:卡口、电警等,获取过车数据,并根据标准格式存储到时序数据库中,以供后续加工和统计分析。
执行流量数据预处理模块S2,首先预处理过车数据记录,并将其整合为固定间隔时间内的车流量,从而形成高速公路流量序列数据。将监测设备记录的过车数据转换为指定时间间隔的流量序列数据S={s1,…,st,…,sT},T代表时间序列的总长度,其中相邻元素的时间间隔为5min。将原始流量序列数据进行Z-score标准化,从而得到归一化序列数据X。其中,标准化计算公式为,
其中,μ表示原始序列S的平均值,σ表示原始序列S的标准差。
流量预测模型训练模块S3,具体包括:
S31:所述输入层用于接受经过数据预处理之后的流量序列;
S32:所述编码层用于对输入的流量序列进行编码,获得隐变量特征分布;
S33:所述采样层用于对编码之后的隐变量特征分布进行采样获得编码特征向量;
S34:所述解码层用于对编码特征向量进行解码,以重构输入数据;
S35:所述输出层用于将学习到的隐变量特征映射到目标输出,采用基于sigmoid激活函数的全连接层将高维时序特征向量映射到最终的目标预测序列。
执行流量预测模型训练模块S3,包括变分推理子模块和预测输出子模块,首先通过变分自编码网络来处理原始交通流数据,通过变分时序推导来准确学习流量数据的潜在分布规律,然后将连续隐变量特征映射到最终的流量预测输出。流量预测模型训练模块S3具体包括步骤:
S31:输入层接受经过数据预处理之后的交通流量序列,假设输入的真实交通流量为x={x1,x2,…,xT},定义隐变量z和真实变量的联合分布为pθ(z;x)。
隐向量z可从先验分布pθ(z)中采样得到,然后重构数据点x从以z为条件的分布pθ(x|z)中产生。
变分自编码模型定义了真实数据和隐变量的联合分布pθ(z;x)=pθ(x|z)pθ(z)。
变分推理过程等价于在已知观测变量x条件下计算z的后验概率,根据贝叶斯公式可定义为,
其中,pθ(z|x)表示给定真实交通流x条件下隐变量z的后验分布,pθ(x|z)表示已知隐变量z条件下真实流量x的分布。然而直接计算pθ(x)非常耗时且难以处理,通常采用可假设的近似后验分布qφ(z|x)来逼近真实后验分布pθ(z|x)。
S32:编码层用于对输入的流量序列x进行编码,获得隐变量z的特征分布。
如图2所示,交通流量预测方法的模型图,基于变分门控递归单元自编码网络的预测模型。
首先,让编码器建立一个具有对角协方差结构的多元高斯模型qφ(z|x)=N(z|μ,diag(σ2))。通过GRU循环神经网络训练真实交流量数据,其中网络输入为交通流量数据x,网络输出为编码向量,然后通过线性变换得到隐变量z的高斯分布参数,均值μ和方差σ2,接下来可通过对该正态分布进行采样,得到隐变量z的近似后验分布qφ(z|x)。
输入x经过GRU网络编码计算如下,
具体来说,重置门rt确定是否需要将当前状态与以前的历史信息相结合,而更新门zt定义要保留的信息量。
图4所示为GRU门控递归单元的结构图,其中数据传递流程计算方式如下,
其中,xt表示第t时刻输入的流量序列数据,{Wr,Wz,Wh}和{Ur,Uz,Uh}表示权重矩阵参数,{br,bz,bh}表示偏置向量,ht-1表示前一时刻的隐藏状态,σ和⊙分别表示sigmoid激活函数和按元素乘积操作符。
S33:采样层用于对编码之后的隐变量z进行采样获得流量序列的特征表示向量,然而直接从分布进行的采样操作对μ和σ2不可导,无法在网络训练时使用梯度下降法来优化,在此使用变分自编码器训练中的重参数化,首先从上采样得到ε,然后利用重参数化来计算z,如此得到的结果是可导的。
z=μ+σ×ε (7)
S34:解码层用于对采样隐变量特征向量进行解码,以重构输入数据x。
本公开实施例采用长度和对应编码器相同的GRU网络,其中每个GRU隐藏单元数量跟编码器隐藏单元数量一样,数量为m,解码器的目标是输出和编码器尽可能相同的输入,输出定义如下,
上述变分推理子模块的目标是需要在确保输入数据重构误差足够小的同时,最小化qφ(z|x)和pθ(z|x)分布间的KL散度,从而实现在连续潜空间中的交通流量分布建模,达到对流量缺失数据的数据填充效果,从而进一步应用于鲁棒性流量预测。其中变分推理子模块的复合损失函数定义如下,
其中,第一项表示为是期望重构损失,或第i个数据点的期望负对数似然函数,可以得到模型编码器上的特征分布,进而使得模型的解码器能实现准确重构数据。
第二项表示正则项KL散度,其用于衡量用qφ(z|x)去近似表示pθ(z|x)时信息丢失的数量或程度,所以通过最小化KL散度,就能得到近似的pθ(z|x),这里x表示输入向量,z表示潜在空间隐变量。
对于观测变量x={x1,x2,x3,…,xZ}和隐变量z={z1,z2,z3,…,zM}联合表征的联合概率分布pθ(x;z)。
变分推理问题在给定观测值的条件下计算隐变量的条件分布pθ(z|x)=pθ(z,x)/pθ(x),其中pθ(x)=∫pθ(z|x)pθ(z)dz。
然而,直接计算pθ(z|x)代价比较大,为了计算可行性,变分推理采用假定分布qφ(z|x)来近似推理pθ(z|x),那么可以通过最小化两个分布的KL散度来实现分布近似,
进一步地,为推理出准确的隐变量分布,神经网络模型优化首先需要最小化pθ(z|x)和qφ(z|x)之间的KL散度,
但是这个采样过程不可导,导致网络无法训练。因此,参考变分自动编码器的重参数化技巧,假设隐变量z服从标准正态分布而真实交通流量x服从于正态分布条件下隐变量z的分布满足那么隐变量分布与近似隐变量分布之间的KL散度重新计算为,
其中,均值μ和方差σ2通过GRU网络训练真实交通流量数据x得到,最小化上述公式可得到真实交通流量x服从于正态分布条件下隐变量z的分布qφ(z|x),进而得到隐变量的真实分布pθ(x|z),从而完成将真实交通流量x编码为隐变量z。
因此,为了便于网络训练,所提模型中变分推理模块的损失函数可重定义为,
其中,k代表隐变量z的维度。
最后,通过无监督训练获得准确的隐变量特征,然后将生成流量分布的潜变量特征传递到输出层,完成最终的流量预测输出。
S35:输出层包含一个全连接层,将隐变量特征z映射到最后预测结果y,其中隐藏层单元数量为n1,具体映射计算如下,
y=W3*z+b3 (15)
最后,通过输出层映射将获得最终的流量预测输出y.
进一步地,在整体训练所述所提模型的过程中,为了使得优化参数相对平稳,在本公开的一实施例中,采用自适应矩估计优化算法对所提模型进行优化。具体地,Adam优化算法是在带动量的梯度下降法基础上融合了一种称为RMSprop的算法而成的。它利用梯度的一阶矩估计和二阶矩估计动态调整每个参数的学习率,其具体表达式为,
其中,mt表示为更新有偏一阶矩估计;vt表示为更新有偏二阶矩估计;表示为修正一阶矩的偏差,表示为修正二阶矩的偏差,参数α为0.001,参数β1为0.9,参数β2为0.999,而参数∈=10-8。该Adam的优点主要在于经过偏置校正后,每一次迭代学习率都有个确定范围,使得参数比较平稳。
进一步地,执行流量预测模型预测模块S4,将数据输入到训练完的鲁棒预测模型来输出未来时刻的流量预测结果。
由上述过程可知交通流量再生成的过程可利用GRU网络逼近真实训练数据,因此通过神经网络训练中的反向传播方法可优化变分自编码网络的损失函数,使得重构交通流量与真实交通流量更加相似。通过这个优化过程生成的中间隐藏变量z将不再受到因设备、人为操作问题导致的数据缺失现象的影响,可以反映生产流量的连续潜在特征分布,从而能够实现更加鲁棒的流量预测模型。
本实施例的技术效果,采用了真实交通数据集进行仿真实验,具体采集沈海高速的青岛段五个卡口检测点,历时两个月的过车数据,经过处理得到时间间隔为5分钟的交通数据,使用第一个月数据进行模型训练,第二个月数据进行模型测试。最后,与两种典型深度学习模型(LSTM、GRU)进行性能对比,实验结果采用MSE、MAPE、RMSE作为评价指标。
三种不同模型的高速公路流量预测结果对比表
通过上述表格结果的对比分析可知,基于变分自编码网络的流量预测模型具备对高速公路异常流量数据的抗噪能力,表现出更加准确的流量预测结果。
本公开实施例与LSTM和GRU神经网络预测模型相比,无论是MSE、RMSE还是MAPE指标,本公开的实施例模型均表现出更低的流量预测误差,实现了更加准确的预测精度。一方面是由于利用变分自编码器来推断生成高速公路流量的潜在分布,通过变分推理来准确建模该潜在分布特征,进而生成准确的流量数据,另一方面利用GRU循环神经网络来表征流量序列演变的时序特征,便于模型能够准确建模高速公路流量的非线性时序依赖,可准确表征流量序列的长短期序列特征。由于利用变分推理来建模高速公路流量数据的概率分布,而隐空间学习到的变量的概率分布为连续的,可对设备异常、人为操作等因素引起的噪声具有一定的鲁棒性,进而表现出更加可靠、准确的流量预测性能。
本公开实施例所提供的基于变分自编码网络的高速公路流量预测方法,充分利用了变分自编码网络的特征提取能力和抗噪声能力,结合门控递归单元神经网络的长短周期时序建模优势,在考虑到高速公路流量监测设备异常或人工操作导致的流量数据样本缺失等现象基础上,实现了鲁棒且高精度的流量预测模型。其中,GRU网络对后验概率qφ(z|x)的参数进行建模,有效提取流量序列数据中的时间依赖性;另一方面,变分编码器通过随机采样对隐变量进行编码,在一定程度上可降低原始传感器数据中噪声的干扰,基于可靠数据集构建的预测模型表现出更加鲁棒、准确的预测结果,从而为高速安全及流量疏导提供了可靠的技术支撑。
在介绍了本公开示例性实施方式的一种交通流量预测方法之后,接下来,介绍根据本公开的另一示例性实施方式的电子设备。
所属技术领域的技术人员能够理解,本公开的各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
在一些可能的实施方式中,根据本公开的电子设备可以至少包括至少一个处理器、以及至少一个计算机存储介质。其中,计算机存储介质存储有程序代码,当程序代码被处理器执行时,使得处理器执行本说明书上述描述的根据本公开各种示例性实施方式的交通流量预测方法中的步骤。
下面参照图4来描述根据本公开的这种实施方式的电子设备600。图4显示的电子设备600仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图4所示,电子设备600以通用电子设备的形式表现。电子设备600的组件可以包括但不限于:上述至少一个处理器601、上述至少一个计算机存储介质602、连接不同系统组件(包括计算机存储介质602和处理器601)的总线603。
总线603表示几类总线结构中的一种或多种,包括计算机存储介质总线或者计算机存储介质控制器、外围总线、处理器或者使用多种总线结构中的任意总线结构的局域总线。
计算机存储介质602可以包括易失性计算机存储介质形式的可读介质,例如随机存取计算机存储介质(RAM)621和/或高速缓存存储介质622,还可以进一步包括只读计算机存储介质(ROM)623。
计算机存储介质602还可以包括具有一组(至少一个)程序模块624的程序/实用工具625,这样的程序模块624包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
电子设备600也可以与一个或多个外部设备604(例如键盘、指向设备等)通信,还可与一个或者多个使得用户能与电子设备600交互的设备通信,和/或与使得该电子设备600能与一个或多个其它电子设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口605进行。并且,电子设备600还可以通过网络适配器606与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器606通过总线603与用于电子设备600的其它模块通信。应当理解,尽管图中未示出,可以结合电子设备600使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
在一些可能的实施方式中,本公开提供的一种交通流量预测方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在计算机设备上运行时,程序代码用于使计算机设备执行本说明书上述描述的根据本公开各种示例性实施方式的图像搜索方法中的步骤。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取计算机存储介质(RAM)、只读计算机存储介质(ROM)、可擦式可编程只读计算机存储介质(EPROM或闪存)、光纤、便携式紧凑盘只读计算机存储介质(CD-ROM)、光计算机存储介质件、磁计算机存储介质件、或者上述的任意合适的组合。
本公开的实施方式的图像搜索的程序产品可以采用便携式紧凑盘只读计算机存储介质(CD-ROM)并包括程序代码,并可以在电子设备上运行。然而,本公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户电子设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户电子设备上部分在远程电子设备上执行、或者完全在远程电子设备或服务器上执行。在涉及远程电子设备的情形中,远程电子设备可以通过任意种类的网络包括局域网(LAN)或广域网(WAN)连接到用户电子设备,或者,可以连接到外部电子设备(例如利用因特网服务提供商来通过因特网连接)。
应当注意,尽管在上文详细描述中提及了装置的若干模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块的特征和功能可以在一个模块中具体化。反之,上文描述的一个模块的特征和功能可以进一步划分为由多个模块来具体化。
此外,尽管在附图中以特定顺序描述了本公开方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
本领域内的技术人员应明白,本公开的实施例可提供为方法、系统、或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘计算机存储介质、CD-ROM、光学计算机存储介质等)上实施的计算机程序产品的形式。
本公开是参照根据本公开的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读计算机存储介质中,使得存储在该计算机可读计算机存储介质中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本公开进行各种改动和变型而不脱离本公开的精神和范围。这样,倘若本公开的这些修改和变型属于本公开权利要求及其等同技术的范围之内,则本公开也意图包含这些改动和变型在内。
Claims (10)
1.一种高速公路交通流量预测方法,其特征在于,所述方法包括:
接收高速公路监测设备发送的采集到的高速公路过车数据,形成固定间隔时间的高速公路流量序列数据;
将所述高速公路流量序列数据进行Z-score标准化,得到归一化的流量序列数据;
通过变分门控递归单元自编码网络将所述流量序列数据及多维度之间关联性映射到隐空间,用于提取所述流量序列数据的长短期时间序列特征,其中变分门控递归单元自编码网络通过变分推理来建模所述高速公路流量序列数据的概率分布,所述隐空间的变量的概率分布为连续的;
将当前实时采集的数据输入到所述变分门控递归单元自编码网络,获得未来时刻的流量预测信息。
2.根据权利要求1所述的一种高速公路交通流量预测方法,其特征在于,所述变分门控递归单元自编码网络包括输入层,所述输入层用于接受所述归一化的流量序列数据x={x1,x2,...,xT},定义隐变量z和真实变量的联合分布为pθ(z;x),隐向量z从先验分布pθ(z)中采样得到,重构数据点x从以z为条件的分布pθ(x|z)中产生,其中pθ(x|z)表示已知隐变量z条件下所述归一化的流量序列数据x的分布。
3.根据权利要求2所述的一种高速公路交通流量预测方法,其特征在于,所述变分门控递归单元自编码网络包括编码层,所述编码层用于对输入的流量序列数据x进行编码,获得所述隐变量z的特征分布,其中,向GRU循环神经网络输入流量序列数据x,GRU循环神经网络输出为编码向量henc,并通过线性变换得到隐变量z的高斯分布参数,包括均值μ和方差σ2,得到隐变量z的近似后验分布qφ(z|x)。
6.根据权利要求1-5所述的任一种高速公路交通流量预测方法,其特征在于,所述变分门控递归单元自编码网络的损失函数由第一损失函数和第二损失函数构成,其中,所述第一损失函数为负对数似然函数,用于衡量输入数据的重构误差,所述第二损失函数为真实分布和近似后验分布之间的KL散度(Kullback-Leibler divergence),用于衡量两个分布之间的相似度。
7.根据权利要求1-5所述的任一种高速公路交通流量预测方法,其特征在于,所述变分门控递归单元自编码网络采用自适应矩估计(Adaptive Moment Estimation,Adam),Adam有动量项的RMSprop,利用梯度的一阶矩估计和二阶矩估计动态调整每个参数的学习率,经过偏置校正后,每一次迭代学习率都有确定范围。
8.一种电子设备,其特征在于,包括存储单元和处理器;其中:
所述处理器,被配置为:
接收高速公路监测设备发送的采集到的高速公路过车数据,形成固定间隔时间的高速公路流量序列数据;
将所述高速公路流量序列数据进行Z-score标准化,得到归一化的流量序列数据;
通过变分门控递归单元自编码网络将所述流量序列数据及多维度之间关联性映射到隐空间,用于提取所述流量序列数据的长短期时间序列特征,其中变分门控递归单元自编码网络通过变分推理来建模所述高速公路流量序列数据的概率分布,所述隐空间的变量的概率分布为连续的;
将当前实时采集的数据输入到所述变分门控递归单元自编码网络,获得未来时刻的流量预测信息。
9.根据权利要求8所述的电子设备,其特征在于,所述处理器,还被配置为:
所述变分门控递归单元自编码网络包括输入层,所述输入层用于接受所述归一化的流量序列数据x={x1,x2,...,xT},定义隐变量z和真实变量的联合分布为pθ(z;x),隐向量z从先验分布pθ(z)中采样得到,重构数据点x从以z为条件的分布pθ(x|z)中产生,其中pθ(x|z)表示已知隐变量z条件下所述归一化的流量序列数据x的分布。
10.根据权利要求8所述的电子设备,其特征在于,所述处理器具体被配置为:
所述变分门控递归单元自编码网络包括编码层,所述编码层用于对输入的流量序列数据x进行编码,获得所述隐变量z的特征分布,其中,向GRU循环神经网络输入流量序列数据x,GRU循环神经网络输出为编码向量henc,并通过线性变换得到隐变量z的高斯分布参数,包括均值μ和方差σ2,得到隐变量z的近似后验分布qφ(z|x)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111326656.9A CN116128082A (zh) | 2021-11-10 | 2021-11-10 | 高速公路交通流量预测方法及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111326656.9A CN116128082A (zh) | 2021-11-10 | 2021-11-10 | 高速公路交通流量预测方法及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116128082A true CN116128082A (zh) | 2023-05-16 |
Family
ID=86310381
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111326656.9A Pending CN116128082A (zh) | 2021-11-10 | 2021-11-10 | 高速公路交通流量预测方法及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116128082A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116504076A (zh) * | 2023-06-19 | 2023-07-28 | 贵州宏信达高新科技有限责任公司 | 基于etc门架数据的高速公路车流量预测方法 |
-
2021
- 2021-11-10 CN CN202111326656.9A patent/CN116128082A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116504076A (zh) * | 2023-06-19 | 2023-07-28 | 贵州宏信达高新科技有限责任公司 | 基于etc门架数据的高速公路车流量预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111694879B (zh) | 一种多元时间序列异常模式预测方法及数据采集监控装置 | |
CN111370122B (zh) | 一种基于知识指导的时序数据风险预测方法、系统及其应用 | |
CN111191841A (zh) | 一种电力负荷预测方法、装置、计算机设备及存储介质 | |
CN112784965A (zh) | 面向云环境下大规模多元时间序列数据异常检测方法 | |
CN113568819B (zh) | 异常数据检测方法、装置、计算机可读介质及电子设备 | |
CN111738520A (zh) | 一种融合孤立森林与长短期记忆网络的系统负载预测方法 | |
CN112291098B (zh) | 一种网络安全风险预测方法及其相关装置 | |
CN115587454A (zh) | 基于改进Transformer模型的交通流量长时预测方法及系统 | |
CN113360848A (zh) | 一种时序数据预测方法及装置 | |
CN110956309A (zh) | 基于crf和lstm的流程活动预测方法 | |
Yang et al. | An ensemble prediction system based on artificial neural networks and deep learning methods for deterministic and probabilistic carbon price forecasting | |
CN116503118A (zh) | 一种基于分类选择强化预测模型的废旧家电价值评估系统 | |
CN116128082A (zh) | 高速公路交通流量预测方法及电子设备 | |
CN117435997B (zh) | 一种基于Transformer和时序压缩机制的电梯预警及按需维保方法 | |
Liu et al. | Residual useful life prognosis of equipment based on modified hidden semi-Markov model with a co-evolutional optimization method | |
CN117076993A (zh) | 基于云原生的多智能体博弈决策系统及方法 | |
CN114399901B (zh) | 一种控制交通系统的方法和设备 | |
CN111402042B (zh) | 一种用于股市大盘形态分析的数据分析与显示方法 | |
CN111461416B (zh) | 风速预测方法、系统、电子设备及存储介质 | |
CN115705339A (zh) | 交通流量预测方法及电子设备 | |
Wang et al. | Short-term probability density function forecasting of industrial loads based on ConvLSTM-MDN | |
CN113591391A (zh) | 一种电力负荷控制装置、控制方法、终端、介质及应用 | |
Zhang et al. | [Retracted] Bayesian Network Structure Learning and Application | |
CN115456073B (zh) | 基于长短期记忆的生成式对抗网络模型建模分析方法 | |
CN117725488B (zh) | 基于机器学习的建筑工程项目安全性能预测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |