CN112863179B - 一种基于神经网络模型预测控制的路口信号灯控制方法 - Google Patents

一种基于神经网络模型预测控制的路口信号灯控制方法 Download PDF

Info

Publication number
CN112863179B
CN112863179B CN202110031086.4A CN202110031086A CN112863179B CN 112863179 B CN112863179 B CN 112863179B CN 202110031086 A CN202110031086 A CN 202110031086A CN 112863179 B CN112863179 B CN 112863179B
Authority
CN
China
Prior art keywords
intersection
state
moment
signal lamp
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110031086.4A
Other languages
English (en)
Other versions
CN112863179A (zh
Inventor
肖万兴
杨博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN202110031086.4A priority Critical patent/CN112863179B/zh
Publication of CN112863179A publication Critical patent/CN112863179A/zh
Application granted granted Critical
Publication of CN112863179B publication Critical patent/CN112863179B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • G08G1/0129Traffic data processing for creating historical data or processing based on historical data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0137Measuring and analyzing of parameters relative to traffic conditions for specific applications
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/07Controlling traffic signals
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Abstract

本发明公开了一种基于神经网络模型预测控制的路口信号灯控制方法,涉及路口信号灯控制领域,包括以下步骤:建立交叉路口场景,设定计划区域并定义交叉路口延迟状态;建立神经网络预测模型;获取当前时刻交叉路口状态信息,通过所述神经网络预测模型预测下一时刻交叉路口的延迟状态;在模型预测控制的框架下,定义目标函数和约束条件并进行迭代求解,获取最优控制序列并提取控制输出控制当前时刻信号灯,下一时刻再通过数据传输更新状态进行滚动优化,以达到实时控制路口信号的目的。本发明实时应用于各种场景,能有效的还原系统特征动态并且易于应用,计算负载更小更适用于路侧嵌入式设备。

Description

一种基于神经网络模型预测控制的路口信号灯控制方法
技术领域
本发明涉及路口信号灯控制领域,尤其涉及一种基于神经网络模型预测控制的路口信号灯控制方法。
背景技术
随着经济的不断发展,城市车辆的不断增加,城市路网的交通拥堵已经成为一个严重的社会经济问题。难以进一步修建和拓宽道路的情况下,通过加强交通管理和控制来有效利用现有道路是城市交通的主要选择。人们普遍认为通过有效管理交通流量可以减少出行延迟,否则就会带来很多出行麻烦,尤其是车辆通过交叉路口时,不合理的交通信号周期可能会中断顺畅的交通流并导致拥堵。
在车联网的背景下,现有的交通信号灯控制方案一般可以分为两类。第一类是固定配时信号灯控制,第二类是自适应信号灯控制。对于第一类,在固定时间控制的情况下,控制器利用历史交通数据来离线确定交通信号灯固定配时方案,方案包括三个参数,周期时间、分割时间和偏移。周期时间定义了一个完整信号周期的持续时间,分割时间定义了灯在每个状态(如绿灯)下停留的时间,偏移量定义了相对于其他十字路口交通灯的相位差。在传统的交通信号灯控制中,这些参数是基于对一天的历史交通流量数据的分析来及时调整的,然而固定配时方案不能实时响应各种交通状况,尤其是在交通流量突然增加的情况下。
第二类方案是自适应信号灯控制,其优势在于它可以考虑实时和随机的交通需求,并基于各种算法设计并提供交通灯控制决策,包括动态规划、模糊逻辑和强化学习。自适应信号灯控制利用实时数据来确定最佳信号定时,以最大化定义的目标函数,并且在最近几十年中,由于其适应性和灵活性,它逐渐变得流行。典型的信号控制系统是现代化的优化车辆驱动(MOVA)系统。然而该系统的缺点是它不能全局优化,因为控制决策只考虑当前绿色方向的交通需求,而忽略其他方向。
还有一种由深度神经网络支持的强化学习方法来实现自适应交通信号灯控制算法。为了尽可能真实地反映交叉路口交通状况,将单个车辆延迟定义为交通状态的基本要素,并将交叉口划分为代表单个延迟的单元。此外,为了捕捉时间上的交通动态,该方案采用了一系列的空间观测来增强交通状态的表示,这种表示被引入到一个非整数网络中,以确定不同时间间隔的控制决策。决策阶段是通过两个LSTM神经网络来实现的,Critic网络预测预期的累积成本,Actor网络直接确定当前状态下最优的动作。通过输入当前绿灯可通行车道的延迟状态和部分历史时刻数据,通过神经网络判断信号灯是否按固定的周期顺序切换到下一阶段。同时由于神经网络初始参数是随机给定的,该方案采用一个Actor-Critic算法框架进行优化,以减少Critic网络的估计误差,降低Actor网络的未来代价,并计算神经网络参数和反馈系数。但是此方法计算负载大,不适用于路侧嵌入式设备。
因此,本领域的技术人员致力于开发一种基于神经网络模型预测控制的路口信号灯控制方法,可以实时应用于各种场景,能更有效地还原系统动态特征并且易于应用,同时计算负载更小更适用于路侧嵌入式设备。
发明内容
有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是交通状态特定信息容易丢失,固定顺序和周期的交通信号灯切换方案缺乏灵活性,不能实时应用于各种场景,并且常规模型预测控制方法中的线性模型不能有效的还原系统特征动态,而非线性模型过于复杂难以应用的问题,基于强化学习等算法的信号灯控制方案计算负载大,不适用于路侧嵌入式设备。
为实现上述目的,本发明提供了一种基于神经网络模型预测控制的路口信号灯控制方法,包括以下步骤:
步骤1、建立交叉路口场景,设定计划区域并定义交叉路口延迟状态;
步骤2、建立神经网络预测模型;
步骤3、获取当前时刻交叉路口状态信息,通过所述神经网络预测模型预测下一时刻交叉路口的延迟状态;
步骤4、在模型预测控制的框架下,定义目标函数和约束条件并进行迭代求解,获取最优控制序列并提取控制输出控制当前时刻信号灯,下一时刻再通过数据传输更新状态进行滚动优化,以达到实时控制路口信号的目的。
进一步地,所述步骤1还包括:
步骤1.1、建立与划分交叉路口区域,每个方向分为两条驶入车道,所述驶入车道包括左转车道和直行右转车道;
步骤1.2、将计划区域内每条所述驶入车道划分为长度为L的N个单元;
步骤1.3、定义每个所述单元延迟状态;
步骤1.4、根据每个所述单元延迟状态信息和路口场景定义交叉路口延迟状态。
进一步地,每个所述单元延迟状态定义如下:
Figure BDA0002892100420000021
其中,下标i=1,2,……,N是每个单元的索引,di表示每个单元的延迟状态,Ni表示第i个单元内的车辆数,via表示单元内车辆的平均速度,vmax是通过交叉路口计划区域的最大允许速度,q表示延迟系数。
进一步地,所述步骤1.4包括:
k时刻路口交通状态定义如下:
y(k)=[d1(k),d2(k),d3(k),...,dN(k)]T
其中,y(k)表示一条驶入车道上的延迟状态;
交叉路口信号灯分为四个通行阶段,路口延迟状态定义如下:
x=(x0,x1,x2,x3)T
xm=(ym1,ym2)T
其中,下标m=0,1,2,3是每个通行阶段的索引,xm=(ym1,ym2)T表示一个通行阶段有两个不同的来车方向;
当前k时刻信号灯状态定义如下:
u(k)=[δ0(k),δ1(k),δ2(k),δ3(k)]T
Figure BDA0002892100420000031
Figure BDA0002892100420000032
其中,δ是一个二元变量,表示对应的信号阶段是否可通行,同时考虑到安全因素,在k时刻四个阶段有且只有一个可以通行。
进一步地,所述步骤2包括:
步骤2.1、采集历史数据,结合交叉路口场景模型特点建立所述神经网络预测模型,所述神经网络预测模型采用对角递归神经网络(DRNN),所述历史数据是按时间间隔所采集到的交叉路口计划区域内车辆的数据和当前时刻信号灯状态数据;
步骤2.2、使用所述历史数据建立数据集,将采集到的所述历史数据,使用滑动窗口,每T个时刻的所述历史数据作为一个输入,下一个时刻的所述历史数据作为标签,将所述历史数据按所述输入和对应的所述标签制作成数据集,并按比例划分成训练集和测试集;
步骤2.3、使用所述训练集对模型进行多次训练,并用所述测试集进行数据传输量减少的本地测试;
步骤2.4、当所述历史数据增加量达到设定值时,重新制作数据集进行模型训练,若所获得的最好预测模型的数据传输量减少比例比上次获得的数据传输量减少比例的增加量小于阈值,则停止训练和优化模型。
进一步地,所述步骤3包括:
获取k时刻交叉路口计划区域内所有车辆的位置和速度数据,通过延迟状态的定义获得每条所述驶入车道当前时刻的延迟状态数据y(k),同时获取k时刻信号灯状态u(k),结合历史数据生成DRNN预测模型的输入向量:
Figure BDA0002892100420000041
Figure BDA0002892100420000042
Figure BDA0002892100420000043
Figure BDA0002892100420000044
其中,FNN表示神经网络预测模型的非线性映射关系,从而由k时刻的状态数据获得下一时刻该车道的延迟状态预测输出
Figure BDA0002892100420000045
再结合k时刻外部输入该车道的延迟状态e(k)可得到最终的预测输出:
Figure BDA0002892100420000046
同理预测出每条所述驶入车道的k+1时刻延迟状态,从而获得整个交叉路口的延迟状态x(k+1)。
进一步地,所述步骤4包括:
步骤4.1、根据模型预测控制的框架,在预测水平T下定义所述目标函数和所述约束条件;
步骤4.2、在预测水平内求解k时刻所述目标函数最优值,得到预测的所述最优控制序列;
步骤4.3、求解所述最优控制序列并提取所述控制输出;
步骤4.4、采用所述控制输出作为信号灯状态,并在k+1时刻获得的车辆状态信息,更新模型中的路口交通延迟状态进行滚动优化,重复所述步骤4.3。
进一步地,所述目标函数和所述约束条件分别定义如下:
Figure BDA0002892100420000047
Figure BDA0002892100420000048
其中,ωx和ωu分别表示权重系数,T表示预测水平,正定矩阵Q表示路口延迟状态x(k)中各分量加权求和关系;所述目标函数中第一项表示预测水平内路口总延迟,第二项作为频繁改变信号灯状态的惩罚项;所述约束条件中,路口交通延迟状态x存在区间约束x∈[xmin,xmax],信号灯状态即控制量根据步骤1.4定义。
进一步地,所述步骤4.2包括:
采用混合整数规划的方法,引入辅助变量的方法迭代求解所述目标函数最优值,以及预测水平内初始时刻k到结束时刻之间各时刻的最优信号灯控制序列值,从而得到预测的所述最优控制序列:
Figure BDA0002892100420000051
进一步地,所述控制输出,即k+1时刻交叉路口信号灯状态定义如下:
Figure BDA0002892100420000052
与现有技术相比,本发明至少具有如下有益技术效果:
1、基于车辆具体信息而不是车流或排队长队等信息进行处理,减少了特定信息丢失的问题;
2、通过结合历史数据训练好的神经网络模型进行预测控制来获取信号灯最优控制输出,而不是固定顺序和周期的切换方案,具有更好的灵活性适用于各种场景;
3、通过引入神经网络预测控制模型而不是基于物理过程的线性或非线性模型,能更有效地还原系统动态特征并且易于应用;
4、在模型预测控制的框架下利用混合整数规划的算法解决优化问题,相比于基于强化学习等算法的信号灯控制方案计算负载更小更适用于路侧嵌入式设备。
以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。
附图说明
图1是本发明的一个较佳实施例的流程图;
图2是本发明的一个较佳实施例的交叉路口场景图;
图3是本发明的一个较佳实施例的车道单元图;
图4是本发明的一个较佳实施例的通行阶段图;
图5是本发明的一个较佳实施例的DRNN结构图。
具体实施方式
以下参考说明书附图介绍本发明的多个优选实施例,使其技术内容更加清楚和便于理解。本发明可以通过许多不同形式的实施例来得以体现,本发明的保护范围并非仅限于文中提到的实施例。
在附图中,结构相同的部件以相同数字标号表示,各处结构或功能相似的组件以相似数字标号表示。附图所示的每一组件的尺寸和厚度是任意示出的,本发明并没有限定每个组件的尺寸和厚度。为了使图示更清晰,附图中有些地方适当夸大了部件的厚度。
如图1所示,是本发明的一种基于神经网络模型预测控制的路口信号灯控制方法流程图,包括以下步骤:
步骤1、建立交叉路口场景,设定计划区域并定义交叉路口延迟状态;
步骤2、建立神经网络预测模型;
步骤3、获取当前k时刻交叉路口状态信息,通过神经网络预测模型预测下一时刻交叉路口的延迟状态;
步骤4、在模型预测控制的框架下,定义目标函数和约束条件并进行迭代求解,获取最优控制序列并提取控制输出控制当前时刻信号灯,下一时刻再通过数据传输更新状态进行滚动优化,以达到实时控制路口信号的目的。
步骤1包括:
步骤1.1、建立与划分交叉路口区域,如图2所示,每个方向分为两条驶入车道,驶入车道包括左转车道和直行右转车道,同时计划区域内所有车辆配备了C-V2X通信设备,可在低延迟的状态下向路侧控制单元发送自身状态信息;
步骤1.2、如图3所示,将计划区域内每条驶入车道划分的N个单元,每个单元的跨度为10m至20m;
步骤1.3、定义每个单元延迟状态:
Figure BDA0002892100420000061
其中,下标i=1,2,……,N是每个单元的索引,di表示每个单元的延迟状态,Ni表示第i个单元内的车辆数,via表示单元内车辆的平均速度,vmax是通过交叉路口计划区域的最大允许速度,q表示延迟系数。
步骤1.4、根据每个单元延迟状态信息和路口场景定义交叉路口延迟状态:
k时刻路口交通状态定义如下:
y(k)=[d1(k),d2(k),d3(k),...,dN(k)]T
其中,y(k)表示一条驶入车道上的延迟状态;
如图4所示,在实际场景中,交叉路口信号灯分为四个通行阶段,路口延迟状态定义如下:
x=(x0,x1,x2,x3)T
xm=(ym1,ym2)T
其中,下标m=0,1,2,3是每个通行阶段的索引,xm=(ym1,ym2)T表示一个通行阶段有两个不同的来车方向;
当前k时刻信号灯状态定义如下:
u(k)=[δ0(k),δ1(k),δ2(k),δ3(k)]T
Figure BDA0002892100420000062
Figure BDA0002892100420000063
其中,δ是一个二元变量,表示对应的信号阶段是否可通行,同时考虑到安全因素,在k时刻四个阶段有且只有一个可以通行,例如u=(0,0,1,0)T表示阶段2(东西向左转)为绿灯通行状态。
步骤2包括:
步骤2.1、路侧控制单元通过C-V2X技术,按时间间隔不断获取所采集到的交叉路口计划区域内车辆的数据和当前时刻信号灯状态数据,结合这一特点,搭建对角递归神经网络(DRNN),如图5所示,DRNN结构较为简单并且学习速度快,不需要知道预测过程的阶数,同时具有自适应和数据融合的能力,适合用于从时序输入输出数据中识别出合适的模型参数。取一段时间如T个时刻的时序数据作为网络的输入,每一个时刻所对应网络的输入即这一时刻的数据,整个网络的输出为下一个时刻的数据
步骤2.2、使用历史数据建立数据集,将采集到的历史数据,使用滑动窗口,每T个时刻的历史数据作为一个输入,下一个时刻的历史数据作为标签,将历史数据按输入和对应的标签制作成数据集,并按比例划分成训练集和测试集;
步骤2.3、使用训练集对模型进行训练,由于训练过程具有一定的随机性,所以进行多次训练,并利用测试集进行数据传输量减少的本地测试,即将测试集所涉及的时间段内的数据使用滑动窗口生成模型输入数据,并使用DRNN预测模型预测下一时刻数据,若预测值与真实值的差值小于等于阈值,使用预测值替代下一时刻的数据,数据减少个数加1,否则真实数据个数加1,数据减少个数加真实数据个数即总的数据个数,数据减少个数除以总的数据个数即数据输量减少比例;
步骤2.4、路侧控制单元按时间间隔不断的获得交叉路口计划区域内传来的车辆状态数据,随着时间的推移,历史数据将不断增多,当数据增加量达到设定值时,重新制作数据集进行模型训练,由于随着模型的迭代,其每次优化训练所获得的提升将越来越低,若该次所获得的最好预测模型的数据传输量减少比例比上次获得的数据传输量减少比例的增加量小于阈值,则以后都不再训练和优化模型。
步骤3包括:
路侧控制单元获取k时刻交叉路口计划区域内所有车辆的位置和速度数据,通过延迟状态的定义获得每条驶入车道当前时刻的延迟状态数据y(k),同时获取k时刻信号灯状态u(k),结合历史数据生成DRNN预测模型的输入向量:
Figure BDA0002892100420000071
Figure BDA0002892100420000072
Figure BDA0002892100420000073
Figure BDA0002892100420000074
其中,FNN表示神经网络预测模型的非线性映射关系,从而由k时刻的状态数据获得下一时刻该车道的延迟状态预测输出
Figure BDA0002892100420000081
再结合k时刻外部输入该车道的延迟状态e(k)可得到最终的预测输出:
Figure BDA0002892100420000082
同理预测出每条驶入车道的k+1时刻延迟状态,从而获得整个交叉路口的延迟状态x(k+1)。
步骤4包括:
步骤4.1、根据模型预测控制的框架,在预测水平T下定义目标函数和约束条件如下:
Figure BDA0002892100420000083
Figure BDA0002892100420000084
其中,ωx和ωu分别表示权重系数,T表示预测水平,正定矩阵Q表示路口延迟状态x(k)中各分量加权求和关系;目标函数中第一项表示预测水平内路口总延迟,第二项作为频繁改变信号灯状态的惩罚项;约束条件中,路口交通延迟状态x存在区间约束x∈[xmin,xmax],信号灯状态即控制量根据步骤1.4定义。
步骤4.2、根据上一步建立的模型、目标函数和约束条件,求解k时刻最优的目标函数值,在求解过程中,由于控制量u中含有二元变量且u取值只有四种情况,本实施例采用混合整数规划的方法,引入辅助变量的方法迭代求解目标函数最优值,以及预测水平内初始时刻k到结束时刻之间各时刻的最优信号灯控制序列值,从而得到预测的最优控制序列:
Figure BDA0002892100420000085
步骤4.3、根据上一步得到的最优控制序列以及模型预测控制规则,将序列中的第一个分量对应的值作为控制输出,即k+1时刻交叉路口信号灯状态:
Figure BDA0002892100420000086
步骤4.4、采用上一步的控制输出u(k+1)作为信号灯状态,在下一步k+1时刻通过C-V2X通信技术实时获得的车辆具体状态信息包括位置和速度,用于更新模型中的路口交通延迟状态。通过提前一步移动预测水平和使用更新的交通状态重复优化过程,即重复步骤4.3,并继续该过程。
在另一实施例中,神经网络预测模型可以采用LSTM神经网络或者时间卷积网络或者BP神经网络,当路侧控制单元的计算能力比较弱时,可以选择相对简单的预测方法。同时,对于路口延迟状态的定义也可采用其他基于车辆微观具体数据的定义方法,包括加速度、车辆间隔等车辆其他信息进行延迟状态的定义,当考虑驾驶员舒适感时也需要考虑加速度的变化。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

Claims (5)

1.一种基于神经网络模型预测控制的路口信号灯控制方法,其特征在于,包括以下步骤:
步骤1、建立交叉路口场景,设定计划区域并定义交叉路口延迟状态;
所述步骤1还包括:
步骤1.1、建立与划分交叉路口区域,每个方向分为两条驶入车道,所述驶入车道包括左转车道和直行右转车道;
步骤1.2、将计划区域内每条所述驶入车道划分为长度为L的N个单元;
步骤1.3、定义每个所述单元延迟状态,如下所示:
Figure FDA0003640101130000011
其中,下标i=1,2,……,N是每个单元的索引,di表示每个单元的延迟状态,Ni表示第i个单元内的车辆数,via单元内车辆的平均速度,vmax是通过交叉路口计划区域的最大允许速度,q表示延迟系数;
步骤1.4、根据每个所述单元延迟状态信息和路口场景定义交叉路口延迟状态,定义k时刻路口交通状态、当前k时刻信号灯状态;
所述k时刻路口交通状态定义如下:
y(k)=[d1(k),d2(k),d3(k),...,dN(k)]T
其中,y(k)表示一条驶入车道上的延迟状态;
交叉路口信号灯分为四个通行阶段,路口延迟状态定义如下:
x=(x0,x1,x2,x3)T
xm=(ym1,ym2)T
其中,下标m=0,1,2,3是每个通行阶段的索引,xm=(ym1,ym2)T表示一个通行阶段有两个不同的来车方向;
所述当前k时刻信号灯状态定义如下:
u(k)=[δ0(k),δ1(k),δ2(k),δ3(k)]T
Figure FDA0003640101130000012
Figure FDA0003640101130000013
其中,δ是一个二元变量,表示对应的信号阶段是否可通行,同时考虑到安全因素,在k时刻四个阶段有且只有一个可以通行;
步骤2、建立神经网络预测模型;
步骤3、获取当前时刻交叉路口状态信息,使用所述k时刻路口交通状态、所述当前k时刻信号灯状态通过所述神经网络预测模型预测下一时刻交叉路口的延迟状态;
所述步骤3包括:
获取k时刻交叉路口计划区域内所有车辆的位置和速度数据,通过延迟状态的定义获得每条所述驶入车道当前时刻的延迟状态数据y(k),同时获取k时刻信号灯状态u(k),结合历史数据生成DRNN预测模型的输入向量:
Figure FDA0003640101130000021
Figure FDA0003640101130000022
Figure FDA0003640101130000023
Figure FDA0003640101130000024
其中,FNN表示神经网络预测模型的非线性映射关系,从而由k时刻的状态数据获得下一时刻该车道的延迟状态预测输出
Figure FDA0003640101130000025
再结合k时刻外部输入该车道的延迟状态e(k)可得到最终的预测输出:
Figure FDA0003640101130000026
同理预测出每条所述驶入车道的k+1时刻延迟状态,从而获得整个交叉路口的延迟状态x(k+1);
步骤4、在模型预测控制的框架下,定义目标函数和约束条件并进行迭代求解,获取最优控制序列并提取控制输出控制当前时刻信号灯,下一时刻再通过数据传输更新状态进行滚动优化,以达到实时控制路口信号的目的;所述目标函数和所述约束条件分别定义如下:
Figure FDA0003640101130000027
Figure FDA0003640101130000028
其中,ωx和ωu分别表示权重系数,T表示预测水平,正定矩阵Q表示路口延迟状态x(k)中各分量加权求和关系;所述目标函数中第一项表示预测水平内路口总延迟,第二项作为频繁改变信号灯状态的惩罚项;所述约束条件中,路口交通延迟状态x存在区间约束x∈[xmin,xmax],信号灯状态即控制量根据所述步骤1.4定义。
2.如权利要求1所述的基于神经网络模型预测控制的路口信号灯控制方法,其特征在于,所述步骤2包括:
步骤2.1、采集历史数据,结合交叉路口场景模型特点建立所述神经网络预测模型,所述神经网络预测模型采用对角递归神经网络(DRNN),所述历史数据是按时间间隔所采集到的交叉路口计划区域内车辆的数据和当前时刻信号灯状态数据;
步骤2.2、使用所述历史数据建立数据集,将采集到的所述历史数据,使用滑动窗口,每T个时刻的所述历史数据作为一个输入,下一个时刻的所述历史数据作为标签,将所述历史数据按所述输入和对应的所述标签制作成数据集,并按比例划分成训练集和测试集;
步骤2.3、使用所述训练集对模型进行多次训练,并用所述测试集进行数据传输量减少的本地测试;
步骤2.4、当所述历史数据增加量达到设定值时,重新制作数据集进行模型训练,若所获得的最好预测模型的数据传输量减少比例比上次获得的数据传输量减少比例的增加量小于阈值,则停止训练和优化模型。
3.如权利要求2所述的基于神经网络模型预测控制的路口信号灯控制方法,其特征在于,所述步骤4包括:
步骤4.1、根据模型预测控制的框架,在预测水平T下定义所述目标函数和所述约束条件;
步骤4.2、在预测水平内求解k时刻所述目标函数最优值,得到预测的所述最优控制序列;
步骤4.3、求解所述最优控制序列并提取所述控制输出;
步骤4.4、采用所述控制输出作为信号灯状态,并在k+1时刻获得车辆状态信息,更新模型中的路口交通延迟状态进行滚动优化,重复所述步骤4.3。
4.如权利要求3所述的基于神经网络模型预测控制的路口信号灯控制方法,其特征在于,所述步骤4.2包括:
采用混合整数规划的方法,引入辅助变量的方法迭代求解所述目标函数最优值,以及预测水平内初始时刻k到结束时刻之间各时刻的最优信号灯控制序列值,从而得到预测的所述最优控制序列:
Figure FDA0003640101130000031
5.如权利要求4所述的基于神经网络模型预测控制的路口信号灯控制方法,其特征在于,所述控制输出,即k+1时刻交叉路口信号灯状态定义如下:
Figure FDA0003640101130000041
CN202110031086.4A 2021-01-11 2021-01-11 一种基于神经网络模型预测控制的路口信号灯控制方法 Active CN112863179B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110031086.4A CN112863179B (zh) 2021-01-11 2021-01-11 一种基于神经网络模型预测控制的路口信号灯控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110031086.4A CN112863179B (zh) 2021-01-11 2021-01-11 一种基于神经网络模型预测控制的路口信号灯控制方法

Publications (2)

Publication Number Publication Date
CN112863179A CN112863179A (zh) 2021-05-28
CN112863179B true CN112863179B (zh) 2022-07-12

Family

ID=76002364

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110031086.4A Active CN112863179B (zh) 2021-01-11 2021-01-11 一种基于神经网络模型预测控制的路口信号灯控制方法

Country Status (1)

Country Link
CN (1) CN112863179B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113256961B (zh) * 2021-06-25 2022-05-24 上海交通大学 基于车辆编队的路口自主车辆调度与控制方法
CN113537595A (zh) * 2021-07-16 2021-10-22 上海电气风电集团股份有限公司 模型训练方法、风功率预测方法、系统、设备及介质
CN114004339B (zh) * 2021-11-12 2024-05-03 广东海洋大学 一种基于宽度学习的城市照明系统调节方法、装置和存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6119112A (en) * 1997-11-19 2000-09-12 International Business Machines Corporation Optimum cessation of training in neural networks
WO2013143621A1 (en) * 2012-03-30 2013-10-03 Nec Europe Ltd. Method and system for adapting vehicular traffic flow
CN104408919A (zh) * 2014-11-25 2015-03-11 深圳大学 一种基于移动智能终端的道路交通参数人工调查系统
CN104751650A (zh) * 2013-12-31 2015-07-01 中国移动通信集团公司 一种对道路交通信号进行控制的方法和设备
CN108407808A (zh) * 2018-04-23 2018-08-17 安徽车鑫保汽车销售有限公司 一种汽车行驶智能预测系统
CN109767632A (zh) * 2019-03-02 2019-05-17 太原理工大学 一种基于迭代学习与模型预测控制的交通信号混合控制方法
CN110221611A (zh) * 2019-06-11 2019-09-10 北京三快在线科技有限公司 一种轨迹跟踪控制方法、装置及无人驾驶车辆
EP3594920A1 (en) * 2018-07-09 2020-01-15 Siemens Mobility GmbH Method for generating a traffic control signal
EP3726497A1 (en) * 2019-04-15 2020-10-21 Zenuity AB Autonomous decisions in traffic situations with planning control

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200365015A1 (en) * 2016-12-19 2020-11-19 ThruGreen, LLC Connected and adaptive vehicle traffic management system with digital prioritization
CN107730884B (zh) * 2017-09-14 2020-04-14 华为技术有限公司 交通应用实例处理方法及交通控制单元
US11145197B2 (en) * 2019-03-13 2021-10-12 Mitsubishi Electric Research Laboratories, Inc. Joint control of vehicles traveling on different intersecting roads
CN110161853A (zh) * 2019-05-09 2019-08-23 大连海事大学 一种新型具有实时性的船舶综合自动驾驶系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6119112A (en) * 1997-11-19 2000-09-12 International Business Machines Corporation Optimum cessation of training in neural networks
WO2013143621A1 (en) * 2012-03-30 2013-10-03 Nec Europe Ltd. Method and system for adapting vehicular traffic flow
CN104751650A (zh) * 2013-12-31 2015-07-01 中国移动通信集团公司 一种对道路交通信号进行控制的方法和设备
CN104408919A (zh) * 2014-11-25 2015-03-11 深圳大学 一种基于移动智能终端的道路交通参数人工调查系统
CN108407808A (zh) * 2018-04-23 2018-08-17 安徽车鑫保汽车销售有限公司 一种汽车行驶智能预测系统
EP3594920A1 (en) * 2018-07-09 2020-01-15 Siemens Mobility GmbH Method for generating a traffic control signal
CN109767632A (zh) * 2019-03-02 2019-05-17 太原理工大学 一种基于迭代学习与模型预测控制的交通信号混合控制方法
EP3726497A1 (en) * 2019-04-15 2020-10-21 Zenuity AB Autonomous decisions in traffic situations with planning control
CN110221611A (zh) * 2019-06-11 2019-09-10 北京三快在线科技有限公司 一种轨迹跟踪控制方法、装置及无人驾驶车辆

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
城市快速路出口匝道区域建模与控制方法研究;饶劲超;《中国优秀博硕士学位论文全文数据库(硕士) 工程科技II辑》;20140915(第09期);第C034-326页 *

Also Published As

Publication number Publication date
CN112863179A (zh) 2021-05-28

Similar Documents

Publication Publication Date Title
CN112863179B (zh) 一种基于神经网络模型预测控制的路口信号灯控制方法
CN112419726B (zh) 一种基于交通流预测的城市交通信号控制系统
CN114038212B (zh) 基于双阶段注意力机制和深度强化学习的信号灯控制方法
CN110843789B (zh) 一种基于时序卷积网络的车辆换道意图预测方法
Khamis et al. Multi-objective traffic light control system based on Bayesian probability interpretation
CN114360266B (zh) 一种网联车探测状态感知的交叉口强化学习信号控制方法
Mehan Introduction of Trafc Light Controller with Fuzzy Control System
CN113053120B (zh) 基于迭代学习模型预测控制的交通信号灯调度方法与系统
CN113511222A (zh) 场景自适应式车辆交互行为决策与预测方法及装置
Wu et al. Traffic signal networks control optimize with PSO algorithm
De Oliveira et al. Optimization of traffic lights timing based on multiple neural networks
CN110021168B (zh) 一种车联网下实现实时智能交通管理的分级决策方法
Arora et al. Intelligent traffic light control system using morphological edge detection and fuzzy logic
CN112258856A (zh) 一种区域交通信号数据驱动控制模型建立方法
Wu et al. Deep Reinforcement Learning Based Traffic Signal Control: A Comparative Analysis
Joo et al. Reinforcement learning for traffic signal timing optimization
CN116258242A (zh) 一种自动驾驶车辆反应式轨迹预测方法及系统
Zang et al. An intelligent control method for urban traffic signal based on fuzzy neural network
Shahriar et al. Intersection traffic efficiency enhancement using deep reinforcement learning and V2X communications
KR102346507B1 (ko) 다중 교차로 환경에서의 강화학습 기반의 분산 교통 신호 제어 방법 및 장치
Zhou et al. A Sarsa (λ)-based control model for real-time traffic light coordination
Yu et al. Minimize pressure difference traffic signal control based on deep reinforcement learning
Moel et al. Analysis of intersection traffic light management system in Mandalay city
Wang et al. Efficiency and reliability analysis of self-adaptive two-stage fuzzy control system in complex traffic environment
Reda et al. Introduction to coordinated deep agents for traffic signal

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant