CN113053120A - 基于迭代学习模型预测控制的交通信号灯调度方法与系统 - Google Patents

基于迭代学习模型预测控制的交通信号灯调度方法与系统 Download PDF

Info

Publication number
CN113053120A
CN113053120A CN202110297263.3A CN202110297263A CN113053120A CN 113053120 A CN113053120 A CN 113053120A CN 202110297263 A CN202110297263 A CN 202110297263A CN 113053120 A CN113053120 A CN 113053120A
Authority
CN
China
Prior art keywords
control
traffic signal
traffic
iterative learning
loop
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110297263.3A
Other languages
English (en)
Other versions
CN113053120B (zh
Inventor
吕亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ningbo Liangkong Information Technology Co ltd
Original Assignee
Ningbo Liangkong Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ningbo Liangkong Information Technology Co ltd filed Critical Ningbo Liangkong Information Technology Co ltd
Priority to CN202110297263.3A priority Critical patent/CN113053120B/zh
Publication of CN113053120A publication Critical patent/CN113053120A/zh
Application granted granted Critical
Publication of CN113053120B publication Critical patent/CN113053120B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • G06F30/18Network design, e.g. design based on topological or interconnect aspects of utility systems, piping, heating ventilation air conditioning [HVAC] or cabling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • G08G1/0129Traffic data processing for creating historical data or processing based on historical data
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0137Measuring and analyzing of parameters relative to traffic conditions for specific applications
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/07Controlling traffic signals

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Geometry (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Computer Hardware Design (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种基于迭代学习模型预测控制的交通信号灯调度方法与系统,涉及智慧交通领域,所述方法包括以下步骤:步骤1、建立目标区域的交通流仿真模型;步骤2、根据控制策略获得一个固定时间区间的闭环数据;步骤3、将所述闭环数据作为后续的开环预测优化问题的终端条件进行预测控制。本发明首先从传统固定时间的交通信号灯调度策略开始,由迭代生成数据再去迭代,并使用之前的闭环数据获得最优交通流模式,并进一步基于一些仿真,证明本发明提出的利用历史迭代的闭环数据集作为当天预测控制优化问题的终端约束的迭代学习模型预测控制策略可以减少道路上车辆的排队时间,使车辆在交通网络中通行更快更畅通。

Description

基于迭代学习模型预测控制的交通信号灯调度方法与系统
技术领域
本发明涉及智慧交通领域,尤其涉及一种基于迭代学习模型预测控制的交通信号灯调度方法与系统。
背景技术
城市交通网络的拥堵会带来严重的污染和经济成本,交通灯管制是缓解交通拥堵的有效方法之一。交通灯调度是交通工程中的一个重要课题。对于城市交通网络来说,路段和路口总是遇到交通流量大的问题,给目前的交通管制策略带来麻烦。
目前,大多数信号交叉口都采用预定周期或固定时间区间控制信号灯的方法。该方法是根据以往观测到的交通需求,预先设定配时方案进行控制,这种方案无法对交通需求的随机变化进行及时的响应。而该领域现有的学习型模型预测控制方案,是通过收集所有前次迭代轨迹建立一个“安全性评估数据集”,由于这个集是由点组成的,终端集的凸性得不到保证,而终端成本和终端约束集的设立往往会导致混合整数二次规划(MIQP)问题。
因此,本发明基于存储转发模型(SFM)提出了一种基于迭代学习模型预测控制的交通信号灯调度方法与系统,改进了现有的基于模型的迭代学习预测控制技术中存在的混合整数二次规划(MIQP)问题,从而为解决城市交通的调度难题提供了一种更好的技术方案。
发明内容
本发明通过提供一种基于迭代学习模型预测控制的交通信号灯调度方法与系统,利用迭代学习预测控制(ILMPC)解决了城市交通信号灯控制问题,减少道路上车辆的排队时间,使车辆在交通网络中通行更快更畅通。从交通历史数据的分析中不难发现,在工作日和周末,人们的每天出行模式以及日常交通变化是重复的。一些研究数据也表明,交通规律确实存在于现实世界的交通网络中。本发明基于交通需求的重复性特征,并结合模型预测控制的滚动优化的动态控制特点,解决了城市交通信号灯控制中存在的MIQP问题。
为实现上述目的,本发明提供的一种基于迭代学习模型预测控制的交通信号灯调度方法,包括以下步骤:
步骤1、建立目标区域的交通流仿真模型;
步骤2、根据控制策略获得一个固定时间区间的闭环数据;
步骤3、将所述闭环数据作为后续的开环预测优化问题的终端条件进行预测控制。
进一步地,所述步骤1包括:
步骤1.1、建立绿灯时间约束,在每个交叉路口j,所有相位的绿灯时间必须满足下面约束:
Figure BDA0002984816460000021
Figure BDA0002984816460000022
其中,
Figure BDA0002984816460000023
是所述交叉路口j的一组相位集,uj是所述交叉路口j的所有相位的绿灯时长,l表示迭代学习的次数,Lj表示所述交叉路口j的总损失时间,G表示周期时长,
Figure BDA0002984816460000024
Figure BDA0002984816460000025
是相位时长的最小和最大边界;
步骤1.2、设
Figure BDA0002984816460000026
表示一组实数、非负实数、整数和非负整数,
Figure BDA0002984816460000027
表示集合
Figure BDA0002984816460000028
基于车辆守恒定律,路段传输模型,所有路段的交通流动态方程为:
Figure BDA0002984816460000029
其中,l表示迭代学习的次数,t表示采样时刻,
Figure BDA00029848164600000210
Figure BDA00029848164600000211
分别表示在采样时刻t,整个区域内所有车道组上的车辆数量、输出、相位时长以及路段上停车场出入口的车辆进出,维度n表示路段数乘以2,m表示交叉路口数乘以相位数,
Figure BDA00029848164600000212
是有适当维度的随时间变化的矩阵,包括饱和流率和转向比信息;
对所有
Figure BDA00029848164600000213
‖B(t,l)‖≤βB,‖d(t,l)‖≤βd,‖x(0,l)‖≤βx0
其中,T为每次迭代的数据采样时刻区间,界限βB≥0,βd≥0和βx0≥0为有限。
进一步地,对所有
Figure BDA00029848164600000214
Figure BDA00029848164600000215
其中,模型参数矩阵B(t)是我们将要学习的,对于城市设施没有变化、没有重大意外和事件等发生的常规工作日的最优交通流模式。注,如果交通模式发生变化,ILMPC将会根据收集到的数据开始学习这些变化,并实时补偿适应新模式。
在第l次迭代收集时间区间[0,T]内的闭环状态和相位时间并生成以下列向量:
x(l)=[x(t0,l),x(to+1,l),…,x(to+T,l),…], (4)
u(l)=[u(t0,l),x(t0+1,l),…,u(t0+T,l),…]. (5)
假设从任意可行的初始状态和输入轨迹x(l)和u(l)开始。这可以从一些简单的镇定控制方案(例如极点配置)进行构建。
定义
Figure BDA0002984816460000031
为优化二次代价函数,最优控制的目标是最大限度地减少交通网络每个路段上的车辆总数。
进一步地,引入超越性最优或平均最优的概念:
定义1:使得x∈S,假设一个控制序列u有对应状态轨迹x,则(xe,ue)被称为超越性最优,如果:
Figure BDA0002984816460000032
其中,x(t,l)=xe(t),μ表示任意可行的满足约束的控制律。
由定义1,如果一条数据序列(x,u)对应二次代价函数之和的下极限被任何其他轨迹的成本所超越,则此序列是最优的;如果最优值有限,则超越性最优被认为和通常最优的定义一致。同样地,也可以定义闭环轨迹产生最优性能;
定义2:使得x∈S,假设一个有对应状态轨迹x的控制序列u,则所述方法是在(xe,ue)上的最优运行,如果:
Figure BDA0002984816460000033
其中,μ表示任意可行的满足约束的控制律。
将模型预测控制与迭代学习控制相结合解决下列开环最优控制问题:
Figure BDA0002984816460000034
s.t.
Figure BDA0002984816460000035
满足约束(1),(2),k=0,1,…,N-1,
Figure BDA0002984816460000036
Figure BDA0002984816460000037
Figure BDA0002984816460000038
Figure BDA0002984816460000041
在第l次迭代的每个采样时刻,选择一个N=N*(t),使得上述优化问题对特定的
Figure BDA0002984816460000042
可行。
在每个采样时刻求解所述开环最优控制问题可以导出一个从时间t到时间t+N-1最优控制律的唯一序列,表述为:
Figure BDA0002984816460000043
其中,最优代价函数为:
Figure BDA0002984816460000044
通过将最优控制序列
Figure BDA0002984816460000045
的第一个向量
Figure BDA0002984816460000046
应用于交通信号灯系统规划各个交通灯的相位时长,并根据下一采样时刻状态再次求解优化问题(6),计算下一个采样时刻后的相位时长。
由于系统动态矩阵随时间变化,MPC控制律将表示为:
Figure BDA0002984816460000047
所述MPC控制律也随时间变化,闭环系统可表述为:
x(t+1,l)=x(t,l)+B(t,l)μ(t,x(t,l),l)+d(t,l), (8)
yμ(t,l)=Cx(t,l)+Dμ(t,x(t),l). (9)
本发明还提供了一种应用权利要求1~9中任一项所述的调度方法的交通信号灯调度系统,包括:建模模块、数据采集模块、预测控制模块;其中,所述建模模块负责建立目标区域的交通流仿真模型;所述数据采集模块根据控制策略获得一个固定时间区间的闭环数据;所述预测控制模块将所获得的所述闭环数据作为后续的开环优化问题的终端条件进行预测控制。
本发明提供的一种基于迭代学习模型预测控制的交通信号灯调度系统至少具有以下技术效果:
1、本发明提供了一种迭代学习模型预测控制(ILMPC)策略基于存储转发模型(SFM)构建交通系统模型,利用迭代学习MPC解决了交通控制问题;
2、本发明首先从传统的固定时间的交通信号灯调度策略开始,从迭代生成数据再去迭代,并使用以前的闭环数据获得最优交通流模式,并进一步基于一些仿真,证明本发明提出的迭代学习模型预测控制策略采用二次成本,以最大限度地减少交通网络中每个路段上的车辆总数作为最优控制的目标;
3、本发明利用从ILMPC设置中先前迭代的闭环轨迹中获得的一个终端约束就可以实现最优的交通流,并优化交通网络性能。
以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。
附图说明
图1是本发明的算法实施例的工作流程图;
图2是本发明的算法实施例的迭代学习过程示意图。
具体实施方式
以下参考说明书附图介绍本发明的多个优选算法执行的过程,使其技术内容更加清楚和便于理解。本发明可以通过许多不同形式的算法来得以体现,本发明的保护范围并非仅限于文中提到的算法。
如图1所示,为本发明提供的一种基于迭代学习模型预测控制的交通信号灯调度方法的工作流程图。具体来说,该方法包括以下步骤:
步骤1、建立目标区域的交通流仿真模型;
步骤2、根据控制策略获得一个固定时间区间的闭环数据;
步骤3、将闭环数据作为后续的开环预测优化问题的终端条件进行预测控制。
在时间t0,用ave[y(t),t0]表示渐近平均集:
Figure BDA0002984816460000051
考虑某交叉路口j∈J,其中J为城市交通区域内交叉路口的集合,并采用存储转发模型(SFM),或在每个路口指定每个路段的车辆数量。假设在某些区域内城市交通网络作为交通系统,以及每个交叉路口被作为子系统。
其中,步骤1包括:
步骤1.1、建立绿灯时间约束,在每个交叉路口j,所有相位的绿灯时间必须满足下面约束:
Figure BDA0002984816460000052
Figure BDA0002984816460000053
其中,
Figure BDA0002984816460000054
是交叉路口j的一组相位集,uj是交叉路口j的所有相位的绿色时长,l表示迭代学习的次数,Lj表示交叉路口j的总损失时间,G表示周期时长,
Figure BDA0002984816460000055
Figure BDA0002984816460000056
是相位时长的最小和最大边界;
步骤1.2、基于车辆守恒定律,路段传输模型,所有路段的交通流动态方程为:
Figure BDA0002984816460000061
其中,l表示迭代学习的次数,
Figure BDA0002984816460000062
分别表示在采样时刻t上整个区域内所有车道组上的车辆数量、输出、相位时长以及干扰(包括路段上停车场出入口的车辆进出),维度n表示路段数乘以2,m表示交叉路口数乘以相位数,
Figure BDA0002984816460000063
是有适当维度的随时间变化的矩阵,包括饱和流率和转向比信息;
对所有
Figure BDA0002984816460000064
‖B(t,l)‖≤βB,‖d(t,l)‖≤βd,‖x(0,l)‖≤βx0
T为每次迭代的数据采样时刻区间,界限βB≥0,βd≥0和βx0≥0是有限的。
对所有
Figure BDA0002984816460000065
Figure BDA0002984816460000066
模型参数矩阵B(t)是我们将要学习的,对于在城市设施没有变化、没有重大意外和事件等发生的常规工作日的最优交通流模式。注,如果交通模式发生变化,ILMPC将会根据收集到的数据开始学习这些变化,并实时补偿适应新模式。
在第l次迭代收集时间区间[0,T]内的闭环状态和相位时间并生成以下列向量:
x(l)=[x(t0,l),x(to+1,l),…,x(to+T,l),…], (4)
u(l)=[u(t0,l),x(t0+1,l),…,u(t0+T,l),…]. (5)
假设从任意可行的初始状态和输入轨迹x(l)和u(l)开始,这可以从一些简单的镇定控制方案(例如极点位置)进行构建。
定义
Figure BDA0002984816460000067
为优化二次代价函数,最优控制的目标是最大限度地减少交通网络每个路段上的车辆总数。
本发明的目标是综合一种最优控制律,解决当系统存在约束时,极难解决的无穷时域最优控制问题。系统(1)-(3)每次迭代的交通流动态是时变的,使得变化的动态不仅沿时间轴,而且沿迭代轴变化,这使得问题更加复杂。
另外,无穷时域最优控制问题中的目标函数不是必需有限的。对于系统动态(3),可以是∞和-∞。因此,很难最优地去对一个对无限时域的最优控制序列进行判定。因为从长远来看,可能会发生每次迭代都趋于无穷,然后很难比较迭代到迭代的改进的最优性。
为此,引入超越性最优或平均最优的概念:
定义1:使得x∈S,假设一个控制序列u有对应状态轨迹x,则(xe,ue)被称为超越性最优,如果:
Figure BDA0002984816460000071
其中,x(t,l)=xe(t)。μ表示任意可行的满足约束的控制律。
由定义1,如果一条数据序列(x,u)对应二次代价函数之和的下极限被任何其他轨迹的成本所超越,则此序列是最优的;如果最优值有限,则超越性最优被认为和通常最优的定义一致。同样地,也可以定义闭环轨迹产生最优性能;
定义2:使得x∈S,假设一个有对应状态轨迹x的控制序列u,则称该方法是在(xe,ue)上的最优运行,如果:
Figure BDA0002984816460000072
其中,μ表示任意可行的满足约束的控制律。
需要注意,定义1跟定义2唯一的不同在于,在定义2中,初始状态可以给定一个不同的值。
下面开始迭代学习MPC公式,将模型预测控制与迭代学习控制相结合解决下列开环最优控制问题:
Figure BDA0002984816460000073
s.t.,
Figure BDA0002984816460000074
满足约束(1),(2),k=0,1,…,N-1,
Figure BDA0002984816460000075
Figure BDA0002984816460000076
Figure BDA0002984816460000077
Figure BDA0002984816460000078
在第l次迭代的每个时刻,选择一个N=N*(t),使得上述优化问题对特定的
Figure BDA0002984816460000079
可行。
其中,在每个采样时刻求解所述开环最优控制问题可以导出一个从时间t到时间t+N-1最优控制律的唯一序列,表述为:
Figure BDA0002984816460000081
由于每次迭代的初始状态有所不同,记做
Figure BDA0002984816460000082
由于预测控制固有的鲁棒性,上述开环最优控制问题是可行的,否则,我们可以增加范围长度N,以获得x(T+N,l-1)的一个可行解。
其中,最优(有限范围)代价函数为:
Figure BDA0002984816460000083
与相应的无限范围代价函数相比,该函数表示为:
Figure BDA0002984816460000084
通过将最优控制序列
Figure BDA0002984816460000085
的第一个向量
Figure BDA0002984816460000086
应用于交通信号灯系统规划各个交通灯的相位时长,并根据下一采样时刻状态再次求解优化问题(6),计算下一个采样时刻后的相位时长。
由于系统动态随时间变化,MPC控制律将表示为:
Figure BDA0002984816460000087
MPC控制律也随时间变化,闭环系统可表述为:
x(t+1,l)=x(t,l)+B(t,l)μ(t,x(t,l),l)+d(t,l) (8)
yμ(t,l)=Cx(t,l)+Dμ(t,x(t),l) (9)
定理1:根据ILMPC控制器
Figure BDA0002984816460000088
考虑交通流动态系统与开环最优控制中的N=N*(t),如果初始可行状态和控制序列在S中可行,那么,ILMPC控制器在每次迭代
Figure BDA0002984816460000089
上,对所有
Figure BDA00029848164600000810
都是迭代递归可行的。
由假设3,开环最优控制问题容许一个初始可行的解,即ILMPC在每次迭代
Figure BDA00029848164600000811
Figure BDA00029848164600000812
在时刻t=0是可行的。
如图2所示,为本发明的一个算法实施例的迭代学习过程示意图,具体包括如下步骤:
步骤一:在MATLAB中打开真实路网界面;
步骤二:用预先设定的系统设置初始化真实路网;
步骤三:在真实路网中开始仿真,在每次时间间隔将收集的数据传输回MATLAB;
步骤四:在MATLAB中收集数据,并为下一个完整交通信号循环计算交通信号;
步骤五:再由MATLAB将交通信号设置传输回真实路网,同时,真实路网继续仿真;
步骤六:MATLAB为下个循环记录数据;
步骤七:如果迭代终止,真实路网收集数据并计算性能表现;否则,转到步骤三。
以上详细描述了本发明的具体算法实施例。凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

Claims (10)

1.一种基于迭代学习模型预测控制的交通信号灯调度方法,其特征在于,所述方法包括以下步骤:
步骤1、建立目标区域的交通流仿真模型;
步骤2、根据控制策略获得一个固定时间区间的闭环数据;
步骤3、将所获得的闭环数据作为后续的开环优化问题的终端条件进行预测控制。
2.如权利要求1所述的基于迭代学习模型预测控制的交通信号灯调度方法,其特征在于,所述步骤1包括:
步骤1.1、建立绿灯时间约束,在每个交叉路口j,所有相位的绿灯时间必须满足下面约束:
Figure FDA0002984816450000011
Figure FDA0002984816450000012
其中,
Figure FDA0002984816450000013
是所述交叉路口j的一组相位集,uj是所述交叉路口j的所有相位的绿灯时长,t表示采样时刻,l表示迭代学习的次数,Lj表示所述交叉路口j的总损失时间,G表示周期时长,
Figure FDA0002984816450000014
Figure FDA0002984816450000015
是相位时长的最小和最大边界;
步骤1.2、设
Figure FDA0002984816450000016
表示一组实数、非负实数、整数和非负整数,
Figure FDA0002984816450000017
表示集合
Figure FDA0002984816450000018
基于车辆守恒定律,路段传输模型,所有路段的交通流动态方程为:
Figure FDA0002984816450000019
其中,l表示迭代学习的次数,t表示采样时刻,
Figure FDA00029848164500000110
Figure FDA00029848164500000111
分别表示在采样时刻上整个区域内所有车道组上的车辆数量、输出、相位时长以及干扰(包括路段上停车场出入口的车辆进出),维度n表示路段数乘以2,m表示交叉路口数乘以相位数,
Figure FDA00029848164500000112
是有适当维度的随时间变化的矩阵,包括饱和流率和转向比信息。
3.如权利要求2所述的基于迭代学习模型预测控制的交通信号灯调度方法,其特征在于,对所有
Figure FDA0002984816450000021
||B(t,l)||≤βB,||d(t,l)||≤βd,||x(0,l)||≤βx0
其中,T为每次迭代的数据采样时刻区间,界限βB≥0,βd≥0和βx0≥0是有限的。
4.如权利要求3所述的基于迭代学习模型预测控制的交通信号灯调度方法,其特征在于,对所有
Figure FDA0002984816450000022
Figure FDA0002984816450000023
其中,B(t)是最优交通流模式。
5.如权利要求4所述的基于迭代学习模型预测控制的交通信号灯调度方法,其特征在于,在第l个迭代收集时间区间[0,T]内的闭环状态和相位时间并生成以下列向量:
x(l)=[x(t0,l),x(t0+1,l),…,x(t0+T,l),…], (4)
u(l)=[u(t0,l),x(t0+1,l),…,u(t0+T,l),…]. (5)
假设从任意可行的初始状态和输入轨迹x(l)和u(l)开始。
6.如权利要求5所述的基于迭代学习模型预测控制的交通信号灯调度方法,其特征在于,定义
Figure FDA0002984816450000024
为优化二次代价函数,最优控制的目标是最大限度地减少交通网络中每个路段上的车辆总数。
7.如权利要求6所述的基于迭代学习模型预测控制的交通信号灯调度方法,其特征在于,引入超越性最优或平均最优的概念:
定义1:使得x∈S,假设一个控制序列u有对应状态轨迹x,则(xe,ue)被称为超越性最优,如果:
Figure FDA0002984816450000025
其中,x(t,l)=xe(t),μ表示任意可行的满足约束的控制律;
由定义1,如果一条数据序列(x,u)对应二次代价函数之和的下极限被任何其他轨迹的成本所超越,则此序列是最优的;如果最优值有限,则超越性最优被认为和通常最优的定义一致;同样地,也可以定义闭环轨迹产生最优性能;
定义2:使得x∈S,假设一个有对应状态轨迹x的控制序列u,则称所述方法是在(xe,ue)上的最优运行,如果:
Figure FDA0002984816450000031
其中,μ表示任意可行的满足约束的控制律;
注:所述定义1和所述定义2中唯一的不同在于,在所述定义2中,初始状态可以给定一个不同的值。
8.如权利要求7所述的基于迭代学习模型预测控制的交通信号灯调度方法,其特征在于,将模型预测控制与迭代学习控制相结合解决下列开环最优控制问题:
Figure FDA0002984816450000032
s.t.
Figure FDA0002984816450000033
满足约束(1),(2),k=0,1,...,N-1,
Figure FDA0002984816450000034
Figure FDA0002984816450000035
Figure FDA0002984816450000036
Figure FDA0002984816450000037
在第l次迭代的每个采样时刻,选择一个N=N*(t),使得上述优化问题对特定的
Figure FDA0002984816450000038
可行。
9.如权利要求8所述的基于迭代学习模型预测控制的交通信号灯调度方法,其特征在于,在每个采样时刻求解所述开环最优控制问题可以导出一个从时间t到时间t+N-1的最优控制律的唯一序列,表述为
Figure FDA0002984816450000039
Figure FDA00029848164500000310
其中,最优代价函数为:
Figure FDA00029848164500000311
通过将最优控制序列
Figure FDA00029848164500000312
的第一个向量
Figure FDA00029848164500000313
应用于交通信号灯系统规划各个交通灯的相位时长,并根据下一采样时刻状态再次求解优化问题(6),计算下一个采样时刻后的相位时长。
10.一种应用权利要求1~9中任一项所述的调度方法的交通信号灯调度系统,其特征在于,包括:建模模块、数据采集模块、预测控制模块;
其中,所述建模模块负责建立目标区域的交通流仿真模型;所述数据采集模块根据控制策略获得一个固定时间区间的闭环数据;所述预测控制模块将所获得的所述闭环数据作为后续的开环优化问题的终端条件进行预测控制。
CN202110297263.3A 2021-03-19 2021-03-19 基于迭代学习模型预测控制的交通信号灯调度方法与系统 Active CN113053120B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110297263.3A CN113053120B (zh) 2021-03-19 2021-03-19 基于迭代学习模型预测控制的交通信号灯调度方法与系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110297263.3A CN113053120B (zh) 2021-03-19 2021-03-19 基于迭代学习模型预测控制的交通信号灯调度方法与系统

Publications (2)

Publication Number Publication Date
CN113053120A true CN113053120A (zh) 2021-06-29
CN113053120B CN113053120B (zh) 2022-03-22

Family

ID=76514267

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110297263.3A Active CN113053120B (zh) 2021-03-19 2021-03-19 基于迭代学习模型预测控制的交通信号灯调度方法与系统

Country Status (1)

Country Link
CN (1) CN113053120B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113538910A (zh) * 2021-07-14 2021-10-22 李丹丹 一种自适应的全链条城市区域网络信号控制优化方法
CN114973660A (zh) * 2022-05-13 2022-08-30 黄河科技学院 一种模型线性化迭代更新法的交通决策方法
CN115116225A (zh) * 2022-06-23 2022-09-27 上海交通大学 一种面向混合交通流的数据驱动随机模型预测控制方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108538065A (zh) * 2018-04-24 2018-09-14 浙江工业大学 一种基于自适应迭代学习控制的城市主干道协调控制方法
CN108648446A (zh) * 2018-04-24 2018-10-12 浙江工业大学 一种基于mfd的路网交通信号迭代学习控制方法
US20200285209A1 (en) * 2019-03-06 2020-09-10 Mitsubishi Electric Research Laboratories, Inc. System and Method for Data-Driven Control of Constrained System
CN111951574A (zh) * 2020-07-29 2020-11-17 太原理工大学 衰减记忆去伪控制的交通信号自适应迭代学习控制方法
US20210043074A1 (en) * 2019-08-08 2021-02-11 At&T Intellectual Property I, L.P. Apparatus and method to facilitate an iterative, machine learning based traffic classification

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108538065A (zh) * 2018-04-24 2018-09-14 浙江工业大学 一种基于自适应迭代学习控制的城市主干道协调控制方法
CN108648446A (zh) * 2018-04-24 2018-10-12 浙江工业大学 一种基于mfd的路网交通信号迭代学习控制方法
US20200285209A1 (en) * 2019-03-06 2020-09-10 Mitsubishi Electric Research Laboratories, Inc. System and Method for Data-Driven Control of Constrained System
US20210043074A1 (en) * 2019-08-08 2021-02-11 At&T Intellectual Property I, L.P. Apparatus and method to facilitate an iterative, machine learning based traffic classification
CN111951574A (zh) * 2020-07-29 2020-11-17 太原理工大学 衰减记忆去伪控制的交通信号自适应迭代学习控制方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
黄青青: "《基于宏观基本图的城市路网交通信号迭代学习控制方法研究》", 《中国优秀硕士学位论文全文数据库》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113538910A (zh) * 2021-07-14 2021-10-22 李丹丹 一种自适应的全链条城市区域网络信号控制优化方法
CN114973660A (zh) * 2022-05-13 2022-08-30 黄河科技学院 一种模型线性化迭代更新法的交通决策方法
CN114973660B (zh) * 2022-05-13 2023-10-24 黄河科技学院 一种模型线性化迭代更新法的交通决策方法
CN115116225A (zh) * 2022-06-23 2022-09-27 上海交通大学 一种面向混合交通流的数据驱动随机模型预测控制方法
CN115116225B (zh) * 2022-06-23 2023-08-04 上海交通大学 一种面向混合交通流的数据驱动随机模型预测控制方法

Also Published As

Publication number Publication date
CN113053120B (zh) 2022-03-22

Similar Documents

Publication Publication Date Title
CN113053120B (zh) 基于迭代学习模型预测控制的交通信号灯调度方法与系统
CN109559530B (zh) 一种基于q值迁移深度强化学习的多交叉口信号灯协同控制方法
CN112700664B (zh) 一种基于深度强化学习的交通信号配时优化方法
CN110032782B (zh) 一种城市级智能交通信号控制系统及方法
CN110570672B (zh) 一种基于图神经网络的区域交通信号灯控制方法
CN113538910B (zh) 一种自适应的全链条城市区域网络信号控制优化方法
CN106355905A (zh) 一种基于卡口数据的高架信号控制方法
Krzysztof The importance of automatic traffic lights time algorithms to reduce the negative impact of transport on the urban environment
Spall et al. A model-free approach to optimal signal light timing for system-wide traffic control
Jiang et al. A distributed multi-agent reinforcement learning with graph decomposition approach for large-scale adaptive traffic signal control
CN114360266A (zh) 一种网联车探测状态感知的交叉口强化学习信号控制方法
CN111341109B (zh) 一种基于时空相似性的城市级信号推荐系统
Song et al. Traffic signal control under mixed traffic with connected and automated vehicles: a transfer-based deep reinforcement learning approach
CN113299078A (zh) 一种基于多智能体协作的多模式交通干线信号协调控制方法及装置
CN113392577B (zh) 一种基于深度强化学习的区域边界主交叉口信号控制方法
CN109615885A (zh) 一种智能交通信号控制方法、装置及系统
CN115331460B (zh) 一种基于深度强化学习的大规模交通信号控制方法及装置
Chen et al. Traffic signal optimization control method based on adaptive weighted averaged double deep Q network
CN115063988B (zh) 一种应急车辆优先的跨交通子区信号协同控制方法
Dabiri et al. Personalised optimal speed advice to cyclists approaching an intersection with uncertain green time
CN109686086A (zh) 模糊控制网络的训练、生成路口建议速度的方法及装置
CN115547050A (zh) 一种基于马尔科夫决策过程的智能交通信号控制优化方法、软件
Shahriar et al. Intersection traffic efficiency enhancement using deep reinforcement learning and V2X communications
Xu et al. Research on Optimization of Intersection Signal Control Based on Traffic Flow Forecasting
Bi et al. Single intersection signal control based on Type-2 fuzzy logic

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 315199 room 510-511, building 1, science and technology building, No. 298, bachelor Road, Shounan street, Yinzhou District, Ningbo City, Zhejiang Province

Applicant after: Ningbo liangkong Information Technology Co.,Ltd.

Address before: 315199 Room 101, building 1, science and technology building, 298, bachelor Road, Shounan street, Yinzhou District, Ningbo City, Zhejiang Province

Applicant before: Ningbo liangkong Information Technology Co.,Ltd.

GR01 Patent grant
GR01 Patent grant