CN106935033A - 快速路交通系统的迭代动态线性化及自学习控制方法 - Google Patents
快速路交通系统的迭代动态线性化及自学习控制方法 Download PDFInfo
- Publication number
- CN106935033A CN106935033A CN201710292710.XA CN201710292710A CN106935033A CN 106935033 A CN106935033 A CN 106935033A CN 201710292710 A CN201710292710 A CN 201710292710A CN 106935033 A CN106935033 A CN 106935033A
- Authority
- CN
- China
- Prior art keywords
- traffic
- street
- model
- section
- expressway
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000013499 data model Methods 0.000 claims abstract description 24
- 230000007480 spreading Effects 0.000 claims abstract description 12
- 230000006870 function Effects 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 5
- 238000005070 sampling Methods 0.000 claims description 3
- 230000008859 change Effects 0.000 abstract description 13
- 238000013461 design Methods 0.000 abstract description 7
- 230000008569 process Effects 0.000 abstract description 5
- 238000005516 engineering process Methods 0.000 abstract description 3
- 230000001419 dependent effect Effects 0.000 abstract description 2
- 238000004088 simulation Methods 0.000 description 4
- 241000351238 Alinea Species 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 206010039203 Road traffic accident Diseases 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000010415 tropism Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0137—Measuring and analyzing of parameters relative to traffic conditions for specific applications
- G08G1/0145—Measuring and analyzing of parameters relative to traffic conditions for specific applications for active traffic flow control
Abstract
本发明涉及快速路交通控制技术领域,具体涉及一种快速路交通系统的迭代动态线性化及自学习控制方法,包括以下步骤:(1)建立快速路交通系统的空间离散交通模型;(2)将所述空间离散交通流模型用一般非线性离散时间系统的形式表示;(3)将一般非线性离散时间模型转化为动态线性化数据模型;(4)建立动态线性化数据模型的学习控制律和参数更新律。本发明所提出的LDM‑AILC方法能够处理非线性系统,并且无需已知线性参数的结构,它是一种数据驱动的控制方法,控制器的设计和分析只取决于I/O数据。此外,在具有随机初始状态和迭代变化跟踪目标的非严格可重复条件下,所提出的LDM‑AILC方法仍然能够获得完全跟踪性能。
Description
技术领域
本发明涉及快速路交通控制技术领域,具体涉及一种快速路交通系统的迭代动态线性化及自学习控制方法。
背景技术
快速路交通控制是交通工程和智能交通系统中的一个重要领域。高峰期高速公路的频繁拥堵使交通状况恶化。造成快速路拥堵最常见的原因包括:交通需求大于设计能力、交通事故、道路工程和天气状况。为了更好地发挥快速路的性能,入口匝道是普遍采用的策略。入口匝道控制的目的是为了调节在其入口匝道处进入快速路主道的交通量,保证在下游干线快速路上保持期望(或最优)的车流量,使得快速路通行能力达到最大化。实际中,可在入口匝道处,通过交通监测装置和信号配时装置对进入的汽车数量进行统计检测和控制。
目前,基于局部和协调反馈的ALINEA入口匝道策略已成功应用到快速路交通系统控制中。它已被证明是一种非常简单,高效且方便实现的入口匝道控制方法。然而,该方法难以校准影响系统性能的关键模型参数,因为模型参数会随着道路条件的几何结构和环境因素,如雨水或者雾天而有所不同。此外,快速路交通流系统是强非线性、耦合且不确定的,因此其准确的模型在实际中很难得到。所以,将常见的基于模型的控制方法应用于快速路交通控制问题时,常会遇到很多意想不到的困难。
另一方面,宏观交通流模式一般都是每天重复的。例如,交通流将从午夜开始并逐渐增加至第一个高峰即早高峰,通常从上午7点到9点,第二个高峰从下午5点到7点。拥堵通常每天在同一位置开始。迭代学习控制(ILC)非常适合处理重复过程的控制问题。在前期的研究中,有学者提出了一些基于入口匝道策略的ILC方法,并已经应用于快速路一天或一周的密度控制中。在文献“Freeway traffic control using iterative learning control-based ramp metering and speed signaling”中,讨论了基于ILC的入口匝道和速度控制。在文献“An iterative learning approach for density control of freeway trafficflow via ramp metering”中,研究了以互补方式与纯误差反馈相结合的学习机制,仿真结果证明了基于ILC的优越性。文献“A complementary modularized ramp meteringapproach based on iterative learning control and ALINEA”,通过使用基于ILC的入口匝道策略和基于ILC和ALINEA相结合的互补入口匝道策略来对输入饱和进行研究。在文献“Iterative learning control of freeway flow via ramp metering andsimulation on PARAMICS”和文献“Flow based local ramp metering using iterativelearning and PARAMICS platform”中,进一步评估了基于ILC的入口匝道控制的有效性。
需要注意的是,上述用于入口匝道控制的ILC方法都是基于压缩映射和固定点理论设计的线性迭代学习算法,这在实际应用中会存在两个主要的限制。第一个限制是,由于跟踪误差的收敛性是基于λ范数获得的,有时沿迭代轴系统输出的瞬态响应性能变差。第二个限制是相同初始状态及相同参考轨迹必须匹配才能获得完全跟踪。
日复一日的严格重复性是一种理想的交通控制情况。实际中,由于快速路的道路条件和环境因素,例如雨水和雾天,使得交通流密度和车辆平均速度的初始值,以及跟踪目标每天都是变化的。因此,研究非严格重复模式的具有随机初始条件和迭代变化的期望密度轨迹的快速路交通系统的ILC方法是具有一定意义的。
目前,自适应迭代学习控制(AILC)方案得到了广泛研究,并且有许多成功的案例。在一般情况下,AILC最具有吸引力的优点是其处理迭代变化的参考轨迹的能力,并且这些参考轨迹是有界但可能具有大的随机初始重置误差以及干扰等问题。然而,大多数现有的AILC依赖于这样一个事实,即未知参数被已知非线性函数线性参数化,由于宏观交通流模型具有强非线性,因此不能直接用于快速路交通控制问题中。
最近,神经网络或模糊系统已被应用到了AILC中,以解决非线性系统无法线性参数化的问题。然而,通常难以确定模糊规则库和隶属度函数,并且用大量的操作数据训练神经网络也比较困难。最近,有学者通过将动态线性化方法引入到迭代域,提出了针对一般非线性离散时间系统的一种数据驱动的无模型自适应ILC。它实现了随机初始条件下的完全跟踪,并且不需要任何外部测试信号或训练过程。但是,目标跟踪轨迹必须是严格重复的。
受上述讨论的启发,通过引入伪偏导数(PPD)的新概念,针对快速路交通系统提出了一种新的等价的动态线性化方法。进一步,提出了一种基于快速路交通系统的迭代动态线性化的自学习控制方法(Linear Data-model based Adaptive ILC,LDM-AILC),通过匝道调节对快速路交通流密度进行控制。
发明内容
本发明的目的是提出了一种新的快速路交通系统的迭代动态线性化及自学习控制方法,通过匝道调节对快速路交通流密度进行控制。
为了实现上述目的,本发明采用如下技术方案,快速路交通系统的迭代动态线性化及自学习控制方法,包括以下步骤:
(1)建立快速路交通系统的空间离散交通模型;
(2)将所述空间离散交通流模型用一般非线性离散时间系统的形式表示;
(3)将一般非线性离散时间模型转化为动态线性化数据模型;
(4)建立动态线性化数据模型的学习控制律和参数更新律。
进一步地,所述步骤(1)中所述快速路交通系统假设包括一条单车道的快速路,每一区段均有一个入口匝道和一个出口匝道,则所述快速路的空间离散交通流模型为:
qi(t)=ρi(t)vi(t), (2)
其中h是采样时间间隔;t是指第t个时刻;i∈{1,Λ,IN}是指快速路的第i个区段;IN是总的区段数;τ,υ,κ,l,m为常数参数;ρi(t)表示快速路第i个区段第t个时刻的交通流密度;vi(t)表示快速路第i个区段第t个时刻的平均速度;qi(t)表示快速路第i个区段第t个时刻的交通流量;ri(t)表示快速路第i个区段第t个时刻的入口匝道交通流率;si(t)表示快速路第i个区段第t个时刻的出口匝道交通流率;Li表示快速路第i个区段的长度,Vfree表示快速路第i个区段的自由速度,ρjam表示最大密度。
进一步地,将所述空间离散交通流模型转化为一般非线性形式为:
y(t+1)=f[y(t),r(t),d(t)], (5)
其中,状态向量y(t)∈Rn包括所有交通密度、平均速度以及匝道序列;控制向量r(t)∈Rn包括所有可控匝道流率;干扰向量d(t)∈Rn包括所有入口匝道的需求和转弯速度;f(Λ)∈Rn是向量值函数。
进一步地,所述步骤(3)中将一般非线性离散时间模型转化为动态线性化数据模型,需要设定非线性数据模型满足以下2个假设:
假设1:f(Λ)关于控制向量r(t)的偏导数连续;
假设2:非线性数据模型满足广义Lipschitz条件,即对任意固定的t和||Δr(t)||≠0,有
其中,Δy(t+1)=y(t+1)-y(t),Δr(t+1)=r(t)-r(t-1);是一个正常数;
则可得,对于任意的时刻t一定存在一个被称为PPD矩阵的参数使得非线性数据模型能够转化为以下等价的动态线性化数据模型,
Δy(t+1)=Φ(t)Δr(t) (6)
其中,Φ(t)∈Rn×n且||Φ(t)||≤bΦ。
进一步地,所述步骤(5)中建立动态线性化数据模型的学习控制律和参数更新律的步骤为:
(51)设动态线性化数据模型满足假设3,同时设定快速路交通系统在有限的运行时间间隔t内重复,是严格重复的;
假设3:PPD参数矩阵是正定或者非负定;
(52)设期望交通输出为yd,k(t)∈Rn,对于所有的t∈{0,1,∧,T},k=1,2,∧,yd,k(t)是迭代相关且有界的,即
其中,byd为正常数且存在;
(53)定义跟踪误差ek(t)=yd,k(t)-yk(t),则
ek(t+1)=yd,k(t+1)-yk(t)-Φ(t)Δrk(t)=Φ(t)(Φ(t)-1yd,k(t+1)-Φ(t)-1yk(t)-Δrk(t)) (9)
令
ek(t+1)=Φ(t)[Θ(t)ζk(t)-Δrk(t)] (10)
其中,ζk(t)=yd,k(t+1)-yk(t)∈Rn,Θ(t)=Φ(t)-1∈Rn×n;
(54)则可得第k次的学习控制律可表述为:
其中,是Θ(t)的估计值。它的参数更新律为
其中,是给定有界的;c>0;0<abΦ<2,P=In×n是单位阵。
本发明所提出的LDM-AILC方法能够处理非线性系统,并且无需已知线性参数的结构,它是一种数据驱动的控制方法,控制器的设计和分析只取决于I/O数据。此外,在具有随机初始状态和迭代变化跟踪目标的非严格可重复条件下,所提出的LDM-AILC方法仍然能够获得完全跟踪性能。因此,在实践中更适合于具有更高阶、强非线性和非严格可重复条件的这种典型的复杂快速路交通控制系统。理论分析和仿真结果均证实了所提方法的有效性。并且本发明的方法具有以下优点:
(1)本发明的快速路交通系统的迭代动态线性化方法,与以前的方法相比,不需要模型且完全等价;
(2)本发明的方法是基于数据驱动的,是利用以前重复的信息来更新当前的操作,与人的经验学习类似;
(3)本发明的方法不需要要求系统每天从同一个初始点开始运行;
(4)本发明的方法在每天的期望密度和期望速度有所改变时,也可以应用。
附图说明
图1是具有入口/出口匝道的快速路各区段描述;
图2是迭代变化的期望交通密度分布图;
图3是初始交通密度迭代100次的变化图;
图4是在时间间隔t∈{0,Λ,500}内的最大跟踪误差变化图。
具体实施方式
下面结合附图和实施例对本发明作进一步的说明。
如图1所示,快速路交通系统包括一个单车道的快速路,每一区段都有一个入口匝道和一个出口匝道。它的空间离散交通流模型如下(1)-(4)式所示。
qi(t)=ρi(t)vi(t), (2)
其中,h是采样时间间隔;t是指第t个时刻,t∈{0,1,∧,T};i∈{1,∧,IN}是指快速路的第i个区段;IN是总的区段数;τ,v,k,l,m为常数参数;ρi(t)表示快速路第i个区段第t个时刻的交通流密度;vi(t)表示快速路第i个区段第t个时刻的平均速度;qi(t)表示快速路第i个区段第t个时刻的交通流量;ri(t)表示快速路第i个区段第t个时刻的入口匝道交通流率;si(t)表示快速路第i个区段第t个时刻的出口匝道交通流率;Li表示快速路第i个区段的长度,Vfree表示快速路第i个区段的自由速度,ρjam表示最大密度。
假设快速路交通系统在有限的时间间隔t={0,1,Λ,T}内重复运行。控制目标是设计一种不需要已知确切的交通流模型和干扰情况的自适应ILC方法。自适应ILC将利用历史的快速路交通数据来产生控制输入序列,以使得交通密度在整个区间t={0,1,Λ,T}上收敛到期望值。
根据(1)–(4)式,将所述空间离散交通流模型用一般非线性离散时间形式表示为:
y(t+1)=f[y(t),r(t),d(t)], (5)
其中,状态向量y(t)∈Rn包含所有交通密度、平均速度以及匝道序列;控制向量r(t)∈Rn包括所有可控匝道流率;干扰向量d(t)∈Rp包含所有入口匝道的需求和转弯速度;f(Λ)∈Rn是向量值函数。
假设1:f(Λ)关于控制输入r(t)的偏导数连续。
假设2:非线性数据模型满足广义Lipschitz条件,即对任意固定的t和||Δr(t)||≠0,有
||Δy(t+1)||≤bΦ||Δr(t)||
其中,Δy(t+1)=y(t+1)-y(t),Δr(t)=r(t)-r(t-1);bΦ是一个正常数。
假设1是一般非线性系统控制器设计的典型条件。假设2限制由控制输入的变化驱动的系统输出的变化率,它意味着入口匝道交通流量的有限变化不会导致交通密度的无限变化。此外,我们只需要已知bΦ这样一个常数的存在,而不需要已知它的精确值。
对于满足假设1和假设2的一般非线性离散时间模型,当||Δr(t)||≠0时,对于任意的时刻t一定存在一个被称为PPD矩阵的参数Φ(t),使得非线性数据模型能够转化成如下等价的动态线性化数据模型,
Δy(t+1)=Φ(t)Δr(t) (6)
其中,Φ(t)∈Rn×n且||Φ(t)||≤bΦ。
由非线性数据模型,
令Ψ(t)=f[y(t),r(t-1),d(t)]-f[y(t-1),r(t-1),d(t-1)]。由假设1和微分中值定理,(A1)可重写为
其中, 表示fi关于输入rj(t)在间隔[rj(t),rj(t-1)]中某点处的偏导数值。对于每个固定的t,我们考虑以下方程,H(t)为n行、n列的数值矩阵:
Ψ(t)=H(t)Δr(t) (A3)
因为条件||Δr(t)||≠0满足,方程(A3)至少有一个解H*(t)。事实上,对于每个时刻t,它一定具有无穷多个解。
令那么我们有Δx(t+1)=Φ(t)Δr(t)。结果||Φ(t)||≤bΦ是假设2的直接结论。
动态线性化数据模型是对一般非线性离散时间模型的一种等价的描述,它与其他的线性形式不同,如泰勒线性化省略了高阶项。动态线性化是一种数据驱动的方法,它的实现只依赖于系统的输入输出数据。此外,线性数据模型非常简单,不需要任何模糊控制规则、外部测试信号以及像神经网络那样的训练过程。
另一个假设是关于PPD参数的。
PPD参数矩阵Φ(t)是正定或者非负定的。不失一般性,本文中我们假设Φ(t)≥δI>0。
假设3规定了控制方向的同向性,这在控制系统中是常见的。
如文献“Data driven model-free adaptive control for a class of MIMOnonlinear discrete-time systems”所述,Φ(t)表示马尔可夫参数或线性系统的传递函数,对于仅在有限时间间隔t∈{0,1,Λ,T}上沿时间轴变化的快速路交通系统,可以合理地假设Φ(t)是严格可重复的,然后通过考虑快速路交通控制系统的重复性,动态线性化数据模型的等效表达式可表述为,
yk(t+1)=yk(t)+Φ(t)Δrk(t) (10)
其中,Δrk(t)=rk(t)-rk(t-1);t={0,1,Λ,T};k=1,2,Λ代表迭代次数。
期望的交通输出是yd,k(t)∈Rn,对于所有的t∈{0,Λ,T},k=1,2,Λ,它是迭代相关且有界的,即
其中,我们只需要知道正常数byd的存在性。
定义跟踪误差ek(t)=yd,k(t)-yk(t),t∈{0,1,Λ,T}。由(10)式,我们可以得到
ek(t+1)=yd,k(t+1)-yk(t)-Φ(t)Δrk(t)=Φ(t)(Φ(t)-1yd,k(t+1)-Φ(t)-1yk(t)-Δrk(t)) (11)
令ζk(t)=yd,k(t+1)-yk(t)∈Rn,Θ(t)=Φ(t)-1∈Rn×n。等式(11)可重写成
ek(t+1)=Φ(t)[Θ(t)ζk(t)-Δrk(t)] (12)
那么,第k次的学习控制律可表述如下
其中,是Θ(t)的估计值。它的参数更新律为
其中,是给定有界的;c>0;0<abΦ<2,bΦ如假设2中所定义,是正常数;P=In×n是单位阵。
其中,与其它的自适应ILC[14-20]不同,ζk(t)=yd,k(t+1)-yk(t)是线性函数,与系统输出和参考轨迹有关。因此,自动满足关于线性增长条件。
其中,所提的LDM-AILC是一种数据驱动的方法,因为控制器的设计和分析仅用到系统输入输出的可测数据。未知参数Θ(t)是随迭代估计的,也是只用到控制系统可测的I/O数据。
针对MIMO非线性离散时间系统所提出的LDM-AILC方案,在假设1–3满足的条件下,控制律(13)与学习更新律(14)能够保证:
(a)对于所有的t∈{0,Λ,T},k=1,2,Λ,PPD矩阵估计是有界的。
(b)当k趋于无穷时,跟踪误差ek(t),t∈{1,Λ,T},沿迭代轴趋于零。
定义参数估计误差将控制律(13)式代入误差动态方程(12)式中,得
注意以下性质
性质1.
性质2.trace(QTvyT)=trace(QTvyT)T=vTQy
其中,A,B,C是方阵,Q∈Rm×n,v∈Rm×1,y∈Rn×1。
定义那么根据以上性质1,可得
根据(14)式,等式(B2)变成
由于以上性质2,(B3)变为
在(14)式两边同时减去Θ(t),并用关系式(B1),可得
考虑到(B5),(B4)式可重写为
再用关系式(B1),我们有
由于0<abΦ<2,q>0,很明显
由(B7)和(B8),很容易得到
或者
根据定理1和假设3,0<δ≤||Φ(t)||≤bΦ,所以Θ(t)是有界的。进一步,t∈{0,Λ,T},是给定有界的,因此,很明显是有界的。又由不等式(B10)可推出是非负、非增且有界的,所以是有界的。
将(B7)的两边从0到k求和,得
由于V0(t)是有界的,Vk(t)是非负有界的,考虑到(B8)和(B11),可得
根据ζk(t)的定义,有
其中,q2=1是两个正常数。
因此,根据收敛性质(B12)与(B13)即可得到对于所有的t∈{1,Λ,T},ek(t)沿迭代轴渐近收敛。
为了验证本发明方法的正确性,对本发明的方法进行了以下仿真:
对于仿真,我们考虑一个区间的快速路被分为12个区段。每个区段的长度为0.5km。进入第1区段的初始交通量为每小时1600辆车辆。该模型中使用的参数如下:vi(0)=50km/h,vfree=80km/h,ρjam=80veh/lane/km,l=1.8,m=1.7,κ=13veh/km,τ=0.01h,h=0.00417h,γ=35km2/h,ri(0)=0veh/h,α=0.95。
在第2区段有一个入口匝道口,已知交通需求,有两个出口匝道口分别位于第5区段和第9区段,出口流量未知。以此来模拟高峰时段的交通情况。未知的出口流量实际上是作为模拟第2区段的外部干扰。
注意,序列需求实际上对入口匝道的控制输入施加了一些约束,例如:在k时刻入口匝道的交通流率不能超过当前需求与当前在入口匝道等待序列的和;因此
其中,li(t)是指在t时刻第i个入口匝道可能存在的等待序列的长度;ηi(t)是在t时刻第i个入口匝道交通需求量(veh/h);在本文仿真中ION=2,指存在入口匝道的区段数。另一方面,等待序列是入口匝道的需求与实际流量的差的累积,即
li(t+1)=li(t)+T[ηi(t)-ri(t)],i∈ION (16)
期望的快速路交通密度是ρd,k=30+0.1sin(πk/50),如图2所示,它是随迭代次数不断变化的。随机初始交通密度选的是ρi,k(0)=30+0.01rand,如图3所示。
在仿真中,我们选择a=0.1,c=0.01,θ0(t)=0.002,u0(t)=0。应用所提的LDM-AILC方法,学习收敛性如图4所示。其中横轴是迭代次数,纵轴是跟踪误差的最大绝对值
从图2-4可看出所提LDM-AILC方法的有效性。尽管初始值随机以及参考轨迹沿迭代轴随机变化,跟踪误差仍然渐进地逼近零。
Claims (5)
1.快速路交通系统的迭代动态线性化及自学习控制方法,其特征在于,包括以下步骤:
(1)建立快速路交通系统的空间离散交通模型;
(2)将所述空间离散交通流模型用一般非线性离散时间系统的形式表示;
(3)将一般非线性离散时间模型转化为动态线性化数据模型;
(4)建立迭代动态线性化数据模型的学习控制律和参数更新律。
2.根据权利要求1所述的快速路交通系统的迭代动态线性化及自学习控制方法,其特征在于,所述步骤(1)中所述快速路交通系统包括一条单车道的快速路,每一区段均有一个入口匝道和一个出口匝道,则所述快速路的空间离散交通流模型为:
qi(t)=ρi(t)vi(t), (2)
其中,h是采样时间间隔;t是指第t个时刻,t∈{0,1,∧,T};i∈{1,∧,IN}是指快速路的第i个区段;IN是总的区段数;τ,v,k,l,m为常数参数;ρi(t)表示快速路第i个区段第t个时刻的交通流密度;vi(t)表示快速路第i个区段第t个时刻的平均速度;qi(t)表示快速路第i个区段第t个时刻的交通流量;ri(t)表示快速路第i个区段第t个时刻的入口匝道交通流率;si(t)表示快速路第i个区段第t个时刻的出口匝道交通流率;Li表示快速路第i个区段的长度,Vfree表示快速路第i个区段的自由速度,ρjam表示最大密度。
3.根据权利要求2所述的快速路交通系统的迭代动态线性化及自学习控制方法,其特征在于,将所述空间离散交通流模型转化为一般非线性离散时间形式为:
y(t+1)=f[y(t),r(t),d(t)], (5)
其中,状态向量y(t)∈Rn包括所有交通密度、平均速度以及匝道序列;控制向量r(t)∈Rn包括所有可控匝道流率;干扰向量d(t)∈Rn包括所有入口匝道的需求和转弯速度;f(Λ)∈Rn是向量值函数。
4.根据权利要求3所述的快速路交通系统的迭代动态线性化及自学习控制方法,其特征在于,所述步骤(3)中将非线性数据模型转化为动态线性化数据模型,需要设定非线性数据模型满足以下2个假设:
假设1:f(Λ)关于控制向量r(t)的偏导数连续;
假设2:非线性数据模型满足广义Lipschitz条件,即对任意固定的t和‖Δr(t)‖≠0,有
其中,Δy(t+1)=y(t+1)-y(t),Δr(t+1)=r(t)-r(t-1);是一个正常数;
则可得,对于任意的时刻t一定存在一个被称为PPD矩阵的参数使得非线性数据模型能够转化为以下等价的动态线性化数据模型,
其中,且
5.根据权利要求4所述的快速路交通系统的迭代动态线性化及自学习控制方法,其特征在于,所述步骤(5)中建立动态线性化数据模型的学习控制律和参数更新律的步骤为:
(51)设定动态线性化数据模型满足假设3,同时设定快速路交通系统在有限的运行时间间隔t内重复,是严格重复的;
假设3:PPD参数矩阵是正定或者非负定;
(52)设置期望交通输出为yd,k(t)∈Rn,对于所有的t∈{0,1,∧,T},k=1,2,∧,yd,k(t)是迭代相关且有界的,即
其中,byd为正常数且存在;
(53)定义跟踪误差ek(t)=yd,k(t)-yk(t),则
ek(t+1)=yd,k(t+1)-yk(t)-Φ(t)Δrk(t)=Φ(t)(Φ(t)-1yd,k(t+1)-Φ(t)-1yk(t)-Δrk(t)) (9)
令
ek(t+1)=Φ(t)[Θ(t)ζk(t)-Δrk(t)] (10)
其中,ζk(t)=yd,k(t+1)-yk(t)∈Rn,Θ(t)=Φ(t)-1∈Rn×n;
(54)则可得第k次的学习控制律可表述为:
其中,是Θ(t)的估计值,它的参数更新律为
其中,是给定有界的;c>0;0<abΦ<2,P=In×n是单位阵。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710292710.XA CN106935033B (zh) | 2017-04-28 | 2017-04-28 | 快速路交通系统的迭代动态线性化及自学习控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710292710.XA CN106935033B (zh) | 2017-04-28 | 2017-04-28 | 快速路交通系统的迭代动态线性化及自学习控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106935033A true CN106935033A (zh) | 2017-07-07 |
CN106935033B CN106935033B (zh) | 2020-07-28 |
Family
ID=59438500
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710292710.XA Active CN106935033B (zh) | 2017-04-28 | 2017-04-28 | 快速路交通系统的迭代动态线性化及自学习控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106935033B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108594644A (zh) * | 2018-03-05 | 2018-09-28 | 青岛科技大学 | 基于固定场景和路线的智能无人驾驶车辆的迭代学习控制方法 |
CN108828960A (zh) * | 2018-09-11 | 2018-11-16 | 武汉理工大学 | 一种气动肌肉无模型高阶迭代学习控制方法 |
CN109946964A (zh) * | 2019-02-19 | 2019-06-28 | 江苏经贸职业技术学院 | 一种基于非严格重复问题的复杂非线性系统学习控制方法 |
CN110376901A (zh) * | 2019-08-19 | 2019-10-25 | 哈尔滨工业大学(深圳) | 一种基于动态控制器的迭代学习控制方法 |
CN110400471A (zh) * | 2019-07-24 | 2019-11-01 | 杭州电子科技大学 | 一种城市交通系统安全运行的控制方法 |
CN110428608A (zh) * | 2019-06-18 | 2019-11-08 | 上海电科智能系统股份有限公司 | 一种基于交通大数据的道路通行能力提取方法 |
CN111610719A (zh) * | 2020-07-07 | 2020-09-01 | 青岛科技大学 | 一种基于观测器的非线性执行器故障系统的容错控制方法 |
CN113126500A (zh) * | 2021-04-20 | 2021-07-16 | 河北工业大学 | 一种交通系统的非脆弱同步控制方法及装置 |
CN114488818A (zh) * | 2022-01-28 | 2022-05-13 | 青岛科技大学 | 一种pid控制系统的设定点迭代学习优化技术 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101246514A (zh) * | 2008-03-20 | 2008-08-20 | 天津市市政工程设计研究院 | 城市快速路互通立交仿真设计系统及建立设计模型的方法 |
CN102360522A (zh) * | 2011-09-27 | 2012-02-22 | 浙江交通职业技术学院 | 一种高速公路优化控制方法 |
CN103456163A (zh) * | 2012-06-04 | 2013-12-18 | 北京市市政工程设计研究总院 | 城市快速路互通立交通行能力和运行状态判别方法与系统 |
CN103839418A (zh) * | 2014-02-27 | 2014-06-04 | 中国航天系统工程有限公司 | 一种自适应的城市快速路匝道动态控制系统 |
-
2017
- 2017-04-28 CN CN201710292710.XA patent/CN106935033B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101246514A (zh) * | 2008-03-20 | 2008-08-20 | 天津市市政工程设计研究院 | 城市快速路互通立交仿真设计系统及建立设计模型的方法 |
CN102360522A (zh) * | 2011-09-27 | 2012-02-22 | 浙江交通职业技术学院 | 一种高速公路优化控制方法 |
CN103456163A (zh) * | 2012-06-04 | 2013-12-18 | 北京市市政工程设计研究总院 | 城市快速路互通立交通行能力和运行状态判别方法与系统 |
CN103839418A (zh) * | 2014-02-27 | 2014-06-04 | 中国航天系统工程有限公司 | 一种自适应的城市快速路匝道动态控制系统 |
Non-Patent Citations (2)
Title |
---|
池荣虎 等: "离散时间系统自适应迭代学习控制的研究进展", 《青岛科技大学学报(自然科学版)》 * |
王英伟: "高速公路入口匝道迭代学习控制方法研究", 《中国优秀硕士学位论文全文数据库 工程科技II辑》 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108594644A (zh) * | 2018-03-05 | 2018-09-28 | 青岛科技大学 | 基于固定场景和路线的智能无人驾驶车辆的迭代学习控制方法 |
CN108828960A (zh) * | 2018-09-11 | 2018-11-16 | 武汉理工大学 | 一种气动肌肉无模型高阶迭代学习控制方法 |
CN109946964A (zh) * | 2019-02-19 | 2019-06-28 | 江苏经贸职业技术学院 | 一种基于非严格重复问题的复杂非线性系统学习控制方法 |
CN110428608A (zh) * | 2019-06-18 | 2019-11-08 | 上海电科智能系统股份有限公司 | 一种基于交通大数据的道路通行能力提取方法 |
CN110428608B (zh) * | 2019-06-18 | 2022-03-04 | 上海电科智能系统股份有限公司 | 一种基于交通大数据的道路通行能力提取方法 |
CN110400471B (zh) * | 2019-07-24 | 2020-09-22 | 杭州电子科技大学 | 一种城市交通系统安全运行的控制方法 |
CN110400471A (zh) * | 2019-07-24 | 2019-11-01 | 杭州电子科技大学 | 一种城市交通系统安全运行的控制方法 |
CN110376901A (zh) * | 2019-08-19 | 2019-10-25 | 哈尔滨工业大学(深圳) | 一种基于动态控制器的迭代学习控制方法 |
CN110376901B (zh) * | 2019-08-19 | 2022-09-02 | 哈尔滨工业大学(深圳) | 一种基于动态控制器的迭代学习控制方法 |
CN111610719A (zh) * | 2020-07-07 | 2020-09-01 | 青岛科技大学 | 一种基于观测器的非线性执行器故障系统的容错控制方法 |
CN113126500A (zh) * | 2021-04-20 | 2021-07-16 | 河北工业大学 | 一种交通系统的非脆弱同步控制方法及装置 |
CN114488818A (zh) * | 2022-01-28 | 2022-05-13 | 青岛科技大学 | 一种pid控制系统的设定点迭代学习优化技术 |
CN114488818B (zh) * | 2022-01-28 | 2023-09-29 | 青岛科技大学 | 一种pid控制系统的设定点迭代学习优化方法 |
Also Published As
Publication number | Publication date |
---|---|
CN106935033B (zh) | 2020-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106935033A (zh) | 快速路交通系统的迭代动态线性化及自学习控制方法 | |
Liu et al. | Impact of cooperative adaptive cruise control on multilane freeway merge capacity | |
Ho et al. | Traffic flow modeling and control using artificial neural networks | |
Belletti et al. | Expert level control of ramp metering based on multi-task deep reinforcement learning | |
Camponogara et al. | Distributed learning agents in urban traffic control | |
Zhao et al. | DHP method for ramp metering of freeway traffic | |
Kotsialos et al. | Motorway network traffic control systems | |
Zhang et al. | A feedback-based dynamic tolling algorithm for high-occupancy toll lane operations | |
CN103593535A (zh) | 基于多尺度融合的城市交通复杂自适应网络平行仿真系统及方法 | |
Papamichail et al. | Motorway traffic flow modelling, estimation and control with vehicle automation and communication systems | |
Wang et al. | A general approach to smoothing nonlinear mixed traffic via control of autonomous vehicles | |
CN104134356A (zh) | 城市交叉口模型参考自适应信号的控制方法 | |
CN106249599A (zh) | 一种基于神经网络预测的网络化控制系统故障检测方法 | |
Han et al. | Validation of an extended discrete first-order model with variable speed limits | |
Kušić et al. | A comparison of different state representations for reinforcement learning based variable speed limit control | |
CN107193210A (zh) | 一种非线性系统的自适应学习预设性能控制方法 | |
Choi et al. | Field implementation feasibility study of cumulative travel‐time responsive (CTR) traffic signal control algorithm | |
Toledo et al. | Simulation-based optimization of HOT lane tolls | |
Yuan et al. | A kinematic wave model in Lagrangian coordinates incorporating capacity drop: Application to homogeneous road stretches and discontinuities | |
Xu et al. | Integrated route guidance and ramp metering consistent with drivers' en-route diversion behaviour | |
Lu et al. | TD3LVSL: A lane-level variable speed limit approach based on twin delayed deep deterministic policy gradient in a connected automated vehicle environment | |
Yin et al. | A reinforcement learning method for traffic signal control at an isolated intersection with pedestrian flows | |
Li et al. | Traffic flow stabilization | |
Lu et al. | MPC-based variable speed limit and its impact on traffic with V2I type ACC | |
Zu et al. | Distributed traffic speed control for improving vehicle throughput |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |