CN103177589A - 基于演化博弈的交通信号周期自适应控制方法 - Google Patents

基于演化博弈的交通信号周期自适应控制方法 Download PDF

Info

Publication number
CN103177589A
CN103177589A CN2013101398098A CN201310139809A CN103177589A CN 103177589 A CN103177589 A CN 103177589A CN 2013101398098 A CN2013101398098 A CN 2013101398098A CN 201310139809 A CN201310139809 A CN 201310139809A CN 103177589 A CN103177589 A CN 103177589A
Authority
CN
China
Prior art keywords
crossing
phase differential
phase
period
feasible program
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013101398098A
Other languages
English (en)
Other versions
CN103177589B (zh
Inventor
余春艳
李建明
吴丽丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuzhou University
Original Assignee
Fuzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuzhou University filed Critical Fuzhou University
Priority to CN201310139809.8A priority Critical patent/CN103177589B/zh
Publication of CN103177589A publication Critical patent/CN103177589A/zh
Application granted granted Critical
Publication of CN103177589B publication Critical patent/CN103177589B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Traffic Control Systems (AREA)

Abstract

本发明设计了一种基于演化博弈的交通信号周期自适应控制方法,将演化博弈理论应用于交通信号自适应控制中,充分考虑了交通流和信号控制的动态特性,建立了信号灯自适应控制模型,应用于解决当前区域城市交通号灯控制的问题。该方法是一种完全分布式的控制方法,可以很好的解决交通系统的不确定性、随机性、非线性、局部性等特点,此外,相对于其他一些智能算法的应用,该方法的结构简单,性能稳定,具有良好的可修改性和可扩展性。

Description

基于演化博弈的交通信号周期自适应控制方法
技术领域
本发明涉及智能交通技术领域,特别是一种基于演化博弈的交通信号周期自适应控制方法。
背景技术
随着社会经济的不断发展,城市交通拥堵问题日益严重。城市交通控制系统作为智能交通系统的一个重要子系统,一直是研究的热点。由于交通系统具有复杂性,不确定性,时变性以及非线性等特点,现有的控制技术难以有效对其进行控制。随着科技的不断进步,采用新的控制理论和方法设计出先进的城市交通信号控制系统,改善交通控制效果,是当前智能交通控制研究的重点。
交通系统是典型的复杂系统,是城市交通设施与参与者之间共同作用的成果,难以用数学模型进行描述。交通信号控制问题可以诠释为交叉口之间的决策问题。通常利用博弈论求解多个交叉口之间的冲突、协调和竞争问题,但该理论难以描述实际系统的动态特性,且要求每个交叉口都是理性的参与者。针对经典博弈论存在的缺陷,演化博弈理论从有限理性的博弈参与人出发,不要求在完全信息下进行决策,认为交叉口不是行为最优化者,交叉口之间的决策是通过交叉口之间的模仿、学习和突变等动态过程实现的,非常适合用于描述交通系统的动态特性。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于演化博弈的交通信号周期自适应控制方法,相对于其他一些智能算法的应用,该方法的结构简单,性能稳定,具有良好的可修改性和可扩展性。
本发明采用以下方案实现:
一种基于演化博弈的交通信号周期自适应控制方法,其特征在于:采用两层递阶分布式结构,上层是区域控制层,下层是路口控制层;区域控制层主要负责每个时段周期和相位差的优化,路口控制层则负责在每一周期内绿信比的优化;所述的基于演化博弈的交通信号周期自适应控制方法按如下过程进行:
S1:在时段内的每个周期结束前的若干秒,根据实时检测的路网交通流量数据以及路口参数信息和预测信息,优化得到下一周期路口使用的绿信比;
S2:在每一个时段的最后一个周期,通过前面若干个周期采集到的路网交通流量数据,优化得到下一个时段内区域共用的周期和相位差;
S3:各路口根据过程S1、S2得到的配时方案,配置运行。
在本发明一实施例中,所述过程S1中绿信比的优化方法指在时段内的每个周期结束前的若干秒,根据实时检测的路网交通流量数据和预测信息,以基于演化博弈的优化方法得到下一周期路口使用的绿信比,具体步骤如下:
S21:演化的每一时期t,从单交叉路口的所有相位中随机挑选两个相位进行有限次数的博弈,并确定相位的博弈收益值ut
S22:重复步骤S21直到两个相位之间达到最大的博弈次数MaxNum,并计算使用纯策略si的相位的平均博弈收益值
S23:确定相位选择纯策略si的增长率,并更新演化下一时期采用纯策略si的相位在单交叉路口的所有相位中所占的比例;
S24:重复上述步骤S22至S23,直至单交叉路口的所有相位达到演化稳定策略或者演化终止代数;
S25:根据步骤S24的结果配置单交叉路口各相位的绿灯时长,转到步骤S22。
在本发明一实施例中,所述的博弈收益值ut指第t时期,相位在博弈开始前对各种可能的纯策略带来的收益的一种预测,选择一个周期内单交叉路口平均延误时长的预测值倒数作为博弈收益值,即:,其中,n1为单交叉路口相位总数;dit为第t时期单交叉路口第i个相位由Webster方法计算得到的延误值,延误值d=(c(1-λ)2)/(2(1-λx))+x2/(2q(1-x))-0.65(c/q2)1/3x2+5λ,其中c为周期时长,λ为绿信比,q为到达率,x为饱和度,x=q/(λs),s表示驶出率;相位在博弈之初,遵循以下规则预测下一周期采用某个纯策略获得的收益值,其中,纯策略si指交叉路口上的一个合理有效的配时方案;相位若选择纯策略s1,那么纯策略s1中绿灯所对应相位上的绿灯时长延长△tex(△tex>0),纯策略s1中红灯所对应相位上的绿灯时长增加△tex′(△tex′<0),并满足(n-1)*|△tex′|=△tex;同理可得相位选择纯策略s2,s3,...,sn的预测收益值u(s2),u(s3),...,u(sn);这里通过多次观测统计历史数据的平均值来预测单交叉路口下一周期内车流量。
在本发明一实施例中,所述的确定相位选择纯策略si的增长率,并更新演化下一时期采用纯策略si的相位在单交叉路口的所有相位中所占的比例的方法如下:在演化时期t使用纯策略si的相位集合用Xt(si)表示,在演化时期t使用纯策略si的相位在单交叉路口的所有相位中所占比例,其中n2表示该单交叉路口可选策略的个数,在演化时期t单交叉路口的所有相位的平均收益 u &OverBar; t = &Sigma; i = 1 n 2 &theta; t ( s i ) u &OverBar; t ( s i ) ,相位选择纯策略si的增长率 &theta; &CenterDot; t ( s i ) = &theta; t ( s i ) [ &theta; t ( s i ) - u &OverBar; t ] .
在本发明一实施例中,所述过程S2的实现方式是:每个时段起始,首先Webster方法确定干线的共同周期,并在所述过程S1的基础上确定单交叉路口绿信比,然后采用RDOC方法进行优化,并将所获得的最优相位差可行方案应用于交通干线系统;具体的控制步骤下:
S51:初始化时段包含N0个周期,p=0;
S52:当p=N0,确定干线的共同周期和交叉口绿信比;根据当前的交通需求,应用RDOC方法优化相邻交叉口之间的相位差,最后根据所得的方案调整当前干线上相邻交叉口之间的相位差;
S53:第p个周期结束,p=p+1;若p>N0,p=0;返回步骤S52。
在本发明一实施例中,所述RDOC方法的具体实现步骤如下:
S61:初始化,在可行解空间中随机挑选K个不重复的候选相位差可行方案作为第一代;
S62:相位差可行方案的收益计算;在交通干线系统中,通过计算相位差可行方案的收益值来判断相位差可行方案适应当前动态交通需求的程度;相位差可行方案的收益通过(Umax-D)计算得到,其中Umax为一个相对较大的数,D表示整个交通干线总延误;
S63:计算相位差可行方案的增长率,然后根据相位差可行方案增长率大小进行排序,选取最大增长率的相位差可行方案配置当前交通需求的交通干线系统的相位差;
S64:若此时演化代数达到规定最大演化代数T或者连续t′代所有单交叉路口的平均收益之差不超过0.1,则演化结束;否则转入下一步骤;
S65:生成下一代;按照“优胜劣汰”的自然选择机制,将上一代的K个不重复的相位差可行方案按相位差可行方案增长率排序,并确定要淘汰的相位差可行方案数量K′;从可行解空间中随机挑选K′个不重复的候选相位差可行方案替代上一代淘汰的相位差可行方案,并将增长率最高的相位差可行方案直接复制到下一代,然后根据相位差可行方案的增长率用轮盘赌选择生成下一代;这里要注意的是,所挑选K′个不重复的相位差可行方案也必须与上一代中K个相位差可行方案不同;转到步骤S61。
在本发明一实施例中,所述的交通干线相位差可行方案指对于一个由n个交叉口组成的交通干线系统,其含有的优化相位差个数为
Figure BDA00003082763600042
Figure BDA00003082763600043
Figure BDA00003082763600044
为从交叉口ci下行至交叉口ci+1东西直行相位上ci+1相对于ci的相位差,T表示交通干线共同周期;
Figure BDA00003082763600045
所有可能采取行动的集合记为A(m),其中m为行动的个数,定义下行所有
Figure BDA00003082763600046
随机选择的行动构成的行动组合称为交通干线相位差可行方案;所述的可行解空间指所有可行行动组合的集合,记为X,并满足
Figure BDA00003082763600047
,且Xi∩Xj=φ.i,j∈{1,2,...,mn}。
在本发明一实施例中,所述的交通干线总延误 D = &Sigma; i = 2 n &alpha; i delay id + ( 1 - &alpha; i ) delay id &prime; + &Sigma; i = 1 n - 1 &beta; i delay iu + ( 1 - &beta; i ) delay iu &prime; ,其中n表示该交通干线有n个路口,delay(i+1)d=0.5qdτdd+t1),delay′(i+1)d=0.5qdτ′d 2+qdτ′d(tr-τ′d)+0.5t′dτ′dqd,qd表示交通干线下行的交通量,τd表示从车流头部行至交叉口Ji+1受阻开始直至交叉口Ji+1红灯结束的时长,
Figure BDA00003082763600049
表示第i+1个交叉口对第i个交叉口的相位差,li表示第i+1个交叉口与第i个交叉口间的距离,vd表示交通干线下行的车速,T表示交通干线共同周期,t1表示交叉口某相位绿灯开启后,该相位路口累积的车辆全部疏散所需要的时长,t1=qdτd/(C-qd),C表示交叉口绿灯时间内相位最大通行能力,τ′d表示车流中第一辆车遇红灯受阻开始直到车流中的最后一辆车到该交叉口所需要的时长,
Figure BDA00003082763600054
,t′d=qdτ′d/C,tr表示一个周期内的红灯时长,delay(i+1)u=0.5quτuu+tu),delay′(i+1)u=0.5quτu2+quτu′(tru′)+0.5tu′τu′qu,qu表示交通干线上行的交通量,τu表示从车流头部行至交叉口Ji受阻开始直至交叉口Ji红灯结束的时长,
Figure BDA00003082763600055
Figure BDA00003082763600056
表示第i个交叉口对第i+1个交叉口的相位差,
Figure BDA00003082763600057
,c为周期时期时长,vu表示交通干线上行的车速,tu=quτu/(C-qu),τu′表示车流中第一辆车遇红灯受阻开始直到车流中的最后一辆车到该交叉口所需要的时长,
Figure BDA00003082763600058
,tu′=quτu′/C,如果
Figure BDA00003082763600059
则αi为1,反之αi为0,如果
Figure BDA000030827636000510
,则βi为1,反之βi为0。
在本发明一实施例中,所述相位差可行方案的增长率的计算方法如下:在演化的第t代,相位差可行方案Xi收益为ut(Xi),用Pt(Xi)度量在时期t使用相位差可行方案Xi的集合;用
Figure BDA00003082763600051
表示在时期t使用Xi在演化第t代的全部相位差可行方案中所占份额,n表示演化第t代中包含的相位差可行方案的个数;用状态变量θt表示这一比例构成的向量,则可得在时期t群体中平均收益
Figure BDA00003082763600052
,相位差可行方案Xi的增长率 &theta; &CenterDot; t ( X i ) = &theta; t ( X i ) [ u t ( X i ) - u &OverBar; t ] .
本发明设计一种基于演化博弈的交通信号周期自适应控制方法,将演化博弈理论应用于交通信号灯控制中,充分考虑了交通流和信号灯控制的动态特性,建立了自适应信号灯控制模型,应用于解决城市信号控制的协调问题。该方法是一种分布式的控制方法,可以很好的解决交通系统的不确定性、随机性、非线性、局部性等特点,此外,相对于其他一些智能算法的应用,该方法的结构简单,性能稳定,具有良好的可修改性和可扩展性。
附图说明
图1是本发明实施例的交通信号灯控制示意图。
图2是信号灯控制流程示意图。
图3是RDOC方法流程。
具体实施方式
本实施例提供一种基于演化博弈的交通信号周期自适应控制方法,其特征在于:采用两层递阶分布式结构,上层是区域控制层,下层是路口控制层;区域控制层主要负责每个时段周期和相位差的优化,路口控制层则负责在每一周期内绿信比的优化;所述的基于演化博弈的交通信号周期自适应控制方法按如下过程进行:
S1:在时段内的每个周期结束前的若干秒,根据实时检测的路网交通流量数据以及路口参数信息和预测信息,优化得到下一周期路口使用的绿信比;
S2:在每一个时段的最后一个周期,通过前面若干个周期采集到的路网交通流量数据,优化得到下一个时段内区域共用的周期和相位差;
S3:各路口根据过程S1、S2得到的配时方案,配置运行。
请参考图1和图2及图3,本发明基于演化博弈的交通信号周期自适应控制优化方法,具体过程如下:
1、在时段内的每个周期结束前的若干秒,根据实时检测的路网交通流量数据和预测信息,优化得到下一周期路口使用的绿信比。具体步骤如下:
⑴演化的每一时期t,从单交叉路口的所有相位中随机挑选两个相位进行有限次数的博弈,并确定相位的博弈收益ut。第t时期,博弈收益值ut指相位在博弈开始前对各种可能的纯策略带来的收益的一种预测,选择一个周期内单交叉路口平均延误时长的预测值倒数作为博弈收益值,即:
Figure BDA00003082763600061
,其中,n1为单交叉路口相位总数;dit为第t时期单交叉路口第i个相位由Webster方法计算得到的延误值,延误值d=(c(1-λ)2)/(2(1-λx))+x2/(2q(1-x))-0.65(c/q2)1/3x2+5λ,其中c为周期时长,λ为绿信比,q为到达率,x为饱和度,x=q/(λs),s表示驶出率。相位在博弈之初,遵循以下规则预测下一周期采用某个纯策略获得的收益值,纯策略si指交叉路口上的一个合理有效的配时方案。相位若选择纯策略s1,那么s1纯策略中绿灯所对应相位上的绿灯时长延长△tex(△tex>0),s1纯策略中红灯所对应相位上的绿灯时长增加△tex(△tex<0),并满足(n-1)*|△tex|=△tex。同理可得相位选择纯策略s2,s3,...,sn的预测收益值u(s2),u(s3),...,u(sn)。这里通过多次观测统计历史数据的平均值来预测单交叉路口下一周期内车流量。
⑵重复步骤(1)直到两个相位之间达到最大的博弈次数MaxNum,并计算使用纯策略si的相位的平均收益
Figure BDA00003082763600071
⑶确定相位选择纯策略si的增长率,并更新演化下一时期采用纯策略si的相位在单交叉路口的所有相位中所占的比例的方法如下:在演化时期t使用纯策略si的相位集合用Xt(si)表示,那么在演化时期t使用纯策略si的相位在单交叉路口的所有相位中所占比例
Figure BDA00003082763600072
,其中n2表示该单交叉路口可选策略的个数,在演化时期t单交叉路口的所有相位的平均收益 u &OverBar; t = &Sigma; i = 1 n 2 &theta; t ( s i ) u &OverBar; t ( s i ) ,相位选择纯策略si的增长率 &theta; &CenterDot; t ( s i ) = &theta; t ( s i ) [ &theta; t ( s i ) - u &OverBar; t ] .
⑷重复上述步骤(2)至(3),直至单交叉路口的所有相位达到演化稳定策略或者演化终止代数。
⑸根据步骤(4)的结果配置单交叉路口各相位的绿灯时长,转到步骤(2)。
2、在每一个时段的最后一个周期,通过前面若干个周期采集到的路网交通流量数据,优化得到下一个时段内区域共用的周期和相位差。每个时段起始,首先确定Webster干线的共同周期,并在过程1的基础上确定单交叉路口绿信比,然后采用RDOC方法进行优化,并将所获得的最优相位差可行方案应用于交通干线系统。具体的控制步骤下:
⑴初始化时段包含N0个周期,p=0。
⑵当p=N0,确定干线的共同周期和交叉口绿信比。根据当前的交通需求,应用RDOC方法优化相邻交叉口之间的相位差,最后根据所得的方案调整当前干线上相邻交叉口之间的相位差。
⑶第p个周期结束,p=p+1。若p>N0,p=0。返回步骤(2)。
其中RDOC方法通过如下具体步骤实现:
1)初始化。在可行解空间中随机挑选K个不重复的候选相位差可行方案作为第一代。对于一个由n个交叉口组成的交通干线系统,其含有的优化相位差个数为 为从交叉口ci下行至交叉口ci+1东西直行相位上ci+1相对于ci的相位差,T表示交通干线共同周期。
Figure BDA00003082763600085
所有可能采取行动的集合记为A(m),其中m为行动的个数,定义下行所有
Figure BDA00003082763600086
随机选择的行动构成的行动组合称为交通干线相位差可行方案。可行解空间即为所有可行行动组合的集合,记为X,并满足
Figure BDA00003082763600087
,且Xi∩Xj=φ.i,j∈{1,2,...,mn}。
2)相位差可行方案的收益计算。在交通干线系统中,可以通过计算相位差可行方案的收益值来判断相位差可行方案适应当前动态交通需求的程度。相位差可行方案的收益通过(Umax-D)计算得到,其中Umax为一个相对较大的数,D表示整个交通干线总延误。总延误 D = &Sigma; i = 2 n &alpha; i delay id + ( 1 - &alpha; i ) delay id &prime; + &Sigma; i = 1 n - 1 &beta; i delay iu + ( 1 - &beta; i ) delay iu &prime; ,其中n表示该交通干线有n个路口,delay(i+1)d=0.5qdτdd+t1),delay′(i+1)d=0.5qdτ′d 2+qdτ′d(tr-τ′d)+0.5t′dτ′dqd,qd表示交通干线下行的交通量,τd表示从车流头部行至交叉口Ji+1受阻开始直至交叉口Ji+1红灯结束的时长,
Figure BDA00003082763600088
Figure BDA00003082763600089
表示第i+1个交叉口对第i个交叉口的相位差,li
表示第i+1个交叉口与第i个交叉口间的距离,vd表示交通干线下行的车速,T表示交通干线共同周期,t1表示交叉口某相位绿灯开启后,该相位路口累积的车辆全部疏散所需要的时长,t1=qdτd/(C-qd),C表示交叉口绿灯时间内相位最大通行能力,τ′d表示车流中第一辆车遇红灯受阻开始直到车流中的最后一辆车到该交叉口所需要的时长,
Figure BDA00003082763600094
,t′d=qdτ′d/C,tr表示一个周期内的红灯时长,delay(i+1)u=0.5quτuu+tu),delay′(i+1)u=0.5quτu2+quτu′(tru′)+0.5tu′τu′qu,qu表示交通干线上行的交通量,τu表示从车流头部行至交叉口Ji受阻开始直至交叉口Ji红灯结束的时长,
Figure BDA00003082763600095
Figure BDA00003082763600096
表示第i个交叉口对第i+1个交叉口的相位差,
Figure BDA00003082763600097
,c为周期时期时长,vu表示交通干线上行的车速,tu=quτu/(C-qu),τu′表示车流中第一辆车遇红灯受阻开始直到车流中的最后一辆车到该交叉口所需要的时长,
Figure BDA00003082763600098
,tu′=quτu′/C,如果
Figure BDA00003082763600099
则αi为1,反之αi为0,如果
Figure BDA000030827636000910
,则βi为1,反之βi为0。
3)计算相位差可行方案的增长率,然后根据相位差可行方案增长率大小进行排序,选取最大增长率的相位差可行方案配置当前交通需求的交通干线系统的相位差。相位差可行方案的增长率的计算方法如下:在演化的第t代,相位差可行方案Xi收益为ut(Xi),用Pt(Xi)度量在时期t使用相位差可行方案Xi的集合;用
Figure BDA00003082763600091
表示在时期t使用Xi在演化第t代的全部相位差可行方案中所占份额,n表示演化第t代中包含的相位差可行方案的个数;用状态变量θt表示这一比例构成的向量,则可得在时期t群体中平均收益 u &OverBar; t = &Sigma; X i &theta; t ( X i ) u t ( X i ) ,相位差可行方案Xi的增长率 &theta; &CenterDot; t ( X i ) = &theta; t ( X i ) [ u t ( X i ) - u &OverBar; t ] .
4)若此时演化代数达到规定最大演化代数T或者连续t′代所有单交叉路口的平均收益之差不超过0.1,则演化结束。否则转入下一步骤。
5)生成下一代。按照“优胜劣汰”的自然选择机制,将上一代的K个不重复的相位差可行方案按相位差可行方案增长率排序,并确定要淘汰的相位差可行方案数量K′。从可行解空间中随机挑选K′个不重复的候选相位差可行方案替代上一代淘汰的相位差可行方案,并将增长率最高的相位差可行方案直接复制到下一代,然后根据相位差可行方案的增长率用轮盘赌选择生成下一代。这里要注意的是,所挑选K′个不重复的相位差可行方案也必须与上一代中K个相位差可行方案不同。转到步骤1)。
3、各路口根据过程1、2得到的配时方案,配置运行。
以上是本发明的较佳实施例,凡依本发明技术方案所作的改变,所产生的功能作用未超出本发明技术方案的范围时,均属于本发明的保护范围。

Claims (9)

1.一种基于演化博弈的交通信号周期自适应控制方法,其特征在于:采用两层递阶分布式结构,上层是区域控制层,下层是路口控制层;区域控制层主要负责每个时段周期和相位差的优化,路口控制层则负责在每一周期内绿信比的优化;所述的基于演化博弈的交通信号周期自适应控制方法按如下过程进行:
S1:在时段内的每个周期结束前的若干秒,根据实时检测的路网交通流量数据以及路口参数信息和预测信息,优化得到下一周期路口使用的绿信比;
S2:在每一个时段的最后一个周期,通过前面若干个周期采集到的路网交通流量数据,优化得到下一个时段内区域共用的周期和相位差;
S3:各路口根据过程S1、S2得到的配时方案,配置运行。
2.根据权利要求1所述的基于演化博弈的交通信号周期自适应控制方法,其特征在于:所述过程S1中绿信比的优化方法指在时段内的每个周期结束前的若干秒,根据实时检测的路网交通流量数据和预测信息,以基于演化博弈的优化方法得到下一周期路口使用的绿信比,具体步骤如下:
S21:演化的每一时期t,从单交叉路口的所有相位中随机挑选两个相位进行有限次数的博弈,并确定相位的博弈收益值ut
S22:重复步骤S21直到两个相位之间达到最大的博弈次数MaxNum,并计算使用纯策略si的相位的平均博弈收益值
Figure FDA00003082763500011
S23:确定相位选择纯策略si的增长率,并更新演化下一时期采用纯策略si的相位在单交叉路口的所有相位中所占的比例;
S24:重复上述步骤S22至S23,直至单交叉路口的所有相位达到演化稳定策略或者演化终止代数;
S25:根据步骤S24的结果配置单交叉路口各相位的绿灯时长,转到步骤S22。
3.根据权利要求2所述的基于演化博弈的交通信号周期自适应控制方法,其特征在于:所述的博弈收益值ut指第t时期,相位在博弈开始前对各种可能的纯策略带来的收益的一种预测,选择一个周期内单交叉路口平均延误时长的预测值倒数作为博弈收益值,即:
Figure FDA00003082763500021
,其中,n1为单交叉路口相位总数;dit为第t时期单交叉路口第i个相位由Webster方法计算得到的延误值,延误值d=(c(1-λ)2)/(2(1-λx))+x2/(2q(1-x))-0.65(c/q2)1/3x2+5λ,其中c为周期时长,λ为绿信比,q为到达率,x为饱和度,x=q/(λs),s表示驶出率;相位在博弈之初,遵循以下规则预测下一周期采用某个纯策略获得的收益值,其中,纯策略si指交叉路口上的一个合理有效的配时方案;相位若选择纯策略s1,那么纯策略s1中绿灯所对应相位上的绿灯时长延长△tex(△tex>0),纯策略s1中红灯所对应相位上的绿灯时长增加△tex(△tex<0),并满足(n-1)*|△tex|=△tex;同理可得相位选择纯策略s2,s3,...,sn的预测收益值u(s2),u(s3),...,u(sn);这里通过多次观测统计历史数据的平均值来预测单交叉路口下一周期内车流量。
4.根据权利要求2所述的基于演化博弈的交通信号周期自适应控制方法,其特征在于:所述的确定相位选择纯策略si的增长率,并更新演化下一时期采用纯策略si的相位在单交叉路口的所有相位中所占的比例的方法如下:在演化时期t使用纯策略si的相位集合用Xt(si)表示,在演化时期t使用纯策略si的相位在单交叉路口的所有相位中所占比例
Figure FDA00003082763500022
,其中n2表示该单交叉路口可选策略的个数,在演化时期t单交叉路口的所有相位的平均收益 u &OverBar; t = &Sigma; i = 1 n 2 &theta; t ( s i ) u &OverBar; t ( s i ) ,相位选择纯策略si的增长率 &theta; &CenterDot; t ( s i ) = &theta; t ( s i ) [ &theta; t ( s i ) - u &OverBar; t ] .
5.根据权利要求1所述的基于演化博弈的交通信号周期自适应控制方法,其特征在于:所述过程S2的实现方式是:每个时段起始,首先Webster方法确定干线的共同周期,并在所述过程S1的基础上确定单交叉路口绿信比,然后采用RDOC方法进行优化,并将所获得的最优相位差可行方案应用于交通干线系统;具体的控制步骤下:
S51:初始化时段包含N0个周期,p=0;
S52:当p=N0,确定干线的共同周期和交叉口绿信比;根据当前的交通需求,应用RDOC方法优化相邻交叉口之间的相位差,最后根据所得的方案调整当前干线上相邻交叉口之间的相位差;
S53:第p个周期结束,p=p+1;若p>N0,p=0;返回步骤S52。
6.根据权利要求5所述的基于演化博弈的交通信号周期自适应控制方法,其特征在于:所述RDOC方法的具体实现步骤如下:
S61:初始化,在可行解空间中随机挑选K个不重复的候选相位差可行方案作为第一代;
S62:相位差可行方案的收益计算;在交通干线系统中,通过计算相位差可行方案的收益值来判断相位差可行方案适应当前动态交通需求的程度;相位差可行方案的收益通过(Umax-D)计算得到,其中Umax为一个相对较大的数,D表示整个交通干线总延误;
S63:计算相位差可行方案的增长率,然后根据相位差可行方案增长率大小进行排序,选取最大增长率的相位差可行方案配置当前交通需求的交通干线系统的相位差;
S64:若此时演化代数达到规定最大演化代数T或者连续t′代所有单交叉路口的平均收益之差不超过0.1,则演化结束;否则转入下一步骤;
S65:生成下一代;按照“优胜劣汰”的自然选择机制,将上一代的K个不重复的相位差可行方案按相位差可行方案增长率排序,并确定要淘汰的相位差可行方案数量K′;从可行解空间中随机挑选K′个不重复的候选相位差可行方案替代上一代淘汰的相位差可行方案,并将增长率最高的相位差可行方案直接复制到下一代,然后根据相位差可行方案的增长率用轮盘赌选择生成下一代;这里要注意的是,所挑选K′个不重复的相位差可行方案也必须与上一代中K个相位差可行方案不同;转到步骤S61。
7.根据权利要求6所述的基于演化博弈的交通信号周期自适应控制方法,其特征在于:所述的交通干线相位差可行方案指对于一个由n个交叉口组成的交通干线系统,其含有的优化相位差个数为
Figure FDA00003082763500031
Figure FDA00003082763500032
Figure FDA00003082763500033
为从交叉口ci下行至交叉口ci+1东西直行相位上ci+1相对于ci的相位差,T表示交通干线共同周期;所有可能采取行动的集合记为A(m),其中m为行动的个数,定义下行所有随机选择的行动构成的行动组合称为交通干线相位差可行方案;所述的可行解空间指所有可行行动组合的集合,记为X,并满足,且Xi∩Xj=φ.i,j∈{1,2,...,mn}。
8.根据权利要求6所述的基于演化博弈的交通信号周期自适应控制方法,其特征在于:所述的交通干线总延误 D = &Sigma; i = 2 n &alpha; i delay id + ( 1 - &alpha; i ) delay id &prime; + &Sigma; i = 1 n - 1 &beta; i delay iu + ( 1 - &beta; i ) delay iu &prime; ,其中n表示该交通干线有n个路口,delay(i+1)d=0.5qdτdd+t1),delay′(i+1)d=0.5qdτ′d 2+qdτ′d(tr-τ′d)+0.5t′dτ′dqd,qd表示交通干线下行的交通量,τd表示从车流头部行至交叉口Ji+1受阻开始直至交叉口Ji+1红灯结束的时长,
Figure FDA00003082763500045
Figure FDA00003082763500046
表示第i+1个交叉口对第i个交叉口的相位差,li表示第i+1个交叉口与第i个交叉口间的距离,vd表示交通干线下行的车速,T表示交通干线共同周期,t1表示交叉口某相位绿灯开启后,该相位路口累积的车辆全部疏散所需要的时长,t1=qdτd/(C-qd),C表示交叉口绿灯时间内相位最大通行能力,τ′d表示车流中第一辆车遇红灯受阻开始直到车流中的最后一辆车到该交叉口所需要的时长,
Figure FDA00003082763500047
,t′d=qdτ′d/C,tr表示一个周期内的红灯时长,delay(i+1)u=0.5quτuu+tu),delay′(i+1)u=0.5quτu2+quτu′(tru′)+0.5tu′τu′qu,qu表示交通干线上行的交通量,τu表示从车流头部行至交叉口Ji受阻开始直至交叉口Ji红灯结束的时长,
Figure FDA00003082763500048
Figure FDA00003082763500049
表示第i个交叉口对第i+1个交叉口的相位差,,c为周期时期时长,vu表示交通干线上行的车速,tu=quτu/(C-qu),τu′表示车流中第一辆车遇红灯受阻开始直到车流中的最后一辆车到该交叉口所需要的时长,
Figure FDA000030827635000411
,tu′=quτu′/C,如果
Figure FDA00003082763500054
则αi为1,反之αi为0,如果
Figure FDA00003082763500055
,则βi为1,反之βi为0。
9.根据权利要求6所述的基于演化博弈的交通信号周期自适应控制方法,其特征在于:所述相位差可行方案的增长率的计算方法如下:在演化的第t代,相位差可行方案Xi收益为ut(Xi),用Pt(Xi)度量在时期t使用相位差可行方案Xi的集合;用
Figure FDA00003082763500051
表示在时期t使用Xi在演化第t代的全部相位差可行方案中所占份额,n表示演化第t代中包含的相位差可行方案的个数;用状态变量θt表示这一比例构成的向量,则可得在时期t群体中平均收益 u &OverBar; t = &Sigma; X i &theta; t ( X i ) u t ( X i ) ,相位差可行方案Xi的增长率 &theta; &CenterDot; t ( X i ) = &theta; t ( X i ) [ u t ( X i ) - u &OverBar; t ] .
CN201310139809.8A 2013-04-22 2013-04-22 基于演化博弈的交通信号周期自适应控制方法 Expired - Fee Related CN103177589B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310139809.8A CN103177589B (zh) 2013-04-22 2013-04-22 基于演化博弈的交通信号周期自适应控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310139809.8A CN103177589B (zh) 2013-04-22 2013-04-22 基于演化博弈的交通信号周期自适应控制方法

Publications (2)

Publication Number Publication Date
CN103177589A true CN103177589A (zh) 2013-06-26
CN103177589B CN103177589B (zh) 2015-07-22

Family

ID=48637410

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310139809.8A Expired - Fee Related CN103177589B (zh) 2013-04-22 2013-04-22 基于演化博弈的交通信号周期自适应控制方法

Country Status (1)

Country Link
CN (1) CN103177589B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103593987A (zh) * 2013-11-13 2014-02-19 福建省视通光电网络有限公司 基于多路口信号机进行干线协调控制的方法
CN108364484A (zh) * 2018-02-22 2018-08-03 清华大学 一种基于序贯博弈的单交叉口信号配时方法
CN108364483A (zh) * 2018-02-22 2018-08-03 清华大学 基于合作博弈论成本分摊方法的单交叉口信号配时方法
CN109035766A (zh) * 2018-07-13 2018-12-18 北京工业大学 一种车联网环境下考虑可变周期的动态交通控制与诱导协同优化方法
CN109285362A (zh) * 2018-12-07 2019-01-29 北京工业大学 基于优先度规则的交叉口反溢流动态控制方法
CN109377753A (zh) * 2018-10-19 2019-02-22 江苏智通交通科技有限公司 协调方向重复放行的干线协调优化方法
CN111127881A (zh) * 2019-12-16 2020-05-08 安徽科力信息产业有限责任公司 一种区域防溢出的交通信号控制博弈方法及系统
CN113870584A (zh) * 2021-09-28 2021-12-31 中国科学技术大学先进技术研究院 基于博弈论的交通路口通行方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005010846A1 (ja) * 2003-07-23 2005-02-03 Mitsubishi Heavy Industries, Ltd. 分散信号制御システム
CN101281685A (zh) * 2008-01-30 2008-10-08 吉林大学 区域混合交通自适应信号协调控制方法
CN101325008A (zh) * 2008-07-25 2008-12-17 浙江大学 一种城市交通干线动态双向绿波带智能协调控制方法
WO2009150528A2 (en) * 2008-06-13 2009-12-17 Tmt Services And Supplies (Pty) Limited Traffic control system and method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005010846A1 (ja) * 2003-07-23 2005-02-03 Mitsubishi Heavy Industries, Ltd. 分散信号制御システム
CN101281685A (zh) * 2008-01-30 2008-10-08 吉林大学 区域混合交通自适应信号协调控制方法
WO2009150528A2 (en) * 2008-06-13 2009-12-17 Tmt Services And Supplies (Pty) Limited Traffic control system and method
CN101325008A (zh) * 2008-07-25 2008-12-17 浙江大学 一种城市交通干线动态双向绿波带智能协调控制方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李建明等: "演化博弈下单点信号灯配时优化研究", 《交通运输系统工程与信息》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103593987B (zh) * 2013-11-13 2016-01-13 福建省视通光电网络有限公司 基于多路口信号机进行干线协调控制的方法
CN103593987A (zh) * 2013-11-13 2014-02-19 福建省视通光电网络有限公司 基于多路口信号机进行干线协调控制的方法
CN108364483B (zh) * 2018-02-22 2020-07-14 清华大学 基于合作博弈论成本分摊方法的单交叉口信号配时方法
CN108364484A (zh) * 2018-02-22 2018-08-03 清华大学 一种基于序贯博弈的单交叉口信号配时方法
CN108364483A (zh) * 2018-02-22 2018-08-03 清华大学 基于合作博弈论成本分摊方法的单交叉口信号配时方法
CN108364484B (zh) * 2018-02-22 2021-03-30 清华大学 一种基于序贯博弈的单交叉口信号配时方法
CN109035766A (zh) * 2018-07-13 2018-12-18 北京工业大学 一种车联网环境下考虑可变周期的动态交通控制与诱导协同优化方法
CN109377753A (zh) * 2018-10-19 2019-02-22 江苏智通交通科技有限公司 协调方向重复放行的干线协调优化方法
CN109377753B (zh) * 2018-10-19 2021-04-30 江苏智通交通科技有限公司 协调方向重复放行的干线协调优化方法
CN109285362B (zh) * 2018-12-07 2021-03-02 北京工业大学 基于优先度规则的交叉口反溢流动态控制方法
CN109285362A (zh) * 2018-12-07 2019-01-29 北京工业大学 基于优先度规则的交叉口反溢流动态控制方法
CN111127881A (zh) * 2019-12-16 2020-05-08 安徽科力信息产业有限责任公司 一种区域防溢出的交通信号控制博弈方法及系统
CN111127881B (zh) * 2019-12-16 2021-02-12 安徽科力信息产业有限责任公司 一种区域防溢出的交通信号控制博弈方法及系统
CN113870584A (zh) * 2021-09-28 2021-12-31 中国科学技术大学先进技术研究院 基于博弈论的交通路口通行方法及系统

Also Published As

Publication number Publication date
CN103177589B (zh) 2015-07-22

Similar Documents

Publication Publication Date Title
CN103177589B (zh) 基于演化博弈的交通信号周期自适应控制方法
Xiao et al. A hybrid model based on selective ensemble for energy consumption forecasting in China
US20210375129A1 (en) Traffic Signal Pan-String Control Method and Its System
CN104900063B (zh) 一种短程行驶时间预测方法
Guo et al. An integrated MPC and deep reinforcement learning approach to trams-priority active signal control
Zaied et al. Development of a fuzzy logic traffic system for isolated signalized intersections in the State of Kuwait
CN104657538B (zh) 一种多节点航道调度的仿真方法
Zhang et al. Cooperative multi-agent actor–critic control of traffic network flow based on edge computing
CN104636823A (zh) 一种风电功率预测方法
CN104932267A (zh) 一种采用资格迹的神经网络学习控制方法
CN105083333A (zh) 一种地铁交通流优化控制方法
CN113053120B (zh) 基于迭代学习模型预测控制的交通信号灯调度方法与系统
CN103927460A (zh) 一种基于rbf的风电场短期风速预测方法
CN108897928A (zh) 一种基于嵌套蒙特卡洛树搜索的智能车坡路节能车速优化方法
CN103942422A (zh) 一种基于粒度计算的冶金企业转炉煤气柜位长期预测方法
Tunc et al. Fuzzy logic and deep Q learning based control for traffic lights
Li et al. Optimal switched control design for automatic train regulation of metro lines with time-varying passengers arrival flow
Marsetič et al. Road artery traffic light optimization with use of the reinforcement learning
CN103699933A (zh) 基于最小生成树聚类遗传算法的交通信号配时优化方法
CN105083322A (zh) 一种地铁列车冲突预警方法
CN105083335B (zh) 地铁交通流优化控制方法
CN104376387A (zh) 高拱坝工程建设中的混凝土运输排队网络优化决策方法
CN115912430A (zh) 基于云边端协同的大规模储能电站资源分配方法及系统
Lv et al. Parking space prediction algorithm based on recurrent neural network and ensemble learning algorithm
Cao et al. Research On Regional Traffic Flow Prediction Based On MGCN-WOALSTM

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150722

Termination date: 20190422

CF01 Termination of patent right due to non-payment of annual fee