CN103177589B - 基于演化博弈的交通信号周期自适应控制方法 - Google Patents
基于演化博弈的交通信号周期自适应控制方法 Download PDFInfo
- Publication number
- CN103177589B CN103177589B CN201310139809.8A CN201310139809A CN103177589B CN 103177589 B CN103177589 B CN 103177589B CN 201310139809 A CN201310139809 A CN 201310139809A CN 103177589 B CN103177589 B CN 103177589B
- Authority
- CN
- China
- Prior art keywords
- crossing
- phase differential
- phase
- period
- feasible program
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Traffic Control Systems (AREA)
Abstract
本发明设计了一种基于演化博弈的交通信号周期自适应控制方法,将演化博弈理论应用于交通信号自适应控制中,充分考虑了交通流和信号控制的动态特性,建立了信号灯自适应控制模型,应用于解决当前区域城市交通号灯控制的问题。该方法是一种完全分布式的控制方法,可以很好的解决交通系统的不确定性、随机性、非线性、局部性等特点,此外,相对于其他一些智能算法的应用,该方法的结构简单,性能稳定,具有良好的可修改性和可扩展性。
Description
技术领域
本发明涉及智能交通技术领域,特别是一种基于演化博弈的交通信号周期自适应控制方法。
背景技术
随着社会经济的不断发展,城市交通拥堵问题日益严重。城市交通控制系统作为智能交通系统的一个重要子系统,一直是研究的热点。由于交通系统具有复杂性,不确定性,时变性以及非线性等特点,现有的控制技术难以有效对其进行控制。随着科技的不断进步,采用新的控制理论和方法设计出先进的城市交通信号控制系统,改善交通控制效果,是当前智能交通控制研究的重点。
交通系统是典型的复杂系统,是城市交通设施与参与者之间共同作用的成果,难以用数学模型进行描述。交通信号控制问题可以诠释为交叉口之间的决策问题。通常利用博弈论求解多个交叉口之间的冲突、协调和竞争问题,但该理论难以描述实际系统的动态特性,且要求每个交叉口都是理性的参与者。针对经典博弈论存在的缺陷,演化博弈理论从有限理性的博弈参与人出发,不要求在完全信息下进行决策,认为交叉口不是行为最优化者,交叉口之间的决策是通过交叉口之间的模仿、学习和突变等动态过程实现的,非常适合用于描述交通系统的动态特性。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于演化博弈的交通信号周期自适应控制方法,相对于其他一些智能算法的应用,该方法的结构简单,性能稳定,具有良好的可修改性和可扩展性。
本发明采用以下方案实现:
一种基于演化博弈的交通信号周期自适应控制方法,其特征在于:采用两层递阶分布式结构,上层是区域控制层,下层是路口控制层;区域控制层主要负责每个时段周期和相位差的优化,路口控制层则负责在每一周期内绿信比的优化;所述的基于演化博弈的交通信号周期自适应控制方法按如下过程进行:
S1:在时段内的每个周期结束前的若干秒,根据实时检测的路网交通流量数据以及路口参数信息和预测信息,优化得到下一周期路口使用的绿信比;
S2:在每一个时段的最后一个周期,通过前面若干个周期采集到的路网交通流量数据,优化得到下一个时段内区域共用的周期和相位差;
S3:各路口根据过程S1、S2得到的配时方案,配置运行。
在本发明一实施例中,所述过程S1中绿信比的优化方法指在时段内的每个周期结束前的若干秒,根据实时检测的路网交通流量数据和预测信息,以基于演化博弈的优化方法得到下一周期路口使用的绿信比,具体步骤如下:
S21:演化的每一时期t,从单交叉路口的所有相位中随机挑选两个相位进行有限次数的博弈,并确定相位的博弈收益值ut;
S22:重复步骤S21直到两个相位之间达到最大的博弈次数MaxNum,并计算使用纯策略si的相位的平均博弈收益值
S23:确定相位选择纯策略si的增长率,并更新演化下一时期采用纯策略si的相位在单交叉路口的所有相位中所占的比例;
S24:重复上述步骤S22至S23,直至单交叉路口的所有相位达到演化稳定策略或者演化终止代数;
S25:根据步骤S24的结果配置单交叉路口各相位的绿灯时长,转到步骤S22。
在本发明一实施例中,所述的博弈收益值ut指第t时期,相位在博弈开始前对各种可能的纯策略带来的收益的一种预测,选择一个周期内单交叉路口平均延误时长的预测值倒数作为博弈收益值,即:其中,n1为单交叉路口相位总数;dit为第t时期单交叉路口第i个相位由Webster方法计算得到的延误值,延误值d=(c(1-λ)2)/(2(1-λx))+x2/(2q(1-x))-0.65(c/q2)1/3x2+5λ,其中c为周期时长,λ为绿信比,q为到达率,x为饱和度,x=q/(λs),s表示驶出率;相位在博弈之初,遵循以下规则预测下一周期采用某个纯策略获得的收益值,其中,纯策略si指交叉路口上的一个合理有效的配时方案;相位若选择纯策略s1,那么纯策略s1中绿灯所对应相位上的绿灯时长延长Δtex(Δtex>0),纯策略s1中红灯所对应相位上的绿灯时长增加Δt′ex(Δt′ex<0),并满足(n-1)*|Δt′ex|=Δtex;同理可得相位选择纯策略s2,s3,...,sn的预测收益值u(s2),u(s3),...,u(sn);这里通过多次观测统计历史数据的平均值来预测单交叉路口下一周期内车流量。
在本发明一实施例中,所述的确定相位选择纯策略si的增长率,并更新演化下一时期采用纯策略si的相位在单交叉路口的所有相位中所占的比例的方法如下:在演化时期t使用纯策略si的相位集合用Xt(si)表示,在演化时期t使用纯策略si的相位在单交叉路口的所有相位中所占比例其中n2表示该单交叉路口可选策略的个数,在演化时期t单交叉路口的所有相位的平均收益相位选择纯策略si的增长率
在本发明一实施例中,所述过程S2的实现方式是:每个时段起始,首先Webster方法确定干线的共同周期,并在所述过程S1的基础上确定单交叉路口绿信比,然后采用RDOC方法进行优化,并将所获得的最优相位差可行方案应用于交通干线系统;具体的控制步骤下:
S51:初始化时段包含N0个周期,p=0;
S52:当p=N0,确定干线的共同周期和交叉口绿信比;根据当前的交通需求,应用RDOC方法优化相邻交叉口之间的相位差,最后根据所得的方案调整当前干线上相邻交叉口之间的相位差;
S53:第p个周期结束,p=p+1;若p>N0,p=0;返回步骤S52。
在本发明一实施例中,所述RDOC方法的具体实现步骤如下:
S61:初始化,在可行解空间中随机挑选K个不重复的候选相位差可行方案作为第一代;
S62:相位差可行方案的收益计算;在交通干线系统中,通过计算相位差可行方案的收益值来判断相位差可行方案适应当前动态交通需求的程度;相位差可行方案的收益通过(Umax-D)计算得到,其中Umax为一个相对较大的数,D表示整个交通干线总延误;
S63:计算相位差可行方案的增长率,然后根据相位差可行方案增长率大小进行排序,选取最大增长率的相位差可行方案配置当前交通需求的交通干线系统的相位差;
S64:若此时演化代数达到规定最大演化代数T或者连续t′代所有单交叉路口的平均收益之差不超过0.1,则演化结束;否则转入下一步骤;
S65:生成下一代;按照“优胜劣汰”的自然选择机制,将上一代的K个不重复的相位差可行方案按相位差可行方案增长率排序,并确定要淘汰的相位差可行方案数量K′;从可行解空间中随机挑选K′个不重复的候选相位差可行方案替代上一代淘汰的相位差可行方案,并将增长率最高的相位差可行方案直接复制到下一代,然后根据相位差可行方案的增长率用轮盘赌选择生成下一代;这里要注意的是,所挑选K′个不重复的相位差可行方案也必须与上一代中K个相位差可行方案不同;转到步骤S61。
在本发明一实施例中,所述的交通干线相位差可行方案指对于一个由n个交叉口组成的交通干线系统,其含有的优化相位差个数为 为从交叉口ci下行至交叉口ci+1东西直行相位上ci+1相对于ci的相位差,T表示交通干线共同周期;所有可能采取行动的集合记为A(m),其中m为行动的个数,定义下行所有随机选择的行动构成的行动组合称为交通干线相位差可行方案;所述的可行解空间指所有可行行动组合的集合,记为X,并满足且Xi∩Xj=φ.i,j∈{1,2,...,mn}。
在本发明一实施例中,所述的交通干线总延误 其中n表示该交通干线有n个路口,delay(i+1)d=0.5qdτd(τd+t1), qd表示交通干线下行的交通量,τd表示从车流头部行至交叉口Ji+1受阻开始直至交叉口Ji+1红灯结束的时长, 表示第i+1个交叉口对第i个交叉口的相位差,li表示第i+1个交叉口与第i个交叉口间的距离,vd表示交通干线下行的车速,T表示交通干线共同周期,t1表示交叉口某相位绿灯开启后,该相位路口累积的车辆全部疏散所需要的时长,t1=qdτd/(C-qd),C表示交叉口绿灯时间内相位最大通行能力,τ′d表示车流中第一辆车遇红灯受阻开始直到车流中的最后一辆车到该交叉口所需要的时长,t′d=qdτ′d/C,tr表示一个周期内的红灯时长,delay(i+1)u=0.5quτu(τu+tu), qu表示交通干线上行的交通量,τu表示从车流头部行至交叉口Ji受阻开始直至交叉口Ji红灯结束的时长, 表示第i个交叉口对第i+1个交叉口的相位差,c为周期时期时长,vu表示交通干线上行的车速,tu=quτu/(C-qu),τ′u表示车流中第一辆车遇红灯受阻开始直到车流中的最后一辆车到该交叉口所需要的时长,t′u=quτ′u/C,如果则αi为1,反之αi为0,如果则βi为1,反之βi为0。
在本发明一实施例中,所述相位差可行方案的增长率的计算方法如下:在演化的第t代,相位差可行方案Xi收益为ut(Xi),用Pt(Xi)度量在时期t使用相位差可行方案Xi的集合;用表示在时期t使用Xi在演化第t代的全部相位差可行方案中所占份额,n表示演化第t代中包含的相位差可行方案的个数;用状态变量θt表示这一比例构成的向量,则可得在时期t群体中平均收益相位差可行方案Xi的增长率
本发明设计一种基于演化博弈的交通信号周期自适应控制方法,将演化博弈理论应用于交通信号灯控制中,充分考虑了交通流和信号灯控制的动态特性,建立了自适应信号灯控制模型,应用于解决城市信号控制的协调问题。该方法是一种分布式的控制方法,可以很好的解决交通系统的不确定性、随机性、非线性、局部性等特点,此外,相对于其他一些智能算法的应用,该方法的结构简单,性能稳定,具有良好的可修改性和可扩展性。
附图说明
图1是本发明实施例的交通信号灯控制示意图。
图2是信号灯控制流程示意图。
图3是RDOC方法流程。
具体实施方式
本实施例提供一种基于演化博弈的交通信号周期自适应控制方法,其特征在于:采用两层递阶分布式结构,上层是区域控制层,下层是路口控制层;区域控制层主要负责每个时段周期和相位差的优化,路口控制层则负责在每一周期内绿信比的优化;所述的基于演化博弈的交通信号周期自适应控制方法按如下过程进行:
S1:在时段内的每个周期结束前的若干秒,根据实时检测的路网交通流量数据以及路口参数信息和预测信息,优化得到下一周期路口使用的绿信比;
S2:在每一个时段的最后一个周期,通过前面若干个周期采集到的路网交通流量数据,优化得到下一个时段内区域共用的周期和相位差;
S3:各路口根据过程S1、S2得到的配时方案,配置运行。
请参考图1和图2及图3,本发明基于演化博弈的交通信号周期自适应控制优化方法,具体过程如下:
1、在时段内的每个周期结束前的若干秒,根据实时检测的路网交通流量数据和预测信息,优化得到下一周期路口使用的绿信比。具体步骤如下:
⑴演化的每一时期t,从单交叉路口的所有相位中随机挑选两个相位进行有限次数的博弈,并确定相位的博弈收益ut。第t时期,博弈收益值ut指相位在博弈开始前对各种可能的纯策略带来的收益的一种预测,选择一个周期内单交叉路口平均延误时长的预测值倒数作为博弈收益值,即:其中,n1为单交叉路口相位总数;dit为第t时期单交叉路口第i个相位由Webster方法计算得到的延误值,延误值d=(c(1-λ)2)/(2(1-λx))+x2/(2q(1-x))-0.65(c/q2)1/3x2+5λ,其中c为周期时长,λ为绿信比,q为到达率,x为饱和度,x=q/(λs),s表示驶出率。相位在博弈之初,遵循以下规则预测下一周期采用某个纯策略获得的收益值,纯策略si指交叉路口上的一个合理有效的配时方案。相位若选择纯策略s1,那么s1纯策略中绿灯所对应相位上的绿灯时长延长Δtex(Δtex>0),s1纯策略中红灯所对应相位上的绿灯时长增加Δt′ex(Δt′ex<0),并满足(n-1)*|Δt′ex|=Δtex。同理可得相位选择纯策略s2,s3,...,sn的预测收益值u(s2),u(s3),...,u(sn)。这里通过多次观测统计历史数据的平均值来预测单交叉路口下一周期内车流量。
⑵重复步骤(1)直到两个相位之间达到最大的博弈次数MaxNum,并计算使用纯策略si的相位的平均收益。
⑶确定相位选择纯策略si的增长率,并更新演化下一时期采用纯策略si的相位在单交叉路口的所有相位中所占的比例的方法如下:在演化时期t使用纯策略si的相位集合用Xt(si)表示,那么在演化时期t使用纯策略si的相位在单交叉路口的所有相位中所占比例其中n2表示该单交叉路口可选策略的个数,在演化时期t单交叉路口的所有相位的平均收益 相位选择纯策略si的增长率
⑷重复上述步骤(2)至(3),直至单交叉路口的所有相位达到演化稳定策略或者演化终止代数。
⑸根据步骤(4)的结果配置单交叉路口各相位的绿灯时长,转到步骤(2)。
2、在每一个时段的最后一个周期,通过前面若干个周期采集到的路网交通流量数据,优化得到下一个时段内区域共用的周期和相位差。每个时段起始,首先确定Webster干线的共同周期,并在过程1的基础上确定单交叉路口绿信比,然后采用RDOC方法进行优化,并将所获得的最优相位差可行方案应用于交通干线系统。具体的控制步骤下:
⑴初始化时段包含N0个周期,p=0。
⑵当p=N0,确定干线的共同周期和交叉口绿信比。根据当前的交通需求,应用RDOC方法优化相邻交叉口之间的相位差,最后根据所得的方案调整当前干线上相邻交叉口之间的相位差。
⑶第p个周期结束,p=p+1。若p>N0,p=0。返回步骤(2)。
其中RDOC方法通过如下具体步骤实现:
1)初始化。在可行解空间中随机挑选K个不重复的候选相位差可行方案作为第一代。对于一个由n个交叉口组成的交通干线系统,其含有的优化相位差个数为 为从交叉口ci下行至交叉口ci+1东西直行相位上ci+1相对于ci的相位差,T表示交通干线共同周期。所有可能采取行动的集合记为A(m),其中m为行动的个数,定义下行所有随机选择的行动构成的行动组合称为交通干线相位差可行方案。可行解空间即为所有可行行动组合的集合,记为X,并满足 且Xi∩Xj=φ.i,j∈{1,2,...,mn}。
2)相位差可行方案的收益计算。在交通干线系统中,可以通过计算相位差可行方案的收益值来判断相位差可行方案适应当前动态交通需求的程度。相位差可行方案的收益通过(Umax-D)计算得到,其中Umax为一个相对较大的数,D表示整个交通干线总延误。总延误 其中n表示该交通干线有n个路口,delayid=0.5qdτd(τd+t1), qd表示交通干线下行的交通量,τd表示从车流头部行至交叉口Ji+1受阻开始直至交叉口Ji+1红灯结束的时长, 表示第i+1个交叉口对第i个交叉口的相位差,li表示第i+1个交叉口与第i个交叉口间的距离,vd表示交通干线下行的车速,T表示交通干线共同周期,t1表示交叉口某相位绿灯开启后,该相位路口累积的车辆全部疏散所需要的时长,t1=qdτd/(C-qd),C表示交叉口绿灯时间内相位最大通行能力,τ′d表示车流中第一辆车遇红灯受阻开始直到车流中的最后一辆车到该交叉口所需要的时长,t′d=qdτ′d/C,tr表示一个周期内的红灯时长,delay(i+1)u=0.5quτu(τu+tu), qu表示交通干线上行的交通量,τu表示从车流头部行至交叉口Ji受阻开始直至交叉口Ji红灯结束的时长, 表示第i个交叉口对第i+1个交叉口的相位差,c为周期时期时长,vu表示交通干线上行的车速,tu=quτu/(C-qu),τ′u表示车流中第一辆车遇红灯受阻开始直到车流中的最后一辆车到该交叉口所需要的时长,t′u=quτ′u/C,如果则αi为1,反之αi为0,如果则βi为1,反之βi为0。
3)计算相位差可行方案的增长率,然后根据相位差可行方案增长率大小进行排序,选取最大增长率的相位差可行方案配置当前交通需求的交通干线系统的相位差。相位差可行方案的增长率的计算方法如下:在演化的第t代,相位差可行方案Xi收益为ut(Xi),用Pt(Xi)度量在时期t使用相位差可行方案Xi的集合;用表示在时期t使用Xi在演化第t代的全部相位差可行方案中所占份额,n表示演化第t代中包含的相位差可行方案的个数;用状态变量θt表示这一比例构成的向量,则可得在时期t群体中平均收益相位差可行方案Xi的增长率
4)若此时演化代数达到规定最大演化代数T或者连续t′代所有单交叉路口的平均收益之差不超过0.1,则演化结束。否则转入下一步骤。
5)生成下一代。按照“优胜劣汰”的自然选择机制,将上一代的K个不重复的相位差可行方案按相位差可行方案增长率排序,并确定要淘汰的相位差可行方案数量K′。从可行解空间中随机挑选K′个不重复的候选相位差可行方案替代上一代淘汰的相位差可行方案,并将增长率最高的相位差可行方案直接复制到下一代,然后根据相位差可行方案的增长率用轮盘赌选择生成下一代。这里要注意的是,所挑选K′个不重复的相位差可行方案也必须与上一代中K个相位差可行方案不同。转到步骤1)。
3、各路口根据过程1、2得到的配时方案,配置运行。
以上是本发明的较佳实施例,凡依本发明技术方案所作的改变,所产生的功能作用未超出本发明技术方案的范围时,均属于本发明的保护范围。
Claims (7)
1.一种基于演化博弈的交通信号周期自适应控制方法,其特征在于:采用两层递阶分布式结构,上层是区域控制层,下层是路口控制层;区域控制层主要负责每个时段周期和相位差的优化,路口控制层则负责在每一周期内绿信比的优化;所述的基于演化博弈的交通信号周期自适应控制方法按如下过程进行:
S1:在时段内的每个周期结束前的若干秒,根据实时检测的路网交通流量数据以及路口参数信息和预测信息,优化得到下一周期路口使用的绿信比;
S2:在每一个时段的最后一个周期,通过前面若干个周期采集到的路网交通流量数据,优化得到下一个时段内区域共用的周期和相位差;
S3:各路口根据过程S1、S2得到的配时方案,配置运行;
所述过程S1中绿信比的优化方法指在时段内的每个周期结束前的若干秒,根据实时检测的路网交通流量数据以及路口参数信息和预测信息,以基于演化博弈的优化方法得到下一周期路口使用的绿信比,具体步骤如下:
S21:演化的每一时期t,从单交叉路口的所有相位中随机挑选两个相位进行有限次数的博弈,并确定相位的博弈收益值ut;
S22:重复步骤S21直到两个相位之间达到最大的博弈次数MaxNum,并计算使用纯策略si的相位的平均博弈收益值
S23:确定相位选择纯策略si的增长率,并更新演化下一时期采用纯策略si的相位在单交叉路口的所有相位中所占的比例;
S24:重复上述步骤S22至S23,直至单交叉路口的所有相位达到演化稳定策略或者演化终止代数;
S25:根据步骤S24的结果配置单交叉路口各相位的绿灯时长,转到步骤S22;
所述的博弈收益值ut指第t时期,相位在博弈开始前对各种可能的纯策略带来的收益的一种预测,选择一个周期内单交叉路口平均延误时长的预测值倒数作为博弈收益值,即:其中,n1为单交叉路口相位总数;dit为第t时期单交叉路口第i个相位由Webster方法计算得到的延误值,延误值d=(c(1-λ)2)/(2(1-λx))+x2/(2q(1-x))-0.65(c/q2)1/3x2+5λ,其中c为周期时长,λ为绿信比,q为到达率,x为饱和度,x=q/(λs),s表示驶出率;相位在博弈之初,遵循以下规则预测下一周期采用某个纯策略获得的收益值,其中,纯策略si指交叉路口上的一个合理有效的配时方案;相位若选择纯策略s1,那么纯策略s1中绿灯所对应相位上的绿灯时长延长Δtex(Δtex>0),纯策略s1中红灯所对应相位上的绿灯时长增加Δt′ex(Δt′ex<0),并满足(n-1)*|Δt′ex|=Δtex;同理可得相位选择纯策略s2,s3,…,sn的预测收益值u(s2),u(s3),…,u(sn);这里通过多次观测统计历史数据的平均值来预测单交叉路口下一周期内车流量。
2.根据权利要求1所述的基于演化博弈的交通信号周期自适应控制方法,其特征在于:所述的确定相位选择纯策略si的增长率,并更新演化下一时期采用纯策略si的相位在单交叉路口的所有相位中所占的比例的方法如下:在演化时期t使用纯策略si的相位集合用Xt(si)表示,在演化时期t使用纯策略si的相位在单交叉路口的所有相位中所占比例其中n2表示该单交叉路口可选策略的个数,在演化时期t单交叉路口的所有相位的平均收益 相位选择纯策略si的增长率
3.根据权利要求1所述的基于演化博弈的交通信号周期自适应控制方法,其特征在于:所述过程S2的实现方式是:每个时段起始,首先Webster方法确定干线的共同周期,并在所述过程S1的基础上确定单交叉路口绿信比,然后采用RDOC方法进行优化,并将所获得的最优相位差可行方案应用于交通干线系统;具体的控制步骤如下:
S51:初始化时段包含N0个周期,p=0;
S52:当p=N0,确定干线的共同周期和交叉口绿信比;根据当前的交通需求,应用RDOC方法优化相邻交叉口之间的相位差,最后根据所得的方案调整当前干线上相邻交叉口之间的相位差;
S53:第p个周期结束,p=p+1;若p>N0,p=0;返回步骤S52。
4.根据权利要求3所述的基于演化博弈的交通信号周期自适应控制方法,其特征在于:所述RDOC方法的具体实现步骤如下:
S61:初始化,在可行解空间中随机挑选K个不重复的候选相位差可行方案作为第一代;
S62:相位差可行方案的收益计算;在交通干线系统中,通过计算相位差可行方案的收益值来判断相位差可行方案适应当前动态交通需求的程度;相位差可行方案的收益通过(Umax-D)计算得到,其中Umax为一个较大的数,D表示整个交通干线总延误;
S63:计算相位差可行方案的增长率,然后根据相位差可行方案增长率大小进行排序,选取最大增长率的相位差可行方案配置当前交通需求的交通干线系统的相位差;
S64:若此时演化代数达到规定最大演化代数T或者连续t′代所有单交叉路口的平均收益之差不超过0.1,则演化结束;否则转入下一步骤;
S65:生成下一代;按照“优胜劣汰”的自然选择机制,将上一代的K个不重复的相位差可行方案按相位差可行方案增长率排序,并确定要淘汰的相位差可行方案数量K′;从可行解空间中随机挑选K′个不重复的候选相位差可行方案替代上一代淘汰的相位差可行方案,并将增长率最高的相位差可行方案直接复制到下一代,然后根据相位差可行方案的增长率用轮盘赌选择生成下一代;这里要注意的是,所挑选K′个不重复的相位差可行方案也必须与上一代中K个相位差可行方案不同;转到步骤S61。
5.根据权利要求4所述的基于演化博弈的交通信号周期自适应控制方法,其特征在于:所述的交通干线相位差可行方案指对于一个由n个交叉口组成的交通干线系统,其含有的优化相位差个数为 为从交叉口ci下行至交叉口ci+1东西直行相位上ci+1相对于ci的相位差,T表示交通干线共同周期;所有可能采取行动的集合记为A(m),其中m为行动的个数,定义下行所有随机选择的行动构成的行动组合称为交通干线相位差可行方案;所述的可行解空间指所有可行行动组合的集合,记为X,并满足 且Xi∩Xj=φ.i,j∈{1,2,…,mn}。
6.根据权利要求4所述的基于演化博弈的交通信号周期自适应控制方法,其特征在于:所述的交通干线总延误 其中n表示该交通干线有n个路口,delayid=0.5qdτd(τd+t1),qd表示交通干线下行的交通量,τd表示从车流头部行至交叉口Ji+1受阻开始直至交叉口Ji+1红灯结束的时长, 表示第i+1个交叉口对第i个交叉口的相位差,li表示第i+1个交叉口与第i个交叉口间的距离,vd表示交通干线下行的车速,T表示交通干线共同周期,t1表示交叉口某相位绿灯开启后,该相位路口累积的车辆全部疏散所需要的时长,t1=qdτd/(C-qd),C表示交叉口绿灯时间内相位最大通行能力,τ′d表示车流中第一辆车遇红灯受阻开始直到车流中的最后一辆车到该交叉口所需要的时长,t′d=qdτ′d/C,tr表示一个周期内的红灯时长,delay(i+1)u=0.5quτu(τu+tu),qu表示交通干线上行的交通量,τu表示从车流头部行至交叉口Ji受阻开始直至交叉口Ji红灯结束的时长, 表示第i个交叉口对第i+1个交叉口的相位差,c为周期时期时长,vu表示交通干线上行的车速,tu=quτu/(C-qu),τ′u表示车流中第一辆车遇红灯受阻开始直到车流中的最后一辆车到该交叉口所需要的时长,t′u=quτ′u/C,如果则αi为1,反之αi为0,如果则βi为1,反之βi为0。
7.根据权利要求4所述的基于演化博弈的交通信号周期自适应控制方法,其特征在于:所述相位差可行方案的增长率的计算方法如下:在演化的第t代,相位差可行方案Xi收益为ut(Xi),用Pt(Xi)度量在时期t使用相位差可行方案Xi的集合;用表示在时期t使用Xi在演化第t代的全部相位差可行方案中所占份额,n表示演化第t代中包含的相位差可行方案的个数;用状态变量θt表示这一比例构成的向量,则可得在时期t群体中平均收益 相位差可行方案Xi的增长率
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310139809.8A CN103177589B (zh) | 2013-04-22 | 2013-04-22 | 基于演化博弈的交通信号周期自适应控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310139809.8A CN103177589B (zh) | 2013-04-22 | 2013-04-22 | 基于演化博弈的交通信号周期自适应控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103177589A CN103177589A (zh) | 2013-06-26 |
CN103177589B true CN103177589B (zh) | 2015-07-22 |
Family
ID=48637410
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310139809.8A Expired - Fee Related CN103177589B (zh) | 2013-04-22 | 2013-04-22 | 基于演化博弈的交通信号周期自适应控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103177589B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109035766A (zh) * | 2018-07-13 | 2018-12-18 | 北京工业大学 | 一种车联网环境下考虑可变周期的动态交通控制与诱导协同优化方法 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103593987B (zh) * | 2013-11-13 | 2016-01-13 | 福建省视通光电网络有限公司 | 基于多路口信号机进行干线协调控制的方法 |
CN108364483B (zh) * | 2018-02-22 | 2020-07-14 | 清华大学 | 基于合作博弈论成本分摊方法的单交叉口信号配时方法 |
CN108364484B (zh) * | 2018-02-22 | 2021-03-30 | 清华大学 | 一种基于序贯博弈的单交叉口信号配时方法 |
CN109377753B (zh) * | 2018-10-19 | 2021-04-30 | 江苏智通交通科技有限公司 | 协调方向重复放行的干线协调优化方法 |
CN109285362B (zh) * | 2018-12-07 | 2021-03-02 | 北京工业大学 | 基于优先度规则的交叉口反溢流动态控制方法 |
CN111127881B (zh) * | 2019-12-16 | 2021-02-12 | 安徽科力信息产业有限责任公司 | 一种区域防溢出的交通信号控制博弈方法及系统 |
CN113870584B (zh) * | 2021-09-28 | 2023-01-10 | 中国科学技术大学先进技术研究院 | 基于博弈论的交通路口通行方法及系统 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2003252237A1 (en) * | 2003-07-23 | 2005-02-14 | Mitsubishi Corporation | Distributed signal control system |
CN101281685B (zh) * | 2008-01-30 | 2010-08-25 | 吉林大学 | 区域混合交通自适应信号协调控制方法 |
WO2009150528A2 (en) * | 2008-06-13 | 2009-12-17 | Tmt Services And Supplies (Pty) Limited | Traffic control system and method |
CN101325008A (zh) * | 2008-07-25 | 2008-12-17 | 浙江大学 | 一种城市交通干线动态双向绿波带智能协调控制方法 |
-
2013
- 2013-04-22 CN CN201310139809.8A patent/CN103177589B/zh not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109035766A (zh) * | 2018-07-13 | 2018-12-18 | 北京工业大学 | 一种车联网环境下考虑可变周期的动态交通控制与诱导协同优化方法 |
Also Published As
Publication number | Publication date |
---|---|
CN103177589A (zh) | 2013-06-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103177589B (zh) | 基于演化博弈的交通信号周期自适应控制方法 | |
Xiao et al. | A hybrid model based on selective ensemble for energy consumption forecasting in China | |
Bi et al. | Type-2 fuzzy multi-intersection traffic signal control with differential evolution optimization | |
CN101706335B (zh) | 一种基于遗传算法优化bp神经网络的风电功率预测方法 | |
CN103581188B (zh) | 一种网络安全态势预测方法及系统 | |
CN104636823B (zh) | 一种风电功率预测方法 | |
CN102622418B (zh) | 一种基于bp神经网络的预测装置及设备 | |
CN110570672B (zh) | 一种基于图神经网络的区域交通信号灯控制方法 | |
Zaied et al. | Development of a fuzzy logic traffic system for isolated signalized intersections in the State of Kuwait | |
CN108010378A (zh) | 停车场泊位占用率预测方法、装置、设备及存储介质 | |
CN110085027B (zh) | 一种大规模路网群体车流诱导任务的分解方法 | |
Tunc et al. | Fuzzy logic and deep Q learning based control for traffic lights | |
CN102622515A (zh) | 一种天气预测方法 | |
CN104504520A (zh) | 一种基于神经网络的深空探测器自主任务规划方法 | |
CN113516277B (zh) | 一种基于路网动态定价的网联智能交通路径规划方法 | |
Tagliaferri et al. | A real-time strategy-decision program for sailing yacht races | |
CN103699933A (zh) | 基于最小生成树聚类遗传算法的交通信号配时优化方法 | |
Zhao et al. | Traffic signal control with deep reinforcement learning | |
CN104809890A (zh) | 基于主成分分析和局部搜索改进正交遗传算法的交通信号配时优化方法 | |
Zhao et al. | Enhancing traffic signal control with composite deep intelligence | |
CN116758767B (zh) | 基于多策略强化学习的交通信号灯控制方法 | |
CN117592602A (zh) | 一种基于时空图常微分方程的地铁客流量预测方法及系统 | |
KR102059902B1 (ko) | 교통 속도 추정 방법 및 시스템 | |
CN116843500A (zh) | 充电站规划方法、神经网络模型训练方法、装置和设备 | |
De Aquino et al. | Echo state networks, artificial neural networks and fuzzy systems models for improve short-term wind speed forecasting |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20150722 Termination date: 20190422 |