CN108364484B - 一种基于序贯博弈的单交叉口信号配时方法 - Google Patents

一种基于序贯博弈的单交叉口信号配时方法 Download PDF

Info

Publication number
CN108364484B
CN108364484B CN201810153796.2A CN201810153796A CN108364484B CN 108364484 B CN108364484 B CN 108364484B CN 201810153796 A CN201810153796 A CN 201810153796A CN 108364484 B CN108364484 B CN 108364484B
Authority
CN
China
Prior art keywords
phase
period
sequential
sequential game
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810153796.2A
Other languages
English (en)
Other versions
CN108364484A (zh
Inventor
胡坚明
裴欣
潘旭冉
张毅
张佐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN201810153796.2A priority Critical patent/CN108364484B/zh
Publication of CN108364484A publication Critical patent/CN108364484A/zh
Application granted granted Critical
Publication of CN108364484B publication Critical patent/CN108364484B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/07Controlling traffic signals
    • G08G1/08Controlling traffic signals according to detected number or speed of vehicles

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于序贯博弈的单交叉口信号配时方法,其特征在于包括以下步骤:1)建立表征单交叉口各相位信号配时时间的无穷期序贯博弈模型,并确定该模型的收益函数和贴现因子;2)通过车路协同系统获取单交叉口当前周期各相位的收益函数计算参数以及上一周期各个相位的排队长度,用于序贯模型博弈计算;3)将单交叉口各相位作为无穷期序贯博弈模型的参与者进行序贯博弈,根据得到的序贯博弈均衡解以及单交叉口的周期时长,计算得到单交叉口各个相位在当前周期下分配得到的通行时间。本发明可以广泛应用于单交叉口信号配时领域中。

Description

一种基于序贯博弈的单交叉口信号配时方法
技术领域
本发明涉及交通路网中单交叉口的信号配时技术,尤其是一种基于序贯博弈的单交叉口信号配时方法。
背景技术
在城市交通系统中,交叉口信号配时是解决交通拥堵现象的基础。通过合理的信号配时、协调与优化,可以有效提高城市主干路交通的流畅性和安全性,在极大程度上缓解城市交通压力。然而,在实际中,很多城市交叉口配时仅采用最简单的配时方法,在效率上还有很大的提升空间。
基于此,研究单交叉口信号配时技术,是一个很有经济价值和理论价值的事情。从目前流行的方法来看,大致分为以下几类:
1.Webster配时法。
Webster配时法是以交叉口车辆延误的估计为基础,通过对周期内不同信号相位的时间优化确定一系列配时参数。对于n个信号相位的交叉口,其目标函数就是一周期内的总延误,即:
Figure BDA0001580563450000011
式中,D为车辆总延误,di为第i个相位的单车延误,qi为第i个相位的车辆到达率。
通过总延误的表达,可以归纳为一个关于周期长度,具体信号分配的优化问题。求解方法为F-W方法(Frank-Wolfe算法,一种改进的梯度下降算法),计算搜索方向,优化搜索步长。其最大的弊病在于模型受到交通量大小的影响,使用范围有限。当交通流量较小时,容易造成相位信号时间设置过短,不利于行车安全。当交通流量过大时,交通流饱和度增大导致延误计算的误差增大,使得配时效率降低。
2.遗传算法。
遗传算法是通过模拟自然生物进化过程的随机化高效全局搜索最优解的算法。通过选择、交叉和变异三个主要的遗传算子,在不断的遗传(迭代)过程中迅速收敛,得到最优解。遗传算法可以通过合理的编码方式提升运行速度和精度,在大空间搜索条件下有非常好的运算效率。但是这种方法要求的计算量过大,在交通路网节点增加时可能导致计算量的急剧膨胀。
3.基于排队长度的配时技术。
建立控制目标为最小的平均排队长度的优化问题,通过求解优化问题得到具体配时参数。这个方法的局限是不能反映局部路段的信息,因此存在精度不足的问题。
发明内容
针对上述问题,本发明的目的是提供一种基于序贯博弈的单交叉口信号配时方法,采用该配时方法能够有效降低单交叉口各相位的平均排队长度。
为实现上述目的,本发明采取以下技术方案:一种基于序贯博弈的单交叉口信号配时方法,其特征在于包括以下步骤:1)建立表征单交叉口各相位信号配时时间的无穷期序贯博弈模型,并确定该模型的收益函数和贴现因子;2)通过车路协同系统获取单交叉口当前周期各相位的收益函数计算参数以及上一周期各个相位的排队长度,用于序贯模型博弈计算;3)将单交叉口各相位作为无穷期序贯博弈模型的参与者进行序贯博弈,根据得到的序贯博弈均衡解以及单交叉口的周期时长,计算得到单交叉口各个相位在当前周期下分配得到的通行时间。
所述步骤1)中,单交叉口信号配时的无穷期序贯博弈模型的收益函数为:
Figure BDA0001580563450000021
式中,Q为进车口通行能力,t1为该相位当前周期内通行时间(即该相位绿时时长),T为周期时长,L为该相位前一周期的排队长度,q为车辆到达率,H为不变量,用于保证收益与排队长度的负相关关系。
所述步骤1)中,单交叉口信号配时的无穷期序贯博弈模型的贴现因子的计算公式为:
Figure BDA0001580563450000022
式中,t1为该相位当前周期内通行时间,T为周期时长,W为单相位收益函数,t1′=t1+Δt,代表t1时间后下一次采样时间,Δt为采样间隔。
所述步骤3)中,将单交叉口各相位作为无穷期序贯博弈模型的参与者进行序贯博弈的方法,包括以下步骤:3.1)将单交叉口的四个相位的相邻相位分为两组,两组相位视为整体作为第一轮序贯博弈的参与者;3.2)根据获取的单交叉口当前周期内各相位的收益函数计算参数以及上一周期各个相位的排队长度,计算得到当前周期内各个相位的收益函数值及贴现因子;3.3)将每一参与者内两个相位单独的收益函数值之和作为该参与者的收益函数值进行序贯博弈,得到第一轮参与者进行序贯博弈的均衡解,并根据单交叉口的周期时长,得到两组相位分配得到的时间总和;3.4)将步骤3.1)中每一组内的两个相位分别作为序贯博弈模型的参与者进行第二轮序贯博弈,得到各组内两个相位的分配时间比例,再根据步骤3.3)得到的每组相位所分配的时间总和,计算得到各个相位所需的具体分配时间。
所述步骤3.3)中,进行第一轮序贯博弈时:根据两参与者内两个相位单独的收益函数值,计算得到两参与者的总收益函数值;根据两参与者的总收益函数值,计算得到序贯博弈模型的贴现因子;采用子博弈精炼纳什均衡方法,计算得到序贯博弈模型的均衡解,即两个参与者的分配的时间比例关系;根据给定的单交叉口的周期时长T,得到两个参与者的分配时间,也即两组相位的分配时间总和。
本发明由于采取以上技术方案,其具有以下优点:1、本发明将序贯博弈模型应用到单交叉口各相位的信号配时中,避免了交通量大小对单交叉口信号配时的影响,对在对过饱和单交叉口配时时,产生较好的改进效果。2、本发明根据单交叉口各个相位前一周期的收益函数计算参数计算得到当前周期的分配时长,具有很好的适应性,运算效率好,相比于经典配时方法,平均排队长度下降约7%。因此,本发明可以广泛应用于单交叉口信号配时领域中。
附图说明
图1(a)~图1(d)分别是采用经典配时方法和本发明配时方法下单交叉口各相位的平均排队长度;其中,曲线1为采用经典配时方法下的结果,曲线2为采用本发明配时方法下的结果。
具体实施方式
下面结合附图和实施例对本发明进行详细的描述。然而应当理解,附图的提供仅为了更好地理解本发明,它们不应该理解成对本发明的限制。
序贯博弈是一种非常典型的完全信息下的动态博弈过程。序贯博弈所描述的是两个参与者轮流提出提议,当另一方接受提议时,谈判结束,双方各获得自己的赢得值。序贯博弈模型中与普通动态博弈不同的一点在于,该模型中“贴现因子”的存在。“贴现因子”代表的含义是每进行一轮谈判,双方的收益都需要乘以特定的在0与1之间的乘数。因此,在序贯博弈模型中,双方都不能在不断推迟谈判的过程中得到收益。正是在这个假设下,双方都有在最初的谈判时达成协议的意愿。序贯博弈模型可以分为两种情况,简单序贯博弈和无穷期序贯博弈,下面对两种情况下的序贯博弈过程进行简单介绍。
一、在简单情况下(简单序贯博弈):
假设贴现因子为δ,谈判共计三个阶段:
在第一阶段,参与者1根据收益函数提出分配方案(s1,1-s1),其中,s1和1-s1分别为参与者1提出的两者的归一化后的分配值。
在第二阶段,参与者2选择是否接受参与者1的方案。如果参与者2接受提议,那么谈判以分配方案(s1,1-s1)结束。如果参与者2拒绝,那么参与者2于第二阶段根据收益函数重新提出分配方案(s2,1-s2),其中,s2和1-s2分别为参与者2提出的两者归一化后的分配值。
在第三阶段,参与者1选择是否接受参与者2的方案。如果参与者1接受提议,那么谈判以分配方案(s2,1-s2)结束。如果参与者1拒绝,谈判会在最终以(s,1-s)的分配方式结束。具体的,采用子博弈精炼纳什均衡方法,分步进行简单序贯博弈模型求解,得到简单序贯博弈模型的均衡解:
参与者1选择{s1,接受}
参与者2选择{接受,s2}
其中,s1=1-δ(1-δs),s2=δs,δ为序贯博弈模型的贴现因子,s=1/(1+δ)。
二、在复杂情况下(无穷期序贯博弈):
在前两个阶段,无穷期序贯博弈模型与简单序贯博弈模型相同。
在第三个阶段,如果参与者1接受提议,那么谈判仍以分配方案(s2,1-s2)结束。如果参与者1拒绝,谈判并不会像简单序贯博弈模型中以固定的分配方式结束。在无穷期模型中,参与者1会继续提出分配方案,即重新回到第一阶段。谈判会一直进行下去,直到某一方参与者接受另一方的提案。
通过观察可以发现,无穷期序贯博弈模型中从第三阶段开始的博弈和从第一阶段开始的博弈是相似的。在这个基础上,根据子博弈精炼纳什均衡方法,得到均衡解:
参与者1提出(s,1-s)的分配方案,并且与参与者2达成协议,不需要再进行之后的谈判博弈。如果参与者2拒绝参与者1的分配方案,他也无法获得更高的收益,因而没有进行之后的谈判的必要。其中,s=1/(1+δ)。也就是无穷期序贯博弈模型中最后的均衡解为:s1=1/(1+δ)、s2=1-s1=δ/(1+δ)。
基于上述序贯博弈的基本理论知识,本发明提供一种基于序贯博弈的单交叉口信号配时方法,包括以下步骤:
1)建立表征单交叉口各相位信号配时时间的无穷期序贯博弈模型,并确定该模型的收益函数和贴现因子。
本发明将序贯博弈模型应用在实际的单交叉口信号配时中,建立序贯博弈参与者的单相位收益函数为:
Figure BDA0001580563450000041
式中,Q为进车口通行能力,t1为该相位当前周期内通行时间(即该相位绿时时长),T为周期时长,L为该相位前一周期的排队长度,q为车辆到达率,H为不变量,用于保证收益与排队长度的负相关关系,本发明中H取为2000。该收益函数的目标是量化单个相位车辆的平均排队时长,从而反应出单交叉口的通行效率。
本发明采用的贴现因子δ为:
Figure BDA0001580563450000051
式中,t1为该相位当前周期内通行时间,T为周期时长,W为单相位收益函数,t1′=t1+Δt,代表t1时间后下一次采样时间,Δt为采样间隔。本发明中贴现因子δ的实际意义为将谈判推迟到下一阶段所带来的总收益的减小比例,与经济学模型中的贴现因子含义吻合。
2)通过车路协同系统获取单交叉口当前周期各相位的收益函数计算参数以及上一周期各个相位的排队长度,用于序贯模型博弈计算。
3)将单交叉口各相位作为无穷期序贯博弈模型的参与者进行序贯博弈,根据得到的序贯博弈均衡解以及单交叉口的周期时长,计算得到单交叉口各个相位在当前周期下分配得到的通行时间,即绿时时长。
将单交叉口各相位作为无穷期序贯博弈模型的参与者进行序贯博弈的方法,包括以下步骤:
3.1)将单交叉口的四个相位的相邻相位分为两组,两组相位视为整体作为第一轮序贯博弈的参与者;
3.2)根据获取的单交叉口当前周期内各相位的收益函数计算参数以及上一周期各个相位的排队长度,计算得到当前周期内各个相位的收益函数值及贴现因子;
3.3)将每一参与者内两个相位单独的收益函数值之和作为该参与者的收益函数值进行序贯博弈,得到第一轮参与者进行序贯博弈的均衡解,并根据单交叉口的周期时长,得到两组相位分配得到的时间总和;
具体的,进行第一轮序贯博弈时:根据两参与者内两个相位单独的收益函数值,计算得到两参与者的总收益函数值;
根据两参与者的总收益函数值,计算得到序贯博弈模型的贴现因子;
采用子博弈精炼纳什均衡方法,计算得到序贯博弈模型的均衡解,即两个参与者的分配的时间比例关系;
根据给定的单交叉口的周期时长T,得到两个参与者的分配时间,也即两组相位的分配时间总和。
3.4)将步骤3.1)中每一组内的两个相位分别作为序贯博弈模型的参与者进行第二次序贯博弈,得到各组内两个相位的分配时间比例,再根据步骤3.3)得到的每组相位所分配的时间总和,计算得到各个相位所需的具体分配时间。
实施例
本发明采用PTV-VISSIM建模工具进行仿真与测试。具体的,在PTV-VISSIM中搭建四相位单交叉口,添加各相位的出入车流量,模仿真实交叉口情况。通过添加传感器可以得到各个时刻各相位排队长度,从而得到各相位的效益函数以及总效益函数。
由于序贯博弈模型只涉及两个相位之间的比较,本实施例中进行四相位配时先将1,2相位作为整体视为参与者1,将3,4相位作为整体视为参与者2,两参与者1,2进行序贯博弈,在给定周期时间下得到参与者1和参与者2的分配时间,也就是相位1、2的分配时间总和以及相位3、4的分配时间总和。
如图1(a)~图1(d)所示,图中曲线1代表经典配时方案下各相位的实时排队长度,曲线2代表采用本发明方法时各相位的实时排队长度。通过计算曲线下包围的面积即可比较各相位的平均排队长度,通过计算可知,采用本发明方法比经典配时方案下各相位的平均排队长度下降约7%。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (2)

1.一种基于序贯博弈的单交叉口信号配时方法,其特征在于包括以下步骤:
1)建立表征单交叉口各相位信号配时时间的无穷期序贯博弈模型,并确定该模型的收益函数和贴现因子;
其中,单交叉口信号配时的无穷期序贯博弈模型的收益函数为:
Figure FDA0002788624910000011
式中,Q为进车口通行能力,t1为该相位当前周期内通行时间,T为周期时长,L为该相位前一周期的排队长度,q为车辆到达率,H为不变量,用于保证收益与排队长度的负相关关系;
单交叉口信号配时的无穷期序贯博弈模型的贴现因子的计算公式为:
Figure FDA0002788624910000012
式中,t1为该相位当前周期内通行时间,T为周期时长,W为单相位收益函数,t1′=t1+Δt,代表t1时间后下一次采样时间,Δt为采样间隔;
2)通过车路协同系统获取单交叉口当前周期各相位的计算参数以及上一周期各个相位的排队长度,用于序贯博弈模型计算;
3)将单交叉口各相位作为无穷期序贯博弈模型的参与者进行序贯博弈,根据得到的序贯博弈均衡解以及单交叉口的周期时长,计算得到单交叉口各个相位在当前周期下分配得到的通行时间;
所述步骤3)中,将单交叉口各相位作为无穷期序贯博弈模型的参与者进行序贯博弈的方法,包括以下步骤:
3.1)将单交叉口的四个相位的相邻相位分为两组,两组相位视为整体作为第一轮序贯博弈的参与者;
3.2)根据获取的单交叉口当前周期内各相位的计算参数值以及上一周期各个相位的排队长度,计算得到当前周期内各个相位的收益函数值及贴现因子;
3.3)将每一参与者内两个相位单独的收益函数值之和作为该参与者的收益函数值进行序贯博弈,得到第一轮参与者进行序贯博弈的均衡解,并根据单交叉口的周期时长,得到两组相位分配得到的时间总和;
3.4)将步骤3.1)中每一组内的两个相位分别作为序贯博弈模型的参与者进行第二次序贯博弈,得到各组内两个相位的分配时间比例,再根据步骤3.3)得到的每组相位所分配的时间总和,计算得到各个相位所需的具体分配时间。
2.如权利要求1所述的一种基于序贯博弈的单交叉口信号配时方法,其特征在于:所述步骤3.3)中,进行第一轮序贯博弈时:
根据两参与者内两个相位单独的收益函数值,计算得到两参与者的总收益函数值;
根据两参与者的总收益函数值,计算得到序贯博弈模型的贴现因子;
采用子博弈精炼纳什均衡方法,计算得到序贯博弈模型的均衡解,即两个参与者的分配的时间比例关系;
根据给定的单交叉口的周期时长T,得到两个参与者的分配时间,也即两组相位的分配时间总和。
CN201810153796.2A 2018-02-22 2018-02-22 一种基于序贯博弈的单交叉口信号配时方法 Active CN108364484B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810153796.2A CN108364484B (zh) 2018-02-22 2018-02-22 一种基于序贯博弈的单交叉口信号配时方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810153796.2A CN108364484B (zh) 2018-02-22 2018-02-22 一种基于序贯博弈的单交叉口信号配时方法

Publications (2)

Publication Number Publication Date
CN108364484A CN108364484A (zh) 2018-08-03
CN108364484B true CN108364484B (zh) 2021-03-30

Family

ID=63002502

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810153796.2A Active CN108364484B (zh) 2018-02-22 2018-02-22 一种基于序贯博弈的单交叉口信号配时方法

Country Status (1)

Country Link
CN (1) CN108364484B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109447492A (zh) * 2018-11-05 2019-03-08 湘潭大学 一种热电厂参与风电供暖的博弈机制构建方法
CN110246344A (zh) * 2019-03-28 2019-09-17 中国公路工程咨询集团有限公司 一种基于博弈论的信号配时方法
CN113870584B (zh) * 2021-09-28 2023-01-10 中国科学技术大学先进技术研究院 基于博弈论的交通路口通行方法及系统
CN114120664B (zh) * 2022-01-05 2022-09-20 北京航空航天大学合肥创新研究院(北京航空航天大学合肥研究生院) 一种基于博弈论的混行交通交叉口信号与车辆轨迹协同控制方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101273315A (zh) * 2005-05-17 2008-09-24 德累斯顿大学技术公司 用于协调并发过程或用于控制网络中移动单元的运输的方法
CN101789182A (zh) * 2010-02-05 2010-07-28 北京工业大学 一种基于平行仿真技术的交通信号控制系统及方法
CN103177589A (zh) * 2013-04-22 2013-06-26 福州大学 基于演化博弈的交通信号周期自适应控制方法
CN104376727A (zh) * 2014-11-12 2015-02-25 河南理工大学 交通干线四路口控制子区双向绿波协调控制方法
CN107274684A (zh) * 2017-08-01 2017-10-20 东南大学 一种车路协同环境下单点交叉口信号控制策略选择方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101273315A (zh) * 2005-05-17 2008-09-24 德累斯顿大学技术公司 用于协调并发过程或用于控制网络中移动单元的运输的方法
CN101789182A (zh) * 2010-02-05 2010-07-28 北京工业大学 一种基于平行仿真技术的交通信号控制系统及方法
CN103177589A (zh) * 2013-04-22 2013-06-26 福州大学 基于演化博弈的交通信号周期自适应控制方法
CN104376727A (zh) * 2014-11-12 2015-02-25 河南理工大学 交通干线四路口控制子区双向绿波协调控制方法
CN107274684A (zh) * 2017-08-01 2017-10-20 东南大学 一种车路协同环境下单点交叉口信号控制策略选择方法

Also Published As

Publication number Publication date
CN108364484A (zh) 2018-08-03

Similar Documents

Publication Publication Date Title
CN108364484B (zh) 一种基于序贯博弈的单交叉口信号配时方法
CN108197739B (zh) 一种城市轨道交通乘客流量预测方法
CN104464310B (zh) 城市区域多交叉口信号协同优化控制方法及系统
Bressan Noncooperative differential games
CN110223517B (zh) 基于时空相关性的短时交通流量预测方法
CN111047085B (zh) 一种基于元学习的混合动力车辆工况预测方法
CN110942627A (zh) 一种动态交通的路网协调信号控制方法及装置
CN107066239A (zh) 一种实现卷积神经网络前向计算的硬件结构
CN109785619A (zh) 区域交通信号协调优化控制系统及其控制方法
CN112784968A (zh) 一种加速分布式深度神经网络训练的混合流水线并行方法
CN108764466A (zh) 基于现场可编程门阵列的卷积神经网络硬件及其加速方法
CN109839824A (zh) 一种基于预测控制的网络控制系统时延补偿方法
CN109710691B (zh) 一种基于深度学习的混合区块链模型构建方法
CN110378699A (zh) 一种交易反欺诈方法、装置及系统
CN110491125B (zh) 一种交通预警诱导信息生成方法
CN103366574A (zh) 基于车队跟驰理论的交叉口延误计算方法
CN111813858B (zh) 基于计算节点自组织分组的分布式神经网络混合同步训练方法
CN107305501A (zh) 一种多流流式数据的处理方法和系统
CN102903038B (zh) 基于用户轨迹的小件物流配送方法及系统
CN108734361A (zh) 拼车订单处理方法和装置
CN108491927A (zh) 一种基于神经网络的数据处理方法和装置
CN104700634A (zh) 基于最小生成树聚类改进遗传算法的相邻交叉口干道协调控制方法
CN104933593A (zh) 一种基于Elo分级模型的积分激励系统及方法
Horn et al. Optimal strategy synthesis in request-response games
CN106682729A (zh) 基于局部收敛权阵进化的BP神经网络MapReduce训练方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant