CN112216126A - 一种基于sarsa的干线交通控制优化方法 - Google Patents

一种基于sarsa的干线交通控制优化方法 Download PDF

Info

Publication number
CN112216126A
CN112216126A CN202011030095.3A CN202011030095A CN112216126A CN 112216126 A CN112216126 A CN 112216126A CN 202011030095 A CN202011030095 A CN 202011030095A CN 112216126 A CN112216126 A CN 112216126A
Authority
CN
China
Prior art keywords
trunk
traffic
value table
sarsa
light state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011030095.3A
Other languages
English (en)
Inventor
林静
魏平
柴子辉
许泸军
徐韧
冯远静
李永强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aerospace Science And Technology Guangxin Intelligent Technology Co ltd
Original Assignee
Aerospace Science And Technology Guangxin Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aerospace Science And Technology Guangxin Intelligent Technology Co ltd filed Critical Aerospace Science And Technology Guangxin Intelligent Technology Co ltd
Priority to CN202011030095.3A priority Critical patent/CN112216126A/zh
Publication of CN112216126A publication Critical patent/CN112216126A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/07Controlling traffic signals
    • G08G1/08Controlling traffic signals according to detected number or speed of vehicles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computing Systems (AREA)
  • Geometry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Algebra (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Traffic Control Systems (AREA)

Abstract

一种基于SARSA学习的干线交通控制优化方法包括如下步骤:1)对与一段连续的时刻,获取目标干线路口的红绿灯状态信息以及各个红绿灯所对应车道的排队车辆信息;2)整合初始干线‑灯态数据,获得干线‑灯态数据集;3)根据第一步收集的干线‑灯态数据集,优化Q值表直到收敛;4)Q值表收敛到满意的精度后,即可获得基于SARSA学习的干线交通优化方案。与现有技术相比,本发明通过人工智能方法,挖掘干线中车辆包含的隐藏信息,获得的干线配时方案比传统的绿波带控制算法在随机性较强的车流量的路网条件下具有更高的通行效率。

Description

一种基于SARSA的干线交通控制优化方法
技术领域
本发明涉及交通控制工程、人工智能应用领域,具体涉及SARSA(State,Action,Reward,Next State,Next Action)学习方法和干线交通控制优化方法。
背景技术
在城市的路网中,干线交通的优化控制往往是决定居民通行体验的重点。但是近年来,随着汽车的普及,路网设施跟不上车流量的迅速发展。之前对于干线设计的信号控制方法如绿波带,双向绿波带等干线信号控制方法已经不能适应当前干线车流量,其中最主要的原因是上述方法均为给定的配时方案,不能处理车流量的随机变化。本专利设计的基于SARSA的干线交通控制优化方法是一种实时交通控制方案。2020年后,通信技术诸如5G的民用普及和各种车辆检测技术诸如地磁检测和雷达技术的蓬勃发展,干线交通数据的实时获取和快速传输已经可以实现。
发明内容
为了解决干线交通配时方案不能很好地适应交通流随机变化的问题,基于实时获取的干线交通数据,本发明提出一种利用干线各个路口车辆排队数据的交通信号配时优化的方法,对于干线交通提出的基于SARSA的交通信号控制优化方案可以提高交通通行效率,而且可以应对复杂的交通流随机变化情况。
本发明解决其技术问题所采用的技术方案是:
一种基于SARSA的干线交通控制优化方法,包括以下步骤:
1)对于一段连续的时刻,获取目标干线N个路口的红绿灯状态信息以及各个红绿灯所对应车道的排队车辆信息,令N为路口个数,M为每个路口的相位个数;
2)整合初始干线-灯态数据,获得干线-灯态数据集{Ak,Sk,Ak+1,Sk+1},其中,
Figure BDA0002703338380000011
为第k时刻干线上每个路口车辆信息的组合,Vn是干线上第n个路口的排队车辆信息,
Figure BDA0002703338380000012
Figure BDA0002703338380000013
是干线上第n个路口的红绿灯信息,k=1,2,…,K,K为该数据集合中的数据个数;
3)根据干线-灯态数据集{Ak,Sk,Ak+1,Sk+1},初始化SARSA学习中Q函数的Q值表Q(A,S)全为0;
4)Q值表收敛到满意的精度后,可以给出基于SARSA学习的干线交通优化方案:在干线交通信号控制中,获取当前干线各个路口中的排队车辆信息Anow,根据SARSA学习中的Q值表,通过以下公式得到每个干线路口下的应当执行的红绿灯状态Snext
Snext=arg max(Q(Anow,Snow))。
进一步,所述步骤3)中,Q值表的优化过程如下:
3.1)首先,定义基本参数,其中折扣因子γ=0.99,学习率为α=0.1,收敛指标ε=0.001,SARSA学习中的奖励函数设定为:
Figure BDA0002703338380000021
3.2)根据干线-灯态数据集{Ak,Sk,Ak+1,Sk+1},Q值表Q(A,S)的更新公式如下所示:
Q(At,St)=Q(At,St)+α[rt+1+γQ(At+1,St+1)-Q(At,St)];
3.3)每更新一次Q值表就根据下列公式计算一次新旧Q值表的差值,直到ε<0.001,其中i代表Q值表更新的次数
ε=sum(Qi+1(A,S))-sum(Qi(A,S))。
本发明的技术构思为:在一段连续的时刻,首先收集干线每一个路口中的排队车辆和与之对应的红绿灯信息。然后整合成用于SARSA训练的干线-灯态数据集,其中Q函数的Q值表得到在有限次数的训练情况下能收敛到一个给定的精度。Q值表收敛之后,基于SARSA学习的干线交通控制优化方案即可通过选取当前干线路网状态下的Q值表的动作最大值得到,鉴于本方法的实时控制性,则可以适应干线的随机变化的特性。
本发明的有益效果为:通过实时检测干线交通路网的排队车辆数据,设计的基于SARSA的干线交通控制优化方法比已有方法的干线协调方法具有更好的交通通行效率,且能适应干线车流的随机特性。
附图说明
图1显示了应用于干线交通控制优化的SARSA学习算法的流程图;
图2显示了基于交通微观仿真软件VISSIM搭建的干线结构图,用于下文的实例分析。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1和图2,一种基于SARSA的干线交通控制优化方法,包括以下步骤:
1)参照图2,对于一段连续的时刻,获取目标干线N个路口的红绿灯状态信息以及各个红绿灯所对应车道的排队车辆信息,令N为路口个数,M为每个路口的相位个数;
2)整合初始干线-灯态数据,获得干线-灯态数据集{Ak,Sk,Ak+1,Sk+1},其中,
Figure BDA0002703338380000031
为第k时刻干线上每个路口车辆信息的组合,Vn是干线上第n个路口的排队车辆信息,
Figure BDA0002703338380000032
Figure BDA0002703338380000033
是干线上第n个路口的红绿灯信息,k=1,2,…,K,K为该数据集合中的数据个数。
3)参照图1流程图,根据干线-灯态数据集{Ak,Sk,Ak+1,Sk+1},初始化SARSA学习中Q函数的Q值表Q(A,S)全为0,Q值表的优化过程如下:
3.1)首先,定义基本参数,其中折扣因子γ=0.99,学习率为α=0.1,收敛指标ε=0.001,SARSA学习中的奖励函数设定为:
Figure BDA0002703338380000034
3.2)根据干线-灯态数据集{Ak,Sk,Ak+1,Sk+1},Q值表Q(A,S)的更新公式如下所示:
Q(At,St)=Q(At,St)+α[rt+1+γQ(At+1,St+1)-Q(At,St)];
3.3)每更新一次Q值表就根据下列公式计算一次新旧Q值表的差值,直到ε<0.001,其中i代表Q值表更新的次数
ε=sum(Qi+1(A,S))-sum(Qi(A,S));
4)Q值表收敛到满意的精度后,可以给出基于SARSA学习的干线交通优化方案:在干线交通信号控制中,获取当前干线各个路口中的排队车辆信息Anow,根据SARSA学习中的Q值表,通过以下公式得到每个干线路口下的应当执行的红绿灯状态Snext
Snext=arg max(Q(Anow,Snow))。
本实施例以使用交通微观仿真软件VISSIM绘制的干线路网的实测交通排队数据为实施例,一种基于SARSA的干线交通控制优化方法,包括以下步骤:
1)通过VISSIM,绘制一段具有三个交叉口的干线作为实施例路网,对于一段连续的时刻,通过调用VISSIM接口获取目标干线N个路口的红绿灯状态信息以及各个红绿灯所对应车道的排队车辆信息,令N为路口个数,M为每个路口的相位个数;
2)整合初始干线-灯态数据,获得干线-灯态数据集{Ak,Sk,Ak+1,Sk+1},其中,
Figure BDA0002703338380000041
为第k时刻干线上每个路口车辆信息的组合,Vn是干线上第n个路口的排队车辆信息,
Figure BDA0002703338380000042
Figure BDA0002703338380000043
是干线上第n个路口的红绿灯信息,k=1,2,…,K,K为该数据集合中的数据个数;
3)根据干线-灯态数据集{Ak,Sk,Ak+1,Sk+1},初始化SARSA学习中Q函数的Q值表Q(A,S)全为0,Q值表的优化过程如下:
3.1)首先,定义基本参数,其中折扣因子γ=0.99,学习率为α=0.1,收敛指标ε=0.001,SARSA学习中的奖励函数设定为:
Figure BDA0002703338380000044
3.2)根据干线-灯态数据集{Ak,Sk,Ak+1,Sk+1},Q值表Q(A,S)的更新公式如下所示:
Q(At,St)=Q(At,St)+α[rt+1+γQ(At+1,St+1)-Q(At,St)];
3.3)每更新一次Q值表就根据下列公式计算一次新旧Q值表的差值,直到ε<0.001,其中i代表Q值表更新的次数
ε=sum(Qi+1(A,S))-sum(Qi(A,S));
4)Q值表收敛到满意的精度后,可以给出基于SARSA学习的干线交通优化方案:在干线交通信号控制中,通过调用VISSIM接口获取当前干线各个路口中的排队车辆信息Anow,根据SARSA学习中的Q值表,通过以下公式得到每个干线路口下的应当执行的红绿灯状态Snext然后在VISSIM信号灯执行模块执行该条件即可
Snext=arg max(Q(Anow,Snow))。
以微观交通仿真软件VISSIM为实施例,运用以上方法得到了基于SARSA的干线交通控制优化信号配时方案,结果显示在感兴趣时间内的车辆延误时间比传统的定时配时方案少了24.2%。
以上阐述的是本发明给出的一个实施例表现出来的优良效果,显然本发明不仅适合上述实施例,在不偏离本发明基本精神及不超出本发明实质内容所涉及内容的前提下可对其做种种变化加以实施。

Claims (2)

1.一种基于SARSA的干线交通控制优化方法,其特征在于,所述方法包括以下步骤:
1)对于一段连续的时刻,获取目标干线N个路口的红绿灯状态信息以及各个红绿灯所对应车道的排队车辆信息,令N为路口个数,M为每个路口的相位个数;
2)整合初始干线-灯态数据,获得干线-灯态数据集{Ak,Sk,Ak+1,Sk+1},其中,
Figure FDA0002703338370000011
为第k时刻干线上每个路口车辆信息的组合,Vn是干线上第n个路口的排队车辆信息,
Figure FDA0002703338370000012
Figure FDA0002703338370000013
是干线上第n个路口的红绿灯信息,k=1,2,…,K,K为该数据集合中的数据个数;
3)根据干线-灯态数据集{Ak,Sk,Ak+1,Sk+1},初始化SARSA学习中Q函数的Q值表Q(A,S)全为0;
4)Q值表收敛到满意的精度后,可以给出基于SARSA学习的干线交通优化方案:在干线交通信号控制中,获取当前干线各个路口中的排队车辆信息Anow,根据SARSA学习中的Q值表,通过以下公式得到每个干线路口下的应当执行的红绿灯状态Snext
Snext=argmax(Q(Anow,Snow))。
2.如权利要求1所述的一种基于SARSA的干线交通控制优化方法,其特征在于,所述步骤3)中,Q值表的优化过程如下:
3.1)首先,定义基本参数,其中折扣因子γ=0.99,学习率为α=0.1,收敛指标ε=0.001,SARSA学习中的奖励函数设定为:
Figure FDA0002703338370000014
3.2)根据干线-灯态数据集{Ak,Sk,Ak+1,Sk+1},Q值表Q(A,S)的更新公式如下所示:
Q(At,St)=Q(At,St)+α[rt+1+γQ(At+1,St+1)-Q(At,St)];
3.3)每更新一次Q值表就根据下列公式计算一次新旧Q值表的差值,直到ε<0.001,其中i代表Q值表更新的次数
ε=sum(Qi+1(A,S))-sum(Qi(A,S))。
CN202011030095.3A 2020-09-27 2020-09-27 一种基于sarsa的干线交通控制优化方法 Pending CN112216126A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011030095.3A CN112216126A (zh) 2020-09-27 2020-09-27 一种基于sarsa的干线交通控制优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011030095.3A CN112216126A (zh) 2020-09-27 2020-09-27 一种基于sarsa的干线交通控制优化方法

Publications (1)

Publication Number Publication Date
CN112216126A true CN112216126A (zh) 2021-01-12

Family

ID=74050812

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011030095.3A Pending CN112216126A (zh) 2020-09-27 2020-09-27 一种基于sarsa的干线交通控制优化方法

Country Status (1)

Country Link
CN (1) CN112216126A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113327436A (zh) * 2021-01-18 2021-08-31 兆边(上海)科技有限公司 一种基于轨迹数据的干线协调控制优化方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103077615A (zh) * 2012-12-20 2013-05-01 长沙理工大学 一种优化信号交叉口排队长度的在线学习方法
CN110164151A (zh) * 2019-06-21 2019-08-23 西安电子科技大学 基于分布式深度循环q网络的交通灯控制方法
CN111081035A (zh) * 2019-12-17 2020-04-28 扬州市鑫通智能信息技术有限公司 一种基于q学习的交通信号控制方法
CN111653106A (zh) * 2020-04-15 2020-09-11 南京理工大学 一种基于深度q学习的交通信号控制方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103077615A (zh) * 2012-12-20 2013-05-01 长沙理工大学 一种优化信号交叉口排队长度的在线学习方法
CN110164151A (zh) * 2019-06-21 2019-08-23 西安电子科技大学 基于分布式深度循环q网络的交通灯控制方法
CN111081035A (zh) * 2019-12-17 2020-04-28 扬州市鑫通智能信息技术有限公司 一种基于q学习的交通信号控制方法
CN111653106A (zh) * 2020-04-15 2020-09-11 南京理工大学 一种基于深度q学习的交通信号控制方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
杨文臣 等: "多智能体强化学习在城市交通网络信号控制方法中的应用综述", 《计算机应用研究》 *
白静静: "基于SARSA学习的单交叉口配时优化仿真与设计", 《研究与开发》 *
纪英俊: "基于增强学习算法的城市交叉口信号灯控制", 《中国优秀博硕士学位论文全文数据库(硕士)·工程科技Ⅱ辑》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113327436A (zh) * 2021-01-18 2021-08-31 兆边(上海)科技有限公司 一种基于轨迹数据的干线协调控制优化方法
CN113327436B (zh) * 2021-01-18 2022-06-21 兆边(上海)科技有限公司 一种基于轨迹数据的干线协调控制优化方法

Similar Documents

Publication Publication Date Title
CN108648457B (zh) 一种速度预测的方法、装置和计算机可读存储介质
CN110097755A (zh) 基于深度神经网络的高速公路交通流量状态识别方法
CN113538910B (zh) 一种自适应的全链条城市区域网络信号控制优化方法
CN109359166B (zh) 一种空间增长动态模拟与驱动力因子贡献度同步计算方法
CN114627657A (zh) 一种基于图深度强化学习的自适应交通信号控制方法
LU503042B1 (en) Multi-model learning particle swarm-based intelligent city signal light timing optimization method
CN112216127B (zh) 一种基于近端策略优化的小型路网交通信号优化方法
CN110276966B (zh) 交叉口信号控制时段划分方法
WO2021027153A1 (zh) 交通流数据分析模型的构建方法和装置
CN108629970B (zh) 基于蒙特卡罗树搜索的交叉口信号参数优化方法
CN110718077B (zh) 一种行动-评价机制下信号灯优化配时方法
CN112613225B (zh) 一种基于神经网络元胞传输模型的交叉口交通状态预测方法
CN109872531B (zh) 道路交通信号控制全路网最优化控制目标函数构建方法
CN109887284A (zh) 一种智慧城市交通信号控制推荐方法、系统及装置
CN113780624B (zh) 一种基于博弈均衡理论的城市路网信号协调控制方法
CN112071062A (zh) 一种基于图卷积网络和图注意力网络的行车时间估计方法
CN113053120B (zh) 基于迭代学习模型预测控制的交通信号灯调度方法与系统
CN104112366B (zh) 基于隐语义模型的交通信号优化方法
CN112216126A (zh) 一种基于sarsa的干线交通控制优化方法
CN115691167A (zh) 一种基于交叉口全息数据的单点交通信号控制方法
CN106846808B (zh) 一种基于车牌数据的车辆停车次数计算方法
CN114970058A (zh) 一种基于信赖域贝叶斯的大规模网络信号控制优化方法
CN113409576B (zh) 一种基于贝叶斯网络的交通路网动态预测方法及系统
CN110111561A (zh) 一种基于som-pam聚类算法的路网动态划分方法
CN115472023B (zh) 一种基于深度强化学习的智能交通灯控制方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210112