CN112216126A - 一种基于sarsa的干线交通控制优化方法 - Google Patents
一种基于sarsa的干线交通控制优化方法 Download PDFInfo
- Publication number
- CN112216126A CN112216126A CN202011030095.3A CN202011030095A CN112216126A CN 112216126 A CN112216126 A CN 112216126A CN 202011030095 A CN202011030095 A CN 202011030095A CN 112216126 A CN112216126 A CN 112216126A
- Authority
- CN
- China
- Prior art keywords
- trunk
- traffic
- value table
- sarsa
- light state
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/07—Controlling traffic signals
- G08G1/08—Controlling traffic signals according to detected number or speed of vehicles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/15—Correlation function computation including computation of convolution operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computing Systems (AREA)
- Geometry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Algebra (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Traffic Control Systems (AREA)
Abstract
一种基于SARSA学习的干线交通控制优化方法包括如下步骤:1)对与一段连续的时刻,获取目标干线路口的红绿灯状态信息以及各个红绿灯所对应车道的排队车辆信息;2)整合初始干线‑灯态数据,获得干线‑灯态数据集;3)根据第一步收集的干线‑灯态数据集,优化Q值表直到收敛;4)Q值表收敛到满意的精度后,即可获得基于SARSA学习的干线交通优化方案。与现有技术相比,本发明通过人工智能方法,挖掘干线中车辆包含的隐藏信息,获得的干线配时方案比传统的绿波带控制算法在随机性较强的车流量的路网条件下具有更高的通行效率。
Description
技术领域
本发明涉及交通控制工程、人工智能应用领域,具体涉及SARSA(State,Action,Reward,Next State,Next Action)学习方法和干线交通控制优化方法。
背景技术
在城市的路网中,干线交通的优化控制往往是决定居民通行体验的重点。但是近年来,随着汽车的普及,路网设施跟不上车流量的迅速发展。之前对于干线设计的信号控制方法如绿波带,双向绿波带等干线信号控制方法已经不能适应当前干线车流量,其中最主要的原因是上述方法均为给定的配时方案,不能处理车流量的随机变化。本专利设计的基于SARSA的干线交通控制优化方法是一种实时交通控制方案。2020年后,通信技术诸如5G的民用普及和各种车辆检测技术诸如地磁检测和雷达技术的蓬勃发展,干线交通数据的实时获取和快速传输已经可以实现。
发明内容
为了解决干线交通配时方案不能很好地适应交通流随机变化的问题,基于实时获取的干线交通数据,本发明提出一种利用干线各个路口车辆排队数据的交通信号配时优化的方法,对于干线交通提出的基于SARSA的交通信号控制优化方案可以提高交通通行效率,而且可以应对复杂的交通流随机变化情况。
本发明解决其技术问题所采用的技术方案是:
一种基于SARSA的干线交通控制优化方法,包括以下步骤:
1)对于一段连续的时刻,获取目标干线N个路口的红绿灯状态信息以及各个红绿灯所对应车道的排队车辆信息,令N为路口个数,M为每个路口的相位个数;
2)整合初始干线-灯态数据,获得干线-灯态数据集{Ak,Sk,Ak+1,Sk+1},其中,为第k时刻干线上每个路口车辆信息的组合,Vn是干线上第n个路口的排队车辆信息, 是干线上第n个路口的红绿灯信息,k=1,2,…,K,K为该数据集合中的数据个数;
3)根据干线-灯态数据集{Ak,Sk,Ak+1,Sk+1},初始化SARSA学习中Q函数的Q值表Q(A,S)全为0;
4)Q值表收敛到满意的精度后,可以给出基于SARSA学习的干线交通优化方案:在干线交通信号控制中,获取当前干线各个路口中的排队车辆信息Anow,根据SARSA学习中的Q值表,通过以下公式得到每个干线路口下的应当执行的红绿灯状态Snext
Snext=arg max(Q(Anow,Snow))。
进一步,所述步骤3)中,Q值表的优化过程如下:
3.1)首先,定义基本参数,其中折扣因子γ=0.99,学习率为α=0.1,收敛指标ε=0.001,SARSA学习中的奖励函数设定为:
3.2)根据干线-灯态数据集{Ak,Sk,Ak+1,Sk+1},Q值表Q(A,S)的更新公式如下所示:
Q(At,St)=Q(At,St)+α[rt+1+γQ(At+1,St+1)-Q(At,St)];
3.3)每更新一次Q值表就根据下列公式计算一次新旧Q值表的差值,直到ε<0.001,其中i代表Q值表更新的次数
ε=sum(Qi+1(A,S))-sum(Qi(A,S))。
本发明的技术构思为:在一段连续的时刻,首先收集干线每一个路口中的排队车辆和与之对应的红绿灯信息。然后整合成用于SARSA训练的干线-灯态数据集,其中Q函数的Q值表得到在有限次数的训练情况下能收敛到一个给定的精度。Q值表收敛之后,基于SARSA学习的干线交通控制优化方案即可通过选取当前干线路网状态下的Q值表的动作最大值得到,鉴于本方法的实时控制性,则可以适应干线的随机变化的特性。
本发明的有益效果为:通过实时检测干线交通路网的排队车辆数据,设计的基于SARSA的干线交通控制优化方法比已有方法的干线协调方法具有更好的交通通行效率,且能适应干线车流的随机特性。
附图说明
图1显示了应用于干线交通控制优化的SARSA学习算法的流程图;
图2显示了基于交通微观仿真软件VISSIM搭建的干线结构图,用于下文的实例分析。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1和图2,一种基于SARSA的干线交通控制优化方法,包括以下步骤:
1)参照图2,对于一段连续的时刻,获取目标干线N个路口的红绿灯状态信息以及各个红绿灯所对应车道的排队车辆信息,令N为路口个数,M为每个路口的相位个数;
2)整合初始干线-灯态数据,获得干线-灯态数据集{Ak,Sk,Ak+1,Sk+1},其中,为第k时刻干线上每个路口车辆信息的组合,Vn是干线上第n个路口的排队车辆信息, 是干线上第n个路口的红绿灯信息,k=1,2,…,K,K为该数据集合中的数据个数。
3)参照图1流程图,根据干线-灯态数据集{Ak,Sk,Ak+1,Sk+1},初始化SARSA学习中Q函数的Q值表Q(A,S)全为0,Q值表的优化过程如下:
3.1)首先,定义基本参数,其中折扣因子γ=0.99,学习率为α=0.1,收敛指标ε=0.001,SARSA学习中的奖励函数设定为:
3.2)根据干线-灯态数据集{Ak,Sk,Ak+1,Sk+1},Q值表Q(A,S)的更新公式如下所示:
Q(At,St)=Q(At,St)+α[rt+1+γQ(At+1,St+1)-Q(At,St)];
3.3)每更新一次Q值表就根据下列公式计算一次新旧Q值表的差值,直到ε<0.001,其中i代表Q值表更新的次数
ε=sum(Qi+1(A,S))-sum(Qi(A,S));
4)Q值表收敛到满意的精度后,可以给出基于SARSA学习的干线交通优化方案:在干线交通信号控制中,获取当前干线各个路口中的排队车辆信息Anow,根据SARSA学习中的Q值表,通过以下公式得到每个干线路口下的应当执行的红绿灯状态Snext
Snext=arg max(Q(Anow,Snow))。
本实施例以使用交通微观仿真软件VISSIM绘制的干线路网的实测交通排队数据为实施例,一种基于SARSA的干线交通控制优化方法,包括以下步骤:
1)通过VISSIM,绘制一段具有三个交叉口的干线作为实施例路网,对于一段连续的时刻,通过调用VISSIM接口获取目标干线N个路口的红绿灯状态信息以及各个红绿灯所对应车道的排队车辆信息,令N为路口个数,M为每个路口的相位个数;
2)整合初始干线-灯态数据,获得干线-灯态数据集{Ak,Sk,Ak+1,Sk+1},其中,为第k时刻干线上每个路口车辆信息的组合,Vn是干线上第n个路口的排队车辆信息, 是干线上第n个路口的红绿灯信息,k=1,2,…,K,K为该数据集合中的数据个数;
3)根据干线-灯态数据集{Ak,Sk,Ak+1,Sk+1},初始化SARSA学习中Q函数的Q值表Q(A,S)全为0,Q值表的优化过程如下:
3.1)首先,定义基本参数,其中折扣因子γ=0.99,学习率为α=0.1,收敛指标ε=0.001,SARSA学习中的奖励函数设定为:
3.2)根据干线-灯态数据集{Ak,Sk,Ak+1,Sk+1},Q值表Q(A,S)的更新公式如下所示:
Q(At,St)=Q(At,St)+α[rt+1+γQ(At+1,St+1)-Q(At,St)];
3.3)每更新一次Q值表就根据下列公式计算一次新旧Q值表的差值,直到ε<0.001,其中i代表Q值表更新的次数
ε=sum(Qi+1(A,S))-sum(Qi(A,S));
4)Q值表收敛到满意的精度后,可以给出基于SARSA学习的干线交通优化方案:在干线交通信号控制中,通过调用VISSIM接口获取当前干线各个路口中的排队车辆信息Anow,根据SARSA学习中的Q值表,通过以下公式得到每个干线路口下的应当执行的红绿灯状态Snext然后在VISSIM信号灯执行模块执行该条件即可
Snext=arg max(Q(Anow,Snow))。
以微观交通仿真软件VISSIM为实施例,运用以上方法得到了基于SARSA的干线交通控制优化信号配时方案,结果显示在感兴趣时间内的车辆延误时间比传统的定时配时方案少了24.2%。
以上阐述的是本发明给出的一个实施例表现出来的优良效果,显然本发明不仅适合上述实施例,在不偏离本发明基本精神及不超出本发明实质内容所涉及内容的前提下可对其做种种变化加以实施。
Claims (2)
1.一种基于SARSA的干线交通控制优化方法,其特征在于,所述方法包括以下步骤:
1)对于一段连续的时刻,获取目标干线N个路口的红绿灯状态信息以及各个红绿灯所对应车道的排队车辆信息,令N为路口个数,M为每个路口的相位个数;
2)整合初始干线-灯态数据,获得干线-灯态数据集{Ak,Sk,Ak+1,Sk+1},其中,为第k时刻干线上每个路口车辆信息的组合,Vn是干线上第n个路口的排队车辆信息, 是干线上第n个路口的红绿灯信息,k=1,2,…,K,K为该数据集合中的数据个数;
3)根据干线-灯态数据集{Ak,Sk,Ak+1,Sk+1},初始化SARSA学习中Q函数的Q值表Q(A,S)全为0;
4)Q值表收敛到满意的精度后,可以给出基于SARSA学习的干线交通优化方案:在干线交通信号控制中,获取当前干线各个路口中的排队车辆信息Anow,根据SARSA学习中的Q值表,通过以下公式得到每个干线路口下的应当执行的红绿灯状态Snext
Snext=argmax(Q(Anow,Snow))。
2.如权利要求1所述的一种基于SARSA的干线交通控制优化方法,其特征在于,所述步骤3)中,Q值表的优化过程如下:
3.1)首先,定义基本参数,其中折扣因子γ=0.99,学习率为α=0.1,收敛指标ε=0.001,SARSA学习中的奖励函数设定为:
3.2)根据干线-灯态数据集{Ak,Sk,Ak+1,Sk+1},Q值表Q(A,S)的更新公式如下所示:
Q(At,St)=Q(At,St)+α[rt+1+γQ(At+1,St+1)-Q(At,St)];
3.3)每更新一次Q值表就根据下列公式计算一次新旧Q值表的差值,直到ε<0.001,其中i代表Q值表更新的次数
ε=sum(Qi+1(A,S))-sum(Qi(A,S))。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011030095.3A CN112216126A (zh) | 2020-09-27 | 2020-09-27 | 一种基于sarsa的干线交通控制优化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011030095.3A CN112216126A (zh) | 2020-09-27 | 2020-09-27 | 一种基于sarsa的干线交通控制优化方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112216126A true CN112216126A (zh) | 2021-01-12 |
Family
ID=74050812
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011030095.3A Pending CN112216126A (zh) | 2020-09-27 | 2020-09-27 | 一种基于sarsa的干线交通控制优化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112216126A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113327436A (zh) * | 2021-01-18 | 2021-08-31 | 兆边(上海)科技有限公司 | 一种基于轨迹数据的干线协调控制优化方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103077615A (zh) * | 2012-12-20 | 2013-05-01 | 长沙理工大学 | 一种优化信号交叉口排队长度的在线学习方法 |
CN110164151A (zh) * | 2019-06-21 | 2019-08-23 | 西安电子科技大学 | 基于分布式深度循环q网络的交通灯控制方法 |
CN111081035A (zh) * | 2019-12-17 | 2020-04-28 | 扬州市鑫通智能信息技术有限公司 | 一种基于q学习的交通信号控制方法 |
CN111653106A (zh) * | 2020-04-15 | 2020-09-11 | 南京理工大学 | 一种基于深度q学习的交通信号控制方法 |
-
2020
- 2020-09-27 CN CN202011030095.3A patent/CN112216126A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103077615A (zh) * | 2012-12-20 | 2013-05-01 | 长沙理工大学 | 一种优化信号交叉口排队长度的在线学习方法 |
CN110164151A (zh) * | 2019-06-21 | 2019-08-23 | 西安电子科技大学 | 基于分布式深度循环q网络的交通灯控制方法 |
CN111081035A (zh) * | 2019-12-17 | 2020-04-28 | 扬州市鑫通智能信息技术有限公司 | 一种基于q学习的交通信号控制方法 |
CN111653106A (zh) * | 2020-04-15 | 2020-09-11 | 南京理工大学 | 一种基于深度q学习的交通信号控制方法 |
Non-Patent Citations (3)
Title |
---|
杨文臣 等: "多智能体强化学习在城市交通网络信号控制方法中的应用综述", 《计算机应用研究》 * |
白静静: "基于SARSA学习的单交叉口配时优化仿真与设计", 《研究与开发》 * |
纪英俊: "基于增强学习算法的城市交叉口信号灯控制", 《中国优秀博硕士学位论文全文数据库(硕士)·工程科技Ⅱ辑》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113327436A (zh) * | 2021-01-18 | 2021-08-31 | 兆边(上海)科技有限公司 | 一种基于轨迹数据的干线协调控制优化方法 |
CN113327436B (zh) * | 2021-01-18 | 2022-06-21 | 兆边(上海)科技有限公司 | 一种基于轨迹数据的干线协调控制优化方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108648457B (zh) | 一种速度预测的方法、装置和计算机可读存储介质 | |
CN110097755A (zh) | 基于深度神经网络的高速公路交通流量状态识别方法 | |
CN113538910B (zh) | 一种自适应的全链条城市区域网络信号控制优化方法 | |
CN109359166B (zh) | 一种空间增长动态模拟与驱动力因子贡献度同步计算方法 | |
CN114627657A (zh) | 一种基于图深度强化学习的自适应交通信号控制方法 | |
LU503042B1 (en) | Multi-model learning particle swarm-based intelligent city signal light timing optimization method | |
CN112216127B (zh) | 一种基于近端策略优化的小型路网交通信号优化方法 | |
CN110276966B (zh) | 交叉口信号控制时段划分方法 | |
WO2021027153A1 (zh) | 交通流数据分析模型的构建方法和装置 | |
CN108629970B (zh) | 基于蒙特卡罗树搜索的交叉口信号参数优化方法 | |
CN110718077B (zh) | 一种行动-评价机制下信号灯优化配时方法 | |
CN112613225B (zh) | 一种基于神经网络元胞传输模型的交叉口交通状态预测方法 | |
CN109872531B (zh) | 道路交通信号控制全路网最优化控制目标函数构建方法 | |
CN109887284A (zh) | 一种智慧城市交通信号控制推荐方法、系统及装置 | |
CN113780624B (zh) | 一种基于博弈均衡理论的城市路网信号协调控制方法 | |
CN112071062A (zh) | 一种基于图卷积网络和图注意力网络的行车时间估计方法 | |
CN113053120B (zh) | 基于迭代学习模型预测控制的交通信号灯调度方法与系统 | |
CN104112366B (zh) | 基于隐语义模型的交通信号优化方法 | |
CN112216126A (zh) | 一种基于sarsa的干线交通控制优化方法 | |
CN115691167A (zh) | 一种基于交叉口全息数据的单点交通信号控制方法 | |
CN106846808B (zh) | 一种基于车牌数据的车辆停车次数计算方法 | |
CN114970058A (zh) | 一种基于信赖域贝叶斯的大规模网络信号控制优化方法 | |
CN113409576B (zh) | 一种基于贝叶斯网络的交通路网动态预测方法及系统 | |
CN110111561A (zh) | 一种基于som-pam聚类算法的路网动态划分方法 | |
CN115472023B (zh) | 一种基于深度强化学习的智能交通灯控制方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210112 |