CN114141028A

CN114141028A - 智能红绿灯车流调控系统

Info

Publication number: CN114141028A
Application number: CN202111400796.6A
Authority: CN
Inventors: 宋子鹏; 林晨; 曾国坤
Original assignee: Shenzhen Graduate School Harbin Institute of Technology
Current assignee: Shenzhen Graduate School Harbin Institute of Technology
Priority date: 2021-11-19
Filing date: 2021-11-19
Publication date: 2022-03-04
Anticipated expiration: 2041-11-19
Also published as: CN114141028B

Abstract

本发明公开了智能红绿灯车流调控系统，包括通过摄像头收集获得的车流量密度以及当前路况的数据而制定实时更新的红绿灯时长变化策略，还包括近端策略优化的强化学习算法，本发明能够结合路况的实际情况来对红绿灯的时长进行调控，进而帮助各个路口的车流量密度达到理论最大值，独特的加入了时间作为算法输入与调控的参数，针对性的做出了对交通系统的优化策略输出来达到应对每日交通流量的高峰期和低谷期，改善了因高峰期到来但系统调节滞后而造成的恶性循环的问题，使得系统的应用性与可靠性得到了大幅度的提升。并使得近端策略优化算法与curiosity模型相结合，达到更加好的策略决策效果，提高优化效率。

Description

智能红绿灯车流调控系统

技术领域

本发明涉及数据信息管理技术领域，具体为智能红绿灯车流调控系统。

背景技术

日常生活中会遇到有在交通路口等红绿灯时，有的方向来往车辆比较少，而有的方向会有更多的车辆，如果这时候能够根据实时的路况进行路况的调控就可以更加合理化的减少大家等红绿灯的时间，增加出行的效率。然而人工调控会过于浪费人力资源而本末倒置，因此需要结合深度学习与计算机视觉系统设计出一款动态交通管理系统，通过摄像头采集信息进行判断路况的车辆密度，从而实时地调控红路灯的时间。但是目前的问题在于路况实际上是一个数据量非常庞大的数据量难以处理，而且实时的路况调节需要在短暂的时间内处理完这些数据，而且对于交通的动态管理并不是简简单单一个点的管理，还要尝试着考虑一个面的影响，即一个红绿灯的时间变化对下一个红绿灯的影响，这就涉及了各个路口路况的信息共享与共同调节。

为此我们提出了一种智能红绿灯车流调控系统，旨在解决现在普遍出现的出行效率的问题，着手方向是红绿灯的时长控制。

发明内容

本发明的目的在于提供智能红绿灯车流调控系统，可对数据信息进行流程化管理，使得数据信息的管理更加准确和高效。

本发明是这样实现的：智能红绿灯车流调控系统，通过摄像头收集获得的车流量密度以及当前路况的数据而制定实时更新的红绿灯时长变化策略，包括近端策略优化(Proximal Policy Optimization)的强化学习算法：

近端策略优化算法，包括以下步骤：

S1、建立数据模型，通过渲染引擎实构建的交通网路实时产生不同方向的来往车辆进行仿真实验，收集每一帧进程中车辆的各项数据已经红绿灯的交通拥挤情况作为策略的输入，采集各个路口的车流量密度E_i，形成数据集E(E₁,E₂...E_n)以及车辆通行量L_i和总车辆L₀，形成数据集合θ(上一帧数据集合为θ_old)，当前模型时间日期D_i，形成数据集D(D₁,D₂...D_n)；

S2、通行率与拥塞程度预估：对各个路口的车辆数量做处理，得到当前的通行率与拥塞程度预估函数；

S3、将各个路口的通行率与拥塞程度，车辆通行量L_i和总车辆L₀为近端策略优化重要性采样的观测变量，并输入到 curiosity模型中，得到“奖励”输出控制量；

S4、根据控制量来动态实时调整当前红绿灯的时长，并最终得到训练好的模型，在返回到仿真模型中实际应用模型，比较在相同时间内最终通过的总车辆L₀的大小来判断模型的效果，并多此重复上诉步骤得到更多的模型数据；

S5、分析模型数据，选择最优的模型。

进一步的，步骤S1具体包括以下步骤：

S101、建立交通模型，交通模型采用的是以unity为核心的实时渲染应用场景，模拟了一个环形的微型城镇的交通系统，该系统参考了非线性交通模型的实际观测数据和分析，尽最大可能的仿真出了一个与实际情况相吻合的城镇交通系统。

S102、在该系统中，每隔一帧(大约25ms)会对全局进行一次θ采样，该采样会采集出如步骤S1所示的全部数据，并将数据记录输出。

进一步的，步骤S2中的公式为：

其中，P_t为通行率预测，P_S为拥塞程度预测，

为历史时间预估分布参数。对于历史，我们可能会保存前几天的历史估测值，对不同时间段产生不同的线性对应参数。这样会使得系统对每一天当中的车流量高峰期与低谷期产生一个敏感信号，并及时做出相应的调整。

进一步的，步骤S3具体包括以下步骤：

S301、重要性采样：即近端策略优化强化学习过程中根据采样数据做出的参数更新调整公式。

其中t为当前需要学习的actor模型，t'为当前与环境进行互动的示范actor模型；A^t'((Pt_i,Ps_i),at_i)这一项就是估测出来的。他要预估的是在状态(Pt_i,Ps_i)下采取动作at_i是好还是不好。

S302、Curiosity模型：即估测A^t'((Pt_i,Ps_i),at_i)的取值的方法，模型采取的策略非常的简单，即从at_i和t预测出的t'相差越大给的奖励(reward)越大。这样就能够将是更多的方法来获得奖励。

进一步的，控制量输出的计算公式为

还包括城市仿真模型所提供的数据；结合城市仿真模型所提供的数据以实现对数据的处理并作出策略输出，达到实时调控红绿灯时长，优化交通路口车辆通行率的目的。

进一步的，还包括基于图像分类技术及强化学习算法的嵌入式路口红绿灯调控方法，以实现对区域内的交通路口各方向上的拥堵情况进行分类，且依据所述近端策略优化算法进行分析，调控红绿灯时间以进行交通控制，使得区域内的交通网络达到最优的通行效率。

与现有技术相比，发明的有益效果是：

1、本系统通过深度学习对城市交通进行监视与分析，得到相应的结果然后运用于红绿灯的调控。

2、本发明能够结合路况的实际情况来对红绿灯的时长进行调控，进而帮助各个路口的车流量密度达到理论最大值，独特的加入了时间作为算法输入与调控的参数，针对性的做出了对交通系统的优化策略输出来达到应对每日交通流量的高峰期和低谷期，改善了因高峰期到来但系统调节滞后而造成的恶性循环的问题，使得系统的应用性与可靠性得到了大幅度的提升。并使得近端策略优化算法与curiosity模型相结合，达到更加好的策略决策效果，提高优化效率。

附图说明

为了更清楚地说明本发明实施方式的技术方案，下面将对实施方式中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本发明中近端策略优化算法的流程图；

图2为仿真环境的系统构架UML图；

图3为强化学习算法流程；

图4为智能红绿灯车流调控系统的系统构架示意图；

图5为前端采集灯控盒内部系统连接示意图；

图6为路况图像分类模型使用卷积神经网络模型的模型架构图；

图7为基于图像分类技术及强化学习算法的嵌入式路口红绿灯调控方法的流程图；

图8为模型输出计算流程图。

具体实施方式

为使本发明实施方式的目的、技术方案和优点更加清楚，下面将结合本发明实施方式中的附图，对本发明实施方式中的技术方案进行清楚、完整地描述，显然，所描述的实施方式是本发明一部分实施方式，而不是全部的实施方式。因此，以下对在附图中提供的本发明的实施方式的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施方式。基于本发明中的实施方式，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式，都属于本发明保护的范围。

在本发明中，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或成一体；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言，可以根据具体情况理解所述术语在本发明中的具体含义。

实施例：为了解决实现通过摄像头收集获得的车流量密度以及当前路况的数据而制定实时更新的红绿灯时长变化策略的问题，本发明提供了一种近端策略优化(ProximalPolicy Optimization)的强化学习算法，并结合了城市仿真模型所提供的数据。以实现对数据的处理并作出策略输出，达到实时调控红绿灯时长，优化交通路口车辆通行率的目的。

请参阅图1、图2和图3，智能红绿灯车流调控系统，智能红绿灯车流调控系统，通过摄像头收集获得的车流量密度以及当前路况的数据而制定实时更新的红绿灯时长变化策略，包括近端策略优化(Proximal Policy Optimization)的强化学习算法：

近端策略优化算法，包括以下步骤：

S5、分析模型数据，选择最优的模型。

进一步的，步骤S1具体包括以下步骤：

进一步的，步骤S2中的公式为：

其中，P_t为通行率预测，P_S为拥塞程度预测，

进一步的，步骤S3具体包括以下步骤：

进一步的，控制量输出的计算公式为

请参照图4和图5本发明在实施过程中还采用了前端采集灯控盒与后台仿真调控平台，

前端采集灯控盒主要为车流密度检测和调控采集红绿灯信号；

后端仿真调控平台内包含3D城市仿真训练平台和近端策略优化算法。

前端采集灯控盒内包括红绿灯、FPGA电路板和摄像装置，其中FPGA电路板控制红绿灯信号、进行网络连接后台、收集摄像装置采集的车流密度信号。

请参照图6、图7和图8本实施例还包括基于图像分类技术及强化学习算法的嵌入式路口红绿灯调控方法，以实现对区域内的交通路口各方向上的拥堵情况进行分类，且依据所述近端策略优化算法进行分析，调控红绿灯时间以进行交通控制，使得区域内的交通网络达到最优的通行效率。

基于图像分类技术及强化学习算法的嵌入式路口红绿灯调控方法，包括以下步骤：

D1、建模采集数据：在控制区域内的每个红绿灯上加装摄像头，采集该红绿灯所管控路段的路况图像，将同一时间采集的同一交通路口四个方向上的图像分为一组进行预处理，形成路口j的路况数据集；

D2、在嵌入式设备中建立预训练完成的深度学习路况分类模型；

D3、将同一个路口的数据集作为模型的输入变量，调用设备中的模型，输出该交通路口各方向上的拥堵程度。

所述步骤D1中，对每张图像进行图像增强预处理，以保证在夜间等光线较弱环境下也可正常工作；

所述步骤D2中，路况图像分类模型使用卷积神经网络模型，模型架构如附图6：

所述步骤D3具体包括以下步骤:

D301、对神经网络模型进行网络剪枝操作，减少模型的网络规模及资源占用，加快预测速度；

D302、对卷积、池化计算模块分别设计FPGA加速器IP核，直接通过硬件而非程序来实现卷积层和池化层的计算过程。与此同时，在加速器中实现循环展开模块，在每次执行卷积、池化循环运算时更多地执行循环体，以此来加速模型的预测速度；

D303、在数据进行卷积运算前，首先将预先训练好的卷积参数进行量化，将其从原本的float32格式转化为int8格式，即将原本的参数映射到整数[-128,127]范围内，公式为：

p_new＝int 8(p_in*scale)

其中scale是计算得到的映射系数，计算公式为：

scale＝127/p_i

其中p_i是通过比较得到的相对熵最小的截断阈值，相对熵公式如下：

D304、进行int8格式的卷积运算后，将结果进行反量化，公式为：

r_out＝float32(r_in/scale)

D305、采用四级流水线结构，对数据集P_f中的四张图像数据进行流水化处理，实现同一时间的多画面并发处理，加快预测速度。

本方法利用控制区域内的摄像头进行路况图像的采集，并根据预先训练的深度学习路况分类模型对该路段的拥堵情况进行估计。将估计得到的拥堵程度作为反馈量，利用强化学习算法对各交通路口的路况信息进行分析，以实现对区域按照强化学习算法得出的最佳红绿灯时长进行交通控制，使区域内的交通网络达到最优的通行效率，最大限度地缓解城市交通由红绿灯时长不合理导致的拥塞问题，提高城市交通的利用效率。

以上仅为本发明的优选实施方式而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.智能红绿灯车流调控系统，包括通过摄像头收集获得的车流量密度以及当前路况的数据而制定实时更新的红绿灯时长变化策略，其特征在于，还包括近端策略优化的强化学习算法，

所述近端策略优化算法，包括以下步骤：

S3、将各个路口的通行率与拥塞程度，车辆通行量L_i和总车辆L₀为近端策略优化重要性采样的观测变量，并输入到curiosity模型中，得到“奖励”输出控制量；

S5、分析模型数据，选择最优的模型。

2.根据权利要求1所述的智能红绿灯车流调控系统，其特征在于，所述步骤S1具体包括以下步骤：

S101、建立交通模型，交通模型采用的是以unity为核心的实时渲染应用场景，模拟了一个环形的微型城镇的交通系统，

3.根据权利要求1所述的智能红绿灯车流调控系统，其特征在于，所述步骤S2中的公式为：

其中，P_t为通行率预测，P_S为拥塞程度预测，

为历史时间预估分布参数。

4.根据权利要求1所述的智能红绿灯车流调控系统，其特征在于，所述步骤S3具体包括以下步骤：

其中t为当前需要学习的actor模型，t'为当前与环境进行互动的示范actor模型；

S302、Curiosity模型：即估测A^t'((Pt_i,Ps_i),at_i)的取值的方法，从at_i和t预测出的t'相差越大给的奖励(reward)越大。

5.根据权利要求1-4任意一项所述的智能红绿灯车流调控系统，其特征在于，控制量输出的计算公式为

6.根据权利要求5所述的智能红绿灯车流调控系统，其特征在于，还包括城市仿真模型所提供的数据。

7.根据权利要求1所述的智能红绿灯车流调控系统，其特征在于，还包括基于图像分类技术及强化学习算法的嵌入式路口红绿灯调控方法，且依据所述近端策略优化算法进行分析，调控红绿灯时间以进行交通控制，使得区域内的交通网络达到最优的通行效率。