CN117590766B

CN117590766B - 通道入口导流栏杆角度调整的控制方法和装置

Info

Publication number: CN117590766B
Application number: CN202410077447.2A
Authority: CN
Inventors: 杨晓霞; 张国庆; 董海荣; 康元磊; 马浩; 黄帅; 周敏; 张永亮; 曲大义; 朱兆文; 史云娣; 周亚博; 周波
Original assignee: Qingdao University of Technology; China Railway Construction Electrification Bureau Group Co Ltd; Third Engineering Co Ltd of China Railway Construction Electrification Bureau Group Co Ltd; National Institute of Natural Hazards
Current assignee: Qingdao University of Technology; China Railway Construction Electrification Bureau Group Co Ltd; Third Engineering Co Ltd of China Railway Construction Electrification Bureau Group Co Ltd; National Institute of Natural Hazards
Priority date: 2024-01-19
Filing date: 2024-01-19
Publication date: 2024-05-28
Anticipated expiration: 2044-01-19
Also published as: CN117590766A

Abstract

本申请实施例公开了通道入口导流栏杆角度调整的控制方法和装置，涉及计算机技术领域。该方法的一具体实施方式包括：获取预先建立的系统辨识模型，系统辨识模型通过系统辨识的方法由输入输出数据集进行处理得到，输入输出数据集中的输入数据包括预设时间段内通道入口处固定长度的导流栏杆的调整角度序列，输入输出数据集中的输出数据包括预设时间段内通道入口的瓶颈处客流指标的变换序列；将系统辨识模型作为被控对象，通过迭代学习控制算法确定疏散过程各时间节点导流栏杆角度调整的控制数据；基于控制数据对导流栏杆进行控制。该实施方式提高了通道入口处导流栏杆设置的合理性，从而提高了行人的通行效率。

Description

通道入口导流栏杆角度调整的控制方法和装置

技术领域

本申请实施例涉及计算机技术领域，尤其涉及通道入口导流栏杆角度调整的控制方法和装置。

背景技术

在某些商场、火车站或地铁站等人员相对密集的场合，当客流量增加时，在主要固定通道的入口处难免会产生拥挤现象，不仅仅影响了人群的通行速率，而且大大增加了发生事故的可能性。除此之外，对于一些大型活动现场往往也需要对大量人员进行疏散，所以需要一种方法来缓解高密度人员在通道入口处的拥堵。目前，人群疏散的问题主要通过人工引导来解决，但是这种方式效率较低。

发明内容

本申请实施例提出了通道入口导流栏杆角度调整的控制方法和装置。

第一方面，本申请的一些实施例提供了一种通道入口导流栏杆角度调整的控制，该方法包括：获取预先建立的系统辨识模型，所述系统辨识模型通过系统辨识的方法由输入输出数据集进行处理得到，所述输入输出数据集中的输入数据包括预设时间段内通道入口处固定长度的导流栏杆的调整角度序列，所述输入输出数据集中的输出数据包括预设时间段内通道入口的瓶颈处客流指标的变换序列；将所述系统辨识模型作为被控对象，通过迭代学习控制算法确定疏散过程各时间节点所述导流栏杆角度调整的控制数据；基于所述控制数据对所述导流栏杆进行控制。

在一些实施例中，所述基于所述控制数据对所述导流栏杆进行控制，包括：存储所述各时间节点所述导流栏杆角度调整的控制数据；确定系统是否运行到所述各时间节点中的时间节点；若是，则查询运行到的时间节点对应的导流栏杆角度调整的控制数据；根据查询到的控制数据调整所述导流栏杆的角度。

在一些实施例中，所述输入输出数据集通过以下步骤得到：基于社会力模型的个体运动仿真软件，构建通道入口的三维仿真场景；在所述三维仿真场景中加入人群，模拟所述通道入口固定长度导流栏杆不同调整角度的疏散场景，在预先设置的时间节点进行采样得到瓶颈处客流指标。

在一些实施例中，所述系统辨识模型选取RBF-ARX模型作为模型结构对象，所述RBF-ARX模型结构为：

其中，y和u表示模型的输出与输入，为系统状态变量，/>为高斯白噪声，、/>和/>是状态相依的模型函数系数，/>，/>和为RBF网络的线性权重，/>，/>，/>和n_x是模型阶次，、/>和/>为比例系数，表示向量二范式，/>和/>为RBF的网络中心，/>为系统延时。

在一些实施例中，所述系统辨识模型的建立步骤包括：模型参数辨识，所述模型参数辨识，包括对模型参数的估计和阶次的选择；所述对模型参数的估计，包括：采取结构化非线性参数优化策略进行选优，将参数寻找空间分为非线性参数子空间和线性参数子空间；基于类列文伯格-马夸尔特算法对非线性参数空间中的非线性参数进行优化，使用线性最小二乘法对线性参数空间中的线性参数进行优化。

在一些实施例中，所述阶次的选择，包括：通过计算备选模型的赤池信息准则AIC值，找出最小AIC值对应的模型阶次作为所述系统辨识模型的阶次。

在一些实施例中，所述RBF-ARX模型中的参数分为线性参数和非线性参数，其中，所述非线性参数表示为：

，

线性参数表示为：

，

基于辨识向量，所述RBF-ARX表示为：；以及所述通过计算备选模型的赤池信息准则AIC值，找出最小AIC值对应的模型阶次作为所述系统辨识模型的阶次，包括：根据预设规则确定备选的/>和/>；计算备选的/>和/>的AIC值；将最小的AIC值对应的/>和/>确定为所述系统辨识模型的阶次；其中，所述AIC值的计算公式如下：；其中，/>表示辨识数据个数，/>表示模型方差，/>表示所要辨识参数/>的个数，通过以下公式计算：/>；其中，/>为所述RBF-ARX模型的非线性参数个数，/>为所述RBF-ARX模型的线性参数个数，/>和/>为预先设置的。

在一些实施例中，所述对模型参数的估计，包括：确定非线性参数的初始值，其中，比例因子/>的初始值通过以下公式确定：

；其中，/>，/>为状态变量/>中随机选取的值或状态变量/>的均值；根据以下公式利用最小二乘法计算线性参数的初始值/>：

；

其中，是RBF-ARX模型所采集的输出数据的集合，/>表示所述集合中的数据个数，/>表示RBF-ARX模型的最大延时；基于以下优化目标函数对模型参数进行寻优：

；

其中，是模型的一步向前与预测输出，/>通过公式/>计算，/>表示迭代步数，/>关于/>的雅可比矩阵为/>，非线性参数/>的更新策略通过公式来表示，/>表示步长，/>表示寻优方向，/>由公式来确定，/>利用以下最小二乘法公式进行更新：

；

当寻优结果不满足，寻优结束，得到所述系统辨识模型的辨识参数。

在一些实施例中，所述将所述系统辨识模型作为被控对象，通过迭代学习控制算法确定疏散过程各时间节点所述导流栏杆角度调整的控制数据，包括：基于所述系统辨识模型的状态空间表达式，通过D型学习律的迭代学习控制ILC算法找到合适的输入使得系统在该控制信号的作用下，系统的输出/>的轨迹一致收敛于期望/>的轨迹，其中，所述系统辨识模型的状态空间表达式如下：

；

其中，

所述系统辨识模型的状态空间表达式的迭代学习律如下：

；其中，/>为迭代次数，/>为定常的学习增益矩阵，/>为所述预设时间段，/>为系统的跟踪误差，通过以下公式计算：

，/>；其中，当系统满足以下公式时，所述系统的输出/>的轨迹一致收敛于期望/>的轨迹：

，其中，/>为非负数。

第二方面，本申请的一些实施例提供了一种通道入口导流栏杆角度调整的控制装置，该装置包括：获取单元，被配置成获取预先建立的系统辨识模型，所述系统辨识模型通过系统辨识的方法由输入输出数据集进行处理得到，所述输入输出数据集中的输入数据包括预设时间段内通道入口处固定长度的导流栏杆的调整角度序列，所述输入输出数据集中的输出数据包括预设时间段内通道入口的瓶颈处客流指标的变换序列；确定单元，被配置成将所述系统辨识模型作为被控对象，通过迭代学习控制算法确定疏散过程各时间节点所述导流栏杆角度调整的控制数据；控制单元，被配置成基于所述控制数据对所述导流栏杆进行控制。

在一些实施例中，所述控制单元，进一步被配置成：存储所述各时间节点所述导流栏杆角度调整的控制数据；确定系统是否运行到所述各时间节点中的时间节点；若是，则查询运行到的时间节点对应的导流栏杆角度调整的控制数据；根据查询到的控制数据调整所述导流栏杆的角度。

在一些实施例中，所述装置还包括仿真单元，所述仿真单元被配置为通过以下步骤得到所述输入输出数据集：基于社会力模型的个体运动仿真软件，构建通道入口的三维仿真场景；在所述三维仿真场景中加入人群，模拟所述通道入口固定长度导流栏杆不同调整角度的疏散场景，在预先设置的时间节点进行采样得到瓶颈处客流指标。

其中，y和u表示模型的输出与输入，为系统状态变量，/>为高斯白噪声，、/>和/>是状态相依的模型函数系数，/>，/>和为RBF网络的线性权重，/>，/>，/>和n_x是模型阶次，、/>和/>为比例系数，/>表示向量二范式，/>和/>为RBF的网络中心，/>为系统延时。

在一些实施例中，所述装置还包括模型建立单元，所述模型建立单元被配置成通过以下步骤建立所述系统辨识模型：模型参数辨识，所述模型参数辨识，包括对模型参数的估计和阶次的选择；所述对模型参数的估计，包括：采取结构化非线性参数优化策略进行选优，将参数寻找空间分为非线性参数子空间和线性参数子空间；基于类列文伯格-马夸尔特算法对非线性参数空间中的非线性参数进行优化，使用线性最小二乘法对线性参数空间中的线性参数进行优化。

在一些实施例中，所述模型建立单元进一步被配置成：通过计算备选模型的赤池信息准则AIC值，找出最小AIC值对应的模型阶次作为所述系统辨识模型的阶次。

，

所述线性参数表示为：

，

；

在一些实施例中，所述将所述系统辨识模型作为被控对象，通过迭代学习控制算法确定疏散过程各时间节点所述导流栏杆角度调整的控制数据，包括：基于系统辨识模型的状态空间表达式，通过D型学习律的迭代学习控制ILC算法找到合适的输入使得系统在控制信号的作用下，系统的输出/>的轨迹一致收敛于期望/>的轨迹，其中，系统辨识模型的状态空间表达式如下：

；

其中，

系统辨识模型的状态空间表达式的迭代学习律如下：

；

其中，为迭代次数，/>为定常的学习增益矩阵，/>为预设时间段，/>为系统的跟踪误差，通过以下公式计算：

，/>；

其中，当系统满足以下公式时，系统的输出的轨迹一致收敛于期望/>的轨迹：

，其中，/>为非负数。

第三方面，本申请的一些实施例提供了一种设备，包括：一个或多个处理器；存储装置，其上存储有一个或多个程序，当上述一个或多个程序被上述一个或多个处理器执行，使得上述一个或多个处理器实现如第一方面上述的方法。

第四方面，本申请的一些实施例提供了一种计算机可读介质，其上存储有计算机程序，该程序被处理器执行时实现如第一方面上述的方法。

本申请实施例提供的通道入口导流栏杆角度调整的控制方法和装置，通过获取预先建立的系统辨识模型，系统辨识模型通过系统辨识的方法由输入输出数据集进行处理得到，输入输出数据集中的输入数据包括预设时间段内通道入口处固定长度的导流栏杆的调整角度序列，输入输出数据集中的输出数据包括预设时间段内通道入口的瓶颈处客流指标的变换序列；将系统辨识模型作为被控对象，通过迭代学习控制算法确定疏散过程各时间节点导流栏杆角度调整的控制数据；基于控制数据对导流栏杆进行控制，提高了通道入口处导流栏杆设置的合理性，从而提高了行人的通行效率。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显：

图1是本申请的一些可以应用于其中的示例性系统架构图；

图2是根据本申请的通道入口导流栏杆角度调整的控制方法的一个实施例的流程图；

图3是本申请实施例的一个应用场景中通道入口导流栏杆角度调整的迭代学习控制方法流程图；

图4是本申请实施例的一个应用场景中迭代学习控制算法流程图；

图5是根据本申请的通道入口导流栏杆角度调整的控制装置的一个实施例的结构示意图；

图6是适于用来实现本申请的一些实施例的服务器或终端的计算机系统的结构示意图。

具体实施方式

为了使本技术领域的人员更好的理解本方法，下面结合具体实施方法以及附图，对通道入口导流栏杆角度调整的控制方法进行清晰的描述说明。应该指出，以下详细说明都是示例性的，旨在对本申请提供进一步的说明。除非另有指明，本申请使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。

应当理解，在本申请说明书和权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。另外,在本申请说明书和权利要求书的描述中,术语“第一”、“第二”及“第三”等仅用于区分描述，而不能理解为指示或暗示相对重要性。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

图1示出了可以应用本申请的通道入口导流栏杆角度调整的控制方法或通道入口导流栏杆角度调整的控制装置的实施例的示例性系统架构。

如图1所示，系统架构可以包括终端设备101、102、103，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互，以接收或发送消息等。终端设备101、102、103上可以安装有各种客户端应用，例如数据处理类应用、仿真建模类应用等。

终端设备101、102、103可以是硬件，也可以是软件。当终端设备101、102、103为硬件时，可以是具有显示屏的各种电子设备，包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时，可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块，也可以实现成单个软件或软件模块。在此不做具体限定。

服务器105可以是提供各种服务的服务器，例如对终端设备101、102、103上安装的应用提供支持的后台服务器，服务器105可以获取预先建立的系统辨识模型，系统辨识模型通过系统辨识的方法由输入输出数据集进行处理得到，输入输出数据集中的输入数据包括预设时间段内通道入口处固定长度的导流栏杆的调整角度序列，输入输出数据集中的输出数据包括预设时间段内通道入口的瓶颈处客流指标的变换序列；将系统辨识模型作为被控对象，通过迭代学习控制算法确定疏散过程各时间节点导流栏杆角度调整的控制数据；基于控制数据对导流栏杆进行控制。

需要说明的是，本申请实施例所提供的通道入口导流栏杆角度调整的控制方法可以由服务器105执行，也可以由终端设备101、102、103执行，相应地，通道入口导流栏杆角度调整的控制装置可以设置于服务器105中，也可以设置于终端设备101、102、103中。

需要说明的是，服务器可以是硬件，也可以是软件。当服务器为硬件时，可以实现成多个服务器组成的分布式服务器集群，也可以实现成单个服务器。当服务器为软件时，可以实现成多个软件或软件模块（例如用来提供分布式服务），也可以实现成单个软件或软件模块。在此不做具体限定。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

继续参考图2，示出了根据本申请的通道入口导流栏杆角度调整的控制方法的一个实施例的流程。该通道入口导流栏杆角度调整的控制方法，包括以下步骤：

步骤201，获取预先建立的系统辨识模型。

在本实施例中，通道入口导流栏杆角度调整的控制方法执行主体（例如图1所示的服务器或终端）可以首先获取预先建立的系统辨识模型。系统辨识模型通过系统辨识的方法由输入输出数据集进行处理得到，输入输出数据集中的输入数据包括预设时间段内通道入口处固定长度的导流栏杆的调整角度序列，输入输出数据集中的输出数据包括预设时间段内通道入口的瓶颈处客流指标的变换序列。作为示例，系统辨识模型可以选取RBF-ARX模型、BP（Back Propagation）神经网络、Hopfiled神经网络和LVQ（Learning VectorQuantization）神经网络等作为模型结构对象。客流指标可以包括客流量、人群密度、客流速度和/或人群拥挤度。输入输出数据集可以通过实景采集或仿真软件得到。

在本实施例的一些可选实现方式中，输入输出数据集通过以下步骤得到：基于社会力模型的个体运动仿真软件，构建通道入口的三维仿真场景；在三维仿真场景中加入人群，模拟通道入口固定长度导流栏杆不同调整角度的疏散场景，在预先设置的时间节点进行采样得到瓶颈处客流指标。时间节点即采样节点，可以基于经验进行设置。

在本实施例的一些可选实现方式中，系统辨识模型选取RBF-ARX模型作为模型结构对象，RBF-ARX模型结构为：

在本实施例的一些可选实现方式中，系统辨识模型的建立步骤包括：模型参数辨识，模型参数辨识，包括对模型参数的估计和阶次的选择；对模型参数的估计，包括：采取结构化非线性参数优化策略进行选优，将参数寻找空间分为非线性参数子空间和线性参数子空间；基于类列文伯格-马夸尔特算法对非线性参数空间中的非线性参数进行优化，使用线性最小二乘法对线性参数空间中的线性参数进行优化。此外，还可以通过牛顿法、信任域法等方法进行参数优化。

在本实施例的一些可选实现方式中，阶次的选择，包括：通过计算备选模型的赤池信息准则AIC值，找出最小AIC值对应的模型阶次作为系统辨识模型的阶次。除AIC值外，还可以通过BIC、R-squared值等进行评估。

在本实施例的一些可选实现方式中，RBF-ARX模型中的参数分为线性参数和非线性参数，其中，非线性参数表示为：

，

线性参数表示为：

，

基于辨识向量，RBF-ARX表示为：；以及通过计算备选模型的赤池信息准则AIC值，找出最小AIC值对应的模型阶次作为系统辨识模型的阶次，包括：根据预设规则确定备选的/>和/>；计算备选的/>和/>的AIC值；将最小的AIC值对应的/>和确定为系统辨识模型的阶次；其中，AIC值的计算公式如下：/>；其中，/>表示辨识数据个数，/>表示模型方差，/>表示所要辨识参数/>的个数，通过以下公式计算：/>；其中，/>为RBF-ARX模型的非线性参数个数，/>为RBF-ARX模型的线性参数个数，/>和/>为预先设置的。/>和/>能影响模型结构和动态性能，当它们取得过大时就会导致模型结构太复杂而难于计算，取得太小则会系统动态性能不理想。根据经验我们一般选/>为1~2，/>为2~3。这样再根据经验选取不同的/>和/>计算出不同的AIC值,最后确定得出最小的AIC值的那组/>和/>为最终阶次。

在本实施例的一些可选实现方式中，对模型参数的估计，包括：确定非线性参数的初始值，其中，比例因子/>的初始值通过以下公式确定：

；

其中，是RBF-ARX模型所采集的输出数据的集合，/>表示集合中的数据个数，/>表示RBF-ARX模型的最大延时；基于以下优化目标函数对模型参数进行寻优：

；

其中，是模型的一步向前与预测输出，/>通过公式/>计算，/>表示迭代步数，/>关于/>的雅可比矩阵为/>，非线性参数/>的更新策略通过公式来表示，/>表示步长，/>表示寻优方向，/>由公式/>来确定，/>利用以下最小二乘法公式进行更新：

；

当寻优结果不满足，寻优结束，得到系统辨识模型的辨识参数。

步骤202，将系统辨识模型作为被控对象，通过迭代学习控制算法确定疏散过程各时间节点导流栏杆角度调整的控制数据。

在本实施例中，迭代学习控制（Iterative Learning Control，ILC）是一种对重复模式工作的系统进行跟踪控制的方法。这种控制方法特别适用于具有高精度轨迹控制问题的非线性、复杂系统，包括D型学习律、P型学习律等。

在本实施例的一些可选实现方式中，将系统辨识模型作为被控对象，通过迭代学习控制算法确定疏散过程各时间节点导流栏杆角度调整的控制数据，包括：基于系统辨识模型的状态空间表达式，通过D型学习律的迭代学习控制ILC算法找到合适的输入使得系统在控制信号的作用下，系统的输出/>的轨迹一致收敛于期望/>的轨迹，其中，系统辨识模型的状态空间表达式如下：

；

其中，

系统辨识模型的状态空间表达式的迭代学习律如下：

；/>

，/>；

，其中，/>为非负数。

通过范数，可以证明上述定理成立，同样，当系统初始条件不能完全保持一致，即初始条件为/>时，仍能保持系统的输出轨迹/>在/>时，一致收敛于。

作为示例，可以采用压缩映射理论研究方法证明其收敛性。压缩映射方法时最早的收敛性分析方法，该方法要求系统满足全局Lipschitz条件及相同的初始状态。根据压缩映射理论，如果系统参数满足,则有，/>，即迭代学习控制算法单调收敛。该方法依赖于对范数类型的选择，在实际当中需要一定的经验。

步骤203，基于控制数据对导流栏杆进行控制。

在本实施例中，可以直接基于迭代学习控制得到的控制数据对导流栏杆进行控制，也可以在每个选定的固定时间段进行迭代学习控制，得到对应的固定长度导流栏杆最优角度序列，保存到对应的控制系统中，等到再次到达相应的时间段时，调取相应的最优控制输入，从而得到符合要求的瓶颈处客流指标。

在本实施例的一些可选实现方式中，基于控制数据对导流栏杆进行控制，包括：存储各时间节点导流栏杆角度调整的控制数据；确定系统是否运行到各时间节点中的时间节点；若是，则查询运行到的时间节点对应的导流栏杆角度调整的控制数据；根据查询到的控制数据调整导流栏杆的角度。当下一次系统运行到该时间段时调取对应的控制数据可以使得系统能够快速的达到预期的效果，进一步提高人员的疏散效率或通行速率。

本申请的上述实施例提供的方法通过获取预先建立的系统辨识模型，系统辨识模型通过系统辨识的方法对输入输出数据集进行处理得到，输入输出数据集中的输入数据包括预设时间段内通道入口处固定长度的导流栏杆的调整角度序列，输入输出数据集中的输出数据包括预设时间段内通道入口的瓶颈处客流指标的变换序列；将系统辨识模型作为被控对象，通过迭代学习控制算法确定疏散过程各时间节点导流栏杆角度调整的控制数据；基于控制数据对导流栏杆进行控制，提高了通道入口处导流栏杆设置的合理性，从而提高了行人的通行效率。

继续参见图3，图3示出了是本申请实施例的一个应用场景中通道入口导流栏杆角度调整的迭代学习控制方法流程图，包括：

步骤S101：构建固定场景通道入口处的三维仿真场景。

由于疏散环境为某一固定通道入口处，疏散人群为通道入口处两侧的人群，因此可以基于社会力模型的个体运动仿真软件，对应实地场景，构建设置有固定通道入口处以及连接通道入口处两侧的区域的三维仿真场景。

可以使用Pathfinder软件进行构建，Pathfinder软件是一款基于人员疏散和移动模拟的仿真器。它基于先进的社会力模型和路径规划算法，能够提供高度准确的人流仿真结果，并帮助用户做出科学决策。场景构建时，可以使用软件提供的场景编辑工具创建建筑物或空间的几何模型。也可以导入建筑模型文件或手动绘制建筑物的墙壁、地面等元素。确保建筑物的空间模型准确反映实际情况。

S102：将模拟个体加入到三维仿真场景中，模拟通道入口处导流栏杆角度不同调整对应的变换，得到各采样时刻瓶颈处客流指标，构建输入输出数据集。

通过在仿真实验中每个时间段节点更改导流栏杆角度，可以获取输入输出数据集，所用方法是基于社会力模型构建的某一固定通道入口处的三维仿真场景中进行仿真，社会力模型可较为精确地模拟个体运动，故所得数据可信度高。

S103：采用系统辨识方法对数据集进行分析处理，得到最优结构最优参数的辨识模型。

步骤S103中还包括步骤S301、S302、S303、S304、S305、S306，具体为：

S301、输入和输出数据采集与处理。

可以定义导流栏杆不同角度变化序列作为输入，将每个采样时刻通道入口瓶颈处的客流指标作为输出，构建输入输出数据集，通过去除噪声、数据归一化预处理，实现数据的准确性和可用性。

S302、模型结构选取。

可以选取RBF-ARX模型作为系统辨识模型的模型结构对象，RBF-ARX模型是一种由RBF神经网络和状态相依ARX模型相融合而成的新型RBF模型,状态相依模型中的回归矩阵系数通过一组RBF网络逼近得来，从而得到RBF-ARX模型。所述RBF-ARX模型结构的数学公式如下：

其中，y和u表示模型的输出与输入，为系统状态变量，它可能是系统的输入变量或输出变量，也可能输入输出量的组合，或者是系统中的其他相关变量，/>为高斯白噪声，/>、/>和/>是状态相依的模型函数系数，/>，/>和/>为RBF网络的线性权重，/>，/>，/>和n_x是模型阶次，、/>和/>为比例系数，表示向量二范式，/>和/>为RBF的网络中心，/>为系统延时。

S303、模型参数辨识。

可以通过结构化非线性参数优化策略(SNPOM)进行选优，得出系统的阶数。首先，将模型中的参数分为线性参数和非线性参数两类：

非线性参数为：

线性参数为：

通过所述辨识向量，所述RBF-ARX模型可改写为矩阵的表达形式如下所示：

模型的阶次包括，/>，/>和/>。在通过AIC准则确定/>和/>之前，要先确定/>和/>。这样再根据经验选取不同的/>和/>计算出不同的AIC值,最后确定得出最小的AIC值的那组和/>为最终阶次，其中AIC值的具体计算为：/>。其中/>表示辨识数据个数，/>表示模型方差，/>为所要辨识参数/>的个数。

S304、模型参数进行初始化。

先确定非线性参数的初始值。其中，可以由公式：，确定比例因子/>初始值，其中，/>。在状态变量/>中随机选取或者取均值作为/>的初值然后利用最小二乘法计算线性参数的初始值/>，如下公式所示：

其中，，/>表示RBF-ARX模型的最大延时，在这个模型中，他们是所采集的输出数据的集合，/>表示这个数据集合的数据个数。

S305、模型参数进行优化。

得到模型之后为了能够更好的让模型更好的符合所要控制的系统，可以进一步对模型的参数进行优化。首先可以选取如下公式所示的优化目标函数：

其中，是本模型的一步向前与预测输出。对参数的优化问题，通过下面公式计算：

。用/>表示迭代步数；

则关于/>的Jacobian矩阵为：/>；

采用公式来表示非线性参数/>的更新策略。其中，/>表示步长，/>表示寻优方向。/>由公式/>来确定。而公式中的/>又可以利用以下最小二乘法公式进行更新：

在参数优化过程中，当寻优结果不满足时，寻优结束，此时即得到了模型的辨识参数。

S305、模型验证。

使用未使用的数据集可以进行模型验证，可以采用均方根误差指标评估模型的拟合能力和预测性能。

S104、将辨识模型作为被控对象，由迭代学习控制理论来设计迭代学习控制控制算法对被控系统进行控制，得到对应导流栏杆最优角度序列。

所述步骤S104还包括步骤S401、S402、S403，具体为：

S401、模型的状态空间表示。

在获取RBF-ARX模型的状态空间表达式后，可以把RBF-ARX模型表示为如下矩阵多项式：

其中，、/>为上述所建立的RBF-ARX模型系数，/>。/>

通过选取如下变量把系统的模型转化为状态空间表达式：

其中，/>

向量中各元素右下角第一个数字代表编号，用于区分不同的状态，为状态最高阶次区取/>两者中的最大值，t代表时间步长，在这个模型构建的时间。在没有特殊含义及解释的情况下，前后角标的含义以及符号代表的含义均相同。

可得RBF-ARX模型的状态空间表达式，如下所示：

其中，x(t+1)表示系统在时刻t+1的状态向量，x(t)表示系统在时刻t的状态向量，为常数矩阵，表示状态转移矩阵，用于描述系统状态从t到t+1的演化，/>为常数矩阵，表示输入矩阵，用于描述输入对系统状态的影响，u(t)表示系统在时刻t的输入向量，/>为状态相依的模型函数系数，/>表示误差项，用于表示系统中的未建模动态或未知扰动，C为常数矩阵，表示输出矩阵，用于描述状态向量与输出之间的关系。

上式中，状态空间模型中各矩阵的表达形式如下所示：

S402、迭代学习控制算法设计。

对于步骤S401得到的系统的状态空间表达式，通过迭代学习控制算法对系统进行控制。参考图4，迭代学习控制是找到合适的输入使系统在该控制信号的作用下，输出尽可能精确的逼近/> (期望的输出量)。系统跟踪误差为/>，构造控制输入函数/>，则算法可以利用前一次的控制输入和跟踪误差更新控制输入，从而具备了从过去经验中总结不足并进行弥补修正的学习能力。

可以采用D型ILC算法对系统进行控制，在D型学习律中，系统以往操作中的输出误差的倒数信号被作为修正项引入到学习律中修正系统当前操作的控制输入，即：

其中，，/>,/>为迭代次数，/>为定常的学习增益矩阵。

经过离散变换后，得到的迭代学习律为：

其中，，/>为采样周期。

对于RBF-ARX模型的离散时间系统的状态空间表达式，选取学习律

当系统满足：

时，系统的输出轨迹一致收敛于期望轨迹，即当时，/>，/>。

S403、迭代学习控制算法收敛性的判断。

判断算法的收敛性。采用压缩映射理论研究方法证明其收敛性。压缩映射方法时最早的收敛性分析方法，该方法要求系统满足全局Lipschitz条件及相同的初始状态。根据压缩映射理论，如果系统参数满足，则有，即迭代学习控制算法单调收敛。该方法依赖于对范数类型的选择，需要一定的经验。

可以理解的是，系统的状态空间表达式只要满足此公式，那么在迭代控制算法的控制下，在迭代了一定次数后系统可以达到预想的效果。

S404、将得到的每个时间段的最优控制输入存储到系统中，当下一次新系统运行到该时间段时调取对应的控制输入使得系统能够快速的达到预期的效果，提高人员的疏散效率或通行速率。

可以理解为，系统在历史数据的基础上，根据历史数据的输入输出数据通过迭代学习控制算法得到某一特定时间段内得到最优的控制输入，当系统再次运行到此特定时间段内时，通过系统内的调用模块，可以把历史得到的控制输入加入到控制系统从而达到我们所期望的效果。

进一步参考图5，作为对上述各图所示方法的实现，本申请提供了一种通道入口导流栏杆角度调整的控制装置的一个实施例，该装置实施例与图2所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。

如图5所示，本实施例的通道入口导流栏杆角度调整的控制装置包括：获取单元501、确定单元502、控制单元503。其中，获取单元，被配置成获取预先建立的系统辨识模型，系统辨识模型通过系统辨识的方法由输入输出数据集进行处理得到，输入输出数据集中的输入数据包括预设时间段内通道入口处固定长度的导流栏杆的调整角度序列，输入输出数据集中的输出数据包括预设时间段内通道入口的瓶颈处客流指标的变换序列；确定单元，被配置成将系统辨识模型作为被控对象，通过迭代学习控制算法确定疏散过程各时间节点导流栏杆角度调整的控制数据；控制单元，被配置成基于控制数据对导流栏杆进行控制。

在本实施例中，通道入口导流栏杆角度调整的控制装置的获取单元501、确定单元502、控制单元503的具体处理可以参考图2对应实施例中的步骤201、步骤202和步骤203。

在本实施例的一些可选实现方式中，控制单元，进一步被配置成：存储各时间节点导流栏杆角度调整的控制数据；确定系统是否运行到各时间节点中的时间节点；若是，则查询运行到的时间节点对应的导流栏杆角度调整的控制数据；根据查询到的控制数据调整导流栏杆的角度。

在本实施例的一些可选实现方式中，装置还包括仿真单元，仿真单元被配置为通过以下步骤得到输入输出数据集：基于社会力模型的个体运动仿真软件，构建通道入口的三维仿真场景；在三维仿真场景中加入人群，模拟通道入口固定长度导流栏杆不同调整角度的疏散场景，在预先设置的时间节点进行采样得到瓶颈处客流指标。

在本实施例的一些可选实现方式中，装置还包括模型建立单元，模型建立单元被配置成通过以下步骤建立系统辨识模型：模型参数辨识，模型参数辨识，包括对模型参数的估计和阶次的选择；对模型参数的估计，包括：采取结构化非线性参数优化策略进行选优，将参数寻找空间分为非线性参数子空间和线性参数子空间；基于类列文伯格-马夸尔特算法对非线性参数空间中的非线性参数进行优化，使用线性最小二乘法对线性参数空间中的线性参数进行优化。

在本实施例的一些可选实现方式中，模型建立单元进一步被配置成：通过计算备选模型的赤池信息准则AIC值，找出最小AIC值对应的模型阶次作为系统辨识模型的阶次。

，

线性参数表示为：

，

基于辨识向量，RBF-ARX表示为：；以及通过计算备选模型的赤池信息准则AIC值，找出最小AIC值对应的模型阶次作为系统辨识模型的阶次，包括：根据预设规则确定备选的/>和/>；计算备选的/>和/>的AIC值；将最小的AIC值对应的/>和确定为系统辨识模型的阶次；其中，AIC值的计算公式如下：/>；其中，/>表示辨识数据个数，/>表示模型方差，/>表示所要辨识参数/>的个数，通过以下公式计算：/>；其中，/>为RBF-ARX模型的非线性参数个数，/>为RBF-ARX模型的线性参数个数，/>和/>为预先设置的。

；

其中，是RBF-ARX模型所采集的输出数据的集合，/>表示集合中的数据个数，/>表示RBF-ARX模型的最大延时；基于以下优化目标函数对模型参数进行寻优：/>

；

；/>

其中，

系统辨识模型的状态空间表达式的迭代学习律如下：

；

，/>；

，其中，/>为非负数。

下面参考图6，其示出了适于用来实现本申请实施例的服务器或终端的计算机系统的结构示意图。图6示出的服务器或终端仅仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

如图6所示，计算机系统包括中央处理单元（CPU）601，其可以根据存储在只读存储器（ROM）602中的程序或者从存储部分608加载到随机访问存储器（RAM）603中的程序而执行各种适当的动作和处理。在RAM 603中，还存储有系统操作所需的各种程序和数据。CPU601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出（I/O）接口605也连接至总线604。

以下部件可以连接至I/O接口605：包括诸如键盘、鼠标等的输入部分606；包括诸如阴极射线管（CRT）、液晶显示器（LCD）等以及扬声器等的输出部分607；包括硬盘等的存储部分608；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器610上，以便于从其上读出的计算机程序根据需要被安装入存储部分608。

特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分609从网络上被下载和安装，和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元（CPU）601执行时，执行本申请的方法中限定的上述功能。需要说明的是，本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读介质或者是上述两者的任意组合。计算机可读介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器（RAM）、只读存储器（ROM）、可擦式可编程只读存储器（EPROM或闪存）、光纤、便携式紧凑磁盘只读存储器（CD-ROM）、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中，计算机可读介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如C语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机（例如利用因特网服务提供商来通过因特网连接）。

附图中的流程图和框图，图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本申请实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中，例如，可以描述为：一种处理器包括获取单元、确定单元、控制单元。其中，这些单元的名称在某种情况下并不构成对该单元本身的限定，例如，获取单元还可以被描述为“被配置成获取预先建立的系统辨识模型的单元”。

作为另一方面，本申请还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的装置中所包含的；也可以是单独存在，而未装配入该装置中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该装置执行时，使得该装置：获取预先建立的系统辨识模型，系统辨识模型通过系统辨识的方法对输入输出数据集进行处理得到，输入输出数据集中的输入数据包括预设时间段内通道入口处固定长度的导流栏杆的调整角度序列，输入输出数据集中的输出数据包括预设时间段内通道入口的瓶颈处客流指标的变换序列；将系统辨识模型作为被控对象，通过迭代学习控制算法确定疏散过程各时间节点导流栏杆角度调整的控制数据；基于控制数据对导流栏杆进行控制。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本申请中所涉及的发明范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述发明构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的（但不限于）具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims

1.一种通道入口导流栏杆角度调整的控制方法，其特征在于，包括：

获取预先建立的系统辨识模型，所述系统辨识模型通过系统辨识的方法由输入输出数据集进行处理得到，所述输入输出数据集中的输入数据包括预设时间段内通道入口处固定长度的导流栏杆的调整角度序列，所述输入输出数据集中的输出数据包括预设时间段内通道入口的瓶颈处客流指标的变换序列；

将所述系统辨识模型作为被控对象，通过迭代学习控制算法确定疏散过程各时间节点所述导流栏杆角度调整的控制数据；

基于所述控制数据对所述导流栏杆进行控制；

其中，所述系统辨识模型选取RBF-ARX模型作为模型结构对象，所述RBF-ARX模型结构为：

其中，t表示时间变量，y和u表示模型的输出与输入，X(t-1)为系统状态变量，e(t)为高斯白噪声，φ₀(X(t-1))、φ_y，i(X(t-1))(i＝0，1…，p)和φ_u，i(X(t-1))(i＝0，1…，q)是状态相依的模型函数系数，和为RBF网络的线性权重，p，q，m和n_x是模型阶次，n_x＝dim{X(t-1)}、/>和/>为比例系数，||·||表示向量二范式，/>和/>为RBF的网络中心，d为系统延时；

其中，所述将所述系统辨识模型作为被控对象，通过迭代学习控制算法确定疏散过程各时间节点所述导流栏杆角度调整的控制数据，包括：

基于所述系统辨识模型的状态空间表达式，通过D型学习律的迭代学习控制ILC算法找到合适的输入u_k(t)使得系统在控制信号的作用下，系统的输出y_k(t)的轨迹一致收敛于期望y_d(t)的轨迹，其中，所述系统辨识模型的状态空间表达式如下：

其中，

所述系统辨识模型的状态空间表达式的迭代学习律如下：

u_k+1(t)＝u_k(t)+Γ(t)(e_k(t+1)-e_k(t))；

其中，k为迭代次数，Γ为定常的学习增益矩阵，T为所述预设时间段，e_k(t)为系统的跟踪误差，通过以下公式计算：

e_k(t)＝y_d(t)-y_k(t)，t∈[0，T]；

其中，当系统满足以下公式时，所述系统的输出y_k(t)的轨迹一致收敛于期望y_d(t)的轨迹：

其中，p为非负数。

2.根据权利要求1所述的方法，其特征在于，所述基于所述控制数据对所述导流栏杆进行控制，包括：

存储所述各时间节点所述导流栏杆角度调整的控制数据；

确定系统是否运行到所述各时间节点中的时间节点；

若是，则查询运行到的时间节点对应的导流栏杆角度调整的控制数据；

根据查询到的控制数据调整所述导流栏杆的角度。

3.根据权利要求1所述的方法，其特征在于，所述输入输出数据集通过以下步骤得到：

基于社会力模型的个体运动仿真软件，构建通道入口的三维仿真场景；

在所述三维仿真场景中加入人群，模拟所述通道入口固定长度导流栏杆不同调整角度的疏散场景，在预先设置的时间节点进行采样得到瓶颈处客流指标。

4.根据权利要求1所述的方法，其特征在于，所述系统辨识模型的建立步骤包括：

模型参数辨识，所述模型参数辨识，包括对模型参数的估计和阶次的选择；

所述对模型参数的估计，包括：

采取结构化非线性参数优化策略进行选优，将参数寻找空间分为非线性参数子空间和线性参数子空间；

基于类列文伯格-马夸尔特算法对非线性参数空间中的非线性参数进行优化，使用线性最小二乘法对线性参数空间中的线性参数进行优化。

5.根据权利要求4所述的方法，其特征在于，所述阶次的选择，包括：

通过计算备选模型的赤池信息准则AIC值，找出最小AIC值对应的模型阶次作为所述系统辨识模型的阶次。

6.根据权利要求5所述的方法，其特征在于，所述RBF-ARX模型中的参数分为线性参数和非线性参数，其中，所述非线性参数表示为：

线性参数表示为：

基于辨识向量，所述RBF-ARX表示为：

以及

所述通过计算备选模型的赤池信息准则AIC值，找出最小AIC值对应的模型阶次作为所述系统辨识模型的阶次，包括：

根据预设规则确定备选的p和q；

计算备选的p和q的AIC值；

将最小的AIC值对应的p和q确定为所述系统辨识模型的阶次；

其中，所述AIC值的计算公式如下：

AIC＝N log(V)+2(h+1)；

其中，N表示辨识数据个数，V表示模型方差，h表示所要辨识参数(θ_N，θ_L)的个数，通过以下公式计算：

h＝(2m+2)+(p+q+1)(m+1)；

其中，(2m+2)为所述RBF-ARX模型的非线性参数个数，(p+q+1)(m+1)为所述RBF-ARX模型的线性参数个数，m和n_x为预先设置的。

7.根据权利要求6所述的方法，其特征在于，所述对模型参数的估计，包括：

确定非线性参数的初始值其中，比例因子/>的初始值通过以下公式确定：

其中，ε_k∈[0.1～0.0001]，为状态变量X(t-1)中随机选取的值或状态变量X(t-1)的均值；

根据以下公式利用最小二乘法计算线性参数的初始值

其中，是RBF-ARX模型所采集的输出数据的集合，M表示所述集合中的数据个数，τ表示RBF-ARX模型的最大延时；

基于以下优化目标函数对模型参数进行寻优：

其中，是模型的一步向前与预测输出，(θ_N，θ_L)通过公式计算，k＝0，1，2，…，k_max表示迭代步数，/>关于的雅可比矩阵为/>非线性参数/>的更新策略通过公式来表示，β_k表示步长，d_k表示寻优方向，d_k由公式来确定，/>利用以下最小二乘法公式进行更新：

当寻优结果不满足寻优结束，得到所述系统辨识模型的辨识参数。

8.一种通道入口导流栏杆角度调整的控制装置，其特征在于，包括：

获取单元，被配置成获取预先建立的系统辨识模型，所述系统辨识模型通过系统辨识的方法由输入输出数据集进行处理得到，所述输入输出数据集中的输入数据包括预设时间段内通道入口处固定长度的导流栏杆的调整角度序列，所述输入输出数据集中的输出数据包括预设时间段内通道入口的瓶颈处客流指标的变换序列；

确定单元，被配置成将所述系统辨识模型作为被控对象，通过迭代学习控制算法确定疏散过程各时间节点所述导流栏杆角度调整的控制数据；

控制单元，被配置成基于所述控制数据对所述导流栏杆进行控制；

其中，t表示时间变量，y和u表示模型的输出与输入，X(t-1)为系统状态变量，e(t)为高斯白噪声，φ₀(X(t-1))、φ_y，i＝(X(t-1))(i＝0，1，…，p)和φ_u，i＝(X(t-1))(i＝0，1，…，q)是状态相依的模型函数系数，和/>为RBF网络的线性权重，p，q，m和n_x是模型阶次，n_x＝dim{X(t-1)}、/>和/>为比例系数，||·||表示向量二范式，/>和/>为RBF的网络中心，d为系统延时；

其中，

所述系统辨识模型的状态空间表达式的迭代学习律如下：

u_k+1(t)＝u_k(t)+I(t)(e_k(t+1)-e_k(t))；

e_k(t)＝y_d(t)-y_k(t)，t∈[0，T]；

其中，ρ为非负数。