CN103777631B

CN103777631B - 一种自动驾驶的控制系统及方法

Info

Publication number: CN103777631B
Application number: CN201310689453.5A
Authority: CN
Inventors: 肖骁
Original assignee: Beijing Traffic Control Technology Co Ltd
Current assignee: Traffic Control Technology TCT Co Ltd
Priority date: 2013-12-16
Filing date: 2013-12-16
Publication date: 2017-01-18
Anticipated expiration: 2033-12-16
Also published as: CN103777631A

Abstract

本发明公开了一种自动驾驶的控制系统及方法，其中的控制系统包括：曲线合成单元、反馈单元、控制器和优化单元；其中曲线合成单元用于根据外部系统输入的条件计算目标速度曲线；反馈单元用于采集列车运行过程中的状态信息；控制器用于根据目标速度曲线和反馈单元反馈的状态信息制定对列车的控制指令；优化单元对控制器输出的控制指令利用指令优化策略与工况组合构建的关系矩阵进行优化，得到优化的控制指令。通过增加优化单元获取多目标数据，即多种参数，构成曲线合成单元计算得到的目标速度曲线，结合反馈的状态信息得到控制指令，对控制指令进行优化，在特定场景下，实现自适应的自动驾驶控制，便于对车载控制器的控制，提高控制效果。

Description

一种自动驾驶的控制系统及方法

技术领域

本发明涉及控制技术领域，特别涉及一种自动驾驶的控制系统及方法。

背景技术

目前国内多数地铁线路的车载信号设备实现了有人自动驾驶，在有人自动驾驶模式下，列车自动防护系统（ATP）负责保护列车的行车安全，列车自动驾驶系统（ATO）负责列车运行过程中的区间运行和进站停车控制。在ATP的防护下，自动驾驶可降低司机的劳动强度，提高列车运行效率，缩短地铁运行间隔，提高停车精度。

作为标准的控制系统，典型的ATO系统架构如图1所示，其中该控制系统包括：目标曲线计算单元01根据外部系统的输入条件，计算速度的目标量，即目标速度；反馈量采集计算单元02采集列车速度和加速度，明确当前速度的状态；控制器03根据当前速度和目标速度之差，通过计算得出控制量即牵引或制动加速度的输出值，并控制受控对象（即列车）做出相应动作。

传统ATO系统是通过直接调节控制器参数的方式来改善ATO的控制性能，车辆作为时间常数相对较大、对于车辆性能较为敏感的时滞系统，控制器适应性、控制精确性、系统响应速度等控制系统基本性能指标本已很难兼顾，自动驾驶的舒适性更难保证。即使使用多套控制器参数，可供调节的维度仍然有限，且控制器参数大多不够直观、不便理解，控制器参数的增加对软件开发和验证、现场调试以及售后维护等方面都造成了很大的困难。同时随着列车运行时间的累积，车辆性能还会随着时间发生慢性漂移，从而对车载控制器的控制效果产生影响，控制器对列车的控制更加不易操作。

发明内容

（一）要解决的技术问题

本发明要解决的技术问题是如何对列车自动驾驶过程中的众多参数进行处理和控制，便于对车载控制器的控制，提高控制效果。

（二）技术方案

为解决上述技术问题，本发明提供了一种自动驾驶的控制系统，具体包括：曲线合成单元、反馈单元、控制器和优化单元；

其中所述曲线合成单元用于根据外部系统输入的条件计算目标速度曲线；

反馈单元用于采集列车运行过程中的状态信息；

控制器用于根据目标速度曲线和反馈单元反馈的状态信息制定对列车的控制指令；

优化单元对控制器输出的控制指令利用指令优化策略与工况组合构建的关系矩阵进行优化，得到优化的控制指令。

进一步地，所述曲线合成单元用于综合线路限速、安全防护点、停车位置、组织调度和节能时刻表计算出目标优化曲线。

进一步地，所述状态信息包括：原始状态信息和衍生状态信息，其中原始状态信息包括实际运行速度、对控制指令的执行反馈和列车载重，衍生状态信息包括实际加速度、空转滑行状态。

进一步地，所述控制器根据目标速度曲线和状态信息，通过模糊算法选用不同的控制器参数计算得到控制指令。

进一步地，所述优化单元在保证控制器的控制性能的基础上，利用指令优化策略对控制器输出的控制指令进行优化。

进一步地，所述利用指令优化策略与工况组合构建关系矩阵时，针对采集的行车数据调整不同工况情况下优化策略的数值。

为解决上述技术问题，本发明还提供了一种自动驾驶的控制方法，包括：

计算目标速度曲线，采集列车运行过程中的状态信息并反馈；

根据目标速度曲线和反馈得到的状态信息制定对列车的控制指令，并输出；

对输出的控制指令利用指令优化策略与工况组合构建的关系矩阵进行优化，得到优化的控制指令，对列车进行控制。

进一步地，所述计算目标速度具体为：综合线路限速、安全防护点、停车位置、组织调度和节能时刻表，计算出目标优化曲线。

进一步地，所述制定对列车的控制指令的过程中通过模糊算法选用不同的控制器参数计算得到控制指令。

进一步地，所述对输出的控制指令进行优化具体包括：

优化单元在保证控制器的控制性能的基础上，利用指令优化策略对控制器输出的控制指令进行优化。

（三）有益效果

本发明实施例提供的一种自动驾驶的控制系统及方法，其中的控制系统包括：曲线合成单元、反馈单元、控制器和优化单元；其中曲线合成单元用于根据外部系统输入的条件计算目标速度曲线；反馈单元用于采集列车运行过程中的状态信息；控制器用于根据目标速度曲线和反馈单元反馈的状态信息制定对列车的控制指令；优化单元对控制器输出的控制指令利用指令优化策略与工况组合构建的关系矩阵进行优化，得到优化的控制指令。本发明通过增加优化单元，从外部系统获取多目标数据，即自动驾驶过程中的众多参数，构成的曲线合成单元计算得到的目标速度曲线，结合反馈的状态信息得到控制指令，并对控制指令进行优化，能够在特定场景下，实现自适应的自动驾驶控制，便于对车载控制器的控制，提高控制效果。进一步地，本发明中用于优化的专家策略集合以收集司机驾驶技巧为中心，以提高乘客乘坐舒适性为目的，构建专家策略集合，该集合对控制器输出控制量进行优化，在特定的场景下实现舒适驾驶的控制效果。专家策略集合使用自然语言标注的数据文件进行配置，并能够通过记录司机的手动驾驶过程进行训练。

附图说明

图1是现有技术中自动驾驶系统的架构示意图；

图2是本发明实施例中提供的一种自动驾驶的控制系统的组成架构示意图；

图3是本发明实施例中提供的不同工况组合下牵引指令和制动指令的优化策略二维分布图；

图4是本发明实施例中提供的一种自动驾驶的控制方法的步骤流程图。

具体实施方式

下面结合附图和实施例，对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明，但不用来限制本发明的范围。

本发明实施例提供了一种自动驾驶的控制系统，其组成架构示意图如图2所示，具体包括：

曲线合成单元10、反馈单元20、控制器30和优化单元40；

其中曲线合成单元10用于根据外部系统输入的条件计算目标速度曲线；

反馈单元20用于采集列车运行过程中的状态信息；

控制器30用于根据目标速度曲线和反馈单元20反馈的状态信息制定对列车的控制指令；

优化单元40对控制器输出的控制指令利用指令优化策略与工况组合构建的关系矩阵进行优化，得到优化的控制指令。

该控制系统通过在现有控制系统的基础上增加优化单元，从外部系统获取多目标数据，即自动驾驶过程中的众多参数，构成的曲线合成单元计算得到的目标速度曲线，结合反馈的状态信息得到控制指令，并对控制指令进行优化，能够在特定场景下，实现自适应的自动驾驶控制，便于对车载控制器的控制，提高控制效果。

需要说明的是，上述图2中实线框内所示的控制系统包括曲线合成单元10、反馈单元20、控制器30和优化单元40，实线框外部还包括曲线合成单元10中条件的输入端，即外部系统输入模块，以及最终的受控对象，也就是本实施例中的列车。

优选地，本实施例中的曲线合成单元10用于综合线路限速、安全防护点、停车位置、组织调度和节能时刻表计算出目标优化曲线。该曲线合成单元10用于管理系统应用需求对自动驾驶曲线的要求，可以综合线路限速、安全防护点、目标精确停车位置、列车的组织调度、节能时刻表的规划等多种因素，计算出优化的目标速度曲线，ATO控制列车按照该目标速度曲线运行，就能够满足当前时刻系统对自动驾驶曲线的全部要求。

优选地，本实施例中反馈单元20采集的状态信息包括：原始状态信息和衍生状态信息，其中原始状态信息包括实际运行速度、对控制指令的执行反馈和列车载重，衍生状态信息包括实际加速度、空转滑行状态。具体的，通过独立传感器或与其他车载系统共享的传感器，采集列车实际速度、对ATO输出控制指令的执行反馈、列车载重等控制系统的原始状态信息，并以此计算列车实际加速度、列车空转滑行状态等衍生状态信息。

优选地，本实施例中的控制器30根据目标速度曲线和状态信息，通过模糊算法选用不同的控制器参数计算得到控制指令。具体的，该控制器为自适应控制器，能够根据反馈量，也就是反馈单元20输入的控制系统状态信息，通过模糊算法选用不同的控制器参数，在一定范围内适应工况的变化，以使列车实际速度贴近目标速度为目标，输出牵引指令或制动指令及相应的牵引力或制动力。

优选地，本实施例中的优化单元40在保证控制器30的控制性能的基础上，利用指令优化策略对控制器输出的控制指令进行优化。具体的，指令优化策略与工况组合构建关系矩阵时，针对采集的行车数据调整不同工况情况下优化策略的数值。

本实施例中对于优化策略，该优化策略就是通过计算得到的专家策略集合，专家策略集合可认为是不同工况组合下，对控制器输出的牵引指令/制动指令的不同优化。下面通过举例说明专家策略集合的描述方法：

假设有三种不同类型的工况条件甲、乙、丙，甲、乙类条件分别有两种状态，分别以0和1表示，丙类条件有四种状态，分别以00、01、10、11表示。假设对牵引指令/制动指令有两种不同类型的优化维度A、B，每个优化维度都必须能以整型变量描述优化方式。设A限制了牵引指令/制动指令的大小，B限制了牵引制动指令的变化速度。以牵引指令为例，则专家策略集合可表示为：

将工况状态按0、1编码后，所有的工况组合可以转化为十进制序列，这样不同工况组合下牵引指令和制动指令的优化策略就可以存储在一张二维表中，如图3所示，并以十进制序列的序号作为索引，图3所示的表中索引是从0～15，以便于存储于车载控制器的本地存储介质中，在列车运行过程中查询。

假设某时刻N自适应控制器输出的牵引指令为m_N，该时刻甲、乙、丙工况的组合状态为1、0、10（对应序号10），则经过专家策略集合优化单元后实际输出的牵引指令，根据策略A得到牵引指令的大小为：

M_{N} = \{\begin{matrix} {Al}_{10} & m_{N} < {Al}_{10} \\ m_{N} & {Al}_{10} < m_{N} < {Ah}_{10} \\ {Ah}_{10} & m_{N} > {Ah}_{10} \end{matrix}

公式（1）

同时根据策略B有：

M_{N} = \{\begin{matrix} M_{N - 1} - B_{10^{'}} & M_{N} < M_{N - 1} - B_{10} \\ M_{N^{'}} & M_{N - 1} - B_{10} < M_{N} < M_{N - 1} + B_{10} \\ M_{N - 1} + B_{10^{'}} & M_{N} > M_{N - 1} + B_{10} \end{matrix}

公式（2）

列车自动驾驶舒适性专家策略中定义影响专家策略的工况集合为：

{

中心节能调整指令（节能/不节能）

中心发车间隔（大间隔/小间隔）

水平线路条件（弯道/直道）

垂直线路条件（平坡/上坡/下坡）

车辆制动模式（空气制动/混合制动）

车辆空滑状态（空转/打滑/未空滑）

列车运行位置（出站/区间/进站/站台）

}

定义牵引/制动指令优化策略集合为：

{

适用速度区间（下边界，上边界）

速度与目标速度差值的适用区间（下边界，上边界）

幅值限制（最小值，最大值）

脉冲宽度限制（最小值）

变化率（即冲击率）限制（最大值）

}

据此编制的专家策略集合格式如图3所示，并且比图3项目更多更丰富，可使用电子表格等计算机工具对不同工况组合的优化策略进行直观配置，进而生成数据文件供车载控制器在线查询。

需要说明的是，本实施例中专家策略集合的训练及对车辆性能变化的补偿，具体如下：

通过建立牵引/制动指令优化策略与车载工况组合的关系矩阵，可以针对司机行车数据，通过离线数据分析或在线学习的方式，在对车载控制器控制效果做出评价的同时，调整不同工况下优化策略的数值，以改善车载控制器的控制效果。随着列车运行时间的累积，车辆性能会随时间发生慢性漂移，进而对车载控制器的控制效果产生影响。当调整所有优化策略仍然无法使控制效果达到预期指标时，车载控制器将对列车性能发出报警，以提示维修人员对车辆进行检修。

上述专家策略集合使用自然语言标注的数据文件进行配置，并能够通过记录司机的手动驾驶过程进行训练，更加方便后续开发和维护。

还需要说明的是，上述控制系统经理论验证和实际测试，在满足合同要求的旅行速度前提下，全线冲击率低于合同要求的0.4m/s/s/s。

综上所述，本发明实施例中提供的控制系统实际上是构建了一套基于专家策略集合辅助控制的列车自动驾驶系统，其中构建的专家策略集合，能够对控制器输出控制量进行优化，在特定的场景下实现舒适驾驶的控制效果。其中构建的列车自动驾驶系统具备如下特点：

（1）专家策略集合基于大量的人工驾驶数据挖掘和司机走访调查抽象得出；

（2）专家策略集合使用自然语言标注的数据文件进行配置，便于软件开发和验证、现场调试以及售后维护；

（3）专家策略集合能够通过记录司机的手动驾驶过程进行训练；

（4）经过专家策略集合优化后的输出控制量，在列车特性发生较大变化时，能够对控制器直接输出的控制量进行补偿和报警。

该控制系统在构建一套基于专家策略集合辅助控制的列车自动驾驶方法及系统，以收集司机驾驶技巧为中心，以提高乘客乘坐舒适性为目的，构建专家策略集合，该集合对控制器输出控制量进行优化，在特定的场景下实现舒适驾驶的控制效果。

除此之外，基于上述控制系统，本发明实施例还提供了一种自动驾驶的控制方法，步骤流程如图4所示，具体包括：

步骤S1、计算目标速度曲线，采集列车运行过程中的状态信息并反馈；

步骤S2、根据目标速度曲线和反馈得到的状态信息制定对列车的控制指令，并输出；

步骤S3、对输出的控制指令利用指令优化策略与工况组合构建的关系矩阵进行优化，得到优化的控制指令，对列车进行控制。

优选地，上述步骤S1计算目标速度具体为：综合线路限速、安全防护点、停车位置、组织调度和节能时刻表，计算出目标优化曲线。

优选地，上述步骤S2制定对列车的控制指令的过程中通过模糊算法选用不同的控制器参数计算得到控制指令。

优选地，上述步骤S3对输出的控制指令进行优化具体包括：

具体的，指令优化策略与工况组合构建关系矩阵时，针对采集的行车数据调整不同工况情况下优化策略的数值。

综上所述，本实施例中控制方法从外部系统获取多目标数据，即自动驾驶过程中的众多参数，构成的曲线合成单元计算得到的目标速度曲线，结合反馈的状态信息得到控制指令，并对控制指令进行优化，能够在特定的场景下，实现自适应的自动驾驶控制，便于对车载控制器的控制，提高控制效果。

以上实施方式仅用于说明本发明，而并非对本发明的限制，有关技术领域的普通技术人员，在不脱离本发明的精神和范围的情况下，还可以做出各种变化和变型，因此所有等同的技术方案也属于本发明的范畴，本发明的专利保护范围应由权利要求限定。

Claims

1.一种自动驾驶的控制系统，其特征在于，包括：曲线合成单元、反馈单元、控制器和优化单元；

反馈单元用于采集列车运行过程中的状态信息；

2.如权利要求1所述的控制系统，其特征在于，所述曲线合成单元用于综合线路限速、安全防护点、停车位置、组织调度和节能时刻表计算出目标优化曲线。

3.如权利要求1所述的控制系统，其特征在于，所述状态信息包括：原始状态信息和衍生状态信息，其中原始状态信息包括实际运行速度、对控制指令的执行反馈和列车载重，衍生状态信息包括实际加速度、空转滑行状态。

4.如权利要求1所述的控制系统，其特征在于，所述控制器根据目标速度曲线和状态信息，通过模糊算法选用不同的控制器参数计算得到控制指令。

5.如权利要求1所述的控制系统，其特征在于，所述优化单元在保证控制器的控制性能的基础上，利用指令优化策略对控制器输出的控制指令进行优化。

6.如权利要求5所述的控制系统，其特征在于，所述利用指令优化策略与工况组合构建关系矩阵时，针对采集的行车数据调整不同工况情况下优化策略的数值。

7.一种自动驾驶的控制方法，其特征在于，包括：

对输出的控制指令利用指令优化策略与工况组合构建的关系矩阵进行优化，得到优化的控制指令，对列车进行控制，

其中，所述计算目标速度曲线具体为：综合线路限速、安全防护点、停车位置、组织调度和节能时刻表，计算出目标优化曲线，

其中，所述状态信息包括：原始状态信息和衍生状态信息，其中原始状态信息包括实际运行速度、对控制指令的执行反馈和列车载重，衍生状态信息包括实际加速度、空转滑行状态。

8.如权利要求7所述的控制方法，其特征在于，所述制定对列车的控制指令的过程中通过模糊算法选用不同的控制器参数计算得到控制指令。

9.如权利要求7所述的控制方法，其特征在于，所述对输出的控制指令进行优化具体包括：

10.如权利要求7所述的控制方法，其特征在于，所述利用指令优化策略与工况组合构建关系矩阵时，针对采集的行车数据调整不同工况情况下优化策略的数值。