CN113823096A

CN113823096A - 用于仿真测试的随机交通流障碍物对象布置策略

Info

Publication number: CN113823096A
Application number: CN202111410099.9A
Authority: CN
Inventors: 贾世鹏; 秦秀; 戴震; 倪凯
Original assignee: HoloMatic Technology Beijing Co Ltd
Current assignee: Heduo Technology Guangzhou Co ltd
Priority date: 2021-11-25
Filing date: 2021-11-25
Publication date: 2021-12-21
Anticipated expiration: 2041-11-25
Also published as: CN113823096B

Abstract

本发明公开了一种用于仿真测试的随机交通流障碍物对象布置策略，包括以下步骤：步骤1、通过获取某一时刻ego信息和ego控制信号，与上一时刻的ego信息和ego控制信号比较，以预测下一时刻的ego信息和ego控制信号，从而构建ego工作模式的马尔可夫转移概率模型；步骤2、根据ego当前工作模式和仿真需求，构建多层次权重模型和综合目标泛函；步骤3、通过获取ego、npc和障碍物集状态信息，并根据马尔可夫转移概率模型和多层次权重模型和综合目标泛函，利用动态规划模块对布置策略进行滚动优化，直至目标泛函的计算结果误差在设定范围内，则输出结果，获得最优布置策略。本发明简单高效，智能控制npc的布置策略和集群策略，能够显著提高测试的有效性和效率。

Description

用于仿真测试的随机交通流障碍物对象布置策略

技术领域

本发明涉及自动驾驶仿真测试领域，特别涉及一种用于仿真测试的随机交通流障碍物对象布置策略。

背景技术

自动驾驶系统的开发都遵从仿真到实车测试的过程，仿真实验作为一种零风险、快速迭代、可复现的测试方法，为自动驾驶技术上路测试奠定了坚实的基础。仿真可以快速有效的对算法的正确性与性能进行测试。随机交通流测试是仿真测试地主要手段之一，通过模拟真实道路上面npc地行为能够极大地提升测试覆盖度和有效性。目前，随机交通流测试npc的布置方法主要是在ego的周围随机地添加和删减npc车，大部分npc不能有效地针对测试功能，且障碍物极其容易集中在非功能测试区域，从而占用了珍贵的测试资源，导致测试效率低下，提供一种简单高效，智能控制npc的布置策略和集群策略，是很有必要的，能够显著提高测试的有效性和效率。

发明内容

本发明的一个目的是解决至少上述问题，并提供至少后面将说明的优点。

本发明还有一个目的是提供一种用于仿真测试的随机交通流障碍物对象布置策略，该方法简单高效，智能控制npc的布置策略和集群策略，能够显著提高测试的有效性和效率。

为了实现根据本发明的这些目的和其它优点，提供一种用于仿真测试的随机交通流障碍物对象布置策略，包括以下步骤：

步骤1、通过获取某一时刻ego信息和ego控制信号，与获取的所述某一时刻的上一时刻的ego信息和ego控制信号进行比较，以预测所述某一时刻的下一时刻的ego信息和ego控制信号，从而构建ego工作模式的马尔可夫转移概率模型。

步骤2、根据ego当前工作模式和仿真需求，构建多层次权重模型和综合目标泛函。

步骤3、通过获取ego、npc和障碍物集状态信息，并根据步骤1的所述马尔可夫转移概率模型和步骤2所述多层次权重模型和综合目标泛函，利用动态规划模块对布置策略进行滚动优化，直至目标泛函的计算结果误差在设定范围内，则输出结果，获得最优布置策略。

优选的是，步骤2中所述多层次权重模型主要包含目标层、基准层和方案层；根据仿真测试场景，所述多层次权重模型构建的方法，包括以下步骤：

取多个对目标影响的因素，并比较多个所述因素对目标的影响，从而确定所述因素在目标中所占的比重。

比较时，每次取两个因素

和

；

个被比较的因素构成一个两两比较的判断矩阵

；系数矩阵A₁、A₂、A₃以及A₄分别为：

；

；

；

；

其中，设定

个因素

；目标为

；

表示

与

对

的影响程度之比，按比例标度来度量

。

优选的是，构建步骤2中所述综合目标泛函的计算的公式为：

公式（1）

其中，J为综合目标泛函；

表示ego当前所处车道的系数矩阵；

表示ego当前所处的模式矩阵，其中模式矩阵格式为：

；处于该状态时，状态为置1，否则置0。

表示当前时刻npc的数量；

和

表示所述综合目标泛函的权重指数，

和

均为正数，且

和

之和为1；

；

表示当前时刻的马尔可夫模型转移矩阵。

优选的是，所述马尔可夫模型转移矩阵为：

公式2

其中，

表示当前时刻ego的所处的模式矩阵，其中模式矩阵格式为

，处于该状态时，状态为置1，否则置0；

表示从起始时刻到当前时刻模式变换的次数；

表示起始时刻，默认为1；

分别表示当前模式和上一时刻模式变换的权重指数，

均为正数，且

之和为1。

优选的是，步骤1中包括：

ego定位模块，其用于获取ego实时位置坐标。

ego控制信号监控模块，其用于实时获取ego模式状态信息，所述状态信息包括加速、减速以及变道。

ego车道检测模块，其用于实时获取ego所在车道的信息。以及

ego工作模式预测模块，其接收所述ego定位模块、ego控制信号监控模块以及ego车道检测模块传输的信息，根据ego所述某一时刻以及所述某一时刻的上一时刻的ego信息和ego控制信号，预测ego工作模式，并构建所述马尔可夫转移概率模型。

优选的是，步骤3中还包括：

障碍物添加模块，其用于根据步骤3所述最优布置策略，添加相应的障碍物并赋予障碍物信息；所述障碍物信息主要包括所述障碍物所处区域、位置以及初始生命周期。以及

障碍物退出模块，其用于根据步骤3所述最优布置策略，删除相应的障碍物和生命周期结束的障碍物。

优选的是，步骤3中ego、npc和障碍物集状态信息的获取通过环境感知模块，所述环境感知模块，其用于感知仿真环境当中所有的障碍物信息；所述状态信息包括npc、ego和静态障碍物的位置、速度、加速度信息。

优选的是，步骤3中的所述动态规划模块，其用于根据所述环境感知模块传输的信息，综合测试目标泛函，ego工作模式的马尔可夫转移概率模型，进行动态规划求解，获取最优布置策略。

本发明至少包括以下有益效果：

本发明通过在当前t时刻，利用ego的历史信息、当前信息，ego历史控制信号、ego当前控制信号，对ego未来控制信号和ego未来信息进行预测，构建ego工作模式的马尔可夫转移概率模型。再根据ego当前工作模式和仿真需求，构建多层次权重模型和综合目标泛函。根据上述输出的信息，以及获取到的ego、npc和障碍物集状态信息，对布置策略进行滚动优化，直至目标泛函的计算结果误差在设定范围内，把结果进行输出，作为最优布置策略，通过所述最优布置策略，npc能有效地针对地测试功能，避免了障碍物集中在非功能测试区域，避免了测试资源的浪费，能够智能控制npc的布置策略和集群策略，显著提高测试的有效性和效率。

本发明的其它优点、目标和特征将部分通过下面的说明体现，部分还将通过对本发明的研究和实践而为本领域的技术人员所理解。

附图说明

图1为本发明用于仿真测试的随机交通流障碍物对象布置策略的流程图；

图2为本发明所述用于仿真测试的随机交通流障碍物对象布置策略中各个模块连接的结构示意图；

图3为本发明所述npc和ego相对位置整体示意图；

图4为本发明所述多层次权重模型的结构示意图。

具体实施方式

下面结合附图对本发明做进一步的详细说明，以令本领域技术人员参照说明书文字能够据以实施。

应当理解，本文所使用的诸如“具有”、“包含”以及“包括”术语并不排除一个或多个其它元件或其组合的存在或添加。

如图1所示，本发明提供一种用于仿真测试的随机交通流障碍物对象布置策略，包括以下步骤：

在上述方案中，通过在当前t时刻，利用ego的历史信息、当前信息，ego历史控制信号、ego当前控制信号，对ego未来控制信号和ego未来信息进行预测，构建ego工作模式的马尔可夫转移概率模型。再根据ego当前工作模式和仿真需求，构建多层次权重模型和综合目标泛函。根据上述输出的信息，以及获取到的ego、npc和障碍物集状态信息，对布置策略进行滚动优化，直至目标泛函的计算结果误差在设定范围内，把结果进行输出，作为最优布置策略，通过所述最优布置策略，npc能有效地针对地测试功能，避免了障碍物集中在非功能测试区域，避免了测试资源的浪费，能够智能控制npc的布置策略和集群策略，显著提高测试的有效性和效率。

获取到的ego、npc和障碍物集状态信息，包括ego、npc和静态障碍物等的各种信息，各种信息中包含位置、速度和加速度等。

动态规划模块使用的是动态规划算法，是一种全局最优算法。

其中，ego在自动驾驶领域内，一般指自车，表示用于测试自动驾驶算法的车辆；

npc（non-player character），意思是除了自车之外的物体或车辆（行业约定成俗的简称）；

如图3中，所述箭头标示npc前进方向，定义ego所处车道前方第一辆车所处位置为1，前方第二辆车位置为9；后方第一辆车所处位置为2，后方第二辆车所处位置为10。ego所处车道左方第一车道平行车辆所处位置为7，前方第一辆车所处位置为6，前方第二辆车位置为13；后方第一辆车所处位置为8，后方第二辆车所处位置为14，依次类推。

一个优选方案中，步骤2中所述多层次权重模型主要包含目标层、基准层和方案层；根据仿真测试场景，所述多层次权重模型构建的方法，包括以下步骤：

比较时，每次取两个因素

和

；

个被比较的因素构成一个两两比较的判断矩阵

；系数矩阵A₁、A₂、A₃以及A₄分别为：

；

；

；

；

其中，设定

个因素

；目标为

；

表示

与

对

的影响程度之比，按比例标度来度量

。

在上述方案中，如图4所示，多层次权重模型可以明确问题，弄清问题的范围、所包含的因素、各因素之间的关系等，以便尽量掌握充分的信息。将问题所含的因素进行分组，把每一组作为一个层次，可以分为三类。一般而言，上一层元素对相邻的下一层全部或部分元素具有支配作用，形成按层次从上到下的逐层支配关系，处于同一层内部的元素没有支配或依存关系，具有这种性质的层次就称为递阶层次。最高层：这一层次中只有一个元素，一般它是分析问题的预定目标或理想结果，因此也称作目标层，本专利目标层为布置目标。中间层：这一层次中包含了为实现目标所涉及的中间环节，它可以由若干层次组成，包括所需要考虑的准则、子准则，因此也称为基准层。本专利基准层为仿真车辆基本行为，分为四类：加速行驶、左变道、右变道、减速行驶。最底层：这一层次包含了为实现目标可供选择的各种措施、决策方案等，因此也称为措施层或方案层。本专利方案层为npc布置基本位置，分为四种：本车道前、左车道前、右车道前、本车道后。两两比较即成对比较。

一个优选方案中，构建步骤2中所述综合目标泛函的计算的公式为：

公式（1）

其中，J为综合目标泛函；

表示ego当前所处车道的系数矩阵；

表示ego当前所处的模式矩阵，其中模式矩阵格式为：

；处于该状态时，状态为置1，否则置0。

表示当前时刻npc的数量；

和

表示所述综合目标泛函的权重指数，

和

均为正数，且

和

之和为1，具体值需通过实车标定确定具体系数值，默认为0.4，0.2，0.4。

；

表示当前时刻的马尔可夫模型转移矩阵。

一个优选方案中，所述马尔可夫模型转移矩阵为：

公式2

其中，

表示当前时刻ego的所处的模式矩阵，其中模式矩阵格式为

，处于该状态时，状态为置1，否则置0；

表示从起始时刻到当前时刻模式变换的次数；

表示起始时刻，默认为1；

分别表示当前模式和上一时刻模式变换的权重指数，

均为正数，且

之和为1。

一个优选方案中，如图2所示，步骤1中包括：

ego定位模块，其用于获取ego实时位置坐标。

ego车道检测模块，其用于实时获取ego所在车道的信息。以及

在上述方案中，ego实时位置坐标包括ego车的position信息和rotation信息。其中，position信息和rotation信息分别表示位置坐标和朝向信息；Position指ego后轴中心的位置坐标，rotation指旋转坐标，理解为朝向信息；所述ego模式状态信息从自动驾驶核心算法模块获取。

一个优选方案中，步骤3中还包括：

在上述方案中，障碍物处于权重较大区域，在运行过程中，生命周期会增加。障碍物处于权重较小的区域，开始计时减小生命周期，直至生命周期结束。生命周期结束后，障碍物自动退出。由于所处位置是动态的，不固定的，导致生命周期也是动态化的。其中，权重较大区域指所述ego工作模式预测模块预测的ego车将来在多层次权重模型方案层中所处的对应的区域，其他的为权重较小区域。

一个优选方案中，步骤3中ego、npc和障碍物集状态信息的获取通过环境感知模块，所述环境感知模块，其用于感知仿真环境当中所有的障碍物信息；所述状态信息包括npc、ego和静态障碍物的位置、速度、加速度信息。

在上述方案中，静态障碍物的速度和加速度的信息，指的是静态障碍物转化为动态障碍物的时候，比如锥桶属于静态障碍物，但是风大的时候，被吹走了，在运动的时候就转变成了动态障碍物。所以，当处于静态的时候，就把速度，加速度设置为0，位置信息保持不变。

一个优选方案中，步骤3中的所述动态规划模块，其用于根据所述环境感知模块传输的信息，综合测试目标泛函，ego工作模式的马尔可夫转移概率模型，进行动态规划求解，获取最优布置策略。

本发明通过简单高效的仿真测试用随机交通流障碍物对象布置策略，智能控制npc的布置策略和集群策略，能够显著提高测试的有效性和效率。

尽管本发明的实施方案已公开如上，但其并不仅仅限于说明书和实施方式中所列运用，它完全可以被适用于各种适合本发明的领域，对于熟悉本领域的人员而言，可容易地实现另外的修改，因此在不背离权利要求及等同范围所限定的一般概念下，本发明并不限于特定的细节和这里示出与描述的图。