CN116380490A

CN116380490A - 自动驾驶测试任务难度调整方法及装置、存储介质

Info

Publication number: CN116380490A
Application number: CN202310364979.XA
Authority: CN
Inventors: 张毅; 葛经纬; 姚丹亚; 杨敬轩; 史宇辰; 李力; 张佐
Original assignee: Tsinghua University
Current assignee: Tsinghua University
Priority date: 2023-04-07
Filing date: 2023-04-07
Publication date: 2023-07-04

Abstract

一种自动驾驶测试任务难度调整方法及装置、计算机可读存储介质，所述方法包括：设置虚拟测试场景和测试任务，所述虚拟测试场景包括被测车辆和周围车辆；构建车辆行为效用模型，所述车辆行为效用模型包括多种不同的驾驶策略；对所述被测车辆执行所述测试任务，并在所述测试任务执行过程中，改变周围车辆的驾驶策略；获取测试结果，根据所述测试结果生成针对所述被测车辆具有不同难度的测试任务。

Description

自动驾驶测试任务难度调整方法及装置、存储介质

技术领域

本公开实施例涉及但不限于自动驾驶测试技术领域，尤指一种自动驾驶测试任务难度调整方法及装置、计算机可读存储介质。

背景技术

自动驾驶汽车作为我们日常生活中具备可落地的一种典型智能系统，采用机器学习算法等人工智能技术，配备先进的传感器、计算组件与执行器等设备，实现感知、决策与执行的智能性能力，以替代/部分替代人类驾驶员完成安全、高效的交通运输，是智能交通系统的重要构成。

自动驾驶汽车的智能性是指自动驾驶汽车在完成任务时所展示的与人类智能相似或同类能力的特性。测评与评定自动驾驶汽车的智能程度，确定智能性能力级别，是自动驾驶汽车设计、实现和应用的重要内容。

与传统的自动驾驶汽车测试不同，对自动驾驶智能性级别的测试与评定是汽车测试中的全新领域。通过对智能内部结构的解剖、对智能外在表征的解构，自动驾驶汽车的智能性测试要求对自动驾驶汽车的多种智能性能力进行有效测试，并通过设置不同测试指标，评定自动驾驶汽车在实现安全、环保等不同目标时的智能性级别。

发明内容

本公开实施例提供了一种自动驾驶测试任务难度调整方法，包括：

设置虚拟测试场景和测试任务，所述虚拟测试场景包括被测车辆和周围车辆；

构建车辆行为效用模型，所述车辆行为效用模型包括多种不同的驾驶策略；

对所述被测车辆执行所述测试任务，并在所述测试任务执行过程中，改变周围车辆的驾驶策略；

获取测试结果，根据所述测试结果生成针对所述被测车辆具有不同难度的测试任务。

本公开实施例还提供了一种自动驾驶测试仿真测试装置，包括存储器；和连接至所述存储器的处理器，所述存储器用于存储指令，所述处理器被配置为基于存储在所述存储器中的指令，执行本公开任一实施例所述的自动驾驶测试任务难度调整方法的步骤。

本公开实施例还提供了一种存储介质，其上存储有计算机程序，该程序被处理器执行时实现本公开任一实施例所述的自动驾驶测试任务难度调整方法。

本申请的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本申请而了解。本申请的其他优点可通过在说明书以及附图中所描述的方案来实现和获得。

附图说明

附图用来提供对本申请技术方案的理解，并且构成说明书的一部分，与本申请的实施例一起用于解释本申请的技术方案，并不构成对本申请技术方案的限制。

图1为本公开示例性实施例提供的一种自动驾驶测试任务难度调整方法的流程示意图；

图2为本公开示例性实施例提供的一种测试任务的分配方法示意图；

图3为本公开示例性实施例提供的一种自动驾驶仿真测试流程和测试具体步骤示意图；

图4为本公开示例性实施例提供的一种单向双车道道路切车场景示意图；

图5为本公开示例性实施例提供的一种实验结果示意图；

图6为本公开示例性实施例提供的一种自动驾驶测试任务难度调整装置的结构示意图。

具体实施方式

本申请描述了多个实施例，但是该描述是示例性的，而不是限制性的，并且对于本领域的普通技术人员来说显而易见的是，在本申请所描述的实施例包含的范围内可以有更多的实施例和实现方案。尽管在附图中示出了许多可能的特征组合，并在具体实施方式中进行了讨论，但是所公开的特征的许多其它组合方式也是可能的。除非特意加以限制的情况以外，任何实施例的任何特征或元件可以与任何其它实施例中的任何其他特征或元件结合使用，或可以替代任何其它实施例中的任何其他特征或元件。

本申请包括并设想了与本领域普通技术人员已知的特征和元件的组合。本申请已经公开的实施例、特征和元件也可以与任何常规特征或元件组合，以形成由权利要求限定的独特的发明方案。任何实施例的任何特征或元件也可以与来自其它发明方案的特征或元件组合，以形成另一个由权利要求限定的独特的发明方案。因此，应当理解，在本申请中示出和/或讨论的任何特征可以单独地或以任何适当的组合来实现。因此，除了根据所附权利要求及其等同替换所做的限制以外，实施例不受其它限制。此外，可以在所附权利要求的保护范围内进行各种修改和改变。

此外，在描述具有代表性的实施例时，说明书可能已经将方法和/或过程呈现为特定的步骤序列。然而，在该方法或过程不依赖于本文所述步骤的特定顺序的程度上，该方法或过程不应限于所述的特定顺序的步骤。如本领域普通技术人员将理解的，其它的步骤顺序也是可能的。因此，说明书中阐述的步骤的特定顺序不应被解释为对权利要求的限制。此外，针对该方法和/或过程的权利要求不应限于按照所写顺序执行它们的步骤，本领域技术人员可以容易地理解，这些顺序可以变化，并且仍然保持在本申请实施例的精神和范围内。

虚拟仿真测试是实现自动驾驶汽车智能性级别评定的重要手段。虚拟仿真测试在自动驾驶汽车行驶数据集中搜索并采样关键场景，可在短时间内获得更多实车测试过程无法遇见的路况情景，从而保证了测试的效率与场景覆盖率。

测试任务的设计是实现自动驾驶汽车智能性虚拟仿真测试的重要步骤。测试过程引入测试任务的分析，一方面有利于获知测试成功或失败的原因，另一方面可对测试任务进行调整，以有利于后续优化测试场景，并进一步评定其智能程度。

当前虚拟仿真测试场景的生成方法主要聚焦于提高测试效率，尚未考虑评定其智能性级别所需要的不同难度的测试场景；此外，在切车场景中，只考虑采取换道行为的车辆对被测车辆的影响，忽略了周围其他车辆的非换道行为对被测车辆的影响，此时无法采样获得难度不同的测试场景。通常情况下，我们不了解测试的自动驾驶汽车的智能程度，也不了解他是如何训练的(例如，训练时使用了多少数据以及什么类型的数据)，那我们没办法根据他自身的特有条件去推断什么样的测试场景对该车而言是相对较难的，什么样的测试场景对该车而言又是相对较容易的，也即我们没办法判断该车的智能程度到底是多少。

本公开实施例在考虑自动驾驶汽车传感器等零部件和功能器件正常工作的条件下，在明确测试的需求与目标后，以体现安全的智能性测试为例，为评估自动驾驶汽车的智能性级别，提出一种自动驾驶测试任务难度调整方法。

如图1所示，本公开实施例提供了一种自动驾驶测试任务难度调整方法，包括：

步骤101、设置虚拟测试场景和测试任务，虚拟测试场景包括被测车辆和周围车辆；

步骤102、构建车辆行为效用模型，车辆行为效用模型包括多种不同的驾驶策略；

步骤103、对被测车辆执行测试任务，并在测试任务执行过程中，改变周围车辆的驾驶策略；

步骤104、获取测试结果，根据测试结果生成针对被测车辆具有不同难度的测试任务。

本公开实施例提出的自动驾驶测试任务难度调整方法，将虚拟测试场景中交通参与者的驾驶策略作为虚拟测试场景的可调整要素，通过在测试任务执行过程中，改变周围车辆的驾驶策略，控制周围车辆以模拟不同的驾驶行为对被测车辆的影响，可以得到针对被测车辆具有不同难度的测试任务，最终用以评估被测车辆的智能性级别，以满足智能性级别评定的需要。

在一些示例性实施方式中，多种不同的驾驶策略包括至少一种激进型驾驶策略和至少一种保守型驾驶策略；激进型驾驶策略在跟车或换道过程中，倾向于与前车保持的最小安全车距小于保守型驾驶策略在跟车或换道过程中，倾向于与前车保持的最小安全车距。

本公开实施例中，具有激进型驾驶策略的车辆在跟车或换道过程中，倾向与其他车辆保持一个相对较近的车距或车头时距，在完成某行为的过程中具有激进型驾驶策略的车辆所呈现出的速度与加速度更高出正常数值；而具有保守型驾驶策略的车辆与之相反，具有保守型驾驶策略的车辆在跟车或换道过程中，倾向与其他车辆保持一个相对较远的车距或车头时距，在完成某行为的过程中具有保守型驾驶策略的车辆所呈现出的速度与加速度更低出正常数值。

本公开实施例中，多种不同的驾驶策略还可以包括正常型驾驶策略。此外，本公开实施例中，激进型驾驶策略可以设置多个不同的等级，保守型驾驶策略也可以设置多个不同的等级，本公开实施例对此不作限制。

在一些示例性实施方式中，改变周围车辆的驾驶策略，包括以下至少之一：

改变一辆周围车辆的驾驶策略；

改变多辆周围车辆的驾驶策略。

由于我们不了解被测车辆是如何训练的，例如，他的训练场景是否包括调整周围多辆车还是一辆车的驾驶策略。因此，我们通过改变不同的周围车辆的数目以及周围车辆的驾驶策略，有助于我们搜索到更多对被测车辆而言具有挑战性的场景。

在一些示例性实施方式中，测试任务的难度定义为

其中，∑_tA_i为被测车辆在完成测试任务i过程中遭遇的挑战性事件次数总和，被测车辆遭遇挑战性事件定义为被测车辆与周围车辆的碰撞时间处于预设的阈值范围内，S_i为测试任务i的总采样数，i为自然数，t为测试时间。

在一些示例性实施方式中，虚拟测试场景的难度定义为

其中，S_j为测试任务j的总采样数，j为自然数，j≠i，A_ij为测试任务i与测试任务j为并发任务时被测车辆遭遇的挑战性事件次数，μ为缓和并发任务难度的权重系数，0≤μ≤1；并发任务定义为不存在关联且逻辑上无时间先后、无空间先后顺序的可以在同一时间、地点被触发的两个或两个以上的任务。

当前的研究尽管指出了测试任务的明确是自动驾驶汽车测试的关键，却无法满足自动驾驶汽车智能性能力级别测评的实际发展需求；同时，场景中车车交互行为的模型描述的欠缺，导致测试任务存在差异性的依据欠缺，进而无法给出不同测试任务所需难度的调整方法。

本公开针对测试任务的难度需要调整的问题，基于测试所需设定任务的构建方法，引入车辆行为效用模型，构建行为效用函数以量化车辆之间的交互行为，并以此构造测试任务，通过对与被测车辆有交互行为的车辆数量或这些车辆驾驶策略的调整，实现对测试任务难度的有效调整。

本公开在测试需求和测试目标明确的条件下，在虚拟仿真测试平台中已构造了相关虚拟测试场景(其中静态环境固定、动态交通参与者只有车辆)后，为完成自动驾驶汽车智能性的综合测试，提出了一种自动驾驶测试任务难度调整方法。

在基于虚拟测试场景的测试中，为了顺利通过特定交通场景下的测试，被测车辆需要成功地完成一系列的测试任务。测试任务是指自动驾驶在测试场景中需要在有限的时间内完成的活动。由此，设置可测的测试任务是不可缺少的内容，是完成评估的前提。测试任务可以根据不同的测试需求进行拆分，测试需求可以是测试自动驾驶汽车的单项目标，如自动驾驶汽车的智能性安全、执行任务效率、舒适水平等，也可以是自动驾驶汽车综合的、包含多方面的能力测试。测试任务集合可表示为由若干任务构成，即Ψ＝{ψ₁,ψ₂,…}。根据每类测试需求产生不同的测试任务，同时测试任务又可以在有限的时间内于确定的空间中分成若干个子任务，即ψ_i＝{ψ_i1,ψ_i2,…}。子任务之间的时空关系不固定，有限的时间和确定的空间是指测试任务在时空上是有范围的，例如，完成过红绿灯的测试任务，是在某个确定的十字路口在1分钟内通过，而不是任意路口不限时通过。为便于评估自动驾驶汽车的任务完成情况，本公开实施例提供了一种测试任务的分配方法，如图2所示。

示例性的，以面向安全的自动驾驶汽车智能性功能测试和表征测试为例，在功能测试中，测试任务可依据自动驾驶汽车所具有的不同智能性能力，如感知能力、决策能力、执行能力等分解成若干子任务。在智能性安全表征测试中，被测车辆不同类型的表现可当做测试设定任务的拆分依据，如在某时刻某地识别红绿灯、判断是否换道、跟驰前车等。

交通参与者不同的驾驶行为都可以利用不同的行为效用函数实现量化，而影响该行为的诸多影响因素可作为行为效用函数的输入。本公开通过构建被测车辆与周围车辆进行交互时的车辆行为效用模型，用于后续分析周围车辆与被测车辆的交互过程对虚拟测试场景和/或测试任务难度的影响。

考虑行为效用函数的输入是一系列独立的变量：x₁,x₂,…,x_n(速度、位置、加速度等)，对于任意车辆V⁽ⁱ⁾，定义该车的行为效用函数为U_i。我们认为行为效用函数是这些独立变量的加权和，那么行为效用函数U_i的基本公式可以写成下式：

其中，α_k,i为变量x_k的权重系数。实际使用时，不同车辆的变量数可以不一样，权重系数也可以不一致，如果有现成的待模仿车辆，可以采用拟合的方法拟合参数，也可以根据需要自己设计。本公开通过上述行为效用函数U_i的基本公式，设置了一种通用的行为效用函数表达形式。

考虑这些影响因素x_k可以用高斯混合分布进行描述，根据高斯混合分布性质，当分类足够合理，一定程度上可以表达所有可能的分布。另外，这些影响因素都可以归一化(通过归一化消除不同指标具有不同量级时的影响)，即具有零均值和单位方差。则车辆V⁽ⁱ⁾的行为效用的先验分布可表示为：

其中，p(U_i)为U_i的概率密度分布，

服从标准正态分布。

测试场景中所有交通参与者的行为效用可以表示成多元联合分布的形式：

p(U₁,U₂,…,U_N)＝N(U；0,∑)；

其中，p(U₁,U₂,…,U_N)表示U₁到U_N的概率分布函数，N(U；0,∑)表示U₁到U_N服从均值为0，协方差矩阵为Σ的N元高斯分布，U＝[U₁,U₂,...,U_N]^T，且

其中，ρ_k,l表示V_k与V_l两辆车之间行为的关联性，

考虑案例中交通参与者构成偏好无差别的交通群体，即参与者在影响因素x_i的偏好上保持一致，使得对于任意一对k和l，ρ_k,l＝ρ，k和l均在1至N之间，即矩阵中每个ρ_k,l均相等。这相当于在交通环境中，被测车辆知道周围其他车辆存在一些不同的偏好，并知道这些偏好和自己偏好之间的重合程度，但无需确定具体的与自己偏好一致的车辆。

上述的偏好是影响参与者的驾驶行为的因素，如被测车辆可以提前感知到周围存在与自己偏好(如决策方式)不一致的车辆。但是在对方做出危险行为之前，车辆无法确认对方就是存在威胁的车辆，该设置也符合真实的驾驶情况。

首先考虑车辆无法获知其他车辆的驾驶偏好，仅利用自身信息作为影响每一步决策的信息。显然，这些信息都是不完美的，即存在噪声残差ν_k,i，与被测量值x_k，共同组合为真实值：

相对应地，车辆V⁽ⁱ⁾被估计的行为效用可以重写为：

不失一般性，考虑Ε(v_k,i)＝0,var(v_k,i)＝ε²，其中ε为效用值相关的环境噪声等级，由此，可得关于车辆V⁽ⁱ⁾行为效用的条件概率密度分布，

参考上面公式，可以得到

其中，δ_k,l为克罗内克(Kronecker delta)函数。克罗内克函数的自变量(输入值)一般是两个整数，如果两者相等，则其输出值为1，否则为0。

故当车辆的行为是由他的先验期望和自身得到的信息决定的时候，

我们将用理论证明通过周围车辆的行为效用的调整可形成不同难度的测试任务，即在本公开的仿真测试方法中，被测车辆在测试场景中可遭遇更多具有挑战性的事件。为了方便分析，在下面的推导中，我们设置被测车辆编号为V⁽¹⁾，周围车辆的编号为V⁽²⁾，V⁽³⁾，…,V^(m)。

本公开中不考虑车辆之间存在协商行为、协同决策等情况出现，即交通参与者不受其他参与者或路侧设备的影响，都是基于自身的感知信息了解周围车辆的偏好并独立进行决策和规划。设置

为在固定车辆的驾驶策略下，被测车辆从初始测试场景出发完成相应的测试任务时遭遇挑战性事件的概率。

从被测车辆视角而言，其驾驶行为是任务难度体现的重要内容。定义

为被测车辆从设定的初始场景出发，完成预设测试任务，并综合自身行为效用与周围车辆行为效用做出某行为的概率(U作为行为效用函数不具有实际意义，选择效用数值的目的重在对车辆的行为表现进行排序)。其中，/>

为被测车辆在当前时刻的估计自身行为效用值的随机变量，C＝{C_i},i＝2,3,…,m则为表示由周围车辆行为效用值构成的随机变量组合。本公开不考虑距离较远的周围车辆，即不考虑虚拟测试场景里存在车但是与被测车辆无交互的现象。

由此，可以将虚拟测试场景的挑战性，体现在被测车辆在虚拟测试场景中做出的行为，利用全概率公式将上述公式改写成：

通过改变周围车辆的行为效用(或驾驶策略)，找到对于针对被测车辆尽可能多的挑战场景是具有操作性的。理论上讲，如果我们遍历从周围车辆所有的行为组合，从而生成被测车辆在特定场景内所有可能的行为组合，是可以划分遍历不同困难程度的任务。然而，遍历所有的组合是一个非确定性多项式难题(non-deterministic polynomial hard，NP-hard)，因此我们需要对周围车辆的行为效用进行分类并选择，才能尽可能在有限次测试中尽可能采样到不同难度的设定任务。

为了简化下文的公式，我们考虑当测试需求被确定，设定的基本测试任务Ψ与测试指标均已设置好，以及限定了道路环境以及周围车辆的数目和位置等基本的静态与动态因素。

例如，设置语义化的测试需求为测试自动驾驶汽车在有4辆周围车辆的十字路口识别交通状态并安全转向的能力，其中周围车辆采用策略均为保守。由此，在测试需求的指导下，测试场景会规范出具体场景中周围车辆的位置、属性以及相应的行驶方式等，根据测试指标设计具体的自动驾驶测试任务，并初始化虚拟测试场景。

也就是说，周围车辆行为的变化应该在一致的测试指标下，在相同的初始虚拟测试场景出发依据不同任务Ψ。在相同测试场景与相同测试需求下，测试任务是预先设定的，即是不影响结果的，因此，上述公式可以简化成：

当我们调整一辆车，如V₂的行为时，可以写为：

其中：

同样，如果我们通过改变两个周围车辆的驾驶策略来调整测试任务，则测试场景中发生挑战性事件的概率为：

其中，

根据推导可以看出，改变周围车辆的行为效用并控制被改变的周围车辆数量可得到不同难度的测试任务，进而实现测试任务的难度的调整。

在一种示例性仿真场景中，我们设置周围车辆跟驰行为的效用函数模型(分别是跟驰距离与速度函数)如下，我们通过调整模型中的参数数值来构造采取不同驾驶策略的周围车辆，并分析他们对被测车辆的影响以判断测试任务难度的大小。

其中，L(t)为跟驰模型中前车与后车之间的距离,x_lead(t)和v_lead(t)分别为跟驰模型中前车的距离和速度，x_follow(t)和v_follow(t)分别为跟驰模型中后车的距离和速度。

则后车的速度可以计算为：

其中，v_max是可以设置的最大速度(例如，v_max可以设置为14m/s)，T是时间间隔(例如，T可以设置为0.1s)。理想距离G被用来判断车辆跟驰想保持的最终车距.如果L(t)低于G,后车会减速；如果L(t)大于G,后车会加速直到最大速度。

在本示例性仿真场景中，我们通过改变后车的理想距离G与最大速度v_max的高斯分布参数，以实现区分不同策略的后车跟驰行为。本公开定义激进的跟车行为会保持较小的理想距离、最大速度分布均值和方差略大，而保守的跟车行为会保持较大的理想距离，最大速度分布的均值和方差均较小。

在另一种示例性仿真场景中，我们采用MOBIL换道行为模型作为具体的换道行为效用函数如下，即行为效用函数U为加速度收益总和U_acceleration，如果收益总和大于阈值Δα则做出换道决策。

U_acceleration＝Δαc+p(Δαn+Δαo)>Δα；

其中，Δαc为本车加速度收益，p为变道系数，Δαn为目标车道后车加速度收益，Δαo为本车道后车加速度收益，Δα为预设的变道阈值，当变道之后加速度收益总和的值大于预设的变道阈值Δα时允许变道。

在本示例性仿真场景中，我们通过改变变道系数p与预设的变道阈值Δα的值实现区分不同策略的换道行为。示例性的，我们可以定义具有激进型驾驶策略的车辆的换道行为的变道系数p为0.1，即换道决策不考虑其他车辆的安全问题；而具有保守型驾驶策略的车辆的换道行为的变道系数p为1，即换道决策过多考虑其他车辆的安全问题。

本公开中，我们定义测试任务的难度与被测车辆在场景中遭遇的挑战性事件总数成正比，当两车之间的碰撞时间(Time To Collision，TTC)大于1秒、小于2.5秒时，我们认为车辆遭遇挑战性事件。当TTC小于1秒时，我们认为车辆一定会出现不可避免的碰撞事故，即使人类驾驶员也无法安全刹车。而当TTC大于2.5秒时，我们认为车辆行驶过程中不会遇到任何跟驰行为带来的困难。

下面以切车仿真场景为例对本公开提供的自动驾驶测试任务难度调整方法进行详细说明。当被测车辆和初始场景参数不变时，本公开通过同时改变切车车辆与周围其他车辆的驾驶行为，可以采样出难度更高的切车场景和切车任务。

如图3所示，本公开实施例提供了一种自动驾驶仿真测试流程，主要包括以下步骤：仿真初始化、行为采样和智能评估。

仿真初始化

首先，需要初始设置一个虚拟测试场景作为测试环境。在这个初始测试环境中，需要构建场景的时空布局并指定场景的组成。

在不考虑路侧单元或其他设备支持的情况下，本公开设计一个典型的单向双车道道路切车场景。被测的自动驾驶车辆起始位置与基准线之间的距离设置为R，同时该车距离最近的车道线距离是R’，如图4所示。其中被测的自动驾驶车辆(AV)与周围车辆关系描述采用以被测车辆为轴的极坐标方法，设四辆车之间的距离为(R₁,D₁)，(R₂,D₂)，(R₃,D₃)，其中R_i表示车辆中心之间的绝对距离，AV驾驶方向与V⁽ⁱ⁺¹⁾驾驶方向之间的角偏差(即以AV为中心，以AV的车头方向为正方向，另一辆车的中心与AV中心的角度差)为D_i。

场景中车辆状态信息包括车辆的速度和加速度。其中，V⁽ⁱ⁾的速度与加速度构成一对状态变量(v_i,a_i)，其中i＝1,2,3,4，我们设置V⁽²⁾为场景中准备换道的周围车辆。V⁽¹⁾为被测车辆，与V⁽³⁾和V⁽⁴⁾都处在自由驾驶状态。

测试场景初始化参数如表1所示。

表1

行为采样

为了生成不同难度的测试场景，本公开采用语义驱动方式描述车辆丰富的驾驶行为(即不同的驾驶策略可以用语言描述)。具体而言，本公开在采样过程中选择行为效用函数描述车辆的驾驶行为，该函数以外部环境和自身参数设计为输入，车辆在该时刻的行为效用值为输出。通过调整效用函数中的超参数，表征行为效用函数的异构输出。

考虑效用函数的输入是一系列独立的变量：x₁,x₂,…,x_n.对于任意车辆V⁽ⁱ⁾，定义该车的行为效用为U_i。我们认为行为效用是这些独立变量的加权和，那么效用函数的基本公式可以写成：

其中，α_k,i为变量的权重系数。

根据观察，人类驾驶员的驾驶策略一般可以分为激进型和保守型。我们认为车辆驾驶行为受二元策略的支配，即激进型驾驶策略和保守型驾驶策略，以表明工具的“内部现实主义”，C＝{’aggressive’,’conservarive’}。

在本公开中，设定驾驶行为的效用体现为行为切换的概率。在效用函数输入变量一致的情况下，交通参与者采用的驾驶策略影响了执行驾驶行为的概率数值。

智能评估

智能指标选择：在体现安全的智能性测试中，我们选择布尔类型来判断车辆是否在适当的时空范围内成功实现安全目标。我们通过设置碰撞时间(TTC)的阈值来确定布尔量的值。TTC作为最常用的安全性能指标之一，可以有效反映自动驾驶汽车的安全状况。如果TTC超过阈值，说明测试场景中被测车辆遭遇挑战性事件，此时，布尔值B＝0，否则B＝1。由此，在本公开中，定义测试场景的难度为被测车辆遭遇挑战性事件的次数，被测车辆遭遇挑战性事件次数越多，该被测车辆所在的虚拟测试场景难度越大。

如图5所示，在场景1和场景2两种测试场景下调整周围车辆的驾驶策略，以获得针对被测车辆具有不同难度的测试场景。在场景1中，我们只改变V⁽²⁾的驾驶策略，而在场景2中，我们同时改变V⁽²⁾和V⁽³⁾的驾驶策略。同时，我们还提供了一个基准场景，即我们为所有周围车辆均保持正常的驾驶策略。在本实施例中，我们设置TTC的阈值为2s。我们用箱形图表示200次重复实验的结果，如图5所示，其中，Median为中值或中位数，mean value为平均值，IQR为四分位距(interquartile range)，又称四分差。从图5可以看出，相比于场景1，场景2出现了更多挑战性场景；同时相比于在基准场景，在场景1与场景2中被测车辆均遇到了更多挑战性场景。由此说明本公开通过改变不同数量周围车辆的驾驶策略，会使被测车辆遭遇更多具有挑战性的事件，进而采样出难度不同的虚拟测试场景。

本公开实施例还提供了一种自动驾驶测试任务难度调整装置，包括存储器；和连接至所述存储器的处理器，所述存储器用于存储指令，所述处理器被配置为基于存储在所述存储器中的指令，执行如本公开任一实施例所述的自动驾驶测试任务难度调整方法的步骤。

如图6所示，在一个示例中，自动驾驶测试任务难度调整装置可包括：处理器610、存储器620和总线系统630，其中，处理器610和存储器620通过总线系统630相连，存储器620用于存储指令，处理器610用于执行存储器620存储的指令。具体地，处理器610设置虚拟测试场景和测试任务，所述虚拟测试场景包括被测车辆和周围车辆；构建车辆行为效用模型，所述车辆行为效用模型包括多种不同的驾驶策略；对所述被测车辆执行所述测试任务，并在所述测试任务执行过程中，改变周围车辆的驾驶策略；获取测试结果，根据所述测试结果生成针对所述被测车辆具有不同难度的测试任务。

应理解，处理器610可以是中央处理单元(Central Processing Unit，CPU)，处理器610还可以是其他通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器620可以包括只读存储器和随机存取存储器，并向处理器610提供指令和数据。存储器620的一部分还可以包括非易失性随机存取存储器。例如，存储器620还可以存储设备类型的信息。

总线系统630除包括数据总线之外，还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见，在图6中将各种总线都标为总线系统630。

在实现过程中，处理设备所执行的处理可以通过处理器610中的硬件的集成逻辑电路或者软件形式的指令完成。即本公开实施例的方法步骤可以体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等存储介质中。该存储介质位于存储器620，处理器610读取存储器620中的信息，结合其硬件完成上述方法的步骤。为避免重复，这里不再详细描述。

本公开实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本公开任一实施例所述的自动驾驶测试任务难度调整方法。通过执行可执行指令驱动自动驾驶测试任务难度调整的方法与本公开上述实施例提供的自动驾驶测试任务难度调整方法基本相同，在此不做赘述。

在一些可能的实施方式中，本申请提供的自动驾驶测试任务难度调整方法的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当所述程序产品在计算机设备上运行时，所述程序代码用于使所述计算机设备执行本说明书上述描述的根据本申请各种示例性实施方式的自动驾驶测试任务难度调整方法中的步骤，例如，所述计算机设备可以执行本申请实施例所记载的自动驾驶测试任务难度调整方法。

所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于：电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中，在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分；例如，一个物理组件可以具有多个功能，或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器，如数字信号处理器或微处理器执行的软件，或者被实施为硬件，或者被实施为集成电路，如专用集成电路。这样的软件可以分布在计算机可读介质上，计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的，术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外，本领域普通技术人员公知的是，通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据，并且可包括任何信息递送介质。

虽然本公开所揭露的实施方式如上，但所述的内容仅为便于理解本公开而采用的实施方式，并非用以限定本发明。任何所属领域内的技术人员，在不脱离本公开所揭露的精神和范围的前提下，可以在实施的形式及细节上进行任何的修改与变化，但本发明的专利保护范围，仍须以所附的权利要求书所界定的范围为准。

Claims

1.一种自动驾驶测试任务难度调整方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述多种不同的驾驶策略包括至少一种激进型驾驶策略和至少一种保守型驾驶策略；所述激进型驾驶策略在跟车或换道过程中，倾向于与前车保持的最小安全车距小于所述保守型驾驶策略在跟车或换道过程中，倾向于与前车保持的最小安全车距。

3.根据权利要求1所述的方法，其特征在于，所述改变周围车辆的驾驶策略，包括以下至少之一：

改变一辆所述周围车辆的驾驶策略；

改变多辆所述周围车辆的驾驶策略。

4.根据权利要求1所述的方法，其特征在于，所述测试任务的难度定义为

其中，∑_tA_i为所述被测车辆在完成测试任务i过程中遭遇的挑战性事件次数总和，所述被测车辆遭遇挑战性事件定义为所述被测车辆与所述周围车辆的碰撞时间处于预设的阈值范围内，S_i为所述测试任务i的总采样数，i为自然数，t为测试时间。

5.根据权利要求1所述的方法，其特征在于，所述车辆行为效用模型包括跟驰行为模型，所述跟驰行为模型表示为：

其中，L(t)为前车与后车之间的距离,x_lead(t)和v_lead(t)分别为前车的距离和速度，x_follow(t)和v_follow(t)分别为后车的距离和速度，a_max为最大加速度；

后车的速度计算公式为：

其中，理想距离G与最大速度v_max为所述车辆行为效用模型的变量，当L(t)小于G时，后车减速；当L(t)大于G时，后车加速直到最大速度；

所述改变周围车辆的驾驶策略，包括：改变后车的理想距离G与最大速度v_max的值。

6.根据权利要求1所述的方法，其特征在于，所述车辆行为效用模型包括换道行为模型，所述换道行为模型表示为：

U_acceleration＝Δαc+p(Δαn+Δαo)>Δα；

其中，U_acceleration为加速度收益函数，Δαc为本车加速度收益，p为变道系数，Δαn为目标车道后车加速度收益，Δαo为本车道后车加速度收益，Δα为预设的变道阈值，当变道之后加速度收益函数U_acceleration的值大于预设的变道阈值Δα时允许变道；

所述改变周围车辆的驾驶策略，包括：改变变道系数p与预设的变道阈值Δα的值。

7.一种自动驾驶测试任务难度调整装置，其特征在于，包括存储器；和连接至所述存储器的处理器，所述存储器用于存储指令，所述处理器被配置为基于存储在所述存储器中的指令，执行如权利要求1至6中任一项所述的自动驾驶测试任务难度调整方法的步骤。

8.一种存储介质，其特征在于，其上存储有计算机程序，该程序被处理器执行时实现如权利要求1至6中任一项所述的自动驾驶测试任务难度调整方法。