CN117590856B

CN117590856B - 一种基于单一场景和多场景的自动驾驶方法

Info

Publication number: CN117590856B
Application number: CN202410072750.3A
Authority: CN
Inventors: 于海洋; 蔡翱; 任毅龙; 谢丹木; 崔志勇
Original assignee: Beihang University
Current assignee: Beihang University
Priority date: 2024-01-18
Filing date: 2024-01-18
Publication date: 2024-03-26
Anticipated expiration: 2044-01-18
Also published as: CN117590856A

Abstract

本发明公开了一种基于单一场景和多场景的自动驾驶方法，一种基于单一场景的自动驾驶方法包括：基于单一场景下的参考轨迹，确定场景对应的失效边界状态对；对所述失效边界状态对进行标注，获得标注的失效边界状态对；根据标注的失效边界状态对和原始采集的训练数据集训练自动驾驶模型，所述原始采集的训练数据集包括目标车辆的状态信息；根据训练后的自动驾驶模型，控制车辆进行自动驾驶。本发明使自动驾驶系统自身在安全关键驾驶场景下获得控制性能边界，进而使基于具有边界意识的自动驾驶系统控制车辆更安全行驶。

Description

一种基于单一场景和多场景的自动驾驶方法

技术领域

本发明涉及电数字数据处理领域。具体而言，涉及一种基于单一场景和多场景的自动驾驶方法。

背景技术

自动驾驶测试是一种通过探索自动驾驶系统存在的潜在问题以保证系统安全运行的有效方法，这将加速自动驾驶技术的普及和应用。

现有技术中，通过边界输入生成技术找到触发被测自动驾驶系统不同行为的临界输入，为基于视觉的有监督深度神经网络控制的自动驾驶系统的输入图像提供了失效边界关键帧标签，随后通过迭代输入训练集来提升其数据覆盖度，进而缓解自动驾驶测试中的长尾问题。

目前，边界输入生成技术可以分为数据驱动生成、对抗生成和知识生成等方式。然而，现有的边界输入生成技术仅关注驾驶环境的仿真场景生成，试图将对仿真场景的定制和修改从数字世界迁移到实际道路测试中。事实上，自动驾驶系统只能在有限数量的专用场景中进行测试，因此改变驾驶环境是困难，甚至不可能，这对场景的安全关键性提出了较高的要求。此外，当前边界输入生成技术的另一缺陷是以新生成的最小危险场景作为安全场景的边界，且不再生成新的更具有挑战性的危险场景。但是，即使在探索到的无故障场景内也可能存在潜在的驾驶风险。

因此，亟需一种自动驾驶系统自身在安全关键驾驶场景下获得控制性能边界的方法，进而使车辆更安全地行驶。

发明内容

本发明正是基于现有技术的上述需求而提出的，本发明要解决的技术问题是提供一种基于单一场景和多场景的自动驾驶方法以使自动驾驶系统自身在安全关键驾驶场景下获得控制性能边界，进而基于具有边界的自动驾驶系统控制车辆更安全行驶。

为了解决上述问题，本发明是采用如下技术方案实现的：

一种基于单一场景的自动驾驶方法，该方法包括：基于单一场景下的参考轨迹，确定场景对应的失效边界状态对，包括：在单一场景中随机选择一个目标车辆状态点，根据所述状态点确定参考轨迹中最近路点；根据所述状态点获取父状态对；根据父状态对获取子状态对；基于搜索算法，从子状态对中寻找失效边界状态对；所述根据所述状态点获取父状态对包括：判断所述状态点对应的第一状态信息中的位置、航行角和速度与最近路点中的参考位置、参考角和速度之间的关系是否满足第一条件，如果满足，基于第一状态信息进行改变位置、航向角和速度中的至少一者的数值的衍化，获得父状态对，所述父状态包括第一状态信息和第二状态信息；对父状态对进行从第一状态信息或第二状态信息回归到参考轨迹并完成预设任务的时间测试，确定目标车辆是否在预设时间内完成测试的执行结果；所述根据父状态对获取子状态对包括：如果父状态对的执行结果都为成功，则基于父状态对进行多次衍化，生成子状态对，所述子状态对包括第三状态信息和第四状态信息；对所述失效边界状态对进行标注，获得标注的失效边界状态对；根据标注的失效边界状态对和原始采集的训练数据集训练自动驾驶模型，所述原始采集的训练数据集包括目标车辆的状态信息；根据训练后的自动驾驶模型，控制目标车辆进行自动驾驶。

可选地，基于第一状态信息进行改变位置、航向角和速度中的至少一者的数值的衍化，包括：增大第一状态信息中的位置与最近路点的位置之间的距离、第一状态信息中的航向角与最近路点的参考角之间的差值和第一状态信息的速度中的一者，生成第二状态信息。

可选地，基于第一状态信息进行改变位置、航向角和速度中的至少一者的数值的衍化，获得父状态对，包括：判断父状态对中第二状态信息是否满足第一条件和第二条件；判断第二状态信息是否满足第一条件包括判断第二状态信息中位置与最近路点的参考位置之间的距离是否小于或等于第一阈值，且第二状态信息中航向角与最近路点的参考角之间的差值是否小于或等于第二阈值，以及第二状态信息中速度是否小于或等于第三阈值；判断第二状态是否满足第二条件包括判断第一状态信息中位置与第二状态信息中的位置之间的距离是否小于第四阈值，如果同时满足第一条件和第二条件，则将第一状态信息和第二状态信息组合，获得父状态对。

可选地，对父状态对进行从第一状态信息或第二状态信息回归到参考轨迹并完成预设任务的时间测试，确定目标车辆是否在预设时间内完成测试的执行结果，包括：将第一状态信息或第二状态信息作为自动驾驶系统的初始输入状态，在对应的单一场景下，若自动驾驶系统能够在第一时间阈值内从初始输入状态中恢复到参考轨迹的路点对应的状态，并在第二时间阈值内成功完成预设任务，则执行结果为成功，否则为失败。

可选地，对父状态对进行从第一状态信息或第二状态信息回归到参考轨迹并完成预设任务的时间测试，确定目标车辆是否在预设时间内完成测试的执行结果，包括：若自动驾驶车辆在第一状态信息和第二状态信息场景下，执行结果都为成功，则初始化成功；若自动驾驶车辆在第一状态信息和第二状态信息场景下，执行结果都为失败，则初始化失败，并重新开始随机选择目标车辆的其他状态点；若自动驾驶车辆在第一状态信息和第二状态信息场景下，一个执行结果为成功，另一个执行结果为失败，则父状态对为失效边界对，将父状态对加入至预设边界数据库中，并重新开始随机选择目标车辆的其他状态点。

可选地，基于父状态对进行多次衍化，生成子状态对，包括：基于父状态对中第一状态信息衍化生成第三状态信息，根据第三状态信息衍化生成第四状态信息，判断第三状态信息是否满足第一条件，同时判断第四状态信息是否满足第一条件和第二条件，如果满足，则将第三状态信息和第四状态信息组合得到子状态对。

可选地，基于搜索算法，从子状态对中寻找失效边界状态对，包括：基于衍化程度将子状态对添加至带有索引的序列集合中；对序列集合中子状态对进行二分搜索，并对子状态对进行测试以确定失效边界状态对。

可选地，对所述失效边界状态对进行标注，获得标注的失效边界状态对，包括：确定每个失效边界状态对中执行结果为失败的状态信息；将失败的状态信息作为自动驾驶系统的初始状态信息，并输入至对应场景下进行测试，在测试过程中每间隔预设时间为车辆标注正确的转向角度以确保最终测试成功。

可选地，根据标注的失效边界状态对和原始采集的训练数据集训练自动驾驶模型，包括：将标注的失效边界状态对和原始采集的训练数据集进行融合；将融合的数据集输入至未训练的自动驾驶模型中重新开始训练；如果在预设训练次数内，训练的自动驾驶模型的任务成功率与仅利用原始采集的训练数据集训练的自动驾驶模型的任务成功率的差值小于第一任务阈值，则停止训练，并输出训练后的自动驾驶模型；否则，重新开始随机选择目标车辆的其他状态点，寻找失效边界状态对。

一种基于多场景的自动驾驶方法，该方法包括：确定与自动驾驶满足第一关联的场景参数和各场景参数的范围；基于场景参数和各场景参数的范围，生成第一测试场景；基于上述一种基于单一场景的自动驾驶方法，控制自动驾驶模型在各个测试场景中遍历迭代训练，获得第一自动驾驶模型；判断每个第一测试场景中初始自动驾驶模型与训练完成第一自动驾驶模型的完成任务成功率的差值是否大于第二任务阈值，如果大于第二任务阈值，则当前第一测试场景为长尾场景，否则为一般化场景；确定长尾场景中敏感参数；对敏感参数进行扰动，生成第二测试场景；基于单一场景的自动驾驶方法，控制第一自动驾驶模型在第二测试场景中遍历迭代训练，获得第二自动驾驶模型；基于所述第二自动驾驶模型，控制车辆进行自动驾驶。

与现有技术相比，本发明提出了一种基于单一场景的自动驾驶方法以使自动驾驶系统自身在安全关键驾驶场景下获得控制性能边界。在某一固定参数化的道路环境下，基于车辆行驶过程中最主要的车道保持场景，生成失效边界状态对以评估自动驾驶系统的控制极限。具体地，通过对深度神经网络控制的驾驶系统的行驶状态信息进行衍化，从而找到一系列在边界两侧的车辆失效边界状态对。通过对失效边界状态对标注正确的转向角度，从而增强原始训练数据集，进一步增强自动驾驶系统的危险状态辨识与化解能力，量化了安全驾驶场景下潜在的行车风险，提升自动驾驶系统在对应的单一场景的安全性。本发明还提出了一种基于多场景的自动驾驶方法，通过融合多个单一场景以及对所辨识参数化的长尾场景的参数评估重组实现安全关键场景的覆盖，增强自动驾驶模型的泛化性和安全性，实现系统的持续改进。

附图说明

为了更清楚地说明本说明书实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书实施例中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种基于单一场景的自动驾驶方法的第一流程图；

图2是本发明实施例提供的一种基于单一场景的自动驾驶方法的第二流程图；

图3是本发明实施例提供的失效边界状态对的二分搜索示意图；

图4是本发明实施例提供的一种基于多场景的自动驾驶方法的第一流程图；

图5是本发明实施例提供的一种基于多场景的自动驾驶方法的第二流程图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为便于对本发明实施例的理解，下面将结合附图以具体实施例做进一步的解释说明，实施例并不构成对本发明保护范围的限定。

实施例1

目前，边界输入生成技术可以分为数据驱动生成、对抗生成和知识生成等方式。所述数据驱动生成通过对收集的数据进行随机采样，或者根据密度估计模型学习场景的分布以生成边界。其中，随机采样方法简单易行，但是面临稀疏性问题，且无法生成现有数据之外的未知场景。密度估计模型包括贝叶斯网络、深度学习、深度生成和模仿学习等方法，能够在已知场景的基础上进行拓展泛化，但是依然对原始数据集的丰富度有较高的要求。对抗生成通过主动创造风险场景来挑战自动驾驶系统，例如利用周围车辆故意碰撞目标训练车，以加强系统对边界场景的应对处理能力，所述对抗生成主要包括控制初始条件与对抗策略定义两种方式。仅控制环境车辆的初始条件或者直接提供预行驶轨迹具有搜索空间维度低、计算负担小和行为可控可解释的优势，但是会抑制泛化能力、环境对目标车无动态适应性、系统强化上限低等诸多问题。对抗策略定义通过强化学习控制环境动态物体，从而增强场景的柔性，但也伴随着复杂度的增加。知识生成不再单纯地利用原始数据随机地生成泛化场景，而是考虑交通规则和物理定律，能够符合现实约束同时减小场景搜索空间、加快生成速度。但是如何定义先验知识的表示空间是困扰学习与知识融合方法的一大障碍。

因此，本实施例提供了一种基于单一场景的自动驾驶方法以使自动驾驶系统自身在安全关键驾驶场景下获得控制性能边界，进而基于具有边界的自动驾驶系统控制车辆更安全行驶。如图1-图2所示，所述基于单一场景的自动驾驶方法包括：

S1基于单一场景下的参考轨迹，确定场景对应的失效边界状态对。

预先设定一种自动驾驶车辆任务，示例性的，预设任务设为车道保持任务，然后在此设定的任务下，调整环境参数，每种环境参数下对应一种单一场景。重点是找到安全关键场景的失效边界状态对。

所述参考轨迹表示在当下场景中选择比较合适的路点组成的车辆行驶轨迹以完成预设任务，示例性的，所述参考轨迹包括道路中心线。每个路点对应的状态包括参考位置和参考角，所述参考位置为路点的绝对位置，所述参考角为车辆沿参考轨迹行驶时在此路点的航向角。

本步骤中，包括：

S100在单一场景中随机选择一个车辆状态点，根据所述状态点确定参考轨迹中最近路点。

确定目标车辆的状态信息范围值，所述状态信息包括车辆的位置、航向角和速度，确定目标车辆的状态信息范围值包括确定车辆的位置范围区间、航向角范围区间和速度范围区间。

在所述状态信息范围值中随机选择车辆的位置、航向角和速度，组成状态信息，以此确定车辆状态点。需要说明的是状态点是执行预设任务的初始点。

S110根据所述状态点获取父状态对。

S111判断所述状态点对应的第一状态信息中的位置、航行角和速度与最近路点中的参考位置、参考角和速度之间的关系是否满足第一条件，如果满足，基于第一状态信息进行改变位置、航向角和速度中的至少一者的数值的衍化，获得父状态对。

所述状态信息包括车辆的位置，航向角和速度。

示例性的，状态信息，其中，p表示车辆的绝对位置(x,y)，/>表示车辆的绝对航向角；/>是车辆行驶速度矢量v的大小。

所述第一条件包括对应的状态信息中位置与最近路点的参考位置之间的距离小于或等于第一阈值，且对应的状态信息中航向角与最近路点的参考角之间的差值小于或等于第二阈值，以及对应的状态信息中速度小于或等于第三阈值。上述条件表示如下：，/>，/>，其中，/>表示对应的状态信息中位置与最近路点的参考位置之间的距离，d表示距离，T为最近路点的参考位置，/>表示第一阈值，本实施例将第一阈值设置为车道宽度W的一半，/>表示状态信息中航向角与最近路点的参考角之间的差值，/>表示第二阈值，/>表示第三阈值。

父状态对包括第一状态信息和第二状态信息，第二状态信息基于第一状态信息衍化生成。

基于状态信息进行衍化，包括对第一状态信息进行衍化，具体而言，包括，增大第一状态信息中的位置与最近路点的位置之间的距离、第一状态信息中的航向角与最近路点的参考角之间的差值和第一状态信息的速度中的一者，生成另一状态信息。

判断第二状态信息s ₂是否满足第一条件和第二条件，所述第二条件包括一个状态对中的两个状态信息之间的距离是否小于第四阈值，具体而言，此处判断第一状态信息s ₁与第二状态信息s ₂之间的距离是否小于第四阈值，如果满足第一条件和第二条件，将两个状态信息组合生成父状态对b={s ₁,s ₂}。另外，在判断第二状态信息是否满足第一条件前，寻找到第二状态信息对应的最近路点。

通过衍化操作，增加车辆的行驶难度，为寻找边界状态做准备。

S112对父状态对进行从第一状态信息或第二状态信息回归到参考轨迹并完成预设任务的时间测试，确定目标车辆是否在预设时间内完成测试的执行结果。

本步骤中，将父状态对中第一状态信息s ₁或第二状态信息s ₂作为自动驾驶系统的初始输入状态，即车辆偏离参考轨迹的状态，在对应的单一场景下，若自动驾驶系统能够在第一时间阈值内从初始输入状态中恢复到参考轨迹的路点对应的状态，并在第二时间阈值内成功完成预设任务，则执行结果为成功，否则为失败。

具体结果情况包括：

（1）如果自动驾驶车辆在第一状态信息和第二状态信息场景下，执行结果都为成功，则初始化成功。

在此情况下，说明两个状态在当前自动驾驶系统面对的确定环境的安全阈限内。

（2）如果自动驾驶车辆在第一状态信息和第二状态信息场景下，执行结果都为失败，则初始化失败，并重新开始在S100中随机选择其他车辆状态点。

（3）如果自动驾驶车辆在第一状态信息和第二状态信息场景下，一个执行结果为成功，另一个执行结果为失败，则父状态对为失效边界对，将此状态对加入至预设边界数据库中，并重新开始在S100中随机选择一个车辆状态点。

S120根据父状态对获取子状态对。

如果父状态对的执行结果都为成功，则基于父状态对进行衍化，生成子状态对。

基于父状态对生成子状态对，所述子状态对至少一个，也就是说子状态对都是依赖父状态对生成。每个子状态对包括第三状态信息和第四状态信息，第三状态信息基于第一状态信息衍化生成，第四状态信息基于第三状态信息衍化生成。

此步骤可称为进化阶段，包括：基于父状态对中第一状态信息衍化生成子状态对中第三状态信息，根据第三状态信息衍化生成第四状态信息，判断第三状态信息是否满足第一条件，且判断第四状态信息是否满足第一条件和第二条件，如果满足，将第三状态信息和第四状态信息组合得到子状态对。

重复执行上述进化过程，直至不满足条件，即为第三状态信息和第四状态信息组合后为无效子状态对，停止执行。

S130基于搜索算法，从子状态对中寻找失效边界状态对。

上述步骤中通过衍化使子状态对的挑战性逐渐增加，即完整预设任务的难度系数不断提升。如图3所示，基于衍化程度将除无效子状态对外所有新生成的、挑战性单调增加的子状态对全部依次加入序列集合，在序列集合中，基于难度系数子状态对的索引从左往右依次增加。

所述失效边界状态对中第三状态信息和第四状态信息彼此是足够接近的且能够使系统暴露出不同的驾驶行为，即执行结果中其中一个为成功，另一个为失败。

在本实施例中，对序列集合中子状态对进行二分搜索，并对子状态对进行测试以找到失效状态边界对，具体包括：

以序列集合中第一个子状态对为左边界，对应的索引为，最后一个子状态对为右边界，对应的索引为/>。此时，序列集合中状态信息的衍化程度从左往右是依次增加的。

对左边界和右边界的中心子状态对进行测试，即对索引对应的子状态对进行测试，确定执行结果。

如果中心子状态对的其中一个状态信息的执行结果为成功，另一个状态信息的执行结果为失败，则此中心子状态对为失效边界状态对，停止搜索。如图3所示，和/>表示失效边界状态对，图中的“/>”表示对应的状态信息测试成功，“/>”表示对应的状态信息测试失败，虚线左边表示车辆在安全边界内的状态，虚线右边表示车辆在安全边界外的状态，/>表示对应的状态信息中位置与最近路点的参考位置之间的距离，/>表示状态信息中航向角与最近路点的参考角之间的差值，/>表示速度。

如果中心子状态对中两个状态信息的执行结果都为成功，则说明此中心子状态对在安全边界以内，且序列集合中处于中心子状态对与左边界的子状态对之间的子状态对都在安全边界内，不需要进行搜索，只需要在中心子状态对和右边界对应的子状态对之间寻找失效边界状态对，因此将中心子状态对设置为左边界，并基于此时的左边界和右边界更新中心子状态对，并对更新后的中心子状态对再进行测试。

如果中心子状态对中两个状态信息的执行结果都为失败，则说明此中心子状态对在安全边界以外，且序列集合中处于在中心子状态对与右边界的子状态对之间的子状态对都在安全边界外，不需要进行搜索，只需要在中心子状态对和左边界对应的子状态对之间寻找失效边界状态对，因此将中心子状态对设置为右边界，并基于此时的左边界和右边界更新中心子状态对，并对更新后的中心子状态对再进行测试。

然后将搜索到的边界状态对加入边界数据库中。判断当前迭代次数是否达到预设次数，如果达到预设次数，则退出并继续执行后续步骤，否则重新基于父子状态对进行多次衍化。

最后判断是否满足当前实现次数达到预设实验次数的条件，若满足条件，则完成失效边界状态对生成步骤，并输出边界数据库；否则返回S100，重新开始边界对的生成与搜索过程。

S2对所述失效边界状态对进行标注，获得标注的失效边界状态对。

在本步骤中，包括：

S200确定每个失效边界状态对中执行结果为失败的状态信息。

S210将失败的状态信息作为自动驾驶系统的初始状态信息，并输入至对应场景下进行测试，在测试过程中每间隔预设时间为车辆标注正确的转向角度以确保最终测试成功。

所述自动驾驶系统承载自动驾驶模型控制车辆。

S3根据标注的失效边界状态对和原始采集的训练数据集训练自动驾驶模型。

所述原始采集的训练数据集包括目标车辆的状态信息。

将标注的失效边界状态对和原始采集的训练数据集进行融合，即将两者的信息进行结合和关联，增强了原始训练数据集。

将融合的数据集输入至未训练的自动驾驶模型中重新开始训练，如果在预设训练次数内，训练的自动驾驶模型的任务成功率与仅利用原始采集的训练数据集训练的自动驾驶模型的任务成功率的差值小于第一任务阈值，则停止训练，并输出训练后的自动驾驶模型。否则，重新从S100开始，寻找当前自动驾驶模型的失效边界状态对。

通过对失效边界状态对标注正确的转向角度和增强原始训练数据集的交替过程，实现自动驾驶系统在该场景下的加速测试与训练迭代，加强自动驾驶系统在单一场景的安全边缘状态的应对能力。

S4：根据训练后的自动驾驶模型，控制车辆在对应的场景中进行自动驾驶。

通过上述步骤，提高了自动驾驶系统对单一场景的安全性，使目标车辆在对应的场景下安全行驶。

本实施例中，针对目标车辆在目标场景下训练得到自动驾驶模型，也就是说每辆自动驾驶车辆都会执行上述步骤得到目标场景下对应的标注的失效边界状态对，然后将失效边界状态对与对应车辆的状态信息融合，获得训练后的自动驾驶模型，进而控制目标车辆在目标场景下安全行驶。

与现有技术相比，本发明实施例提出了一种基于单一场景的自动驾驶方法以使自动驾驶系统自身在安全关键驾驶场景下获得控制性能边界。在某一固定参数化的道路环境下，基于车辆行驶过程中最主要的车道保持场景，生成失效边界状态对以评估自动驾驶系统的控制极限。具体地，通过对深度神经网络控制的驾驶系统的行驶状态信息进行衍化，从而找到一系列在边界两侧的车辆失效边界状态对。通过对失效边界状态对标注正确的转向角度，从而增强原始训练数据集，进一步增强自动驾驶系统的危险状态辨识与化解能力，量化了安全驾驶场景下潜在的行车风险，提升自动驾驶系统在对应的单一场景的安全性。

实施例2

在现实情况下，自动驾驶车辆可能会遇到各种场景，为了使自动驾驶模型很好地应对各种场景，本实施例将多个单一场景进行重组。然而重组时对每个单一场景无目的性的逐个遍历会大大增加测试和训练的计算和时间成本。所以本实施例仅寻找关键的长尾场景，所述长尾场景指种类繁多、发生概率较低或者突发的场景，比如闯红灯的车辆，横穿马路的行人或红绿灯损坏的路口等。通过融合多个单一场景以及对所辨识参数化的长尾场景的参数进行不断扰动生成新的场景，以提高自动驾驶系统的安全性，更好地面对多样的驾驶环境，提高对长尾场景的泛化性和安全性。

本实施例提供一种基于多场景的自动驾驶方法，其流程如图4和图5所示，具体过程包括：

步骤一：确定与自动驾驶满足第一关联的场景参数和各场景参数的范围。

所述场景参数包括弯道曲率、道路坡度和天气。对所选的场景参数进行明确量化，确定各场景参数的范围，以便后续生成测试场景。所述与自动驾驶满足第一关联的场景参数和各场景参数为对路况具有较强影响的参数。

步骤二：基于场景参数和各场景参数的范围，生成第一测试场景。

步骤三：基于实施例1中的S1-S3，控制自动驾驶模型在各个测试场景中遍历迭代训练，获得第一自动驾驶模型。

在此步骤中，在上一测试场景中训练完成的自动驾驶模型作为下一测试场景的初始自动驾驶模型，以实现持续性增强训练。

步骤四：判断每个第一测试场景中初始自动驾驶模型与训练完成第一自动驾驶模型的完成任务成功率的差值是否大于第二任务阈值，如果大于第二任务阈值，则判断当前第一测试场景为长尾场景，否则为一般化场景。

由于每一组的场景数量是有限的，且部分场景可能不会找到失效边界状态，因此自动驾驶模型几乎不会进行迭代。相反，若输出自动驾驶模型与原自动驾驶模型具有显著区别，则可以认为该场景是长尾场景，因而判断是否为长尾场景需要重点关注场景对安全性的影响，即初始模型的成功率与训练后模型的成功率的差值。

步骤五：确定长尾场景中敏感参数。

确定敏感参数的表达式包括：

其中，为敏感参数，/>表示变化后的参数组，/>表示变化前的参数组，表示在/>对应场景下驾驶任务评价结果，/>在/>对应场景下驾驶任务评价结果，DM表示驾驶任务评价结果。

步骤六：对敏感参数进行扰动，生成第二测试场景。

步骤七：基于实施1中的S1-S3，控制第一自动驾驶模型在第二测试场景中遍历迭代训练，获得第二自动驾驶模型。

步骤八：基于所述第二自动驾驶模型，控制车辆进行自动驾驶。

此步骤中，重复执行步骤四至步骤七，使训练的自动驾驶模型可以适用于所有的长尾场景，从而提高自动驾驶系统的安全性。

与现有技术相比，本实施例提供的一种基于多场景的自动驾驶方法，通过融合多个单一场景以及对所辨识参数化的长尾场景的参数评估重组实现安全关键场景的覆盖，增强自动驾驶模型的泛化性和安全性，实现系统的持续改进。

以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于单一场景的自动驾驶方法，其特征在于，包括：

基于单一场景下的参考轨迹，确定场景对应的失效边界状态对，包括：在单一场景中随机选择一个目标车辆状态点，根据所述状态点确定参考轨迹中最近路点；根据所述状态点获取父状态对；根据父状态对获取子状态对；基于搜索算法，从子状态对中寻找失效边界状态对；

所述根据所述状态点获取父状态对包括：判断所述状态点对应的第一状态信息中的位置、航行角和速度与最近路点中的参考位置、参考角和速度之间的关系是否满足第一条件，如果满足，基于第一状态信息进行改变位置、航向角和速度中的至少一者的数值的衍化，获得父状态对，所述父状态对包括第一状态信息和第二状态信息；对父状态对进行从第一状态信息或第二状态信息回归到参考轨迹并完成预设任务的时间测试，确定目标车辆是否在预设时间内完成测试的执行结果；

所述根据父状态对获取子状态对包括：如果父状态对的执行结果都为成功，则基于父状态对进行多次衍化，生成子状态对，所述子状态对包括第三状态信息和第四状态信息；

对所述失效边界状态对进行标注，获得标注的失效边界状态对；

根据标注的失效边界状态对和原始采集的训练数据集训练自动驾驶模型，所述原始采集的训练数据集包括目标车辆的状态信息；

根据训练后的自动驾驶模型，控制目标车辆进行自动驾驶。

2.根据权利要求1所述的一种基于单一场景的自动驾驶方法，其特征在于，基于第一状态信息进行改变位置、航向角和速度中的至少一者的数值的衍化，包括：

增大第一状态信息中的位置与最近路点的位置之间的距离、第一状态信息中的航向角与最近路点的参考角之间的差值和第一状态信息的速度中的一者，生成第二状态信息。

3.根据权利要求2所述的一种基于单一场景的自动驾驶方法，其特征在于，基于第一状态信息进行改变位置、航向角和速度中的至少一者的数值的衍化，获得父状态对，包括：

判断父状态对中第二状态信息是否满足第一条件和第二条件；判断第二状态信息是否满足第一条件包括判断第二状态信息中位置与最近路点的参考位置之间的距离是否小于或等于第一阈值，且第二状态信息中航向角与最近路点的参考角之间的差值是否小于或等于第二阈值，以及第二状态信息中速度是否小于或等于第三阈值；判断第二状态是否满足第二条件包括判断第一状态信息中位置与第二状态信息中的位置之间的距离是否小于第四阈值，如果同时满足第一条件和第二条件，则将第一状态信息和第二状态信息组合，获得父状态对。

4.根据权利要求1所述的一种基于单一场景的自动驾驶方法，其特征在于，对父状态对进行从第一状态信息或第二状态信息回归到参考轨迹并完成预设任务的时间测试，确定目标车辆是否在预设时间内完成测试的执行结果，包括：

将第一状态信息或第二状态信息作为自动驾驶系统的初始输入状态，在对应的单一场景下，若自动驾驶系统能够在第一时间阈值内从初始输入状态中恢复到参考轨迹的路点对应的状态，并在第二时间阈值内成功完成预设任务，则执行结果为成功，否则为失败。

5.根据权利要求4所述的一种基于单一场景的自动驾驶方法，其特征在于，对父状态对进行从第一状态信息或第二状态信息回归到参考轨迹并完成预设任务的时间测试，确定目标车辆是否在预设时间内完成测试的执行结果，包括：

若自动驾驶车辆在第一状态信息和第二状态信息场景下，执行结果都为成功，则初始化成功；

若自动驾驶车辆在第一状态信息和第二状态信息场景下，执行结果都为失败，则初始化失败，并重新开始随机选择目标车辆的其他状态点；

若自动驾驶车辆在第一状态信息和第二状态信息场景下，一个执行结果为成功，另一个执行结果为失败，则父状态对为失效边界对，将父状态对加入至预设边界数据库中，并重新开始随机选择目标车辆的其他状态点。

6.根据权利要求1所述的一种基于单一场景的自动驾驶方法，其特征在于，基于父状态对进行多次衍化，生成子状态对，包括：

基于父状态对中第一状态信息衍化生成第三状态信息，根据第三状态信息衍化生成第四状态信息，判断第三状态信息是否满足第一条件，同时判断第四状态信息是否满足第一条件和第二条件，如果满足，则将第三状态信息和第四状态信息组合得到子状态对。

7.根据权利要求1所述的一种基于单一场景的自动驾驶方法，其特征在于，基于搜索算法，从子状态对中寻找失效边界状态对，包括：

基于衍化程度将子状态对添加至带有索引的序列集合中；

对序列集合中子状态对进行二分搜索，并对子状态对进行测试以确定失效边界状态对。

8.根据权利要求1所述的一种基于单一场景的自动驾驶方法，其特征在于，对所述失效边界状态对进行标注，获得标注的失效边界状态对，包括：

确定每个失效边界状态对中执行结果为失败的状态信息；

将失败的状态信息作为自动驾驶系统的初始状态信息，并输入至对应场景下进行测试，在测试过程中每间隔预设时间为车辆标注正确的转向角度以确保最终测试成功。

9.根据权利要求1所述的一种基于单一场景的自动驾驶方法，其特征在于，根据标注的失效边界状态对和原始采集的训练数据集训练自动驾驶模型，包括：

将标注的失效边界状态对和原始采集的训练数据集进行融合；

将融合的数据集输入至未训练的自动驾驶模型中重新开始训练；

如果在预设训练次数内，训练的自动驾驶模型的任务成功率与仅利用原始采集的训练数据集训练的自动驾驶模型的任务成功率的差值小于第一任务阈值，则停止训练，并输出训练后的自动驾驶模型；

否则，重新开始随机选择目标车辆的其他状态点，寻找失效边界状态对。

10.一种基于多场景的自动驾驶方法，其特征在于，包括：

确定与自动驾驶满足第一关联的场景参数和各场景参数的范围；

基于场景参数和各场景参数的范围，生成第一测试场景；

基于如权利要求1-9中任意一项所述的基于单一场景的自动驾驶方法，控制自动驾驶模型在各个测试场景中遍历迭代训练，获得第一自动驾驶模型；

判断每个第一测试场景中初始自动驾驶模型与训练完成第一自动驾驶模型的完成任务成功率的差值是否大于第二任务阈值，如果大于第二任务阈值，则当前第一测试场景为长尾场景，否则为一般化场景；

确定长尾场景中敏感参数；

对敏感参数进行扰动，生成第二测试场景；

基于单一场景的自动驾驶方法，控制第一自动驾驶模型在第二测试场景中遍历迭代训练，获得第二自动驾驶模型；

基于所述第二自动驾驶模型，控制车辆进行自动驾驶。