CN117152550A

CN117152550A - 一种面向自动驾驶系统的神经元覆盖引导式测试方法

Info

Publication number: CN117152550A
Application number: CN202310354927.4A
Authority: CN
Inventors: 孙家泽; 李楠; 马鲜艳; 王小银; 李娟�
Original assignee: Xian University of Posts and Telecommunications
Current assignee: Xian University of Posts and Telecommunications
Priority date: 2023-04-04
Filing date: 2023-04-04
Publication date: 2023-12-01

Abstract

本发明公开了一种面向自动驾驶系统的神经元覆盖引导式测试方法，属于人工智能测试领域，具体涉及到自动驾驶系统测试中大规模高质量的测试样本严重稀缺的问题，其特征是根据图像斑点信息对自动驾驶系统采集的原始测试样本聚类，筛选出等量种子样本，然后以最大化神经元覆盖率和使得系统预测不一致为目标，将在原始测试用例上的修改转化为一个优化问题，并采用梯度上升法求解，自动生成出容易使系统输出错误且神经元覆盖率高的测试用例集，最后重新输入至自动驾驶模型中训练，主要解决目前自动驾驶系统中测试用例不足，且存在神经元覆盖率低、耗时长等问题，从而挖掘出更多自动驾驶软件不合理的系统缺陷，减少测试损耗，增强系统模型的预测准确率。

Description

一种面向自动驾驶系统的神经元覆盖引导式测试方法

技术领域

本发明属于人工智能测试领域，特别涉及一种面向自动驾驶系统的神经元覆盖引导式测试方法。基于已有自动驾驶系统图像数据集进行测试用例的增扩，以检测和修复系统潜在的缺陷和不合理行为。

背景技术

随着深度神经网络技术的快速发展，其广泛应用到了计算机视觉，自然语言处理等很多安全敏感领域，自动驾驶系统的研究与开发也取得了巨大突破，成为汽车产业迎接智能时代的核心动力之一。但是近年来，不断有自动驾驶相关的车祸发生，事故分析指出发生原因都是自动驾驶系统的不同程度误判导致。与任何依赖于软件算法的系统一样，自动驾驶系统也存在使用风险，会出现错误或意外的极端情况。一旦出现行为预测问题，可能会导致致命碰撞等严重后果。因此，在自动驾驶被部署之前，自动驾驶系统必须得到充分的检测以尽可能地消除安全隐患。

深度神经网络模型测试经典的方法是收集足够多带标签的测试数据，以评估模型的预测准确性。然而，自动驾驶系统的输入样本是由不同的传感器拍摄得到的，输入空间非常大，很难手动收集所有可能的输入来触发自动驾驶系统的每一个可行逻辑，并且在仅有依靠手动收集的少量测试样本中还存在类别不平衡性、标注不确定性、神经元覆盖率低等问题，严重阻碍了对自动驾驶系统的测试。

基于上述原因，本发明提出一种神经元覆盖引导式测试方法来解决自动驾驶系统面临的这类测试问题，从而自动化地生成自动驾驶测试用例集，提高测试效率。

发明内容

本发明解决的问题是：自动驾驶系统测试中大规模高质量的测试样本严重稀缺，且人工手动收集和筛选测试样本效率低，导致自动驾驶系统测试用例不足，存在神经元覆盖率低、耗时长等问题。如何充分测试与验证安全敏感的自动驾驶系统已成为当前面临的主要挑战。本发明将神经元覆盖引入到了自动驾驶测试中，自动生成具备高神经元覆盖率且容易被预测错误的测试用例，增扩原始测试数据集，挖掘自动驾驶系统中存在的潜在缺陷和不合理行为，以提高深度神经网络技术下的自动驾驶系统的模型鲁棒性。其特点在于主要包括以下步骤：

步骤1，获取自动驾驶系统采集的光学传感器图像数据和相应的标签信息，作为原始的测试样本，对图像的斑点特征数目进行检测。

步骤2，根据图像斑点特征数目和标签信息对测试样本进行聚类分析，从每一类中选取等量的测试样本保存至种子样本集合中。

步骤3，选取目标自动驾驶预测模型，将定量种子样本输入至预训练后的模型中，记录模型预测值，若转向角的输出值与对应种子样本的原始标签误差超过设定范围值，则舍弃此种子样本，否则进行步骤4。

步骤4，针对筛选出的种子样本，选择在过去测试中经常和很少覆盖到的靶向神经元，计算损失值，更新神经元覆盖率。

步骤5，以最大化神经元覆盖率和使得自动驾驶系统预测不一致为目标，将在种子样本上的修改转为为一个优化问题，采用梯度上升法求解。

步骤6，为种子样本添加三种不同类型的约束条件，设置图像部分的宽度、遮挡、污垢模拟图像数据的不同环境，对求解优化问题加以约束。

步骤7，设置梯度迭代次数，开始执行梯度上升引导的局部搜索，找到最大化所需目标的新输入，使种子样本进入迭代过程。

步骤8，重复执行步骤7，直至最大迭代次数或预测转向值与对应种子样本的原始标签误差达到预设条件，生成目标模型新的测试样本。

步骤9，循环执行步骤3-7，直至生成目标模型的测试样本集合，将不同模型的测试样本共同组成面向自动驾驶系统的神经元覆盖引导式测试样本集。

步骤10，使用最终生成的测试样本集重新训练自动驾驶预测模型，计算并评估自动驾驶系统的预测准确率。

其中步骤1以斑点信息作为图像的重要特征，采用LoG算法检测测试样本的斑点特征数目，步骤2采用K-Means算法依据斑点特征和标签信息对测试样本集进行聚类，使种子样本从每一个类别中等量选取。步骤5中所述优化问题定义为obj_joint＝max((c_i-c)+λ(f_n(x))，c_i是目标模型将种子样本x预测为类别i的概率，c是种子样本x的真实标签，f_n(x)是在种子样本x下神经元n的输出值，λ是用来平衡两个目标优化问题的平衡参数。

本发明的特点在于：

1.将图像斑点检测技术与基于神经元覆盖的测试方法结合应用于自动驾驶系统的测试用例生成中。

2.实现自动化生成自动驾驶系统新的测试用例，应用于自动驾驶模型的训练中以增强模型鲁棒性。

与现有技术相比，本发明的有益效果为：

本发明的基于神经元覆盖引导式测试方法，免去了多个功能相似的模型进行交叉验证的过程，缩短了测试用例生成时间，且提升神经元覆盖率更加明显。相比于基于对抗生成测试用例的方法更容易实现，保证了种子样本队列的多样性。实验采用与现有基于覆盖方法DeepXplore相同的自动驾驶模型和数据集，分别使用两方法在测试数据集HMB3上生成100个测试样本，比较两者的平均神经元覆盖率提升、平均生成时间、预测错误的样本数量以评判测试用例质量，实验结果见表1，证实了该方法的有效性。

表1DeepXplore方法与本发明方法测试实验对比结果

通过以上实例验证和分析表明,在相同的参数设置和约束条件下，本发明方法相比于现有基于覆盖的测试方法平均提升神经元覆盖率1.3％，平均生成时间仅是其1/12，最好生成致使模型误判测试样本数从20个增加至52个，可以发现模型更多的错误行为。说明本发明方法在提升神经元覆盖率，更短时间内生成测试样本和在相同的原始测试样本限制下发现更多的系统错误行为方面具有较大优势。

附图说明

附图1为面向自动驾驶系统的神经元覆盖引导式测试方法流程示意图。

具体实施方式

为了使本发明的目的，技术方案和优点更加明确，下面将结合具体实例和附图1对本发明作进一步详细描述，具体包括以下步骤：

1.获取自动驾驶系统预测模型与图像数据集，具体包括：

1.1收集图像数据集，获取Udacity自动驾驶数据集HMB3并保存；

1.2收集自动驾驶系统的预测模型，获取DAVE-orig、DAVE-norminit、DAVE-dropout三个基于NVIDIADAVE-2的驾驶系统模型。

2.预处理，具体包括：

2.1选取步骤1.1中收集的某个数据集，将图片格式处理为模型输入需要的格式；

2.2选取步骤2.2中处理好的数据集，根据标签列表为图片标注相应的标签值。

3.获取种子样本，具体包括：

3.1针对处理好的数据集进行图像斑点检测，记录各个图片的斑点数目。斑点检测通过计算图像与卷积函数的相似性实现，将待测图像假设为一个随机变量x的密度函数I(x,y)与高斯拉普拉斯函数进行卷积运算，当两个函数的分布情况相似时获得较大的函数响应值。当待测图像的拉普拉斯响应达到越大时检测到的图像像素点则为图像特征斑点，计算公式为：其中G_σ(x,y)为标准差，是σ的二维高斯函数。

3.2根据图像斑点数目和相应标签对数据集进行聚类分析，设置类别个数为六类，在每类别中选取50个样本，共300个种子样本构成种子样本集T。聚类分析依据最大期望算法，不断迭代样本与特征中心的距离均值，均值误差公式为Σ^k _i＝1Σ_x∈ci|d(x,c_i)|²，式中d为样本x和聚类中心c_i之间的欧式距离，当到达迭代次数或均值向量不再改变时，模型构建完成，输出聚类结果。

4.筛选种子样本，具体包括：

4.1选取步骤1.2中收集的某个自动驾驶模型作为目标模型F，并将种子样本集T输入至模型中进行车辆的转向角预测，记录预测值；

4.2初始化神经元覆盖率表，记录每个种子样本的初始神经元覆盖率，计算计算公式为其中N表示深度神经网络模型中神经元个数，t为激活函数阈值，T为种子样本集合，f(x,n)表示种子样本x在神经元n上的输出。

4.3将种子样本的预测值与原始标签值进行比较，记录种子样本的预测差异值，若差值超出预设范围0.2，则视为已出现预测误差的测试用例，舍弃样本；若未超出预设范围，则保留样本至新批次。

5.建立优化问题，具体包括：

5.1根据神经元选择策略从新批次的种子样本中选取过去经常和很少覆盖的神经元，作为靶向神经元并计算其损失值；

5.2联合步骤4.3所述预测差异值和步骤4.2所述神经元覆盖率构建种子样本的目标优化问题，定义为obj_joint＝max((c_i-c)+λ(f_n(x))，其中c_i是目标模型将种子样本x预测为类别i的概率，c是种子样本x的真实标签，f_n(x)是在种子样本x下神经元n的输出值，λ是用来平衡两个目标优化问题的平衡参数，设置为0.1。

6.求解优化问题，具体包括：

6.1为种子样本添加三种不同类型的约束条件，设置图像部分的宽度、遮挡、污垢模拟图像数据的不同环境，对求解梯度加以约束。具体通过限制图像像素的加减来模拟光照强弱情况；通过在种子样本任意位置上添加一个小矩形R来模拟被遮挡的情况；通过在种子样本的任意部分添加一个或多个碎片S模拟污垢镜头下拍摄的图像完成约束。

6.2设置梯度迭代次数，开始执行梯度上升引导的局部搜索，找到最大化所需目标的新输入，使种子样本进入迭代过程。梯度上升法沿函数梯度方向探寻最大值，其求解公式为：w:＝w+α▽wf(w)，其中α为学习率，▽为w的梯度。

6.3重复执行步骤6.2，直至最大迭代次数或测试样本的模型预测值与其原始标签的误差达到预设条件，得到目标模型新的测试样本，计算并记录新测试样本的模型预测值和神经元覆盖信息。

7.循环执行步骤4-6，直至生成目标模型的测试样本集合，将不同模型的测试样本共同组成面向自动驾驶系统的神经元覆盖引导式测试样本集。

8.使用最终生成的测试样本集重新训练自动驾驶预测模型，计算并评估自动驾驶系统的预测准确率。

9.以上所述的实例对本发明的技术方案进行了详细说明，应理解的是以上所述仅为本发明的具体实例，并不用于限制本发明，凡在本发明的原则范围内所做的任何修改、补充和等同替换等，均应包含在本发明的保护范围之内。

Claims

1.一种面向自动驾驶系统的神经元覆盖引导式测试方法，其特征在于所述方法包括如下步骤：

步骤1，获取自动驾驶系统采集的光学传感器图像数据和相应的标签信息，作为原始的测试样本，对图像的斑点特征数目进行检测；

步骤2，根据图像斑点特征数目和标签信息对测试样本进行聚类分析，从每一类中选取等量的测试样本保存至种子样本集合中；

步骤3，选取目标自动驾驶预测模型，将定量种子样本输入至预训练后的模型中，记录模型预测值，若转向角的输出值与对应种子样本的原始标签误差超过设定范围值，则舍弃此种子样本，否则进行步骤4；

步骤4，针对筛选出的种子样本，选择在过去测试中经常和很少覆盖到的靶向神经元，计算损失值，更新神经元覆盖率；

步骤5，以最大化神经元覆盖率和使得自动驾驶系统预测不一致为目标，将在种子样本上的修改转为为一个优化问题，采用梯度上升法求解；

步骤6，为种子样本添加三种不同类型的约束条件，设置图像部分的宽度、遮挡、污垢模拟图像数据的不同环境，对求解优化问题加以约束；

步骤7，设置梯度迭代次数，开始执行梯度上升引导的局部搜索，找到最大化所需目标的新输入，使种子样本进入迭代过程；

步骤8，重复执行步骤7，直至最大迭代次数或预测转向值与对应种子样本的原始标签误差达到预设条件，生成目标模型新的测试样本；

步骤9，循环执行步骤3-7，直至生成目标模型的测试样本集合，将不同模型的测试样本共同组成面向自动驾驶系统的神经元覆盖引导式测试样本集；

2.根据权利要求1所述的面向自动驾驶系统的神经元覆盖引导式测试方法，其特征在于：步骤2中以斑点信息作为图像的重要特征，采用LoG算法检测测试样本的斑点特征数目，然后采用K-Means算法依据斑点特征和标签信息对测试样本集进行聚类，使种子样本从每一个类别中等量选取。

3.根据权利要求1所述的面向自动驾驶系统的神经元覆盖引导式测试方法，其特征在于：步骤5中所述优化问题定义为obj_joint＝max((c_i-c)+λ(f_n(x))，c_i是目标模型将种子样本x预测为类别i的概率，c是种子样本x的真实标签，f_n(x)是在种子样本x下神经元n的输出值，λ是用来平衡两个目标优化问题的平衡参数。