CN109948449A

CN109948449A - 一种信息处理方法、装置及存储介质

Info

Publication number: CN109948449A
Application number: CN201910130656.8A
Authority: CN
Inventors: 高飞
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Baidu Online Network Technology Beijing Co Ltd; Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2019-02-21
Filing date: 2019-02-21
Publication date: 2019-06-28
Anticipated expiration: 2039-02-21
Also published as: CN109948449B

Abstract

本发明实施例提出一种信息处理方法、装置及存储介质，其中，所述方法包括：根据样本提取策略和第一样本集得到第二样本集；将所述第二样本集根据变道聚类策略进行聚类处理，得到至少两个聚类信息的情况下，将所述至少两个聚类信息与车辆实际驾驶中得到的至少两个第一数据进行比对，根据比对结果得到第一反馈样本；根据所述第一反馈样本，定位出与车辆实际驾驶的道路测试中不相符合的失效场景；根据所述第一反馈样本所定位出的失效场景对已有评价回归模型进行修正，根据修正后的评价回归模型进行变道选择。采用本发明实施例能提高变道的准确率。

Description

一种信息处理方法、装置及存储介质

技术领域

本发明涉及信息处理技术领域，尤其涉及一种信息处理方法、装置及存储介质。

背景技术

信息处理的一种应用场景是在车辆自动驾驶中，为了实现车辆自动行驶的运动规划，需要对车辆运动的轨迹进行评价。车辆变道是运动轨迹中重要的一环。相关技术中无法自动定位与实际道路测试不相符合的失效场景，也就是说不能有效的定位出问题所在(坏例)并将其挑出。如果不能定位出问题所在，会使得车辆变道决策不准确，则基于该车辆变道决策进行变道选择时变道准确率下降，从而最终难以保证在实际驾驶过程中变道结果的可行性和安全性。

发明内容

本发明实施例提供一种信息处理方法、装置及存储介质，以解决现有技术中的一个或多个技术问题。

第一方面，本发明实施例提供了一种信息处理方法，所述方法包括：

根据样本提取策略和第一样本集得到第二样本集；

将所述第二样本集根据变道聚类策略进行聚类处理，得到至少两个聚类信息的情况下，将所述至少两个聚类信息与车辆实际驾驶中得到的至少两个第一数据进行比对，根据比对结果得到第一反馈样本；

根据所述第一反馈样本，定位出与车辆实际驾驶的道路测试中不相符合的失效场景；

根据所述第一反馈样本所定位出的失效场景对已有评价回归模型进行修正，根据修正后的评价回归模型进行变道选择。

一种实施方式中，根据样本提取策略和第一样本集得到第二样本集，包括：

获取构成所述已有评价回归模型的神经网络，所述神经网络包括输入层、中间层和输出层；

将所述第一样本集中对应所述输入层和所述输出层的全部样本提取出来，作为第一子样本；

将所述第一样本集中对应所述中间层的部分样本提取出来，作为第二子样本；

根据所述第一子样本和所述第二子样本得到所述第二样本集。

一种实施方式中，将所述至少两个聚类信息与车辆实际驾驶中得到的至少两个第一数据进行比对，根据比对结果得到第一反馈样本，包括：

从所述至少两个第一数据中，查询到与每个聚类信息不相匹配的第一目标数据；

将所述第一目标数据作为第一反馈样本。

一种实施方式中，所述方法还包括：

将所述第二样本集根据变道聚类策略进行聚类处理，未得到聚类信息的情况下，当前场景为车辆实际驾驶中的边界场景；

将所述边界场景作为第二反馈样本；

将所述第二反馈样本添加入所述第一反馈样本中。

一种实施方式中，所述方法还包括：

从所述至少两个第一数据中，查询到与每个聚类信息相匹配的第二目标数据；

将所述第一反馈样本和所述第二目标数据输入所述已有评价回归模型，根据打分参考指标进行运算，得到对应所述第一反馈样本的第一分值和对应所述第二目标数据的第二分值；

将所述第一反馈样本及对应的所述第一分值、第二目标数据及对应的所述第二分值添加入所述第二样本集中，得到第三样本集。

一种实施方式中，所述方法还包括：

将所述第三样本集根据变道聚类策略进行聚类处理，得到用于表征向左变道的第一子类、用于表征向右变道的第二子类和用于表征直行的第三子类；

根据所述第一子类、所述第二子类和所述第三子类，对构成所述已有车辆变道模型的神经网络中的各对应子网络进行调整。

一种实施方式中，所述方法还包括：

根据所述第一反馈样本所定位出的失效场景对已有车辆变道模型进行修正；

根据修正后的车辆变道模型和修正后的评价回归模型进行变道选择。

第二方面，本发明实施例提供了一种信息处理装置，所述装置包括：

样本处理单元，用于根据样本提取策略和第一样本集得到第二样本集；

第一反馈样本处理单元，用于将所述第二样本集根据变道聚类策略进行聚类处理，得到至少两个聚类信息的情况下，将所述至少两个聚类信息与车辆实际驾驶中得到的至少两个第一数据进行比对，根据比对结果得到第一反馈样本；

定位单元，用于根据所述第一反馈样本，定位出与车辆实际驾驶的道路测试中不相符合的失效场景；

第一变道选择单元，用于根据所述第一反馈样本所定位出的失效场景对已有评价回归模型进行修正，根据修正后的评价回归模型进行变道选择。

一种实施方式中，所述样本处理单元，进一步用于：

一种实施方式中，所述第一反馈样本处理单元，进一步用于：

将所述第一目标数据作为第一反馈样本。

一种实施方式中，所述方法还包括：

聚类处理单元，用于将所述第二样本集根据变道聚类策略进行聚类处理，未得到聚类信息的情况下，当前场景为车辆实际驾驶中的边界场景；

第二反馈样本处理单元，用于将所述边界场景作为第二反馈样本；

第一样本添加单元，用于将所述第二反馈样本添加入所述第一反馈样本中。

一种实施方式中，所述装置还包括：

第一运算单元，用于从所述至少两个第一数据中，查询到与每个聚类信息相匹配的第二目标数据；

第二运算单元，用于将所述第一反馈样本和所述第二目标数据输入所述已有评价回归模型，根据打分参考指标进行运算，得到对应所述第一反馈样本的第一分值和对应所述第二目标数据的第二分值；

第二样本添加单元，用于将所述第一反馈样本及对应的所述第一分值、第二目标数据及对应的所述第二分值添加入所述第二样本集中，得到第三样本集。

一种实施方式中，所述装置还包括：

子类处理单元，用于将所述第三样本集根据变道聚类策略进行聚类处理，得到用于表征向左变道的第一子类、用于表征向右变道的第二子类和用于表征直行的第三子类；

调整单元，用于根据所述第一子类、所述第二子类和所述第三子类，对构成所述已有车辆变道模型的神经网络中的各对应子网络进行调整。

一种实施方式中，所述装置还包括：

修正单元，用于根据所述第一反馈样本所定位出的失效场景对已有车辆变道模型进行修正；

第二变道选择单元，用于根据修正后的车辆变道模型和修正后的评价回归模型进行变道选择。

第三方面，本发明实施例提供了一种信息处理装置，所述装置的功能可以通过硬件实现，也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。

在一个可能的设计中，所述装置的结构中包括处理器和存储器，所述存储器用于存储支持所述装置执行任一上述信息处理方法的程序，所述处理器被配置为用于执行所述存储器中存储的程序。所述装置还可以包括通信接口，用于与其他设备或通信网络通信。

第四方面，本发明实施例提供了一种计算机可读存储介质，用于存储信息处理装置所用的计算机软件指令，其包括用于执行任一上述信息处理方法所涉及的程序。

上述技术方案中的一个技术方案具有如下优点或有益效果：

本发明实施例根据样本提取策略和第一样本集得到第二样本集，将所述第二样本集根据变道聚类策略进行聚类处理，得到至少两个聚类信息的情况下，将所述至少两个聚类信息与车辆实际驾驶中得到的至少两个第一数据进行比对，根据比对结果得到第一反馈样本。根据所述第一反馈样本，定位出与车辆实际驾驶的道路测试中不相符合的失效场景，根据所述第一反馈样本所定位出的失效场景，根据所述第一反馈样本所定位出的失效场景对已有评价回归模型进行修正，根据修正后的评价回归模型进行变道选择。由于将聚类处理得到聚类信息与车辆实际驾驶中的数据比对，可以得到第一反馈样本(坏例)，根据第一反馈样本可以定位出与车辆实际驾驶的道路测试中不相符合的失效场景，找到问题所在(坏例)并将其挑出。通过所定位出的失效场景对已有评价回归模型进行修正，根据修正后的评价回归模型进行变道选择，会提高车辆变道的准确率。

上述概述仅仅是为了说明书的目的，并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外，通过参考附图和以下的详细描述，本发明进一步的方面、实施方式和特征将会是容易明白的。

附图说明

在附图中，除非另外规定，否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解，这些附图仅描绘了根据本发明公开的一些实施方式，而不应将其视为是对本发明范围的限制。

图1示出根据本发明实施例的信息处理方法的流程图。

图2示出根据本发明实施例的样本筛选的示意图。

图3示出根据本发明实施例的信息处理方法的流程图。

图4示出根据本发明实施例的信息处理方法的流程图。

图5示出根据本发明实施例的信息处理方法的流程图。

图6示出根据本发明实施例的信息处理装置的结构框图。

图7示出根据本发明实施例的信息处理装置的结构框图。

图8示出根据本发明实施例的信息处理装置的结构框图。

具体实施方式

在下文中，仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样，在不脱离本发明的精神或范围的情况下，可通过各种不同方式修改所描述的实施例。因此，附图和描述被认为本质上是示例性的而非限制性的。

图1示出根据本发明实施例的信息处理方法的流程图。如图1所示，该流程包括：

步骤101、根据样本提取策略和第一样本集得到第二样本集。

步骤102、将所述第二样本集根据变道聚类策略进行聚类处理，得到至少两个聚类信息的情况下，将所述至少两个聚类信息与车辆实际驾驶中得到的至少两个第一数据进行比对，根据比对结果得到第一反馈样本。

步骤103、根据所述第一反馈样本，定位出与车辆实际驾驶的道路测试中不相符合的失效场景。

步骤104、根据所述第一反馈样本所定位出的失效场景对已有评价回归模型进行修正，根据修正后的评价回归模型进行变道选择。

一实施方式中，考虑到真人驾驶过程中得到的第一场景信息只能反映人类真实场景，而机器仿真模拟驾驶过程中得到的第二场景信息只能反映动态仿真结果，可二者都不代表真实驾驶，不可能100％覆盖所有数据，因此，需要将二者融合，则第一样本集，由采集真人驾驶过程中得到的第一场景信息和采集机器仿真模拟驾驶过程中得到的第二场景信息所构成。融合第一场景信息和第二场景信息所构成的第一样本集可能不准确，因为在仿真模拟中感知本就有可能是不准的，比如，可能仿真模拟中的感知模块本身就有异常，如有噪声，那可能噪声就会影响感知结果，导致感知不准确。又如，仿真里，障碍物很远就能看到，可在真实的世界中，很远的障碍物车辆上的传感器感知不到，这部分与实际驾驶场景不相符合，需要过滤掉这部分场景，也就是说，对于感知不准确的，都需要过滤掉，以匹配实际驾驶场景，过滤掉这些不匹配实际驾驶场景后得到的第一样本集会相对准确。

对于第一场景信息，是对车辆在行驶车道上的实际行驶情况进行图像采集，根据采集结果得到的第一场景信息，是以每帧为单位，采集车辆在任一车道上行驶所得到的信息。具体的，该信息除了包括车辆周边的环境信息、车辆行驶路线、障碍物信息(静态或动态的障碍物信息)，还包括专业司机的驾驶行为。其中，对于驾驶过程中的驾驶行为进行特征提取可以得到特征信息，比如，加速度、速度、限速、对应的时间戳和位置信息等。对如加速度、速度、限速、对应的时间戳和位置信息等特征信息进行识别后加标签，得到如左变道、右变道或直行的标签信息。第一场景信息至少包括车辆周边的环境信息、车辆行驶路线、障碍物信息(静态或动态的障碍物信息)、及由分析专业司机的驾驶行为所得到的特征信息和标签信息。这里的限速，是当前车辆(如主车)发现在当前车辆行驶路线上有其他车辆(如前车)，若主车的速度是80迈，则为了避免碰撞，需要限速为50迈，以拉开主车和前车间的距离，确保彼此的行驶安全，避免追尾。

对于第二场景信息，是对车辆在行驶车道上的行驶情况进行模拟仿真后进行图像采集，根据采集结果得到第二场景信息，至少包括车辆周边的环境信息、车辆行驶路线、障碍物信息(静态或动态的障碍物信息)，需要利用由分析专业司机的驾驶行为所得到的特征信息和标签信息，由此，该特征信息和标签信息也涵盖在第二场景信息中，模拟仿真是基于这些信息来模拟专业司机的驾驶行为，看能输出得到哪些数据，由于一个是真人驾驶，一个是对真人驾驶的仿真，二者存在一定差异。

过滤掉上述不匹配实际驾驶场景后得到的第一样本集，即便已经相对准确了，可仍然与实际驾驶场景存在偏差。比如，当存在失效场景却不能及时定位出该失效场景，这就容易出现偏差，这个失效场景需要及时被找出，首先根据样本提取策略和上述第一样本集得到第二样本集。具体的，获取构成已有车辆变道模型的神经网络，所述神经网络包括输入层、中间层和输出层。如图2所示，图2为样本筛选的示意图，将该第一样本集11中对应输入层121和输出层123的全部样本提取出来，作为第一子样本131，将第一样本集131中对应中间层122的部分样本提取出来，作为第二子样本132。根据第一子样本131和第二子样本132得到第二样本集14。将该第二样本集根据变道聚类策略进行聚类处理，得到至少两个聚类信息的情况下，将至少两个聚类信息与车辆实际驾驶中得到的至少两个第一数据进行比对，根据比对结果得到第一反馈样本。根据第一反馈样本，定位出与车辆实际驾驶的道路测试中不相符合的失效场景。根据第一反馈样本所定位出的失效场景对已有评价回归模型进行修正，根据修正后的评价回归模型进行变道选择。采用本发明实施例，由于可以根据反馈样本自动定位与实际道路测试不相符合的失效场景，根据失效场景继续改进并提升利用模型变道的准确性。

图3示出根据本发明实施例的信息处理方法的流程图。如图3所示，该流程包括：

步骤201、根据样本提取策略和第一样本集得到第二样本集。

步骤202、将第二样本集根据变道聚类策略进行聚类处理，得到至少两个聚类信息的情况下，将至少两个聚类信息与车辆实际驾驶中得到的至少两个第一数据进行比对，从至少两个第一数据中，查询到与每个聚类信息不相匹配的第一目标数据，将第一目标数据作为第一反馈样本。

一示例中，根据第二样本集，分别在直行、向左变道、向右变道三大类中进行(离线)小类别聚类，以得到聚类结果，具体聚类方法可以选择K-means或层次聚类等。还可以对第二样本集中的样本进行编号，在样本编号、输入特征层、关键中间层输出、输出概率层、车道方向、子类编号间建立关联索引。

一示例中，根据聚类信息(如离线的聚类信息)与车辆实际行驶的第一数据(如在线的数据)进行比较，以得到第二样本集中数据与已有类别的从属关系，以及不属于任何子类的异常新数据。根据聚类信息(如离线的聚类信息)与辆实际行驶的第一数据(如在线的数据)进行比较的目的是：看某个场景是否符合聚类得到的该聚类信息，至少包括2个判断分支：其一，如果符合聚类信息，则为好例，好例不用作反馈；其二：如果不符合聚类信息，则为bad case，bad case用作反馈。通过比较bad case和好例与特征空间索引通过聚类算法在线预测部分来区分是样本类型不存在还是边界场景或其他情况。将该bad case作为反馈样本，再和之前已有第二样本集中的数据再一起重新进行训练。

步骤203、根据第一反馈样本，定位出与车辆实际驾驶的道路测试中不相符合的失效场景。

步骤204、根据第一反馈样本所定位出的失效场景对已有评价回归模型进行修正，根据修正后的评价回归模型进行变道选择。

一示例中，如图2所示，将该第一样本集11中对应输入层121和输出层123的全部样本提取出来，作为第一子样本131，将第一样本集131中对应中间层122的部分样本提取出来，作为第二子样本132。根据第一子样本131和第二子样本132得到第二样本集14。根据该第二样本集进行聚类处理后将多个聚类信息与车辆实际驾驶中得到的多个第一数据进行比对，多个第一数据中包括还包括与聚类信息不相匹配的数据，将与聚类信息相匹配的数据作为目标数据，将目标数据作为第一反馈样本。根据第一反馈样本，定位出与车辆实际驾驶的道路测试中不相符合的失效场景。根据第一反馈样本所定位出的失效场景对已有评价回归模型进行修正，根据修正后的评价回归模型进行变道选择。

图4示出根据本发明实施例的信息处理方法的流程图。如图4所示，该流程包括：

步骤301、根据样本提取策略和第一样本集得到第二样本集。

步骤302、将第二样本集根据变道聚类策略进行聚类处理，得到至少两个聚类信息的情况下，将至少两个聚类信息与车辆实际驾驶中得到的至少两个第一数据进行比对，从至少两个第一数据中，查询到与每个聚类信息不相匹配的第一目标数据，将第一目标数据作为第一反馈样本。

步骤303、将第二样本集根据变道聚类策略进行聚类处理，未得到聚类信息的情况下，当前场景为车辆实际驾驶中的边界场景，将该边界场景作为第二反馈样本。

步骤304、根据第一反馈样本和第二反馈样本，定位出与车辆实际驾驶的道路测试中不相符合的失效场景。

对于上述聚类和得到不止一种反馈样本的一示例中，根据第二样本集，分别在直行、向左变道、向右变道三大类中进行(离线)小类别聚类，以得到聚类结果，具体聚类方法可以选择K-means或层次聚类等。还可以对第二样本集中的样本进行编号，在样本编号、输入特征层、关键中间层输出、输出概率层、车道方向、子类编号间建立关联索引。根据聚类信息(如离线的聚类信息)与车辆实际行驶的第一数据(如在线的数据)进行比较，以得到第二样本集中数据与已有类别的从属关系，以及不属于任何子类的异常新数据。根据聚类信息(如离线的聚类信息)与辆实际行驶的第一数据(如在线的数据)进行比较的目的是：看某个场景是否符合聚类得到的该聚类信息，至少包括2个判断分支：其一，如果符合聚类信息，则为好例，好例不用作反馈；其二：如果不符合聚类信息，则为bad case，bad case用作反馈。进一步的，一个bad case特例是有场景没聚类信息的情况，通常是对应边界场景。对于这种情况，也是会用作反馈。通过比较bad case和好例与特征空间索引通过聚类算法在线预测部分来区分是样本类型不存在还是边界场景或其他情况。将该bad case和/或该bad case特例都作为反馈样本，将反馈样本输入第二样本集中。由于第二样本集中已与的数据无法定位失效场景，不能全面覆盖真人驾驶场景，因此，通过输入第二样本集的反馈样本进行数据修复和补齐后作为新的训练数据，将新的训练数据用于模型(比如，对已有车辆变道模型)优化，可以输出得到更为精确的处理结果，使得根据优化后的车辆变道模型进行的变道准确度会大大提高。

步骤305、根据第一反馈样本和第二反馈样本所定位出的失效场景对已有评价回归模型进行修正，根据修正后的评价回归模型进行变道选择。

图5示出根据本发明实施例的信息处理方法的流程图。如图5所示，该流程包括：

步骤401、根据样本提取策略和第一样本集得到第二样本集。

步骤402、将第二样本集根据变道聚类策略进行聚类处理，得到至少两个聚类信息的情况下，将至少两个聚类信息与车辆实际驾驶中得到的至少两个第一数据进行比对，从至少两个第一数据中，查询到与每个聚类信息不相匹配的第一目标数据，将第一目标数据作为第一反馈样本。

步骤403、将第二样本集根据变道聚类策略进行聚类处理，得到至少两个聚类信息的情况下，将至少两个聚类信息与车辆实际驾驶中得到的至少两个第一数据进行比对，从至少两个第一数据中，查询到与每个聚类信息相匹配的第二目标数据。

这里，第二目标数据是好例，第一目标数据是bad case。

步骤404、将所述第一反馈样本和所述第二目标数据输入所述已有评价回归模型，根据打分参考指标进行运算，得到对应所述第一反馈样本的第一分值和对应所述第二目标数据的第二分值。

步骤405、将所述第一反馈样本及对应的所述第一分值、第二目标数据及对应的所述第二分值添加入所述第二样本集中，得到第三样本集。

一实施方式中，采用评价回归模型，将反馈样本输入评价回归模型并进行优化，提高模型效果。具体的，将输出的比较结果(好例或坏例)打分，出分值，再反馈回去用于继续训练模型。打分参考指标可以包括：概率分布熵，以及其它关心的一项或多项体感或驾驶合理性指标的组合(如是否冗余变道，与其它障碍物间的安全距离和安全系数，行驶速度，变道线型最大曲率等)。一示例中，打分参考指标是概率分布熵，则运算得到反馈样本的概率分布；根据所述反馈样本的概率分布得到反馈熵(概率分布熵的一个示例)；根据所述反馈熵进行是否符合车辆实际驾驶的道路测试，熵越大说明这个变道模型中的好例更好，也就是说，数据越精确。

一实施方式中，将上述第三样本集根据变道聚类策略进行聚类处理，得到用于表征向左变道的第一子类、用于表征向右变道的第二子类和用于表征直行的第三子类；根据所述第一子类、所述第二子类和所述第三子类，对构成所述已有车辆变道模型的神经网络中的各对应子网络进行调整。

图6示出根据本发明实施例的信息处理方法的流程图。如图6所示，该流程包括：

步骤501、根据样本提取策略和第一样本集得到第二样本集。

步骤502、将第二样本集根据变道聚类策略进行聚类处理，得到至少两个聚类信息的情况下，将至少两个聚类信息与车辆实际驾驶中得到的至少两个第一数据进行比对，从至少两个第一数据中，查询到与每个聚类信息不相匹配的第一目标数据，将第一目标数据作为第一反馈样本。

步骤503、根据第一反馈样本，定位出与车辆实际驾驶的道路测试中不相符合的失效场景。

步骤504、根据第一反馈样本所定位出的失效场景对已有评价回归模型进行修正。

步骤505、根据所述第一反馈样本所定位出的失效场景对已有车辆变道模型进行修正。

需要指出的是，也可以先执行步骤505再执行步骤504，顺序并不分先后，也就是说，通过第一反馈样本所定位出的失效场景既可以对已有评价回归模型进行修正，还可以对已有车辆变道模型进行修正，结合这两类被修正的模型进行变道选择，进一步提高了变道准确率。

步骤506、根据修正后的车辆变道模型和修正后的评价回归模型进行变道选择。

图7示出根据本发明实施例的信息处理装置的结构框图，如图7所示，所述装置包括：样本处理单元21，用于根据样本提取策略和第一样本集得到第二样本集；第一反馈样本处理单元22，用于将所述第二样本集根据变道聚类策略进行聚类处理，得到至少两个聚类信息的情况下，将所述至少两个聚类信息与车辆实际驾驶中得到的至少两个第一数据进行比对，根据比对结果得到第一反馈样本；定位单元23，用于根据所述第一反馈样本，定位出与车辆实际驾驶的道路测试中不相符合的失效场景；第一变道选择单元24，用于根据所述第一反馈样本所定位出的失效场景对已有评价回归模型进行修正，根据修正后的评价回归模型进行变道选择。

一实施方式中，所述样本处理单元，进一步用于：获取构成所述已有评价回归模型的神经网络，所述神经网络包括输入层、中间层和输出层；将所述第一样本集中对应所述输入层和所述输出层的全部样本提取出来，作为第一子样本；将所述第一样本集中对应所述中间层的部分样本提取出来，作为第二子样本；根据所述第一子样本和所述第二子样本得到所述第二样本集。

一实施方式中，所述第一反馈样本处理单元，进一步用于：从所述至少两个第一数据中，查询到与每个聚类信息不相匹配的第一目标数据；将所述第一目标数据作为第一反馈样本。

一实施方式中，所述方法还包括：聚类处理单元，用于将所述第二样本集根据变道聚类策略进行聚类处理，未得到聚类信息的情况下，当前场景为车辆实际驾驶中的边界场景；第二反馈样本处理单元，用于将所述边界场景作为第二反馈样本；第一样本添加单元，用于将所述第二反馈样本添加入所述第一反馈样本中。

一实施方式中，所述装置还包括：第一运算单元，用于从所述至少两个第一数据中，查询到与每个聚类信息相匹配的第二目标数据；第二运算单元，用于将所述第一反馈样本和所述第二目标数据输入所述已有评价回归模型，根据打分参考指标进行运算，得到对应所述第一反馈样本的第一分值和对应所述第二目标数据的第二分值；第二样本添加单元，用于将所述第一反馈样本及对应的所述第一分值、第二目标数据及对应的所述第二分值添加入所述第二样本集中，得到第三样本集。

一实施方式中，所述装置还包括：子类处理单元，用于将所述第三样本集根据变道聚类策略进行聚类处理，得到用于表征向左变道的第一子类、用于表征向右变道的第二子类和用于表征直行的第三子类；调整单元，用于根据所述第一子类、所述第二子类和所述第三子类，对构成所述已有车辆变道模型的神经网络中的各对应子网络进行调整。

一实施方式中，所述装置还包括：修正单元，用于根据所述第一反馈样本所定位出的失效场景对已有车辆变道模型进行修正；第二变道选择单元，用于根据修正后的车辆变道模型和修正后的评价回归模型进行变道选择。

本发明实施例各装置中的各模块的功能可以参见上述方法中的对应描述，在此不再赘述。

图8示出根据本发明实施例的信息处理装置的结构框图。如图8所示，该装置包括：存储器910和处理器920，存储器910内存储有可在处理器920上运行的计算机程序。处理器920执行计算机程序时实现上述实施例中的自动驾驶方法。存储器910和处理器920的数量可以为一个或多个。

该装置还包括：通信接口930，用于与外界设备进行通信，进行数据交互传输。

存储器910可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。

如果存储器910、处理器920和通信接口930独立实现，则存储器910、处理器920和通信接口930可以通过总线相互连接并完成相互间的通信。总线可以是工业标准体系结构(ISA，Industry Standard Architecture)总线、外部设备互连(PCI，PeripheralComponent)总线或扩展工业标准体系结构(EISA，Extended Industry StandardComponent)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示，图7中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

可选的，在具体实现上，如果存储器910、处理器920及通信接口930集成在一块芯片上，则存储器910、处理器920及通信接口930可以通过内部接口完成相互间的通信。

本发明实施例提供了一种计算机可读存储介质，其存储有计算机程序，该程序被处理器执行时实现上述实施例中任一所述的方法。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(RAM)，只读存储器(ROM)，可擦除可编辑只读存储器(EPROM或闪速存储器)，光纤装置，以及便携式只读存储器(CDROM)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本发明各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读存储介质中。所述存储介质可以是只读存储器，磁盘或光盘等。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到其各种变化或替换，这些都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种信息处理方法，其特征在于，所述方法包括：

根据样本提取策略和第一样本集得到第二样本集；

2.根据权利要求1所述的方法，其特征在于，根据样本提取策略和第一样本集得到第二样本集，包括：

3.根据权利要求1所述的方法，其特征在于，将所述至少两个聚类信息与车辆实际驾驶中得到的至少两个第一数据进行比对，根据比对结果得到第一反馈样本，包括：

将所述第一目标数据作为第一反馈样本。

4.根据权利要求1所述的方法，其特征在于，所述方法还包括：

将所述边界场景作为第二反馈样本；

将所述第二反馈样本添加入所述第一反馈样本中。

5.根据权利要求1至4任一项所述的方法，其特征在于，所述方法还包括：

6.根据权利要求5所述的方法，其特征在于，所述方法还包括：

7.根据权利要求1所述的方法，其特征在于，所述方法还包括：

8.一种信息处理装置，其特征在于，所述装置包括：

9.根据权利要求8所述的装置，其特征在于，所述样本处理单元，进一步用于：

10.根据权利要求8所述的装置，其特征在于，所述第一反馈样本处理单元，进一步用于：

将所述第一目标数据作为第一反馈样本。

11.根据权利要求8所述的装置，其特征在于，所述装置还包括：

12.根据权利要求8至11任一项所述的装置，其特征在于，所述装置还包括：

13.根据权利要求12所述的装置，其特征在于，所述装置还包括：

14.根据权利要求8所述的装置，其特征在于，所述装置还包括：

15.一种信息处理装置，其特征在于，所述装置包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如权利要求1至7中任一项所述的方法。

16.一种计算机可读存储介质，其存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1至7中任一项所述的方法。