CN115923833A

CN115923833A - 车辆的拟人化决策控制方法、装置、车辆及存储介质

Info

Publication number: CN115923833A
Application number: CN202211175708.1A
Authority: CN
Inventors: 邱利宏; 王晟; 刘闯
Original assignee: Chongqing Changan Automobile Co Ltd
Current assignee: Chongqing Changan Automobile Co Ltd
Priority date: 2022-09-26
Filing date: 2022-09-26
Publication date: 2023-04-07

Abstract

本申请涉及一种车辆的拟人化决策控制方法、装置、车辆及存储介质，其中，方法包括：获取当前交通环境下多目标车辆的车辆行为认知、预测轨迹和危险态势评估结果；根据多目标车辆的车辆行为认知、预测轨迹和危险态势评估结果生成自动驾驶车辆的规划路径和规划速度；基于自动驾驶车辆的规划路径和规划速度生成自动驾驶车辆的拟人化决策结果，并控制自动驾驶车辆执行拟人化决策结果对应的行驶动作。本申请根据车辆行为认知、轨迹预测及危险态势评估结果对车辆进行路径和速度规划，生成车辆的拟人化决策，以控制车辆执行相应的操作，从而有效改善了车辆环境认知和危险态势评估能力，在保障车辆安全性能的同时，提升了车辆的智能化和人性化水平。

Description

车辆的拟人化决策控制方法、装置、车辆及存储介质

技术领域

本申请涉及自动驾驶技术领域，特别涉及一种车辆的拟人化决策控制方法、装置、车辆及存储介质。

背景技术

无人驾驶车辆拟人化决策的基本内涵是车的决策执行，接近自然驾驶人的心理预期。拟人化决策一般涉及三个方面的关键技术。分别为：多维度行车风险态势评估模型及量化；自主决策与规划方法，对于复杂交通场景，具有不同驾驶习性的驾驶员会表现出不同的决策行为，如跟驰、制动、超车等；多线纵横向独立解耦控制器在线调度策略。

目前，相关技术进行自动驾驶车辆安全态势评估时，主要考虑车辆自身运动状态及拓扑化的简单周围环境，且相关技术大多将复杂的驾驶行为分解为多个简单工况下的驾驶行为组合。

然而，相关技术并未考虑车辆周边多目标行为的影响和纵横向动力学之间的耦合，难以处理复杂交通环境下的风险态势评估问题，无法满足不同驾驶员需求，以实现自动驾驶车辆横纵向协同鲁棒控制，亟待解决。

发明内容

本申请提供一种车辆的拟人化决策控制方法、装置、车辆及存储介质，以解决相关技术并未考虑车辆周边多目标行为的影响和纵横向动力学之间的耦合，难以处理复杂交通环境下的风险态势评估问题，无法满足不同驾驶员需求，以实现自动驾驶车辆横纵向协同鲁棒控制等问题。

本申请第一方面实施例提供一种车辆的拟人化决策控制方法，包括以下步骤：获取当前交通环境下多目标车辆的车辆行为认知、预测轨迹和危险态势评估结果；根据所述多目标车辆的车辆行为认知、预测轨迹和危险态势评估结果生成自动驾驶车辆的规划路径和规划速度；以及基于所述自动驾驶车辆的规划路径和规划速度生成所述自动驾驶车辆的拟人化决策结果，并控制所述自动驾驶车辆执行所述拟人化决策结果对应的行驶动作。

根据上述技术手段，本申请实施例根据车辆行为认知、轨迹预测及危险态势评估结果对车辆进行路径和速度规划，生成车辆的拟人化决策，以控制车辆执行相应的操作，从而有效改善了车辆环境认知和危险态势评估能力，在保障车辆安全性能的同时，提升了车辆的智能化和人性化水平。

可选地，在本申请的一个实施例中，所述获取当前交通环境下多目标车辆的车辆行为认知、预测轨迹和危险态势评估结果，包括：基于预设贝叶斯概率模型建立的多传感器信息融合框架，采集车辆周边环境的感知信息；基于预设的马尔科夫模型构造的车辆周边运动目标行为模型，根据所述感知信息提取所述多目标车辆的行为认知和预测轨迹；以及根据所述多目标车辆的行为认知和预测轨迹输入至预先构建的行为场模型，输出所述危险势评估结果，其中，所述行为场模型由运动物体影响的动能场、静止物体影响的势能场及驾驶人特性影响信息建立得到。

根据上述技术手段，本申请实施例通过建立多传感器信息融合框架，并构造车辆周边运动目标行为模型，以建立统一架构下运动物体影响的动能场、静止物体影响的势能场及驾驶人特性影响的行为场模型，从而能够感知车辆周边环境，并对潜在多目标车辆进行行为认知与轨迹预测，实现了综合行车风险态势评估的准确量化，提升了车辆的安全性和可靠性，使车辆更具智能化和科技感。

可选地，在本申请的一个实施例中，所述根据所述多目标车辆的车辆行为认知、预测轨迹和危险态势评估结果生成自动驾驶车辆的规划路径和规划速度，包括：基于对环境的认知和理解，建立适合不同类型道路的坐标系；基于预设的速度-路径规划器，建立实时微观能耗估计模型；利用可变概率模型原理生成基于分布评估算法的车辆速度曲线局部规划策略，以由所述多目标车辆的车辆行为认知、预测轨迹和危险态势评估结果得到所述规划路径和所述规划速度。

根据上述技术手段，本申请实施例通过建立适合不同类型道路的坐标系，构建实时微观能耗估计模型，并设计基于分布评估算法的车辆速度曲线局部规划方法，将上层速度规划信息导入下层规划器，从而在保证经济性的前提下，实现了对车辆行驶轨迹的实时规划，为后续车辆的拟人化决策结果的生成提供重要的数据依据。

可选地，在本申请的一个实施例中，所述基于所述自动驾驶车辆的规划路径和规划速度生成所述自动驾驶车辆的拟人化决策结果，包括：通过感知结果、目标车辆的预测轨迹以及交通规则与路网结构构建的概率环境模型，在学习到的个性奖励函数约束下，利用深度强化学习方法学习当前驾乘人的驾驶习惯的高层决策行为。

根据上述技术手段，本申请实施例根据大规模路试数据，分析与学习横纵向驾驶行为，以基于深度强化学习进行行为决策，从而实现了自动驾驶车辆拟人化决策，极大提升了车辆的人性化程度和智能化水平，使得车辆驾驶更符合用户需求。

可选地，在本申请的一个实施例中，所述控制所述自动驾驶车辆执行所述拟人化决策结果对应的行驶动作，包括：基于预先建立的动力学模型分析纵向与横向运动之间的相互耦合机理；基于预先建立的子系统功能图簇确定各子系统的动态控制边界及优化控制区域；基于所述相互耦合机理和所述各子系统的动态控制边界及优化控制区域生成所述行驶动作。

根据上述技术手段，本申请实施例通过分析纵向与横向运动之间的相互耦合机理，明确各子系统的动态控制边界及优化控制区域，从而设计出非线性解耦及鲁棒控制方法，实现自动驾驶车辆横纵向协同鲁棒控制，避免了横纵向运动之间缺乏协同和补偿的情况，提高了路径跟踪控制的精度，提升了车辆的安全性和可靠性，改善用户的使用体验。

本申请第二方面实施例提供一种车辆的拟人化决策控制装置，包括：获取模块，用于获取当前交通环境下多目标车辆的车辆行为认知、预测轨迹和危险态势评估结果；生成模块，用于根据所述多目标车辆的车辆行为认知、预测轨迹和危险态势评估结果生成自动驾驶车辆的规划路径和规划速度；以及控制模块，用于基于所述自动驾驶车辆的规划路径和规划速度生成所述自动驾驶车辆的拟人化决策结果，并控制所述自动驾驶车辆执行所述拟人化决策结果对应的行驶动作。

可选地，在本申请的一个实施例中，所述获取模块包括：采集单元，用于基于预设贝叶斯概率模型建立的多传感器信息融合框架，采集车辆周边环境的感知信息；提取单元，用于基于预设的马尔科夫模型构造的车辆周边运动目标行为模型，根据所述感知信息提取所述多目标车辆的行为认知和预测轨迹；以及评估单元，用于根据所述多目标车辆的行为认知和预测轨迹输入至预先构建的行为场模型，输出所述危险势评估结果，其中，所述行为场模型由运动物体影响的动能场、静止物体影响的势能场及驾驶人特性影响信息建立得到。

可选地，在本申请的一个实施例中，所述生成模块包括：建立坐标单元，用于基于对环境的认知和理解，建立适合不同类型道路的坐标系；建模单元，用于基于预设的速度-路径规划器，建立实时微观能耗估计模型；规划单元，用于利用可变概率模型原理生成基于分布评估算法的车辆速度曲线局部规划策略，以由所述多目标车辆的车辆行为认知、预测轨迹和危险态势评估结果得到所述规划路径和所述规划速度。

可选地，在本申请的一个实施例中，所述控制模块包括：学习单元，用于通过感知结果、目标车辆的预测轨迹以及交通规则与路网结构构建的概率环境模型，在学习到的个性奖励函数约束下，利用深度强化学习方法学习当前驾乘人的驾驶习惯的高层决策行为。

可选地，在本申请的一个实施例中，所述控制模块还包括：分析单元，用于基于预先建立的动力学模型分析纵向与横向运动之间的相互耦合机理；确定单元，用于基于预先建立的子系统功能图簇确定各子系统的动态控制边界及优化控制区域；行驶单元，用于基于所述相互耦合机理和所述各子系统的动态控制边界及优化控制区域生成所述行驶动作。

本申请第三方面实施例提供一种车辆，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序，以实现如上述实施例所述的车辆的拟人化决策控制车辆的拟人化决策控制方法。

本申请第四方面实施例提供一种计算机可读存储介质，所述计算机可读存储介质存储计算机程序，该程序被处理器执行时实现如上的车辆的拟人化决策控制方法。

由此，本申请的实施例具有以下有益效果：

(1)本申请实施例根据车辆行为认知、轨迹预测及危险态势评估结果对车辆进行路径和速度规划，生成车辆的拟人化决策，以控制车辆执行相应的操作，从而有效改善了车辆环境认知和危险态势评估能力，在保障车辆安全性能的同时，提升了车辆的智能化和人性化水平。

(2)本申请实施例通过建立多传感器信息融合框架，并构造车辆周边运动目标行为模型，以建立统一架构下运动物体影响的动能场、静止物体影响的势能场及驾驶人特性影响的行为场模型，从而能够感知车辆周边环境，并对潜在多目标车辆进行行为认知与轨迹预测，实现了综合行车风险态势评估的准确量化，提升了车辆的安全性和可靠性，使车辆更具智能化和科技感。

(3)本申请实施例通过建立适合不同类型道路的坐标系，构建实时微观能耗估计模型，并设计基于分布评估算法的车辆速度曲线局部规划方法，将上层速度规划信息导入下层规划器，从而在保证经济性的前提下，实现了对车辆行驶轨迹的实时规划，为后续车辆的拟人化决策结果的生成提供重要的数据依据。

(4)本申请实施例根据大规模路试数据，分析与学习横纵向驾驶行为，以基于深度强化学习进行行为决策，从而实现了自动驾驶车辆拟人化决策，极大提升了车辆的人性化程度和智能化水平，使得车辆驾驶更符合用户需求。

(5)本申请实施例通过分析纵向与横向运动之间的相互耦合机理，明确各子系统的动态控制边界及优化控制区域，从而设计出非线性解耦及鲁棒控制方法，实现自动驾驶车辆横纵向协同鲁棒控制，避免了横纵向运动之间缺乏协同和补偿的情况，提高了路径跟踪控制的精度，提升了车辆的安全性和可靠性，改善用户的使用体验。

本申请附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本申请的实践了解到。

附图说明

本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1为根据本申请实施例提供的一种车辆的拟人化决策控制方法的流程图；

图2为根据本申请的一个实施例提供的一种复杂交通环境下危险态势综合评估示意图；

图3为根据本申请的一个实施例提供的一种基于环境认知的路径规划和速度规划示意图；

图4为根据本申请的一个实施例提供的一种基于环境认知的拟人化决策示意图；

图5为根据本申请的一个实施例提供的一种自动驾驶纵横向协同鲁棒控制示意图；

图6为根据本申请实施例的车辆的拟人化决策控制装置的示例图；

图7为申请实施例提供的车辆的结构示意图。

其中，10-车辆的拟人化决策控制装置、100-获取模块、200-生成模块、300-控制模块、701-存储器、702-处理器、703-通信接口。

具体实施方式

下面详细描述本申请的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本申请，而不能理解为对本申请的限制。

下面参考附图描述本申请实施例的车辆的拟人化决策控制方法、装置、车辆及存储介质。针对上述背景技术中提到的问题，本申请提供了一种车辆的拟人化决策控制方法，在该方法中，通过获取当前交通环境下多目标车辆的车辆行为认知、预测轨迹和危险态势评估结果；根据多目标车辆的车辆行为认知、预测轨迹和危险态势评估结果生成自动驾驶车辆的规划路径和规划速度；基于自动驾驶车辆的规划路径和规划速度生成自动驾驶车辆的拟人化决策结果，并控制自动驾驶车辆执行拟人化决策结果对应的行驶动作。本申请可根据车辆行为认知、轨迹预测及危险态势评估结果对车辆进行路径和速度规划，生成车辆的拟人化决策，并控制车辆执行相应的操作，从而有效改善了车辆环境认知和危险态势评估能力，在保障车辆安全性能的同时，提升了车辆的智能化和人性化水平。由此，解决了相关技术并未考虑车辆周边多目标行为的影响和纵横向动力学之间的耦合，难以处理复杂交通环境下的风险态势评估问题，无法满足不同驾驶员需求，以实现自动驾驶车辆横纵向协同鲁棒控制等问题。

具体而言，图1为本申请实施例所提供的一种车辆的拟人化决策控制方法的流程图。

如图1所示，该车辆的拟人化决策控制方法包括以下步骤：

在步骤S101中，获取当前交通环境下多目标车辆的车辆行为认知、预测轨迹和危险态势评估结果。

本申请的实施例在考虑车辆自身运动状态及周围环境的同时，还可通过非高斯噪声感知系统等方法，获取当前交通环境下多目标车辆的车辆行为认知、预测轨迹和危险态势评估结果，从而结合车辆周边多目标车辆行为的影响，实现对复杂交通环境下的风险态势等问题进行评估，提高了无人驾驶车辆环境认知和危险态势评估的能力，有力保障了车辆的安全性能。

可选地，在本申请的一个实施例中，获取当前交通环境下多目标车辆的车辆行为认知、预测轨迹和危险态势评估结果，包括：基于预设贝叶斯概率模型建立的多传感器信息融合框架，采集车辆周边环境的感知信息；基于预设的马尔科夫模型构造的车辆周边运动目标行为模型，根据感知信息提取多目标车辆的行为认知和预测轨迹；根据多目标车辆的行为认知和预测轨迹输入至预先构建的行为场模型，输出危险势评估结果，其中，行为场模型由运动物体影响的动能场、静止物体影响的势能场及驾驶人特性影响信息建立得到。

需要说明的是，本申请的实施例可以基于现有的非高斯噪声感知系统，通过贝叶斯概率模型建立多传感器信息融合框架，研究多目标识别与跟踪算法，实现车辆周边环境的感知，进而基于马尔科夫模型，准确构造车辆周边运动目标行为模型，提取运动目标跟踪轨迹，实现潜在多目标车辆的行为认知与轨迹预测。之后，本申请的实施例可以基于“场论”的人车路综合风险态势评估方法，建立统一架构下运动物体影响的动能场、静止物体影响的势能场及驾驶人特性影响的行为场模型，通过在线调节模型参数，以设计出基于量化安全场的交通场景重构的方法，实现对综合行车风险态势评估的准确量化。

具体地，如图2所示，本申请的实施例进行复杂交通环境下的车辆行为认知、轨迹预测及危险态势评估的具体过程如下所述：

1)基于现有的非高斯噪声感知系统，面向多元异构信息利用时空数据挖掘方法，获取主车环绕环境多目标的运动状态信息(位置、速度、加速度、航向角等)、车辆驾驶状态迁移信息(制动踏板和转向灯信号)与道路环境信息(道路曲率、道路限速)。以自然驾驶数据为基础，利用马尔科夫模型训练，建立车辆周边运动目标行为模型。利用时空数据挖掘方法实现对车辆行为的K-means聚类，完成针对周车运动目标的类人脑行驶意图认知，预测驾驶操控量序列；

2)综合考虑驾驶意图和汽车运动状态，通过将预测的驾驶操控量序列加入到匀加速模型，即CA(Cellular Automata，细胞自动机)模型中，以改进的CA模型为基础，研究基于离散Kalman估计算法的汽车行驶轨迹的短时预测方法，预测本车与周边多目标的运动状态(轨迹、速度、加速度)序贯链；

3)建立统一架构下运动物体影响的动能场、静止物体影响的势能场及驾驶人特性影响的行为场模型，基于多目标差分进化算法对模型参数进行在线调节，设计基于量化安全场的交通场景重构策略，结合汽车运动状态预测序贯链，构建行车路径的冲突区域模型，对综合行车风险态势评估进行量化。

由此，本申请的实施例通过建立多传感器信息融合框架，并构造车辆周边运动目标行为模型，以建立统一架构下运动物体影响的动能场、静止物体影响的势能场及驾驶人特性影响的行为场模型，从而能够感知车辆周边环境，并对潜在多目标车辆进行行为认知与轨迹预测，实现了综合行车风险态势评估的准确量化，提升了车辆的安全性和可靠性，使车辆更具智能化和科技感。

在步骤S102中，根据多目标车辆的车辆行为认知、预测轨迹和危险态势评估结果生成自动驾驶车辆的规划路径和规划速度。

在获取当前交通环境下多目标车辆的车辆行为认知、预测轨迹和危险态势评估结果后，进一步地，本申请的实施例可以根据上述评估结果，生成自动驾驶车辆的规划路径和规划速度，从而为车辆的拟人化决策控制提供可靠地数据支撑。

可选地，在本申请的一个实施例中，根据多目标车辆的车辆行为认知、预测轨迹和危险态势评估结果生成自动驾驶车辆的规划路径和规划速度，包括：基于对环境的认知和理解，建立适合不同类型道路的坐标系；基于预设的速度-路径规划器，建立实时微观能耗估计模型；利用可变概率模型原理生成基于分布评估算法的车辆速度曲线局部规划策略，以由多目标车辆的车辆行为认知、预测轨迹和危险态势评估结果得到规划路径和规划速度。

具体地，如图3所示，本申请实施例基于环境认知进行自动驾驶车辆路径规划和速度规划的具体步骤如下所述：

1)基于车辆行驶循环能耗数据集，分析影响车辆能耗经济性的主、次要因素，得到主要因素与车辆行驶能耗之间的关系，通过多项式拟合方法得到以稳态因素为输入的稳态能耗初步估计微观模型，同时采用对数拟合的方式得到以瞬态因素为输入的瞬态能耗实时修正微观模型，将两者相结合形成“稳态初估+瞬态修正”的实时能耗估计模型，为基于经济性的速度规划奠定模型基础；

2)建立车辆行驶动力学模型，采用加权方式将道路法规限速引入目标函数，以提高车辆通行效率、减少行程时间，忽略传统GA(Genetic Algorithm，遗传算法)中的交叉变异操作，从统计学的角度出发，建立可变概率统计模型，基于实时微观能耗模型，采用GA变相改进算法EDA(Estimation of Distribution Algorithm，分布式估计算法)对车辆的局部车速进行实时优化；

3)建立车辆运动学模型，基于上端环境感知与风险评估获得的目标障碍物信息，采用Bezier曲线拟合方法对车辆无碰撞的安全轨迹进行实时规划，并将速度规划层中的局部规划速度作为轨迹规划层中的初速度与对应时间约束，以提升规划轨迹的经济性。

由此，本申请的实施例通过建立适合不同类型道路的坐标系，构建实时微观能耗估计模型，并设计基于分布评估算法的车辆速度曲线局部规划方法，将上层速度规划信息导入下层规划器，从而在保证经济性的前提下，实现了对车辆行驶轨迹的实时规划，为后续车辆的拟人化决策结果的生成提供重要的数据依据。

在步骤S103中，基于自动驾驶车辆的规划路径和规划速度生成自动驾驶车辆的拟人化决策结果，并控制自动驾驶车辆执行拟人化决策结果对应的行驶动作。

在得到自动驾驶车辆的规划路径和规划速度后，本申请的实施例可以基于上述规划结果，生成自动驾驶车辆的拟人化决策结果，使得车辆根据拟人化决策结果执行相应的行驶动作，从而在保障行驶安全的前提下，提升了不同场景下车辆决策的宜人性。

可选地，在本申请的一个实施例中，基于自动驾驶车辆的规划路径和规划速度生成自动驾驶车辆的拟人化决策结果，包括：通过感知结果、目标车辆的预测轨迹以及交通规则与路网结构构建的概率环境模型，在学习到的个性奖励函数约束下，利用深度强化学习方法学习当前驾乘人的驾驶习惯的高层决策行为。

需要说明的是，本申请的实施例可基于大规模路试数据，采集真实的驾驶环境和驾驶员行为数据，例如，不同驾驶员在多类驾驶工况下的横纵向驾驶数据等，以对车辆横纵向驾驶行为的运动特性进行特征提取和特征选择，并采用无监督聚类方法按照激进型、一般型和保守型三类对上述数据进行聚类分析。进而，本申请的实施例可利用本车历史轨迹信息及其驾驶行为建立符合该驾乘人员的决策奖励函数，通过感知结果、目标车辆的预测轨迹以及交通规则与路网结构构建概率环境模型，以在学习到的个性奖励函数约束下，利用深度强化学习方法，学习符合该驾乘人驾驶习惯的高层决策行为。

具体地，如图4所示，本申请的实施例基于自动驾驶车辆的规划路径和规划速度进行自动驾驶车辆的拟人化决策的具体过程如下所述：

1)深入调研复杂交通场景，建立抽象化的典型场景类型集，利用驾驶模拟器模拟驾驶环境，针对典型场景，设定跟驰、变道、超车等驾驶工况，采集驾驶员操纵数据、车辆状态参数以及环境信息等，通过卡尔曼滤波滤除驾驶员异常操作信号与数据噪声，分析影响驾驶员决策行为特性的主客观因素，阐明驾驶员特性、环境信息及车辆特征参数之间的耦合机理；

2)建立基于马尔科夫决策过程(Markov Decision Process，MDP)的车辆行为预测模型，预测车辆在典型工况下的跟驰、超车、换道等行为；采用设计回报函数，通过广义递归神经网络(General Regression Neural Network，GRNN)算法，基于大样本对其进行离线训练，建立拟人化驾驶认知模型，预测驾驶员的行为操作；

3)考虑驾驶员驾驶习性变化，根据驾驶员实时驾驶数据，采用基于演说家-评论员(Natural Critic，NAC)模式的强化学习(Reinforcement Learning，RL)方法对决策模型进行在线训练，并通过二元高斯分布函数，实现离线-在线联合学习，实时更新驾驶决策模型，最后采用自然驾驶人数据库，对拟人化驾驶决策模型进行验证。

可以理解的是，本申请的实施例根据大规模路试数据，分析与学习横纵向驾驶行为，以基于深度强化学习进行行为决策，从而实现了自动驾驶车辆拟人化决策，极大提升了车辆的人性化程度和智能化水平，使得车辆驾驶更符合用户需求。

可选地，在本申请的一个实施例中，控制自动驾驶车辆执行拟人化决策结果对应的行驶动作，包括：基于预先建立的动力学模型分析纵向与横向运动之间的相互耦合机理；基于预先建立的子系统功能图簇确定各子系统的动态控制边界及优化控制区域；基于相互耦合机理和各子系统的动态控制边界及优化控制区域生成行驶动作。

需要说明的是，本申请的实施例通过建立可准确描述汽车纵横向非线性特性的动力学模型和基于工况辨识的子系统功能图簇，以分析纵向与横向运动之间的相互耦合机理，明确各子系统的动态控制边界及优化控制区域，进而综合考虑耦合约束条件和优化控制目标，设计非线性解耦及鲁棒控制方法。

具体地，如图5所示，本申请的实施例进行自动驾驶车辆横纵向协同鲁棒控制的具体过程如下所述：

1)基于牛顿-欧拉法，建立包含侧、俯仰、横摆等自由度的汽车纵-横-垂向车体动力学模型，以及反映驱动力矩和地面附着力关系的车轮动力学模型；

2)基于汽车的速度、横摆角速度、质心侧偏角等行驶参数，对汽车的运动工况进行划分，对车辆运动工况进行辨识；

3)综合考虑各执行器约束、路面附着约束、路径误差约束及安全舒适约束，基于车辆多胞预测模型设计多目标优化函数，实现纵横向协同控制。

由此，本申请的实施例通过分析纵向与横向运动之间的相互耦合机理，明确各子系统的动态控制边界及优化控制区域，从而设计出非线性解耦及鲁棒控制方法，实现自动驾驶车辆横纵向协同鲁棒控制，避免了横纵向运动之间缺乏协同和补偿的情况，提高了路径跟踪控制的精度，提升了车辆的安全性和可靠性，改善用户的使用体验。

根据本申请实施例提出的车辆的拟人化决策控制方法，通过获取当前交通环境下多目标车辆的车辆行为认知、预测轨迹和危险态势评估结果；根据多目标车辆的车辆行为认知、预测轨迹和危险态势评估结果生成自动驾驶车辆的规划路径和规划速度；基于自动驾驶车辆的规划路径和规划速度生成自动驾驶车辆的拟人化决策结果，并控制自动驾驶车辆执行拟人化决策结果对应的行驶动作。本申请可根据车辆行为认知、轨迹预测及危险态势评估结果对车辆进行路径和速度规划，生成车辆的拟人化决策，并控制车辆执行相应的操作，从而有效改善了车辆环境认知和危险态势评估能力，在保障车辆安全性能的同时，提升了车辆的智能化和人性化水平。

其次参照附图描述根据本申请实施例提出的车辆的拟人化决策控制装置。

图6是本申请实施例的车辆的拟人化决策控制装置的方框示意图。

如图6所示，该车辆的拟人化决策控制装置10包括：获取模块100、生成模块200以及控制模块300。

其中，获取模块100，用于获取当前交通环境下多目标车辆的车辆行为认知、预测轨迹和危险态势评估结果。

生成模块200，用于根据多目标车辆的车辆行为认知、预测轨迹和危险态势评估结果生成自动驾驶车辆的规划路径和规划速度。

控制模块300，用于基于自动驾驶车辆的规划路径和规划速度生成自动驾驶车辆的拟人化决策结果，并控制自动驾驶车辆执行拟人化决策结果对应的行驶动作。

可选地，在本申请的一个实施例中，获取模块100包括：采集单元、提取单元以及评估单元。

其中，采集单元，用于基于预设贝叶斯概率模型建立的多传感器信息融合框架，采集车辆周边环境的感知信息；

提取单元，用于基于预设的马尔科夫模型构造的车辆周边运动目标行为模型，根据感知信息提取多目标车辆的行为认知和预测轨迹；以及

评估单元，用于根据多目标车辆的行为认知和预测轨迹输入至预先构建的行为场模型，输出危险势评估结果，其中，行为场模型由运动物体影响的动能场、静止物体影响的势能场及驾驶人特性影响信息建立得到。

可选地，在本申请的一个实施例中，生成模块200包括：建立坐标单元、建模单元以及规划单元。

其中，建立坐标单元，用于基于对环境的认知和理解，建立适合不同类型道路的坐标系。

建模单元，用于基于预设的速度-路径规划器，建立实时微观能耗估计模型。

规划单元，用于利用可变概率模型原理生成基于分布评估算法的车辆速度曲线局部规划策略，以由多目标车辆的车辆行为认知、预测轨迹和危险态势评估结果得到规划路径和规划速度。

可选地，在本申请的一个实施例中，控制模块300包括：学习单元，用于通过感知结果、目标车辆的预测轨迹以及交通规则与路网结构构建的概率环境模型，在学习到的个性奖励函数约束下，利用深度强化学习方法学习当前驾乘人的驾驶习惯的高层决策行为。

可选地，在本申请的一个实施例中，控制模块300还包括：分析单元、确定单元以及行驶单元。

其中，分析单元，用于基于预先建立的动力学模型分析纵向与横向运动之间的相互耦合机理。

确定单元，用于基于预先建立的子系统功能图簇确定各子系统的动态控制边界及优化控制区域。

行驶单元，用于基于相互耦合机理和各子系统的动态控制边界及优化控制区域生成行驶动作。

需要说明的是，前述对车辆的拟人化决策控制方法实施例的解释说明也适用于该实施例的车辆的拟人化决策控制装置，此处不再赘述。

根据本申请实施例提出的车辆的拟人化决策控制装置，通过获取当前交通环境下多目标车辆的车辆行为认知、预测轨迹和危险态势评估结果；根据多目标车辆的车辆行为认知、预测轨迹和危险态势评估结果生成自动驾驶车辆的规划路径和规划速度；基于自动驾驶车辆的规划路径和规划速度生成自动驾驶车辆的拟人化决策结果，并控制自动驾驶车辆执行拟人化决策结果对应的行驶动作。本申请可根据车辆行为认知、轨迹预测及危险态势评估结果对车辆进行路径和速度规划，生成车辆的拟人化决策，并控制车辆执行相应的操作，从而有效改善了车辆环境认知和危险态势评估能力，在保障车辆安全性能的同时，提升了车辆的智能化和人性化水平。

图7为本申请实施例提供的车辆的结构示意图。该车辆可以包括：

存储器701、处理器702及存储在存储器701上并可在处理器702上运行的计算机程序。

处理器702执行程序时实现上述实施例中提供的车辆的拟人化决策控制方法。

进一步地，车辆还包括：

通信接口703，用于存储器701和处理器702之间的通信。

存储器701，用于存放可在处理器702上运行的计算机程序。

存储器701可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。

如果存储器701、处理器702和通信接口703独立实现，则通信接口703、存储器701和处理器702可以通过总线相互连接并完成相互间的通信。总线可以是工业标准体系结构(Industry Standard Architecture，简称为ISA)总线、外部设备互连(PeripheralComponent，简称为PCI)总线或扩展工业标准体系结构(Extended Industry StandardArchitecture，简称为EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示，图7中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

可选地，在具体实现上，如果存储器701、处理器702及通信接口703，集成在一块芯片上实现，则存储器701、处理器702及通信接口703可以通过内部接口完成相互间的通信。

处理器702可能是一个中央处理器(Central Processing Unit，简称为CPU)，或者是特定集成电路(Application Specific Integrated Circuit，简称为ASIC)，或者是被配置成实施本申请实施例的一个或多个集成电路。

本申请实施例还提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如上的车辆的拟人化决策控制方法。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或N个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中，“N个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或N个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本申请的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本申请的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或N个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(RAM)，只读存储器(ROM)，可擦除可编辑只读存储器(EPROM或闪速存储器)，光纤装置，以及便携式光盘只读存储器(CDROM)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

应当理解，本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，N个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如果用硬件来实现和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本申请各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器，磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本申请的限制，本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种车辆的拟人化决策控制方法，其特征在于，包括以下步骤：

获取当前交通环境下多目标车辆的车辆行为认知、预测轨迹和危险态势评估结果；

根据所述多目标车辆的车辆行为认知、预测轨迹和危险态势评估结果生成自动驾驶车辆的规划路径和规划速度；以及

基于所述自动驾驶车辆的规划路径和规划速度生成所述自动驾驶车辆的拟人化决策结果，并控制所述自动驾驶车辆执行所述拟人化决策结果对应的行驶动作。

2.根据权利要求1所述的方法，其特征在于，所述获取当前交通环境下多目标车辆的车辆行为认知、预测轨迹和危险态势评估结果，包括：

基于预设贝叶斯概率模型建立的多传感器信息融合框架，采集车辆周边环境的感知信息；

基于预设的马尔科夫模型构造的车辆周边运动目标行为模型，根据所述感知信息提取所述多目标车辆的行为认知和预测轨迹；以及

根据所述多目标车辆的行为认知和预测轨迹输入至预先构建的行为场模型，输出所述危险势评估结果，其中，所述行为场模型由运动物体影响的动能场、静止物体影响的势能场及驾驶人特性影响信息建立得到。

3.根据权利要求1所述的方法，其特征在于，所述根据所述多目标车辆的车辆行为认知、预测轨迹和危险态势评估结果生成自动驾驶车辆的规划路径和规划速度，包括：

基于对环境的认知和理解，建立适合不同类型道路的坐标系；

基于预设的速度-路径规划器，建立实时微观能耗估计模型；

利用可变概率模型原理生成基于分布评估算法的车辆速度曲线局部规划策略，以由所述多目标车辆的车辆行为认知、预测轨迹和危险态势评估结果得到所述规划路径和所述规划速度。

4.根据权利要求1所述的方法，其特征在于，所述基于所述自动驾驶车辆的规划路径和规划速度生成所述自动驾驶车辆的拟人化决策结果，包括：

通过感知结果、目标车辆的预测轨迹以及交通规则与路网结构构建的概率环境模型，在学习到的个性奖励函数约束下，利用深度强化学习方法学习当前驾乘人的驾驶习惯的高层决策行为。

5.根据权利要求1所述的方法，其特征在于，所述控制所述自动驾驶车辆执行所述拟人化决策结果对应的行驶动作，包括：

基于预先建立的动力学模型分析纵向与横向运动之间的相互耦合机理；

基于预先建立的子系统功能图簇确定各子系统的动态控制边界及优化控制区域；

基于所述相互耦合机理和所述各子系统的动态控制边界及优化控制区域生成所述行驶动作。

6.一种车辆的拟人化决策控制装置，其特征在于，包括：

获取模块，用于获取当前交通环境下多目标车辆的车辆行为认知、预测轨迹和危险态势评估结果；

生成模块，用于根据所述多目标车辆的车辆行为认知、预测轨迹和危险态势评估结果生成自动驾驶车辆的规划路径和规划速度；以及

控制模块，用于基于所述自动驾驶车辆的规划路径和规划速度生成所述自动驾驶车辆的拟人化决策结果，并控制所述自动驾驶车辆执行所述拟人化决策结果对应的行驶动作。

7.根据权利要求6所述的装置，其特征在于，所述获取模块包括：

采集单元，用于基于预设贝叶斯概率模型建立的多传感器信息融合框架，采集车辆周边环境的感知信息；

提取单元，用于基于预设的马尔科夫模型构造的车辆周边运动目标行为模型，根据所述感知信息提取所述多目标车辆的行为认知和预测轨迹；以及

评估单元，用于根据所述多目标车辆的行为认知和预测轨迹输入至预先构建的行为场模型，输出所述危险势评估结果，其中，所述行为场模型由运动物体影响的动能场、静止物体影响的势能场及驾驶人特性影响信息建立得到。

8.根据权利要求6所述的装置，其特征在于，所述生成模块包括：

建立坐标单元，用于基于对环境的认知和理解，建立适合不同类型道路的坐标系；

建模单元，用于基于预设的速度-路径规划器，建立实时微观能耗估计模型；

规划单元，用于利用可变概率模型原理生成基于分布评估算法的车辆速度曲线局部规划策略，以由所述多目标车辆的车辆行为认知、预测轨迹和危险态势评估结果得到所述规划路径和所述规划速度。

9.一种车辆，其特征在于，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序，以实现如权利要求1-5任一项所述的车辆的拟人化决策控制方法。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行，以用于实现如权利要求1-5任一项所述的车辆的拟人化决策控制方法。