CN114675742A - 一种面向高度自动驾驶的人机决策逻辑在线校验方法 - Google Patents

一种面向高度自动驾驶的人机决策逻辑在线校验方法 Download PDF

Info

Publication number
CN114675742A
CN114675742A CN202210477360.5A CN202210477360A CN114675742A CN 114675742 A CN114675742 A CN 114675742A CN 202210477360 A CN202210477360 A CN 202210477360A CN 114675742 A CN114675742 A CN 114675742A
Authority
CN
China
Prior art keywords
decision
model
machine
man
situation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210477360.5A
Other languages
English (en)
Other versions
CN114675742B (zh
Inventor
孙博华
张宇飞
赵帅
李雅欣
翟洋
马文霄
冷炘伦
吴官朴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jilin University
Original Assignee
Jilin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jilin University filed Critical Jilin University
Priority to CN202210477360.5A priority Critical patent/CN114675742B/zh
Publication of CN114675742A publication Critical patent/CN114675742A/zh
Application granted granted Critical
Publication of CN114675742B publication Critical patent/CN114675742B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Computer Interaction (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了一种面向高度自动驾驶的人机决策逻辑在线校验方法,其方法为:第一步、数据及信息流输入;第二步、在线评估周期进行计算,具体步骤为:步骤一、建立混杂态势评估模型;步骤二、进行混杂态势在线评估;步骤三、进行在线评估周期计算;第三步、对人机混合决策模型进行综合评价,具体步骤为:步骤一、进行人机混合决策模型可解释性评价;步骤二、进行时域决策结果预测;步骤三、进行已用知识库评价;步骤四、进行人机混合决策模型及知识库更新情况判断;步骤五、进行人机混合决策模型综合评价。有益效果:避免人机混合决策过程存在的算法局限及故障隐患,提高了人机混合决策的安全性及可信性。

Description

一种面向高度自动驾驶的人机决策逻辑在线校验方法
技术领域
本发明涉及一种人机决策逻辑在线校验方法,具体涉及一种面向高度自动驾驶的人机决策逻辑在线校验方法。
背景技术
目前,由于完全自动驾驶的技术局限性和其所面临的社会困境,加之民众接受度较低,人机共驾将成为未来社会长期存在的一种智能驾驶形式。深入的人机一致性协同机理分析是人机共驾的理论基础,受“人驾”属性和“机驾”决策逻辑影响,基于高度人机一致性决策的安全可信人机协同共驾研究是未来智能交通系统的技术核心之一。目前人机共驾系统决策层主要基于数据训练的方式实现混合决策过程及人机驾驶权仲裁逻辑,基于第2、3代人工智能理论的数据训练算法普遍存在不可解释且不可释义的弊端,同时由于在线决策故障存在安全隐患且决策算法自学习能力弱限制了车辆对场景的适应性,上述系统缺陷共同对人机混合决策过程及输出结果的可信性提出了挑战。因此,需要建立一种面向高度自动驾驶的人机决策逻辑在线校验方法,实时验证人机决策过程及决策结果的可信性。
面向高度自动驾驶的人机决策逻辑在线校验具备以下几个特点。首先,实时性要求高。真实道路行驶环境具有高复杂度、高动态性变化的特点,因此人机决策逻辑在线校验模型需具备很强的实时性,判断不同时刻的人机混合决策结果的合理性;其次,模型辨识精度与校验精度要求高。在交通环境中,自动驾驶系统的首要任务是保证驾驶人及其他交通参与者的安全性,这首先要求人机混合决策模型的决策结果具有很高的精度与可信度,而人机决策逻辑在线校验模型作为保障安全性的最后一道防线,也应具有非常高的模型辨识精度与校验精度;最后,模型复杂度较高。人机混合决策模型考虑多方面因素,如驾驶人、自动驾驶车辆以及车辆周围环境等从而得到决策结果,因此人机决策逻辑在线校验模型在校验过程中,也要充分考略到决策模型的各个方面,对模型所用到的算法、知识库以及模型中的内参等进行评估,因此在线校验模型具有较高的复杂度。
目前国内外团队已经探索了模型校验的相关方法,但是现有的技术仍存在一定不足。首先,在高度自动驾驶领域关于人机决策逻辑校验的技术较少,大部分研究聚焦在人机混合决策模型的建立上,缺乏对决策模型的解释性与可信性评价;其次,关于人机决策逻辑在线校验的技术较少,交通系统不同于其他系统,具有高度的非线性动态特性,对安全性要求极为苛刻,这要求校验模型必须在线且具有高度的实时性;最后,关于人机混合决策的评价模型较为简单,缺乏体系化,目前人机混合决策模型已经融入了深度学习、强化学习等人工智能领域的机器学习算法,但评价模型还依旧停留在针对基于规则和基于博弈论的决策逻辑层面,而且没有一套完整的评价体系。
中国专利CN201911358599.5公开了一种基于驾驶员实时风险响应的动态人机共驾驾驶权分配方法,该方法包通过采集环境信息和自车信息获取周围车辆对自车的综合风险作用强度,从而实时判断驾驶员的驾驶状态,并计算驾驶权重分配因子,属于一种切换型人机共驾的决策模型。中国专利201910154814.3公开了一种在人机共驾车道保持系统中驾驶权分配的方法,通过模糊控制确定共驾系数,实现共驾系数的连续变化从而防止控制权突变,保证车道保持系统的安全性与舒适性,属于一种共享型人机共驾的决策模型。上述两项专利建立了人机混合决策的模型,但并未针对所设计的模型进行在线校验,不能完全保证决策过程的可解释性与决策结果的可信性。中国专利202110090864.7公开了一种基于数字孪生虚实交互技术的人机共驾测试方法,通过虚拟仿真场景、虚拟传感器(雷达、相机等)与实车的自动驾驶控制器之间的交互来测试和优化车辆的人机交互及共驾性能和乘员舒适性。该专利从仿真实验的角度对人机混合决策模型进行了验证,但并未从决策逻辑的机理层面进行验证,无法对人机混合决策模型的可解释性进行评价,且无法进行在线校验。
发明内容
本发明的目的是为了在车辆的完全自动驾驶的状态下实时验证人机决策过程及决策结果的可信性,而提供的一种面向高度自动驾驶的人机决策逻辑在线校验方法。
本发明提供的面向高度自动驾驶的人机决策逻辑在线校验方法,其方法包括如下步骤:
第一步、数据及信息流输入,具体步骤如下:
将传感器检测到的人-交通混杂态势的多模态态势数据输入在线评估周期计算模型;将在线评估计算周期、人机混合决策驾驶权评估结果、人机混合增强智能决策模型内参以及人机混合决策内模结构输入人机混合决策综合评估模型,作为人机混合决策模型的评估依据;
作为输入的人-交通混杂态势的多模态态势数据中包含了可表征驾驶人驾驶能力及驾驶状态的驾驶人态势数据,可表征车辆状态的车辆态势数据和可表征车辆周围交通环境状态的环境态势数据;驾驶人态势数据中,驾驶人的年龄、驾龄、驾驶里程以及受教育程度的指标能够反映驾驶人的驾驶能力,此外,血流量脉冲、皮肤电导以及眼动参数作为三个典型的生理指标,能够在一定程度上反映驾驶人的驾驶状态;车辆态势数据包括平均车速、加速度标准差以及前轮转角标准差所反映的车辆纵向与横向运动状态的指标;环境态势数据能够反映车辆周围交通环境中的行车风险,分为静态障碍物造成的风险与动态障碍物造成的风险,风险大小通过车头时距、碰撞时间和相对速度的指标或建立行车风险场求解场强的方式来表征;
作为输入的人机混合决策模型的数据包含了模型中深度学习算法的神经元组结构与计算结果、模型内参、模型已用知识库以及决策结果;
第二步、对在线评估周期进行计算,具体步骤如下:
步骤一、进行人-交通混杂态势可观性分析及人-交通混杂态势的多模态态势数据质量分析,建立包含“人”态势及“交通”态势在内的混杂态势评估模型,通过基于可观性量表的参数分析,评估特定驾驶情景产生的多模态场景信息的可观测程度;通过基于参数逻辑门限的数据质量分析,评估特定驾驶情景产生的多模态场景信息的传输质量;
步骤二、进行人-交通混杂态势危急程度在线评估,通过对人-交通混杂态势的多模态态势数据进行聚类,将表征驾驶人驾驶能力及驾驶状态的驾驶人态势数据、表征车辆状态的车辆态势数据和表征车辆周围交通环境状态的环境态势数据分类,每一类对应人-交通混杂态势危急程度的一个层级;通过对聚类结果进行降维,降低人-交通混杂态势危急层级的复杂度,增加人-交通混杂态势危急层级划分的合理性;通过将聚类结果与物理世界映射,得到人-交通混杂态势危险边界回归模型,建立起多层级人-交通混杂态势边界评价理论体系;
步骤三、进行在线评估周期计算,通过建立基于二维线性规划的态势评估与态势危险度映射模型,确定人机混合决策在线评估模型的计算周期;
第三步、对人机混合决策模型进行综合评价,具体步骤如下:
步骤一、进行人机混合决策模型可解释性评价,人机混合决策评价模型通过对人机混合增强决策中所用到的深度学习模型的可解释性进行研究,分析神经元组结构、算力及计算结果,实现对人机混合决策模型可解释性评价;
步骤二、进行基于模型预测控制的滚动时域决策结果预测,通过模型预测控制模拟人脑的决策过程,根据驾驶员预瞄原理,得到驾驶员在滚动时域的决策结果;通过模型预测控制模拟“机器脑”的决策过程,在考虑驾驶员操作的基础上跟踪参考路径,协助驾驶员完成操作;
步骤三、进行人机混合决策模型已用知识库评价,通过对人机混合决策模型知识库的场景元素的复杂度进行分析,从而得到已用知识库的复杂程度,作为判断人机混合决策模型可信性的一个依据;
步骤四、进行人机混合决策模型及知识库更新情况判断,通过对人机混合决策模型、内参及知识库进行相似性分析,设定更新阈值,从而判断更新的必要性;通过对人机混合决策模型、内参及知识库更新方式进行评价,分析更新的效果;
步骤五、进行基于层次分析法的人机混合决策模型综合评价,通过分析上述步骤一至步骤四中评价指标之间的影响关系建立层次结构模型,根据专家经验构造判断矩阵;通过层析排序确定评价指标的影响权重,进行一致性检验验证重要性排序的正确性;根据各指标的评价结果与层次分析法所得的排序结果,得到人机混合决策逻辑多层级在线校验结果,作为人机混合决策逻辑的在线反馈数据。
第二步中的步骤一通过人-交通混杂态势可观性分析与人-交通混杂态势的多模态态势数据质量分析,建立了混杂态势评估模型,具体如下:
人-交通混杂态势可观性分析采用基于量表评价的分析方法,对人-交通混杂态势的观测分为对驾驶人驾驶能力及驾驶状态的观测、对车辆状态的观测以及对车辆周围行驶环境的观测三个部分,这三部分的可观性共同决定了混杂态势的可观性,在上述三个待观测的部分中分别选取能够表征可观性的参数,并为参数设定阈值,将这些参数汇总制作可观性量表,通过对其中参数进行分析判断人-交通混杂态势可观性;
人-交通混杂态势的多模态态势数据质量分析主要评估数据的内在质量、数据量的适当程度以及数据的时效性;
数据的内在质量分为两个维度,包括数据正确性和数据精度,正确性评估数据正确、可靠和无错误的程度,精度是指数据采集和存储的精度,对于数据集L,设数据正确性和数据精度的量化值分别为qc、qp,其最低质量要求分别为θc、θp,则数据集L必须满足最低内在质量要求,如下式所示:
R=(qc≥θc)∩(qp≥θp)
数据li∈L的正确性用qc i表示,精度用qp i表示,则数据集L的正确性和精度可以通过平均函数计算:
Figure BDA0003626393730000041
Figure BDA0003626393730000042
数据量的适当程度是数据质量分析的又一个维度,数据越多,训练模型的性能就越高,用于当前任务的数据集的数据数量要足够完成当前任务,且不会引起额外的资源浪费;
数据的时效性是指当前数据库中的数据适合当前任务的程度,时效性用两个参数来量化,即currency与volatility,其中, currency指数据的使用期限,volatility指数据保持有效的时间,通过数据集中数据片段的最大或平均时效性来评估数据集L 的时效性;
第二步中的步骤二通过基于数据驱动的机器学习算法,将人-交通混杂态势的多模态态势数据进行聚类,从而建立起混杂态势的危急程度评估模型,具体如下:
混杂态势危急程度评估模型采用蚁群算法对人-交通混杂态势数据进行聚类,假设用于蚁群搜索的人-交通混杂态势的多模态态势数据集L具有m个独立参数特征及其对应的E个观测变量,基于蚁群聚类的人-交通混杂态势分类即为在L中找到能够使每个数据样本到达聚类数目已知的聚类中心的距离之和达到最小的划分,如下式:
Figure BDA0003626393730000043
Figure BDA0003626393730000044
式中,lip为第i个数据样本的第p个模型参数特征,cjp为第j个类中心的第p个模型参数特征,Ej为观测变量E中第j 类对应的观测变量,ωij为观测变量与分类间的从属关系标志量,蚁群聚类的分类质量通过迭代更新方程提高,更新方程如下式所示:
Figure 4
式中,Pij为数据样本跨类转换的概率,τij为数据样本i和所属类j间的标准化信息素,ρ(0<ρ<1)为信息素挥发度,τij(t) 为数据样本i和所属类j在t时刻的信息素浓度;
当聚类结果的类别较多,与物理世界中预设的人-交通混杂态势层次数不一致时,按照预设的人-交通混杂态势层次数,将聚类结果中相近的类别划分为一类进行降维,另外,还需要建立聚类结果与物理世界中预设的人-交通混杂态势各层次的映射关系,考虑到待映射元素间存在逻辑联系,但并无可解释的物理及数理推导关系,采用多维线性优化回归模型,得到人 -交通混杂态势评价方程表达式如下式所示:
Figure BDA0003626393730000052
式中,SOCX为人-交通混杂态势危急程度,
Figure BDA0003626393730000053
为人-交通混杂态势的多模态态势数据集L的有效值子集,β为回归系数。
第三步中的步骤一在人机混合决策过程中,混合增强智能理论能够获得环境信息、车辆状态信息以及人的推断信息,机器通过深度学习与强化学习理解人的推断过程与决策模式,以类脑计算模式填补人的决策缺陷,赋予自动驾驶系统较强的决策能力,实现“人机超脑决策”模式,为保证决策结果的安全性与可信性,对人机混合决策模型中的深度学习模型进行可解释性研究,具体如下:
首先获取骨干网络最后一层全连接层的分类权重,以此作为决策树叶子节点,构建决策树层次结构,通过对节点输出进行可视化,使得深度决策树可解释性不再局限于节点精度及决策路径,而是能够在空间位置上给出可视化解释,直观理解模型逐层决策依据,同时,通过基于卷积核相关度验证模型可解释性的方法,对于模型输出特征图组进行扰动,以节点注意力图与决策路径变化为依据,验证决策树分类依据的可靠性;
在传统的基于类激活映射的可视化方法中,将最后一层卷积层输出的k个特征映射图Ak进行加权平均池化,得出注意力图,具体来说,让倒数第二层产生K个特征图,Ak∈Ru ×v,每个元素以i,j为索引,所以Ak i,j指的是特征图Ak在位置(i, j)的激活,然后使用全局平均池化对这些特征图进行空间池化,并对其进行线性变换,产生每个类c的得分Yc,如下式所示:
Figure BDA0003626393730000054
在计算ak (c)的过程中,需要计算反向传播梯度与激活函数,即对权重矩阵与激活函数的连续矩阵进行乘积,直到梯度被传播到最终的卷积层,这些反向传播的梯度在宽度与高度维度上进行全局平均池化,分别以i和j为索引,从而得到神经元重要性权重ak (c),如下式所示:
Figure BDA0003626393730000061
权重ak (c)代表了深度学习网络特征图的部分线性化,并获得特征图k对目标类c的重要性,对前向激活图进行加权组合,并在其后进行激活函数映射,得到模型构建的注意力图,如下式所示:
Figure BDA0003626393730000062
采用优化类激活映射算法,将全局平均池化后的权重ak (c)转化为基于矩阵值权重Wk (c),如下式所示:
Figure BDA0003626393730000063
其主要方式为经由模型最后一层卷积层后去掉全局平均池化层,对卷积层输出进行可视化从而保留最后一层卷积层的空间位置信息;
使用哈达玛积对特征图与权重Wk (c)作乘,记为Wk (c)*Ak,在哈达玛积的定义当中,若A=(aij)与矩阵B=(bij)为同阶矩阵,其哈达玛积记为C=(cij),如下式所示:
Figure BDA0003626393730000064
Wk (c)与Ak同为m×n矩阵,因哈达玛积能最大限度保留空间位置信息,突出显著性决策区域,所以使用哈达玛积将权重 Wk (c)与特征图相乘,输出权重特征图,如下式所示:
Figure BDA0003626393730000065
所提出的优化类激活映射图保留了ReLU激活函数并将其应用于特征图的线性组合,ReLU激活函数能够有效区分相关和不相关的像素并提取对分类结果类有较高贡献度的特征,随后在特征图组中构建激活映射,对经过激活函数的特征图进行显著性映射求和得到注意力图,如下式所示:
Figure BDA0003626393730000066
度量卷积核单元相关度使用IoU算法,在不同的网络中能够比较不同表征的可解释性,探究骨干网络相关卷积核对于模型类别的影响程度,以此验证决策依据的置信度,如下式所示:
Figure BDA0003626393730000071
上述公式通过计算该层特征图二值化激活区域与不同语义标签结果的交并比来确定该层卷积核所具备的语义信息,其中,x代表输入样本,c代表类别信息,k代表某一卷积层的第k个卷积核单元,Lc(x)为输入图像的像素级标注区域,Mc(x) 为像素的单元激活图Ak(x)进行上采样得到的激活图,并与输入像素的图像级标注Lc(x)进行比较,进行二值化语义分割,设定默认阈值为IoUk,c>0.05,当存在卷积核单元对应多个语义相关时取IoU最大值,则此卷积核单元为特定类别语义单元。
第三步中的步骤二基于模型预测控制的方法对滚动时域内的人机混合决策结果进行预测,可增强人机决策结果的一致性;
以信息对称条件下人机协同转向操作为例,驾驶员在对称条件对控制器具备一定的适应性,利用模型预测控制模拟人脑的决策过程,根据驾驶员预瞄原理,驾驶员未来状态的预测方程如下所示:
Xh(k+1|k)=Sshxx(k)+SshuUa(k)+SshuUh(k)
Zh(k+1|k)=Sshzx(k)+SshuUa(k)+SshuUh(k)
其中预测方程中的矩阵如下所示:
Figure BDA0003626393730000072
Figure BDA0003626393730000073
Figure BDA0003626393730000074
Figure BDA0003626393730000081
Figure BDA0003626393730000082
式中,δh为驾驶员的控制输入,δh为“机器脑”的控制输入,P为预测步数,N为控制步数,驾驶员的决策过程与控制器类似,其主要目标为跟踪所预瞄的理想的参考路径,驾驶员的理想路径用Rh(k+1)表示:
Rh(k+1)=[rh(k+1) rh(k+2) … rh(k+P)]T
驾驶员的目标由两部分表达,其中一部分是对理想路径跟踪,另一部分是对控制量的惩罚项,而两个目标通过权重Γsh与Γsuh进行权衡,因此驾驶员的决策可由以下控制目标优化求解表达:
Figure BDA0003626393730000083
求解获得驾驶员的决策变量Uh(k)后,选取Uh(k)的第一个量进行执行;
“机器脑”接收驾驶员的控制变量,在考虑驾驶员操作的基础上跟踪参考路径,协助驾驶员完成转向操作,根据动力学模型,控制器的预测方程如下形式:
Xa(k+1|k)=Ssaxx(k)+SsauUa(k)+SsauUh(k)
Za(k+1|k)=Ssazx(k)+SsuzaUa(k)+SsazUh(k)
预测方程中的矩阵具体表达形式如下:
Figure BDA0003626393730000084
Figure BDA0003626393730000091
Figure BDA0003626393730000092
Figure BDA0003626393730000093
Figure BDA0003626393730000094
其中Ra(k+1)为“机器脑”转向控制的参考路径:
Figure BDA0003626393730000095
信息对称条件下“机器脑”控制目标与驾驶员类似,即跟踪一条理想的参考行车轨迹,因此“机器脑”的控制目标表达为如下形式:
Figure BDA0003626393730000096
其中Γsa与Γsua为“机器脑”控制目标目标函数的权重矩阵;
根据安全约束分析,车辆的侧向位置不应超过道路边界:
Figure BDA0003626393730000097
w是车辆的宽度,yr(k+i)和yl(k+i)是道路边界在预测时域的离散值;
此外,必须考虑满足以下约束条件的转向系统饱和:
Δδmin≤Δδf(k+i)≤Δδmax
其中Δδf(k+i)是前轮转角的增量,Δδmin和Δδmax分别是前轮角度变化率的上下界;
“机器脑”的控制策略表示为如下带约束的优化问题:
Figure BDA0003626393730000101
求解“机器脑”的决策变量后按照预定的驾驶权重与驾驶员决策变量进行交互叠加,得到基于模型预测控制的滚动时域的人机决策的预测结果。
第三步中的步骤三通过对人机混合决策模型知识库的静态知识库复杂度与动态知识库复杂度进行分析,从而评价已用知识库的复杂度;
静态知识库复杂度引入信息熵理论确定静态知识库要素的信息熵,考虑静态知识库要素的类型和权重,静态复杂度系数,即信息熵的计算公式为:
Figure BDA0003626393730000102
式中,θ1为静态知识库复杂度系数;h为静态知识库复杂度中各个组成要素所对应分组标签的类型总数;pi为根据静态知识库复杂度构建的图形结构中相同类型节点数与节点总数的比值;
不同静态知识库要素权重根据专家打分确定:
CO=θ1×(β1ΣY12ΣY23ΣY34ΣY45ΣY5)
式中,Co为静态知识库复杂度;βn为静态知识库组成要素中第n个分组所对应的权重;Yn为静态知识库组成要素中第n 个分组内各个组成要素所对应的预设分值之和;
基于引力模型研究,提出动态知识库复杂度与场景中的动态因素有关,复杂度与测试车辆和参与者的速度、两者之间的距离与夹角存在一种数学函数关系,将动态因素对测试车辆的影响作用视为知识库复杂度的场效应机制,测试车辆与参与者之间的相对速度与距离作为衡量场强度的指标,对知识库复杂度的场分布进行数学描述,将动态因素进行抽象概括,根据测试车辆属性与交通参与者属性初步形成具有场效应的复杂度引力模型结构体系,其模型的基本形式为:
C1=c·K1·K2
式中,C1为动态知识库复杂度;K1为测试车辆的属性值;K2为交通参与者的属性值;c为常数;
测试车辆的属性值的计算公式为:
Figure BDA0003626393730000111
式中,a为常系数,为调整模型规范的一个常数;t1为测试车辆的反应时间;v1为测试车辆的行车速度;d1为测试车辆与交通参与者的距离;θ为测试车辆与其他交通参与者之间的夹角;
交通参与者属性值的计算公式为:
Figure BDA0003626393730000112
式中,p为常数;t2为交通参与者的被感测时间;v2为交通参与者的速度;d2为交通参与者的运动距离;
根据静态知识库复杂度和动态知识库复杂度计算得到已用知识库复杂度,即:
C=C0·C1
式中,C为已用知识库复杂度。
第三步中的步骤四通过对人机混合决策模型及知识库进行相似性分析判断更新的必要性,通过评价更新方式分析更新的效果;
人机混合决策模型中神经网络的模型更新过程整体上分为两步,第一步前向传播预测结果,第二步根据预测结果进行反向反馈,人机混合决策模型的相似性分析通过误差偏差量e的范围进行确定,具体过程如下:
1)网络初始化:给各个连接权值以及偏置设定[-1,1]内的随机数,然后设定损失函数e,并且设置学习率以及误差精度;
2)指定训练样本与样本输出:设置训练样本和样本输出,然后传入到神经网络中;
3)隐含层、输出层计算:计算隐含层各神经元的输入和输出,并由此的如输出层的输出结果;
4)误差偏量e的计算:根据网络模型输出层的输出结果与样本实际输出,计算误差偏量e,如果e在范围内则说明模型相似性较高,符合要求,无需进行模型更新,进入7)继续对新样本进行学习,如果不在则进行更新;
5)权值的更新:根据损失函数计算权值的梯度,根据损失函数最小化的原则进行梯度下降,依次从输出层向输入层更新神经元的连接权值;
6)偏置的更新:根据损失函数计算偏置的梯度,根据损失函数最小化的原则进行梯度下降,依次从输出层向输入层更新每一层的偏置;
7)执行下一次学习,进入2);
人机混合决策模型知识库相似性分析需分析静态知识库与动态知识库复杂度的变化情况,根据静态知识库与动态知识库中各元素的重要性权重,设定相似性阈值,当超过阈值时,则对知识库进行更新,不超过阈值说明知识库相似度较高,能够满足人机混合决策模型决策的需求,无需进行更新;
人机混合决策模型与知识库更新方式的评价要考虑更新所用时间、更新的计算量以及更新的准确性这些因素,通过量表分析的方法综合判断。
第三步中的步骤五通过层次分析法将人机混合决策模型的不同评价指标进行重要性排序,分配重要性权重,进而根据各评价指标的评价结果,得到人机混合决策模型的综合评价结果;
将人机混合决策模型的评价指标条理化和层次化,构造出一个有序的、梯次递进的结构模型;
采用专家咨询法构造判断矩阵,请多位资深专家、具有丰富驾驶经验的驾驶员对各评价指标的重要性进行评价打分,通过1-9标度对同一层次的两个评价指标进行重要性比较,从而构建相应的判断矩阵,得到各评价指标的重要性权重;
为保证权重指标的合理性,须根据判断矩阵求出最大特征值之后对判断矩阵进行一致性检验,一致性检验的公式为:
Figure BDA0003626393730000121
式中,RI为层次总排序平均随机一致性指标的标准值,根据判断矩阵阶数不同取不同的值;CI为层次总排序一致性指标,CI的定义及相关计算公式为:
ω=(ω12,...,ωn)T
Figure BDA0003626393730000122
Figure BDA0003626393730000123
式中,λmax为判断矩阵最大特征值;n为判断矩阵的阶数;A为矩阵,如果CR<0.1,说明判断矩阵的一致性良好,满足一致性要求;
各评价指标重要性排序完成后,根据各指标的重要性权重与评价结果得到人机混合决策模型的综合评价结果。
本发明的有益效果:
本发明提供了一种面向高度自动驾驶的人机决策逻辑在线校验方法,避免人机混合决策过程存在的算法局限及故障隐患,克服了人机混合决策模型各层级的不可解释且不可释义特性对智能车辆安全及可信性带来的技术瓶颈,提高了人机混合决策的安全性及可信性。具体有益效果如下:
1、本发明提供了一种数据及信息流输入模型,除人-交通混杂态势数据以外,还包括人机混合决策模型的内模结构、内参以及决策结果等数据,数据结构更加详细且全面,模态更加完整;
2、本发明提供了一种混杂态势可观性及数据质量分析模型,可科学量化地评价人-交通混杂态势的可观程度和人-交通混杂态势多模态数据的数据质量;
3、本发明提供了一种混杂态势危急程度评估模型,可运用数据聚类的方法建立多层级态势边界的回归模型,科学量化地评估混杂态势的危急程度;
4、本发明提供了一种在线评估计算周期模型,通过对态势评估和态势危急程度评估结果进行二维线性规划得到在线评估所需的周期,建立了在线评估周期的计算原则,奠定了在线校验的理论基础;
5、本发明提供了一种人机混合决策模型可解释性的评价模型,使人机混合决策的决策过程更加透明,增加了决策结果的可信性;
6、本发明提供了一种基于模型预测控制的滚动时域决策结果预测模型,可对人机混合决策结果进行预测,作为评估未来人机态势的依据;
7、本发明提供了一种人机混合决策模型内参及已用知识库的评价模型,能够评估已有决策模型及知识库适合当前人机态势的程度,确保了决策的安全性;
8、本发明提供了一种决策模型、内参及知识库更新情况判断模型,为模型及知识库更新以及更新方法评价提供了科学量化的依据;
9、本发明提供了一种人机混合决策综合评价模型,能够对决策模型进行全方位的评价,拓展了决策模型的分析角度,增加了模型的可信度;
综上所述,本发明所提供的人机决策逻辑在线校验方法属于一种通用的人机混合决策模型评价手段,可满足现有域控制器算力的要求,具有较高的可靠性、一致性与普适性,作为一种冗余的功能模块,极大提高了预期功能安全系统的可信性与驾驶人可接受程度。
附图说明
图1为本发明所述的人机决策逻辑在线校验方法的整体步骤示意图。
图2为本发明所述的人机决策逻辑在线校验方法的架构示意图。
图3为本发明所述的第一步涉及的数据及信息流组成示意图。
图4为本发明所述的第二步中步骤一的示例性架构示意图。
图5为本发明所述的第二步中步骤二的示例性架构示意图。
图6为本发明所述的第三步中步骤一的示例性架构示意图。
图7为本发明所述的第三步中步骤二的示例性架构示意图。
图8为本发明所述的第三步中步骤三的示例性架构示意图。
图9为本发明所述的第三步中步骤四的示例性架构示意图。
图10为本发明所述的第三步中步骤五的示例性架构示意图。
具体实施方式
请参阅图1至图10所示:
本发明提供的面向高度自动驾驶的人机决策逻辑在线校验方法,具体方法如下所述:
第一步、数据及信息流输入;
第二步、对在线评估周期进行计算;
第三步、对人机混合决策模型进行综合评价;
第一步中数据及信息流输入的过程如下:
将传感器检测到的人-交通混杂态势的多模态态势数据输入在线评估周期计算模型;将在线评估计算周期、人机混合决策驾驶权评估结果、人机混合增强智能决策模型内参以及人机混合决策内模结构输入人机混合决策综合评估模型。
在附图2中示出第一步涉及的数据及信息流组成的示意图。第一步通过将人-交通混杂态势数据以及来自人机混合决策模型的各种数据整合,输入至在线评估模型中,作为人机混合决策模型的评估依据。
作为输入的人-交通混杂态势的多模态态势数据中包含了可表征驾驶人驾驶能力及驾驶状态的驾驶人态势数据,可表征车辆状态的车辆态势数据和可表征车辆周围交通环境状态的环境态势数据。驾驶人态势数据中,驾驶人的年龄、驾龄、驾驶里程以及受教育程度等指标均可反映驾驶人的驾驶能力,此外,血流量脉冲、皮肤电导以及眼动参数作为三个典型的生理指标,能够在一定程度上反映驾驶人的驾驶状态;车辆态势数据一般包括平均车速、加速度标准差以及前轮转角标准差等反映车辆纵向与横向运动状态的指标;环境态势数据可反映车辆周围交通环境中的行车风险,一般可分为静态障碍物造成的风险与动态障碍物造成的风险,风险大小可进一步通过车头时距、碰撞时间和相对速度等指标或建立行车风险场求解场强的方式来表征。
作为输入的人机混合决策模型的数据包含了模型中深度学习算法的神经元组结构与计算结果、模型内参、模型已用知识库以及决策结果等。
第二步中对在线评估周期进行计算的过程如下:
步骤一、进行人-交通混杂态势可观性分析及人-交通混杂态势的多模态态势数据质量分析。建立包含“人”态势及“交通”态势在内的混杂态势评估模型,通过基于可观性量表的参数分析,评估特定驾驶情景产生的多模态场景信息的可观测程度;通过基于参数逻辑门限的数据质量分析,评估特定驾驶情景产生的多模态场景信息的传输质量。
步骤二、进行人-交通混杂态势危急程度在线评估。通过对人-交通混杂态势的多模态态势数据进行聚类,将表征驾驶人驾驶能力及驾驶状态的驾驶人态势数据、表征车辆状态的车辆态势数据和表征车辆周围交通环境状态的环境态势数据分类,每一类对应人-交通混杂态势危急程度的一个层级;通过对聚类结果进行降维,降低人-交通混杂态势危急层级的复杂度,增加人-交通混杂态势危急层级划分的合理性;通过将聚类结果与物理世界映射,得到人-交通混杂态势危险边界回归模型,建立起多层级人-交通混杂态势边界评价理论体系。
步骤三、进行在线评估周期计算。通过建立基于二维线性规划的态势评估与态势危险度映射模型,确定人机混合决策在线评估模型的计算周期。
在附图3中示出第二步的步骤一的一示例性实施方式。第二步的步骤一通过人-交通混杂态势可观性分析与人-交通混杂态势的多模态态势数据质量分析,建立了混杂态势评估模型。
人-交通混杂态势可观性分析采用基于量表评价的分析方法。对人-交通混杂态势的观测可分为对驾驶人驾驶能力及驾驶状态的观测、对车辆状态的观测以及对车辆周围行驶环境的观测三个部分,这三部分的可观性共同决定了混杂态势的可观性。因此,可在上述三个待观测的部分中分别选取能够表征可观性的参数,并为参数设定阈值,将这些参数汇总制作可观性量表,通过对其中参数进行分析判断人-交通混杂态势可观性。
人-交通混杂态势的多模态态势数据质量分析主要评估数据的内在质量、数据量的适当程度以及数据的时效性。
数据的内在质量可分为两个维度,包括数据正确性和数据精度。正确性评估数据正确、可靠和无错误的程度,精度是指数据采集和存储的精度。对于数据集L,设数据正确性和数据精度的量化值分别为qc、qp,其最低质量要求分别为θc、θp,则数据集L必须满足最低内在质量要求,如下式所示:
R=(qc≥θc)∩(qp≥θp)
数据li∈L的正确性用qc i表示,精度用qp i表示,则数据集L的正确性和精度可以通过平均函数计算:
Figure BDA0003626393730000151
Figure BDA0003626393730000161
数据量的适当程度是数据质量分析的又一个维度。在多数情况下,数据越多,训练模型(如深度学习模型)的性能就越高,但是,当数据集的大小超过某个最佳点时,不但会造成不必要的计算和存储资源浪费,还会降低决策性能。因此,用于当前任务的数据集的数据数量应该足够完成当前任务,且不会引起额外的资源浪费。
数据的时效性是指当前数据库中的数据适合当前任务的程度。时效性的一般用两个参数来量化——currency与volatility,其中,currency指数据的使用期限,volatility指数据保持有效的时间,可通过数据集中数据片段的最大或平均时效性来评估数据集L的时效性。
在附图4中示出第二步的步骤二的一示例性实施方式。第二步的步骤二通过基于数据驱动的机器学习算法,将人-交通混杂态势的多模态态势数据进行聚类,从而建立起混杂态势的危急程度评估模型。
混杂态势危急程度评估模型采用蚁群算法对人-交通混杂态势数据进行聚类。假设用于蚁群搜索的人-交通混杂态势的多模态态势数据集L具有m个独立参数特征及其对应的E个观测变量,基于蚁群聚类的人-交通混杂态势分类即为在L中找到可以使每个数据样本到达聚类数目已知的聚类中心的距离之和达到最小的划分,如下式:
Figure BDA0003626393730000162
Figure BDA0003626393730000163
式中,lip为第i个数据样本的第p个模型参数特征,cjp为第j个类中心的第p个模型参数特征,Ej为观测变量E中第j类对应的观测变量,ωij为观测变量与分类间的从属关系标志量。蚁群聚类的分类质量通过迭代更新方程提高,更新方程如下式所示:
Figure 5
式中,Pij为数据样本跨类转换的概率,τij为数据样本i和所属类j间的标准化信息素,ρ(0<ρ<1)为信息素挥发度,τij(t)为数据样本i和所属类j在t时刻的信息素浓度。
当聚类结果的类别较多,与物理世界中预设的人-交通混杂态势层次数不一致时,可按照预设的人-交通混杂态势层次数,将聚类结果中相近的类别划分为一类进行降维。另外,由于聚类后的聚类结果尚不具有物理意义,还需要建立聚类结果与物理世界中预设的人-交通混杂态势各层次的映射关系。考虑到待映射元素间存在逻辑联系,但并无可解释的物理及数理推导关系,故采用多维线性优化回归模型,得到人-交通混杂态势评价方程表达式如下式所示:
Figure BDA0003626393730000171
式中,SOCX为人-交通混杂态势危急程度,
Figure BDA0003626393730000172
为人-交通混杂态势的多模态态势数据集L的有效值子集,β为回归系数。
第三步中对人机混合决策模型进行综合评价的过程如下:
步骤一、进行人机混合决策模型可解释性评价。人机混合决策评价模型通过对人机混合增强决策中所用到的深度学习模型的可解释性进行研究,分析神经元组结构、算力及计算结果,实现对人机混合决策模型可解释性评价。
步骤二、进行基于模型预测控制的滚动时域决策结果预测。通过模型预测控制模拟人脑的决策过程,根据驾驶员预瞄原理,得到驾驶员在滚动时域的决策结果;通过模型预测控制模拟“机器脑”的决策过程,在考虑驾驶员操作的基础上跟踪参考路径,协助驾驶员完成操作。
步骤三、进行人机混合决策模型已用知识库评价。通过对人机混合决策模型知识库的场景元素的复杂度进行分析,从而得到已用知识库的复杂程度,可作为判断人机混合决策模型可信性的一个依据。
步骤四、进行人机混合决策模型及知识库更新情况判断。通过对人机混合决策模型、内参及知识库进行相似性分析,设定更新阈值,从而判断更新的必要性;通过对人机混合决策模型、内参及知识库更新方式进行评价,分析更新的效果。
步骤五、进行基于层次分析法的人机混合决策模型综合评价。通过分析上述评价指标之间的影响关系建立层次结构模型,根据专家经验构造判断矩阵;通过层析排序确定评价指标的影响权重,进行一致性检验验证重要性排序的正确性;根据各指标的评价结果与层次分析法所得的排序结果,得到人机混合决策逻辑多层级在线校验结果,作为人机混合决策逻辑的在线反馈数据。
在附图5中示出第三步的步骤一的一示例性实施方式。在人机混合决策过程中,混合增强智能理论能够获得环境信息、车辆状态信息以及人的推断信息,机器通过深度学习与强化学习理解人的推断过程与决策模式,以类脑计算模式填补人的决策缺陷,赋予自动驾驶系统较强的决策能力,实现“人机超脑决策”模式。为保证决策结果的安全性与可信性,需对人机混合决策模型中的深度学习模型进行可解释性研究。
首先获取骨干网络最后一层全连接层的分类权重,以此作为决策树叶子节点,构建决策树层次结构。通过对节点输出进行可视化,使得深度决策树可解释性不再局限于节点精度及决策路径,而是能够在空间位置上给出可视化解释,直观理解模型逐层决策依据。同时,通过基于卷积核相关度验证模型可解释性的方法,对于模型输出特征图组进行扰动,以节点注意力图与决策路径变化为依据,验证决策树分类依据的可靠性。
在传统的基于类激活映射的可视化方法中,将最后一层卷积层输出的k个特征映射图Ak进行加权平均池化,得出注意力图。具体来说,让倒数第二层产生K个特征图,Ak∈Ru ×v,每个元素以i,j为索引,所以Ak i,j指的是特征图Ak在位置(i, j)的激活。然后使用全局平均池化对这些特征图进行空间池化,并对其进行线性变换,产生每个类c的得分Yc,如下式所示:
Figure BDA0003626393730000181
在计算ak (c)的过程中,需要计算反向传播梯度与激活函数,即对权重矩阵与激活函数的连续矩阵进行乘积,直到梯度被传播到最终的卷积层。这些反向传播的梯度在宽度与高度维度(分别以i和j为索引)上进行全局平均池化,从而得到神经元重要性权重ak (c),如下式所示:
Figure BDA0003626393730000182
权重ak (c)代表了深度学习网络特征图的部分线性化,并获得特征图k对目标类c的重要性,对前向激活图进行加权组合,并在其后进行激活函数映射,可得到模型构建的注意力图,如下式所示:
Figure BDA0003626393730000183
采用优化类激活映射算法,将全局平均池化后的权重ak (c)转化为基于矩阵值权重Wk (c),如下式所示:
Figure BDA0003626393730000184
其主要方式为经由模型最后一层卷积层后去掉全局平均池化层,对卷积层输出进行可视化从而保留最后一层卷积层的空间位置信息。
使用哈达玛积对特征图与权重Wk (c)作乘,记为Wk (c)*Ak。在哈达玛积的定义当中,若A=(aij)与矩阵B=(bij)为同阶矩阵,其哈达玛积记为C=(cij),如下式所示:
Figure BDA0003626393730000185
Wk (c)与Ak同为m×n矩阵,因哈达玛积能最大限度保留空间位置信息,突出显著性决策区域,所以使用哈达玛积将权重 Wk (c)与特征图相乘,输出权重特征图,如下式所示:
Figure BDA0003626393730000186
所提出的优化类激活映射图保留了ReLU激活函数并将其应用于特征图的线性组合,因为ReLU激活函数能够有效区分相关和不相关的像素并提取对分类结果类有较高贡献度的特征。随后在特征图组中构建激活映射,对经过激活函数的特征图进行显著性映射求和得到注意力图,如下式所示:
Figure BDA0003626393730000191
度量卷积核单元相关度使用IoU算法,在不同的网络中能够比较不同表征的可解释性,探究骨干网络相关卷积核对于模型类别的影响程度,以此验证决策依据的置信度,如下式所示:
Figure BDA0003626393730000192
上述公式主要通过计算该层特征图二值化激活区域与不同语义标签结果的交并比来确定该层卷积核所具备的语义信息。其中,x代表输入样本,c代表类别信息,k代表某一卷积层的第k个卷积核单元,Lc(x)为输入图像的像素级标注区域,Mc(x) 为像素的单元激活图Ak(x)进行上采样得到的激活图,并与输入像素的图像级标注Lc(x)进行比较,进行二值化语义分割。设定默认阈值为IoUk,c>0.05,当存在卷积核单元对应多个语义相关时取IoU最大值,则此卷积核单元为特定类别语义单元。
在附图6中示出第三步的步骤二的一示例性实施方式。第三步的步骤二基于模型预测控制的方法对滚动时域内的人机混合决策结果进行预测,可增强人机决策结果的一致性。
以信息对称条件下人机协同转向操作为例,驾驶员在对称条件对控制器具备一定的适应性,利用模型预测控制模拟人脑的决策过程,根据驾驶员预瞄原理,驾驶员未来状态的预测方程如下所示:
Xh(k+1|k)=Sshxx(k)+SshuUa(k)+SshuUh(k)
Zh(k+1|k)=Sshzx(k)+SshuUa(k)+SshuUh(k)
其中预测方程中的矩阵如下所示:
Figure BDA0003626393730000193
Figure BDA0003626393730000194
Figure BDA0003626393730000201
Figure BDA0003626393730000202
Figure BDA0003626393730000203
式中,δh为驾驶员的控制输入,δh为“机器脑”的控制输入,P为预测步数,N为控制步数。驾驶员的决策过程与控制器类似,其主要目标为跟踪所预瞄的理想的参考路径,驾驶员的理想路径用Rh(k+1)表示:
Rh(k+1)=[rh(k+1) rh(k+2) … rh(k+P)]T
驾驶员的目标由两部分表达,其中一部分是对理想路径跟踪,另一部分是对控制量的惩罚项,而两个目标通过权重Γsh与Γsuh进行权衡,因此驾驶员的决策可由以下控制目标优化求解表达:
Figure BDA0003626393730000204
求解获得驾驶员的决策变量Uh(k)后,选取Uh(k)的第一个量进行执行。
“机器脑”接收驾驶员的控制变量,在考虑驾驶员操作的基础上跟踪参考路径,协助驾驶员完成转向操作,根据动力学模型,控制器的预测方程如下形式:
Xa(k+1|k)=Ssaxx(k)+SsauUa(k)+SsauUh(k)
Za(k+1|k)=Ssazx(k)+SsuzaUa(k)+SsazUh(k)
预测方程中的矩阵具体表达形式如下:
Figure BDA0003626393730000211
Figure BDA0003626393730000212
Figure BDA0003626393730000213
Figure BDA0003626393730000214
Figure BDA0003626393730000215
其中Ra(k+1)为“机器脑”转向控制的参考路径:
Figure BDA0003626393730000216
信息对称条件下“机器脑”控制目标与驾驶员类似,即跟踪一条理想的参考行车轨迹,因此“机器脑”的控制目标可以表达为如下形式:
Figure BDA0003626393730000217
其中Γsa与Γsua为“机器脑”控制目标目标函数的权重矩阵。
根据安全约束分析,车辆的侧向位置不应超过道路边界:
Figure BDA0003626393730000221
w是车辆的宽度,yr(k+i)和yl(k+i)是道路边界在预测时域的离散值。
此外,必须考虑满足以下约束条件的转向系统饱和:
Δδmin≤Δδf(k+i)≤Δδmax
其中Δδf(k+i)是前轮转角的增量,Δδmin和Δδmax分别是前轮角度变化率的上下界。
因此“机器脑”的控制策略可以表示为如下带约束的优化问题:
Figure BDA0003626393730000222
求解“机器脑”的决策变量后按照预定的驾驶权重与驾驶员决策变量进行交互叠加,即可得基于模型预测控制的滚动时域的人机决策的预测结果。
在附图7中示出第三步的步骤三的一示例性实施方式。第三步的步骤三通过对人机混合决策模型知识库的静态知识库复杂度与动态知识库复杂度进行分析,从而评价已用知识库的复杂度。
静态知识库复杂度引入信息熵理论确定静态知识库要素的信息熵,考虑静态知识库要素的类型和权重。静态复杂度系数 (信息熵)计算公式为:
Figure BDA0003626393730000223
式中,θ1为静态知识库复杂度系数;h为静态知识库复杂度中各个组成要素所对应分组标签的类型总数;pi为根据静态知识库复杂度构建的图形结构中相同类型节点数与节点总数的比值。
不同静态知识库要素权重根据专家打分确定:
CO=θ1×(β1ΣY12ΣY23ΣY34ΣY45ΣY5)
式中,Co为静态知识库复杂度;βn为静态知识库组成要素中第n个分组所对应的权重;Yn为静态知识库组成要素中第n个分组内各个组成要素所对应的预设分值之和。
基于引力模型研究,提出动态知识库复杂度与场景中的动态因素有关,复杂度与测试车辆和参与者的速度、两者之间的距离与夹角等存在某种数学函数关系。将动态因素对测试车辆的影响作用视为知识库复杂度的场效应机制,测试车辆与参与者之间的相对速度与距离作为衡量场强度的指标,对知识库复杂度的场分布进行数学描述,将动态因素进行抽象概括。根据测试车辆属性与交通参与者属性初步形成具有场效应的复杂度引力模型结构体系,其模型的基本形式为:
C1=c·K1·K2
式中,C1为动态知识库复杂度;K1为测试车辆的属性值;K2为交通参与者的属性值;c为常数。
测试车辆的属性值的计算公式为:
Figure BDA0003626393730000231
式中,a为常系数,为调整模型规范的一个常数;t1为测试车辆的反应时间;v1为测试车辆的行车速度;d1为测试车辆与交通参与者的距离;θ为测试车辆与其他交通参与者之间的夹角。
交通参与者属性值的计算公式为:
Figure BDA0003626393730000232
式中,p为常数;t2为交通参与者的被感测时间;v2为交通参与者的速度;d2为交通参与者的运动距离。
根据静态知识库复杂度和动态知识库复杂度计算得到已用知识库复杂度,即:
C=C0·C1
式中,C为已用知识库复杂度。
在附图8中示出第三步的步骤四的一示例性实施方式。通过对人机混合决策模型及知识库进行相似性分析判断更新的必要性,通过评价更新方式分析更新的效果。
人机混合决策模型中神经网络的模型更新过程整体上可以分为两步,第一步前向传播预测结果,第二步根据预测结果进行反向反馈。人机混合决策模型的相似性分析通过误差偏差量e的范围进行确定,具体过程为:
1)网络初始化:给各个连接权值以及偏置设定[-1,1]内的随机数,然后设定损失函数e,并且设置学习率以及误差精度;
2)指定训练样本与样本输出:设置训练样本和样本输出,然后传入到神经网络中;
3)隐含层、输出层计算:计算隐含层各神经元的输入和输出,并由此的如输出层的输出结果;
4)误差偏量e的计算:根据网络模型输出层的输出结果与样本实际输出,计算误差偏量e,如果e在范围内则说明模型相似性较高,符合要求,无需进行模型更新,进入(7)继续对新样本进行学习即可,如果不在则进行更新;
5)权值的更新:根据损失函数计算权值的梯度,根据损失函数最小化的原则进行梯度下降,依次从输出层向输入层更新神经元的连接权值;
6)偏置的更新:根据损失函数计算偏置的梯度,根据损失函数最小化的原则进行梯度下降,依次从输出层向输入层更新每一层的偏置;
7)执行下一次学习,进入(2)。
人机混合决策模型知识库相似性分析需分析静态知识库与动态知识库复杂度的变化情况,根据静态知识库与动态知识库中各元素的重要性权重,设定相似性阈值,当超过阈值时,则对知识库进行更新,不超过阈值说明知识库相似度较高,能够满足人机混合决策模型决策的需求,无需进行更新。
人机混合决策模型与知识库更新方式的评价可考虑更新所用时间、更新的计算量、更新的准确性等因素,通过量表分析的方法综合判断。
在附图9中示出第三步的步骤五的一示例性实施方式。通过层次分析法将人机混合决策模型的不同评价指标进行重要性排序,分配重要性权重,进而根据各评价指标的评价结果,得到人机混合决策模型的综合评价结果。
将人机混合决策模型的评价指标条理化和层次化,构造出一个有序的、梯次递进的结构模型。
采用专家咨询法构造判断矩阵,请多位资深专家、具有丰富驾驶经验的驾驶员对各评价指标的重要性进行评价打分,通过1-9标度对同一层次的两个评价指标进行重要性比较,从而构建相应的判断矩阵,得到各评价指标的重要性权重。
为保证权重指标的合理性,须根据判断矩阵求出最大特征值之后对判断矩阵进行一致性检验,一致性检验的公式为:
Figure BDA0003626393730000241
式中,RI为层次总排序平均随机一致性指标的标准值,根据判断矩阵阶数不同取不同的值;CI为层次总排序一致性指标。CI的定义及相关计算公式为:
ω=(ω12,...,ωn)T
Figure BDA0003626393730000251
Figure BDA0003626393730000252
式中,λmax为判断矩阵最大特征值;n为判断矩阵的阶数;A为矩阵。如果CR<0.1,说明判断矩阵的一致性良好,满足一致性要求。
各评价指标重要性排序完成后,即可根据各指标的重要性权重与评价结果得到人机混合决策模型的综合评价结果。

Claims (8)

1.一种面向高度自动驾驶的人机决策逻辑在线校验方法,其特征在于:其方法包括如下步骤:
第一步、数据及信息流输入,具体步骤如下:
将传感器检测到的人-交通混杂态势的多模态态势数据输入在线评估周期计算模型;将在线评估计算周期、人机混合决策驾驶权评估结果、人机混合增强智能决策模型内参以及人机混合决策内模结构输入人机混合决策综合评估模型,作为人机混合决策模型的评估依据;
作为输入的人-交通混杂态势的多模态态势数据中包含了可表征驾驶人驾驶能力及驾驶状态的驾驶人态势数据,可表征车辆状态的车辆态势数据和可表征车辆周围交通环境状态的环境态势数据;驾驶人态势数据中,驾驶人的年龄、驾龄、驾驶里程以及受教育程度的指标能够反映驾驶人的驾驶能力,此外,血流量脉冲、皮肤电导以及眼动参数作为三个典型的生理指标,能够在一定程度上反映驾驶人的驾驶状态;车辆态势数据包括平均车速、加速度标准差以及前轮转角标准差所反映的车辆纵向与横向运动状态的指标;环境态势数据能够反映车辆周围交通环境中的行车风险,分为静态障碍物造成的风险与动态障碍物造成的风险,风险大小通过车头时距、碰撞时间和相对速度的指标或建立行车风险场求解场强的方式来表征;
作为输入的人机混合决策模型的数据包含了模型中深度学习算法的神经元组结构与计算结果、模型内参、模型已用知识库以及决策结果;
第二步、对在线评估周期进行计算,具体步骤如下:
步骤一、进行人-交通混杂态势可观性分析及人-交通混杂态势的多模态态势数据质量分析,建立包含“人”态势及“交通”态势在内的混杂态势评估模型,通过基于可观性量表的参数分析,评估特定驾驶情景产生的多模态场景信息的可观测程度;通过基于参数逻辑门限的数据质量分析,评估特定驾驶情景产生的多模态场景信息的传输质量;
步骤二、进行人-交通混杂态势危急程度在线评估,通过对人-交通混杂态势的多模态态势数据进行聚类,将表征驾驶人驾驶能力及驾驶状态的驾驶人态势数据、表征车辆状态的车辆态势数据和表征车辆周围交通环境状态的环境态势数据分类,每一类对应人-交通混杂态势危急程度的一个层级;通过对聚类结果进行降维,降低人-交通混杂态势危急层级的复杂度,增加人-交通混杂态势危急层级划分的合理性;通过将聚类结果与物理世界映射,得到人-交通混杂态势危险边界回归模型,建立起多层级人-交通混杂态势边界评价理论体系;
步骤三、进行在线评估周期计算,通过建立基于二维线性规划的态势评估与态势危险度映射模型,确定人机混合决策在线评估模型的计算周期;
第三步、对人机混合决策模型进行综合评价,具体步骤如下:
步骤一、进行人机混合决策模型可解释性评价,人机混合决策评价模型通过对人机混合增强决策中所用到的深度学习模型的可解释性进行研究,分析神经元组结构、算力及计算结果,实现对人机混合决策模型可解释性评价;
步骤二、进行基于模型预测控制的滚动时域决策结果预测,通过模型预测控制模拟人脑的决策过程,根据驾驶员预瞄原理,得到驾驶员在滚动时域的决策结果;通过模型预测控制模拟“机器脑”的决策过程,在考虑驾驶员操作的基础上跟踪参考路径,协助驾驶员完成操作;
步骤三、进行人机混合决策模型已用知识库评价,通过对人机混合决策模型知识库的场景元素的复杂度进行分析,从而得到已用知识库的复杂程度,作为判断人机混合决策模型可信性的一个依据;
步骤四、进行人机混合决策模型及知识库更新情况判断,通过对人机混合决策模型、内参及知识库进行相似性分析,设定更新阈值,从而判断更新的必要性;通过对人机混合决策模型、内参及知识库更新方式进行评价,分析更新的效果;
步骤五、进行基于层次分析法的人机混合决策模型综合评价,通过分析上述步骤一至步骤四中评价指标之间的影响关系建立层次结构模型,根据专家经验构造判断矩阵;通过层析排序确定评价指标的影响权重,进行一致性检验验证重要性排序的正确性;根据各指标的评价结果与层次分析法所得的排序结果,得到人机混合决策逻辑多层级在线校验结果,作为人机混合决策逻辑的在线反馈数据。
2.根据权利要求1所述的一种面向高度自动驾驶的人机决策逻辑在线校验方法,其特征在于:所述的第二步中的步骤一通过人-交通混杂态势可观性分析与人-交通混杂态势的多模态态势数据质量分析,建立了混杂态势评估模型,具体如下:
人-交通混杂态势可观性分析采用基于量表评价的分析方法,对人-交通混杂态势的观测分为对驾驶人驾驶能力及驾驶状态的观测、对车辆状态的观测以及对车辆周围行驶环境的观测三个部分,这三部分的可观性共同决定了混杂态势的可观性,在上述三个待观测的部分中分别选取能够表征可观性的参数,并为参数设定阈值,将这些参数汇总制作可观性量表,通过对其中参数进行分析判断人-交通混杂态势可观性;
人-交通混杂态势的多模态态势数据质量分析主要评估数据的内在质量、数据量的适当程度以及数据的时效性;
数据的内在质量分为两个维度,包括数据正确性和数据精度,正确性评估数据正确、可靠和无错误的程度,精度是指数据采集和存储的精度,对于数据集L,设数据正确性和数据精度的量化值分别为qc、qp,其最低质量要求分别为θc、θp,则数据集L必须满足最低内在质量要求,如下式所示:
R=(qc≥θc)∩(qp≥θp)
数据li∈L的正确性用qc i表示,精度用qp i表示,则数据集L的正确性和精度可以通过平均函数计算:
Figure FDA0003626393720000041
Figure FDA0003626393720000042
数据量的适当程度是数据质量分析的又一个维度,数据越多,训练模型的性能就越高,用于当前任务的数据集的数据数量要足够完成当前任务,且不会引起额外的资源浪费;
数据的时效性是指当前数据库中的数据适合当前任务的程度,时效性用两个参数来量化,即currency与volatility,其中,currency指数据的使用期限,volatility指数据保持有效的时间,通过数据集中数据片段的最大或平均时效性来评估数据集L的时效性。
3.根据权利要求1所述的一种面向高度自动驾驶的人机决策逻辑在线校验方法,其特征在于:所述的第二步中的步骤二通过基于数据驱动的机器学习算法,将人-交通混杂态势的多模态态势数据进行聚类,从而建立起混杂态势的危急程度评估模型,具体如下:
混杂态势危急程度评估模型采用蚁群算法对人-交通混杂态势数据进行聚类,假设用于蚁群搜索的人-交通混杂态势的多模态态势数据集L具有m个独立参数特征及其对应的E个观测变量,基于蚁群聚类的人-交通混杂态势分类即为在L中找到能够使每个数据样本到达聚类数目已知的聚类中心的距离之和达到最小的划分,如下式:
Figure FDA0003626393720000051
Figure FDA0003626393720000052
式中,lip为第i个数据样本的第p个模型参数特征,cjp为第j个类中心的第p个模型参数特征,Ej为观测变量E中第j类对应的观测变量,ωij为观测变量与分类间的从属关系标志量,蚁群聚类的分类质量通过迭代更新方程提高,更新方程如下式所示:
Figure FDA0003626393720000053
式中,Pij为数据样本跨类转换的概率,τij为数据样本i和所属类j间的标准化信息素,ρ(0<ρ<1)为信息素挥发度,τij(t)为数据样本i和所属类j在t时刻的信息素浓度;
当聚类结果的类别较多,与物理世界中预设的人-交通混杂态势层次数不一致时,按照预设的人-交通混杂态势层次数,将聚类结果中相近的类别划分为一类进行降维,另外,还需要建立聚类结果与物理世界中预设的人-交通混杂态势各层次的映射关系,考虑到待映射元素间存在逻辑联系,但并无可解释的物理及数理推导关系,采用多维线性优化回归模型,得到人-交通混杂态势评价方程表达式如下式所示:
Figure FDA0003626393720000061
式中,SOCX为人-交通混杂态势危急程度,
Figure FDA0003626393720000062
为人-交通混杂态势的多模态态势数据集L的有效值子集,β为回归系数。
4.根据权利要求1所述的一种面向高度自动驾驶的人机决策逻辑在线校验方法,其特征在于:所述的第三步中的步骤一在人机混合决策过程中,混合增强智能理论能够获得环境信息、车辆状态信息以及人的推断信息,机器通过深度学习与强化学习理解人的推断过程与决策模式,以类脑计算模式填补人的决策缺陷,赋予自动驾驶系统较强的决策能力,实现“人机超脑决策”模式,为保证决策结果的安全性与可信性,对人机混合决策模型中的深度学习模型进行可解释性研究,具体如下:
首先获取骨干网络最后一层全连接层的分类权重,以此作为决策树叶子节点,构建决策树层次结构,通过对节点输出进行可视化,使得深度决策树可解释性不再局限于节点精度及决策路径,而是能够在空间位置上给出可视化解释,直观理解模型逐层决策依据,同时,通过基于卷积核相关度验证模型可解释性的方法,对于模型输出特征图组进行扰动,以节点注意力图与决策路径变化为依据,验证决策树分类依据的可靠性;
在传统的基于类激活映射的可视化方法中,将最后一层卷积层输出的k个特征映射图Ak进行加权平均池化,得出注意力图,具体来说,让倒数第二层产生K个特征图,Ak∈Ru×v,每个元素以i,j为索引,所以Ak i,j指的是特征图Ak在位置(i,j)的激活,然后使用全局平均池化对这些特征图进行空间池化,并对其进行线性变换,产生每个类c的得分Yc,如下式所示:
Figure FDA0003626393720000071
在计算ak (c)的过程中,需要计算反向传播梯度与激活函数,即对权重矩阵与激活函数的连续矩阵进行乘积,直到梯度被传播到最终的卷积层,这些反向传播的梯度在宽度与高度维度上进行全局平均池化,分别以i和j为索引,从而得到神经元重要性权重ak (c),如下式所示:
Figure FDA0003626393720000072
权重ak (c)代表了深度学习网络特征图的部分线性化,并获得特征图k对目标类c的重要性,对前向激活图进行加权组合,并在其后进行激活函数映射,得到模型构建的注意力图,如下式所示:
Figure FDA0003626393720000073
采用优化类激活映射算法,将全局平均池化后的权重ak (c)转化为基于矩阵值权重Wk (c),如下式所示:
Figure FDA0003626393720000074
其主要方式为经由模型最后一层卷积层后去掉全局平均池化层,对卷积层输出进行可视化从而保留最后一层卷积层的空间位置信息;
使用哈达玛积对特征图与权重Wk (c)作乘,记为Wk (c)*Ak,在哈达玛积的定义当中,若A=(aij)与矩阵B=(bij)为同阶矩阵,其哈达玛积记为C=(cij),如下式所示:
Figure FDA0003626393720000075
Wk (c)与Ak同为m×n矩阵,因哈达玛积能最大限度保留空间位置信息,突出显著性决策区域,所以使用哈达玛积将权重Wk (c)与特征图相乘,输出权重特征图,如下式所示:
Figure FDA0003626393720000081
所提出的优化类激活映射图保留了ReLU激活函数并将其应用于特征图的线性组合,ReLU激活函数能够有效区分相关和不相关的像素并提取对分类结果类有较高贡献度的特征,随后在特征图组中构建激活映射,对经过激活函数的特征图进行显著性映射求和得到注意力图,如下式所示:
Figure FDA0003626393720000082
度量卷积核单元相关度使用IoU算法,在不同的网络中能够比较不同表征的可解释性,探究骨干网络相关卷积核对于模型类别的影响程度,以此验证决策依据的置信度,如下式所示:
Figure FDA0003626393720000083
上述公式通过计算该层特征图二值化激活区域与不同语义标签结果的交并比来确定该层卷积核所具备的语义信息,其中,x代表输入样本,c代表类别信息,k代表某一卷积层的第k个卷积核单元,Lc(x)为输入图像的像素级标注区域,Mc(x)为像素的单元激活图Ak(x)进行上采样得到的激活图,并与输入像素的图像级标注Lc(x)进行比较,进行二值化语义分割,设定默认阈值为IoUk,c>0.05,当存在卷积核单元对应多个语义相关时取IoU最大值,则此卷积核单元为特定类别语义单元。
5.根据权利要求1所述的一种面向高度自动驾驶的人机决策逻辑在线校验方法,其特征在于:所述的第三步中的步骤二基于模型预测控制的方法对滚动时域内的人机混合决策结果进行预测,可增强人机决策结果的一致性;
以信息对称条件下人机协同转向操作为例,驾驶员在对称条件对控制器具备一定的适应性,利用模型预测控制模拟人脑的决策过程,根据驾驶员预瞄原理,驾驶员未来状态的预测方程如下所示:
Xh(k+1|k)=Sshxx(k)+SshuUa(k)+SshuUh(k)
Zh(k+1|k)=Sshzx(k)+SshuUa(k)+SshuUh(k)
其中预测方程中的矩阵如下所示:
Figure FDA0003626393720000091
Figure FDA0003626393720000092
Figure FDA0003626393720000093
Figure FDA0003626393720000094
Figure FDA0003626393720000095
式中,δh为驾驶员的控制输入,δh为“机器脑”的控制输入,P为预测步数,N为控制步数,驾驶员的决策过程与控制器类似,其主要目标为跟踪所预瞄的理想的参考路径,驾驶员的理想路径用Rh(k+1)表示:
Rh(k+1)=[rh(k+1) rh(k+2)…rh(k+P)]T
驾驶员的目标由两部分表达,其中一部分是对理想路径跟踪,另一部分是对控制量的惩罚项,而两个目标通过权重Γsh与Γsuh进行权衡,因此驾驶员的决策可由以下控制目标优化求解表达:
Figure FDA0003626393720000101
求解获得驾驶员的决策变量Uh(k)后,选取Uh(k)的第一个量进行执行;
“机器脑”接收驾驶员的控制变量,在考虑驾驶员操作的基础上跟踪参考路径,协助驾驶员完成转向操作,根据动力学模型,控制器的预测方程如下形式:
Xa(k+1|k)=Ssaxx(k)+SsauUa(k)+SsauUh(k)
Za(k+1|k)=Ssazx(k)+SsuzaUa(k)+SsazUh(k)
预测方程中的矩阵具体表达形式如下:
Figure FDA0003626393720000102
Figure FDA0003626393720000103
Figure FDA0003626393720000111
Figure FDA0003626393720000112
Figure FDA0003626393720000113
其中Ra(k+1)为“机器脑”转向控制的参考路径:
Figure FDA0003626393720000114
信息对称条件下“机器脑”控制目标与驾驶员类似,即跟踪一条理想的参考行车轨迹,因此“机器脑”的控制目标表达为如下形式:
Figure FDA0003626393720000115
其中Γsa与Γsua为“机器脑”控制目标目标函数的权重矩阵;
根据安全约束分析,车辆的侧向位置不应超过道路边界:
Figure FDA0003626393720000116
w是车辆的宽度,yr(k+i)和yl(k+i)是道路边界在预测时域的离散值;
此外,必须考虑满足以下约束条件的转向系统饱和:
Δδmin≤Δδf(k+i)≤Δδmax
其中Δδf(k+i)是前轮转角的增量,Δδmin和Δδmax分别是前轮角度变化率的上下界;
“机器脑”的控制策略表示为如下带约束的优化问题:
Figure FDA0003626393720000121
求解“机器脑”的决策变量后按照预定的驾驶权重与驾驶员决策变量进行交互叠加,得到基于模型预测控制的滚动时域的人机决策的预测结果。
6.根据权利要求1所述的一种面向高度自动驾驶的人机决策逻辑在线校验方法,其特征在于:所述的第三步中的步骤三通过对人机混合决策模型知识库的静态知识库复杂度与动态知识库复杂度进行分析,从而评价已用知识库的复杂度;
静态知识库复杂度引入信息熵理论确定静态知识库要素的信息熵,考虑静态知识库要素的类型和权重,静态复杂度系数,即信息熵的计算公式为:
Figure FDA0003626393720000122
式中,θ1为静态知识库复杂度系数;h为静态知识库复杂度中各个组成要素所对应分组标签的类型总数;pi为根据静态知识库复杂度构建的图形结构中相同类型节点数与节点总数的比值;
不同静态知识库要素权重根据专家打分确定:
CO=θ1×(β1∑Y12∑Y23∑Y34∑Y45∑Y5)
式中,Co为静态知识库复杂度;βn为静态知识库组成要素中第n个分组所对应的权重;Yn为静态知识库组成要素中第n个分组内各个组成要素所对应的预设分值之和;
基于引力模型研究,提出动态知识库复杂度与场景中的动态因素有关,复杂度与测试车辆和参与者的速度、两者之间的距离与夹角存在一种数学函数关系,将动态因素对测试车辆的影响作用视为知识库复杂度的场效应机制,测试车辆与参与者之间的相对速度与距离作为衡量场强度的指标,对知识库复杂度的场分布进行数学描述,将动态因素进行抽象概括,根据测试车辆属性与交通参与者属性初步形成具有场效应的复杂度引力模型结构体系,其模型的基本形式为:
C1=c·K1·K2
式中,C1为动态知识库复杂度;K1为测试车辆的属性值;K2为交通参与者的属性值;c为常数;
测试车辆的属性值的计算公式为:
Figure FDA0003626393720000131
式中,a为常系数,为调整模型规范的一个常数;t1为测试车辆的反应时间;v1为测试车辆的行车速度;d1为测试车辆与交通参与者的距离;θ为测试车辆与其他交通参与者之间的夹角;
交通参与者属性值的计算公式为:
Figure FDA0003626393720000132
式中,p为常数;t2为交通参与者的被感测时间;v2为交通参与者的速度;d2为交通参与者的运动距离;
根据静态知识库复杂度和动态知识库复杂度计算得到已用知识库复杂度,即:
C=C0·C1
式中,C为已用知识库复杂度。
7.根据权利要求1所述的一种面向高度自动驾驶的人机决策逻辑在线校验方法,其特征在于:所述的第三步中的步骤四通过对人机混合决策模型及知识库进行相似性分析判断更新的必要性,通过评价更新方式分析更新的效果;
人机混合决策模型中神经网络的模型更新过程整体上分为两步,第一步前向传播预测结果,第二步根据预测结果进行反向反馈,人机混合决策模型的相似性分析通过误差偏差量e的范围进行确定,具体过程如下:
1)网络初始化:给各个连接权值以及偏置设定[-1,1]内的随机数,然后设定损失函数e,并且设置学习率以及误差精度;
2)指定训练样本与样本输出:设置训练样本和样本输出,然后传入到神经网络中;
3)隐含层、输出层计算:计算隐含层各神经元的输入和输出,并由此的如输出层的输出结果;
4)误差偏量e的计算:根据网络模型输出层的输出结果与样本实际输出,计算误差偏量e,如果e在范围内则说明模型相似性较高,符合要求,无需进行模型更新,进入7)继续对新样本进行学习,如果不在则进行更新;
5)权值的更新:根据损失函数计算权值的梯度,根据损失函数最小化的原则进行梯度下降,依次从输出层向输入层更新神经元的连接权值;
6)偏置的更新:根据损失函数计算偏置的梯度,根据损失函数最小化的原则进行梯度下降,依次从输出层向输入层更新每一层的偏置;
7)执行下一次学习,进入2);
人机混合决策模型知识库相似性分析需分析静态知识库与动态知识库复杂度的变化情况,根据静态知识库与动态知识库中各元素的重要性权重,设定相似性阈值,当超过阈值时,则对知识库进行更新,不超过阈值说明知识库相似度较高,能够满足人机混合决策模型决策的需求,无需进行更新;
人机混合决策模型与知识库更新方式的评价要考虑更新所用时间、更新的计算量以及更新的准确性这些因素,通过量表分析的方法综合判断。
8.根据权利要求1所述的一种面向高度自动驾驶的人机决策逻辑在线校验方法,其特征在于:所述的第三步中的步骤五通过层次分析法将人机混合决策模型的不同评价指标进行重要性排序,分配重要性权重,进而根据各评价指标的评价结果,得到人机混合决策模型的综合评价结果;
将人机混合决策模型的评价指标条理化和层次化,构造出一个有序的、梯次递进的结构模型;
采用专家咨询法构造判断矩阵,请多位资深专家、具有丰富驾驶经验的驾驶员对各评价指标的重要性进行评价打分,通过1-9标度对同一层次的两个评价指标进行重要性比较,从而构建相应的判断矩阵,得到各评价指标的重要性权重;
为保证权重指标的合理性,须根据判断矩阵求出最大特征值之后对判断矩阵进行一致性检验,一致性检验的公式为:
Figure FDA0003626393720000151
式中,RI为层次总排序平均随机一致性指标的标准值,根据判断矩阵阶数不同取不同的值;CI为层次总排序一致性指标,CI的定义及相关计算公式为:
ω=(ω12,...,ωn)T
Figure FDA0003626393720000152
Figure FDA0003626393720000161
式中,λmax为判断矩阵最大特征值;n为判断矩阵的阶数;A为矩阵,如果CR<0.1,说明判断矩阵的一致性良好,满足一致性要求;
各评价指标重要性排序完成后,根据各指标的重要性权重与评价结果得到人机混合决策模型的综合评价结果。
CN202210477360.5A 2022-05-04 2022-05-04 一种面向高度自动驾驶的人机决策逻辑在线校验方法 Active CN114675742B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210477360.5A CN114675742B (zh) 2022-05-04 2022-05-04 一种面向高度自动驾驶的人机决策逻辑在线校验方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210477360.5A CN114675742B (zh) 2022-05-04 2022-05-04 一种面向高度自动驾驶的人机决策逻辑在线校验方法

Publications (2)

Publication Number Publication Date
CN114675742A true CN114675742A (zh) 2022-06-28
CN114675742B CN114675742B (zh) 2022-11-01

Family

ID=82079682

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210477360.5A Active CN114675742B (zh) 2022-05-04 2022-05-04 一种面向高度自动驾驶的人机决策逻辑在线校验方法

Country Status (1)

Country Link
CN (1) CN114675742B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115366920A (zh) * 2022-08-31 2022-11-22 阿波罗智能技术(北京)有限公司 用于自动驾驶车辆的决策方法及装置、设备和介质
CN115407750A (zh) * 2022-08-12 2022-11-29 北京津发科技股份有限公司 人机协同智能系统决策能力的测评方法及系统
CN115546767A (zh) * 2022-11-30 2022-12-30 广汽埃安新能源汽车股份有限公司 数据发送方法、装置、设备和计算机可读介质
CN115626184A (zh) * 2022-12-19 2023-01-20 北京科技大学 自动驾驶车辆的权重系数和控制策略自学习方法及装置
CN116579622A (zh) * 2023-04-03 2023-08-11 吉林大学 基于线性时态逻辑和可拓展层次分析法的人机混合决策在线评价方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104217122A (zh) * 2014-09-15 2014-12-17 北京市市政工程研究院 基于多元信息预警系统的隧道施工过程安全评价方法
CN111688704A (zh) * 2020-06-24 2020-09-22 吉林大学 一种基于驾驶状态预测的人机力矩协同转向控制方法
CN111797000A (zh) * 2020-05-27 2020-10-20 中汽数据有限公司 一种基于梯度提升决策树模型的场景复杂度评估方法
JP2021149200A (ja) * 2020-03-16 2021-09-27 Kddi株式会社 応対評価装置、応対評価方法及びコンピュータプログラム
CN114429008A (zh) * 2022-02-07 2022-05-03 重庆大学 一种基于模型预测控制的拟人化自动驾驶策略

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104217122A (zh) * 2014-09-15 2014-12-17 北京市市政工程研究院 基于多元信息预警系统的隧道施工过程安全评价方法
JP2021149200A (ja) * 2020-03-16 2021-09-27 Kddi株式会社 応対評価装置、応対評価方法及びコンピュータプログラム
CN111797000A (zh) * 2020-05-27 2020-10-20 中汽数据有限公司 一种基于梯度提升决策树模型的场景复杂度评估方法
CN111688704A (zh) * 2020-06-24 2020-09-22 吉林大学 一种基于驾驶状态预测的人机力矩协同转向控制方法
CN114429008A (zh) * 2022-02-07 2022-05-03 重庆大学 一种基于模型预测控制的拟人化自动驾驶策略

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
L. HAO 等: "The Eco-Driving Considering Coordinated Control Strategy for the Intelligent Electric Vehicles", 《IEEE ACCESS》 *
刘俊: "智能车辆人机协同转向控制策略研究", 《中国优秀博硕士学位论文全文数据库(博士)》 *
孙博华: "考虑驾驶能力及驾驶习性的个性化人机共驾策略研究", 《中国优秀博硕士学位论文全文数据库(博士)》 *
王金祥等: "基于博弈论组合赋权TOPSIS法的汽车碰撞危险态势评估", 《科学技术与工程》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115407750A (zh) * 2022-08-12 2022-11-29 北京津发科技股份有限公司 人机协同智能系统决策能力的测评方法及系统
CN115407750B (zh) * 2022-08-12 2023-11-21 北京津发科技股份有限公司 人机协同智能系统决策能力的测评方法及系统
CN115366920A (zh) * 2022-08-31 2022-11-22 阿波罗智能技术(北京)有限公司 用于自动驾驶车辆的决策方法及装置、设备和介质
CN115546767A (zh) * 2022-11-30 2022-12-30 广汽埃安新能源汽车股份有限公司 数据发送方法、装置、设备和计算机可读介质
CN115626184A (zh) * 2022-12-19 2023-01-20 北京科技大学 自动驾驶车辆的权重系数和控制策略自学习方法及装置
CN116579622A (zh) * 2023-04-03 2023-08-11 吉林大学 基于线性时态逻辑和可拓展层次分析法的人机混合决策在线评价方法
CN116579622B (zh) * 2023-04-03 2024-08-23 吉林大学 基于线性时态逻辑和可拓展层次分析法的人机混合决策在线评价方法

Also Published As

Publication number Publication date
CN114675742B (zh) 2022-11-01

Similar Documents

Publication Publication Date Title
CN114675742B (zh) 一种面向高度自动驾驶的人机决策逻辑在线校验方法
Gu et al. A novel lane-changing decision model for autonomous vehicles based on deep autoencoder network and XGBoost
Akgüngör et al. An artificial intelligent approach to traffic accident estimation: Model development and application
Suzdaleva et al. An online estimation of driving style using data-dependent pointer model
Zhao et al. Sensor-based risk perception ability network design for drivers in snow and ice environmental freeway: a deep learning and rough sets approach
CN113406955B (zh) 基于复杂网络的自动驾驶汽车复杂环境模型、认知系统及认知方法
Tango et al. Field tests and machine learning approaches for refining algorithms and correlations of driver’s model parameters
Wu et al. An Optimized Collision Avoidance Decision‐Making System for Autonomous Ships under Human‐Machine Cooperation Situations
Hou et al. Visual evaluation for autonomous driving
Sun et al. An intention-aware and online driving style estimation based personalized autonomous driving strategy
Zhao et al. An objective evaluation method for automated vehicle virtual test
Ponomaryova et al. DEVISING AN APPROACH FOR THE AUTOMATED RESTORATION OF SHIPMASTER’S NAVIGATIONAL QUALIFICATION PARAMETERS UNDER RISK CONDITIONS.
Khademi et al. Day-to-day travel time perception modeling using an adaptive-network-based fuzzy inference system (ANFIS)
Li et al. Driving Behavior Prediction Based on Combined Neural Network Model
CN117275222A (zh) 一种融合一维卷积与属性增强单元的交通流量预测方法
Li et al. A physical law constrained deep learning model for vehicle trajectory prediction
Alsanwy et al. Vehicle Trajectory Prediction Using Deep Learning for Advanced Driver Assistance Systems and Autonomous Vehicles
Caballero et al. Some statistical challenges in automated driving systems
Zheng et al. Towards Driving Policies with Personality: Modeling Behavior and Style in Risky Scenarios via Data Collection in Virtual Reality
Anigbogu et al. Driver behavior model for healthy driving style using machine learning methods
Zhao Modeling driving behavior at single-lane roundabouts
Nabhan Models and algorithms for the exploration of the space of scenarios: toward the validation of the autonomous vehicle
Efremov et al. Neural network model for recognition and classification of types of interactions in road traffic
Chen et al. Risk-Anticipatory Autonomous Driving Strategies Considering Vehicles’ Weights Based on Hierarchical Deep Reinforcement Learning
Tan Paving the Way for Self-driving Cars-Software Testing for Safety-critical Systems Based on Machine Learning: A Systematic Mapping Study and a Survey

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant