CN111753371B - 一种车身控制网络模型的训练方法、系统、终端和存储介质 - Google Patents

一种车身控制网络模型的训练方法、系统、终端和存储介质 Download PDF

Info

Publication number
CN111753371B
CN111753371B CN202010501251.3A CN202010501251A CN111753371B CN 111753371 B CN111753371 B CN 111753371B CN 202010501251 A CN202010501251 A CN 202010501251A CN 111753371 B CN111753371 B CN 111753371B
Authority
CN
China
Prior art keywords
vehicle body
neural network
recurrent neural
vehicle
control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010501251.3A
Other languages
English (en)
Other versions
CN111753371A (zh
Inventor
余恒
王凡
唐锐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zongmu Technology Shanghai Co Ltd
Original Assignee
Zongmu Technology Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zongmu Technology Shanghai Co Ltd filed Critical Zongmu Technology Shanghai Co Ltd
Priority to CN202010501251.3A priority Critical patent/CN111753371B/zh
Publication of CN111753371A publication Critical patent/CN111753371A/zh
Application granted granted Critical
Publication of CN111753371B publication Critical patent/CN111753371B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • G06F30/15Vehicle, aircraft or watercraft design
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W40/00Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
    • B60W40/10Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models related to vehicle motion
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/0088Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots characterized by the autonomous decision making process, e.g. artificial intelligence, predefined behaviours
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/16Anti-collision systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Geometry (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Automation & Control Theory (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Computer Hardware Design (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Medical Informatics (AREA)
  • Mechanical Engineering (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Transportation (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种车身控制网络模型训练方法、系统、终端和存储介质,近场场景路径模拟仿真模块获取该车辆当前位置的近场场景感知数据和车模信息,集合递归神经网络输出的当前横向控制决策和纵向控制决策输入近场场景路径模拟仿真模块,获得车模各个时刻的车身的位置、运动状态和车身姿态并与递归神经网络该时刻输出的控制信号对比得出递归神经网络的损失函数,以该损失函数修正原递归神经网络。本发明不仅考虑了场景道路、场景交通规则、以及场景动态障碍物与车身相对关系这些决策分析维度,且通过递归神经网络输入层的连续性、输出的时间连续性能够得出实时的、连续的车身控制信号,达到动态避障、动态决策的效果。

Description

一种车身控制网络模型的训练方法、系统、终端和存储介质
技术领域
本发明涉及汽车电子技术领域,特别是涉及一种车身控制网络模型的训练方法、系统、终端和存储介质。
背景技术
横向控制主要控制航向,通过改变方向盘扭矩或角度的大小等,使车辆按照想要的航向行驶。纵向控制主要为速度控制,通过控制刹车、油门、档位等实现对车速的控制,对于自动挡车辆来说,控制对象其实就是刹车和油门。
横向控制和纵向控制是车辆智能驾驶领域中的核心技术之一,如何实现车辆的精准横向控制/纵向控制,尤其是如何在复杂路况的交通环境中(例如,大角度弯道、道路光线明显变化、光线暗淡的停车场或者车流湍急的停车场进口或者停车场出口等),实现车辆的精准横向控制。以及在停车场在拥挤、近场景多车的境况下,夹塞意图、变道意图判断困难的情况下实现对于刹车、油门、档位等等的纵向精准控制,是目前亟待解决的一个问题。
发明内容
为了解决上述的以及其他潜在的技术问题,本发明提供了一种车身控制网络模型的训练方法、系统、终端和存储介质,通过近场感知数据和全局路径规划输入基于深度递归神经网络的车身控制网络模型,实时输出车身控制信号反馈给车身控制系统执行,车身控制网络模型的训练通过场景结合车身动力学模拟仿真得出各个时刻车身的控制决策,以结合车身动力学模拟仿真结果与深度递归神经网络输出横向/纵向控制决策对比得出损失函数以修正深度递归神经网络的网络参数,以深度递归神经网络输出的当前车身横向/纵向控制信号不仅考虑了场景道路、场景交通规则、以及场景动态障碍物与车身相对关系这些决策分析维度,且通过递归神经网络输入层的连续性、输出的时间连续性能够得出实时的、连续的车身控制信号,达到动态避障、动态决策的效果。
一种车身控制网络模型,包括:
递归神经网络以离散时间点压缩编码模块输出的包含感兴趣的区域和/或物体特征、车身状态、车身位置和姿态为输入通过压缩编码模块进行融合、压缩、编码获得一个包含本地路径规划、车身状态、车身位置和姿态的矩阵数据包为输入,
通过神经元细胞层的遗忘门和/或记忆门选择调节该细胞层记忆,保留对下一时刻车身近场控制决策起到作用的该车身所在近场区域提取的感兴趣区域和/或物体的特征或车身状态、车身位置和姿态信息,遗忘对下一时刻车身近场控制决策无贡献的区域和/或物体的特征、车身状态、车身位置和姿态信息;
通过神经元细胞层的层层递进,逐层提高输入特征的维度,输出当前时刻车身近场横向控制决策和/或车身近场纵向控制决策。
进一步地,所述基于深度递归神经网络的车身控制网络模型的输入层包括:
车辆感知获取模块,根据车身位置获取车身附近近场区域感知数据,
全局路径规划模块,根据车身位置信号、目的地终点位置信号和全局地图通过全局路径规划算法获取全局路径规划;
感兴趣区域编码模块,以车辆近场区域感知数据和全局路径规划为输入提取车辆近场路径策略中感兴趣区域和/或物体的特征,
车身状态、车身位置和姿态获取模块,所述车身状态、车身位置和姿态获取模块自车身ECU获取车身当前状态下包括但不限于方向盘扭矩信号、方向盘角度值信号、速度控制信号;所述车身状态、车身位置和姿态获取模块自车身定位模块获取车身位置信号、车身姿态信号。
进一步地,所述基于深度递归神经网络的车身控制网络模型的输出层还包括以下模块:
纵向延迟加速模块,
所述深度递归神经网络输出的纵向控制信号在输入近场场景车身动力学模拟仿真算法前经过纵向延迟加速模块处理,以避免车辆纵向控制油门调节加速度时,车身实际运动状态的加速度出现时间延迟。
进一步地,所述基于深度递归神经网络的车身控制网络模型的输入层映射到模型的过程还包括以下模块:
压缩编码模块,所述压缩编码模块将近场区域中感兴趣的区域和/或物体特征、车身状态、车身位置和姿态为输入通过压缩编码模块进行融合、压缩、编码获得一个包含本地路径规划、车身状态、车身位置和姿态的矩阵数据包。
进一步地,所述基于深度递归神经网络的车身控制网络模型的输出层后处理过程包括以下步骤:
将递归神经网络输出当前时刻横向控制决策和纵向控制决策,将横向控制决策和纵向控制决策作为输入信号导入车身ECU控制车身执行该决策。
进一步地,所述基于深度递归神经网络的车身控制网络模型的输出层后处理过程包括以下步骤:
将递归神经网络输出当前时刻横向控制决策和纵向控制决策,将横向控制决策和纵向控制决策作为输入信号导入到递归神经网络的一个特定神经元细胞层之中。
一种车身控制网络模型训练方法,
近场场景路径模拟仿真模块获取该车辆当前位置的近场场景感知数据和车模信息,根据近场场景感知数据处理获得近场场景地图;
以当前车身位置、车身姿态、近场感知环境数据、以及递归神经网络输出的当前横向控制决策和纵向控制决策输入近场场景路径模拟仿真模块,近场场景路径模拟仿真模块根据车模的车身动力学模拟仿真算法输出仿真模拟状态下车模各个时刻的车身的位置、运动状态和车身姿态,将此包含了车身运动状态和车身姿态的信息与递归神经网络该时刻输出的控制信号对比得出递归神经网络的损失函数,以该损失函数修正原递归神经网络。
进一步地,所述车身控制网络模型训练方法还包括该近场场景道路虚拟交通规则的函数,所述包括该近场场景道路虚拟交通规则的函数用于设置基于近场场景地图的交通规则以及预设置的虚拟交通规则。
一种车身控制方法,包括以下步骤:
S01:获取车辆近场区域地图、全局路径规划,以车辆近场区域地图和全局路径规划为输入获取为了到达该全局路径规划终点而制定的近场路径规划策略中感兴趣的区域,
S02:将近场区域中感兴趣的区域、车身状态、车身位置和姿态为输入通过压缩编码模块进行融合、压缩、编码获得一个包含本地路径规划、车身状态、车身位置和姿态的矩阵数据包,
S03:将该矩阵数据包以相应的频率输入递归神经网络,输出横向控制决策和纵向控制决策,将横向控制决策和纵向控制决策作为输入信号导入车身ECU控制车身执行该决策。
进一步地,所述车身控制方法还包括步骤S04:将递归神经网络输出横向控制决策和纵向控制决策,将横向控制决策和纵向控制决策作为输入信号导入到递归神经网络的一个特定神经元细胞层之中。
一种车身控制系统,包括以下模块:
输入层
包括车辆感知获取模块、全局路径规划模块、感兴趣区域编码模块、车身状态、车身位置和姿态获取模块;
所述车辆感知获取模块,根据车身位置获取车身附近近场区域感知数据,
所述全局路径规划模块,根据车身位置信号、目的地终点位置信号和全局地图通过全局路径规划算法获取全局路径规划;
所述感兴趣区域编码模块,以车辆近场区域感知数据和全局路径规划为输入提取车辆近场路径策略中感兴趣区域和/或物体的特征,
所述车身状态、车身位置和姿态获取模块,所述车身状态、车身位置和姿态获取模块自车身ECU获取车身当前状态下包括但不限于方向盘扭矩信号、方向盘角度值信号、速度控制信号;所述车身状态、车身位置和姿态获取模块自车身定位模块获取车身位置信号、车身姿态信号;
网络模型
包括感兴趣区域识别神经网络和递归神经网络;
所述感兴趣区域识别神经网络以车辆感知获取模块和全局路径规划模块为输入,获取车辆近场路径策略中感兴趣区域和/或物体的特征;
所述递归神经网络通过神经元细胞层的层层递进,逐层提高输入特征的维度得到符合车身近场横向控制决策和/或车身近场纵向控制决策;
输出层后处理
包括决策执行模块和反馈模块
所述决策执行模块将递归神经网络输出的横向控制决策和纵向控制决策作为输入信号导入车身ECU控制车身执行该决策;
所述反馈模块将递归神经网络输出的横向控制决策和纵向控制决策为输入信号反馈到递归神经网络的一个特定神经元细胞层之中。
进一步地,所述递归神经网络为深度递归神经网络。
进一步地,所述深度递归神经网络包括n个神经元细胞层,即自输入层至输出层分别标记为第一神经元细胞层、第二神经元细胞层…第n神经元细胞层,所述第一神经元细胞层的输入包括本时刻车辆近场移动物体的数据簇以及该第一神经元细胞层上一时刻的细胞记忆数据,所述第二神经元细胞层的输入为第一神经元细胞层的输出结果以及第二神经元细胞层上一时刻的细胞记忆数据,所述第n神经元细胞层的输入为第n-1层神经元细胞层的输出结果与第n神经元细胞层上一时刻的细胞记忆数据,所述第n神经元细胞层的输出为各个近场移动物体意图预测结果的概率,所述第一神经元细胞层、第二神经元细胞层、…第n神经元细胞层之间并行训练各个分支模型,并将并行训练结果聚合并同步和/或异步更新模型参数并应用在各个分支模型中。
进一步地,所述神经元细胞层的工作原理为:神经元细胞层就像常规存储单元细胞,它输入层、具有自循环连接的存储单元、遗忘门和输出层;输入层可以允许传入信号改变细胞记忆的状态或阻止它。另一方面,输入层可以允许细胞记忆的状态对其他神经元产生影响或阻止它。包括但是它的状态被分成两个载体:h(t)和c(t)(“c”代表“细胞”),h(t)视为短期状态,它表示来自下一层神经元细胞的输入,c(t)视为长期状态,是表示上一时刻神经元细胞的记忆,它可以从一个时间步骤持续到另一个时间。递归神经网络可以学习存储内容的长期状态,即细胞记忆可以通过神经元细胞层的遗忘门和/或记忆门选择调节细胞记忆(即存储单元)自身与外在环境之间的相互作用。作为长期的状态c(t-1)从左到右遍历网络,它首先通过一个忘记门,丢掉一些上一时刻的存储细胞记忆,然后增加了一些当前时刻新的细胞记忆加法运算(添加由输入门选择的存储器)。所以,在连续的时间轴内,每次一次输入层的输入均会有一些记忆被丢弃,一些记忆被添加。而且,之后加法运算,复制长期状态并通过tanh函数(即g(t))传递,然后结果由输出层过滤。这产生了短期状态h(t)。
进一步地,所述神经元细胞层的全连接层的作用是:将当前输入层的输入向量x(t)和先前的短期状态h(t-1)馈送到四个不同的完全连接层。四个完全连接层都有不同的用途:第二全连接层是输出g(t)的层。它具有分析电流输入x(t)和前一个(短期)状态h(t-1)的作用。在常规递归神经网络的细胞层中,它的输出直接输出到y(t)和h(t)。在长期记忆神经网络(LSTM)中,此h(t)的输出不会直接输出,而是直接输出部分存储在长期状态。第一全连接层、第三全连接层、第四全连接层均是门控制器。因为他们使用后勤激活功能,它们的输出范围从0到1。它们的输出被馈送到乘法运算部分,所以如果它们输出0,它们会关闭门,如果他们输出1,他们打开门。第一全连接层控制的遗忘门(由f(t)控制)控制长期状态的哪个部分应该遗忘。第三全连接层控制的输入门(由i(t)控制)控制应添加第二全连接层控制的g(t)的哪个部分到了长期状态。最后,第四全连接层的输出门(由o(t)控制)控制长期的哪些部分应该在此时间步骤(从h(t))和y(t)读取和输出状态。综上所述,长期记忆神经网络单元依靠输入门的作用可以学习识别重要输入,并将其存储在长期状态,依照遗忘门的作用遗忘不必要的部分,记住必要的部分,并且学会在需要时提取它。它们可以运用在捕捉时间序列,长文本,录音,连续视频帧中输入层的输入向量x(t)的感兴趣的部分。
一种终端设备,如可以执行上述车身控制方法程序的智能手机或可以执行上述车身控制方法程序的车载终端控制设备。
一种服务器,所述服务器包括用于实现上述车身控制方法和/或车身控制系统。
一种计算机存储介质,所述计算机存储介质用于存储上述车身控制方法所对应的软件程序和/或车身控制系统。
如上所述,本发明的具有以下有益效果:
通过近场感知数据和全局路径规划输入基于深度递归神经网络的车身控制网络模型,实时输出车身控制信号反馈给车身控制系统执行,车身控制网络模型的训练通过场景结合车身动力学模拟仿真得出各个时刻车身的控制决策,以结合车身动力学模拟仿真结果与深度递归神经网络输出横向/纵向控制决策对比得出损失函数以修正深度递归神经网络的网络参数,以深度递归神经网络输出的当前车身横向/纵向控制信号不仅考虑了场景道路、场景交通规则、以及场景动态障碍物与车身相对关系这些决策分析维度,且通过递归神经网络输入层的连续性、输出的时间连续性能够得出实时的、连续的车身控制信号,达到动态避障、动态决策的效果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1显示为本发明神经元细胞层的示意图。
图2显示为本发明深度循环神经网络的示意图。
图3显示为本发明的车身控制网络模型训练的示意图。
图4显示为本发明车身控制网络的框架图。
图5显示为本发明车身控制网络模型训练的流程图。
图6显示为车身控制方法的流程图。
图7显示为车身控制网络模型输入层的框架图。
图8显示为车身控制方法的示意图。
图9显示为另一实施例中车身控制方法的示意图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
须知,本说明书所附图式所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本发明可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本发明所能产生的功效及所能达成的目的下,均应仍落在本发明所揭示的技术内容得能涵盖的范围内。同时,本说明书中所引用的如“上”、“下”、“左”、“右”、“中间”及“一”等的用语,亦仅为便于叙述的明了,而非用以限定本发明可实施的范围,其相对关系的改变或调整,在无实质变更技术内容下,当亦视为本发明可实施的范畴。
参见图4~图7,
一种车身控制网络模型,包括:
递归神经网络以离散时间点压缩编码模块输出的包含感兴趣的区域和/或物体特征、车身状态、车身位置和姿态为输入通过压缩编码模块进行融合、压缩、编码获得一个包含本地路径规划、车身状态、车身位置和姿态的矩阵数据包为输入;
通过神经元细胞层的遗忘门和/或记忆门选择调节该细胞层记忆,保留对下一时刻车身近场控制决策起到作用的该车身所在近场区域提取的感兴趣区域和/或物体的特征或车身状态、车身位置和姿态信息,遗忘对下一时刻车身近场控制决策无贡献的区域和/或物体的特征、车身状态、车身位置和姿态信息;
通过神经元细胞层的层层递进,逐层提高输入特征的维度,输出当前时刻车身近场横向控制决策和/或车身近场纵向控制决策。
作为优选实施例,所述车身控制网络模型的输入层包括:
车辆感知获取模块,根据车身位置获取车身附近近场区域感知数据,
全局路径规划模块,根据车身位置信号、目的地终点位置信号和全局地图通过全局路径规划算法获取全局路径规划;
感兴趣区域编码模块,以车辆近场区域感知数据和全局路径规划为输入提取车辆近场路径策略中感兴趣区域和/或物体的特征,
车身状态、车身位置和姿态获取模块,所述车身状态、车身位置和姿态获取模块自车身ECU获取车身当前状态下包括但不限于方向盘扭矩信号、方向盘角度值信号、速度控制信号;所述车身状态、车身位置和姿态获取模块自车身定位模块获取车身位置信号、车身姿态信号。
作为优选实施例,所述车身控制网络模型的输出层还包括以下模块:
纵向延迟加速模块,
所述深度递归神经网络输出的纵向控制信号在输入近场场景车身动力学模拟仿真算法前经过纵向延迟加速模块处理,以避免车辆纵向控制油门调节加速度时,车身实际运动状态的加速度出现时间延迟。
作为优选实施例,所述基于深度递归神经网络的车身控制网络模型的输入层映射到模型的过程还包括以下模块:
压缩编码模块,所述压缩编码模块将近场区域中感兴趣的区域和/或物体特征、车身状态、车身位置和姿态为输入通过压缩编码模块进行融合、压缩、编码获得一个包含本地路径规划、车身状态、车身位置和姿态的矩阵数据包。
作为优选实施例,所述车身控制网络模型的输出层后处理过程包括以下步骤:
将递归神经网络输出当前时刻横向控制决策和纵向控制决策,将横向控制决策和纵向控制决策作为输入信号导入车身ECU控制车身执行该决策。
作为优选实施例,所述基于深度递归神经网络的车身控制网络模型的输出层后处理过程包括以下步骤:
将递归神经网络输出当前时刻横向控制决策和纵向控制决策,将横向控制决策和纵向控制决策作为输入信号导入到递归神经网络的一个特定神经元细胞层之中。
参见图5,一种身控制网络模型训练方法,
近场场景路径模拟仿真模块获取该车辆当前位置的近场场景感知数据和车模信息,根据近场场景感知数据处理获得近场场景地图;
以当前车身位置、车身姿态、近场感知环境数据、以及递归神经网络输出的当前横向控制决策和纵向控制决策输入近场场景路径模拟仿真模块,近场场景路径模拟仿真模块根据车模的车身动力学模拟仿真算法输出仿真模拟状态下车模各个时刻的车身的位置、运动状态和车身姿态,将此包含了车身运动状态和车身姿态的信息与递归神经网络该时刻输出的控制信号对比得出递归神经网络的损失函数,以该损失函数修正原递归神经网络。
作为优选实施例,所述车身控制网络模型训练方法还包括该近场场景道路虚拟交通规则的函数,所述包括该近场场景道路虚拟交通规则的函数用于设置基于近场场景地图的交通规则以及预设置的虚拟交通规则。
参见图7-图9,一种车身控制方法,包括以下步骤:
S01:获取车辆近场区域地图、全局路径规划,以车辆近场区域地图和全局路径规划为输入获取为了到达该全局路径规划终点而制定的近场路径规划策略中感兴趣的区域,
S02:将近场区域中感兴趣的区域、车身状态、车身位置和姿态为输入通过压缩编码模块进行融合、压缩、编码获得一个包含本地路径规划、车身状态、车身位置和姿态的矩阵数据包,
S03:将该矩阵数据包以相应的频率输入递归神经网络,输出横向控制决策和纵向控制决策,将横向控制决策和纵向控制决策作为输入信号导入车身ECU控制车身执行该决策。
作为优选实施例,所述车身控制方法还包括步骤S04:将递归神经网络输出横向控制决策和纵向控制决策,将横向控制决策和纵向控制决策作为输入信号导入到递归神经网络的一个特定神经元细胞层之中。
参见图7,一种车身控制系统,包括以下模块:
输入层
包括车辆感知获取模块、全局路径规划模块、感兴趣区域编码模块、车身状态、车身位置和姿态获取模块;
所述车辆感知获取模块,根据车身位置获取车身附近近场区域感知数据,
所述全局路径规划模块,根据车身位置信号、目的地终点位置信号和全局地图通过全局路径规划算法获取全局路径规划;
所述感兴趣区域编码模块,以车辆近场区域感知数据和全局路径规划为输入提取车辆近场路径策略中感兴趣区域和/或物体的特征,
所述车身状态、车身位置和姿态获取模块,所述车身状态、车身位置和姿态获取模块自车身ECU获取车身当前状态下包括但不限于方向盘扭矩信号、方向盘角度值信号、速度控制信号;所述车身状态、车身位置和姿态获取模块自车身定位模块获取车身位置信号、车身姿态信号;
网络模型
包括感兴趣区域识别神经网络和递归神经网络;
所述感兴趣区域识别神经网络以车辆感知获取模块和全局路径规划模块为输入,获取车辆近场路径策略中感兴趣区域和/或物体的特征;
所述递归神经网络通过神经元细胞层的层层递进,逐层提高输入特征的维度得到符合车身近场横向控制决策和/或车身近场纵向控制决策;
输出层后处理
包括决策执行模块和反馈模块
所述决策执行模块将递归神经网络输出的横向控制决策和纵向控制决策作为输入信号导入车身ECU控制车身执行该决策;
所述反馈模块将递归神经网络输出的横向控制决策和纵向控制决策为输入信号反馈到递归神经网络的一个特定神经元细胞层之中。
参见图1~图3,作为优选实施例,所述递归神经网络为深度递归神经网络。
参见图1~图3,作为优选实施例,所述深度递归神经网络包括n个神经元细胞层,即自输入层至输出层分别标记为第一神经元细胞层、第二神经元细胞层…第n神经元细胞层,所述第一神经元细胞层的输入包括本时刻车辆近场移动物体的数据簇以及该第一神经元细胞层上一时刻的细胞记忆数据,所述第二神经元细胞层的输入为第一神经元细胞层的输出结果以及第二神经元细胞层上一时刻的细胞记忆数据,所述第n神经元细胞层的输入为第n-1层神经元细胞层的输出结果与第n神经元细胞层上一时刻的细胞记忆数据,所述第n神经元细胞层的输出为各个近场移动物体意图预测结果的概率,所述第一神经元细胞层、第二神经元细胞层、…第n神经元细胞层之间并行训练各个分支模型,并将并行训练结果聚合并同步和/或异步更新模型参数并应用在各个分支模型中。
参见图1~图3,作为优选实施例,所述神经元细胞层的工作原理为:神经元细胞层就像常规存储单元细胞,它输入层、具有自循环连接的存储单元、遗忘门和输出层;输入层可以允许传入信号改变细胞记忆的状态或阻止它。另一方面,输入层可以允许细胞记忆的状态对其他神经元产生影响或阻止它。包括但是它的状态被分成两个载体:h(t)和c(t)(“c”代表“细胞”),h(t)视为短期状态,它表示来自下一层神经元细胞的输入,c(t)视为长期状态,是表示上一时刻神经元细胞的记忆,它可以从一个时间步骤持续到另一个时间。递归神经网络可以学习存储内容的长期状态,即细胞记忆可以通过神经元细胞层的遗忘门和/或记忆门选择调节细胞记忆(即存储单元)自身与外在环境之间的相互作用。作为长期的状态c(t-1)从左到右遍历网络,它首先通过一个忘记门,丢掉一些上一时刻的存储细胞记忆,然后增加了一些当前时刻新的细胞记忆加法运算(添加由输入门选择的存储器)。所以,在连续的时间轴内,每次一次输入层的输入均会有一些记忆被丢弃,一些记忆被添加。而且,之后加法运算,复制长期状态并通过tanh函数(即g(t))传递,然后结果由输出层过滤。这产生了短期状态h(t)。
参见图1~图3,作为优选实施例,所述神经元细胞层的全连接层的作用是:将当前输入层的输入向量x(t)和先前的短期状态h(t-1)馈送到四个不同的完全连接层。四个完全连接层都有不同的用途:第二全连接层是输出g(t)的层。它具有分析电流输入x(t)和前一个(短期)状态h(t-1)的作用。在常规递归神经网络的细胞层中,它的输出直接输出到y(t)和h(t)。在长期记忆神经网络(LSTM)中,此h(t)的输出不会直接输出,而是直接输出部分存储在长期状态。第一全连接层、第三全连接层、第四全连接层均是门控制器。因为他们使用后勤激活功能,它们的输出范围从0到1。它们的输出被馈送到乘法运算部分,所以如果它们输出0,它们会关闭门,如果他们输出1,他们打开门。第一全连接层控制的遗忘门(由f(t)控制)控制长期状态的哪个部分应该遗忘。第三全连接层控制的输入门(由i(t)控制)控制应添加第二全连接层控制的g(t)的哪个部分到了长期状态。最后,第四全连接层的输出门(由o(t)控制)控制长期的哪些部分应该在此时间步骤(从h(t))和y(t)读取和输出状态。综上所述,长期记忆神经网络单元依靠输入门的作用可以学习识别重要输入,并将其存储在长期状态,依照遗忘门的作用遗忘不必要的部分,记住必要的部分,并且学会在需要时提取它。它们可以运用在捕捉时间序列,长文本,录音,连续视频帧中输入层的输入向量x(t)的感兴趣的部分。
一种终端设备,如可以执行上述车身控制方法程序的智能手机或可以执行上述车身控制方法程序的车载终端控制设备。
一种服务器,所述服务器包括用于实现上述车身控制方法和/或车身控制系统。
一种计算机存储介质,所述计算机存储介质用于存储上述车身控制方法所对应的软件程序和/或车身控制系统。
作为优选实施例,本实施例还提供一种终端设备,如可以执行程序的智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)等。本实施例的终端设备至少包括但不限于:可通过系统总线相互通信连接的存储器、处理器。需要指出的是,具有组件存储器、处理器的终端设备,但是应理解的是,并不要求实施所有示出的组件,可以替代的车身控制方法实施更多或者更少的组件。
作为优选实施例,存储器(即可读存储介质)包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器可以是计算机设备的内部存储单元,例如该计算机设备的硬盘或内存。在另一些实施例中,存储器也可以是计算机设备的外部存储设备,例如该计算机设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)等。当然,存储器还可以既包括计算机设备的内部存储单元也包括其外部存储设备。本实施例中,存储器通常用于存储安装于计算机设备的操作系统和各类应用软件,例如实施例中的车身控制方法程序代码等。此外,存储器还可以用于暂时地存储已经输出或者将要输出的各类数据。
一种计算机可读存储介质,其上存储有计算机程序,其特征在于:该程序被处理器执行时实现上述的车身控制方法中的步骤。
本实施例还提供一种计算机可读存储介质,如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等,其上存储有计算机程序,程序被处理器执行时实现相应功能。本实施例的计算机可读存储介质用于存储基于深度递归神经网络的车身控制方法程序,被处理器执行时实现车身控制方法实施例中的车身控制方法。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中包括通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

Claims (11)

1.一种车身控制网络模型训练方法,其特征在于,包括以下步骤:
近场场景路径模拟仿真模块获取车辆当前位置的近场场景感知数据和车模信息,根据近场场景感知数据处理获得近场场景地图;
以当前车身位置、车身姿态、近场感知环境数据、以及深度递归神经网络输出的当前横向控制决策和纵向控制决策输入近场场景路径模拟仿真模块,近场场景路径模拟仿真模块根据车模的车身动力学模拟仿真算法输出仿真模拟状态下车模各个时刻的车身的位置、运动状态和车身姿态,将此包含了车身运动状态和车身姿态的信息与递归神经网络该时刻输出的控制信号对比得出递归神经网络的损失函数,以该损失函数修正原递归神经网络;
所述深度递归神经网络的输入层包括:
车辆感知获取模块,根据车身位置获取车身附近近场区域感知数据,
全局路径规划模块,根据车身位置信号、目的地终点位置信号和全局地图通过全局路径规划算法获取全局路径规划;
感兴趣区域编码模块,以车辆近场区域感知数据和全局路径规划为输入提取车辆近场路径策略中感兴趣区域和/或物体的特征,
车身状态、车身位置和姿态获取模块,所述车身状态、车身位置和姿态获取模块自车身ECU获取车身当前状态下包括方向盘扭矩信号、方向盘角度值信号、速度控制信号;所述车身状态、车身位置和姿态获取模块自车身定位模块获取车身位置信号、车身姿态信号。
2.根据权利要求1所述的车身控制网络模型训练方法,其特征在于,所述深度递归神经网络的输出层还包括以下模块:
纵向延迟加速模块,
所述深度递归神经网络输出的纵向控制信号在输入近场场景车身动力学模拟仿真算法前经过纵向延迟加速模块处理,以避免车辆纵向控制油门调节加速度时,车身实际运动状态的加速度出现时间延迟。
3.根据权利要求1所述的车身控制网络模型训练方法,其特征在于,所述深度递归神经网络的输入层映射到模型的过程还包括以下模块:
压缩编码模块,所述压缩编码模块将近场区域中感兴趣的区域和/或物体特征、车身状态、车身位置和姿态为输入通过压缩编码模块进行融合、压缩、编码获得一个包含本地路径规划、车身状态、车身位置和姿态的矩阵数据包。
4.根据权利要求1所述的车身控制网络模型训练方法,其特征在于,所述深度递归神经网络的输出层后处理过程包括以下步骤:
将递归神经网络输出当前时刻横向控制决策和纵向控制决策,将横向控制决策和纵向控制决策作为输入信号导入车身ECU控制车身执行该决策。
5.根据权利要求4所述的车身控制网络模型训练方法,其特征在于,所述深度递归神经网络的输出层后处理过程包括以下步骤:
将递归神经网络输出当前时刻横向控制决策和纵向控制决策,将横向控制决策和纵向控制决策作为输入信号导入到递归神经网络的一个特定神经元细胞层之中。
6.一种车身控制方法,其特征在于,包括以下步骤:
S01:获取车辆近场区域地图、全局路径规划,以车辆近场区域地图和全局路径规划为输入获取为了到达该全局路径规划终点而制定的近场路径规划策略中感兴趣的区域,
S02:将近场区域中感兴趣的区域、车身状态、车身位置和姿态为输入通过压缩编码模块进行融合、压缩、编码获得一个包含本地路径规划、车身状态、车身位置和姿态的矩阵数据包,
S03:将该矩阵数据包以相应的频率输入递归神经网络,输出横向控制决策和纵向控制决策,将横向控制决策和纵向控制决策作为输入信号导入车身ECU控制车身执行该决策。
7.根据权利要求6所述的车身控制方法,其特征在于,所述车身控制方法还包括步骤S04:将递归神经网络输出横向控制决策和纵向控制决策,将横向控制决策和纵向控制决策作为输入信号导入到递归神经网络的一个特定神经元细胞层之中。
8.一种车身控制系统,其特征在于,包括以下模块:
输入层
包括车辆感知获取模块、全局路径规划模块、感兴趣区域编码模块、车身状态、车身位置和姿态获取模块;
所述车辆感知获取模块,根据车身位置获取车身附近近场区域感知数据,
所述全局路径规划模块,根据车身位置信号、目的地终点位置信号和全局地图通过全局路径规划算法获取全局路径规划;
所述感兴趣区域编码模块,以车辆近场区域感知数据和全局路径规划为输入提取车辆近场路径策略中感兴趣区域和/或物体的特征,
所述车身状态、车身位置和姿态获取模块,所述车身状态、车身位置和姿态获取模块自车身ECU获取车身当前状态下包括方向盘扭矩信号、方向盘角度值信号、速度控制信号;所述车身状态、车身位置和姿态获取模块自车身定位模块获取车身位置信号、车身姿态信号;
网络模型
包括感兴趣区域识别神经网络和递归神经网络;
所述感兴趣区域识别神经网络以车辆感知获取模块和全局路径规划模块为输入,获取车辆近场路径策略中感兴趣区域和/或物体的特征;
所述递归神经网络通过神经元细胞层的层层递进,逐层提高输入特征的维度得到符合车身近场横向控制决策和/或车身近场纵向控制决策;
输出层后处理
包括决策执行模块和反馈模块;
所述决策执行模块将递归神经网络输出的横向控制决策和纵向控制决策作为输入信号导入车身ECU控制车身执行该决策;
所述反馈模块将递归神经网络输出的横向控制决策和纵向控制决策为输入信号反馈到递归神经网络的一个特定神经元细胞层之中。
9.一种服务器,所述服务器包括用于实现上述权利要求6-7任一项所述的车身控制方法和/或权利要求8所述的车身控制系统。
10.一种终端设备,其特征在于:所述终端设备为控制上述权利要求6-7任一项所述车身控制方法的智能手机或为执行上述权利要求6-7任一项所述车身控制方法的车载终端控制设备。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:该程序被处理器执行时实现如权利要求6至7任一权利要求所述的方法中的步骤。
CN202010501251.3A 2020-06-04 2020-06-04 一种车身控制网络模型的训练方法、系统、终端和存储介质 Active CN111753371B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010501251.3A CN111753371B (zh) 2020-06-04 2020-06-04 一种车身控制网络模型的训练方法、系统、终端和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010501251.3A CN111753371B (zh) 2020-06-04 2020-06-04 一种车身控制网络模型的训练方法、系统、终端和存储介质

Publications (2)

Publication Number Publication Date
CN111753371A CN111753371A (zh) 2020-10-09
CN111753371B true CN111753371B (zh) 2024-03-15

Family

ID=72674650

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010501251.3A Active CN111753371B (zh) 2020-06-04 2020-06-04 一种车身控制网络模型的训练方法、系统、终端和存储介质

Country Status (1)

Country Link
CN (1) CN111753371B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112651456B (zh) * 2020-12-31 2023-08-08 遵义师范学院 基于rbf神经网络的无人车控制方法
CN116540701B (zh) * 2023-04-19 2024-03-05 广州里工实业有限公司 一种路径规划方法、系统、装置及存储介质

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103207634A (zh) * 2013-03-20 2013-07-17 北京工业大学 一种智能车辆中差分gps与惯性导航数据融合的系统和方法
KR101951595B1 (ko) * 2018-05-18 2019-02-22 한양대학교 산학협력단 모듈형 순환 신경망 구조 기반 차량 경로 예측 시스템 및 방법
CN109726804A (zh) * 2019-01-25 2019-05-07 江苏大学 一种基于行车预测场和bp神经网络的智能车辆驾驶行为拟人化决策方法
CN110186470A (zh) * 2019-04-26 2019-08-30 纵目科技(上海)股份有限公司 符合车辆动力学的参考线生成系统、终端和使用方法
CN110214296A (zh) * 2017-12-29 2019-09-06 北京嘀嘀无限科技发展有限公司 用于路线确定的系统和方法
CN110210058A (zh) * 2019-04-26 2019-09-06 纵目科技(上海)股份有限公司 符合车辆动力学的参考线生成方法、系统、终端和介质
CN110264270A (zh) * 2019-06-20 2019-09-20 京东数字科技控股有限公司 一种行为预测方法、装置、设备和存储介质
CN110348297A (zh) * 2019-05-31 2019-10-18 纵目科技(上海)股份有限公司 一种用于识别立体停车库的检测方法、系统、终端和存储介质
CN110509916A (zh) * 2019-08-30 2019-11-29 的卢技术有限公司 一种基于深度神经网络的车身姿态稳定方法和系统
CN110515303A (zh) * 2019-09-17 2019-11-29 余姚市浙江大学机器人研究中心 一种基于ddqn的自适应动态路径规划方法
CN110796856A (zh) * 2019-10-16 2020-02-14 腾讯科技(深圳)有限公司 车辆变道意图预测方法及变道意图预测网络的训练方法
CN110895807A (zh) * 2018-08-22 2020-03-20 罗伯特·博世有限公司 用于评估图像的系统、运行辅助方法和工作设备
CN111137292A (zh) * 2018-11-01 2020-05-12 通用汽车环球科技运作有限责任公司 用于控制自主车辆的分层车道变换策略的基于空间和时间注意力的深度强化学习
EP3660734A1 (en) * 2018-11-30 2020-06-03 Baidu USA LLC Real time object behavior prediction

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11093829B2 (en) * 2017-10-12 2021-08-17 Honda Motor Co., Ltd. Interaction-aware decision making

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103207634A (zh) * 2013-03-20 2013-07-17 北京工业大学 一种智能车辆中差分gps与惯性导航数据融合的系统和方法
CN110214296A (zh) * 2017-12-29 2019-09-06 北京嘀嘀无限科技发展有限公司 用于路线确定的系统和方法
KR101951595B1 (ko) * 2018-05-18 2019-02-22 한양대학교 산학협력단 모듈형 순환 신경망 구조 기반 차량 경로 예측 시스템 및 방법
CN110895807A (zh) * 2018-08-22 2020-03-20 罗伯特·博世有限公司 用于评估图像的系统、运行辅助方法和工作设备
CN111137292A (zh) * 2018-11-01 2020-05-12 通用汽车环球科技运作有限责任公司 用于控制自主车辆的分层车道变换策略的基于空间和时间注意力的深度强化学习
EP3660734A1 (en) * 2018-11-30 2020-06-03 Baidu USA LLC Real time object behavior prediction
CN109726804A (zh) * 2019-01-25 2019-05-07 江苏大学 一种基于行车预测场和bp神经网络的智能车辆驾驶行为拟人化决策方法
CN110186470A (zh) * 2019-04-26 2019-08-30 纵目科技(上海)股份有限公司 符合车辆动力学的参考线生成系统、终端和使用方法
CN110210058A (zh) * 2019-04-26 2019-09-06 纵目科技(上海)股份有限公司 符合车辆动力学的参考线生成方法、系统、终端和介质
CN110348297A (zh) * 2019-05-31 2019-10-18 纵目科技(上海)股份有限公司 一种用于识别立体停车库的检测方法、系统、终端和存储介质
CN110264270A (zh) * 2019-06-20 2019-09-20 京东数字科技控股有限公司 一种行为预测方法、装置、设备和存储介质
CN110509916A (zh) * 2019-08-30 2019-11-29 的卢技术有限公司 一种基于深度神经网络的车身姿态稳定方法和系统
CN110515303A (zh) * 2019-09-17 2019-11-29 余姚市浙江大学机器人研究中心 一种基于ddqn的自适应动态路径规划方法
CN110796856A (zh) * 2019-10-16 2020-02-14 腾讯科技(深圳)有限公司 车辆变道意图预测方法及变道意图预测网络的训练方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于LSTM的智能车变道预测研究;伍淑莉;《信息通信》(第5期);7-11 *
履带式排爆机器人的路径规划和轨迹跟踪研究;邓伟;《中国博士学位论文全文数据库-信息科技辑》;1-128 *

Also Published As

Publication number Publication date
CN111753371A (zh) 2020-10-09

Similar Documents

Publication Publication Date Title
DE102018121595B4 (de) Unbeaufsichtigtes anlernen von agenten für autonome fahranwendungen
CN107697070B (zh) 驾驶行为预测方法和装置、无人车
DE102019113880A1 (de) Systeme, verfahren und steuerungen die autonome fahreragenten und einen richtlinienserver zum erfüllen von richtlinien für autonome fahreragenten implementieren, zum steuern eines autonomen fahrzeugs
DE102019113856A1 (de) Systeme, verfahren und steuerungen für ein autonomes fahrzeug, die autonome fahreragenten und fahrrichtlinienlernende implementieren, um richtlinien basierend auf kollektiven fahrerfahrungen der autonomen fahreragenten zu erstellen und zu verbessern
DE102016113903A1 (de) Fahrzeugfahrstreckenbestimmung
CN113044064B (zh) 基于元强化学习的车辆自适应的自动驾驶决策方法及系统
CN111753371B (zh) 一种车身控制网络模型的训练方法、系统、终端和存储介质
CN110210058B (zh) 符合车辆动力学的参考线生成方法、系统、终端和介质
CN111238523B (zh) 一种运动轨迹的预测方法及装置
DE112021005894T5 (de) Teile-und-herrsche-verfahren zur fahrspurbewussten diversen trajektorienvorhersage
DE102021109395A1 (de) Verfahren, systeme und vorrichtungen für benutzerverständliche erklärbare lernmodelle
DE102021203588A1 (de) Verfahren und Steuergerät zum Schätzen eines Verhaltens eines Systems
CN115402319A (zh) 一种自动驾驶变道速度控制方法、计算机设备及存储介质
CN112784885A (zh) 基于人工智能的自动驾驶方法、装置、设备、介质及车辆
CN113435356B (zh) 一种克服观察噪声与感知不确定性的轨迹预测方法
DE112022002869T5 (de) Verfahren und System zur Verhaltensprognose von Akteuren in einer Umgebung eines autonomen Fahrzeugs
CN111661034B (zh) 基于深度递归神经网络的车身控制方法、系统、终端和存储介质
CN111754816B (zh) 一种移动物体意图识别装置、方法、系统、终端和介质
CN110186470B (zh) 符合车辆动力学的参考线生成系统、终端和使用方法
CN113625753A (zh) 一种由专家规则引导神经网络学习无人机机动飞行的方法
CN114104005B (zh) 自动驾驶设备的决策方法、装置、设备及可读存储介质
Cai et al. Implementation of the Human‐Like Lane Changing Driver Model Based on Bi‐LSTM
Hayashi et al. A predictive reward function for human-like driving based on a transition model of surrounding environment
DE102020129451A1 (de) Verfahren zur Prädiktion von Fahreingriffen, Verfahren zum Training eines Algorithmus und Kraftfahrzeug
Yang et al. Deep Reinforcement Learning Lane-Changing Decision Algorithm for Intelligent Vehicles Combining LSTM Trajectory Prediction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant