CN110481561B - 无人驾驶车辆自动控制信号生成方法和装置 - Google Patents

无人驾驶车辆自动控制信号生成方法和装置 Download PDF

Info

Publication number
CN110481561B
CN110481561B CN201910720811.1A CN201910720811A CN110481561B CN 110481561 B CN110481561 B CN 110481561B CN 201910720811 A CN201910720811 A CN 201910720811A CN 110481561 B CN110481561 B CN 110481561B
Authority
CN
China
Prior art keywords
control signal
function
difference
determining
absolute value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910720811.1A
Other languages
English (en)
Other versions
CN110481561A (zh
Inventor
钱德恒
任冬淳
朱炎亮
付圣
丁曙光
王志超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sankuai Online Technology Co Ltd
Original Assignee
Beijing Sankuai Online Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sankuai Online Technology Co Ltd filed Critical Beijing Sankuai Online Technology Co Ltd
Priority to CN201910720811.1A priority Critical patent/CN110481561B/zh
Publication of CN110481561A publication Critical patent/CN110481561A/zh
Application granted granted Critical
Publication of CN110481561B publication Critical patent/CN110481561B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W2050/0001Details of the control system
    • B60W2050/0019Control system elements or transfer functions
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W2050/0001Details of the control system
    • B60W2050/0019Control system elements or transfer functions
    • B60W2050/0028Mathematical models, e.g. for simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Human Computer Interaction (AREA)
  • Transportation (AREA)
  • Mechanical Engineering (AREA)
  • Feedback Control In General (AREA)
  • Control Of Driving Devices And Active Controlling Of Vehicle (AREA)

Abstract

本公开是关于无人驾驶车辆自动控制信号生成方法,包括:根据多个时刻下车辆的驾驶员实际输出的控制信号与多个时刻确定第一拟合函数,根据多个时刻下训练过程模型基于车辆的环境信息输出的控制信号与多个时刻确定第二拟合函数;根据第一拟合函数和第二拟合函数中相同类型的函数项的系数的差值确定损失函数;根据损失函数训练训练过程模型以得到训练完成模型;根据训练完成模型和车辆的环境信息生成用于自动控制车辆的信号。根据本公开的实施例,可以使得训练得到的模型基于环境信息输出的控制信号,可以与驾驶员基于环境信息输出的控制信号稳定性相近,有利于保证模型输出控制信号的稳定性。

Description

无人驾驶车辆自动控制信号生成方法和装置
技术领域
本公开涉及自动驾驶领域,尤其涉及无人驾驶车辆自动控制信号生成方 法、无人驾驶车辆自动控制信号生成装置、电子设备和计算机可读存储介质。
背景技术
无人驾驶的核心技术是构建一个驾驶模型,通过将环境信息输入该驾驶模 型得到控制信号,以控制车辆行驶。
目前构成的驾驶模型主要问题之一在于,输出的控制信号精度足够高,但 是输出信号的稳定性(也可以称作平滑性)较差。直观表现是,环境信息仅在 较小范围内变化,而驾驶模型输出的控制信号却发生了明显的摆动,例如行驶 方向忽左忽右,加速度时正时负。
发明内容
本公开提供无人驾驶车辆自动控制信号生成方法、无人驾驶车辆自动控制 信号生成装置,电子设备和计算机可读存储介质,以解决相关技术中驾驶模型 输出控制信号摆动的问题。
根据本公开实施例的第一方面,提出一种无人驾驶车辆自动控制信号生成 方法,包括:
根据多个时刻下车辆的驾驶员实际输出的控制信号与所述多个时刻确定第 一拟合函数,根据所述多个时刻下训练过程模型基于车辆的环境信息输出的控 制信号与所述多个时刻确定第二拟合函数,其中,所述第一拟合函数与所述第 二拟合函数的类型相同,且包含函数项的数目相同;
根据所述第一拟合函数和所述第二拟合函数中相同类型的函数项的系数的 差值确定损失函数;
根据所述损失函数训练所述训练过程模型;
根据训练完成模型和所述车辆的环境信息生成用于自动控制所述车辆的信 号。
根据本公开实施例的第二方面,提出一种无人驾驶车辆自动控制信号生成 装置,包括:
拟合函数确定模块,用于根据多个时刻下车辆的驾驶员实际输出的控制信 号与所述多个时刻确定第一拟合函数,根据所述多个时刻下训练过程模型基于 车辆的环境信息输出的控制信号与所述多个时刻确定第二拟合函数,其中,所 述第一拟合函数与所述第二拟合函数的类型相同,且包含函数项的数目相同;
损失函数确定模块,用于根据所述第一拟合函数和所述第二拟合函数中相 同类型的函数项的系数的差值确定损失函数;
模型训练模块,用于根据所述损失函数训练所述训练过程模型以得到训练 完成模型;
信号生成模块,用于根据所述训练完成模型和所述车辆的环境信息生成用 于自动控制所述车辆的信号。
根据本公开实施例的第三方面,提出一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为实现上述任一实施例所述的方法。
根据本公开实施例的第四方面,提出一种计算机可读存储介质,其上存储 有计算机程序,该程序被处理器执行时实现上述任一实施例所述方法中的步骤。
根据本公开的实施例,由于对模型训练过程中参考的损失函数,可以表达 驾驶员实际输出的控制信号和模型输出的控制信号之间稳定性的差异,从而使 得训练得到的模型基于环境信息输出的控制信号,可以与驾驶员基于环境信息 输出的控制信号稳定性相近,有利于保证模型输出控制信号的稳定性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的, 并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开 的实施例,并与说明书一起用于解释本公开的原理。
图1是根据本公开的实施例示出的一种无人驾驶车辆自动控制信号生成方 法的示意流程图。
图2是根据本公开的实施例示出的另一种无人驾驶车辆自动控制信号生成 方法的示意流程图。
图3是根据本公开的实施例示出的又一种无人驾驶车辆自动控制信号生成 方法的示意流程图。
图4是根据本公开的实施例示出的一种训练过程模型的示意图。
图5是根据本公开的实施例示出的又一种无人驾驶车辆自动控制信号生成 方法的示意流程图。
图6是根据本公开的实施例示出的又一种无人驾驶车辆自动控制信号生成 方法的示意流程图。
图7是根据本公开的实施例示出的又一种无人驾驶车辆自动控制信号生成 方法的示意流程图。
图8是根据本公开的实施例示出的又一种无人驾驶车辆自动控制信号生成 方法的示意流程图。
图9是根据本公开的实施例的无人驾驶车辆自动控制信号生成装置所在设 备的一种硬件结构图。
图10是根据本公开的实施例示出的一种无人驾驶车辆自动控制信号生成 装置的示意框图。
图11是根据本公开的实施例示出的另一种无人驾驶车辆自动控制信号生成 装置的示意框图。
图12是根据本公开的实施例示出的又一种无人驾驶车辆自动控制信号生 成装置的示意框图。
图13是根据本公开的实施例示出的又一种无人驾驶车辆自动控制信号生 成装置的示意框图。
图14是根据本公开的实施例示出的又一种无人驾驶车辆自动控制信号生 成装置的示意框图。
图15是根据本公开的实施例示出的又一种无人驾驶车辆自动控制信号生 成装置的示意框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描 述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。 以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方 式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一 致的装置和方法的例子。
图1是根据本公开的实施例示出的一种无人驾驶车辆自动控制信号生成方 法的示意流程图。本实施例所述的无人驾驶车辆自动控制信号生成方法可以适 用于车辆、船舶、飞行器等载具的自动驾驶领域(以下主要针对车辆这种载具 进行示例性说明),具体可以用于生成模型,通过所述模型可以根据环境信息生 成信号控制车辆行驶。
如图1所示,所述无人驾驶车辆自动控制信号生成方法可以包括以下步骤:
步骤S1,根据多个时刻下车辆的驾驶员实际输出的控制信号与所述多个时 刻确定第一拟合函数,根据所述多个时刻下训练过程模型基于车辆的环境信息 输出的控制信号与所述多个时刻确定第二拟合函数,其中,所述第一拟合函数 与所述第二拟合函数的类型相同,且包含函数项的数目相同;
步骤S2,根据所述第一拟合函数和所述第二拟合函数中相同类型的函数项 的系数的差值确定损失函数;
步骤S3,根据所述损失函数训练所述训练过程模型以得到训练完成模型;
步骤S4,根据训练完成模型和所述车辆的环境信息生成用于自动控制所述 车辆的信号。
在一个实施例中,可以先由驾驶员人工驾驶车辆,然后记录多个时刻(例 如共n个时刻)下驾驶员输出的控制信号(例如y1至yn),进而根据多个时刻 和多个时刻对应的多个控制信号确定第一拟合函数。
由于驾驶员从人类角度观察车辆的环境信息,在环境信息改变较小的情况 下,不易出现大幅度改变输出信号的动作,也就不会导致输出信号发生摆动, 也即驾驶员输出的信号是相对平滑的。
例如在路面上对应车辆右侧轮胎的位置存在凹陷,相关技术中的模型可能 会输出车辆向左转向的信号,然后经过凹陷后再生成向右转向的信号,而驾驶 员可以根据经验估计凹陷的深度是否会导致车辆产生过大的颠簸,例如凹陷较 浅,那么驾驶员可能并不会输出转向信号,而是从凹陷上压过去,或者即使驾 驶员输出向左转向的信号避开凹陷,但是向左转向后,车辆仍在原车道内行驶, 那么驾驶员可以不输出向右转向的信号。可见,驾驶员输出的控制信号相对于 相关技术中的模型输出的信号摆动较少,也即更加稳定。
还可以根据所述多个时刻下训练过程模型(例如可以是神经网络)基于车 辆的环境信息输出的控制信号与所述多个时刻确定第二拟合函数,也即根据在 所述多个时刻将车辆的环境信息输入到训练过程模型中,训练过程模型输出多 个控制信号(例如z1至zn),然后对多个控制信号进行拟合得到第二拟合函数。
在一个实施例中,环境信息至少包括以下至少之一:
障碍物(包括静态障碍物和动态障碍物)、车道线、交通指示灯、交通指示 牌、路面形状(例如存在凹陷或凸起)。
在一个实施例中,驾驶员输出的控制信号和训练过程模型输出的控制信号 可以相同,包括以下至少之一:
方向信号,加速度信号,速度信号。
由于第一拟合函数是根据驾驶员在多个时刻输出的控制信合拟合得到的, 所以第一拟合函数可以表达驾驶员输出的控制信号的稳定性。由于第二拟合函 数是根据驾驶员在多个时刻输出的控制信合拟合得到的,所以第二拟合函数可 以表达训练过程模型输出的控制信号的稳定性。
而一个函数的稳定性,主要通过函数中每个函数项的系数来体现,那么比 较第一拟合函数和第二拟合函数稳定性的差异,可以将第一拟合函数与第二拟 合函数中相同类型的函数项的系数做差,并根据差值来确定两个拟合函数稳定 性的差异。
为了保证能够计算第一拟合函数与第二拟合函数中相同类型的函数项的系 数的差值,第一拟合函数与所述第二拟合函数的相同,且包含函数项的数目相 同。
例如第一拟合函数和第二拟合函数均为多项式函数,针对t0至t(n-1)这n 个时刻的控制信号而言,其中第一拟合函数的函数形式如下:
f1(n)=cn-1yn-1+cn-2yn-2+...+c1y+c0
其中,y为驾驶员输出的控制信号;
例如n=3,那么c0=[f1(1)-2f1(2)+f1(3)]/2,c1=[f1(3)-f1(1)]/2,c2=f1(2);
第一拟合函数的函数形式如下:
f2(n)=dn-1zn-1+dn-2zn-2+...+d1z+d0
其中,z为训练过程模型输出的控制信号;
例如n=3,那么c0=[f2(1)-2f2(2)+f2(3)]/2,d1=[f2(3)-f2(1)]/2,d2=f2(2);
那么第一拟合函数f1(x)和第二拟合函数f2(x)中相同类型的函数项的系数的 差值为cn-1-dn-1,cn-2-dn-2,…,c1-d1,c0-d0,这些差值可以体现第一拟合函数和第二 拟合函数稳定性的差异,例如可以将这些差值的绝对值加和:
Figure BDA0002157126720000071
并通过求和得到的值D来表达两个函数稳定性的差异,从而可以根据这些 差值来确定损失函数。
需要说明的是,第一拟合函数和第二拟合函数中函数项的类型并不限于上 述多项式中的函数项,还可以包括但不限于指数项,对数项等。
然后可以根据该损失函数训练训练过程模型,也即在训练(例如基于监督 学习或非监督学习训练)训练过程模型的过程中,可以参考损失函数中的D, 若D较大,例如大于第一预设值,那么继续调整训练过程模型,直至D小于或 等于第一预设值,即可确定训练过程模型训练完成,从而得到训练完成模型。
根据本实施例,由于对模型训练过程中参考的损失函数,可以表达驾驶员 实际输出的控制信号和模型输出的控制信号之间稳定性的差异,从而使得训练 得到的模型基于环境信息输出的控制信号,可以与驾驶员基于环境信息输出的 控制信号稳定性相近,有利于保证模型输出控制信号的稳定性。
虽然针对模型输出的控制信号摆动的问题,相关技术中有的采用平滑滤波 器的方式处理模型输出的控制信号,但是这是针对模型输出的控制信号进行调 整,并没有使得模型本身更加准确,还可能出现需要输出较大变化的控制信号 时,例如连续避让障碍时,导致控制信号被平滑掉,从而导致避让失败,容易 出现危险。
而本实施例则是通过构建损失函数,在训练模型的过程能够参考该损失函 数,进而使得训练得到的模型更加准确,则输出结果也是准确的。
图2是根据本公开的实施例示出的另一种无人驾驶车辆自动控制信号生成 方法的示意流程图。如图2所示,所述对每种类型的函数项的系数的差值的绝 对值求和以确定所述损失函数包括:
步骤S201,对每种类型的函数项的系数的差值的平方进行加权求和以确定 所述损失函数。
在一个实施例中,可以对每种类型的函数项的系数的差值的平方进行加权 求和以确定损失函数,例如针对上述实施例中的第一拟合函数和第二拟合函数, 对其中每种类型的函数项的系数的差值的平方加权求和:
Figure BDA0002157126720000081
其中,wi是第i项函数项差值的平方||di-ci||2的权重,可 以根据需要进行设置。
可选地,所述第一拟合函数和所述第二拟合函数中的函数项包括以下类型 至少之一:
多项式函数,指数函数,对数函数。
图3是根据本公开的实施例示出的又一种无人驾驶车辆自动控制信号生成 方法的示意流程图。如图3所述,所述训练过程模型为神经网络,所述神经网 络包括m层,在根据所述第一拟合函数和所述第二拟合函数中相同类型的函数 项的系数的差值确定损失函数之前,所述方法还包括:
步骤S5,确定驾驶员在第一时刻的环境信息下输出的第一控制信号,在第 二时刻输出的第二控制信号和在第三时刻输出的第三控制信号,其中,第一控 制信号大于第二控制信号,第二控制信号大于第三控制信号,且第一控制信号 与第二控制信号的差值,小于第二控制信号与第三控制信号的差值;
步骤S6,确定所述第一时刻的环境信息在所述神经网络中第j层激发的第 一特征值,所述第二时刻的环境信息在所述神经网络中第j层激发的第二特征值, 所述第三时刻的环境信息在所述神经网络中第j层激发的第三特征值;
步骤S7,计算第一控制信号和第二控制信号的差值,与第二控制信号和第 三控制信号的差值的控制信号比值,第一特征值和第二特征值的差值,与第二 特征值和第三特征值的差值的第j差值比;
步骤S8,计算所述控制信号比值与所述第j差值比的第j差值的绝对值;
其中,所述根据所述第一拟合函数和所述第二拟合函数中相同类型的函数 项的系数的差值确定损失函数包括:
步骤S202,根据所述第一拟合函数中函数项的系数和所述第二拟合函数中 函数项的系数的差值的绝对值,以及所述第j差值的绝对值确定损失函数,j≤m。
图4是根据本公开的实施例示出的一种训练过程模型的示意图。
在一个实施例中,以神经网络作为训练过程模型为例,如图4所示,所述 神经网络包括m层,每个时刻的环境信息输入到神经网络中,在神经网络的每 一层都会激发出相应的特征。
在驾驶员输出的控制信号确定三个控制信号,分别为驾驶员在第一时刻的 环境信息下输出的第一控制信号y(p),在第二时刻输出的第二控制信号y(q)和在 第三时刻输出的第三控制信号y(r),其中,需要保证第一控制信号y(p)大于第二 控制信号y(q),第二控制信号y(q)大于第三控制信号y(r),且第一控制信号y(p) 与第二控制信号y(q)的差值y(p)-y(q),小于第二控制信号y(q)与第三控制信号 y(r)的差值y(q)-y(r),而第一时刻、第二时刻和第三时间之间并没有必然的先后 关系。
而第一控制信号y(p)、第二控制信号y(q)和第三控制信号y(r)对应的环境信 息,第一时刻的环境信息p,第二时刻的环境信息q,第三时刻的环境信息r, 在神经网络的第j层可以分别激发出特征,其中,第一时刻的环境信息p激发出 的特征为第一特征值fj(p),第二时刻的环境信息q激发出的特征为第二特征值 fj(q),第三时刻的环境信息r激发出的特征为第三特征值fj(r)。
由于第一控制信号y(p)大于第二控制信号y(q),第二控制信号y(q)大于第三 控制信号y(r),且第一控制信号y(p)与第二控制信号y(q)的差值y(p)-y(q),小于 第二控制信号y(q)与第三控制信号y(r)的差值y(q)-y(r),这表明驾驶员根据环境 信息p输出的第一控制信号y(q)与根据环境信息q输出的第二控制信号y(q)之间 的相似度,相对于根据环境信息q输出的第二控制信号y(q)与根据环境信息r 输出的第三控制信号y(r)之间的相似度更高,这两个相似度之间的差异程度可以 通过第一控制信号y(q)和第二控制信号y(q)的差值,与第二控制信号y(q)和第三 控制信号y(r)的差值的控制信号比值表示:
Figure BDA0002157126720000101
基于这种关系,理想情况下环境信息p激发出第一特征值fj(p)和环境信息 q激发出的第二特征值fj(q)之间的相似度,相对于环境信息q激发出的第二特 征值fj(q)和环境信息r激发出的第二特征值fj(r)之间的相似度更高,这两个相 似度之间的差异程度可以通过第一特征值fj(p)和第二特征值fj(q)的差值,与第 二特征值fj(q)和第三特征值fj(r)的差值的第j差值比表示:
Figure BDA0002157126720000111
由于驾驶员输出的控制信号一般不会频繁地摆动,那么在基于训练过程模 型激励得到的第j差值比,和基于驾驶员输出的控制信号得到的控制信号比值相 同的情况下,训练过程模型激励得到的特征值变化也较为稳定,从而使得训练 过程模型接近驾驶员对环境信息的处理方式。
那么可以计算控制信号比值与所述第j差值比的第j差值Si
Figure BDA0002157126720000112
进而可以根据前述实施例中的第一拟合函数中函数项的系数和第二拟合函 数中函数项的系数的差值的绝对值D与Si一起构建损失函数。然后可以根据该 损失函数训练训练过程模型,也即在训练训练过程模型的过程中,可以参考损 失函数中的D与Si,若D与Si之和较大,例如大于第二预设值,那么继续调整 训练过程模型,直至D与Si之和小于或等于第二预设值,即可确定训练过程模 型训练完成。
根据本实施例,损失函数不仅包含第一拟合函数中函数项的系数和第二拟 合函数中函数项的系数的差值的绝对值D,还包含控制信号比值与所述第j差值 比的第j差值Si,而在训练过程中使得损失函数中的Si较小,可以保证训练过程 模型激励得到的特征值变化较为稳定,进而使得训练得到的模型接近驾驶员对 环境信息的处理方式。
图5是根据本公开的实施例示出的又一种无人驾驶车辆自动控制信号生成 方法的示意流程图。如图5所示,在根据所述第一拟合函数和所述第二拟合函 数中相同类型的函数项的系数的差值确定损失函数之前,所述方法还包括:
步骤S9,对第一差值的绝对值到第m差值的绝对值进行加权求和;
其中,所述根据所述第一拟合函数和所述第二拟合函数中相同类型的函数 项的系数的差值确定损失函数包括:
步骤S2021,根据所述第一拟合函数中函数项的系数和所述第二拟合函数中 函数项的系数的差值的绝对值,以及对第一差值的绝对值到第m差值的绝对值 进行加权求和的值确定损失函数。
在一个实施例中,可以根据第一拟合函数中函数项的系数和第二拟合函数 中函数项的系数的差值的绝对值,以及对第一差值的绝对值到第m差值的绝对 值进行加权求和的值确定损失函数。其中,对第一差值的绝对值到第m差值的 绝对值进行加权求和的值为:
Figure BDA0002157126720000121
其中,vj是第j差值的绝对值Sj的权重,可以根据需要进行设置。
图6是根据本公开的实施例示出的又一种无人驾驶车辆自动控制信号生成 方法的示意流程图。如图6所示,所述训练过程模型为神经网络,所述神经网 络包括m层,在根据所述第一拟合函数和所述第二拟合函数中相同类型的函数 项的系数的差值确定损失函数之前,所述方法还包括:
步骤S10,确定驾驶员在第一时刻的环境信息下输出的第一控制信号,在第 二时刻输出的第二控制信号和在第三时刻输出的第三控制信号,其中,第一控 制信号大于第二控制信号,第二控制信号大于第三控制信号,且第一控制信号 与第二控制信号的差值,小于第二控制信号与第三控制信号的差值;
步骤S11,确定所述第一时刻的环境信息在所述神经网络中第j层激发的第 一特征值,所述第二时刻的环境信息在所述神经网络中第j层激发的第二特征值, 所述第三时刻的环境信息在所述神经网络中第j层激发的第三特征值;
步骤S12,计算第一控制信号和第二控制信号的第一实际相关度,以及计算 第二控制信号和第三控制信号的第二实际相关度,第一特征值和第二特征值的 第一模型相关度,以及第二特征值和第三特征值的第二模型相关度;
步骤S13,计算所述第一实际相关度和所述第一模型相关度的差值的绝对值, 与所述第二实际相关度和所述第二模型相关度的差值的绝对值的第j绝对值和;
其中,所述根据所述第一拟合函数和所述第二拟合函数中相同类型的函数 项的系数的差值确定损失函数包括:
步骤S203,根据所述第一拟合函数中函数项的系数和所述第二拟合函数中 函数项的系数的差值的绝对值,以及所述第j绝对值和确定损失函数,j≤m。
在一个实施例中,以神经网络作为训练过程模型为例,如图4所示,所述 神经网络包括m层,每个时刻的环境信息输入到神经网络中,在神经网络的每 一层都会激发出相应的特征。
在驾驶员输出的控制信号确定三个控制信号,分别为驾驶员在第一时刻的 环境信息下输出的第一控制信号y(p),在第二时刻输出的第二控制信号y(q)和在 第三时刻输出的第三控制信号y(r),其中,需要保证第一控制信号y(p)大于第二 控制信号y(q),第二控制信号y(q)大于第三控制信号y(r),且第一控制信号y(p) 与第二控制信号y(q)的差值y(p)-y(q),小于第二控制信号y(q)与第三控制信号 y(r)的差值y(q)-y(r),而第一时刻、第二时刻和第三时间之间并没有必然的先后 关系。
而第一控制信号y(p)、第二控制信号y(q)和第三控制信号y(r)对应的环境信 息,第一时刻的环境信息p,第二时刻的环境信息q,第三时刻的环境信息r, 在神经网络的第j层可以分别激发出特征,其中,第一时刻的环境信息p激发出 的特征为第一特征值fj(p),第二时刻的环境信息q激发出的特征为第二特征值 fj(q),第三时刻的环境信息r激发出的特征为第三特征值fj(r)。
由于第一控制信号y(p)大于第二控制信号y(q),第二控制信号y(q)大于第三 控制信号y(r),且第一控制信号y(p)与第二控制信号y(q)的差值y(p)-y(q),小于 第二控制信号y(q)与第三控制信号y(r)的差值y(q)-y(r),这表明驾驶员根据环境 信息p输出的第一控制信号y(q)与根据环境信息q输出的第二控制信号y(q)之间 的第一实际相关度,相对于根据环境信息q输出的第二控制信号y(q)与根据环境 信息r输出的第三控制信号y(r)之间的第二实际相关度更高。
基于这种关系,理想情况下环境信息p激发出第一特征值fj(p)和环境信息 q激发出的第二特征值fj(q)之间的第一模型相关度,相对于环境信息q激发出 的第二特征值fj(q)和环境信息r激发出的第二特征值fj(r)之间的第二模型相关 度更高。
其中,上述第一实际相关度S1,第二实际相关度S2,第一模型相关度S'1, 第二模型相关度S'2,可以根据余弦公式,欧式距离计算。
以第一实际相关度S1为例,可以计算y(p)与y(q)的余弦相关度为:
Figure RE-GDA0002212186480000011
其中,y(p)与y(q)可以是包含方向信号,加速度信号,速 度信号等多种信号的向量。
由于驾驶员输出的控制信号一般不会频繁地摆动,那么理想情况下,基于 训练过程模型激励得到的第一模型相关度,和基于驾驶员输出的控制信号得到 的第一实际相关度应该较为接近,同理,第二模型相关度与第一实际相关度也 因该较为接近。
那么可以计算第一实际相关度S1和第一模型相关度S'1的差值的绝对值:
||S1-S'1||;
以及计算第一实际相关度S2和第一模型相关度S'2的差值的绝对值:
||S2-S'2||;
进而计算这两个绝对值之和作为第j绝对值和:
S'j=||S1-S'1||+||S2-S'2||。
据此,可以根据前述实施例中的第一拟合函数中函数项的系数和第二拟合 函数中函数项的系数的差值的绝对值D与第j绝对值和一起构建损失函数。然 后可以根据该损失函数训练训练过程模型,也即在训练训练过程模型的过程中, 可以参考损失函数中的D与第j绝对值和,若D与第j绝对值和之和较大,例 如大于第二预设值,那么继续调整训练过程模型,直至D与第j绝对值和之和 小于或等于第二预设值,即可确定训练过程模型训练完成。
根据本实施例,损失函数不仅包含第一拟合函数中函数项的系数和第二拟 合函数中函数项的系数的差值的绝对值D,还包含第j绝对值和,而在训练过程 中使得第j绝对值和较小,可以保证训练过程模型激励得到的特征值变化较为稳 定,进而使得训练得到的模型接近驾驶员对环境信息的处理方式。
图7是根据本公开的实施例示出的又一种无人驾驶车辆自动控制信号生成 方法的示意流程图。如图7所示,在根据所述第一拟合函数和所述第二拟合函 数中相同类型的函数项的系数的差值确定损失函数之前,所述方法还包括:
步骤S14,对第一绝对值和的到第n绝对值和进行加权求和;
其中,所述根据所述第一拟合函数和所述第二拟合函数中相同类型的函数 项的系数的差值确定损失函数包括:
步骤S2031,根据所述第一拟合函数中函数项的系数和所述第二拟合函数中 函数项的系数的差值的绝对值,以及对第一绝对值和到第n绝对值和进行加权 求和的值确定损失函数。
在一个实施例中,可以根据第一拟合函数中函数项的系数和第二拟合函数 中函数项的系数的差值的绝对值,以及对第一绝对值和到第n绝对值和进行加 权求和的值确定损失函数。其中,对第一绝对值和到第n绝对值和进行加权求 和的值为:
Figure BDA0002157126720000151
其中,v'j是第j绝对值和S'j的权重,可以根据需要进行设置。
图8是根据本公开的实施例示出的又一种无人驾驶车辆自动控制信号生成 方法的示意流程图。如图8所示,在根据所述第一拟合函数和所述第二拟合函 数中相同类型的函数项的系数的差值确定损失函数之前,所述方法还包括:
步骤S15,确定在车辆的样本环境信息下驾驶员实际输出的实际控制信号, 以及所述训练过程模型基于车辆的样本环境信息输出的模型控制信号;
步骤S16,计算所述实际控制信号与所述模型控制信号的差值的绝对值;
其中,所述根据所述第一拟合函数和所述第二拟合函数中相同类型的函数 项的系数的差值确定损失函数包括:
步骤S204,根据所述第一拟合函数中函数项的系数和所述第二拟合函数中 函数项的系数的差值的绝对值,以及所述实际控制信号与所述模型控制信号的 差值的绝对值确定损失函数。
在一个实施例中,还可以根据实际控制信号与模型控制信号的差值的绝对 值构建损失函数,实际控制信号与模型控制信号的差值的绝对值可以直观地反 应训练过程模型输出的模型控制信号与驾驶员输出的实际控制信号的差异,在 对训练过程模型进行训练的过程中,可以调整训练过程模型,直至第一拟合函 数中函数项的系数和第二拟合函数中函数项的系数的差值的绝对值D与实际控 制信号与模型控制信号的差值的绝对值较小,例如小于或等于第三预设值。
在此基础上,可以综合第一拟合函数中函数项的系数和第二拟合函数中函 数项的系数的差值的绝对值D,控制信号比值与第j差值比的第j差值Si或者第 j绝对值和S'j,以及实际控制信号与模型控制信号的差值的绝对值确定损失函数。
本公开无人驾驶车辆自动控制信号生成装置的实施例可以应用在网络设备 (例如服务器)上。装置实施例可以通过软件实现,也可以通过硬件或者软硬 件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其 所在设备的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运 行形成的。从硬件层面而言,如图9所示,为本公开无人驾驶车辆自动控制信 号生成装置所在设备的一种硬件结构图,除了图9所示的处理器、网络接口、 内存以及非易失性存储器之外,实施例中装置所在的设备通常还可以包括其他 硬件,如负责处理报文的转发芯片等等;从硬件结构上来讲该设备还可能是分 布式的设备,可能包括多个接口卡,以便在硬件层面进行报文处理的扩展。
图10是根据本公开的实施例示出的一种无人驾驶车辆自动控制信号生成装 置的示意框图。本实施例所述无人驾驶车辆自动控制信号生成装置可以适用于 车辆、船舶、飞行器等载具的自动驾驶领域(以下主要针对车辆这种载具进行 示例性说明),具体可以用于生成模型,通过所述模型可以根据环境信息生成信 号控制车辆行驶。
如图10所示,所述无人驾驶车辆自动控制信号生成装置包括:
拟合函数确定模块1,用于根据多个时刻下车辆的驾驶员实际输出的控 制信号与所述多个时刻确定第一拟合函数,根据所述多个时刻下训练过程模 型基于车辆的环境信息输出的控制信号与所述多个时刻确定第二拟合函数, 其中,所述第一拟合函数与所述第二拟合函数的类型相同,且包含函数项的 数目相同;
损失函数确定模块2,用于根据所述第一拟合函数和所述第二拟合函数 中相同类型的函数项的系数的差值确定损失函数;
模型训练模块3,用于根据所述损失函数训练所述训练过程模型以得到 训练完成模型;
信号生成模块4,用于根据训练完成模型和所述车辆的环境信息生成用 于自动控制所述车辆的信号。
可选地,所述损失函数确定模块用于对每种类型的函数项的系数的差值 的平方进行加权求和以确定所述损失函数。
可选地,所述第一拟合函数和所述第二拟合函数中的函数项包括以下类 型至少之一:
多项式函数,指数函数,对数函数。
图11是根据本公开的实施例示出的另一种无人驾驶车辆自动控制信号 生成装置的示意框图。如图11所示,所述训练过程模型为神经网络,所述神 经网络包括m层,所述装置还包括:
第一信号确定模块5,用于确定驾驶员在第一时刻的环境信息下输出的 第一控制信号,在第二时刻输出的第二控制信号和在第三时刻输出的第三控 制信号,其中,第一控制信号大于第二控制信号,第二控制信号大于第三控 制信号,且第一控制信号与第二控制信号的差值,小于第二控制信号与第三 控制信号的差值;
第一特征确定模块6,用于确定所述第一时刻的环境信息在所述神经网 络中第j层激发的第一特征值,所述第二时刻的环境信息在所述神经网络中 第j层激发的第二特征值,所述第三时刻的环境信息在所述神经网络中第j 层激发的第三特征值;
比值计算模块7,用于计算第一控制信号和第二控制信号的差值,与第 二控制信号和第三控制信号的差值的控制信号比值,第一特征值和第二特征 值的差值,与第二特征值和第三特征值的差值的第j差值比;
第一绝对值计算模块8,用于计算所述控制信号比值与所述第j差值比 的第j差值的绝对值;
其中,所述损失函数确定模块2用于根据所述第一拟合函数中函数项的 系数和所述第二拟合函数中函数项的系数的差值的绝对值,以及所述第j差 值的绝对值确定损失函数,j≤m。
图12是根据本公开的实施例示出的又一种无人驾驶车辆自动控制信号 生成装置的示意框图。如图12所示,所述装置还包括:
第一求和模块9,用于对第一差值的绝对值到第m差值的绝对值进行加 权求和;
其中,所述损失函数确定模块2用于,根据所述第一拟合函数中函数项 的系数和所述第二拟合函数中函数项的系数的差值的绝对值,以及对第一差 值的绝对值到第m差值的绝对值进行加权求和的值确定损失函数。
图13是根据本公开的实施例示出的又一种无人驾驶车辆自动控制信号 生成装置的示意框图。如图13所示,所述训练过程模型为神经网络,所述神 经网络包括m层,所述装置还包括:
第二信号确定模块10,确定驾驶员在第一时刻的环境信息下输出的第一 控制信号,在第二时刻输出的第二控制信号和在第三时刻输出的第三控制信 号,其中,第一控制信号大于第二控制信号,第二控制信号大于第三控制信 号,且第一控制信号与第二控制信号的差值,小于第二控制信号与第三控制 信号的差值;
第二特征确定模块11,确定所述第一时刻的环境信息在所述神经网络中 第j层激发的第一特征值,所述第二时刻的环境信息在所述神经网络中第j 层激发的第二特征值,所述第三时刻的环境信息在所述神经网络中第j层激 发的第三特征值;
相关度计算模块12,用于计算第一控制信号和第二控制信号的第一实际 相关度,以及计算第二控制信号和第三控制信号的第二实际相关度,第一特 征值和第二特征值的第一模型相关度,以及第二特征值和第三特征值的第二 模型相关度;
绝对值和计算模块13,用于计算所述第一实际相关度和所述第一模型相 关度的差值的绝对值,与所述第二实际相关度和所述第二模型相关度的差值 的绝对值的第j绝对值和;
其中,所述损失函数确定模块2用于,根据所述第一拟合函数中函数项 的系数和所述第二拟合函数中函数项的系数的差值的绝对值,以及所述第j 绝对值和确定损失函数,j≤m。
图14是根据本公开的实施例示出的又一种无人驾驶车辆自动控制信号 生成装置的示意框图。如图14所示,所述装置还包括:
第二求和模块14,对第一绝对值和的到第n绝对值和进行加权求和;
其中,所述损失函数确定模块2用于,根据所述第一拟合函数中函数项 的系数和所述第二拟合函数中函数项的系数的差值的绝对值,以及对第一绝 对值和到第n绝对值和进行加权求和的值确定损失函数。
图15是根据本公开的实施例示出的又一种无人驾驶车辆自动控制信号 生成装置的示意框图。如图15所示,所述装置还包括:
第三信号确定模块15,确定在车辆的样本环境信息下驾驶员实际输出的 实际控制信号,以及所述训练过程模型基于车辆的样本环境信息输出的模型 控制信号;
第二绝对值计算模块16,用于计算所述实际控制信号与所述模型控制信 号的差值的绝对值;
其中,所述损失函数确定模块2用于,根据所述第一拟合函数中函数项 的系数和所述第二拟合函数中函数项的系数的差值的绝对值,以及所述实际 控制信号与所述模型控制信号的差值的绝对值确定损失函数。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有 关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参 见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的, 其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作 为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方, 或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或 者全部模块来实现本公开方案的目的。本领域普通技术人员在不付出创造性 劳动的情况下,即可以理解并实施。
本公开的实施例还提出一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为实现上述任一实施例所述的方法。
本公开的实施例还提出一种计算机可读存储介质,其上存储有计算机程序, 该程序被处理器执行时实现上述任一实施例所述方法中的步骤。
本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本 公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性 变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公 开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被 视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确 结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所 附的权利要求来限制。

Claims (10)

1.一种无人驾驶车辆自动控制信号生成方法,其特征在于,包括:
根据多个时刻下车辆的驾驶员实际输出的控制信号与所述多个时刻确定第一拟合函数,根据所述多个时刻下训练过程模型基于车辆的环境信息输出的控制信号与所述多个时刻确定第二拟合函数,其中,所述第一拟合函数与所述第二拟合函数的类型相同,且包含函数项的数目相同;
根据所述第一拟合函数和所述第二拟合函数中相同类型的函数项的系数的差值确定损失函数;
根据所述损失函数训练所述训练过程模型以得到训练完成模型;
根据所述训练完成模型和所述车辆的环境信息生成用于自动控制所述车辆的信号;
在根据所述第一拟合函数和所述第二拟合函数中相同类型的函数项的系数的差值确定损失函数之前,所述方法还包括:
确定在车辆的样本环境信息下驾驶员实际输出的实际控制信号,以及所述训练过程模型基于车辆的样本环境信息输出的模型控制信号;
计算所述实际控制信号与所述模型控制信号的差值的绝对值;
其中,所述根据所述第一拟合函数和所述第二拟合函数中相同类型的函数项的系数的差值确定损失函数包括:
根据所述第一拟合函数中函数项的系数和所述第二拟合函数中函数项的系数的差值的绝对值,以及所述实际控制信号与所述模型控制信号的差值的绝对值确定损失函数。
2.根据权利要求1所述的方法,其特征在于,所述对每种类型的函数项的系数的差值的绝对值求和以确定所述损失函数包括:
对每种类型的函数项的系数的差值的平方进行加权求和以确定所述损失函数。
3.根据权利要求1所述的方法,其特征在于,所述第一拟合函数和所述第二拟合函数中的函数项包括以下类型至少之一:
多项式函数,指数函数,对数函数。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述训练过程模型为神经网络,所述神经网络包括m层,在根据所述第一拟合函数和所述第二拟合函数中相同类型的函数项的系数的差值确定损失函数之前,所述方法还包括:
确定驾驶员在第一时刻的环境信息下输出的第一控制信号,在第二时刻输出的第二控制信号和在第三时刻输出的第三控制信号,其中,第一控制信号大于第二控制信号,第二控制信号大于第三控制信号,且第一控制信号与第二控制信号的差值,小于第二控制信号与第三控制信号的差值;
确定所述第一时刻的环境信息在所述神经网络中第j层激发的第一特征值,所述第二时刻的环境信息在所述神经网络中第j层激发的第二特征值,所述第三时刻的环境信息在所述神经网络中第j层激发的第三特征值;
计算第一控制信号和第二控制信号的差值,与第二控制信号和第三控制信号的差值的控制信号比值,第一特征值和第二特征值的差值,与第二特征值和第三特征值的差值的第j差值比;
计算所述控制信号比值与所述第j差值比的第j差值的绝对值;
其中,所述根据所述第一拟合函数和所述第二拟合函数中相同类型的函数项的系数的差值确定损失函数包括:
根据所述第一拟合函数中函数项的系数和所述第二拟合函数中函数项的系数的差值的绝对值,以及所述第j差值的绝对值确定损失函数,j≤m。
5.根据权利要求4所述的方法,其特征在于,在根据所述第一拟合函数和所述第二拟合函数中相同类型的函数项的系数的差值确定损失函数之前,所述方法还包括:
对第一差值的绝对值到第m差值的绝对值进行加权求和;
其中,所述根据所述第一拟合函数和所述第二拟合函数中相同类型的函数项的系数的差值确定损失函数包括:
根据所述第一拟合函数中函数项的系数和所述第二拟合函数中函数项的系数的差值的绝对值,以及对第一差值的绝对值到第m差值的绝对值进行加权求和的值确定损失函数。
6.根据权利要求1至3中任一项所述的方法,其特征在于,所述训练过程模型为神经网络,所述神经网络包括m层,在根据所述第一拟合函数和所述第二拟合函数中相同类型的函数项的系数的差值确定损失函数之前,所述方法还包括:
确定驾驶员在第一时刻的环境信息下输出的第一控制信号,在第二时刻输出的第二控制信号和在第三时刻输出的第三控制信号,其中,第一控制信号大于第二控制信号,第二控制信号大于第三控制信号,且第一控制信号与第二控制信号的差值,小于第二控制信号与第三控制信号的差值;
确定所述第一时刻的环境信息在所述神经网络中第j层激发的第一特征值,所述第二时刻的环境信息在所述神经网络中第j层激发的第二特征值,所述第三时刻的环境信息在所述神经网络中第j层激发的第三特征值;
计算第一控制信号和第二控制信号的第一实际相关度,以及计算第二控制信号和第三控制信号的第二实际相关度,第一特征值和第二特征值的第一模型相关度,以及第二特征值和第三特征值的第二模型相关度;
计算所述第一实际相关度和所述第一模型相关度的差值的绝对值,与所述第二实际相关度和所述第二模型相关度的差值的绝对值的第j绝对值和;
其中,所述根据所述第一拟合函数和所述第二拟合函数中相同类型的函数项的系数的差值确定损失函数包括:
根据所述第一拟合函数中函数项的系数和所述第二拟合函数中函数项的系数的差值的绝对值,以及所述第j绝对值和确定损失函数,j≤m。
7.根据权利要求6所述的方法,其特征在于,在根据所述第一拟合函数和所述第二拟合函数中相同类型的函数项的系数的差值确定损失函数之前,所述方法还包括:
对第一绝对值和的到第n绝对值和进行加权求和;
其中,所述根据所述第一拟合函数和所述第二拟合函数中相同类型的函数项的系数的差值确定损失函数包括:
根据所述第一拟合函数中函数项的系数和所述第二拟合函数中函数项的系数的差值的绝对值,以及对第一绝对值和到第n绝对值和进行加权求和的值确定损失函数。
8.一种无人驾驶车辆自动控制信号生成装置,其特征在于,包括:
拟合函数确定模块,用于根据多个时刻下车辆的驾驶员实际输出的控制信号与所述多个时刻确定第一拟合函数,根据所述多个时刻下训练过程模型基于车辆的环境信息输出的控制信号与所述多个时刻确定第二拟合函数,其中,所述第一拟合函数与所述第二拟合函数的类型相同,且包含函数项的数目相同;
损失函数确定模块,用于根据所述第一拟合函数和所述第二拟合函数中相同类型的函数项的系数的差值确定损失函数;
模型训练模块,用于根据所述损失函数训练所述训练过程模型以得到训练完成模型;
信号生成模块,用于根据所述训练完成模型和所述车辆的环境信息生成用于自动控制所述车辆的信号。
9.一种无人驾驶车辆,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为实现权利要求1至7中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至7中任一项所述方法中的步骤。
CN201910720811.1A 2019-08-06 2019-08-06 无人驾驶车辆自动控制信号生成方法和装置 Active CN110481561B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910720811.1A CN110481561B (zh) 2019-08-06 2019-08-06 无人驾驶车辆自动控制信号生成方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910720811.1A CN110481561B (zh) 2019-08-06 2019-08-06 无人驾驶车辆自动控制信号生成方法和装置

Publications (2)

Publication Number Publication Date
CN110481561A CN110481561A (zh) 2019-11-22
CN110481561B true CN110481561B (zh) 2021-04-27

Family

ID=68549898

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910720811.1A Active CN110481561B (zh) 2019-08-06 2019-08-06 无人驾驶车辆自动控制信号生成方法和装置

Country Status (1)

Country Link
CN (1) CN110481561B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111152796B (zh) * 2020-04-07 2020-08-07 北京三快在线科技有限公司 一种车辆运动状态预测方法及装置
CN112364561B (zh) * 2020-10-26 2022-07-26 上海感探号信息科技有限公司 控车动作修正方法、装置、电子设备和存储介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016145917A (ja) * 2015-02-09 2016-08-12 株式会社東芝 シミュレーション条件設定装置、シミュレーション条件設定方法および運転訓練支援システム
US10762399B2 (en) * 2017-12-18 2020-09-01 Ford Global Technologies, Llc Using deep video frame prediction for training a controller of an autonomous vehicle
EP3532902A4 (en) * 2017-12-29 2019-12-25 Beijing Didi Infinity Technology and Development Co., Ltd. PATH DETERMINATION SYSTEMS AND METHODS
CN108520155B (zh) * 2018-04-11 2020-04-28 大连理工大学 基于神经网络的车辆行为模拟方法
CN108875776B (zh) * 2018-05-02 2021-08-20 北京三快在线科技有限公司 模型训练方法和装置、业务推荐的方法和装置、电子设备
CN108791302B (zh) * 2018-06-25 2020-05-19 大连大学 驾驶员行为建模系统
CN109816092B (zh) * 2018-12-13 2020-06-05 北京三快在线科技有限公司 深度神经网络训练方法、装置、电子设备及存储介质
CN109871010B (zh) * 2018-12-25 2022-03-22 南方科技大学 基于强化学习型的方法及系统
CN109976340B (zh) * 2019-03-19 2022-02-08 中国人民解放军国防科技大学 一种基于深度增强学习的人机协同动态避障方法及系统

Also Published As

Publication number Publication date
CN110481561A (zh) 2019-11-22

Similar Documents

Publication Publication Date Title
US11958554B2 (en) Steering control for vehicles
WO2022052406A1 (zh) 一种自动驾驶训练方法、装置、设备及介质
CN110316193B (zh) 预瞄距离的设置方法、装置、设备及计算机可读存储介质
CN110481561B (zh) 无人驾驶车辆自动控制信号生成方法和装置
EP4066171A1 (en) Vehicle intent prediction neural network
CN109405843B (zh) 一种路径规划方法及装置和移动设备
US20180232636A1 (en) Learning device, estimating device, estimating system, learning method, estimating method, and storage medium
CN111201448A (zh) 用于产生反演传感器模型的方法和设备以及用于识别障碍物的方法
JP2008018872A (ja) 運転支援装置、自動車及び運転支援方法
CN114454875A (zh) 一种基于强化学习的城市道路自动泊车方法及系统
CN115457395A (zh) 基于通道注意力与多尺度特征融合的轻量级遥感目标检测方法
JP2021033510A (ja) 運転支援装置
Kim et al. Vision-based uncertainty-aware lane keeping strategy using deep reinforcement learning
CN116343080A (zh) 一种动态稀疏关键帧视频目标检测方法、装置及存储介质
CN113281718B (zh) 一种基于激光雷达场景流估计的3d多目标跟踪系统及方法
CN110992424A (zh) 基于双目视觉的定位方法和系统
CN109492835A (zh) 车辆控制信息的确定方法、模型训练方法和相关装置
CN110864670B (zh) 目标障碍物位置的获取方法和系统
WO2023045791A1 (zh) 车道保持方法、装置、设备、介质及系统
JP6800901B2 (ja) 物体領域識別装置、物体領域識別方法およびプログラム
CN114966736A (zh) 一种基于点云数据进行目标速度预测的处理方法
CN113963027B (zh) 不确定性检测模型的训练、不确定性的检测方法及装置
JP2021012446A (ja) 学習装置及びプログラム
US20220036183A1 (en) Method and device for the fusion of sensor signals using a neural network
CN117765796B (zh) 自动驾驶教学系统、方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant