CN112987577A - 一种无人车数据驱动自适应控制方法和装置 - Google Patents

一种无人车数据驱动自适应控制方法和装置 Download PDF

Info

Publication number
CN112987577A
CN112987577A CN202110433277.3A CN202110433277A CN112987577A CN 112987577 A CN112987577 A CN 112987577A CN 202110433277 A CN202110433277 A CN 202110433277A CN 112987577 A CN112987577 A CN 112987577A
Authority
CN
China
Prior art keywords
model
unmanned vehicle
dimensional linear
linear dynamic
dynamic evolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110433277.3A
Other languages
English (en)
Other versions
CN112987577B (zh
Inventor
蒋薇
刘晋泽
苏绍璟
左震
郭晓俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN202110433277.3A priority Critical patent/CN112987577B/zh
Publication of CN112987577A publication Critical patent/CN112987577A/zh
Application granted granted Critical
Publication of CN112987577B publication Critical patent/CN112987577B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • G05B13/027Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using neural networks only

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

本申请涉及一种无人车数据驱动自适应控制方法、装置、计算机设备和存储介质。方法包括:通过传感器获取无人车在行驶状态下的多组数据对信息,构建非线性静态映射模型和高维线性动态演化模型。在预测时域内以最小化期望轨迹跟踪误差为优化目标,构建无人车的模型预测控制最优化模型,获取无人车在当前时间步的控制信息。当行驶时间大于预设的时间步时,获取当前时间步前l个历史时刻多组数据对信息;根据预设的更新律、前l个历史时刻多组数据对信息,对高维线性动态演化模型的参数信息进行更新,求解模型预测控制最优化模型,确定无人车当前时间步的控制量。本发明可以实现无人车的在线自适应模型预测控制。

Description

一种无人车数据驱动自适应控制方法和装置
技术领域
本申请涉及无人车技术领域,特别是涉及一种无人车数据驱动自适应控制方法、装置、计算机设备和存储介质。
背景技术
随着无人车技术的发展,无人车有了越来越多的应用。无人车的动力学是高度非线性的,设计基于优化的控制方法具有一定的挑战。当前的控制方法均有各自的局限性,绝大部分工作控制器的设计均需要动力学模型信息,但实际应用中精确模型难以获取,且控制器结构复杂,计算量大,无法有效处理无人车系统的状态和控制量的约束;另一方面,由于无人车系统具有高度时变特性,无人车辆在不同路况下呈现的动力学特性是有显著差异的,仅仅靠离线辨识,在线设计控制器不能完全解决自适应自主驾驶问题。因此,现有的无人车预测控制方法存在控制效果不佳的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提升无人车自主驾驶对路面适应性能的无人车数据驱动自适应控制方法、装置、计算机设备和存储介质。
一种无人车数据驱动自适应控制方法,所述方法包括:
通过传感器预先获取无人车在行驶状态下的多组数据对信息;所述多组数据对信息中的每组数据对包含一个时刻的当前控制量、当前状态量和下一时刻状态量;
构建非线性静态映射模型和高维线性动态演化模型,根据所述多组数据对信息通过构建有监督回归优化问题,求解所述高维线性动态演化模型,得到所述高维线性动态演化模型的参数信息;所述非线性静态映射模型满足在状态量为0时,所述非线性静态映射模型的值为0;所述高维线性动态演化模型根据所述参数信息确定模型参数;
在预测时域内以最小化期望轨迹跟踪误差为优化目标,构建无人车的模型预测控制最优化模型,以所述高维线性动态演化模型、所述非线性静态映射模型、状态量约束和控制量约束为约束条件,通过优化求解器求解所述模型预测控制最优化模型,得到预测时域内的控制量序列,并将第一个控制量作为无人车当前的控制量;
在无人车自主行驶过程中,在任意时刻
Figure 220135DEST_PATH_IMAGE001
,实时保存所述数据对信息,当行驶时间大于预设的时间步长时,利用当前时间步前l个历史时刻保存的所述数据对信息构成所述多组数据对信息;
在相继的时刻
Figure 668434DEST_PATH_IMAGE002
,根据预设的更新律、前l个历史时刻所述多组数据对信息,对所述参数信息进行更新,根据更新后的所述高维线性动态演化模型求解所述模型预测控制最优化模型,确定无人车当前时间步的控制量。
在其中一个实施例中,还包括:构建非线性静态映射模型为:
Figure 854696DEST_PATH_IMAGE003
其中,
Figure 515484DEST_PATH_IMAGE004
是一种非线性映射函数,以实现从
Figure 595436DEST_PATH_IMAGE005
的映射,可以设计成深度神经网络或者由基函数构成;
Figure 824423DEST_PATH_IMAGE006
表示
Figure 357035DEST_PATH_IMAGE007
时刻的高维的抽象状态量;
Figure 87094DEST_PATH_IMAGE008
表示
Figure 896918DEST_PATH_IMAGE009
时刻在原状态空间的状态量;
Figure 421440DEST_PATH_IMAGE010
表示原状态空间的维数;
Figure 80829DEST_PATH_IMAGE011
表示高维特征空间的维数;
构建高维线性动态演化模型为:
Figure 614579DEST_PATH_IMAGE012
其中,
Figure 544489DEST_PATH_IMAGE013
表示高维线性动态演化模型的参数;
Figure 505492DEST_PATH_IMAGE014
表示高维线性空间到低维非线性原状态空间的映射关系参数;
Figure 153642DEST_PATH_IMAGE015
表示
Figure 959924DEST_PATH_IMAGE016
时刻的控制量;
Figure 744340DEST_PATH_IMAGE017
表示
Figure 610665DEST_PATH_IMAGE018
时刻根据高维状态空间的状态值
Figure 244646DEST_PATH_IMAGE019
计算得到的状态量
Figure 589040DEST_PATH_IMAGE020
的估计值。
在其中一个实施例中,还包括:
构建求解高维线性动态演化模型参数
Figure 352597DEST_PATH_IMAGE021
的一种最优化目标函数为:
Figure 530768DEST_PATH_IMAGE022
其中,
Figure 746986DEST_PATH_IMAGE023
表示所述多组数据对信息的组数;
Figure 160650DEST_PATH_IMAGE024
表示第
Figure 919658DEST_PATH_IMAGE025
组数据对中无人车的状态量;
Figure 127786DEST_PATH_IMAGE026
表示
Figure 972245DEST_PATH_IMAGE027
的下一时刻状态量;
Figure 658441DEST_PATH_IMAGE028
是一种非线性映射函数,以实现从
Figure 396590DEST_PATH_IMAGE029
的映射,可以设计成深度神经网络或者由基函数构成,以基函数形式为例,
Figure 415100DEST_PATH_IMAGE030
Figure 605909DEST_PATH_IMAGE031
是基函数,
Figure 95797DEST_PATH_IMAGE032
Figure 563818DEST_PATH_IMAGE033
表示基函数的个数;
Figure 113748DEST_PATH_IMAGE034
表示第
Figure 791854DEST_PATH_IMAGE035
组数据对中无人车的控制量;
Figure 226378DEST_PATH_IMAGE036
是一个常数;
Figure 673540DEST_PATH_IMAGE037
表示Frobenius范数。
构建求解高维线性动态演化模型参数
Figure 128792DEST_PATH_IMAGE038
的一种最优化目标函数为:
Figure 435139DEST_PATH_IMAGE039
其中,
Figure 266829DEST_PATH_IMAGE040
是一个常数。
在其中一个实施例中,还包括:当非线性映射函数
Figure 834077DEST_PATH_IMAGE041
为深度神经网络时,构建求解高维线性动态演化模型参数
Figure 99711DEST_PATH_IMAGE042
和优化深度神经网络权值
Figure 752409DEST_PATH_IMAGE043
的一种最优化目标函数为:
Figure 387789DEST_PATH_IMAGE044
其中,
Figure 684910DEST_PATH_IMAGE045
是一个常数。
在其中一个实施例中,还包括:通过二次型优化求解器求解所述模型预测控制最优化模型。
在其中一个实施例中,还包括:在相继的时刻
Figure 747544DEST_PATH_IMAGE046
,根据预设的更新律、前l个历史时刻所述多组数据对信息,对所述参数信息进行更新;所述更新律为:
Figure 887538DEST_PATH_IMAGE047
Figure 467555DEST_PATH_IMAGE048
其中,矩阵
Figure 743816DEST_PATH_IMAGE049
Figure 977351DEST_PATH_IMAGE050
Figure 480007DEST_PATH_IMAGE051
Figure 457191DEST_PATH_IMAGE052
为定义的中间变量,
Figure 587958DEST_PATH_IMAGE053
表示矩阵
Figure 631875DEST_PATH_IMAGE054
的逆,
Figure 746461DEST_PATH_IMAGE055
表示矩阵
Figure 137123DEST_PATH_IMAGE056
的逆;
Figure 653555DEST_PATH_IMAGE057
Figure 228892DEST_PATH_IMAGE058
Figure 440562DEST_PATH_IMAGE059
下一时刻状态量的值;
Figure 759548DEST_PATH_IMAGE060
Figure 130486DEST_PATH_IMAGE061
Figure 752092DEST_PATH_IMAGE062
表示矩阵
Figure 575691DEST_PATH_IMAGE063
的转置;
Figure 698368DEST_PATH_IMAGE064
Figure 32135DEST_PATH_IMAGE065
表示k时刻的
Figure 214855DEST_PATH_IMAGE066
Figure 525750DEST_PATH_IMAGE067
Figure 61905DEST_PATH_IMAGE068
在其中一个实施例中,还包括:在任意
Figure 141857DEST_PATH_IMAGE069
时刻,在预测时域内以最小化期望轨迹跟踪误差为优化目标,以所述高维线性动态演化模型、所述非线性静态映射模型、状态量约束和控制量约束为约束条件,构建无人车的模型预测控制最优化模型为:
Figure 495478DEST_PATH_IMAGE070
其中,
Figure 903456DEST_PATH_IMAGE071
;参数
Figure 367936DEST_PATH_IMAGE072
分别是参数
Figure 302394DEST_PATH_IMAGE073
Figure 702282DEST_PATH_IMAGE074
时刻的值;
Figure 987770DEST_PATH_IMAGE075
是预测时域;
Figure 990361DEST_PATH_IMAGE076
Figure 153227DEST_PATH_IMAGE077
表示期望的轨迹;
Figure 114230DEST_PATH_IMAGE078
是对称正定矩阵,
Figure 355855DEST_PATH_IMAGE079
是预设的,
Figure 37503DEST_PATH_IMAGE080
是Lyapunov方程
Figure 212133DEST_PATH_IMAGE081
的解,
Figure 953824DEST_PATH_IMAGE082
是一个反馈增益矩阵使得
Figure 948325DEST_PATH_IMAGE083
是舒尔稳定的,为提高计算效率也可以设计为
Figure 558297DEST_PATH_IMAGE084
Figure 197220DEST_PATH_IMAGE085
为高维线性动态演化模型约束条件,
Figure 234446DEST_PATH_IMAGE086
可根据实时测量的状态值
Figure 716243DEST_PATH_IMAGE087
计算得到;
Figure 503808DEST_PATH_IMAGE088
为状态量约束条件,
Figure 121872DEST_PATH_IMAGE089
是状态约束;
Figure 329999DEST_PATH_IMAGE090
为控制量约束条件,
Figure 908879DEST_PATH_IMAGE091
是控制约束。
在其中一个实施例中,状态量包括车体坐标系下的纵向和侧向线速度以及横摆角速度,控制量包括车辆的方向盘转角、以及油门或刹车量。
一种无人车数据驱动自适应控制装置,所述装置包括:
初始数据获取模块,用于通过传感器预先获取无人车在行驶状态下的多组数据对信息;所述多组数据对信息中的每组数据对包含一个时刻的当前控制量、当前状态量和下一时刻状态量;
高维特征空间模型确定模块,用于构建非线性静态映射模型和高维线性动态演化模型,根据所述多组数据对信息通过构建有监督回归优化问题,求解所述高维线性动态演化模型,得到所述高维线性动态演化模型的参数信息;所述非线性静态映射模型满足在状态量为0时,所述非线性静态映射模型的值为0;所述高维线性动态演化模型根据所述参数信息确定模型参数;
模型预测控制最优化模型求解模块,用于在预测时域内以最小化期望轨迹跟踪误差为优化目标,构建无人车的模型预测控制最优化模型,以所述高维线性动态演化模型、所述非线性静态映射模型、状态量约束和控制量约束为约束条件,通过优化求解器求解所述模型预测控制最优化模型,得到预测时域内的控制量序列,并将第一个控制量作为无人车当前的控制量;
实时数据获取模块,用于在无人车自主行驶过程中,在任意时刻
Figure 860655DEST_PATH_IMAGE092
,当行驶时间大于预设的时间步长时,利用当前时间步前l个历史时刻保存的所述数据对信息构成所述多组数据对信息;
模型更新求解模块,用于在相继的时刻
Figure 598803DEST_PATH_IMAGE093
,根据预设的更新律、前l个历史时刻所述多组数据对信息,对所述参数信息进行更新,根据更新后的所述高维线性动态演化模型求解所述模型预测控制最优化模型,确定无人车当前时间步的控制量。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
通过传感器预先获取无人车在行驶状态下的多组数据对信息;所述多组数据对信息中的每组数据对包含一个时刻的当前控制量、当前状态量和下一时刻状态量;
构建非线性静态映射模型和高维线性动态演化模型,根据所述多组数据对信息通过构建有监督回归优化问题,求解所述高维线性动态演化模型,得到所述高维线性动态演化模型的参数信息;所述非线性静态映射模型满足在状态量为0时,所述非线性静态映射模型的值为0;所述高维线性动态演化模型根据所述参数信息确定模型参数;
在预测时域内以最小化期望轨迹跟踪误差为优化目标,构建无人车的模型预测控制最优化模型,以所述高维线性动态演化模型、所述非线性静态映射模型、状态量约束和控制量约束为约束条件,通过优化求解器求解所述模型预测控制最优化模型,得到预测时域内的控制量序列,并将第一个控制量作为无人车当前的控制量;
在无人车自主行驶过程中,在任意时刻
Figure 587619DEST_PATH_IMAGE094
,实时保存所述数据对信息,当行驶时间大于预设的时间步长时,利用当前时间步前l个历史时刻保存的所述数据对信息构成所述多组数据对信息;
在相继的时刻
Figure 44008DEST_PATH_IMAGE095
,根据预设的更新律、前l个历史时刻所述多组数据对信息,对所述参数信息进行更新,根据更新后的所述高维线性动态演化模型求解所述模型预测控制最优化模型,确定无人车当前时间步的控制量。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
通过传感器预先获取无人车在行驶状态下的多组数据对信息;所述多组数据对信息中的每组数据对包含一个时刻的当前控制量、当前状态量和下一时刻状态量;
构建非线性静态映射模型和高维线性动态演化模型,根据所述多组数据对信息通过构建有监督回归优化问题,求解所述高维线性动态演化模型,得到所述高维线性动态演化模型的参数信息;所述非线性静态映射模型满足在状态量为0时,所述非线性静态映射模型的值为0;所述高维线性动态演化模型根据所述参数信息确定模型参数;
在预测时域内以最小化期望轨迹跟踪误差为优化目标,构建无人车的模型预测控制最优化模型,以所述高维线性动态演化模型、所述非线性静态映射模型、状态量约束和控制量约束为约束条件,通过优化求解器求解所述模型预测控制最优化模型,得到预测时域内的控制量序列,并将第一个控制量作为无人车当前的控制量;
在无人车自主行驶过程中,在任意时刻
Figure 674841DEST_PATH_IMAGE094
,实时保存所述数据对信息,当行驶时间大于预设的时间步长时,利用当前时间步前l个历史时刻保存的所述数据对信息构成所述多组数据对信息;
在相继的时刻
Figure 267496DEST_PATH_IMAGE095
,根据预设的更新律、前l个历史时刻所述多组数据对信息,对所述参数信息进行更新,根据更新后的所述高维线性动态演化模型求解所述模型预测控制最优化模型,确定无人车当前时间步的控制量。
上述无人车数据驱动自适应控制方法、装置、计算机设备和存储介质,通过传感器预先获取无人车在行驶状态下的多组数据对信息,构建非线性静态映射模型和高维线性动态演化模型,根据多组数据对信息通过构建有监督回归优化问题求解高维线性动态演化模型,其中非线性静态映射模型满足在状态量为0时,非线性静态映射模型的值为0。在预测时域内以最小化期望轨迹跟踪误差为优化目标,以高维线性动态演化模型、非线性静态映射模型为约束条件之一,求解无人车的模型预测控制最优化模型,得到预测时域内的控制量序列,并将第一个控制量作为无人车当前的控制量。当行驶时间大于预设的时间步时,获取当前时间步前l个历史时刻多组数据对信息;根据预设的更新律、前l个历史时刻多组数据对信息,对参数信息进行更新,利用更新后的高维线性动态演化模型求解模型预测控制最优化模型,确定无人车当前时间步的控制量。本发明可以实时学习并更新无人车的动力学模型,实现无人车的在线自适应模型预测控制,提高无人车在复杂路况下自主驾驶的环境适应性。
附图说明
图1为一个实施例中无人车数据驱动自适应控制方法的应用场景图;
图2为一个实施例中车辆四轮模型的受力图;
图3为一个具体实施例中数据驱动的无人车自适应控制模型示意图;
图4为一个具体实施例中数据驱动的车辆动力学模型参数在线更新示意图;
图5为一个实施例中无人车数据驱动自适应控制装置的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的无人车数据驱动自适应控制方法,可以应用于如下应用环境中。通过无人车上的控制终端执行一种无人车数据驱动自适应控制方法,通过传感器预先获取无人车在行驶状态下的多组数据对信息,构建非线性静态映射模型和高维线性动态演化模型,根据多组数据对信息通过构建有监督回归优化问题求解高维线性动态演化模型,其中非线性静态映射模型满足在状态量为0时,非线性静态映射模型的值为0。在预测时域内以最小化期望轨迹跟踪误差为优化目标,以高维线性动态演化模型、非线性静态映射模型为约束条件之一,求解无人车的模型预测控制最优化模型,得到预测时域内的控制量序列,并将第一个控制量作为无人车当前的控制量。当行驶时间大于预设的时间步时,获取当前时间步前l个历史时刻多组数据对信息;根据预设的更新律、前l个历史时刻多组数据对信息,对参数信息进行更新,利用更新后的高维线性动态演化模型求解模型预测控制最优化模型,确定无人车当前时间步的控制量。其中,终端可以但不限于是嵌入无人车的计算机、平板电脑。
在一个实施例中,如图1所示,提供了一种无人车数据驱动自适应控制方法,包括以下步骤:
步骤102,通过传感器预先获取无人车在行驶状态下的多组数据对信息。
多组数据对信息中的每组数据对包含一个时刻的当前控制量、当前状态量和下一时刻状态量。
利用传感器采集车辆状态量
Figure 817426DEST_PATH_IMAGE096
Figure 135013DEST_PATH_IMAGE097
的三个分量分别表示车体坐标系下的纵向和侧向线速度以及横摆角速度,控制量
Figure 163012DEST_PATH_IMAGE098
Figure 875753DEST_PATH_IMAGE099
的两个分量分别表示车辆的方向盘转角,油门或刹车,构成M组数据对,每组数据对的形式为
Figure 471950DEST_PATH_IMAGE100
,
Figure 902932DEST_PATH_IMAGE101
表示
Figure 734622DEST_PATH_IMAGE102
的下一个时间步的无人车的状态。
步骤104,构建非线性静态映射模型和高维线性动态演化模型,根据多组数据对信息通过构建有监督回归优化问题,求解高维线性动态演化模型,得到高维线性动态演化模型的参数信息。
构建的非线性静态映射模型需要满足
Figure 177235DEST_PATH_IMAGE103
,以满足当车辆状态量
Figure 68968DEST_PATH_IMAGE104
=0时候非线性静态映射模型的值为0。高维线性动态演化模型根据参数信息确定模型参数。
考虑四轮车辆模型,并假设车体为刚体,如图2所示为车辆四轮模型的受力图。车辆动力学系统描述成一个连续时间非线性系统:
Figure 862612DEST_PATH_IMAGE105
式中
Figure 232413DEST_PATH_IMAGE106
表示车辆状态,具体为车体坐标系下的纵向和侧向线速度以及横摆角速度,
Figure 654167DEST_PATH_IMAGE107
表示车辆控制量,具体为车辆的方向盘转角,油门或刹车。
给定一个采样间隔,可以写出上述系统在离散时间下的模型形式:
Figure 716801DEST_PATH_IMAGE108
其中
Figure 693206DEST_PATH_IMAGE110
是离散时间指针。
由于模型未知,采用数据驱动的方式对系统进行建模,首先构建非线性静态映射模型为:
Figure 110412DEST_PATH_IMAGE111
其中,
Figure 343947DEST_PATH_IMAGE004
是一种非线性映射函数,以实现从
Figure 971237DEST_PATH_IMAGE112
的映射,可以设计成深度神经网络或者由基函数构成;
Figure 558208DEST_PATH_IMAGE113
表示
Figure 220133DEST_PATH_IMAGE114
时刻的高维的抽象状态量;
Figure 765515DEST_PATH_IMAGE115
表示
Figure 614523DEST_PATH_IMAGE116
时刻在原状态空间实时测量的状态量;
Figure 129817DEST_PATH_IMAGE117
表示原状态空间的维数;
Figure 20151DEST_PATH_IMAGE118
表示高维特征空间的维数。以基函数形式为例,
Figure 595489DEST_PATH_IMAGE119
Figure 931792DEST_PATH_IMAGE120
是基函数,
Figure 391723DEST_PATH_IMAGE121
Figure 497083DEST_PATH_IMAGE122
表示基函数的个数;在上述基础上,通过一个非线性的特征映射把原系统映射到一个高维特征空间上,在此空间构建一个线性模型来替代原模型,可以把非线性控制问题转化成高维线性空间的线性优化问题进行求解,那么高维空间下原系统可以表示成:
Figure 508901DEST_PATH_IMAGE123
构建有监督回归优化问题,根据M组数据对
Figure 942288DEST_PATH_IMAGE124
采用最小二乘算法可以计算得到参数A,B,C
通过一个线性模型替代原始的非线性模型的优势是,线性模型的求解更加高效,可以提高算法的时效性,可以通过增加非线性映射的维度增加非线性映射的准确性,模型具有较好的可扩展性,有利于提升无人车的控制精度。
步骤106,在预测时域内以最小化期望轨迹跟踪误差为优化目标,构建无人车的模型预测控制最优化模型,以高维线性动态演化模型、非线性静态映射模型、状态量约束和控制量约束为约束条件,通过优化求解器求解模型预测控制最优化模型,得到预测时域内的控制量序列,并将第一个控制量作为无人车当前的控制量。
在无人车实际控制中,通常目标是让车辆状态量跟踪一条时变的期望轨迹
Figure 64964DEST_PATH_IMAGE125
,也就是在每个时刻
Figure 24830DEST_PATH_IMAGE126
,让当前状态量逼近当前的期望状态值,即
Figure 82916DEST_PATH_IMAGE127
,同时满足状态量和控制量约束:
Figure 393812DEST_PATH_IMAGE128
以及满足当前更新的模型约束:
Figure 54600DEST_PATH_IMAGE129
采用模型预测控制算法,可以以高维线性动态演化模型、非线性静态映射模型、状态量约束和控制量约束为约束条件,根据所述多组数据对信息通过优化求解器求解模型预测控制最优化模型,确定无人车在预测时域内控制量
Figure 508453DEST_PATH_IMAGE130
,其中
Figure 862074DEST_PATH_IMAGE131
,将
Figure 394686DEST_PATH_IMAGE132
应用到无人车系统。
模型预测控制(MPC)是一类特殊的控制。它的当前控制动作是在每一个采样瞬间通过求解一个有限时域开环最优控制问题而获得。过程的当前状态作为最优控制问题的初始状态,解得的最优控制序列只实施第一个控制作用。通过模型预测控制算法预测控制时域内无人车的控制量有利于使模型失配、畸变、扰动等引起的不确定性及时得到弥补,从而得到较好的动态控制性能,从而提高系统的鲁棒性。
步骤108,在无人车自主行驶过程中,在任意时刻
Figure 734532DEST_PATH_IMAGE133
,实时保存数据对信息,当行驶时间大于预设的时间步长时,利用当前时间步前l个历史时刻保存的数据对信息构成多组数据对信息。
Figure 668990DEST_PATH_IMAGE134
Figure 193512DEST_PATH_IMAGE135
时刻继续求解模型预测控制问题,并通过传感器实时采集数据
Figure 947841DEST_PATH_IMAGE136
,并根据状态空间到高维特征空间的映射得到
Figure 356957DEST_PATH_IMAGE137
步骤110,在相继的时刻
Figure 411501DEST_PATH_IMAGE138
,根据预设的更新律、前l个历史时刻多组数据对信息,对参数信息进行更新,根据更新后的高维线性动态演化模型求解模型预测控制最优化模型,确定无人车当前时间步的控制量。
Figure 716711DEST_PATH_IMAGE138
时刻利用
Figure 489495DEST_PATH_IMAGE139
Figure 295777DEST_PATH_IMAGE138
时刻采集保存的多组数据对信息,根据预设的更新律更新高维线性动态演化模型的参数信息,利用更新后的高维线性动态演化模型求解模型预测控制最优化模型,确定无人车当前时间步的控制量。通过对高维线性动态演化模型的参数进行持续更新,可以实时学习并更新无人车的动力学模型,实现无人车的在线自适应模型预测控制,提高无人车在复杂路况下自主驾驶的环境适应性。
上述无人车数据驱动自适应控制方法中,通过传感器预先获取无人车在行驶状态下的多组数据对信息,构建非线性静态映射模型和高维线性动态演化模型,根据多组数据对信息通过构建有监督回归优化问题求解高维线性动态演化模型,其中非线性静态映射模型满足在状态量为0时,非线性静态映射模型的值为0。在预测时域内以最小化期望轨迹跟踪误差为优化目标,以高维线性动态演化模型、非线性静态映射模型为约束条件之一,求解无人车的模型预测控制最优化模型,得到预测时域内的控制量序列,并将第一个控制量作为无人车当前的控制量。当行驶时间大于预设的时间步时,获取当前时间步前l个历史时刻多组数据对信息;根据预设的更新律、前l个历史时刻多组数据对信息,对参数信息进行更新,根据更新后的高维线性动态演化模型求解模型预测控制最优化模型,确定无人车当前时间步的控制量。本发明可以实时学习并更新无人车的动力学模型,实现无人车的在线自适应模型预测控制,提高无人车在复杂路况下自主驾驶的环境适应性。
在其中一个实施例中,还包括:构建非线性静态映射模型为:
Figure 578729DEST_PATH_IMAGE140
其中,
Figure 445054DEST_PATH_IMAGE004
是一种非线性映射函数,以实现从
Figure 173975DEST_PATH_IMAGE141
的映射,可以设计成深度神经网络或者由基函数构成;
Figure 659314DEST_PATH_IMAGE142
表示
Figure 688450DEST_PATH_IMAGE143
时刻的高维的抽象状态量;
Figure 460097DEST_PATH_IMAGE144
表示
Figure 82840DEST_PATH_IMAGE145
时刻在原状态空间的状态量;
Figure 230924DEST_PATH_IMAGE146
表示原状态空间的维数;
Figure 848987DEST_PATH_IMAGE147
表示高维特征空间的维数;
构建高维线性动态演化模型为:
Figure 932481DEST_PATH_IMAGE148
其中,
Figure 635995DEST_PATH_IMAGE149
表示高维线性动态演化模型的参数;
Figure 587770DEST_PATH_IMAGE150
表示高维线性空间到低维非线性原状态空间的映射关系参数;
Figure 230979DEST_PATH_IMAGE151
表示
Figure 485374DEST_PATH_IMAGE152
时刻的控制量;
Figure 941763DEST_PATH_IMAGE153
表示
Figure 572596DEST_PATH_IMAGE154
时刻根据高维状态空间的状态值
Figure 165251DEST_PATH_IMAGE155
计算得到的状态量
Figure 980760DEST_PATH_IMAGE156
的估计值。
在其中一个实施例中,还包括:构建求解高维线性动态演化模型参数
Figure 534232DEST_PATH_IMAGE157
的一种最优化目标函数为:
Figure 827811DEST_PATH_IMAGE158
其中,
Figure 274972DEST_PATH_IMAGE159
表示多组数据对信息的组数;
Figure 635284DEST_PATH_IMAGE160
表示第
Figure 800686DEST_PATH_IMAGE161
组数据对中无人车的状态量;
Figure 773322DEST_PATH_IMAGE162
表示
Figure 74990DEST_PATH_IMAGE163
的下一时刻状态量;
Figure 232302DEST_PATH_IMAGE164
是一种非线性映射函数,以实现从
Figure 494787DEST_PATH_IMAGE165
的映射,可以设计成深度神经网络或者由基函数构成,以基函数形式为例,
Figure 130168DEST_PATH_IMAGE166
Figure 551922DEST_PATH_IMAGE167
是基函数,
Figure 755501DEST_PATH_IMAGE168
Figure 629916DEST_PATH_IMAGE169
表示基函数的个数;
Figure 803409DEST_PATH_IMAGE170
表示第
Figure 719150DEST_PATH_IMAGE171
组数据对中无人车的控制量;
Figure 952685DEST_PATH_IMAGE172
是一个常数;
Figure 579975DEST_PATH_IMAGE173
表示Frobenius范数。
构建求解高维线性动态演化模型参数
Figure 432525DEST_PATH_IMAGE174
的一种最优化目标函数为:
Figure 94450DEST_PATH_IMAGE175
其中,
Figure 498887DEST_PATH_IMAGE176
是一个常数。
在其中一个实施例中,还包括:当非线性映射函数
Figure 223260DEST_PATH_IMAGE177
为深度神经网络时,构建求解高维线性动态演化模型参数
Figure 4135DEST_PATH_IMAGE178
和优化深度神经网络权值
Figure 254987DEST_PATH_IMAGE179
的一种最优化目标函数为:
Figure 971271DEST_PATH_IMAGE180
其中,
Figure 41995DEST_PATH_IMAGE181
是一个常数。
通过深度神经网络构建非线性映射函数,只需要保证深度神经网络的每一层的偏置权值为零和激活函数
Figure 360981DEST_PATH_IMAGE182
满足
Figure 105821DEST_PATH_IMAGE183
,即可使得非线性映射函数满足
Figure 852060DEST_PATH_IMAGE184
的条件,从而使得后续推导成立。
在其中一个实施例中,还包括:当车辆动力学系统存在外部干扰时,也就是
Figure 675659DEST_PATH_IMAGE185
,其中
Figure 673702DEST_PATH_IMAGE186
是外部干扰;构建求解高维线性动态演化模型参数
Figure 899147DEST_PATH_IMAGE187
的一种最优化目标函数为:
Figure 957233DEST_PATH_IMAGE188
其中,
Figure 2549DEST_PATH_IMAGE189
表示多组数据对信息的组数;
Figure 663338DEST_PATH_IMAGE190
表示第
Figure 743289DEST_PATH_IMAGE191
组数据对中无人车的状态量;
Figure 706697DEST_PATH_IMAGE192
表示
Figure 504889DEST_PATH_IMAGE193
的下一时刻状态量;
Figure 969368DEST_PATH_IMAGE028
是一种非线性映射函数,以实现从
Figure 277728DEST_PATH_IMAGE194
的映射,可以设计成深度神经网络或者由基函数构成,以基函数形式为例,
Figure 802250DEST_PATH_IMAGE195
Figure 822159DEST_PATH_IMAGE196
是基函数,
Figure 965695DEST_PATH_IMAGE197
Figure 20239DEST_PATH_IMAGE198
表示基函数的个数;
Figure 450083DEST_PATH_IMAGE199
表示第
Figure 832654DEST_PATH_IMAGE200
组数据对中无人车的控制量;
Figure 904515DEST_PATH_IMAGE201
表示第
Figure 547986DEST_PATH_IMAGE202
组数据对应的外部干扰,矩阵
Figure 289677DEST_PATH_IMAGE203
是待优化的参数;
Figure 284178DEST_PATH_IMAGE204
是一个常数;
Figure 894151DEST_PATH_IMAGE205
表示Frobenius范数。
在其中一个实施例中,还包括:当非线性映射函数
Figure 31609DEST_PATH_IMAGE206
为深度神经网络且车辆动力学系统存在外部干扰时,也就是
Figure 68835DEST_PATH_IMAGE207
,其中
Figure 285053DEST_PATH_IMAGE208
是外部干扰;构建求解高维线性动态演化模型参数
Figure 574083DEST_PATH_IMAGE209
和优化深度神经网络权值
Figure 192146DEST_PATH_IMAGE210
的一种最优化目标函数为:
Figure 541219DEST_PATH_IMAGE211
其中,
Figure 244733DEST_PATH_IMAGE212
是一个常数。
在其中一个实施例中,还包括:在任意
Figure 196508DEST_PATH_IMAGE213
时刻,在预测时域内以最小化期望轨迹跟踪误差为优化目标,以高维线性动态演化模型、非线性静态映射模型、状态量约束和控制量约束为约束条件,构建无人车的模型预测控制最优化模型为:
Figure 669078DEST_PATH_IMAGE214
其中,
Figure 189052DEST_PATH_IMAGE215
;参数
Figure 379862DEST_PATH_IMAGE216
分别是参数
Figure 509230DEST_PATH_IMAGE217
Figure 101885DEST_PATH_IMAGE218
时刻的值;
Figure 386236DEST_PATH_IMAGE219
是预测时域;
Figure 205287DEST_PATH_IMAGE220
Figure 498865DEST_PATH_IMAGE221
表示期望的轨迹;
Figure 946027DEST_PATH_IMAGE222
是对称正定矩阵,
Figure 666859DEST_PATH_IMAGE223
是预设的,
Figure 707627DEST_PATH_IMAGE224
是Lyapunov方程
Figure 539317DEST_PATH_IMAGE225
的解,
Figure 247510DEST_PATH_IMAGE226
是一个反馈增益矩阵使得
Figure 139242DEST_PATH_IMAGE227
是舒尔稳定的,为提高计算效率也可以设计为
Figure 526361DEST_PATH_IMAGE228
Figure 161742DEST_PATH_IMAGE229
为高维线性动态演化模型约束条件,
Figure 222977DEST_PATH_IMAGE230
可根据实时测量的状态值
Figure 285611DEST_PATH_IMAGE231
计算得到;
Figure 160026DEST_PATH_IMAGE232
为状态量约束条件,
Figure 474463DEST_PATH_IMAGE233
是状态约束;
Figure 750724DEST_PATH_IMAGE234
为控制量约束条件,
Figure 984259DEST_PATH_IMAGE235
是控制约束。
利用前l个历史时刻多组数据对信息,对参数
Figure 486916DEST_PATH_IMAGE236
进行更新,根据更新了参数
Figure 464099DEST_PATH_IMAGE237
的高维线性动态演化模型求解模型预测控制最优化模型。当
Figure 735812DEST_PATH_IMAGE238
动态变化时,
Figure 140248DEST_PATH_IMAGE239
也相应地动态变化。
在其中一个实施例中,还包括:通过优化求解器Quadprog或其他二次型优化求解器求解模型预测控制最优化模型。
Quadprog是在MATLAB中求解二次规划的函数,可以用于求解本发明所设计的模型预测控制最优化模型。
在其中一个实施例中,还包括:在相继的时刻
Figure 989255DEST_PATH_IMAGE240
,根据预设的更新律、前l个历史时刻所述多组数据对信息,对所述参数信息进行更新;所述更新律为:
Figure 409610DEST_PATH_IMAGE241
Figure 394884DEST_PATH_IMAGE242
其中,矩阵
Figure 970222DEST_PATH_IMAGE243
Figure 447470DEST_PATH_IMAGE244
Figure 766456DEST_PATH_IMAGE245
Figure 871816DEST_PATH_IMAGE246
为定义的中间变量,
Figure 618055DEST_PATH_IMAGE247
表示矩阵
Figure 582600DEST_PATH_IMAGE248
的逆,
Figure 439697DEST_PATH_IMAGE249
表示矩阵
Figure 399563DEST_PATH_IMAGE250
的逆;
Figure 723228DEST_PATH_IMAGE251
Figure 768544DEST_PATH_IMAGE252
Figure 429333DEST_PATH_IMAGE253
下一时刻状态量的值;
Figure 148765DEST_PATH_IMAGE254
Figure 236807DEST_PATH_IMAGE255
Figure 769419DEST_PATH_IMAGE256
表示矩阵
Figure 109265DEST_PATH_IMAGE257
的转置;
Figure 309302DEST_PATH_IMAGE258
Figure 568245DEST_PATH_IMAGE259
表示k时刻的
Figure 463520DEST_PATH_IMAGE260
Figure 731690DEST_PATH_IMAGE261
Figure 661600DEST_PATH_IMAGE262
更新律的推导过程为:
定义
Figure 888182DEST_PATH_IMAGE263
Figure 769288DEST_PATH_IMAGE264
时刻的初始值
Figure 309991DEST_PATH_IMAGE265
可以表示为:
Figure 219041DEST_PATH_IMAGE266
其中变量
Figure 960732DEST_PATH_IMAGE267
,对任意
Figure 955233DEST_PATH_IMAGE268
成立,例如当
Figure 299627DEST_PATH_IMAGE269
时,
Figure 63183DEST_PATH_IMAGE270
,定义
Figure 241355DEST_PATH_IMAGE271
。为了保证模型参数的收敛性并提高计算效率,允许模型每
Figure 457573DEST_PATH_IMAGE272
步更新一次,其中
Figure 605657DEST_PATH_IMAGE272
是自然数。假设在任意一个时刻
Figure 364666DEST_PATH_IMAGE273
,
Figure 572793DEST_PATH_IMAGE274
,
其中矩阵
Figure 276307DEST_PATH_IMAGE275
可以被定义为
Figure 336405DEST_PATH_IMAGE276
其中变量
Figure 340133DEST_PATH_IMAGE277
,对任意
Figure 719161DEST_PATH_IMAGE278
成立。
在相继的时刻
Figure 50917DEST_PATH_IMAGE279
, 状态量
Figure 540804DEST_PATH_IMAGE280
和观测量
Figure 867880DEST_PATH_IMAGE281
Figure 293176DEST_PATH_IMAGE282
是已知的(
Figure 236862DEST_PATH_IMAGE283
可利用状态量
Figure 530440DEST_PATH_IMAGE284
通过非线性映射模型
Figure 852968DEST_PATH_IMAGE285
计算求得),
Figure 308220DEST_PATH_IMAGE286
。那么
Figure 739201DEST_PATH_IMAGE287
因此模型参数可以按照如下策略进行更新:
Figure 968230DEST_PATH_IMAGE288
为了减少计算负荷,引入如下矩阵求逆规则:
Figure 535477DEST_PATH_IMAGE289
其中
Figure 427210DEST_PATH_IMAGE290
是一个方阵,
Figure 955274DEST_PATH_IMAGE291
是列向量。
基于上式,模型更新策略可以简化为
Figure 590655DEST_PATH_IMAGE292
其中
Figure 746830DEST_PATH_IMAGE293
Figure 950409DEST_PATH_IMAGE294
根据矩阵
Figure 824824DEST_PATH_IMAGE295
和更新策略,可以实现
Figure 263896DEST_PATH_IMAGE296
Figure 681102DEST_PATH_IMAGE297
的不断更新。
所述模型更新过程中的步长
Figure 914637DEST_PATH_IMAGE298
需要满足:
Figure 541928DEST_PATH_IMAGE299
Figure 893012DEST_PATH_IMAGE300
在其中一个实施例中,状态量包括车体坐标系下的纵向和侧向线速度以及横摆角速度,控制量包括车辆的方向盘转角、以及油门或刹车量。
在一个具体实施例中,数据驱动的无人车模型预测控制模型如图3所示,通过非线性静态映射模型将原状态空间
Figure 23779DEST_PATH_IMAGE301
维的状态量
Figure 693795DEST_PATH_IMAGE302
转换为高维特征空间
Figure 418169DEST_PATH_IMAGE303
维的抽象状态量
Figure 933464DEST_PATH_IMAGE304
,其约束条件为
Figure 449896DEST_PATH_IMAGE305
,即在状态量
Figure 900600DEST_PATH_IMAGE306
的时候非线性静态映射模型的值为0。在满足状态和控制约束条件以及高维线性动态演化模型、非线性静态映射模型的模型约束的基础上,通过模型预测控制最优化模型得到预测时域内的控制量序列
Figure 502482DEST_PATH_IMAGE307
,并将第一个控制量
Figure 821468DEST_PATH_IMAGE308
作为无人车当前的控制量。
在另一个具体实施例中,数据驱动的车辆动力学模型如图4所述,在车辆行驶状态下采集
Figure 802194DEST_PATH_IMAGE309
组数据对
Figure 548433DEST_PATH_IMAGE310
,通过构建有监督回归优化问题,求解高维线性动态演化模型,得到高维线性动态演化模型的参数
Figure 106453DEST_PATH_IMAGE311
,根据非线性静态映射模型和高维线性动态演化模型,进行数据驱动建模,得到预测时域内的控制量序列
Figure 229130DEST_PATH_IMAGE312
,并将第一个控制量
Figure 828476DEST_PATH_IMAGE313
作为无人车当前的控制量。在
Figure 745617DEST_PATH_IMAGE314
时刻继续求解模型预测控制最优化模型;在每个时刻
Figure 56512DEST_PATH_IMAGE315
利用传感器实时采集数据
Figure 858246DEST_PATH_IMAGE316
,并利用非线性映射模型求解得到
Figure 672618DEST_PATH_IMAGE317
;在
Figure 26239DEST_PATH_IMAGE318
时刻利用过去
Figure 434218DEST_PATH_IMAGE319
Figure 164277DEST_PATH_IMAGE320
时刻的数据根据更新律更新高维线性动态演化模型参数,之后利用更新后的高维线性动态演化模型求解模型预测控制最优化模型。
在另一个具体实施例中,提供了一种无人车数据驱动自适应控制方法,包括:
1.利用传感器采集车辆状态量
Figure 833155DEST_PATH_IMAGE321
,表示车体坐标系下的纵向和侧向线速度以及横摆角速度,控制量
Figure 498623DEST_PATH_IMAGE322
,表示车辆的方向盘转角和油门/刹车,构成M组数据对
Figure 518532DEST_PATH_IMAGE323
2.采用最小二乘算法离线构建高维线性动态演化模型对应的最优化问题求解
Figure 521123DEST_PATH_IMAGE324
3.采用基函数或深度神经网络构建非线性静态映射模型,若所述非线性静态映射模型设计为基函数形式时,可利用最小二乘法等有监督回归算法离线构建高维线性动态演化模型对应的最优化问题求解模型参数
Figure 683989DEST_PATH_IMAGE325
;若所述非线性静态映射模型设计为深度神经网络时,也可利用最小二乘法等有监督回归算法离线构建高维线性动态演化模型和非线性静态映射模型对应的最优化问题求解模型参数
Figure 644991DEST_PATH_IMAGE326
和深度神经网络权值
Figure 886617DEST_PATH_IMAGE327
。在线控制时在每个时刻
Figure 568265DEST_PATH_IMAGE328
利用优化求解器Quadprog等二次型求解器在线求解模型预测控制最优化模型得到最优的
Figure 742894DEST_PATH_IMAGE329
4.把
Figure 343640DEST_PATH_IMAGE330
应用到无人车系统;
5.在
Figure 479086DEST_PATH_IMAGE331
时刻继续求解模型预测控制最优化模型;
6.在每个时刻利用传感器实时采集数据
Figure 823480DEST_PATH_IMAGE332
,并利用非线性映射模型求解得到
Figure 587037DEST_PATH_IMAGE333
7.在
Figure 234050DEST_PATH_IMAGE334
时刻利用过去
Figure 981426DEST_PATH_IMAGE335
Figure 129510DEST_PATH_IMAGE336
时刻的数据根据更新律更新高维线性动态演化模型参数,之后利用更新后的高维线性动态演化模型求解模型预测控制最优化模型。
应该理解的是,虽然图1的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图5所示,提供了一种无人车数据驱动自适应控制装置,包括:初始数据获取模块502、高维特征空间模型确定模块504、模型预测控制最优化模型求解模块506、实时数据获取模块508和模型更新求解模块510,其中:
初始数据获取模块502,用于通过传感器预先获取无人车在行驶状态下的多组数据对信息;多组数据对信息中的每组数据对包含一个时刻的当前控制量、当前状态量和下一时刻状态量;
高维特征空间模型确定模块504,用于构建非线性静态映射模型和高维线性动态演化模型,根据多组数据对信息通过构建有监督回归优化问题,求解高维线性动态演化模型,得到高维线性动态演化模型的参数信息;非线性静态映射模型满足在状态量为0时,非线性静态映射模型的值为0;高维线性动态演化模型根据参数信息确定模型参数;
模型预测控制最优化模型求解模块506,用于在预测时域内以最小化期望轨迹跟踪误差为优化目标,构建无人车的模型预测控制最优化模型,以高维线性动态演化模型、非线性静态映射模型、状态量约束和控制量约束为约束条件,通过优化求解器求解模型预测控制最优化模型,得到预测时域内的控制量序列,并将第一个控制量作为无人车当前的控制量;
实时数据获取模块508,用于在无人车自主行驶过程中,在任意时刻
Figure 387054DEST_PATH_IMAGE337
,实时保存所述数据对信息,当行驶时间大于预设的时间步长时,利用当前时间步前l个历史时刻保存的所述数据对信息构成所述多组数据对信息;
模型更新求解模块510,用于在相继的时刻
Figure 595182DEST_PATH_IMAGE338
,根据预设的更新律、前l个历史时刻多组数据对信息,对参数信息进行更新,根据更新后的高维线性动态演化模型求解模型预测控制最优化模型,确定无人车当前时间步的控制量。
高维特征空间模型确定模块504还用于构建非线性静态映射模型为:
Figure 298695DEST_PATH_IMAGE339
其中,
Figure 125837DEST_PATH_IMAGE004
是一种非线性映射函数,以实现从
Figure 863986DEST_PATH_IMAGE340
的映射,可以设计成深度神经网络或者由基函数构成;
Figure 118381DEST_PATH_IMAGE341
表示
Figure 309191DEST_PATH_IMAGE342
时刻的高维的抽象状态量;
Figure 799078DEST_PATH_IMAGE343
表示
Figure 532679DEST_PATH_IMAGE344
时刻在原状态空间的状态量;
Figure 82609DEST_PATH_IMAGE345
表示原状态空间的维数;
Figure 760715DEST_PATH_IMAGE346
表示高维特征空间的维数;
构建高维线性动态演化模型为:
Figure 428194DEST_PATH_IMAGE347
其中,
Figure 875356DEST_PATH_IMAGE348
表示高维线性动态演化模型的参数;
Figure 596187DEST_PATH_IMAGE349
表示高维线性空间到低维非线性原状态空间的映射关系参数;
Figure 761590DEST_PATH_IMAGE350
表示
Figure 734225DEST_PATH_IMAGE351
时刻的控制量;
Figure 35893DEST_PATH_IMAGE352
表示
Figure 68571DEST_PATH_IMAGE353
时刻根据高维状态空间的状态值
Figure 721269DEST_PATH_IMAGE354
计算得到的状态量
Figure 91071DEST_PATH_IMAGE355
的估计值。
高维特征空间模型确定模块504还用于
构建求解高维线性动态演化模型参数
Figure 653770DEST_PATH_IMAGE356
的一种最优化目标函数为:
Figure 716404DEST_PATH_IMAGE357
其中,
Figure 856399DEST_PATH_IMAGE358
表示多组数据对信息的组数;
Figure 669372DEST_PATH_IMAGE359
表示第
Figure 945632DEST_PATH_IMAGE360
组数据对中无人车的状态量;
Figure 179167DEST_PATH_IMAGE361
表示
Figure 681824DEST_PATH_IMAGE362
的下一时刻状态量;
Figure 393428DEST_PATH_IMAGE028
是一种非线性映射函数,以实现从
Figure 789774DEST_PATH_IMAGE363
的映射,可以设计成深度神经网络或者由基函数构成,以基函数形式为例,
Figure 335156DEST_PATH_IMAGE364
Figure 184164DEST_PATH_IMAGE365
是基函数,
Figure 699459DEST_PATH_IMAGE366
Figure 91257DEST_PATH_IMAGE367
表示基函数的个数;
Figure 666595DEST_PATH_IMAGE368
表示第
Figure 268477DEST_PATH_IMAGE369
组数据对中无人车的控制量;
Figure 961365DEST_PATH_IMAGE370
是一个常数;
Figure 66724DEST_PATH_IMAGE371
表示Frobenius范数。
构建求解高维线性动态演化模型参数
Figure 812963DEST_PATH_IMAGE372
的一种最优化目标函数为:
Figure 511929DEST_PATH_IMAGE373
其中,
Figure 634605DEST_PATH_IMAGE374
是一个常数。
高维特征空间模型确定模块504还用于当非线性映射函数
Figure 594471DEST_PATH_IMAGE375
为深度神经网络时,构建求解高维线性动态演化模型参数
Figure 652557DEST_PATH_IMAGE376
和优化深度神经网络权值
Figure 963453DEST_PATH_IMAGE377
的一种最优化目标函数为:
Figure 624241DEST_PATH_IMAGE378
其中,
Figure 438613DEST_PATH_IMAGE379
是一个常数。
模型预测控制最优化模型求解模块506还用于在任意
Figure 933180DEST_PATH_IMAGE380
时刻,在预测时域内以最小化期望轨迹跟踪误差为优化目标,以高维线性动态演化模型、非线性静态映射模型、状态量约束和控制量约束为约束条件,构建无人车的模型预测控制最优化模型为:
Figure 465792DEST_PATH_IMAGE381
其中,
Figure 304173DEST_PATH_IMAGE382
;参数
Figure 238631DEST_PATH_IMAGE236
分别是参数
Figure 28732DEST_PATH_IMAGE383
Figure 658428DEST_PATH_IMAGE384
时刻的值;
Figure 926598DEST_PATH_IMAGE385
是预测时域;
Figure 715563DEST_PATH_IMAGE386
Figure 145407DEST_PATH_IMAGE387
表示期望的轨迹;
Figure 793557DEST_PATH_IMAGE388
是对称正定矩阵,
Figure 599839DEST_PATH_IMAGE389
是预设的,
Figure 384256DEST_PATH_IMAGE390
是Lyapunov方程
Figure 250580DEST_PATH_IMAGE391
的解,
Figure 979502DEST_PATH_IMAGE392
是一个反馈增益矩阵使得
Figure 589475DEST_PATH_IMAGE393
是舒尔稳定的,为提高计算效率也可以设计为
Figure 726933DEST_PATH_IMAGE394
Figure 764159DEST_PATH_IMAGE395
为高维线性动态演化模型约束条件,
Figure 245956DEST_PATH_IMAGE396
可根据实时测量的状态值
Figure 269407DEST_PATH_IMAGE397
计算得到;
Figure 153049DEST_PATH_IMAGE398
为状态量约束条件,
Figure 95597DEST_PATH_IMAGE399
是状态约束;
Figure 940057DEST_PATH_IMAGE400
为控制量约束条件,
Figure 891832DEST_PATH_IMAGE401
是控制约束。
模型预测控制最优化模型求解模块506还用于通过二次型优化求解器求解模型预测控制最优化模型。
模型更新求解模块510还用于在相继的时刻
Figure 364402DEST_PATH_IMAGE320
根据预设的更新律、前l个历史时刻所述多组数据对信息,对所述参数信息进行更新;所述更新律为:
Figure 884376DEST_PATH_IMAGE402
Figure 75186DEST_PATH_IMAGE403
其中,矩阵
Figure 204554DEST_PATH_IMAGE404
Figure 797209DEST_PATH_IMAGE405
Figure 347139DEST_PATH_IMAGE406
Figure 900611DEST_PATH_IMAGE407
为定义的中间变量,
Figure 194189DEST_PATH_IMAGE408
表示矩阵
Figure 641351DEST_PATH_IMAGE409
的逆,
Figure 362182DEST_PATH_IMAGE410
表示矩阵
Figure 668530DEST_PATH_IMAGE411
的逆;
Figure 703482DEST_PATH_IMAGE412
Figure 379052DEST_PATH_IMAGE413
Figure 270784DEST_PATH_IMAGE414
下一时刻状态量的值;
Figure 657903DEST_PATH_IMAGE415
Figure 293284DEST_PATH_IMAGE416
Figure 855984DEST_PATH_IMAGE417
表示矩阵
Figure 184197DEST_PATH_IMAGE418
的转置;
Figure 933978DEST_PATH_IMAGE419
Figure 107471DEST_PATH_IMAGE420
表示k时刻的
Figure 383731DEST_PATH_IMAGE421
Figure 617266DEST_PATH_IMAGE422
Figure 119923DEST_PATH_IMAGE423
关于无人车数据驱动自适应控制装置的具体限定可以参见上文中对于无人车数据驱动自适应控制方法的限定,在此不再赘述。上述无人车数据驱动自适应控制装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种无人车数据驱动自适应控制方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现上述方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种无人车数据驱动自适应控制方法,其特征在于,所述方法包括:
通过传感器预先获取无人车在行驶状态下的多组数据对信息;所述多组数据对信息中的每组数据对包含一个时刻的当前控制量、当前状态量和下一时刻状态量;
构建非线性静态映射模型和高维线性动态演化模型,根据所述多组数据对信息通过构建有监督回归优化问题,求解所述高维线性动态演化模型,得到所述高维线性动态演化模型的参数信息;所述非线性静态映射模型满足在状态量为0时,所述非线性静态映射模型的值为0;所述高维线性动态演化模型根据所述参数信息确定模型参数;
在预测时域内以最小化期望轨迹跟踪误差为优化目标,构建无人车的模型预测控制最优化模型,以所述高维线性动态演化模型、所述非线性静态映射模型、状态量约束和控制量约束为约束条件,通过优化求解器求解所述模型预测控制最优化模型,得到预测时域内的控制量序列,并将第一个控制量作为无人车当前的控制量;
在无人车自主行驶过程中,在任意时刻
Figure DEST_PATH_IMAGE001
,实时保存所述数据对信息,当行驶时间大于预设的时间步长l时,利用当前时间步前l个历史时刻保存的所述数据对信息构成所述多组数据对信息;
在相继的时刻
Figure DEST_PATH_IMAGE002
,根据预设的更新律、前l个历史时刻所述多组数据对信息,对所述参数信息进行更新,根据更新后的所述高维线性动态演化模型求解所述模型预测控制最优化模型,确定无人车当前时间步的控制量。
2.根据权利要求1所述的方法,其特征在于,所述构建非线性静态映射模型和高维线性动态演化模型包括:
构建非线性静态映射模型为:
Figure DEST_PATH_IMAGE003
其中,
Figure DEST_PATH_IMAGE004
是一种非线性映射函数,以实现从
Figure DEST_PATH_IMAGE005
的映射,可以设计成深度神经网络或者由基函数构成;
Figure DEST_PATH_IMAGE006
表示
Figure DEST_PATH_IMAGE007
时刻的高维的抽象状态量;
Figure DEST_PATH_IMAGE008
表示
Figure DEST_PATH_IMAGE009
时刻在原状态空间的状态量;
Figure DEST_PATH_IMAGE010
表示原状态空间的维数;
Figure DEST_PATH_IMAGE011
表示高维特征空间的维数;
构建高维线性动态演化模型为:
Figure DEST_PATH_IMAGE012
其中,
Figure DEST_PATH_IMAGE013
表示高维线性动态演化模型的参数;
Figure DEST_PATH_IMAGE014
表示高维线性空间到低维非线性原状态空间的映射关系参数;
Figure DEST_PATH_IMAGE015
表示
Figure DEST_PATH_IMAGE016
时刻的控制量;
Figure DEST_PATH_IMAGE017
表示
Figure DEST_PATH_IMAGE018
时刻根据高维状态空间的状态值
Figure DEST_PATH_IMAGE019
计算得到的状态量
Figure DEST_PATH_IMAGE020
的估计值。
3.根据权利要求2所述的方法,其特征在于,根据所述多组数据对信息通过构建有监督回归优化问题求解所述高维线性动态演化模型,包括:
构建求解高维线性动态演化模型参数
Figure DEST_PATH_IMAGE021
的一种最优化目标函数为:
Figure DEST_PATH_IMAGE022
其中,
Figure DEST_PATH_IMAGE023
表示所述多组数据对信息的组数;
Figure DEST_PATH_IMAGE024
表示第
Figure DEST_PATH_IMAGE025
组数据对中无人车的状态量;
Figure DEST_PATH_IMAGE026
表示
Figure DEST_PATH_IMAGE027
的下一时刻状态量;
Figure DEST_PATH_IMAGE028
是一种非线性映射函数,以实现从
Figure DEST_PATH_IMAGE029
的映射,可以设计成深度神经网络或者由基函数构成,以基函数形式为例,
Figure DEST_PATH_IMAGE030
Figure DEST_PATH_IMAGE031
是基函数,
Figure DEST_PATH_IMAGE032
Figure DEST_PATH_IMAGE033
表示基函数的个数;
Figure DEST_PATH_IMAGE034
表示第
Figure DEST_PATH_IMAGE035
组数据对中无人车的控制量;
Figure DEST_PATH_IMAGE036
是一个常数;
Figure DEST_PATH_IMAGE037
表示Frobenius范数;
构建求解高维线性动态演化模型参数
Figure DEST_PATH_IMAGE038
的一种最优化目标函数为:
Figure DEST_PATH_IMAGE039
其中,
Figure DEST_PATH_IMAGE040
是一个常数。
4.根据权利要求3所述的方法,其特征在于,根据所述多组数据对信息通过构建有监督回归优化问题求解所述高维线性动态演化模型,包括:
当非线性映射函数
Figure DEST_PATH_IMAGE041
为深度神经网络时,构建求解高维线性动态演化模型参数
Figure DEST_PATH_IMAGE042
和优化深度神经网络权值
Figure DEST_PATH_IMAGE043
的一种最优化目标函数为:
Figure DEST_PATH_IMAGE044
其中,
Figure DEST_PATH_IMAGE045
是一个常数。
5.根据权利要求3或4所述的方法,其特征在于,所述在预测时域内以最小化期望轨迹跟踪误差为优化目标,以所述高维线性动态演化模型、所述非线性静态映射模型、状态量约束和控制量约束为约束条件,构建无人车的模型预测控制最优化模型,包括:
在任意
Figure DEST_PATH_IMAGE046
时刻,在预测时域内以最小化期望轨迹跟踪误差为优化目标,以所述高维线性动态演化模型、所述非线性静态映射模型、状态量约束和控制量约束为约束条件,构建无人车的模型预测控制最优化模型为:
Figure DEST_PATH_IMAGE047
其中,
Figure DEST_PATH_IMAGE048
;参数
Figure DEST_PATH_IMAGE049
分别是参数
Figure DEST_PATH_IMAGE050
Figure DEST_PATH_IMAGE051
时刻实时更新得到的值,
Figure DEST_PATH_IMAGE052
是根据所述预先采集的多组数据对利用权利要求3或4所述的方法求解得到的值;
Figure DEST_PATH_IMAGE053
是预测时域;
Figure DEST_PATH_IMAGE054
Figure DEST_PATH_IMAGE055
表示期望的轨迹;
Figure DEST_PATH_IMAGE056
是对称正定矩阵,
Figure DEST_PATH_IMAGE057
是预设的,
Figure DEST_PATH_IMAGE058
是Lyapunov方程
Figure DEST_PATH_IMAGE059
的解,
Figure DEST_PATH_IMAGE060
是一个反馈增益矩阵使得
Figure DEST_PATH_IMAGE061
是舒尔稳定的,或者设计
Figure DEST_PATH_IMAGE062
Figure DEST_PATH_IMAGE063
为高维线性动态演化模型约束条件,
Figure DEST_PATH_IMAGE064
可根据实时测量的状态值计算得到;
Figure DEST_PATH_IMAGE065
为状态量约束条件,
Figure DEST_PATH_IMAGE066
是状态约束;
Figure DEST_PATH_IMAGE067
为控制量约束条件,
Figure DEST_PATH_IMAGE068
是控制约束。
6.根据权利要求5所述的方法,其特征在于,所述通过优化求解器求解所述模型预测控制最优化模型,包括:
通过二次型优化求解器求解所述模型预测控制最优化模型。
7.根据权利要求6所述的方法,其特征在于,在相继的时刻
Figure DEST_PATH_IMAGE069
,根据预设的更新律、前l个历史时刻所述多组数据对信息,对所述参数信息进行更新,包括:
在相继的时刻
Figure DEST_PATH_IMAGE070
,根据预设的更新律、前l个历史时刻所述多组数据对信息,对所述参数信息进行更新;所述更新律为:
Figure DEST_PATH_IMAGE071
Figure DEST_PATH_IMAGE072
其中,矩阵
Figure DEST_PATH_IMAGE073
Figure DEST_PATH_IMAGE074
Figure DEST_PATH_IMAGE075
Figure DEST_PATH_IMAGE076
为定义的中间变量,
Figure DEST_PATH_IMAGE077
表示矩阵
Figure DEST_PATH_IMAGE078
的逆,
Figure DEST_PATH_IMAGE079
表示矩阵
Figure DEST_PATH_IMAGE080
的逆;
Figure DEST_PATH_IMAGE081
Figure DEST_PATH_IMAGE082
Figure DEST_PATH_IMAGE083
下一时刻状态量的值;
Figure DEST_PATH_IMAGE084
Figure DEST_PATH_IMAGE085
Figure DEST_PATH_IMAGE086
表示矩阵
Figure DEST_PATH_IMAGE087
的转置;
Figure DEST_PATH_IMAGE088
Figure DEST_PATH_IMAGE089
表示k时刻的
Figure DEST_PATH_IMAGE090
Figure DEST_PATH_IMAGE091
Figure DEST_PATH_IMAGE092
8.一种无人车数据驱动自适应控制装置,其特征在于,所述装置包括:
初始数据获取模块,用于通过传感器预先获取无人车在行驶状态下的多组数据对信息;所述多组数据对信息中的每组数据对包含一个时刻的当前控制量、当前状态量和下一时刻状态量;
高维特征空间模型确定模块,用于构建非线性静态映射模型和高维线性动态演化模型,根据所述多组数据对信息通过构建有监督回归优化问题,求解所述高维线性动态演化模型,得到所述高维线性动态演化模型的参数信息;所述非线性静态映射模型满足在状态量为0时,所述非线性静态映射模型的值为0;所述高维线性动态演化模型根据所述参数信息确定模型参数;
模型预测控制最优化模型求解模块,用于在预测时域内以最小化期望轨迹跟踪误差为优化目标,构建无人车的模型预测控制最优化模型,以所述高维线性动态演化模型、所述非线性静态映射模型、状态量约束和控制量约束为约束条件,通过优化求解器求解所述模型预测控制最优化模型,得到预测时域内的控制量序列,并将第一个控制量作为无人车当前的控制量;
实时数据获取模块,用于在无人车自主行驶过程中,在任意时刻
Figure DEST_PATH_IMAGE093
,实时保存所述数据对信息,当行驶时间大于预设的时间步长时,利用当前时间步前l个历史时刻保存的所述数据对信息构成所述多组数据对信息;
模型更新求解模块,用于在相继的时刻
Figure DEST_PATH_IMAGE094
,根据预设的更新律、前l个历史时刻所述多组数据对信息,对所述参数信息进行更新,根据更新后的所述高维线性动态演化模型求解所述模型预测控制最优化模型,确定无人车当前时间步的控制量。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202110433277.3A 2021-04-22 2021-04-22 一种无人车数据驱动自适应控制方法和装置 Active CN112987577B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110433277.3A CN112987577B (zh) 2021-04-22 2021-04-22 一种无人车数据驱动自适应控制方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110433277.3A CN112987577B (zh) 2021-04-22 2021-04-22 一种无人车数据驱动自适应控制方法和装置

Publications (2)

Publication Number Publication Date
CN112987577A true CN112987577A (zh) 2021-06-18
CN112987577B CN112987577B (zh) 2021-07-30

Family

ID=76339732

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110433277.3A Active CN112987577B (zh) 2021-04-22 2021-04-22 一种无人车数据驱动自适应控制方法和装置

Country Status (1)

Country Link
CN (1) CN112987577B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112989499A (zh) * 2021-04-22 2021-06-18 中国人民解放军国防科技大学 一种无人车数据驱动控制方法和装置
CN113534669A (zh) * 2021-09-17 2021-10-22 中国人民解放军国防科技大学 基于数据驱动的无人车控制方法、装置和计算机设备
CN113759724A (zh) * 2021-09-17 2021-12-07 中国人民解放军国防科技大学 基于数据驱动的机器人控制方法、装置和计算机设备
CN115268380A (zh) * 2022-07-18 2022-11-01 深圳市玄羽科技有限公司 一种基于人工智能的工业数据模型构建方法及系统
WO2023010828A1 (zh) * 2021-08-04 2023-02-09 北京三快在线科技有限公司 一种无人驾驶设备的横向控制
CN112989499B (zh) * 2021-04-22 2024-07-02 中国人民解放军国防科技大学 一种无人车数据驱动控制方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150127596A1 (en) * 2011-12-07 2015-05-07 Extendabrain Corporation Particle Methods for Nonlinear Control
CN110647042A (zh) * 2019-11-11 2020-01-03 中国人民解放军国防科技大学 一种基于数据驱动的机器人鲁棒学习预测控制方法
CN111152796A (zh) * 2020-04-07 2020-05-15 北京三快在线科技有限公司 一种车辆运动状态预测方法及装置
CN111665853A (zh) * 2020-07-07 2020-09-15 中国人民解放军国防科技大学 一种面向规划控制联合优化的无人车辆运动规划方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150127596A1 (en) * 2011-12-07 2015-05-07 Extendabrain Corporation Particle Methods for Nonlinear Control
CN110647042A (zh) * 2019-11-11 2020-01-03 中国人民解放军国防科技大学 一种基于数据驱动的机器人鲁棒学习预测控制方法
CN111152796A (zh) * 2020-04-07 2020-05-15 北京三快在线科技有限公司 一种车辆运动状态预测方法及装置
CN111665853A (zh) * 2020-07-07 2020-09-15 中国人民解放军国防科技大学 一种面向规划控制联合优化的无人车辆运动规划方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112989499A (zh) * 2021-04-22 2021-06-18 中国人民解放军国防科技大学 一种无人车数据驱动控制方法和装置
CN112989499B (zh) * 2021-04-22 2024-07-02 中国人民解放军国防科技大学 一种无人车数据驱动控制方法和装置
WO2023010828A1 (zh) * 2021-08-04 2023-02-09 北京三快在线科技有限公司 一种无人驾驶设备的横向控制
CN113534669A (zh) * 2021-09-17 2021-10-22 中国人民解放军国防科技大学 基于数据驱动的无人车控制方法、装置和计算机设备
CN113534669B (zh) * 2021-09-17 2021-11-30 中国人民解放军国防科技大学 基于数据驱动的无人车控制方法、装置和计算机设备
CN113759724A (zh) * 2021-09-17 2021-12-07 中国人民解放军国防科技大学 基于数据驱动的机器人控制方法、装置和计算机设备
CN113759724B (zh) * 2021-09-17 2023-08-15 中国人民解放军国防科技大学 基于数据驱动的机器人控制方法、装置和计算机设备
CN115268380A (zh) * 2022-07-18 2022-11-01 深圳市玄羽科技有限公司 一种基于人工智能的工业数据模型构建方法及系统

Also Published As

Publication number Publication date
CN112987577B (zh) 2021-07-30

Similar Documents

Publication Publication Date Title
CN112987577B (zh) 一种无人车数据驱动自适应控制方法和装置
CN109885883B (zh) 一种基于gk聚类算法模型预测的无人车横向运动的控制方法
Wu et al. Adaptive fuzzy control for full states constrained systems with nonstrict-feedback form and unknown nonlinear dead zone
Wang et al. Passivity and passification of memristive recurrent neural networks with multi-proportional delays and impulse
Ting Stability analysis and design of Takagi–Sugeno fuzzy systems
Boukens et al. Design of an intelligent optimal neural network-based tracking controller for nonholonomic mobile robot systems
Liu et al. Multi-kernel online reinforcement learning for path tracking control of intelligent vehicles
Hu et al. Safe reinforcement learning for model-reference trajectory tracking of uncertain autonomous vehicles with model-based acceleration
Jian et al. Parametric estimation of ship maneuvering motion with integral sample structure for identification
Zhou et al. Turning motion control design of a two-wheeled inverted pendulum using curvature tracking and optimal control theory
Wang et al. Adaptive optimal controller design for a class of LDI-based neural network systems with input time-delays
Ngo et al. Robust adaptive self-organizing wavelet fuzzy CMAC tracking control for de-icing robot manipulator
CN113534669B (zh) 基于数据驱动的无人车控制方法、装置和计算机设备
Gao et al. Tracking control of the nodes for the complex dynamical network with the auxiliary links dynamics
CN113805483B (zh) 基于模型预测的机器人控制方法、装置和计算机设备
Tian et al. Personalized lane change planning and control by imitation learning from drivers
Liang et al. Nonlinear MPC based on elastic autoregressive fuzzy neural network with roasting process application
Fu et al. Adaptive optimal control of unknown nonlinear systems with different time scales
Zhong et al. Adaptive anti-noise least-squares algorithm for parameter identification of unmanned marine vehicles: Theory, simulation, and experiment
Lin Robust adaptive critic control of nonlinear systems using fuzzy basis function networks: an LMI approach
CN112989499B (zh) 一种无人车数据驱动控制方法和装置
Li et al. Fuzzy encoded Markov chains: Overview, observer theory, and applications
Meng et al. Dynamic adaptive learning algorithm based on two-fuzzy neural-networks
CN112989499A (zh) 一种无人车数据驱动控制方法和装置
Castillo et al. Introduction to interval type-3 fuzzy systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant