CN115534970A - 对车辆的行驶动态调节系统进行最佳参数化的方法和装置 - Google Patents

对车辆的行驶动态调节系统进行最佳参数化的方法和装置 Download PDF

Info

Publication number
CN115534970A
CN115534970A CN202210747794.2A CN202210747794A CN115534970A CN 115534970 A CN115534970 A CN 115534970A CN 202210747794 A CN202210747794 A CN 202210747794A CN 115534970 A CN115534970 A CN 115534970A
Authority
CN
China
Prior art keywords
vehicle
model
driving dynamics
driving
vehicle state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210747794.2A
Other languages
English (en)
Inventor
A·多尔
F·伯肯坎普
M·勒法罗夫
V·洛弗尔曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Robert Bosch GmbH
Original Assignee
Robert Bosch GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Robert Bosch GmbH filed Critical Robert Bosch GmbH
Publication of CN115534970A publication Critical patent/CN115534970A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W40/00Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
    • B60W40/10Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models related to vehicle motion
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W50/08Interaction between the driver and the control system
    • B60W50/085Changing the parameters of the control units, e.g. changing limit values, working points by control input
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W50/0098Details of control systems ensuring comfort, safety or stability not otherwise provided for
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W30/00Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units
    • B60W30/02Control of vehicle driving stability
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W30/00Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units
    • B60W30/18Propelling the vehicle
    • B60W30/18009Propelling the vehicle related to particular drive situations
    • B60W30/18109Braking
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W50/08Interaction between the driver and the control system
    • B60W50/12Limiting control by the driver depending on vehicle state, e.g. interlocking means for the control input for preventing unsafe operation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/092Reinforcement learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/094Adversarial learning
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W2050/0001Details of the control system
    • B60W2050/0002Automatic control, details of type of controller or control system architecture
    • B60W2050/0004In digital systems, e.g. discrete-time systems involving sampling
    • B60W2050/0006Digital architecture hierarchy
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W2050/0001Details of the control system
    • B60W2050/0019Control system elements or transfer functions
    • B60W2050/0028Mathematical models, e.g. for simulation
    • B60W2050/0031Mathematical model of the vehicle
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W2050/0062Adapting control system settings
    • B60W2050/0075Automatic parameter input, automatic initialising or calibrating means
    • B60W2050/0082Automatic parameter input, automatic initialising or calibrating means for initialising the control system
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2510/00Input parameters relating to a particular sub-units
    • B60W2510/18Braking system
    • B60W2510/182Brake pressure, e.g. of fluid or between pad and disc
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2520/00Input parameters relating to overall vehicle dynamics
    • B60W2520/26Wheel slip
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Physics & Mathematics (AREA)
  • Transportation (AREA)
  • Mechanical Engineering (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Regulating Braking Force (AREA)
  • Control Of Driving Devices And Active Controlling Of Vehicle (AREA)

Abstract

用于对车辆的行驶动态调节器进行参数化的方法和装置,该行驶动态调节器以调节的方式来干预车辆的行驶动态,其中行驶动态调节器根据车辆状态(
Figure 100004_DEST_PATH_IMAGE001
)来确定行动(
Figure 255123DEST_PATH_IMAGE002
),该方法包括如下步骤:提供用于预测车辆状态的模型
Figure 100004_DEST_PATH_IMAGE003
,该模型被设立为:根据车辆状态(
Figure 969001DEST_PATH_IMAGE001
)和行动(
Figure 342214DEST_PATH_IMAGE002
)来预测后续车辆状态(
Figure 206265DEST_PATH_IMAGE004
);确定至少一个数据元组,其包括车辆状态的序列和分别被分配的行动,其中车辆状态借助于模型(
Figure 286216DEST_PATH_IMAGE003
)根据通过行驶动态调节器所确定的行动来被确定;使行驶动态调节器的参数(θ)改变/适配,使得成本函数(
Figure 100004_DEST_PATH_IMAGE005
)被最小化,该成本函数根据所述数据元组的车辆状态和分别被分配的车辆状态的所确定的行动来确定所记录的轨迹的成本并且取决于行驶动态调节器的参数。

Description

对车辆的行驶动态调节系统进行最佳参数化的方法和装置
技术领域
本发明涉及一种对车辆的行驶动态调节器进行最佳参数化的方法、一种训练装置、一种计算机程序和一种机器可读存储介质。
背景技术
通常从现有技术中公知行驶动态调节器。术语“行驶动态调节器”(ESC,英文Electronic Stability Control(电子稳定性控制))是指用于任意车辆的如下调节器,该调节器在特定情况、例如其中在路面上的轮胎抓地力不再最佳的情况下以调节的方式干预车辆的行驶运行,以便例如重新实现最佳的轮胎抓地力。这些特定情况可能由于例如在持续监控轮胎抓地力或者其它车辆状态时发生异常而被发现。
例如,行驶动态调节器可以通过各个车轮的有针对性的制动来阻止车辆滑向一边,例如,以便在转弯时通过各个车轮的有针对性的制动不仅在转向过度时而且在转向不足时都防止车辆在弯道中的边界区域的打滑,以便这样来保障驾驶员对车辆的控制。行驶动态调节的另一应用例如是在紧急制动时提供最佳制动压力,以便阻止车轮抱死并且使制动距离保持得尽可能短。
在使制动系统与特定的车辆类型适配时,必须在应用过程中以特定于车辆类型的方式设定多个参数。因而,这很复杂并且并不总是得出最佳设定。
本发明的任务在于提供一种用于对行驶动态调节器进行最佳参数化的高效且自动化的方法。
本发明的优点
具有独立权利要求1的特征的本发明的优点在于:可以找到如下参数化,这些参数化相对于以前的参数化而言实现了明显更优化的控制、尤其是对轮胎抓地力的明显更优化的控制。例如,可以表明:借此,相对于当前的紧急制动系统而言,在紧急制动时的制动距离可以再次被显著缩短。这提高了车辆的乘员的安全性。
本发明还具有如下优点:可以自动化地找出最佳参数化,由此复杂的手动测试和评估变得过时。
本发明还具有如下优点:参数化甚至可以仅通过车辆的模拟来被学习。这一点特别有利,原因在于在模拟中可以进一步用尽行驶动态的极限,由此最终一方面可以尝试更多参数化另一方面可以成本更加低廉地尝试这些参数化。因而可以说:借此可以实现特别高效且有效的应用。
本发明还具有如下优点:应用工程师可以通过域知识(诸如通过高级决策:更方便与更高性能)来进行最低限度的干预并且因此也能根据客户的需要来有针对性地调整参数化。
本发明还具有如下优点:可以实现更高的鲁棒性,即在所有工作点并且借此不仅仅是针对个别测试场景来优化地实现良好的性能。
发明内容
在第一方面,本发明涉及一种用于对车辆的行驶动态调节器进行最佳参数化的尤其是计算机实现的方法。该行驶动态调节器可以以调节的方式来干预车辆的行驶动态或者控制该行驶动态,其中该行驶动态调节器根据车辆状态(
Figure 100002_DEST_PATH_IMAGE001
)、尤其是当前的车辆状态来确定行动(
Figure 174262DEST_PATH_IMAGE002
),以便例如积极地干预该行驶动态。即,对该行驶动态进行干预,以便使车辆在其原始行驶轨迹上保持稳定。
行驶动态可以被理解成车辆的运动,也就是说朝着和绕着三个车辆运动方向的路程、速度、加速度以及作用于车辆的力和扭矩。车辆运动示例性地包括直行和转弯行驶、垂直、俯仰和摆动运动以及恒速行驶、制动和加速过程。此外,行驶动态在此也可以被理解成车辆的所形成的振动。
车辆状态(
Figure 718376DEST_PATH_IMAGE001
)可以被理解成如下参量,该参量表征车辆的关于其行驶动态方面和/或关于车辆的组件状态方面的状态。该车辆状态优选地表征当前的车辆动态的一部分,尤其是车辆的空间运动。在主轴线的方向上的三种平移运动可设想作为空间运动,即沿着纵轴线的纵向运动、即实际位置变化,沿着横轴线的横向运动和沿着垂直轴线的升降运动,通常与下坡或上坡行驶时的纵向运动相结合。空间运动也可以作为加速度来给出。也可设想的是绕着三条主轴线的旋转运动,例如绕着垂直轴线的偏航、绕着横轴线的俯仰和绕着纵轴线的摆动。这些运动可以作为角度或者作为角速度来给出。此外,附加的平移和旋转振动也可以影响车辆状态。
此外,该车辆状态优选地表征方向盘角度或方向盘扭矩。特别优选地,该车辆状态也表征轮胎抓地力和/或轮胎的行为。
行动(
Figure 69723DEST_PATH_IMAGE002
)可以被理解成如下参量,该参量表征车辆的运动,也就是说当由车辆来实施该行动时,车辆实施该运动。优选地,该行动(
Figure 15682DEST_PATH_IMAGE002
)是控制参量,诸如制动力或者甚至制动压力。
该方法包括如下阐述的步骤:
该方法开始于提供用于预测车辆状态(
Figure 100002_DEST_PATH_IMAGE003
)的模型
Figure 289056DEST_PATH_IMAGE004
。该模型
Figure 195832DEST_PATH_IMAGE004
被设立为:根据车辆状态(
Figure 350870DEST_PATH_IMAGE001
)和行动(
Figure 416915DEST_PATH_IMAGE002
)来预测后续车辆状态(
Figure 999206DEST_PATH_IMAGE003
)。后续车辆状态(
Figure 783491DEST_PATH_IMAGE003
)可以被理解成当从当前的车辆状态(
Figure 476641DEST_PATH_IMAGE001
)出发由车辆实施了行动(
Figure 272558DEST_PATH_IMAGE002
)时立即出现的车辆状态。
然后,确定至少一个数据元组(
Figure 100002_DEST_PATH_IMAGE005
),该数据元组包括车辆状态(
Figure 884805DEST_PATH_IMAGE006
)的序列和分别被分配的行动(
Figure 100002_DEST_PATH_IMAGE007
),其中这些车辆状态借助于该模型(
Figure 625228DEST_PATH_IMAGE004
)根据通过该行驶动态调节器所确定的行动来被确定。
然后,使该行驶动态调节器的参数(
Figure 122069DEST_PATH_IMAGE008
)适配,使得成本函数(
Figure 100002_DEST_PATH_IMAGE009
)被最小化,该成本函数根据该数据元组的车辆状态和分别被分配的车辆状态的所确定的行动来确定所记录的轨迹的成本并且取决于该行驶动态调节器的参数。对该行驶动态调节器的参数(
Figure 631547DEST_PATH_IMAGE008
)的适配可以针对该数据元组的每个车辆状态或者在来自该数据元组的整个序列内实现。
对这些参数(
Figure 555641DEST_PATH_IMAGE008
)的适配可以通过优化算法、优选地借助于梯度下降法、特别优选地借助于反向传播时间(Back-prop-through time)来实现。
已经认识到:用于基于借助于相对准确的模型的优化来优化该行驶动态调节器的所谓的基于模型的方法可以确定对这些参数
Figure 48939DEST_PATH_IMAGE008
的信息最丰富的适配。替代于此,存在所谓的无模型方法,但是这些无模型方法不那么有效,原因在于这些无模型方法在优化这些参数以便获得尽可能好地控制行驶动态的行驶动态调节器方面没有提供足够的信息。因而可以说:只有通过所提出的方法才能够提供具有比手动设定的调节器明显更好的性能的行驶动态调节器。相对于其它学习范例,该方法具有如下优点:该方法能扩展,即也可以处理任意复杂的数据量;以及该方法也可以优化高维行驶动态调节器。
提出:该模型(
Figure 349471DEST_PATH_IMAGE004
)是可训练模型,该可训练模型的参数化是根据该车辆或另一车辆的所检测到的驾驶机动来被教导的;或者该模型(
Figure 244614DEST_PATH_IMAGE004
)是物理模型,该物理模型描述了车辆的行驶动态,尤其是沿着车辆的纵向和横向轴线的行驶动态。该可训练模型例如可以是机器学习系统,优选地是神经网络。通常,该可训练模型可以是黑盒(Black-Box)模型,例如线性或基于特征的回归、高斯过程模型、循环神经网络(RNN,LSTMs)、(深度)神经网络或者白盒(White-Box)模型,例如具有参数的(简化)物理模型或者它们的组合(灰盒模型(Grey-BoxModel))。
该物理模型具有如下优点:该物理模型能够实现解析梯度,由此来实现更准确的适配,这引起:行驶动态调节器参数化更接近理想参数化。此外,不需要真实测量,因此该方法也可以有利地以纯模拟的方式被执行。
还提出:附加地,检测车辆的真实驾驶机动的轨迹,其中根据所检测到的轨迹和该模型(
Figure 339609DEST_PATH_IMAGE004
)来创建校正模型(
Figure 461149DEST_PATH_IMAGE010
),使得该校正模型(
Figure 444934DEST_PATH_IMAGE010
)对该模型(
Figure 69950DEST_PATH_IMAGE004
)的输出进行校正,使得这些输出与所检测到的轨迹基本上相匹配。该轨迹可以描述车辆状态的序列以及在相应的车辆状态下所选择的真实驾驶机动的行动。“基本上”在这里可以被理解为:通过该校正所实现的精度处在这些待校正的车辆状态的测量公差之内或者处在如下精度内,该精度可以利用用于创建校正模型的相应的优化方法来被实现,或者由于该校正模型的强大而可以实现该校正模型的最大可实现精度。
可设想的是:在使该行驶动态调节器的参数适配的步骤之后再次进行检测真实驾驶机动的该附加步骤,其中现在使用经适配的行驶动态调节器来执行真实驾驶机动。接着,借此所检测到的轨迹可以再次被用于借助于该模型
Figure 335846DEST_PATH_IMAGE004
来重新调整该校正模型以及确定至少一个数据元组的接下来的步骤,并且于是随后使该行驶动态调节器的参数适配。
该校正模型尤其被创建为使得在该校正模型的输出与训练数据的所记录的状态和通过该模型所预测的状态的差异之间的差异被最小化。
如果该模型(
Figure 803737DEST_PATH_IMAGE004
)是被学习的模型,则该模型的参数化可以根据所检测到的轨迹来被学习。例如,适合于此的是借助于计算针对开环(前馈)或闭环(反馈)调节回路中例如借助(随机)梯度下降的单步或多步模型预测的最大似然(Maximum Likelihood)或最大后验(Maximum-a-posteriori)解来进行的对模型参数的优化。
令人惊讶的是,通过使用该校正模型实现了如下优点:需要车辆的特别少的真实机动来一方面优化该行驶动态调节器并且另一方面创建被学习的模型。
还提出:该模型(
Figure 446071DEST_PATH_IMAGE004
)是确定性的并且该校正模型是与时间相关的。换言之,该校正模型取决于状态或时间,其中该时间表征自从所记录的轨迹开始以来经过的时间段。也就是说,该校正模型根据该时间来确定针对该模型
Figure 191173DEST_PATH_IMAGE004
的校正值。令人惊讶的是,已经证明:这种类型的校正模型引起了最好的参数化。该时间也可以是离散值,该离散值表征自从预先限定的起点(例如该行驶动态调节器干预行驶动态的时间点)以来所执行的行动的数目。
该模型
Figure 752604DEST_PATH_IMAGE004
与被配置用于校正该模型的输出的校正模型的组合可以被理解成用于预测状态变化的全局模型。换言之,状态变化的该全局模型是这两个模型的叠加。
即,该校正模型被配置用于校正第一模型相对于在执行行动之后的环境的真实状态的误差。例如,该模型根据当前状态和行动来对状态进行预测。应当注意:该行动可以由该行驶动态调节器以及由例如驾驶员来确定。然后,该校正模型对该模型的所预测的状态进行校正,使得在代理针对当前状态执行该行动之后,所预测的状态与环境的实际状态尽可能相似。换言之:该校正模型对第一模型的输出进行校正,以便获得预测状态,该预测状态尽可能接近环境实际上会假定的状态或者尽可能接近在这些机动的情况下所检测到的状态。因而,该校正模型对第一模型进行校正,以便获得关于环境、尤其是环境动态的更精确的状态。
优选地,该校正模型取决于时间步长和/或当前状态。替代地,该校正模型是校正项,该校正项是被提取的校正值,该校正值通过所检测到的真实机动的所检测到的车辆状态与通过该模型所预测的状态的差异来被确定。该校正模型可以输出离散校正,这些离散校正可以直接被添加到该模型的预测上。可存在该校正模型的特例,在该特例中,该校正模型输出时间离散的校正值。
还提出:通过如下方式来选择该校正模型:使在该校正模型的输出与沿着轨迹的所检测到的车辆状态和该模型的所预测的车辆状态的差异之间的差异的量度最小化。该最小化也可以通过已知的梯度下降法来被执行。
还提出:提供多个不同的模型(
Figure 583157DEST_PATH_IMAGE004
),其中该数据元组随机针对所述多个不同的模型之一来被检测。
在这种情况下有利的是:一方面由此可以对模型不确定性进行建模并且最终实现鲁棒的调节器行为,并且因此该调节器例如可以更好地处理随时间的变化。也可设想的是:该模型或者这些模型可以针对其预测输出不确定性,该不确定性表征所述模型的预测的不确定性,其中该不确定性在对该行驶动态调节器的参数的适配方面被考虑。该不确定性可以按如下地被确定:
1) 关于调节器的性能、鲁棒性和安全性的统计结论;和/或
2) 在优化期间/之后避免不安全的/未知的车辆行为;和/或
3) 通过在以前未知的区域进行额外探索来使学习加快。
通过在多个时间步长内对(模型)不确定性的传播,得出在长期预测中的不确定性(关于可能的未来系统行为的分布)。方法在这里例如是解析闭合(对于简单模型来说,例如线性高斯)、采样、数值积分、矩匹配(moment matching)、线性化(对于更复杂的模型来说)。
还提出:不同模型的区别在于:这些模型分别考虑或表征外部参量的不同动态或者车辆的参量的不同动态。
动态参量的示例是变化的路面或者不同的场景,如道路的关于该道路的全部三条可能的空间轴线的变化的走向。
还提出:针对这些模型中的每个模型检测各一个数据元组,其中根据所有数据元组来改变这些参数。因为已经证明:这会引起特别优化的、鲁棒的调节器行为。
还提出:借助于卡尔曼滤波器来对所检测到的车辆状态进行过滤,其中根据车辆的预测轨迹来确定卡尔曼滤波器的参数化,其中卡尔曼滤波器被应用于所检测到的状态。
还提出:该行驶动态调节器具有模块化的调节器结构,其中在使这些参数适配时,这些参数被适配为使得被改变的参数处在指定的值范围内。也就是说,该调节器被划分成模块,并且每个模块负责一个子功能,例如PID调节器,该PID调节器将当前滑差调节到目标滑差。接着,另一个模块会是增益调度器,该增益调度器根据行驶情况、地面(Untergrund)、速度来使PID增益适配。又一个另外的模型可以基于车轮转速、制动压力曲线和车速来估计行驶情况,等等。
除了只在置信范围内优化这些参数之外的优点在于:该行驶动态调节器将不会表现出危及安全的行为,并且优点还在于:对行驶动态的探索被限于有意义的车辆状态。
还提出:该行驶动态调节器是神经网络,尤其是径向基函数网络(英文radialbasis function network)。
有利的是:神经网络可以非常好地学习复杂的关系并且具有特别高的灵活性,以便学习各种调节器行为方式。特别优选的是RBF网络,原因在于这些RBF网络由于其紧凑的结构而特别适合于在车辆中的控制设备上实现。
还提出:在使这些参数适配之后,检测在车辆运行时的车辆状态,其中车辆的执行器根据行动来被操控,该行动借助于该行驶动态调节器根据所检测到的该车辆状态来被确定。
还提出:成本函数是多个函数的加权叠加,其中这些函数表征车辆的轮胎的当前滑移与目标滑移的差异、自从该行驶动态调节器干预以来所走过的路程以及所走过的路程的随时间的导数。
还提出:该行驶动态调节器是ABS调节器并且输出表征制动力的行动,其中该物理模型包括多个子模型,所述多个子模型是车辆的组件的物理模型。
该行动例如可以分别针对车辆的车轮或车桥中的每个来单独地被确定,使得这些车轮/车桥可以单独地根据相应的制动压力来被操控。
应当注意:该行驶动态调节器例如可以是ABS、TCS或ESP调节器,等等,或者可以是这些调节器的组合。
还应当注意:该方法也可以被用于:例如当车辆新换胎时,针对第二车辆类型/实例来重新调整已经针对第一车辆类型/实例被优化的行驶动态调节器或者甚至针对第一车辆类型/实例来重新调整已经针对第一车辆类型/实例被优化的行驶动态调节器。
在其它方面,本发明涉及:一种装置以及一种计算机程序,该装置和该计算机程序分别被设立为实施上述方法;和一种机器可读存储介质,在其上存储有该计算机程序。
附图说明
随后,本发明的实施方式参考随附的附图更详细地予以阐述。在附图中:
图1示意性示出了用于利用行驶动态调节器来控制车辆的实施例;
图2示意性示出了用于对行驶动态调节器进行参数化的方法的流程图;
图3示出了训练装置的可能的结构。
具体实施方式
图1示范性地示出了具有控制系统40的车辆100。
车辆100通常可以是机动车,该机动车通过驾驶员来被控制或者可以是部分自主车辆或者甚至是完全自主车辆。在其它实施方式中,该机动车可以是轮式车辆、履带式车辆和轨道车辆。也可设想的是:该机动车是两轮车,比如自行车、摩托车等等。
利用至少一个传感器30以优选地均匀的时间间隔来检测车辆的状态,该传感器也可以通过多个传感器来给出。该状态也可以根据所检测到的传感器值来被确定。传感器30优选地是加速度传感器(沿车辆纵向方向,但是也可能会是在所有轴线上的3D传感器)、车轮转速传感器(在所有车轮上)、绕着垂直轴的偏航率传感器(Drehratensensor)(但是也可能会绕着所有其它轴线)。
控制系统40在可选的接收单元中接收传感器30的传感器信号S的序列,该接收单元将传感器信号S的序列转换成经预处理的传感器信号的序列。
传感器信号S或者经预处理的传感器信号的序列被输送给控制系统40的行驶动态调节器60。行驶动态调节器60优选地通过参数
Figure 888236DEST_PATH_IMAGE008
来被参数化,这些参数寄存在参数存储器P中并且由该参数存储器来提供。
行驶动态调节器60根据传感器信号S以及该行驶动态调节器的参数
Figure 487845DEST_PATH_IMAGE008
来确定行动,在下文也称为操控信号A,该操控信号被传输给车辆的执行器10。执行器10接收操控信号A,相对应地被操控并且然后实施相对应的行动。也可设想的是:执行器10被设立用于将操控信号A转换成直接控制信号。如果执行器10例如接收制动力作为操控信号A,则该执行器可以将该制动力换算成相对应的制动压力,接着利用该制动压力来直接操控制动器。在这种情况下,执行器10可以是制动系统,该制动系统包括车辆100的制动器。附加地或替代地,执行器10可以是车辆100的驱动装置或者转向装置。
在其它优选的实施方式中,控制系统40包括一个或多个处理器45和至少一个机器可读存储介质46,在该机器可读存储介质上存储有命令,当这些命令在处理器45上被实施时,这些命令促使控制系统40实施按照本发明的方法。
在其它实施方式中,除了执行器10之外,还设置显示单元10a。显示单元10a被设置用于例如显示该行驶动态调节器60的干预和/或输出该行驶动态调节器60将要马上干预的预告。
该行驶动态调节器60通过经参数化的函数
Figure DEST_PATH_IMAGE011
来给出,该函数根据状态
Figure 954598DEST_PATH_IMAGE012
和/或根据传感器30的传感器信号S来输出操控信号A。对于该行驶动态调节器60针对执行器10输出操控信号A的情况来说,其中执行器10具有多个致动器,操控信号A可以分别具有针对这些致动器中的每个致动器的控制信号。各个致动器可以是车辆100的各个制动器。
在一个优选的实施例中,该行驶动态调节器60是ABS调节器,其中该调节器输出制动力或制动压力,作为操控信号。优选地,该行驶动态调节器60这里针对车轮的制动器中的每个制动器或者针对车轮100的车桥中的每个车桥输出制动压力或制动力,以便能够对这些车轮单独进行控制。
优选地,该行驶动态调节器60具有可解释的调节器结构。这例如可以通过在该调节器内能限定有效的参数限制而存在。这具有如下优点:该行驶动态调节器60的行为能在任何情况下都被理解。
该行驶动态调节器60的被参数化的函数
Figure DEST_PATH_IMAGE013
的示例如下:
具有可解释的调节器结构的行驶动态调节器60例如可以通过结构化的行驶动态调节器60来给出,该结构化的行驶动态调节器像决策树(英文decision tree)那样被结构化。
为了依据决策树来确定行动,从根节点沿着树进行。在每个节点处查询属性(例如车辆状态)并且通过此来做出关于对下一节点的选择的决策。该过程一直继续,直至到达决策树的叶子为止。该叶子表征多个可能的行动中的一个行动。该叶子例如可以表征制动压力的建立/撤销。
在该示例中,这些参数
Figure 741289DEST_PATH_IMAGE008
是决策阈值等等。
替代地,该行驶动态调节器60可以通过RBF网络(radial basis functions(径向基函数))或者通过深度RNN策略(Deep RNN policy)来给出。
应当注意:被参数化的函数
Figure 850059DEST_PATH_IMAGE013
也可以是任意其它数学函数,该任意其它数学函数根据这些参数来将车辆的状态映射到操控信号上。
图2示出了用于对行驶动态调节器60进行参数化并且可选地然后在车辆100中运行行驶动态调节器60的流程图20的示意图。
该方法开始于步骤S21。在该步骤中,收集车辆100的行驶数据。这些行驶数据例如是数据系列
Figure 304174DEST_PATH_IMAGE014
,该数据系列描述车辆100的沿着驾驶机动的状态
Figure 348354DEST_PATH_IMAGE012
。这些行驶数据优选地是数据元组,该数据元组包括在该机动的每个时间点
Figure DEST_PATH_IMAGE015
的状态数据
Figure 746974DEST_PATH_IMAGE001
以及行动数据
Figure 534801DEST_PATH_IMAGE002
对于该行驶动态调节器60是ABS调节器的情况来说,例如可以在使用已知的ABS调节器的情况下或者通过由驾驶员驾驶车辆100来记录制动过程,其中状态数据(
Figure 233636DEST_PATH_IMAGE001
)示例性地包括如下传感器数据:车辆 速度
Figure 183137DEST_PATH_IMAGE016
、加速度
Figure DEST_PATH_IMAGE017
,优选地车辆100的每个车轮的下列传感器数据:车轮 速度
Figure 806404DEST_PATH_IMAGE018
、加速度
Figure DEST_PATH_IMAGE019
、加加速度(英文jerk)
Figure 991398DEST_PATH_IMAGE020
。行动数据(
Figure 420105DEST_PATH_IMAGE002
)是在相应状态下所选择的制动力,优选地也是表征路面的参量。
替代地,这些行驶数据可以通过模拟来产生,在该模拟中,虚拟车辆在模拟环境下实施一个或多个(制动)机动。
然后可以是步骤S22。在其中,所记录的状态数据
Figure 540508DEST_PATH_IMAGE012
部分地被重建。原因在于通常并非所有关于系统(汽车)的状态的所需的信息都由内部传感器来测量(例如车辆的倾斜度、悬架行为、车轮加速度)。为了学习和建模,这些潜在信息必须被恢复,以便能够实现预测和优化。该领域通常称为潜在状态推理(例如隐马尔可夫模型)并且通过过滤/平滑算法(例如卡尔曼滤波器)来被求解。优选地,借助于卡尔曼滤波器来执行对车辆状态的步骤S22的重建。
在步骤S21或步骤S22结束之后,是步骤S23。在该步骤中,提供模型
Figure 444879DEST_PATH_IMAGE004
。该提供可以通过如下方式来进行:基于根据步骤S21的记录来创建该模型
Figure 308930DEST_PATH_IMAGE004
或者提供物理模型。
该模型
Figure DEST_PATH_IMAGE021
是根据在时间点
Figure 451198DEST_PATH_IMAGE015
的车辆状态
Figure 8081DEST_PATH_IMAGE001
以及据此被选择的操控信号来预测在紧接着随后的时间点
Figure 9535DEST_PATH_IMAGE022
的后续车辆状态
Figure 801911DEST_PATH_IMAGE003
的模型。
优选地,该模型
Figure 939631DEST_PATH_IMAGE021
是一阶物理模型。也就是说,该物理模型包括方程,这些方程描述了物理关系并且根据当前的车辆状态
Figure 792050DEST_PATH_IMAGE001
和行动
Figure 280800DEST_PATH_IMAGE002
尤其是确定性地预测后续车辆状态
Figure 486653DEST_PATH_IMAGE003
。示范性地,对于用于ABS的行驶动态调节器60来说,该物理模型可以由下列子模型列表中的一个或多个子模型组成:第一子模型,该第一子模型是车辆100的车轮的物理模型;第二子模型,该第二子模型描述了车辆的重心;第三子模型,该第三子模型是减震器的物理模型;第四子模型,该第四子模型是轮胎的物理模型;和第五子模型,该第五子模型是液压系统模型的多维模型。应当注意:该列表不是封闭的,并且可以考虑其它物理特征,如轮胎/制动器温度等等。
应当注意:除了该模型
Figure 869093DEST_PATH_IMAGE004
之外,也可设想其它方法用来对参数化进行优化。替代于该模型,也可以选择所谓的无模型强化学习方法或者基于价值的强化学习方法。接着,相对应地,在步骤S23中例如基于来自步骤S21中的记录来创建用于基于价值的强化学习的Q函数。
在步骤S23之后,可以是步骤S24。步骤S24可以称为“同策略(On-policy)校正”。在这种情况下,创建校正模型
Figure 767779DEST_PATH_IMAGE010
,该校正模型对该模型
Figure 478246DEST_PATH_IMAGE021
关于车辆状态的预测进行校正,使得经校正的预测与来自步骤S21中的所检测到的预测基本上一致。
优选地,经校正的车辆状态按如下地被校正:
Figure 878003DEST_PATH_IMAGE024
该校正模型
Figure 990316DEST_PATH_IMAGE010
被校正为使得该校正模型通过如下方式来被优化:该校正模型在给定
Figure 59903DEST_PATH_IMAGE001
Figure 379370DEST_PATH_IMAGE002
的情况下输出其中一个值,该值对应于该模型
Figure DEST_PATH_IMAGE025
相对于根据S21的所检测到的车辆状态的误差。
该校正模型
Figure 786081DEST_PATH_IMAGE010
还具有如下优点:该校正模型对该模型
Figure 18479DEST_PATH_IMAGE004
与车辆的实际行为相比的不匹配进行校正。
为了对该模型
Figure 993388DEST_PATH_IMAGE004
与车辆的实际行为相比的不匹配进行校正,替代地或附加地,可以采取如下措施。可设想的是:为此使用所谓的迁移学习(Transfer Learning),该迁移学习包括先前确定的车辆状态并且借此允许该模型针对具体车辆实例的更快的学习。也可设想的是:使用多个不同的模型,由此可以通过该集成来学习更鲁棒的调节器行为。
在步骤S23或步骤S24之后,是步骤S25。在其中,执行多次展示(Rollouts)。也就是说,在使用该行驶动态调节器60的当前参数化
Figure 68660DEST_PATH_IMAGE026
的情况下并且在使用模型P的情况下,尤其是附加地在有校正模型
Figure 685586DEST_PATH_IMAGE010
的情况下,该行驶动态调节器被应用于机动并且从中得到的轨迹、尤其是所确定的车辆状态的序列被检测。
应当注意:除了该模型
Figure 506912DEST_PATH_IMAGE004
之外,也可设想其它方法用来对参数化进行优化(无模型强化学习方法或者基于价值的强化学习方法)。相对应地,在该展示步骤中必须使对轨迹的检测适配。
在步骤S25被实施之后或者在步骤S25被多次重复实施之后,是步骤S26。在该步骤中,评估来自步骤S25中的一条或多条所检测到的轨迹的成本。
轨迹的成本可以按如下地被确定。优选地,针对该行驶动态调节器60的每个被建议的行动来确定成本。为此,成本函数
Figure DEST_PATH_IMAGE027
可以根据以前的轨迹或者当前的车辆状态
Figure 777356DEST_PATH_IMAGE001
以及当前选择的行动
Figure 949712DEST_PATH_IMAGE002
来确定成本。接着,轨迹的总成本可以在整个机动期间、即在所有时间点
Figure 963804DEST_PATH_IMAGE015
上被累积:
Figure DEST_PATH_IMAGE029
成本函数
Figure 905215DEST_PATH_IMAGE027
可以组成如下:
Figure DEST_PATH_IMAGE031
其中
Figure 80982DEST_PATH_IMAGE032
是可指定的系数,这些可指定的系数例如由应用工程师来指定或者被设置到初始值。这些系数可以取介于0和1之间的值。
Figure DEST_PATH_IMAGE033
可以被理解成车辆的可控性。该可控性可以根据横向作用于车辆的力(
Figure 334108DEST_PATH_IMAGE034
)来被确定(例如
Figure DEST_PATH_IMAGE035
),必要时也根据归一化的横向力:
(
Figure 886312DEST_PATH_IMAGE036
当成本函数应该被最小化时,该可控性也可以被限定为负。附加地或替代地,该可控性也可以根据纵向力来被确定,使得纵向力不被充分利用,以便仍为横向力留出“余地”。为此,可以限定目标滑移范围(例如
Figure DEST_PATH_IMAGE037
),以便接着例如使用sigmoid函数映射到相对应的成本上。
Figure 416651DEST_PATH_IMAGE038
可以被理解成对轨迹的所有加速度的平均,例如
Figure DEST_PATH_IMAGE039
成本函数的其它组成部分可以通过车辆的任何应该受到惩罚或奖励的行为来给出。示范性地,这可以是:舒适度/加加速度(Jerk),即制动有多急促,或者硬件要求(用于制动系统的制动器、车辆、液压系统、轮胎承受多少负载),性能(例如制动距离、加速度),直线滑行,即绕着垂直轴线的行为。
所有这些组成部分都可以依据不同的信号(传感器信号或估计)并且依据不同的成本函数来被评价,例如当前与目标状态之间的平均绝对误差(Mean Absolute Error)、均方误差(Mean Squared Error)、均方根误差(Root Mean Squared Error)(例如在滑差(Slip)、摩擦值、加加速度方面),或者信号的标准差。
成本函数的另一组成部分可以是总制动距离。这可以是:单个值,该单个值只有在其中制动结束的时间步长内才能被获得,例如
Figure 31828DEST_PATH_IMAGE040
,其中c是总制动距离;或者针对其中制动活跃的每个时间步长的通过
Figure DEST_PATH_IMAGE041
的总和。
成本函数的另一组成部分可以是:滑移相对于目标滑移的偏差:||slip-lip_target||^2;和/或平均加速度:mean std(acceleration)。
在步骤S26中针对该轨迹或者多条轨迹确定总成本之后,是步骤S27。在该步骤中,该行驶动态调节器60的参数
Figure 772250DEST_PATH_IMAGE008
迭代地被适配,使得这些参数降低总成本。在此,优化可以被限定如下:
Figure DEST_PATH_IMAGE043
关于参数
Figure 862566DEST_PATH_IMAGE008
的这种优化可以通过关于总成本
Figure 778570DEST_PATH_IMAGE044
的梯度下降法来实现。
接着,对于该优化的每次迭代
Figure DEST_PATH_IMAGE045
,当前的参数
Figure 561718DEST_PATH_IMAGE026
按如下地被适配:
Figure DEST_PATH_IMAGE047
其中
Figure 664803DEST_PATH_IMAGE048
是系数,该系数取小于1的值。
可以一直执行该迭代,直至满足中断标准为止。中断标准例如可能会是:最大迭代次数、在
Figure DEST_PATH_IMAGE049
中的最小变化、参数
Figure 558810DEST_PATH_IMAGE050
的最小变化。
对于尤其是针对不同的机动确定了多个总成本的情况来说,这些参数可以分批地通过所述多个总成本来被适配。分批程序可以作为关于模型参数的批次、作为关于场景/机动的批次或者作为关于子轨迹的批次来进行。
在完成步骤S27之后,可以重新实施步骤S25至S27,替代地也可以重新实施步骤S21至27。
在可选的步骤S28中,使用来自步骤S27中的经适配的行驶动态调节器60来对车辆100的控制系统40进行初始化。
在随后的可选的步骤S29中,使用经适配的行驶动态调节器60来运行车辆100。在此,当该行驶动态调节器60在相对应的情况下被激活时,例如当执行紧急制动时,车辆100可以通过该行驶动态调节器来被控制。
在根据图2的方法的另一实施方式中,在完成步骤S27之后,也可以重新实施步骤S21至27,然而根据步骤S27来经适配的行驶动态调节器30被加载(gespielt)到另一车辆模型或类型的另一车辆上,并且根据步骤S21来执行新的测量。这能够实现:针对另一车辆花费低地对经优化的行驶动态调节器60重新进行优化。
在根据图2的方法的另一实施方式中,提供或产生多个不同的模型
Figure 188374DEST_PATH_IMAGE004
并且针对这些模型中的每个模型都产生轨迹。这些模型的区别在于:这些模型描述了不同的场景和/或考虑外部参量的不同的动态,例如路面或者其它车辆模型类型的其它行驶特性或者轮胎/其它车辆组件的磨损。这具有如下优点:该行驶动态调节器学会能够处理随时间的变化。
图3示意性示出了用于对行驶动态调节器60进行参数化的训练装置300。该训练装置300包括提供方31,该提供方要么提供来自步骤S21中的所记录的行驶数据要么是模拟环境,该模拟环境根据该行驶动态调节器60的所实施的行动来产生状态。提供方31的数据被转发给该行驶动态调节器60,该行驶动态调节器据此来确定相应的行动。行动以及提供方31的数据被输送给评估方33,该评估方据此来确定按照步骤S27所适配的参数,这些参数被传送给参数存储器P并且在那里替换当前的参数。
由训练装置300实施的步骤可以以作为计算机程序来实现的方式寄存在机器可读存储介质34上并且由处理器35来实施。
术语“计算机”包括用于运行可指定的计算规则的任意设备。这些计算规则可以以软件的形式存在,或者以硬件的形式存在,或者也可以以软件和硬件的混合形式存在。

Claims (17)

1.一种用于对车辆100的行驶动态调节器(60)进行参数化的方法(20),所述行驶动态调节器能够以调节的方式来干预所述车辆(100)的行驶动态,其中所述行驶动态调节器(60)根据车辆状态(
Figure DEST_PATH_IMAGE001
)来确定行动(
Figure 149389DEST_PATH_IMAGE002
),所述方法包括如下步骤:
提供(S23)用于预测车辆状态(
Figure DEST_PATH_IMAGE003
)的模型
Figure 213160DEST_PATH_IMAGE004
,所述模型被设立为:根据所述车辆状态(
Figure 677639DEST_PATH_IMAGE001
)和所述行动(
Figure 674414DEST_PATH_IMAGE002
)来预测后续车辆状态(
Figure 933357DEST_PATH_IMAGE003
);
确定至少一个数据元组(
Figure DEST_PATH_IMAGE005
),所述数据元组包括车辆状态(
Figure 484424DEST_PATH_IMAGE006
)的序列和分别被分配的行动(
Figure DEST_PATH_IMAGE007
),其中所述车辆状态借助于所述模型(
Figure 955857DEST_PATH_IMAGE004
)根据通过所述行驶动态调节器所确定的行动来被确定;
使所述行驶动态调节器(60)的参数(
Figure 807138DEST_PATH_IMAGE008
)适配(S27),使得成本函数(
Figure DEST_PATH_IMAGE009
)被最小化,所述成本函数根据所述数据元组的车辆状态和分别被分配的车辆状态的所确定的行动来确定所记录的数据元组的成本,而且其中所述成本函数(
Figure 971403DEST_PATH_IMAGE009
)取决于所述行驶动态调节器(60)的参数。
2.根据权利要求1所述的方法,其中所述模型(
Figure 806504DEST_PATH_IMAGE004
)是机器学习系统,所述机器学习系统的参数化是根据所述车辆(100)或另一车辆的所检测到的驾驶机动来被教导的;或者所述模型(
Figure 284890DEST_PATH_IMAGE004
)是物理模型,所述物理模型描述了所述车辆的行驶动态,尤其是沿着车辆的纵向、横向和水平轴线的行驶动态。
3.根据权利要求1或2所述的方法,其中附加地,检测(S21)所述车辆(100)的真实驾驶机动的轨迹,其中根据所检测到的轨迹和所述模型(
Figure 193940DEST_PATH_IMAGE004
)来创建校正模型
Figure 125512DEST_PATH_IMAGE010
,使得所述校正模型对所述模型(
Figure 323275DEST_PATH_IMAGE004
)的输出进行校正,使得所述输出与所检测到的轨迹基本上相匹配。
4.根据权利要求3所述的方法,其中所述模型(
Figure 729985DEST_PATH_IMAGE004
)是确定性的并且所述校正模型是与时间相关的。
5.根据上述权利要求中任一项所述的方法,其中提供多个不同的模型(
Figure 493542DEST_PATH_IMAGE004
),其中所述数据元组随机针对所述多个不同的模型之一来被检测。
6.根据权利要求5所述的方法,其中所述不同模型的区别在于:所述模型分别描述外部参量的不同动态或者所述车辆的参量的不同动态。
7.根据权利要求5或6所述的方法,其中针对所述模型中的每个模型检测各一个数据元组,其中根据所有数据元组来改变所述参数。
8.根据上述权利要求中任一项所述的方法,其中所述车辆状态借助于卡尔曼滤波器来被过滤(S22)。
9.根据上述权利要求中任一项所述的方法,其中所述行驶动态调节器具有模块化的调节器结构,其中在使所述参数适配时,所述参数被适配为使得被改变的参数处在指定的值范围内。
10.根据上述权利要求1至8中任一项所述的方法,其中所述行驶动态调节器(60)是神经网络,尤其是径向基函数网络(英文radial basis function network)。
11.根据上述权利要求中任一项所述的方法,其中在使所述参数适配(S27)之后,检测在所述车辆(100)运行时的车辆状态,其中所述车辆的执行器(10)根据行动来被操控,所述行动借助于所述行驶动态调节器(60)根据所检测到的所述车辆状态来被确定。
12.根据上述权利要求2至11中任一项所述的方法,其中所述行驶动态调节器(60)是ABS调节器并且输出表征制动力的行动,其中所述物理模型包括多个子模型,其中所述子模型分别是所述车辆的组件的物理模型。
13.根据上述权利要求中任一项所述的方法,其中所述成本函数是多个函数的加权叠加,其中所述函数表征所述车辆的轮胎的当前滑移与目标滑移的差异、自从所述行驶动态调节器干预以来所走过的路程以及所走过的路程的随时间的导数。
14.一种行驶动态调节器(60),所述行驶动态调节器能根据权利要求9来获得。
15.一种装置,所述装置被设立为执行根据上述权利要求1至13中任一项所述的方法。
16.一种计算机程序,所述计算机程序包括如下指令,在通过计算机来执行所述程序时,所述指令促使所述计算机来执行根据权利要求1至13中任一项所述的方法。
17.一种机器可读存储介质,在其上存储有根据权利要求16所述的计算机程序。
CN202210747794.2A 2021-06-30 2022-06-29 对车辆的行驶动态调节系统进行最佳参数化的方法和装置 Pending CN115534970A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102021206880.4A DE102021206880A1 (de) 2021-06-30 2021-06-30 Verfahren und Vorrichtung zur optimalen Parametrisierung eines Fahrdynamikregelungssystems für Fahrzeuge
DE102021206880.4 2021-06-30

Publications (1)

Publication Number Publication Date
CN115534970A true CN115534970A (zh) 2022-12-30

Family

ID=84493017

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210747794.2A Pending CN115534970A (zh) 2021-06-30 2022-06-29 对车辆的行驶动态调节系统进行最佳参数化的方法和装置

Country Status (4)

Country Link
US (1) US20230001940A1 (zh)
JP (1) JP2023017703A (zh)
CN (1) CN115534970A (zh)
DE (1) DE102021206880A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102023200229A1 (de) 2023-01-12 2024-07-18 Robert Bosch Gesellschaft mit beschränkter Haftung Verfahren zum Erzeugen von Trainingsdaten für eine Fahrzeugsteuerung
CN115826544B (zh) * 2023-02-17 2023-07-11 江苏御传新能源科技有限公司 一种汽车配件的生产调参系统

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19748424C2 (de) * 1997-11-03 2003-04-17 Daimler Chrysler Ag Verfahren zur fahrverhaltensadaptiven Steuerung eines variabel einstellbaren Kraftfahrzeugaggregates
DE10003739C2 (de) 2000-01-28 2002-12-05 Daimler Chrysler Ag Verfahren und System zur Identifikation von Systemparametern in Fahrzeugen
DE10356307A1 (de) * 2003-11-28 2005-06-23 Robert Bosch Gmbh Verfahren und Vorrichtung zur Warnung des Fahrers eines Kraftfahrzeugs
JP4887980B2 (ja) * 2005-11-09 2012-02-29 日産自動車株式会社 車両用運転操作補助装置および車両用運転操作補助装置を備えた車両
DE102006054425A1 (de) 2005-11-22 2007-05-31 Continental Teves Ag & Co. Ohg Verfahren und Vorrichtung zum Ermitteln eines Modellparameters eines Referenzfahrzeugmodells
KR101075615B1 (ko) * 2006-07-06 2011-10-21 포항공과대학교 산학협력단 주행 차량의 운전자 보조 정보 생성 장치 및 방법
KR20140031369A (ko) * 2011-06-17 2014-03-12 로베르트 보쉬 게엠베하 도로 위 차량의 차선 안내 시에 운전자를 보조하기 위한 방법 및 장치
DE102011085325A1 (de) * 2011-10-27 2013-05-02 Robert Bosch Gmbh Verfahren zum Führen eines Fahrzeugs und Fahrerassistenzsystem
US9440350B2 (en) * 2012-03-02 2016-09-13 Positec Power Tools (Suzhou) Co., Ltd Automatically travelling device and control method therefor
US9058038B2 (en) * 2012-03-29 2015-06-16 GM Global Technology Operations LLC Method and system for predicting vehicle battery health using a collaborative vehicle battery health model
DE102013209729A1 (de) * 2013-05-24 2014-11-27 Robert Bosch Gmbh Fahrerassistenzsystem mit zusätzlichen Informationen zu einer Straßenkarte
US9523984B1 (en) * 2013-07-12 2016-12-20 Google Inc. Methods and systems for determining instructions for pulling over an autonomous vehicle
US9327712B2 (en) * 2014-04-22 2016-05-03 Alcatel Lucent System and method for control of a hybrid vehicle with regenerative braking using location awareness
DE102016214064A1 (de) 2016-07-29 2018-02-01 Zf Friedrichshafen Ag Bestimmung von Fahrzustandsgrößen
DE102017218446A1 (de) * 2016-10-28 2018-05-03 Robert Bosch Gmbh Verfahren zum Überwachen eines Kraftfahrzeugs mit automatisierter Fahrfunktion und Vorrichtung zum Durchführen des Verfahrens
DE102016223579A1 (de) * 2016-11-28 2018-05-30 Robert Bosch Gmbh Verfahren zum Ermitteln von Daten einer Verkehrssituation
DE102018201075A1 (de) * 2018-01-24 2019-07-25 Robert Bosch Gmbh Verfahren und Vorrichtung zur Emissionsüberwachung eines Verbrennungsmotors in einem Kraftfahrzeug
DE102019205519A1 (de) * 2019-04-16 2020-10-22 Robert Bosch Gmbh Verfahren zum Ermitteln von Fahrverläufen
DE102019127906A1 (de) 2019-10-16 2021-04-22 Bayerische Motoren Werke Aktiengesellschaft Verfahren und Vorrichtung zur Ermittlung eines Wertes eines Fahrzeugparameters
DE102019216150A1 (de) * 2019-10-21 2021-04-22 Robert Bosch Gmbh Regelsystem für ein Kraftfahrzeug und ein Verfahren zum Anpassen des Regelsystems
US20230034418A1 (en) * 2019-11-14 2023-02-02 Zf Friedrichshafen Ag Model Predictive Control of a Motor Vehicle
US11613269B2 (en) * 2019-12-23 2023-03-28 Nissan North America, Inc. Learning safety and human-centered constraints in autonomous vehicles
DE102020206592A1 (de) * 2020-05-27 2021-12-02 Robert Bosch Gesellschaft mit beschränkter Haftung Verfahren und Vorrichtung zum Betreiben eines elektrisch antreibbaren Kraftfahrzeugs abhängig von einem prädizierten Alterungszustands eines elektrischen Energiespeichers
DE102021202273A1 (de) * 2020-08-13 2022-02-17 Continental Teves Ag & Co. Ohg Bewegungssteuerung in Kraftfahrzeugen
DE102020212278A1 (de) * 2020-09-29 2022-03-31 Robert Bosch Gesellschaft mit beschränkter Haftung Verfahren und Vorrichtung zur maschinenindividuellen Verbesserung der Lebensdauer einer Batterie in einer batteriebetriebenen Maschine
DE102020212282A1 (de) * 2020-09-29 2022-03-31 Robert Bosch Gesellschaft mit beschränkter Haftung Verfahren und Vorrichtung zur Parametrisierung eines elektrochemischen Batteriemodells für eine Batterie basierend auf Daten von einer Vielzahl von Batterien
EP4040252A1 (en) * 2021-02-09 2022-08-10 Volkswagen Ag Vehicle, infrastructure component, apparatus, computer program, and method for a vehicle
US20230286546A1 (en) * 2022-03-14 2023-09-14 Honda Motor Co., Ltd. Systems and methods for parameter prediction for agent modeling

Also Published As

Publication number Publication date
DE102021206880A1 (de) 2023-01-05
US20230001940A1 (en) 2023-01-05
JP2023017703A (ja) 2023-02-07

Similar Documents

Publication Publication Date Title
CN106004870B (zh) 一种基于变权重模型预测算法的车辆稳定性集成控制方法
CN104773170B (zh) 一种车辆稳定性集成控制方法
Di Cairano et al. Driver-assist steering by active front steering and differential braking: design, implementation and experimental evaluation of a switched model predictive control approach
CN115534970A (zh) 对车辆的行驶动态调节系统进行最佳参数化的方法和装置
US11254315B2 (en) Friction adaptive vehicle control
CN111976729B (zh) 汽车控制方法、底盘域控制器及智能驾驶汽车
JP2019513613A (ja) 車両を制御する方法、システム、及び非一時的コンピューター可読メモリ
CN112141101B (zh) 一种基于cnn和lstm的预瞄安全路径的方法及系统
WO2022266824A1 (zh) 一种转向控制方法及装置
CN115598983B (zh) 一种考虑时变时延的无人车横纵向协同控制方法及装置
KR20220070467A (ko) 자동차의 폭방향 및 길이방향 안내 동안 데드타임 보상 기술
Koh et al. Integrated speed and steering control driver model for vehicle–driver closed-loop simulation
CN115707609A (zh) 驾驶员命令预测
Bárdos et al. Implementation and experimental evaluation of a MIMO drifting controller on a test vehicle
Li et al. Lateral stability regulation of intelligent electric vehicle based on model predictive control
Filip Trajectory tracking for autonomous vehicles
CN115432009A (zh) 一种自动驾驶车辆轨迹跟踪控制系统
WO2022163013A1 (en) System and method for adaptive control of vehicle dynamics
CN114889599A (zh) 一种基于模型预测控制的自适应巡航控制算法
CN115805939B (zh) 智能电动汽车路径跟踪控制方法及装置
Gerard et al. Global and local chassis control based on load sensing
Arat et al. Optimal tire force allocation by means of smart tire technology
CN114954432A (zh) 一种车辆路径跟踪与车身姿态协同控制方法
Acosta et al. On highly-skilled autonomous competition vehicles: An FSM for autonomous rallycross
Kirchner et al. An anthropomimetic approach to high performance traction control

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication