JP2021017168A - ダンパ制御システム、車両、情報処理装置およびそれらの制御方法、ならびにプログラム - Google Patents

ダンパ制御システム、車両、情報処理装置およびそれらの制御方法、ならびにプログラム Download PDF

Info

Publication number
JP2021017168A
JP2021017168A JP2019134773A JP2019134773A JP2021017168A JP 2021017168 A JP2021017168 A JP 2021017168A JP 2019134773 A JP2019134773 A JP 2019134773A JP 2019134773 A JP2019134773 A JP 2019134773A JP 2021017168 A JP2021017168 A JP 2021017168A
Authority
JP
Japan
Prior art keywords
damper
control
vehicle
feedback data
damper control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019134773A
Other languages
English (en)
Inventor
岳洋 藤元
Takehiro Fujimoto
岳洋 藤元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honda Motor Co Ltd
Original Assignee
Honda Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honda Motor Co Ltd filed Critical Honda Motor Co Ltd
Priority to JP2019134773A priority Critical patent/JP2021017168A/ja
Priority to US16/928,390 priority patent/US20210023905A1/en
Priority to CN202010691111.7A priority patent/CN112277558A/zh
Publication of JP2021017168A publication Critical patent/JP2021017168A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60GVEHICLE SUSPENSION ARRANGEMENTS
    • B60G17/00Resilient suspensions having means for adjusting the spring or vibration-damper characteristics, for regulating the distance between a supporting surface and a sprung part of vehicle or for locking suspension during use to meet varying vehicular or surface conditions, e.g. due to speed or load
    • B60G17/015Resilient suspensions having means for adjusting the spring or vibration-damper characteristics, for regulating the distance between a supporting surface and a sprung part of vehicle or for locking suspension during use to meet varying vehicular or surface conditions, e.g. due to speed or load the regulating means comprising electric or electronic elements
    • B60G17/0152Resilient suspensions having means for adjusting the spring or vibration-damper characteristics, for regulating the distance between a supporting surface and a sprung part of vehicle or for locking suspension during use to meet varying vehicular or surface conditions, e.g. due to speed or load the regulating means comprising electric or electronic elements characterised by the action on a particular type of suspension unit
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60GVEHICLE SUSPENSION ARRANGEMENTS
    • B60G17/00Resilient suspensions having means for adjusting the spring or vibration-damper characteristics, for regulating the distance between a supporting surface and a sprung part of vehicle or for locking suspension during use to meet varying vehicular or surface conditions, e.g. due to speed or load
    • B60G17/06Characteristics of dampers, e.g. mechanical dampers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60GVEHICLE SUSPENSION ARRANGEMENTS
    • B60G2400/00Indexing codes relating to detected, measured or calculated conditions or factors
    • B60G2400/05Attitude
    • B60G2400/051Angle
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60GVEHICLE SUSPENSION ARRANGEMENTS
    • B60G2400/00Indexing codes relating to detected, measured or calculated conditions or factors
    • B60G2400/10Acceleration; Deceleration
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60GVEHICLE SUSPENSION ARRANGEMENTS
    • B60G2400/00Indexing codes relating to detected, measured or calculated conditions or factors
    • B60G2400/20Speed
    • B60G2400/202Piston speed; Relative velocity between vehicle body and wheel
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60GVEHICLE SUSPENSION ARRANGEMENTS
    • B60G2400/00Indexing codes relating to detected, measured or calculated conditions or factors
    • B60G2400/20Speed
    • B60G2400/204Vehicle speed
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60GVEHICLE SUSPENSION ARRANGEMENTS
    • B60G2400/00Indexing codes relating to detected, measured or calculated conditions or factors
    • B60G2400/20Speed
    • B60G2400/208Speed of wheel rotation
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60GVEHICLE SUSPENSION ARRANGEMENTS
    • B60G2400/00Indexing codes relating to detected, measured or calculated conditions or factors
    • B60G2400/25Stroke; Height; Displacement
    • B60G2400/252Stroke; Height; Displacement vertical
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60GVEHICLE SUSPENSION ARRANGEMENTS
    • B60G2400/00Indexing codes relating to detected, measured or calculated conditions or factors
    • B60G2400/40Steering conditions
    • B60G2400/41Steering angle
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60GVEHICLE SUSPENSION ARRANGEMENTS
    • B60G2400/00Indexing codes relating to detected, measured or calculated conditions or factors
    • B60G2400/50Pressure
    • B60G2400/52Pressure in tyre
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60GVEHICLE SUSPENSION ARRANGEMENTS
    • B60G2400/00Indexing codes relating to detected, measured or calculated conditions or factors
    • B60G2400/80Exterior conditions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mechanical Engineering (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Vehicle Body Suspensions (AREA)
  • Feedback Control In General (AREA)

Abstract

【課題】機械学習アルゴリズムを用いながらダンパの特性の制御を高い応答性能とロバスト性で行うことが可能な技術を実現する。【解決手段】ダンパ制御システムであって、車両のサスペンションに用いられるダンパの特性を制御するダンパ制御手段と、車両において計測された車両の挙動に関するフィードバックデータを受け付けて、機械学習アルゴリズムの実行により特定された演算処理をフィードバックデータに適用し、演算処理により得られた制御変数をダンパ制御手段に出力する処理手段と、を有し、ダンパ制御手段は、ダンパ制御手段の内部で用いられている制御変数に基づいてダンパの特性を制御すると共に、内部で用いられている制御変数を、処理手段により出力された新たな制御変数に置き換える。【選択図】図2

Description

本発明は、ダンパ制御システム、車両、情報処理装置およびそれらの制御方法、ならびにプログラムに関する。
従来、機械学習アルゴリズムを用いて車両の自律的な走行を適応的に制御する(自動運転ともいわれる)技術が知られており、特許文献1には、能動的な探索を行わない強化学習に基づく車両制御技術が開示されている。
また、近年、サスペンションに用いられるダンパとして、各輪のダンパの減衰力を制御可能なアクティブダンパを採用する車両が知られている。当該減衰力を制御することにより、車両のロール挙動などを制御してより高い乗り心地を提供することができる。
特開2018−37064号公報
ところで、機械学習アルゴリズムにより、アクティブダンパの減衰力を直接制御することが考えられる。機械学習アルゴリズム(とりわけ深層強化学習アルゴリズム)によってアクティブダンパを直接制御して乗り心地を改善する場合、当該アルゴリズムを用いた制御の応答性能が問題となる場合がある。すなわち、広い範囲の挙動で乗り心地を改善しようとすると、減衰力の制御自体の応答性能は数msec程度まで向上させなければならない場合がある。これに対して、機械学習アルゴリズムの計算負荷によっては、ロバスト性を持たせつつ減衰力の制御の応答性能を数msecまで向上させることは、計算資源の観点から現実的でない場合がある。
本発明は、上記課題に鑑みてなされ、その目的は、機械学習アルゴリズムを用いながらダンパの特性の制御を独立した応答性能と独立したロバスト性で行うことが可能な技術を実現することである。
本発明によれば、
ダンパ制御システムであって、
車両のサスペンションに用いられるダンパの特性を制御するダンパ制御手段と、
前記車両において計測された前記車両の挙動に関するフィードバックデータを受け付けて、機械学習アルゴリズムの実行により特定された演算処理を前記フィードバックデータに適用し、前記演算処理により得られた制御変数を前記ダンパ制御手段に出力する処理手段と、を有し、
前記ダンパ制御手段は、前記ダンパ制御手段の内部で用いられている制御変数に基づいて前記ダンパの特性を制御すると共に、前記内部で用いられている前記制御変数を、前記処理手段により出力された新たな前記制御変数に置き換える、
ことを特徴とするダンパ制御システムが提供される。
本発明によれば、機械学習アルゴリズムを用いながらダンパの特性の制御を独立した応答性能と独立したロバスト性で行うことが可能になる。
本発明の実施形態に係る車両および情報処理装置の機能構成例を示すブロック図 本実施形態に係るダンパ制御の一例として、強化学習を用いる場合の動作概要と関連する構成を説明する図 本実施形態に係るダンパ制御の一例として、アクタークリティック手法を適用する場合の構成を説明する図 本実施形態に係るダンパ制御の一連の動作を示すフローチャート 本実施形態において利用可能なセンサ及び当該センサにより計測されるセンサデータの例を説明する図
以下、添付図面を参照して実施形態を詳しく説明する。尚、以下の実施形態は特許請求の範囲に係る発明を限定するものでするものでなく、また実施形態で説明されている特徴の組み合わせの全てが発明に必須のものとは限らない。実施形態で説明されている複数の特徴うち二つ以上の特徴が任意に組み合わされてもよい。また、同一若しくは同様の構成には同一の参照番号を付し、重複した説明は省略する。
<車両および情報処理装置の構成>
図1を参照して、本実施形態に係る車両100および情報処理装置200の構成について説明する。なお、本実施形態に係るダンパ制御システムは、例えば、情報処理装置200と、ダンパ制御部106とダンパ107とを含む。本実施形態では、車両100がアクティブダンパを備える四輪の車両である場合を例に説明するが、本実施形態は、アクティブダンパを用いて挙動を制御可能であれば二輪の車両や除雪車などの作業機に適用されてもよい。以下の実施形態において、車両はボディおよびダンパのいずれをも含むが、単に車両の縦方向の加速度を指す場合には、車両ボディの縦方向の加速度を指すものとする。
また、以降の図を参照して説明する機能ブロックの各々は、統合されまたは分離されてもよく、また説明する機能が別のブロックで実現されてもよい。また、ハードウェアとして説明するものがソフトウェアで実現されてもよく、その逆であってもよい。
センサ部101は、車両100に備えられる各種センサであり、車両100の挙動に関するセンサデータを出力する。図5は、センサ部101のうち、本実施形態のダンパ制御処理に用いられ得る各種センサと計測内容の一例を示している。これらのセンサには、例えば、車両100の車速を計測するための車速センサや、車両のボディ加速度を計測するための加速度センサ、ダンパのストローク挙動(速度や変位)を計測するサスペンション変位センサを含む。更に、ステアリング入力を計測する操舵角センサ、自己位置を取得するGPS等が含まれる。なお、以降の説明では、ダンパ制御処理に用いられる、車両100の挙動に関するこれらのセンサデータを特にフィードバックデータという。センサ部101から出力された車両100の挙動に関するフィードバックデータは、情報処理装置200に入力され、データ入力部213、一時記憶部216および報酬決定部217に入力される。
また、センサ部101は、車両の外部状況や車両からの距離、路面状態等を認識するために用いるカメラ、Lidarおよびレーダーや、車両に搭乗する搭乗者の様子を識別するためのセンサを含んでもよい。
通信部102は、例えば通信用回路等を含む通信デバイスであり、例えばLTEやLTE−Advanced等或いは所謂5Gとして規格化された移動体通信を介して外部のサーバや周囲の交通システムなどと通信する。地図データの一部又は全部を外部サーバから受信したり、他の交通システムから交通情報などを受信し得る。また、通信部102は、センサ部101から取得された各種データ(センサデータ或いはフィードバックデータ)を外部のサーバに送信し得る。操作部103は、車両100内に取り付けられたボタンやタッチパネルなどの操作部材のほか、ステアリングやブレーキペダルなどの、車両100を運転するための入力を受け付ける部材を含む。電源部104は、例えばリチウムイオンバッテリ等で構成されるバッテリを含み、車両100内の各部に電力を供給する。動力部105は、例えば車両を走行させるための動力を発生させるエンジンやモータを含む。
ダンパ107は、車両100のサスペンションに用いられ、例えば、ダンパの特性である減衰力を制御可能なアクティブダンパである。例えば、ダンパ107の制御は、ダンパ107の内部のコイルに流す電流量を制御することで内部のバルブが開く圧力が調節され、ダンパ107の減衰力が制御される。ダンパ107は、それぞれ独立する4つのダンパ107で構成され、それぞれ独立して制御される。
ダンパ制御部106は、ダンパ107の特性を制御するための例えばソフトウェアモジュールであり、ダンパ制御部106は、情報処理装置200から出力される制御変数に基づいて(独立した4つのダンパ107のそれぞれの)ダンパの特性を制御する。ダンパ制御部106の詳細については、後述する。
システム制御部108は、1つ以上のプロセッサ、ROMおよびRAMを含み、車両100内の各部の動作を制御するコントローラである。本実施形態では、システム制御部108とダンパ制御部106とを別々に説明しているが、ダンパ制御部106がシステム制御部108の一部として動作してもよい。
情報処理装置200は、センサ部101からフィードバックデータを取得して、後述するダンパ制御処理における機械学習アルゴリズムを用いた処理を実行する。例えば、情報処理装置200は、CPU210、RAM211、ROM212、データ入力部213、モデル処理部214、制御変数出力部215、一時記憶部216および報酬決定部217を含む。
CPU210は、1つ以上のプロセッサを含み、ROM212に記憶されるコンピュータプログラムをRAM211に展開、実行することにより、情報処理装置200の各部の動作を制御する。RAM211は、例えばDRAM等を含み、CPU210のワークメモリとして機能する。ROM212は、不揮発性の記憶媒体で構成され、CPU210によって実行されるコンピュータプログラムや情報処理装置200を動作させる際の設定値などを記憶する。なお、以下の実施形態では、CPU210がモデル処理部214の処理を実行する場合を例に説明するが、モデル処理部214の処理は不図示の1つ以上の他のプロセッサ(例えばGPU)で実行されてもよい。
データ入力部213は、後述する一時記憶部216に記憶されたフィードバックデータを取得して、データの前処理を行う。フィードバックデータとして入力される車両の運動状態や運転入力の特徴を、機械学習アルゴリズムが処理し易いように、種々の加工処理を行う。加工処理の一例では、所定の期間内のフィードバックデータの最大値、最小値等に加工する処理を含む。事前にフィードバックデータを加工しておくことにより、生のフィードバックデータを機械学習アルゴリズムで直接扱う場合よりも処理効率や学習効率を向上させることができる。
モデル処理部214は、例えば、強化学習などの機械学習アルゴリズムの演算を行って、得られた出力を制御変数出力部215に出力する。モデル処理部214は、データ入力部213からのフィードバックデータと報酬決定部217からの報酬のデータを用いて、強化学習アルゴリズムを実行し、ダンパ制御部106に提供する制御変数を出力する。モデル処理部214は、強化学習アルゴリズムの実行を通して内部のパラメータを最適化し(すなわち学習し)、内部のパラメータで特定される演算処理をフィードバックデータに対して適用することにより、車両100の挙動に応じた最適な制御変数を出力する。
制御変数出力部215は、モデル処理部214から出力される制御変数をダンパ制御部106に出力する。制御変数出力部215は、モデル処理部214から出力された制御変数が許容可能な範囲であるかを判定し、その制御変数が予め決められた許容可能な範囲であると判定した場合にのみ、制御変数をダンパ制御部106に出力する制御変数フィルタ手段として動作してもよい。この場合、仮にモデル処理部214が許容範囲を超える値を出力した場合であっても、ダンパ制御部106には許容範囲となる出力のみを提供することができる。
一時記憶部216は、揮発性或いは不揮発性の記憶媒体で構成され、情報処理装置200がセンサ部101から受け付けたフィードバックデータを一時的に記憶する。一時的に記憶されたフィードバックデータは、所定のタイミングでデータ入力部213に読み出される。
報酬決定部217は、フィードバックデータに基づいて、機械学習アルゴリズム(強化学習アルゴリズム)で用いられる報酬又はペナルティを決定し、モデル処理部214に出力する。報酬決定部217の詳細については、後述する。
<ダンパ制御処理の概要と関連するブロックの構成>
次に、図2を参照して、本実施形態に係るダンパ制御処理の概要と、ダンパ制御処理に用いられる機能構成例について説明する。
本実施形態のダンパ制御処理は、主に、モデル処理部214における機械学習アルゴリズムを用いた演算処理と、ダンパ制御部106によるルールベースの演算処理とから構成されるハイブリッド処理により実現される。
このような構成では、ダンパ制御部106は予め決められたルールベースの演算処理により、低次元制御出力を数百ヘルツの高速な動作周波数でダンパを制御することができる。一方、モデル処理部214はダンパ制御部ほど高くない動作周波数で高次元の制御を実行することができる。ダンパ制御部106の低次元の制御は、ルールベースで記述されるため、ダンパ制御部106の動作が安定し易く、動作を把握することができる。このため、深層強化学習を用いる場合の出力の予見可能性の低さを改善することが可能になる。
ある時刻tにおいて、モデル処理部214はフィードバックデータを受け付け、(機械学習アルゴリズムの実行により特定された演算処理により)得られた制御変数をダンパ制御部106に出力する。強化学習では、この場合のフィードバックデータは環境の状態(s)に相当し、制御変数は、環境に対する行動(a)に相当する。
ダンパ制御部106は、モデル処理部214からの制御変数を受け付けると、ダンパ制御部106の内部で用いられている制御変数を、モデル処理部214から取得した新たな制御変数に置き換える。制御変数は、例えば、ダンパ制御部106のルールベースの処理が参照するルックアップテーブルや、フィードバックデータに応じたゲインパラメータなどの、ダンパ制御部106がダンパの特性を決定するためのパラメータを含む。また、制御変数は、ダンパ制御部106が公知のスカイフック理論に基づいてダンパ107の減衰力を決定するためのパラメータでもある。例えば、車両100のセンサ部101において計測される車両のボディ加速度がスカイフック理論に基づく加速度と整合するようにダンパ107の減衰力を制御する。
ダンパ制御部106は、新たな制御変数に基づいて、フィードバックデータに対するダンパ特性の制御を行う。このとき、ダンパ制御部106は、ダンパ107の特性を制御するための制御量を算出する。例えば、ダンパ107の特性は減衰力であり、ダンパ107の特性を制御するための制御量は、当該減衰力を制御する電流量である。ダンパ制御部106は、時刻がt+1になるまで、新たな制御変数に基づく、フィードバックデータに対するダンパ制御を繰り返す。
センサ部101は、時刻t+1におけるフィードバックデータを取得して出力する(時刻tから時刻t+1までのフィードバックデータをまとめて、時刻t+1のフィードバックデータとしてもよい)。強化学習では、このフィードバックデータは、環境における状態(st+1)に相当する。報酬決定部217は、センサ部101からのフィードバックデータに基づいて、強化学習における報酬(rt+1)(またはペナルティ)を決定してモデル処理部214に提供する。本実施形態では、報酬は、所定のフィードバックデータの組み合わせから得られる、車両の挙動に関する報酬値である。報酬値は、複数の観点で求めた報酬値を平均化したり又は合計してものであってもよい。
モデル処理部214は、報酬(rt+1)を受け付けると、後述する方策および状態価値関数を更新して、時刻t+1におけるフィードバックデータに対する新たな制御変数を出力する(行動(at+1))。
<モデル処理部214の構成>
更に、図3を参照して、モデル処理部214のより詳細な構成とダンパ制御処理におけるモデル処理部214の動作例について説明する。図3は、アクタークリティック手法を用いる場合のモデル処理部214の内部構成例と、モデル処理部214の内部構成をニューラルネットワーク(NN)において実現する場合のネットワーク構成例を模式的に示している。
モデル処理部214は、アクター301とクリティック302とを含む。アクター301は、方策π(s,a)に基づき行動(a)を選択する機構である。一例として、状態sで行動aを選択する確率をp(s,a)とすると、方策は、p(s,a)と例えばsoftmax関数などを用いた所定の関数で定義される。クリティック302は、現在アクターが利用している方策π(s,a)に対する評価を行う機構であり、当該評価を表す状態価値関数V(s)を有する。
図2において説明した時刻tから時刻t+1における動作を例に説明すると、ある時刻tにおいて、アクター301はフィードバックデータを受け付け、方策π(s,a)に基づき制御変数(すなわち行動(a))を出力する。
ダンパ制御部106によりダンパ制御が行われた後に、時刻t+1におけるフィードバックデータ(すなわち状態(st+1)が得られると、報酬決定部217から当該フィードバックデータに基づく報酬(rt+1)がクリティック302に入力される。
クリティック302は、アクターの方策を改善するための方策改善を算出して、アクター301に入力する。方策改善は、公知の所定の計算方法によって求めたものでよいが、例えば、報酬とフィードバックデータを用いて得られる、公知のTD誤差δ=rt+1+γV(st+1)−V(s)(γは強化学習における割引報酬)を方策改善として用いることができる。
アクター301は、方策改善に基づいて方策π(s,a)を更新する。方策の更新は、例えば、p(s,a)をp(s,a)+βδ(βはステップサイズパラメータ)で置き換えるような更新を行いうる。すなわち、アクター301は報酬に基づく方策改善を用いて方策を更新する。クリティック302は、状態価値関数V(s)を、例えばV(s)+αδ(αはステップサイズパラメータ)で置き換えて更新する。
図3の右図は、モデル処理部214の内部構成をニューラルネットワーク(NN)において実現する場合のネットワーク構成例を模式的に示している。この例では、アクターとクリティックの2つのニューラルネットワークで構成される。入力層310は、例えば1450個のノード(ニューロン)で構成される。入力層に入力される信号は、例えば29ch×50ステップ(=1450)のフィードバックデータである。
入力層310から入力された信号はそれぞれアクターの隠れ層311、クリティックの隠れ層312を伝搬してそれぞれの出力層313と314から出力値が得られる。アクターのNNからの出力は方策であり、クリティックのNNからの出力は状態価値である。一例として、アクターの隠れ層311は例えば500個のノード×5層のネットワーク構造で構成され、クリティックの隠れ層312は例えば300個のノード×3層のネットワーク構造で構成される。また、アクターの出力層313は例えば22個のノードで構成され、クリティックの出力層314は例えば1個のノードで構成される。しかし、ネットワークのノード数や層の数、ネットワーク構成は適宜変更することができ、他の構成を用いてもよい。
それぞれのニューラルネットワークを最適化するためにニューラルネットワークの重みパラメータを変更する必要がある。ニューラルネットワークの重みパラメータの変更は、予め定めた損失関数を用いて誤差逆伝搬により行われる。本実施形態では、アクターとクリティックの2つのネットワークが存在するため、予めアクターの損失関数Lactorとクリティックの損失関数Lcriticをそれぞれ用いる。それぞれのネットワークの重み付けパラメータは、例えば、各損失関数に対して所定の勾配降下方最適化手法(例えばRMSprop SGD)を用いることにより変更される。
<本実施形態に係るダンパ制御処理の一連の動作>
次に、本実施形態に係るダンパ制御処理の一連の動作について、図4を参照して説明する。なお、本処理は、図2の説明において時刻tのフィードバックデータが得られた時点から開始される。なお、モデル処理部214の動作は、例えば5Hzの動作周波数で行われるものとする。
S401において、アクター301は、データ入力部213からフィードバックデータを受け付けて、方策π(s,a)に基づき制御変数(すなわち行動(a))を出力する。
S402において、ダンパ制御部106は、モデル処理部214からの制御変数を受け付けると、ダンパ制御部106の内部で用いられている制御変数を、モデル処理部214から取得した新たな制御変数に置き換える。そして、ダンパ制御部106は、フィードバックデータに対して、置き換えた制御変数を適用することにより、ダンパ107の特性を制御する。なお、図4に示すフローチャートでは、簡単のため、S402〜S404のステップは、ダンパ制御部106による1回分の制御として記載されている。しかし、ダンパ制御部106は、例えば1KHxの速度で取得可能なフィードバックデータに対し、ダンパ特性を、例えば100Hzの動作周波数で制御し、当該動作周波数で制御量(ダンパ107の減衰力を制御するための電流量)を制御する。このため、実際には、時刻t+1までに、S402〜S404の処理が繰り返され得る。
S403において、ダンパ制御部106は、算出した制御量(例えば電流量)が予め定められた許容可能な範囲であるかを判定し、許容可能であると判定した場合には、S404に進み、許容可能でないと判定した場合には、S405に進む。本実施形態では、制御量が許容可能でない場合にダンパ特性を変更しないようにしているが、他の制御を行ってもよい。例えば、許容可能でないと判定された制御量を許容可能な所定の上限値に補正して、補正後の制御量を用いてダンパ107を制御してもよい。このような判定を行うことにより、仮に、モデル処理部214からの制御変数に基づいて求めた制御量が異常値となる場合であっても、適切にその制御値を除外したり適切な値に修正することにより安全なダンパ制御を実現することができる。
S404において、ダンパ制御部106は、算出した制御量(例えば電流量)をダンパに供給してダンパ107の特性を制御する。
S405において、センサ部101は、時刻t+1までフィードバックデータを(例えば1KHzの動作周波数で)取得する。
S406において、データ入力部213は、フィードバックデータに上述した加工処理を施して、前処理を適用する。なお、図4に示すフローチャートでは明示していないが、データ入力部213は、入力したフィードバックデータが予め定めた許容範囲を超えたデータであるかを判定してよい。そして、当該許容範囲を超えたデータがあると判定した場合(すなわちセンサデータの異常値)には、当該フィードバックデータを使用した処理を行わないように本処理を終了してもよい。このようにすれば、モデル処理部214における内部パラメータの更新(例えば方策や状態価値の更新)を許容可能なフィードバックデータの範囲で行うことができる。
S407において、報酬決定部217は、時刻t+1におけるフィードバックデータに基づいて、上述した報酬(rt+1)を決定し、クリティック302に出力する。S408において、クリティック302は、アクターの方策を改善するための、上述した方策改善(例えばTD誤差)を算出して、アクター301に入力する。
S409において、アクター301は、S407における方策改善に基づいて方策π(s,a)を更新する。アクター301は、上述した方法で、例えば、p(s,a)をp(s,a)+βδで置き換えるように方策を更新する。S410のおいて、クリティック302は、状態価値関数V(s)を、上述した方法、例えばV(s)+αδ(αはステップサイズパラメータ)で置き換えて更新する。クリティック302が状態価値関数を更新すると、その後、本処理は終了する。本実施形態では、時刻tから時刻t+1における動作を選りに説明したが図4に示す一連の動作を繰り返して、所定の条件を満たした場合に一連の処理を終了するようにしてもよい。
以上説明したように、本実施形態では、ダンパの特性を制御するダンパ制御部106と、機械学習アルゴリズムの実行により特定された演算処理をフィードバックデータに適用し、ダンパ制御部106を制御するための制御変数を出力するモデル処理部214とを用いて、ダンパの特性を制御するようにした。このようにすることで、機械学習アルゴリズムを用いながらダンパの特性の制御を独立した応答性能と独立したロバスト性で行うことが可能になる。
<変形例>
上述の実施形態では、ダンパ制御部106では、予め定められたルールベースの演算処理を実行する例を説明した。しかし、例えば、単純なネットワークで構成され、制御変数を入力の一部とするニューラルネットワークであって、ネットワークの重みが学習後に固定され、予め十分に動作検証がなされた構成であれば、ルールベースの演算処理に代えてダンパ制御部106の演算に用いてもよい。すなわち、このようなニューラルネットワークであれば、ルールベースの演算処理のように高速動作が可能であり、安定した処理結果を得ることができる。
また、上述の実施形態では、フィードバックデータを一時記憶部216に一時的に記憶させ、データ入力部213が当該フィードバックデータを読み出すようにした。このようにすることで、本実施形態の強化学習はオンライン学習により内部パラメータが更新されるため、その場で素早く環境の変化に対応した学習が可能である。しかし、一時記憶部216に記憶させたフィードバックデータを、外部のサーバに送信し、外部サーバでバッチ処理を実施することによって、より学習を安定化させることもできる。バッチ処理において学習を行う場合、バッチ処理により更新された内部パラメータを外部サーバから受信してもよい。
更に、上述の実施形態では、情報処理装置200が車両100内に設置されている場合を例に説明した。しかし、情報処理装置200は、車両外(例えば外部サーバ)に設置され、車両100との間でフィードバックデータと制御変数を送受信するようにしてもよい。このように情報処理装置200とダンパ制御部106とが遠隔に配置されるようになったとしても、上述した実施形態は有効に動作することができる。すなわち、ダンパ制御部106の高応答性能が担保しつつ、機械学習アルゴリズムによる高次元な出力でダンパ制御部の制御を行うことができる。
<実施形態のまとめ>
1.上記実施形態のダンパ制御システム(例えば106、107、200)は、
車両(例えば100)のサスペンションに用いられるダンパ(例えば107)の特性を制御するダンパ制御手段(例えば107)と、
車両において計測された車両の挙動に関するフィードバックデータを受け付けて、機械学習アルゴリズムの実行により特定された演算処理をフィードバックデータに適用し、演算処理により得られた制御変数をダンパ制御手段に出力する処理手段(例えば213、214、215)と、を有し、
ダンパ制御手段は、ダンパ制御手段の内部で用いられている制御変数に基づいてダンパの特性を制御すると共に、内部で用いられている制御変数を、処理手段により出力された新たな制御変数に置き換える。
この実施形態によれば、機械学習アルゴリズムを用いながらダンパの特性の制御を独立した応答性能と独立したロバスト性で行うことが可能なダンパ制御システムを提供可能になる。
2.上記実施形態におけるダンパ制御システムでは、
ダンパ制御手段は、第1の動作周波数でダンパの特性を制御し、処理手段は、第1の動作周波数より小さい第2の動作周波数で制御変数をダンパ制御手段に出力する。
この実施形態によれば、ダンパ制御手段は処理手段よりも高速にダンパの特性を制御することが可能になる。
3.上記実施形態におけるダンパ制御システムでは、
ダンパ制御手段は、内部で用いられている制御変数に基づくダンパの特性の制御を、機械学習アルゴリズムの実行により特定された演算処理ではない予め定められたルールベースの演算処理により行う(例えば106)。
この実施形態によれば、ダンパ制御手段の低次元の制御を、ルールベースで記述するため、ダンパ制御手段の動作が安定し易く、動作を把握することができるになる。
4.上記実施形態におけるダンパ制御システムでは、
ダンパ制御手段は、置き換えられた新たな制御変数に基づいて得られたダンパの特性の制御量が許容可能な範囲であるとの判定に応じて、ダンパの特性を制御する(例えばS403、S404)。
この実施形態によれば、仮に、モデル処理部214からの制御変数に基づいて求めた制御量が異常値となる場合であっても、適切にその制御値を除外する、もしくは適切な値に修正して安全なダンパ制御を実現することができる。
5.上記実施形態におけるダンパ制御システムでは、
処理手段から出力された制御変数が許容可能な範囲であるかを判定し、該制御変数が許容可能な範囲であると判定した場合にのみ、処理手段から出力された制御変数をダンパ制御手段に入力する制御変数フィルタ手段(例えば215)を更に有する。
この実施形態によれば、仮に処理手段の出力が許容範囲を超える値を出力した場合であっても、ダンパ制御手段には許容範囲となる出力のみを提供することができる。
6.上記実施形態におけるダンパ制御システムでは、
フィードバックデータが許容可能な範囲であるかを判定し、該フィードバックデータが許容可能な範囲であると判定した場合にのみ、フィードバックデータを処理手段に入力するフィードバックデータフィルタ手段(例えば213、S406)を更に有する。
この実施形態によれば、処理処理における内部パラメータの更新(深層強化学習の場合には例えば方策や状態価値の更新)を許容可能なフィードバックデータの範囲で行うことができる。
7.上記実施形態におけるダンパ制御システムでは、
処理手段は、車両の挙動に関するフィードバックデータに基づいて算出される報酬又はペナルティを更に受け付けて、演算処理をフィードバックデータに適用する(例えば214、217)。
この実施形態によれば、フィードバックデータに基づく報酬又はペナルティにより処理手段の内部パラメータを更新するアルゴリズムを適用することが可能になる。
8.上記実施形態におけるダンパ制御システムでは、
機械学習アルゴリズムは、深層強化学習アルゴリズム(例えば図3)を含む。
この実施形態によれば、状況に応じた適応的で高次元な制御変数を出力させることができる。
9.上記実施形態におけるダンパ制御システムでは、
フィードバックデータは、車両のボディの挙動に関する計測データと、ダンパのストローク挙動に関する計測データと、車両の操舵角に関する計測データとに関するデータを含む。
この実施形態によれば、高次元なフィードバックデータを用いて総合的な状況を加味したダンパ制御を行うことができる。
10.上記実施形態におけるダンパ制御システムでは、
ダンパの特性は、ダンパの減衰力である。
この実施形態によれば、上記実施形態におけるダンパ制御処理をアクティブダンパの減衰力の制御に適用することができる。
11.上記実施形態におけるダンパ制御システムでは、
処理手段から出力される制御変数は、スカイフック理論に基づいてダンパの減衰力を決定するための制御変数である。
この実施形態によれば、上記実施形態におけるダンパ制御処理をスカイフック理論によりダンパを制御ことができる。
12.上記実施形態における車両は、
サスペンションに用いられるダンパと、
ダンパの特性を制御するダンパ制御手段と、
車両において計測された車両の挙動に関するフィードバックデータを受け付けて、機械学習アルゴリズムの実行により特定された演算処理をフィードバックデータに適用し、演算処理により得られた制御変数をダンパ制御手段に出力する処理手段と、を有し、
ダンパ制御手段は、ダンパ制御手段の内部で用いられている制御変数に基づいてダンパの特性を制御すると共に、内部で用いられている制御変数を、処理手段により出力された新たな制御変数に置き換える。
この実施形態によれば、機械学習アルゴリズムを用いながらダンパの特性の制御を独立した応答性能と独立したロバスト性で行うことが可能な車両を提供することができる。
13.上記実施形態における情報処理装置は、
車両のサスペンションに用いられるダンパの特性を制御するダンパ制御手段と共に用いられる情報処理装置であって、
車両において計測された車両の挙動に関するフィードバックデータを受け付けて、機械学習アルゴリズムの実行により特定された演算処理をフィードバックデータに適用し、演算処理により得られた制御変数をダンパ制御手段に出力する処理手段を有し、
ダンパ制御手段は、ダンパ制御手段の内部で用いられている制御変数に基づいてダンパの特性を制御すると共に、内部で用いられている制御変数を、処理手段により出力された新たな制御変数に置き換える
この実施形態によれば、機械学習アルゴリズムを用いながらダンパの特性の制御を独立した応答性能と独立したロバスト性で行うことが可能な情報処理装置が提供される。
14.上記実施形態におけるプログラムは、
コンピュータを、ダンパ制御システムの各手段として機能させるためのプログラムであって、ダンパ制御システムは、
車両のサスペンションに用いられるダンパの特性を制御するダンパ制御手段と、
車両において計測された車両の挙動に関するフィードバックデータを受け付けて、機械学習アルゴリズムの実行により特定された演算処理をフィードバックデータに適用し、演算処理により得られた制御変数をダンパ制御手段に出力する処理手段と、を有し、
ダンパ制御手段は、ダンパ制御手段の内部で用いられている制御変数に基づいてダンパの特性を制御すると共に、内部で用いられている制御変数を、処理手段により出力された新たな制御変数に置き換える。
この実施形態によれば、機械学習アルゴリズムを用いながらダンパの特性の制御を独立した応答性能と独立したロバスト性で行うことが可能なプログラムが提供される。
発明は上記の実施形態に制限されるものではなく、発明の要旨の範囲内で、種々の変形・変更が可能である。
213…データ入力部、214…モデル処理部、215…制御編集出力部、106…ダンパ制御部、107…ダンパ

Claims (17)

  1. ダンパ制御システムであって、
    車両のサスペンションに用いられるダンパの特性を制御するダンパ制御手段と、
    前記車両において計測された前記車両の挙動に関するフィードバックデータを受け付けて、機械学習アルゴリズムの実行により特定された演算処理を前記フィードバックデータに適用し、前記演算処理により得られた制御変数を前記ダンパ制御手段に出力する処理手段と、を有し、
    前記ダンパ制御手段は、前記ダンパ制御手段の内部で用いられている制御変数に基づいて前記ダンパの特性を制御すると共に、前記内部で用いられている前記制御変数を、前記処理手段により出力された新たな前記制御変数に置き換える、ことを特徴とするダンパ制御システム。
  2. 前記ダンパ制御手段は、第1の動作周波数で前記ダンパの特性を制御し、前記処理手段は、前記第1の動作周波数より小さい第2の動作周波数で前記制御変数を前記ダンパ制御手段に出力する、ことを特徴とする請求項1に記載のダンパ制御システム。
  3. 前記ダンパ制御手段は、前記内部で用いられている前記制御変数に基づく前記ダンパの特性の制御を、機械学習アルゴリズムの実行により特定された演算処理ではない予め定められたルールベースの演算処理により行う、ことを特徴とする請求項1または2に記載のダンパ制御システム。
  4. 前記ダンパ制御手段は、置き換えられた新たな前記制御変数に基づいて得られた前記ダンパの特性の制御量が許容可能な範囲であるとの判定に応じて、前記ダンパの特性を制御する、ことを特徴とする請求項1から3のいずれか1項に記載のダンパ制御システム。
  5. 前記処理手段から出力された前記制御変数が許容可能な範囲であるかを判定し、該制御変数が許容可能な範囲であると判定した場合にのみ、前記処理手段から出力された前記制御変数を前記ダンパ制御手段に入力する制御変数フィルタ手段を更に有する、ことを特徴とする請求項1から4のいずれか1項に記載のダンパ制御システム。
  6. 前記フィードバックデータが許容可能な範囲であるかを判定し、該フィードバックデータが許容可能な範囲であると判定した場合にのみ、前記フィードバックデータを前記処理手段に入力するフィードバックデータフィルタ手段を更に有する、ことを特徴とする請求項1から5のいずれか1項に記載のダンパ制御システム。
  7. 前記処理手段は、前記車両の挙動に関するフィードバックデータに基づいて算出される報酬又はペナルティを更に受け付けて、前記演算処理を前記フィードバックデータに適用する、ことを特徴とする請求項1から6のいずれか1項に記載のダンパ制御システム。
  8. 前記機械学習アルゴリズムは、深層強化学習アルゴリズムを含む、ことを特徴とする請求項7に記載のダンパ制御システム。
  9. 前記フィードバックデータは、前記車両のボディの挙動に関する計測データと、前記ダンパのストローク挙動に関する計測データと、前記車両の操舵角に関する計測データとに関するデータを含む、ことを特徴とする請求項1から8のいずれか1項に記載のダンパ制御システム。
  10. 前記ダンパの特性は、前記ダンパの減衰力である、ことを特徴とする請求項1から9のいずれか1項に記載のダンパ制御システム。
  11. 前記処理手段から出力される前記制御変数は、スカイフック理論に基づいて前記ダンパの減衰力を決定するための制御変数である、ことを特徴とする請求項10に記載のダンパ制御システム。
  12. 車両であって、
    サスペンションに用いられるダンパと、
    前記ダンパの特性を制御するダンパ制御手段と、
    前記車両において計測された前記車両の挙動に関するフィードバックデータを受け付けて、機械学習アルゴリズムの実行により特定された演算処理を前記フィードバックデータに適用し、前記演算処理により得られた制御変数を前記ダンパ制御手段に出力する処理手段と、を有し、
    前記ダンパ制御手段は、前記ダンパ制御手段の内部で用いられている制御変数に基づいて前記ダンパの特性を制御すると共に、前記内部で用いられている前記制御変数を、前記処理手段により出力された新たな前記制御変数に置き換える、ことを特徴とする車両。
  13. 車両のサスペンションに用いられるダンパの特性を制御するダンパ制御手段と共に用いられる情報処理装置であって、
    前記車両において計測された前記車両の挙動に関するフィードバックデータを受け付けて、機械学習アルゴリズムの実行により特定された演算処理を前記フィードバックデータに適用し、前記演算処理により得られた制御変数を前記ダンパ制御手段に出力する処理手段を有し、
    前記ダンパ制御手段は、前記ダンパ制御手段の内部で用いられている制御変数に基づいて前記ダンパの特性を制御すると共に、前記内部で用いられている前記制御変数を、前記処理手段により出力された新たな前記制御変数に置き換える、ことを特徴とする情報処理装置。
  14. 車両のサスペンションに用いられるダンパの特性を制御するダンパ制御手段と処理手段とを有するダンパ制御システムの制御方法であって、
    前記処理手段が、前記車両において計測された前記車両の挙動に関するフィードバックデータを受け付けて、機械学習アルゴリズムの実行により特定された演算処理を前記フィードバックデータに適用し、前記演算処理により得られた制御変数を前記ダンパ制御手段に出力する処理工程と、
    前記ダンパ制御手段が、前記ダンパ制御手段の内部で用いられている前記制御変数を、前記処理工程において出力された新たな前記制御変数に置き換えて、前記内部で用いられている制御変数に基づいて前記ダンパの特性を制御するダンパ制御工程と、を有することを特徴とするダンパ制御システムの制御方法。
  15. サスペンションに用いられるダンパと、前記ダンパの特性を制御するダンパ制御手段と、処理手段とを有する車両の制御方法であって、
    前記処理手段が、前記車両において計測された前記車両の挙動に関するフィードバックデータを受け付けて、機械学習アルゴリズムの実行により特定された演算処理を前記フィードバックデータに適用し、前記演算処理により得られた制御変数を前記ダンパ制御手段に出力する処理工程と、
    前記ダンパ制御手段が、前記ダンパ制御手段の内部で用いられている前記制御変数を、前記処理工程において出力された新たな前記制御変数に置き換えて、前記内部で用いられている制御変数に基づいて前記ダンパの特性を制御するダンパ制御工程と、を有することを特徴とする車両の制御方法。
  16. 車両のサスペンションに用いられるダンパの特性を制御するダンパ制御手段と共に用いられる情報処理装置の制御方法であって、
    前記車両において計測された前記車両の挙動に関するフィードバックデータを受け付けて、機械学習アルゴリズムの実行により特定された演算処理を前記フィードバックデータに適用し、前記演算処理により得られた制御変数を前記ダンパ制御手段に出力する処理工程を有し、
    前記ダンパ制御手段は、前記ダンパ制御手段の内部で用いられている制御変数に基づいて前記ダンパの特性を制御すると共に、前記内部で用いられている前記制御変数を、前記処理工程において出力された新たな前記制御変数に置き換える、ことを特徴とする情報処理装置の制御方法。
  17. コンピュータを、ダンパ制御システムの各手段として機能させるためのプログラムであって、前記ダンパ制御システムは、
    車両のサスペンションに用いられるダンパの特性を制御するダンパ制御手段と、
    前記車両において計測された前記車両の挙動に関するフィードバックデータを受け付けて、機械学習アルゴリズムの実行により特定された演算処理を前記フィードバックデータに適用し、前記演算処理により得られた制御変数を前記ダンパ制御手段に出力する処理手段と、を有し、
    前記ダンパ制御手段は、前記ダンパ制御手段の内部で用いられている制御変数に基づいて前記ダンパの特性を制御すると共に、前記内部で用いられている前記制御変数を、前記処理手段により出力された新たな前記制御変数に置き換える、ことを特徴とするプログラム。
JP2019134773A 2019-07-22 2019-07-22 ダンパ制御システム、車両、情報処理装置およびそれらの制御方法、ならびにプログラム Pending JP2021017168A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2019134773A JP2021017168A (ja) 2019-07-22 2019-07-22 ダンパ制御システム、車両、情報処理装置およびそれらの制御方法、ならびにプログラム
US16/928,390 US20210023905A1 (en) 2019-07-22 2020-07-14 Damper control system, vehicle, information processing apparatus and control method thereof, and storage medium
CN202010691111.7A CN112277558A (zh) 2019-07-22 2020-07-17 减振器控制系统、车辆、信息处理装置及它们的控制方法以及记录介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019134773A JP2021017168A (ja) 2019-07-22 2019-07-22 ダンパ制御システム、車両、情報処理装置およびそれらの制御方法、ならびにプログラム

Publications (1)

Publication Number Publication Date
JP2021017168A true JP2021017168A (ja) 2021-02-15

Family

ID=74187582

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019134773A Pending JP2021017168A (ja) 2019-07-22 2019-07-22 ダンパ制御システム、車両、情報処理装置およびそれらの制御方法、ならびにプログラム

Country Status (3)

Country Link
US (1) US20210023905A1 (ja)
JP (1) JP2021017168A (ja)
CN (1) CN112277558A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022239619A1 (ja) * 2021-05-11 2022-11-17 日立Astemo株式会社 サスペンション制御装置、およびサスペンション制御方法

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113119952B (zh) * 2021-05-31 2023-06-02 周宇 实时车辆稳定系统及其方法
CN113232566B (zh) * 2021-07-01 2023-06-20 周宇 Ai电磁瞬控主动防震座椅及其方法
CN113759715A (zh) * 2021-08-11 2021-12-07 中国船舶重工集团公司第七一九研究所 一种具有强化学习功能的舰船设备智能振动控制系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09216509A (ja) * 1996-02-14 1997-08-19 Toyota Motor Corp 車輌のサスペンション制御方法
JP2003104024A (ja) * 2001-09-28 2003-04-09 Tokico Ltd サスペンション制御装置
JP2016068677A (ja) * 2014-09-29 2016-05-09 株式会社ショーワ 電動パワーステアリング装置
WO2018142700A1 (ja) * 2017-02-02 2018-08-09 日本電信電話株式会社 制御装置、制御方法、及びプログラム
JP2018178900A (ja) * 2017-04-18 2018-11-15 株式会社日立製作所 風力発電システム
JP2019032659A (ja) * 2017-08-07 2019-02-28 株式会社東芝 運転計画システム、運転計画装置および運転計画方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6366841B1 (en) * 1999-04-20 2002-04-02 Toyota Jidosha Kabushiki Kaisha Damping force control device and method
JP5941886B2 (ja) * 2013-08-30 2016-06-29 本田技研工業株式会社 サスペンション制御装置
US10065654B2 (en) * 2016-07-08 2018-09-04 Toyota Motor Engineering & Manufacturing North America, Inc. Online learning and vehicle control method based on reinforcement learning without active exploration
CN107825930B (zh) * 2017-12-08 2019-01-25 吉林大学 一种用于车辆悬架系统的智能模糊混合棚半主动控制方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09216509A (ja) * 1996-02-14 1997-08-19 Toyota Motor Corp 車輌のサスペンション制御方法
JP2003104024A (ja) * 2001-09-28 2003-04-09 Tokico Ltd サスペンション制御装置
JP2016068677A (ja) * 2014-09-29 2016-05-09 株式会社ショーワ 電動パワーステアリング装置
WO2018142700A1 (ja) * 2017-02-02 2018-08-09 日本電信電話株式会社 制御装置、制御方法、及びプログラム
JP2018178900A (ja) * 2017-04-18 2018-11-15 株式会社日立製作所 風力発電システム
JP2019032659A (ja) * 2017-08-07 2019-02-28 株式会社東芝 運転計画システム、運転計画装置および運転計画方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022239619A1 (ja) * 2021-05-11 2022-11-17 日立Astemo株式会社 サスペンション制御装置、およびサスペンション制御方法

Also Published As

Publication number Publication date
US20210023905A1 (en) 2021-01-28
CN112277558A (zh) 2021-01-29

Similar Documents

Publication Publication Date Title
JP2021017168A (ja) ダンパ制御システム、車両、情報処理装置およびそれらの制御方法、ならびにプログラム
CN112805198B (zh) 用于自主驾驶的个人驾驶风格学习
CN104859650B (zh) 一种多时间尺度的车辆横摆稳定性滚动优化控制方法
CN110654195A (zh) 车辆、车辆悬架系统及其调节方法、装置
US20170151618A1 (en) Simulation apparatus of wire electric discharge machine having function of determining welding positions of core using machine learning
Soleymani et al. Adaptive fuzzy controller for vehicle active suspension system based on traffic conditions
CN112382165B (zh) 驾驶策略生成方法、装置、介质、设备及仿真系统
KR20220116319A (ko) 지능형 차량 제어 방법, 장치 및 제어 시스템
CN110321665A (zh) 车辆悬架系统的控制方法、装置、设备、介质及车辆
CN110879595A (zh) 一种基于深度强化学习的无人矿卡循迹控制系统及方法
US11579574B2 (en) Control customization system, control customization method, and control customization program
US20210333764A1 (en) Electronic control device and neural network update system
Ozcan et al. Optimisation of Nonlinear Spring and Damper Characteristics for Vehicle Ride and Handling Improvement
KR102654627B1 (ko) 차량 제어 장치, 차량 제어 방법 및 차량 제어 시스템
Sherif et al. Optimal control of lane keeping system using simulated annealing and linear quadratic regulator
JP7357537B2 (ja) 制御装置、制御装置の制御方法、プログラム、情報処理サーバ、情報処理方法、並びに制御システム
Qamar et al. Online adaptive full car active suspension control using b-spline fuzzy-neural network
EP4082860A2 (en) Advanced control framework for automotive systems
Khan et al. Online adaptive neuro-fuzzy based full car suspension control strategy
Zhou et al. Research on Control Mode Switching of Vehicle Intelligent Suspension Based on DBN and T–S Fuzzy Method
Wu et al. Real-time adaptive cruise control strategy based on linear variable parameter/H∞ control
Prunean et al. The influence of the suspension system on the energy efficiency of an autonomous public transport vehicle.
WO2023156017A1 (en) Method and device for controlling a technical system in real time
CN117962538A (zh) 预瞄式半主动悬架的控制方法、装置、设备及存储介质
CN116513219A (zh) 一种车辆自适应控制方法、系统、存储介质及车辆

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20210103

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210125

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211126

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220714

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220801

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220927

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221031

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230421