JP2020066400A - 操舵装置及び操舵システム - Google Patents

操舵装置及び操舵システム Download PDF

Info

Publication number
JP2020066400A
JP2020066400A JP2018202042A JP2018202042A JP2020066400A JP 2020066400 A JP2020066400 A JP 2020066400A JP 2018202042 A JP2018202042 A JP 2018202042A JP 2018202042 A JP2018202042 A JP 2018202042A JP 2020066400 A JP2020066400 A JP 2020066400A
Authority
JP
Japan
Prior art keywords
steering
amount
learning
information
torque
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018202042A
Other languages
English (en)
Other versions
JP7230431B2 (ja
Inventor
敏明 應矢
Toshiaki Oya
敏明 應矢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JTEKT Corp
Original Assignee
JTEKT Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JTEKT Corp filed Critical JTEKT Corp
Priority to JP2018202042A priority Critical patent/JP7230431B2/ja
Publication of JP2020066400A publication Critical patent/JP2020066400A/ja
Application granted granted Critical
Publication of JP7230431B2 publication Critical patent/JP7230431B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Steering Control In Accordance With Driving Conditions (AREA)

Abstract

【課題】様々な状況に対して適切にアシストトルク又は操舵反力を決定することができる操舵装置等を提供する。【解決手段】操舵機構10の動作に応じて、操舵機構10にアシスト力を付与する、又は、操舵機構10に操舵反力を与える動力源と、動力源を制御する制御装置35と、を備え、制御装置35は、操舵角、操舵角速度、操舵角加速度、操舵トルク、転舵角、転舵トルク、転舵アクチュエータの電流、車速、アクセル開度、ブレーキ、ヨーレート、横加速度、気温、ワイパー、及びヘッドライトの情報の内の少なくとも1つの情報を取得する取得部351と、少なくとも1つの情報をニューラルネットワークへ入力して動力源の制御量を決定する決定部353と、を備える。【選択図】図1

Description

本発明は、操舵装置及び操舵システムに関する。
電動パワーステアリング(EPS)では、例えば操舵トルク及び車速等に基づいてアシストトルクが決定される。例えば、操舵トルクとアシストトルクとの関係を示すアシスト特性を用いてアシストトルクが決定される。
また、操舵機構と転舵機構とが機械的に分離されたステアバイワイヤ(SBW)では、例えば操舵角及び車速等に基づいて操舵反力が決定される。例えば、操舵角及び車速等と操舵反力との関係を示す関数又はマップで定義された反力特性を用いて操舵反力が決定される。
特許文献1及び2では、ファジィ推論を用いることで、適切なアシストトルクを決定している。
特開2015−31600号公報 特開2017−201288号公報
しかしながら、上記従来技術だけでは、様々な状況に対して適切にアシストトルク又は操舵反力を決定することが難しい。
そこで、本発明は、様々な状況に対して適切にアシストトルク又は操舵反力を決定することができる操舵装置等を提供する。
本発明の一態様に係る操舵装置は、操舵機構の動作に応じて、前記操舵機構にアシスト力を付与する、又は、前記操舵機構に操舵反力を与える動力源と、前記動力源を制御する制御装置と、を備え、前記制御装置は、操舵角、操舵角速度、操舵角加速度、操舵トルク、転舵角、転舵トルク、転舵アクチュエータの電流、車速、アクセル開度、ブレーキ、ヨーレート、横加速度、気温、ワイパー、及びヘッドライトの情報の内の少なくとも1つの情報を取得する取得部と、前記少なくとも1つの情報をニューラルネットワークへ入力して前記動力源の制御量を決定する決定部と、を備える。
本発明の一態様に係る操舵装置は、様々な状況に対して適切にアシストトルク又は操舵反力を決定することができる。
実施の形態1に係る操舵装置の概略図 実施の形態1に係る制御装置の機能ブロック図 実施の形態1におけるニューラルネットワークの概念図 実施の形態1に係る制御装置の動作を示すフローチャート 実施の形態2に係る操舵システムの機能ブロック図
以下、実施の形態について、図面を参照しながら具体的に説明する。
なお、以下で説明する実施の形態は、いずれも包括的又は具体的な例を示すものである。以下の実施の形態で示される数値、形状、材料、構成要素、並びに、構成要素の配置位置及び接続形態などは、一例であり、請求の範囲を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。また、各図は、必ずしも厳密に図示したものではない。各図において、実質的に同一の構成については同一の符号を付し、重複する説明は省略又は簡略化する。
(実施の形態1)
以下に、実施の形態1に係る操舵装置について説明する。ここでは、操舵装置が電動パワーステアリング装置である場合について説明する。
[操舵装置の構成]
図1は、実施の形態1に係る操舵装置1の概略図である。操舵装置1は、操舵機構10、転舵機構20、アシスト機構30、制御装置35、1以上のセンサ40を備える。操舵装置1のアシスト型式は、デュアルピニオンアシスト型である。
操舵機構10は、コラムシャフト11、インターミディエイトシャフト12、及び、ピニオンシャフト13を有している。コラムシャフト11の入力側部分は、操舵部材2に接続されている。インターミディエイトシャフト12の入力側部分は、コラムシャフト11の出力側部分に接続されている。
ピニオンシャフト13の入力側部分は、インターミディエイトシャフト12の出力側部分に接続されている。ピニオンシャフト13の出力側部分には、ピニオン歯13Dが形成されている。
転舵機構20は、ラックシャフト21及びラックハウジング22を有している。ラックシャフト21には、第1ラック歯21A及び第2ラック歯21Bが形成されている。第1ラック歯21A及びピニオン歯13Dは、互いに噛み合わせられている。第1ラック歯21A及びピニオン歯13Dは、ラックアンドピニオン機構23を構成している。
転舵機構20は、コラムシャフト11、インターミディエイトシャフト12、及び、ピニオンシャフト13の回転によりラックシャフト21を直線運動させ、タイロッド24を介して転舵輪3を転舵させる。
アシスト機構30は、アシストモータ31、ピニオンシャフト32、ウォームシャフト33、ウォームホイール34、及び、制御装置35を有している。アシストモータ31は、操舵機構10の動作に応じて操舵機構10にアシスト力を付与する動力源の一例である。ウォームシャフト33は、アシストモータ31の出力軸に連結されている。ウォームホイール34は、ピニオンシャフト32に外嵌されている。ピニオンシャフト32には、ピニオン歯32Aが形成されている。第2ラック歯21B及びピニオン歯32Aは、互いに噛み合わせられている。第2ラック歯21B及びピニオン歯32Aは、ラックアンドピニオン機構25を構成している。
1以上のセンサ40の各々は、操舵角、操舵角速度、操舵角加速度、操舵トルク、転舵角、転舵トルク、転舵アクチュエータの電流、車速、アクセル開度、ブレーキ情報、ヨーレート、横加速度、気温、ワイパー、及びヘッドライトの情報の内の少なくとも1つの情報に関する信号を出力する。例えば、1以上のセンサ40のうちの1つは、操舵トルクを検出するためのトルクセンサであり、ピニオンシャフト13の捩れ量に応じた信号を制御装置35に出力する。
制御装置35は、アシストモータ31を制御する。つまり、制御装置35は、ニューラルネットワークを用いてアシストモータ31の制御量を決定する。アシストモータ31の制御量とは、アシストモータ31の出力の大きさに対応する物理量である。具体的には、アシストモータ31の制御量は、例えば、アシストモータ31に供給するアシスト電流、及び、アシストモータ31に生じさせるアシストトルクなどである。
[制御装置の構成]
図2及び図3を参照しながら、制御装置35の機能構成について説明する。図2は、実施の形態1に係る制御装置35の機能ブロック図である。
制御装置35は、取得部351と、記憶部352と、決定部353と、学習部354と、を備える。制御装置35は、専用の電子回路によって実現される。専用の電子回路は、1個のチップ上に集積されてもよいし、複数のチップ上に形成されてもよい。また、制御装置35は、プロセッサと、ソフトウェアプログラム又はインストラクションが格納されたメモリとによって実現されてもよい。この場合、ソフトウェアプログラム又はインストラクションが実行されたときに、プロセッサは、取得部351、決定部353及び学習部354として機能する。
取得部351は、操舵角、操舵角速度、操舵角加速度、操舵トルク、転舵角、転舵トルク、転舵アクチュエータの電流、車速、アクセル開度、ブレーキ情報、ヨーレート、横加速度、気温、ワイパー、及びヘッドライトの情報の内の少なくとも1つの情報を取得する。具体的には、取得部351は、1以上のセンサ40の出力信号に基づいて情報を経時的に取得する。例えば、取得部351は、1ms間隔で情報を取得する。
記憶部352は、取得部351によって経時的に取得された情報を格納する。
決定部353は、少なくとも1つの情報をニューラルネットワークへの入力として用いてアシストモータ31の制御量を決定する。ここでは、ニューラルネットワークは、人工ニューラルネットワークを意味し、アシストモータ31の制御量を決定するためのシミュレーションモデルである。具体的には、ニューラルネットワークとしては、例えばDQN(Deep Q−Network)又はDDQN(Double DQN)を用いることができる。
図3は、実施の形態1におけるニューラルネットワークの概念図である。図3では、入力データが入力ノードに入力され、出力ノードからQ値が出力される。出力ノードには、アクチュエータ目標電流値の変化量△Iが対応付けられている。なお、ここでは、図示及び説明を簡略化するために2層のニューラルネットワークについて説明したが、本実施の形態におけるニューラルネットワークの階層数は、これに限定されない。また、出力ノードの数も3つに限定されない。
学習部354は、操舵角あるいは操舵トルクの周波数特性における第1所定周波数以上の高周波成分量に基づいて報酬を算出し、算出された報酬を用いてニューラルネットワークの強化学習を行う。第1所定周波数は、経験的あるいは実験的に予め定められればよい。例えば、第1所定周波数としては、安定的な操舵において発生することが予想される周波数成分の上限周波数を用いることができる。人間の通常の操舵では1Hz以下の周波数成分が想定されるので、第1所定周波数としては、1Hzより大きい周波数(例えば50Hz等)を用いることができる。
学習部354は、高周波成分量が第1の量である場合に当該第1の量に対応する第1の報酬を算出する。また、学習部354は、高周波成分量が第1の量よりも大きい第2の量である場合に、当該第2の量に対応する第2の報酬であって第1の報酬よりも低い第2の報酬を算出する。例えば、報酬は、高周波成分量が増加するほど減少する。なお、報酬は、高周波成分量が増加したときに増加しなければよく、必ずしも減少しなくてもよい。
また、高周波成分量にノイズの混入が想定される場合には、人間の操舵では発生しえない高周波成分量を報酬の算出から除外してもよい。例えば、学習部354は、高周波成分量として、操舵角あるいは操舵トルクの周波数特性における第1所定周波数以上第2所定周波数未満の特定周波数帯域の成分量を用いてもよい。第2所定周波数は、経験的あるいは実験的に予め定められればよい。例えば、第2所定周波数としては、人間の操舵において発生し得る周波数成分の上限周波数を用いることができる。具体的には、第2周波数としては、例えば10Hzを用いることできる。
[操舵装置の処理]
次に、以上のように構成された制御装置35の処理について図4を参照しながら説明する。図4は、実施の形態1に係る制御装置35の処理を示すフローチャートである。
以下の説明及び図4で使用する記号の定義は以下のとおりである。
t:制御周期を単位とする制御上の時刻を表すパラメータ
Rt:tの時刻の報酬
St:tの時刻の状態変数(舵角、操舵トルクなど)
Qm:メインQニューラルネットワークの出力値(注:周波数解析用のサンプルの数のmとは無関係)
Qt:ターゲットQニューラルネットワークの出力値
f1:パーシャルオーバーオール(POA)の下限周波数
f2:POAの上限周波数
a:選択したアクション(例えば、Qm(St,at)は、tの時刻の状態Stで幾つかあるQm値のうち、aというアクションを選択したときのQm値を表す。)
制御装置35は、まずカウンタiを0に初期化する(S102)。
取得部351は、状態Stを観測する(S104)。つまり、取得部351は、操舵角、操舵角速度、操舵角加速度、操舵トルク、転舵角、転舵トルク、転舵アクチュエータの電流、車速、アクセル開度、ブレーキ情報、ヨーレート、横加速度、気温、ワイパー、及びヘッドライトの情報の内の少なくとも1つの情報を取得する。
決定部353は、メインQネットワークQmと状態Stとを用いてアクチュエータ目標電流の変化量△Itを算出する(S106)。具体的には、決定部353は、StをQmに入力して算出されるQ値に基づいて目標電流の変化量△Itを決定する。例えば、決定部353は、最も大きいQ値の出力に対応する目標電流変化量を△Itと決定する。
制御装置35は、アクチュエータ目標電流にI=I+△Iを入力する(S108)。つまり、制御装置35は、アクチュエータ目標電流を前の目標電流に変化量△Iだけ加算した電流を現在の目標電流に設定することでアシストモータ31を制御する。
その後、取得部351は、状態St+1を観測する(S110)。つまり、取得部351は、アシストモータ31の制御後に状態を観測する。具体的には、取得部351は、操舵角、操舵角速度、操舵角加速度、操舵トルク、転舵角、転舵トルク、転舵アクチュエータの電流、車速、アクセル開度、ブレーキ情報、ヨーレート、横加速度、気温、ワイパー、及びヘッドライトの情報の内の少なくとも1つの情報を取得する。
学習部354は、操舵角θ(t〜t−(m−1))を周波数解析し、高周波数帯域f1〜f2Hzにおけるパーシャルオーバーオール(POA)値を計算する(S112)。ここで、mは周波数解析用のサンプル数を表す。f1は、第1所定周波数の一例であり、POAの下限周波数を表す。f2は、第2所定周波数の一例であり、POAの上限周波数を表す。
学習部354は、POA値の大中小を判定する(S114)。例えば、学習部354は、POA値が第1閾値未満である場合にPOA値を小と判定し、POA値が第1閾値以上第2閾値未満である場合にPOA値を中と判定し、POA値が第2閾値以上である場合にPOA値を大と判定する。
ここで、POA値が小の場合(S114のS)、学習部354は、報酬Rt+1を「1」と決定する(S116)。POA値が中の場合(S114のM)、学習部354は、報酬Rt+1を「0」と決定する(S118)。POA値が大の場合(S114のL)、学習部354は、報酬Rt+1を「−1」と決定する(S120)。
学習部354は、St、△It、St+1、及びRt+1をリングバッファ(記憶部352)に記録する(S122)。学習部354は、i%nが0であるか否かを判定する(S124)。ここで、%は、剰余を与える演算子であり、modと記載されることもある。つまり、学習部354は、iがnで割り切れるか否かを判定する。ここで、nは、Qmを更新する周期を表す。
ここで、i%nが0である場合(S124のY)、学習部354は、t〜t−(m−1)に対する損失関数R+γQt(St+1,am)−Qm(St,at)をHuber関数で最小化する(S126)。ここで、amは、Qm(St+1,a)が最大となるa値である。また、γは、割引率であり、0以上1以下の定数である。そして、学習部354は、Qmを更新する(S128)。ステップS126及びステップS128により、Qmの強化学習が行われる。一方、i%nが0でない場合(S124のN)、ステップS126及びステップS128がスキップされる。
次に、学習部354は、iをインクリメントし、インクリメントされたiがimax以上であるか否かを判定する(S130)。imaxは、ターゲットQネットワークQtを更新する周期を表す。
ここで、インクリメントされたiがimax以上である場合(S130のY)、学習部354は、QtをQmで置き換える(S132)。さらに、学習部354は、iを0に初期化して(S134)、ステップS106に戻る。
一方、インクリメントされたiがimax未満である場合(S130のN)、ステップS132及びステップS134がスキップされ、ステップS106に戻る。
なお、周波数解析におけるサンプル数を考慮して、状態St+1には、可能な限り、過去m回のデータが含まれることが好ましい。
[効果等]
以上のように、本実施の形態に係る操舵装置1によれば、少なくとも1つの情報をニューラルネットワークへ入力してアシストモータ31の制御量を決定することができる。したがって、機械学習により様々な状況に対して適切にアシストトルクを決定することができる。その結果、過剰アシストによる過剰な操舵及び/又はアシスト不足による操舵不足が抑制され、快適性の向上のみならず、走行時のライン取りの精度向上による安全性向上にも貢献することができる。
また、本実施の形態に係る操舵装置1によれば、操舵角あるいは操舵トルクの周波数特性における第1所定周波数以上の高周波成分量に基づく報酬を用いて、ニューラルネットワークの強化学習を行うことができる。操舵アシストの根本的な目的は、必要な旋回を無駄なく、無理なく実現することである。つまり、ヨーレートの変化の過程も含めて、極力微調整なく旋回が得られる状態を提供することである。微調整は、アシストの過不足に起因して発生し、操舵角あるいは操舵トルクの高周波成分として現れる。したがって、高周波成分量に基づく報酬を用いて強化学習を行うことで、ニューラルネットワークの学習効果を向上させることができる。さらに、実際に操舵者が操舵装置を操舵して得られた情報を用いて学習することができるので、操舵者及び操舵装置の組み合わせに適した操舵アシストを実現することができる。
特に、本実施の形態に係る操舵装置1によれば、高周波成分量が第1の量である場合に、第1の量に対応する第1の報酬を用いて強化学習を行い、高周波成分量が第1の量よりも大きい第2の量である場合に、第2の量に対応する第2の報酬であって第1の報酬よりも低い第2の報酬を用いて強化学習を行うことができる。したがって、高周波成分量が小さい場合に高い報酬を与えることができ、滑らかな操舵を実現するための強化学習が可能となる。
また、本実施の形態に係る操舵装置1によれば、第1所定周波数以上第2所定周波数未満の特定周波数帯域の成分量を高周波成分量として用いることができる。これにより、ノイズ等による高周波成分をカットすることができ、ノイズ等の影響を報酬から低減することができる。
(実施の形態2)
次に、実施の形態2について説明する。本実施の形態では、サーバ装置で強化学習が行われる点が上記実施の形態1と主として異なる。以下に、実施の形態1と異なる点を中心に本実施の形態について説明する。
[操舵システムの構成]
図5は、実施の形態2に係る操舵システム100の機能ブロック図である。操舵システム100は、操舵装置1Aと、サーバ装置200とを備える。
操舵装置1Aは、操舵機構10、転舵機構20、アシスト機構30、制御装置35A、1以上のセンサ40を備える。
制御装置35Aは、学習部354の代わりに通信部355を備える。通信部355は、記憶部352に格納された操舵角、操舵角速度、操舵角加速度、操舵トルク、転舵角、転舵トルク、転舵アクチュエータの電流、車速、アクセル開度、ブレーキ情報、ヨーレート、横加速度、気温、ワイパー、及びヘッドライトの情報の内の少なくとも1つの情報を通信ネットワーク等を介してサーバ装置200に送信する。さらに、通信部355は、通信ネットワーク等を介して、サーバ装置200から学習結果を受信する。学習結果とは、強化学習によって更新されたニューラルネットワークのパラメータである。
サーバ装置200は、通信部201と、記憶部202と、学習部203と、を備える。
通信部201は、操舵装置1Aの制御装置35Aから情報を受信する。さらに、通信部201は、学習部203による学習結果を操舵装置1Aの制御装置35Aへ送信する。
記憶部202は、通信部201が受信した情報を格納する。
学習部203は、記憶部202に格納された情報に基づいて、実施の形態1の学習部354と同様に、ニューラルネットワークの強化学習を行う。
[操舵システムの処理]
次に、操舵システム100の処理について説明する。本実施の形態に係る操舵システム100の処理は、基本的に図4と同様であるので、図示を省略し、説明を簡略化する。なお、本実施の形態では、実施の形態1に係る操舵装置1の制御装置35の学習部354で行われていた処理が、サーバ装置200の学習部203で行われる。つまり、本実施の形態では、強化学習がサーバ装置で行われる点が、実施の形態1と異なる。
具体的には、本実施の形態に係る操舵装置1Aは、ステップS102〜ステップS122までを実行する。その後、ステップS106に戻る。また、所定のタイミングで記憶部352に格納された情報をサーバ装置200に送信する。所定のタイミングは、例えば、車両の点火装置がオフされたタイミング、又は、一定周期等に基づいて決定されればよく、特に限定されない。
サーバ装置200は、受信した情報に基づいて、ステップS124〜ステップS134を実行し、更新されたQmを操舵装置1Aに送信する。操舵装置1Aは、更新されたQmを受信した場合は、更新されたQmを用いて△Itを算出する。
[効果等]
以上のように、本実施の形態に係る操舵システム100によれば、サーバ装置200において強化学習を行うことができ、操舵装置1Aの処理負荷を低減することができる。
なお、本実施の形態において、周波数解析及び報酬の判定は、操舵装置1Aで行われていたが、これに限定されない。例えば、周波数解析及び報酬の判定は、サーバ装置200で行われてもよい。
(他の実施の形態)
以上、本発明の1つ又は複数の態様に係る操舵装置及び操舵システムについて、実施の形態に基づいて説明したが、本発明は、この実施の形態に限定されるものではない。本発明の趣旨を逸脱しない限り、当業者が思いつく各種変形を本実施の形態に施したものや、異なる実施の形態における構成要素を組み合わせて構築される形態も、本発明の1つ又は複数の態様の範囲内に含まれてもよい。
例えば、上記各実施の形態において、操舵装置は、ピニオンアシスト型の電動パワーステアリングであったが、これに限定されない。例えば、操舵装置は、コラムアシスト型又はラックアシスト型の電動パワーステアリングであってもよい。また、操舵装置は、ステアバイワイヤであってもよい。この場合、操舵装置において、操舵機構と転舵機構とは機械的に分離され、反力モータを備える。そして、制御装置は、ニューラルネットワークを用いて反力モータを制御する。
なお、上記各実施の形態において、報酬として、「1」、「0」及び「−1」の3段階の値が用いられたが、これに限定されない。報酬として、2段階又は4段階以上の値が用いられてもよい。また、報酬として、連続的な値が用いられてもよい。この場合、報酬値は、例えば、高周波成分のPOA値に反比例してもよい。
なお、上記各実施の形態において、高周波成分量として、POA値が用いられていたが、これに限定されない。例えば、第1所定周波数以上第2所定周波数未満の特定周波数帯域に含まれる低周波区間のPOA値と高周波区間のPOA値との比率が用いられてもよい。これにより、これによれば、周波数成分の絶対量ではなく相対量を用いて報酬を設定することができる。これによれば、例えば小刻みなハンドル操作が多い操舵者であっても、適切に報酬を設定することができ、より操舵者に適したアシストが可能となる。
また、POA値は重み付けされてもよい。例えば、周波数区間ごとに重み係数を用いてPOA値を重み付けしてもよい。具体的には、第1周波数区間の第1POA値を第1重み係数を用いて重み付けし、第1周波数区間よりも高い第2周波数区間の第2POA値を第1重み係数よりも大きい第2重み係数を用いて重み付けしてもよい。これにより、より高い周波数成分の報酬への影響を増加させることができ、より不安定な操舵ほど報酬を減らすことができる。
なお、上記各実施の形態では、ニューラルネットワークの強化学習として、DQNアルゴリズムが用いられていたが、これに限られない。例えば、SARSA(State−Action−Reward−State−Action)学習、TD(Temporal Difference)学習、GORILA(General Reinforcement Learning Architecture)、A3C(Asynchronous Advantage Actor−Critic)、及びA2Cなどが用いられてもよい。
なお、上記実施の形態1では、アシストモータの制御とニューラルネットワークの強化学習とが連続的に行われていたが、これに限定されない。例えば、強化学習は、オフライン学習であってもよい。具体的には、強化学習は、例えば車両の点火装置がオフの時に行われてもよい。これにより、強化学習と運転時の他の制御との負荷の競合を回避することができる。
なお、上記各実施の形態では、1つの車両に関する情報に基づいて、ニューラルネットワークの強化学習が行われていたが、これに限定されない。例えば、サーバ装置の学習部は、対象車両の操舵装置から受信した情報に加えて、他の車両の操舵装置から受信した情報を用いて、ニューラルネットワークの強化学習を行ってもよい。これにより、より学習効率を向上させることができる。例えば、同一地域を走行する車両から受信した情報を用いることで、地域に適したアシストを実現することができる。
なお、上記各実施の形態では、最も高いQ値を有する出力ノードに対応する制御量が利用されていたが、これに限られない。例えば、ε−greedy法を用いて出力ノードに対応する制御量が利用されてもよい。これにより、さらに学習効果を高めることができる。
本発明は、電動パワーステアリングにおけるアシストモータの制御又はステアバイワイヤにおける反力モータの制御に利用することができる。
1、1A…操舵装置、2…操舵部材、3…転舵輪、10…操舵機構、11…コラムシャフト、12…インターミディエイトシャフト、13、32…ピニオンシャフト、13D、32A…ピニオン歯、20…転舵機構、21…ラックシャフト、21A…第1ラック歯、21B…第2ラック歯、22…ラックハウジング、23、25…ラックアンドピニオン機構、24…タイロッド、30…アシスト機構、31…アシストモータ、33…ウォームシャフト、34…ウォームホイール、35、35A…制御装置、40…1以上のセンサ、100…操舵システム、200…サーバ装置、201、355…通信部、202、352…記憶部、203、354…学習部、351…取得部、353…決定部

Claims (10)

  1. 操舵機構の動作に応じて、前記操舵機構にアシスト力を付与する、又は、前記操舵機構に操舵反力を与える動力源と、
    前記動力源を制御する制御装置と、を備え、
    前記制御装置は、
    操舵角、操舵角速度、操舵角加速度、操舵トルク、転舵角、転舵トルク、転舵アクチュエータの電流、車速、アクセル開度、ブレーキ、ヨーレート、横加速度、気温、ワイパー、及びヘッドライトの情報の内の少なくとも1つの情報を取得する取得部と、
    前記少なくとも1つの情報をニューラルネットワークへ入力して前記動力源の制御量を決定する決定部と、を備える、
    操舵装置。
  2. 前記制御装置は、さらに、
    操舵角あるいは操舵トルクの周波数特性における第1所定周波数以上の高周波成分量に基づく報酬を用いて、前記ニューラルネットワークの強化学習を行う学習部を備える、
    請求項1に記載の操舵装置。
  3. 前記学習部は、
    前記高周波成分量が第1の量である場合に、第1の量に対応する第1の報酬を用いて前記強化学習を行い、
    前記高周波成分量が前記第1の量よりも大きい第2の量である場合に、前記第2の量に対応する第2の報酬であって前記第1の報酬よりも低い第2の報酬を用いて前記強化学習を行う、
    請求項2に記載の操舵装置。
  4. 前記学習部は、前記高周波成分量として、操舵角あるいは操舵トルクの周波数特性における前記第1所定周波数以上第2所定周波数未満の特定周波数帯域の成分量を用いる、
    請求項2又は3に記載の操舵装置。
  5. 前記学習部は、前記特定周波数帯域を細分化した周波数区間ごとに、重み係数を用いてパーシャルオーバーオール値を重み付けすることにより、前記特定周波数帯域の成分量を算出する、
    請求項4に記載の操舵装置。
  6. 前記学習部は、前記特定周波数帯域に含まれる低周波区間のパーシャルオーバーオール値と、前記特定周波数帯域に含まれる高周波区間のパーシャルオーバーオール値との比率を、前記特定周波数帯域の成分量として用いる、
    請求項4に記載の操舵装置。
  7. 前記学習部は、DQNアルゴリズムを用いて前記強化学習を行う、
    請求項2〜6のいずれか1項に記載の操舵装置。
  8. 前記学習部は、前記操舵装置が搭載される車両の点火装置がオフの時に、前記強化学習を行う、
    請求項2〜7のいずれか1項に記載の操舵装置。
  9. 請求項1に記載の操舵装置と、
    前記操舵装置と通信可能なサーバ装置と、を備え、
    前記操舵装置は、さらに、前記少なくとも1つの情報を前記サーバ装置に送信する通信部と、を備え、
    前記サーバ装置は、
    操舵角あるいは操舵トルクの周波数特性における第1所定周波数以上の高周波成分量に基づく報酬を用いて、前記ニューラルネットワークの強化学習を行う学習部と、
    前記少なくとも1つの情報を前記操舵装置から受信し、前記強化学習の結果を前記操舵装置に送信する通信部と、を備える、
    操舵システム。
  10. 前記学習部は、前記操舵装置から受信した前記少なくとも1つの情報に加えて、他の操舵装置から受信した前記少なくとも1つの情報を用いて、前記ニューラルネットワークの強化学習を行う、
    請求項9に記載の操舵システム。
JP2018202042A 2018-10-26 2018-10-26 操舵装置及び操舵システム Active JP7230431B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018202042A JP7230431B2 (ja) 2018-10-26 2018-10-26 操舵装置及び操舵システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018202042A JP7230431B2 (ja) 2018-10-26 2018-10-26 操舵装置及び操舵システム

Publications (2)

Publication Number Publication Date
JP2020066400A true JP2020066400A (ja) 2020-04-30
JP7230431B2 JP7230431B2 (ja) 2023-03-01

Family

ID=70389400

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018202042A Active JP7230431B2 (ja) 2018-10-26 2018-10-26 操舵装置及び操舵システム

Country Status (1)

Country Link
JP (1) JP7230431B2 (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0699830A (ja) * 1992-09-21 1994-04-12 Toyota Motor Corp 車両の操舵装置
JPH08150949A (ja) * 1994-11-28 1996-06-11 Mazda Motor Corp 車両の走行制御装置
JP2000203302A (ja) * 1999-01-11 2000-07-25 Isuzu Motors Ltd 車両の危険運転判定装置
DE102006053029A1 (de) * 2006-11-10 2008-05-15 Zf Lenksysteme Gmbh Verfahren zum Betrieb eines elektronisch geregelten Servolenksystems
DE102016212097A1 (de) * 2016-07-04 2018-01-04 Volkswagen Ag Verfahren und Vorrichtung zum Schätzen eines Lenkraddrehmoments für eine mechanische Rückkopplung an einem Lenkrad eines Kraftfahrzeugs
JP2018063602A (ja) * 2016-10-13 2018-04-19 株式会社 ディー・エヌ・エー Q学習を用いたニューラルネットワークの重み付け調整のためのプログラム、システム、及び方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0699830A (ja) * 1992-09-21 1994-04-12 Toyota Motor Corp 車両の操舵装置
JPH08150949A (ja) * 1994-11-28 1996-06-11 Mazda Motor Corp 車両の走行制御装置
JP2000203302A (ja) * 1999-01-11 2000-07-25 Isuzu Motors Ltd 車両の危険運転判定装置
DE102006053029A1 (de) * 2006-11-10 2008-05-15 Zf Lenksysteme Gmbh Verfahren zum Betrieb eines elektronisch geregelten Servolenksystems
DE102016212097A1 (de) * 2016-07-04 2018-01-04 Volkswagen Ag Verfahren und Vorrichtung zum Schätzen eines Lenkraddrehmoments für eine mechanische Rückkopplung an einem Lenkrad eines Kraftfahrzeugs
JP2018063602A (ja) * 2016-10-13 2018-04-19 株式会社 ディー・エヌ・エー Q学習を用いたニューラルネットワークの重み付け調整のためのプログラム、システム、及び方法

Also Published As

Publication number Publication date
JP7230431B2 (ja) 2023-03-01

Similar Documents

Publication Publication Date Title
CN107697153B (zh) 作动器控制装置
JP5429234B2 (ja) 車両用情報処理装置
JP4400544B2 (ja) 車両の操舵装置
JP4411514B2 (ja) 電動パワーステアリング装置
JP2004042796A (ja) 車両の運動制御方法および車両の運動制御装置
JP2018177120A (ja) 自動運転システム
JP4579056B2 (ja) 車両用操舵装置
JP2007186169A (ja) 電動パワーステアリング装置
CN108327781B (zh) 电动转向式转向操纵装置
JP2007314082A (ja) パワーステアリング装置
JP2021181259A (ja) 車両用運転支援装置
JP5181563B2 (ja) 車両用操舵装置
JP7197413B2 (ja) 操舵制御システム
JP5393495B2 (ja) 操舵装置
JP2006218880A (ja) 車両の操舵装置
JP4058505B2 (ja) 車両の運動制御方法および車両の運動制御装置
JP2007204034A (ja) 重畳角操作部の操作角及び出力トルクの制御のための方法及び制御構造
JP2020066400A (ja) 操舵装置及び操舵システム
JP5776837B2 (ja) 車両用操舵制御装置及び車両用操舵制御方法
JP5703998B2 (ja) 電動パワーステアリング装置
JP2002193120A (ja) 電動パワーステアリング装置
JP4280669B2 (ja) 車両の操舵装置
JP5407407B2 (ja) 車両舵角制御装置及び車両舵角制御方法
JP6390393B2 (ja) 車両用操舵装置
JP2019217867A (ja) 車両用操舵装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210910

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220830

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220831

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221005

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230117

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230130

R150 Certificate of patent or registration of utility model

Ref document number: 7230431

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150