JP2014115168A - 車輌用走行シミュレーション装置、ドライバモデル構築方法及びドライバモデル構築プログラム - Google Patents
車輌用走行シミュレーション装置、ドライバモデル構築方法及びドライバモデル構築プログラム Download PDFInfo
- Publication number
- JP2014115168A JP2014115168A JP2012268816A JP2012268816A JP2014115168A JP 2014115168 A JP2014115168 A JP 2014115168A JP 2012268816 A JP2012268816 A JP 2012268816A JP 2012268816 A JP2012268816 A JP 2012268816A JP 2014115168 A JP2014115168 A JP 2014115168A
- Authority
- JP
- Japan
- Prior art keywords
- value
- vehicle
- driver model
- vehicle speed
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【課題】人間らしいペダル操作を行うドライバモデルを強化学習によって構築することが可能な車輌用走行シミュレーション装置、ドライバモデル構築方法及びドライバモデル構築プログラムを提供する。
【解決手段】車輌用走行シミュレーション装置は、ドライバモデルのゲインの値を変更させながら、車輌モデルを複数回走行させ、この時に変更されたゲインの値を報酬値に基づいて評価することによって、ドライバモデルのゲインの設定を自動的に行う。上記ゲインの値は、車速の追従性を評価する車速報酬関数のみならず、アクセルペダルの操作の滑らかさを評価するアクセル報酬関数、ブレーキペダルの操作の滑らかさを評価するブレーキ報酬関数によっても評価が行われる。
【選択図】図4
【解決手段】車輌用走行シミュレーション装置は、ドライバモデルのゲインの値を変更させながら、車輌モデルを複数回走行させ、この時に変更されたゲインの値を報酬値に基づいて評価することによって、ドライバモデルのゲインの設定を自動的に行う。上記ゲインの値は、車速の追従性を評価する車速報酬関数のみならず、アクセルペダルの操作の滑らかさを評価するアクセル報酬関数、ブレーキペダルの操作の滑らかさを評価するブレーキ報酬関数によっても評価が行われる。
【選択図】図4
Description
本発明は、車輌特性を模擬した車輌モデルをコンピュータによって仮想的に走行させる車輌用走行シミュレーション装置、ドライバモデル構築方法及びドライバモデル構築プログラムに関する。
一般に、自動車などの車輌の設計において、実際に設計した車輌を試作して試験する前に、コンピュータ上にて設計した車輌の特性を模擬した車輌モデルを構築して走行シミュレーションを行うことによって、設計された車輌の性能を検証することが行われている。
例えば、車輌の燃費性能を検証する場合には、ドライバのアクセル操作及びブレーキ操作を模擬したドライバモデルを用いて、車輌モデルを燃費測定走行パターン(例えばJC08モードや、10・15モードなど)で走行させて燃費を検証する。
ところで、上記ドライバモデルが、車輌モデルの車速を所定の走行パターンに追従して上手にコントロール出来るようになるには、車輌モデルに合せてこのドライバモデルを調整することが必要となる。従来、このドライバモデルの調整は手動で行われていたが、近年、手動ではなくコンピュータが自動的にドライバモデルの調整を行うことが出来るように、強化学習を用いて上記ドライバモデルを構築することが提案されている(非特許文献1)。
具体的には、上記非特許文献1には、ドライバモデルのPIDゲインの値を変化させて車輌モデルを繰り返し走行させ、その時の車速が走行パターンから所定の範囲内に収まっている場合には正の報酬を与え、車速が所定の範囲から逸脱した場合には負の報酬を与えることによって、上記ゲインの値を評価し、報酬の値の大きな、即ち、評価の高いゲインの値をドライバモデルに採用することによって、自動的にドライバモデルを構築する方法が記載されている。
二宮 一史,森田 良文,鵜飼 裕之,水野 靖之,河本 誠,高取 克彦、「強化学習を用いたドライバーモデルの構築法の提案」、電気関係学会東海支部連合大会公演論文集、名古屋大学大学院工学研究科、2011年9月、ROMBUNNO.N3−6
このように、上記非特許文献1の方法では、車速の追従性を指標にしてゲインの値を評価することによってドライバモデルの調整の自動化を可能にしている。しかしながら、この非特許文献1の方法は、車速が走行パターンから所定の範囲内にあるか否かのみをゲインの値の評価の基準としているため、構築されるドライバモデルは、実際のドライバに比して、アクセル及びブレーキのペダル操作が多くまた、そのペダル操作が人間では行うことができないくらい急激なものになってしまうことがあった。
そして、その結果として、燃費性能の検証をしてみても、上記非特許文献1の方法によって構築したドライバモデルを用いて行った走行シミュレーションでは、実際に人間が車輌を運転した場合に比べて、燃費性能の結果が低く出てしまうという問題があった。
そこで本発明は、人間らしいペダル操作を行うドライバモデルを強化学習によって構築することが可能な車輌用走行シミュレーション装置、ドライバモデル構築方法及びドライバモデル構築プログラムを提供することを目的とする。
本発明は、車輌特性を模擬した車輌モデル(13)をコンピュータ(3)によって仮想的に走行させる車輌用走行シミュレーション装置(1)において、
前記車輌モデル(13)の現在車速と目標車速との間の車速偏差に基づいて、アクセル及びブレーキペダルの少なくとも一方の操作量の値を前記車輌モデル(13)に対して出力し、前記現在車速が前記目標車速となるように前記車輌モデルを操作するドライバモデル(14)を構築するドライバモデル構築部(6,10)を備え、
前記ドライバモデル構築部(6,10)は、
前記現在車速が前記目標車速から所定の許容範囲(W1)以内の場合に前記ドライバモデル(14)のゲインを評価するための報酬値が加算されるように設定された車速報酬関数、前記アクセルペダルの操作量の値の微分値が所定の許容範囲(W2)内の場合に前記報酬値が加算されるように設定されたアクセル報酬関数、前記ブレーキペダルの操作量の値の微分値が所定の許容範囲(W3)内の場合に前記報酬値が加算されるように設定されたブレーキ報酬関数を有する評価式を備え、
前記ドライバモデル(14)のゲインの値を変更させながら、前記車輌モデル(13)を所定の走行パターンにて複数回走行させて、これら変更した各ゲインの値を前記評価式によって評価した際に、前記報酬値による評価が最も高いゲインの値を前記ドライバモデル(14)のゲインの値とする、ことを特徴とする。
前記車輌モデル(13)の現在車速と目標車速との間の車速偏差に基づいて、アクセル及びブレーキペダルの少なくとも一方の操作量の値を前記車輌モデル(13)に対して出力し、前記現在車速が前記目標車速となるように前記車輌モデルを操作するドライバモデル(14)を構築するドライバモデル構築部(6,10)を備え、
前記ドライバモデル構築部(6,10)は、
前記現在車速が前記目標車速から所定の許容範囲(W1)以内の場合に前記ドライバモデル(14)のゲインを評価するための報酬値が加算されるように設定された車速報酬関数、前記アクセルペダルの操作量の値の微分値が所定の許容範囲(W2)内の場合に前記報酬値が加算されるように設定されたアクセル報酬関数、前記ブレーキペダルの操作量の値の微分値が所定の許容範囲(W3)内の場合に前記報酬値が加算されるように設定されたブレーキ報酬関数を有する評価式を備え、
前記ドライバモデル(14)のゲインの値を変更させながら、前記車輌モデル(13)を所定の走行パターンにて複数回走行させて、これら変更した各ゲインの値を前記評価式によって評価した際に、前記報酬値による評価が最も高いゲインの値を前記ドライバモデル(14)のゲインの値とする、ことを特徴とする。
また、前記ドライバモデル構築部(6,10)は、
人間のドライバが実車輌を前記所定の走行パターンに沿って走行させた際の前記アクセルペダルの操作量の値の微分値の上限値(Y2)及び下限値(Y1)に基づいて、前記アクセルペダルの操作量の値の微分値の許容範囲(W2)を設定し、
人間のドライバが実車輌を前記所定の走行パターンに沿って走行させた際の前記ブレーキペダルの操作量の値の微分値の上限値(Y4)及び下限値(Y3)に基づいて、前記ブレーキペダルの操作量の値の微分値の許容範囲(W3)を設定すると好適である。
人間のドライバが実車輌を前記所定の走行パターンに沿って走行させた際の前記アクセルペダルの操作量の値の微分値の上限値(Y2)及び下限値(Y1)に基づいて、前記アクセルペダルの操作量の値の微分値の許容範囲(W2)を設定し、
人間のドライバが実車輌を前記所定の走行パターンに沿って走行させた際の前記ブレーキペダルの操作量の値の微分値の上限値(Y4)及び下限値(Y3)に基づいて、前記ブレーキペダルの操作量の値の微分値の許容範囲(W3)を設定すると好適である。
更に、前記ドライバモデル構築部(6,10)は、
前記アクセル及びブレーキペダルの操作値の微分値の許容範囲(W2,W3)を、前記車輌モデル(13)の車輌容量に応じて複数設定する、と好適である。
前記アクセル及びブレーキペダルの操作値の微分値の許容範囲(W2,W3)を、前記車輌モデル(13)の車輌容量に応じて複数設定する、と好適である。
また、本発明は、車輌特性を模擬した車輌モデル(13)に対して、この車輌モデル(13)の現在車速と目標車速との間の車速偏差に基づいて、アクセル及びブレーキペダルの少なくとも一方の操作量の値を、前記現在車速が前記目標車速となるように出力するドライバモデル(14)の構築方法において、
演算装置(6)が、前記ドライバモデル(14)のゲインの値を変更させながら、前記車輌モデル(13)を所定の走行パターンにて複数回走行させ、これら変更した各ゲインの値を、前記現在車速が前記目標車速から所定の許容範囲内の場合に前記ドライバモデル(14)のゲインを評価するための報酬値が加算されるように設定された車速報酬関数、前記アクセルペダルの操作量の値の微分値が所定の許容範囲内の場合に前記報酬値が加算されるように設定されたアクセル報酬関数、前記ブレーキペダルの操作量の値の微分値が所定の許容範囲内の場合に前記報酬値が加算されるように設定されたブレーキ報酬関数を有する評価式によって評価する評価工程と、
前記演算装置(6)が、前記評価工程で評価された前記ゲインの値の内、前記報酬値による評価が最も高いゲインの値を前記ドライバモデル(14)のゲインの値とするモデル構築工程と、を備えた、ことを特徴とする。
演算装置(6)が、前記ドライバモデル(14)のゲインの値を変更させながら、前記車輌モデル(13)を所定の走行パターンにて複数回走行させ、これら変更した各ゲインの値を、前記現在車速が前記目標車速から所定の許容範囲内の場合に前記ドライバモデル(14)のゲインを評価するための報酬値が加算されるように設定された車速報酬関数、前記アクセルペダルの操作量の値の微分値が所定の許容範囲内の場合に前記報酬値が加算されるように設定されたアクセル報酬関数、前記ブレーキペダルの操作量の値の微分値が所定の許容範囲内の場合に前記報酬値が加算されるように設定されたブレーキ報酬関数を有する評価式によって評価する評価工程と、
前記演算装置(6)が、前記評価工程で評価された前記ゲインの値の内、前記報酬値による評価が最も高いゲインの値を前記ドライバモデル(14)のゲインの値とするモデル構築工程と、を備えた、ことを特徴とする。
更に、本発明のドライバモデル構築プログラム(12)は、上記ドライバモデル構築方法の各工程を実行することを特徴とする。
なお、上記カッコ内の符号は、図面と対照するためのものであるが、これは、発明の理解を容易にするための便宜的なものであり、特許請求の範囲の構成に何等影響を及ぼすものではない。
請求項1、4、5に係る発明によると、ドライバモデルのゲインの値を変更しながら車輌モデルを所定の走行パターンで繰り返し走行させ、これら変更された各ゲインの値を評価して、最も評価の高いゲインの値をドライバモデルのゲインの値として設定するため、自動的にゲインの値を調整したドライバモデルを構築することができる。また、上記ゲインの評価を、車速の追従性のみならず、アクセルペダル及びブレーキペダルの操作の滑らかさの観点からも評価を行うため、ペダル操作の滑らかな人間のペダル操作に近い値にドライバモデルのゲインを収束させることができる。
請求項2に係る発明によると、アクセル報酬関数におけるアクセルペダルの操作量の値の微分値の許容範囲及びブレーキ報酬関数におけるブレーキペダルの操作量の値の微分値の許容範囲を、人間が所定の走行パターンで実車輌を走行させた際のアクセル及びブレーキペダルの上限値及び下限値に基づいて設定している。このため、より人間らしいペダル操作のドライバモデルのゲインの値の評価が高まり、そのゲインの値にドライバモデルのゲインを収束させることができる。
請求項3に係る発明によると、アクセル及びブレーキのペダル操作値の微分値の許容範囲を、車輌モデルの車輌容量に応じて複数設定している。このため、車輌モデルの特性の違いに応じて、人間のようにアクセル及びブレーキの操作がことなるドライバモデルを構築することができる。
以下、本発明の実施の形態に係る車輌用走行シミュレーション装置を図面に沿って説明する。
<車輌用走行シミュレーション装置の概略構成>
図1に示すように、車輌用走行シミュレーション装置1は、一般にHILS(Hardware In the Loop Simulation/Simulator)と呼ばれ、シミュレーション対象の系の一部を実物によって構成すると共に、シミュレーション対象のその他の全ての部分については、ハードウェア(コンピュータ)で仮想的に実現するシミュレータである。
図1に示すように、車輌用走行シミュレーション装置1は、一般にHILS(Hardware In the Loop Simulation/Simulator)と呼ばれ、シミュレーション対象の系の一部を実物によって構成すると共に、シミュレーション対象のその他の全ての部分については、ハードウェア(コンピュータ)で仮想的に実現するシミュレータである。
上記車輌用走行シミュレーション装置1は、数値化が困難な部分がある場合や、実物にて動作評価を実施したい場合などに多く用いられ、本実施の形態においては、実物のECU(Electronic Control Unit)2をシミュレーション装置本体3に接続して構成されている。
より詳しくは、シミュレーション装置本体(コンピュータ)3は、図2に示すように、CPU5を主体として演算装置6を構成していると共に、このCPU5には、ROM7及びRAM9などの記憶装置10がバス11を介して接続されている。ROM7には、シミュレーション装置の基本制御に必要なプログラムが格納されていると共に、後述するドライバモデル構築プログラム12などの各種プログラムやデータが格納されている。RAM9には、CPU5に対する作業領域が確保されると共に、シミュレーションを行う車輌モデル13、ドライバモデル14のデータや、後述するQマップ15のデータなどが格納されている。
また、CPU5には、バス11を介して操作パネル16が接続されていると共に、バス11及び入力インターフェース17を介して外部コンピュータ19と接続されている。従って、これら操作パネル16及び外部コンピュータ19からシミュレーション装置本体3に対して、シミュレーションに必要な情報、或いはその他の指示の入力が可能となっていると共に、上記外部コンピュータ19もしくは不図示の表示装置に対してシミュレーション結果を出力可能となっている。
<走行シミュレーションについて>
ついで、上記車輌用走行シミュレーション装置の行う車輌の走行シミュレーションについて説明をする。上述した車輌用走行シミュレーション装置1は、車輌の走行シミュレーションを行うに際して、接続された実物のECU及びその他の数値化された車輌データに基づいて、走行シミュレーションを行いたい車輌の特性を模擬した車輌モデル13を構築する。
ついで、上記車輌用走行シミュレーション装置の行う車輌の走行シミュレーションについて説明をする。上述した車輌用走行シミュレーション装置1は、車輌の走行シミュレーションを行うに際して、接続された実物のECU及びその他の数値化された車輌データに基づいて、走行シミュレーションを行いたい車輌の特性を模擬した車輌モデル13を構築する。
また、車輌用走行シミュレーション装置1は、上記車輌モデル13の現在車速と目標車速との間の車速偏差に基づいて、アクセル及びブレーキペダルの少なくとも一方の操作量の値を車輌モデル13に対して出力し、現在車速が目標車速となるように車輌モデル13を操作するドライバモデル14を構築する。
即ち、上記ドライバモデル14は、車輌モデル13をコンピュータによって仮想的に走行させる際の制御則として形成される。従って、演算装置6は、ドライバモデル14が決まれば、車輌モデル13を走行させたい任意の速度パターンの車速を、ドライバモデル14の目標車速とすることによって、車輌モデル13に出力するアクセルペダル及びブレーキペダルの操作量の値を演算することができる。そして、この出力されたアクセル及びブレーキペダル操作量の値に基づいて、車輌モデル13の走行状態をコンピュータ上にて演算してシミュレーションすることができるようになっている。
なお、上記アクセルペダル及びブレーキペダルの操作量の値はペダル操作値として演算され、このペダル操作値は、プラスの値によってアクセルペダルの操作量を、マイナスの値によってブレーキペダルの操作量を示す。また、本実施の形態においては、ドライバモデル14は、式(1)に示すように、PID制御(Proportional Integral Derivative Controller)によって車輌モデル13を制御するように制御側が構成されている。
<ドライバモデルの構築方法>
上述したように、車輌モデル13は、ドライバモデル14によってその走行を制御されるため、正確な走行シミュレーションを行いたい場合、どのようなドライバモデル14を構築するかが重要となる。以下、上記ドライバモデル構築プログラム12によるドライバモデルの構築方法について説明をする。
上述したように、車輌モデル13は、ドライバモデル14によってその走行を制御されるため、正確な走行シミュレーションを行いたい場合、どのようなドライバモデル14を構築するかが重要となる。以下、上記ドライバモデル構築プログラム12によるドライバモデルの構築方法について説明をする。
図3は、本実施の形態に係るドライバモデル及び車輌モデルを示すブロック図である。図3に示すように、本実施の形態において、演算装置6は、強化学習エージェント20として機能し、強化学習を用いてドライバモデル14を自動的に構築する。
具体的には、本実施の形態では、上述したドライバモデルのPIDゲイン(式(1)のKP、KI、KD)をQ−learning法の手法を用いて決定することにより、適切なドライバモデルを構築する。即ち、車輌用走行シミュレーション装置は、図4(a)に示すように、一方の軸(本実施の形態では列)に車輌モデルの走行状態を取ると共に他方の軸(本実施の形態では行)にゲインの値を取り、各走行状態におけるゲインの値の評価が報酬値の積算値としてセルに入力されるQマップ15をRAM9に格納している。
上記Qマップ15のセルの報酬値の値は、学習前はそれぞれ0の値を取っているが、ドライバモデル構築プログラム12は、演算装置6に上記ゲインの値(aP t,aI t,aD t)を変更させながら車輌モデル13を所定の走行パターンで複数回走行させ、その際に後述する評価式を用いて各走行状態におけるゲインの値をそれぞれ評価して上記報酬値の値(ゲインの評価)を更新して行くことによって、Qマップ15を学習させる。そして、走行状態ごとに、この学習させたQマップ上で最も報酬値(評価)の高いゲインの値を、ドライバモデル14のゲインの値として採用することによって、上記ドライバモデル14を自動的に構築可能なようになっている。
具体的に、図4(a)のQマップ15では、ゲインの値がaP 1〜aP 4の間で変更され、状態SP 1を例にとると、報酬値の値が9でゲインaP 1が最も高いので、このゲインaP 1が状態SP 1の際のゲインとして演算装置6に選択される。
なお、本実施の形態においては、上述したように車輌モデル13をPID制御によって制御するため、ドライバモデル14のゲインの値もそれぞれ車速偏差、車速偏差の積分値、車速偏差の微分値に応じて別々に設定されている。このため、Qマップ15についても、図4(a)〜(c)に示すようにゲイン別に3つ設けられ、この場合、各Qマップ15の走行状態はそれぞれゲインの種類に合せて、図4(d)に示す車速と車速偏差によって定まる状態、図4(e)に示す車速と車速偏差の積分値によって定まる状態、図4(f)に示す車速と車速偏差の微分値によって定まる状態によって区分される。
また、PIDゲインの値を変動させる範囲については、車速が目標車速(走行パターン車速)から極端に逸脱しない範囲内で設定され、所望のゲインがこの範囲から外れず、かつドライバモデルを構築する時間が極端に長くならないように設定される。
ついで、上記ゲインの評価方法について説明をする。上記ドライバモデル構築プログラム12には、Qマップ15のセルに加算される報酬値を算出する評価式が組み込まれており、演算装置6は、この評価式に基づいてゲインの値を評価する。
具体的には、上記評価式は、式(2)に示すように設定されている。即ち、この評価式r(t)は、車速追従に対する報酬値を設定する車速報酬関数(式(2)のr0(t)の部分)、アクセル操作に対する報酬値を設定するアクセル報酬関数(式(2)のKAd(Ac(t))/dt+γの部分)、ブレーキ操作に対する報酬値を設定するブレーキ報酬関数(式(2)のKBd(Br(t))/dt+γの部分)を有して構成されており、各報酬関数にて算出された報酬値の和が、上記Qマップ15のセルの報酬値として加えられる。
より詳しく説明すると、上記車速報酬関数r0(t)は、式(3)のように設定されている。
即ち、図5(a)に示すように、車速報酬関数r0(t)は、車輌モデル13の現在車速が許容車速偏差幅W1の範囲内の場合に、報酬値(ゲインの評価)がこの許容車速偏差幅W1外の場合に比して高くなるように設定されており、特に現在車速が目標車速(走行パターンの車速)に近い程、報酬値が高くなるようになっている。また、上記現在車速が許容車速偏差幅の範囲外に逸脱している場合には、報酬値は0となるように設定されている。これにより、例え、現在車速が許容車速偏差幅の範囲外に逸脱したとしても適切なPIDゲインだった場合に、車速報酬関数からの報酬値がマイナスになることがなくなり、Qマップの学習結果を収束させやすくすることができる。
なお、本実施の形態において、上記許容車速偏差幅W1は、燃費計測モード(JC08モード、10・15モードなど)において許容されている範囲に設定されており、具体的には、走行パターンの車速からプラス・マイナス2km/hの範囲に設定されている。
また、アクセル報酬関数KAd(Ac(t))/dt+γは、図5(b)に示すように、アクセルペダルの操作量(プラスのペダル操作値)の微分値が、所定の許容範囲W2内の場合に、報酬値(ゲインの評価)がこの許容範囲W2外の場合に比して高くなるように設定されている。即ち、アクセルペダルの操作量の微分値が上記許容範囲W2内の場合は、ペダル操作の重みパラメータγがそのまま報酬値となるが(この時、KA=0)、この許容範囲W2からアクセルペダルの操作量の微分値が逸脱すればするほど、KAd(Ac(t))/dtの項のマイナス値(負の報酬)が大きくなって、報酬値の値が小さくなる(マイナスも含む)。
また、上記アクセルペダルの操作量の微分値の許容範囲W2は、実車輌において人間のドライバが所定の走行パターンを走行させる際のアクセルペダルの操作量の微分値の上限値Y2及び下限値Y1に基づいて設定されている。具体的には、上記アクセルペダルの操作量の微分値の上限値Y2及び下限値Y1は、表1に示すように、車輌のサイズ(車輌容量)に応じて複数(本実施の形態では小型、中型、大型の3つ)設定されており、車輌モデルのサイズに合わせて値が選択される。
更に、ブレーキ報酬関数KBd(Br(t))/dt+γは、図5(c)に示すように、ブレーキペダルの操作量(マイナスのペダル操作値)の微分値が、所定の許容範囲W3内の場合に、報酬値(ゲインの評価)がこの許容範囲W3外の場合に比して高くなるように設定されている。即ち、ブレーキペダルの操作量の微分値が上記許容範囲内の場合は、ペダル操作の重みパラメータγがそのまま報酬値となるが(この時、KB=0)、この許容範囲からブレーキペダルの操作量の微分値が逸脱すればするほど、KBd(Br(t))/dtの項のマイナス値(負の報酬)が大きくなって、報酬値の値が小さくなる(マイナスも含む)。
また、上記ブレーキペダルの操作量の微分値の許容範囲W3は、上記アクセル報酬関数と同様に、実車輌において人間のドライバが所定の走行パターンを走行させる際のブレーキペダルの操作量の微分値の上限値Y4及び下限値Y3に基づいて設定されており、表1に示すように、車輌のサイズ(車輌容量)に応じて複数(本実施の形態では小型、中型、大型の3つ)設定されている。
なお、通常、アクセル及びブレーキは、同時に操作されることが少なく、式(2)を見て分かる通り上記ペダル操作の重みパラメータγは、アクセルペダル報酬関数とブレーキ報酬関数との共通の重みパラメータとなっている。そのため、ペダル操作に基づいて得られる報酬値の最大値は、ペダル操作の重みパラメータγである。
また、kA,kBの値を1/1000としたのは、報酬値の桁数を合わせるためであると共に、ペダル操作の重みパラメータγ=2を追加で加えるのは、アクセル及びブレーキの操作量(変化量)が1000〜3000程度の場合であっても人間のペダル操作で取り得る値として正の報酬を与えられるようにするためである。
上述したように、本実施の形態に係る車輌用走行シミュレーション装置1は、演算装置6及びドライバモデル構築プログラム12が格納された記憶装置10を備えて上記ドライバモデル14を構築するドライバモデル構築部を形成している。このドライバモデル構築プログラム12は、ドライバモデル14のゲインの値を変更させながら、車輌モデル13を所定の走行パターンにて複数回走行させ、これら変更した各ゲインの値を上述した評価式によって評価する評価工程と、この評価工程で評価されたゲインの値の内、報酬値の値(報酬値による評価)が最も高いゲインの値をドライバモデル14のゲインの値に設定するモデル構築工程とを、演算装置6に実行させるように構成されているため、車輌用走行シミュレーション装置1は、ゲインの値を最適化したドライバモデル14を自動的に構築することができる。
従って、車輌モデルを繰り返し自動走行させることによって、ドライバモデル14が学習して、例えば、燃費評価テストなどの場合、国土交通省の定めた規定値内走行が可能となるため、人手によるドライバモデルの調整が必要なくなり、人間の作業工数を削減することができる。
また、上記ゲインの値を評価する評価式を、車速の追従性を評価する車速報酬関数のみならず、アクセルペダル及びブレーキペダルの操作の滑らかさを評価するアクセル報酬関数及びブレーキ報酬関数を加えて構成したため、ドライバモデル14を、ペダル操作の滑らかさの観点からも評価することができ、より人間に近い、出来るだけ滑らかなペダル操作を行うドライバモデルを、ドライバモデル構築部6,10によって自動的に構築することができる。
即ち、現在車速が目標車速から所定の許容範囲以内になりかつ、アクセルペダル及びブレーキペダルの操作量の値の微分値が所定の許容範囲内になるゲインの値について、最も多くの報酬値が加算されるため、よりペダル操作の滑らかな人間に近いドライバモデル14を構築することができる。
更に、車輌用走行シミュレーション装置1は、アクセル及びブレーキペダルの操作量の微分値の許容範囲を、車輌容量に応じて複数設定している。このため、車輌容量に応じて変化する車輌モデルのエンジン性能や車輌重量などの人間のペダル操作に影響を与える車輌特性に応じて、ドライバモデル14を調整することができ、より人間のペダル操作に近いドライバモデル14を構築することができる。
また、ドライバモデル14を構築する際の車輌モデル13を走行させたパターン以外の走行パターンであっても、上記アクセル及びブレーキペダルの操作量の微分値の許容範囲内でペダル操作を行う走行パターンであれば、滑らかなペダル操作が可能となり、構築したドライバモデル14の汎用性を高めることができる。
更に、ドライバモデル14のペダル操作値の出力が人間の操作に近づいて滑らかになることによって、変速機の変速タイミングが、人間が操作した場合と類似してくるため、フェールセーフや燃費テストにおける評価精度を向上させることができる。
<試験結果>
ついで、ドライバモデル14のゲインの値を車速報酬関数のみを用いて評価して構築されたドライバモデルと、本実施の形態の評価式を用いて評価して構築されたドライバモデル(アクセル及びブレーキ報酬関数有りの場合)とによって、同一の車輌モデルをJC08モードで走行させた場合の結果の比較を、表2及び表3に示す。
ついで、ドライバモデル14のゲインの値を車速報酬関数のみを用いて評価して構築されたドライバモデルと、本実施の形態の評価式を用いて評価して構築されたドライバモデル(アクセル及びブレーキ報酬関数有りの場合)とによって、同一の車輌モデルをJC08モードで走行させた場合の結果の比較を、表2及び表3に示す。
上記表2に示すように、車速追従のみを指標として構築されたドライバモデルでは、1回の最大逸脱時間は0.00秒であり、国土交通省の規定である1秒以内に収まっていると共に、総逸脱時間も0.00秒となり、この総逸脱時間においても国土交通省の規定である2秒以内に収まっている。
一方、本実施の形態の方法によって構築されたドライバモデルも、それぞれ1回の最大逸脱時間が0.1秒、総逸脱時間が0.1秒となって、いずれの値も上記国土交通省の規定内に収まっていることが分かる。これらの結果から車速追従のみを指標として構築されたドライバモデルであっても、本実施の形態に係るドライバモデルであっても規定の許容範囲内で走行パターンに車速を同程度の精度で追従させることができることが分かる。
次に、表3では、上記2つのドライバモデルを用いてJC08モードを走行した際のアクセル及びブレーキペダルそれぞれの操作量の積分値を、人間が実車輌でJC08モードを走行した場合と比較することで、上記2つのドライバモデルがどの程度、人間のペダル操作に近いかを評価した。
表3に示すように、アクセル及びブレーキのいずれの操作量の積分値も、本実施の形態の方法で構築されたドライバモデルの方が、人間の操作に近い事がわかる。特に、車速追従のみを指標にして構築されたドライバモデルを用いて車輌モデルを走行させた場合は、アクセル及びブレーキペダルの操作量の積分値が高くなっており、これは、アクセル及びブレーキを多く操作したことを示している。従って、車速追従のみを指標として構築されたドライバモデルでは、車速の追従は可能であったとしても、正確な燃費評価を行うことができない事がわかる。
一方、本実施の形態の方法で構築されたドライバモデルでは、上記積分値の値が人間操作に近づいて小さくなっているため、車速追従のみを指標にして構築されたドライバモデルに対して、よりペダル操作が滑らかであることが分かる。従って、上述した車速追従のみを指標として構築されたドライバモデルに比して、正確な燃費評価を行うことができる。
なお、上述の実施の形態においては、報酬値が大きい程、評価が高い設定になっているが、報酬値が低い程、評価が高くなるように設定してもよく、上記車速報酬関数、アクセル報酬関数及びブレーキ報酬関数において、車速、アクセルのペダル操作量の値の微分値及びブレーキのペダル操作量の値の微分値が所定の許容範囲W1,W2,W3の場合、報酬値が加算されるとは、報酬値が評価の高まる方向に加算されるという意味である。
また、Qマップ15におけるセルの報酬値は、報酬値を単純に積算するのではなく、単位走行パターンを走行した際に積算された報酬値の平均値などによって評価を比較しても良い。更に、本実施の形態においては、ドライバモデルをPID制御を用いて構成したが、例えば、ファージモデルなど、他の方法を用いて構成しても良い。
更に、本実施の形態においてアクセル/ブレーキ報酬関におけるアクセル/ブレーキペダルの操作量の微分値は、一階微分の値を用いたが、アクセル/ブレーキペダルの操作量を複数回微分した値を用いても良く、例えば、二階微分の値(操作量の加速度)を用いても良い。
また、ドライバモデル構築プログラムは、ROM,RAMのいずれに格納されていても良く、図2に示すように、CD、DVD、フラッシュメモリなどのコンピュータが読み取り可能な記録媒体30に格納して、走行シミュレーション装置にインストールすることもできかつ、通信装置31を介して、インターネットなどで配信することもできる。
1:車輌用走行シミュレーション装置、3:コンピュータ(シミュレーション装置本体)、6:演算部、6,10:ドライバモデル構築部、12:ドライバモデル構築プログラム、13:車輌モデル、14:ドライバモデル、W1:車速の許容範囲、W2:アクセルペダルの操作量の値の微分値の許容範囲、W3:ブレーキのペダル操作量の値の微分値の許容範囲、Y1:アクセルペダルの操作量の値の微分値の下限値、Y2:アクセルペダルの操作量の値の微分値の上限値、Y3:ブレーキペダルの操作量の値の微分値の下限値、Y4:ブレーキペダルの操作量の値の微分値の上限値
Claims (5)
- 車輌特性を模擬した車輌モデルをコンピュータによって仮想的に走行させる車輌用走行シミュレーション装置において、
前記車輌モデルの現在車速と目標車速との間の車速偏差に基づいて、アクセル及びブレーキペダルの少なくとも一方の操作量の値を前記車輌モデルに対して出力し、前記現在車速が前記目標車速となるように前記車輌モデルを操作するドライバモデルを構築するドライバモデル構築部を備え、
前記ドライバモデル構築部は、
前記現在車速が前記目標車速から所定の許容範囲以内の場合に前記ドライバモデルのゲインを評価するための報酬値が加算されるように設定された車速報酬関数、前記アクセルペダルの操作量の値の微分値が所定の許容範囲内の場合に前記報酬値が加算されるように設定されたアクセル報酬関数、前記ブレーキペダルの操作量の値の微分値が所定の許容範囲内の場合に前記報酬値が加算されるように設定されたブレーキ報酬関数を有する評価式を備え、
前記ドライバモデルのゲインの値を変更させながら、前記車輌モデルを所定の走行パターンにて複数回走行させて、これら変更した各ゲインの値を前記評価式によって評価した際に、前記報酬値による評価が最も高いゲインの値を前記ドライバモデルのゲインの値とする、
ことを特徴とする車輌用走行シミュレーション装置。 - 前記ドライバモデル構築部は、
人間のドライバが実車輌を前記所定の走行パターンに沿って走行させた際の前記アクセルペダルの操作量の値の微分値の上限値及び下限値に基づいて、前記アクセルペダルの操作量の値の微分値の許容範囲を設定し、
人間のドライバが実車輌を前記所定の走行パターンに沿って走行させた際の前記ブレーキペダルの操作量の値の微分値の上限値及び下限値に基づいて、前記ブレーキペダルの操作量の値の微分値の許容範囲を設定する、
請求項1記載の車輌用走行シミュレーション装置。 - 前記ドライバモデル構築部は、
前記アクセル及びブレーキペダルの操作値の微分値の許容範囲を、前記車輌モデルの車輌容量に応じて複数設定する、
請求項1又は2記載の車輌用走行シミュレーション装置。 - 車輌特性を模擬した車輌モデルに対して、この車輌モデルの現在車速と目標車速との間の車速偏差に基づいて、アクセル及びブレーキペダルの少なくとも一方の操作量の値を、前記現在車速が前記目標車速となるように出力するドライバモデルの構築方法において、
演算装置が、前記ドライバモデルのゲインの値を変更させながら、前記車輌モデルを所定の走行パターンにて複数回走行させ、これら変更した各ゲインの値を、前記現在車速が前記目標車速から所定の許容範囲内の場合に前記ドライバモデルのゲインを評価するための報酬値が加算されるように設定された車速報酬関数、前記アクセルペダルの操作量の値の微分値が所定の許容範囲内の場合に前記報酬値が加算されるように設定されたアクセル報酬関数、前記ブレーキペダルの操作量の値の微分値が所定の許容範囲内の場合に前記報酬値が加算されるように設定されたブレーキ報酬関数を有する評価式によって評価する評価工程と、
前記演算装置が、前記評価工程で評価された前記ゲインの値の内、前記報酬値による評価が最も高いゲインの値を前記ドライバモデルのゲインの値に設定するモデル構築工程と、を備えた、
ことを特徴とするドライバモデル構築方法。 - 請求項4記載のドライバモデル構築方法の各工程を実行するドライバモデル構築プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012268816A JP2014115168A (ja) | 2012-12-07 | 2012-12-07 | 車輌用走行シミュレーション装置、ドライバモデル構築方法及びドライバモデル構築プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012268816A JP2014115168A (ja) | 2012-12-07 | 2012-12-07 | 車輌用走行シミュレーション装置、ドライバモデル構築方法及びドライバモデル構築プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2014115168A true JP2014115168A (ja) | 2014-06-26 |
Family
ID=51171324
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012268816A Pending JP2014115168A (ja) | 2012-12-07 | 2012-12-07 | 車輌用走行シミュレーション装置、ドライバモデル構築方法及びドライバモデル構築プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2014115168A (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017061168A (ja) * | 2015-09-23 | 2017-03-30 | トヨタテクニカルディベロップメント株式会社 | 車両の自動運転装置 |
US10034630B2 (en) | 2015-11-16 | 2018-07-31 | Samsung Electronics Co., Ltd. | Apparatus and method to train autonomous driving model, and autonomous driving apparatus |
JP2020056737A (ja) * | 2018-10-04 | 2020-04-09 | 株式会社明電舎 | 自動操縦ロボットの制御装置及び制御方法 |
CN112506170A (zh) * | 2020-11-20 | 2021-03-16 | 北京赛目科技有限公司 | 一种基于驾驶员模型的测试方法及装置 |
KR20210090313A (ko) * | 2020-01-09 | 2021-07-20 | 주식회사 현대케피코 | 차량 목표차속 실시간 추종 학습 방법 및 차량 가감속력 학습 시스템 |
JP2021124403A (ja) * | 2020-02-06 | 2021-08-30 | 株式会社明電舎 | 自動操縦ロボットの制御装置及び制御方法 |
WO2021193225A1 (ja) * | 2020-03-24 | 2021-09-30 | 株式会社堀場製作所 | 供試体自動運転装置、供試体試験システム、指令車速生成プログラム、及び、供試体自動運転方法 |
-
2012
- 2012-12-07 JP JP2012268816A patent/JP2014115168A/ja active Pending
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017061168A (ja) * | 2015-09-23 | 2017-03-30 | トヨタテクニカルディベロップメント株式会社 | 車両の自動運転装置 |
US10034630B2 (en) | 2015-11-16 | 2018-07-31 | Samsung Electronics Co., Ltd. | Apparatus and method to train autonomous driving model, and autonomous driving apparatus |
US10791979B2 (en) | 2015-11-16 | 2020-10-06 | Samsung Electronics Co., Ltd. | Apparatus and method to train autonomous driving model, and autonomous driving apparatus |
JP2020056737A (ja) * | 2018-10-04 | 2020-04-09 | 株式会社明電舎 | 自動操縦ロボットの制御装置及び制御方法 |
JP7110891B2 (ja) | 2018-10-04 | 2022-08-02 | 株式会社明電舎 | 自動操縦ロボットの制御装置及び制御方法 |
KR20210090313A (ko) * | 2020-01-09 | 2021-07-20 | 주식회사 현대케피코 | 차량 목표차속 실시간 추종 학습 방법 및 차량 가감속력 학습 시스템 |
KR102280989B1 (ko) | 2020-01-09 | 2021-07-26 | 주식회사 현대케피코 | 차량 목표차속 실시간 추종 학습 방법 및 차량 가감속력 학습 시스템 |
JP2021124403A (ja) * | 2020-02-06 | 2021-08-30 | 株式会社明電舎 | 自動操縦ロボットの制御装置及び制御方法 |
WO2021193225A1 (ja) * | 2020-03-24 | 2021-09-30 | 株式会社堀場製作所 | 供試体自動運転装置、供試体試験システム、指令車速生成プログラム、及び、供試体自動運転方法 |
CN112506170A (zh) * | 2020-11-20 | 2021-03-16 | 北京赛目科技有限公司 | 一种基于驾驶员模型的测试方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2014115168A (ja) | 車輌用走行シミュレーション装置、ドライバモデル構築方法及びドライバモデル構築プログラム | |
CN110045608B (zh) | 基于数字孪生的机械设备零部件结构参数动态优化方法 | |
JP6898101B2 (ja) | 車両のエネルギー効率を分析するためのシステムおよび方法 | |
US20160025025A1 (en) | Method for optimizing vehicles and engines used for driving such vehicles | |
JP6726106B2 (ja) | 車両の動作挙動の判定及び/又は最適化システム | |
JP5738329B2 (ja) | シミュレーション装置 | |
WO2018173933A1 (ja) | 情報処理装置、走行データ処理方法、車両およびプログラム記録媒体 | |
JP6504542B2 (ja) | 車両速度制御装置 | |
Shi et al. | Air–fuel ratio prediction and NMPC for SI engines with modified Volterra model and RBF network | |
Tulpule et al. | Model based design (MBD) and hardware in the loop (HIL) validation: curriculum development | |
Skarka | Model-based design and optimization of electric vehicles | |
US20080183449A1 (en) | Machine parameter tuning method and system | |
Tajeddin | Automatic code generation of real-time nonlinear model predictive control for plug-in hybrid electric vehicle intelligent cruise controllers | |
Taghavipour et al. | Control‐relevant parameter estimation application to a model‐based PHEV power management system | |
Lasalle et al. | Automatic test concretization to supply end-to-end MBT for automotive mechatronic systems | |
Shakouri et al. | Teaching fuzzy logic control based on a robotic implementation | |
Roche et al. | An innovative vehicle behaviour modeling methodology for model-based development | |
Neumann et al. | Low-level online control of the formula 1 power unit with feedforward cylinder deactivation | |
Abubakar et al. | Robust polytopic LPV based Adaptive Cruise Control design for Autonomous Vehicle System | |
Zhang et al. | Enhancement of Driving Strategy of Electric Vehicle by Consideration of Individual Driver Intention | |
Mange et al. | Distributed Simulation of the Effects of Autonomous Behavior on Battery Consumption in Ground Vehicles | |
Salazar | Time-optimal control of the formula 1 hybrid electric power unit | |
Pasdar et al. | A Comparative Study on the Efficiency of Compiled Languages and MATLAB/Simulink for Simulation of Highly Nonlinear Automotive Systems | |
JP7451182B2 (ja) | 制御装置 | |
Guizani et al. | Agent-based approach for the optimal design of mechatronic systems |