JP6011788B2 - 車両用制御装置 - Google Patents

車両用制御装置 Download PDF

Info

Publication number
JP6011788B2
JP6011788B2 JP2012193499A JP2012193499A JP6011788B2 JP 6011788 B2 JP6011788 B2 JP 6011788B2 JP 2012193499 A JP2012193499 A JP 2012193499A JP 2012193499 A JP2012193499 A JP 2012193499A JP 6011788 B2 JP6011788 B2 JP 6011788B2
Authority
JP
Japan
Prior art keywords
vehicle
unit
control algorithm
hierarchical model
new
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012193499A
Other languages
English (en)
Other versions
JP2014046889A (ja
Inventor
由幸 松岡
由幸 松岡
和夫 中澤
和夫 中澤
良樹 氏家
良樹 氏家
山▲崎▼ 卓
卓 山▲崎▼
了 古郡
了 古郡
黒田 康秀
康秀 黒田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mazda Motor Corp
Original Assignee
Mazda Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mazda Motor Corp filed Critical Mazda Motor Corp
Priority to JP2012193499A priority Critical patent/JP6011788B2/ja
Publication of JP2014046889A publication Critical patent/JP2014046889A/ja
Application granted granted Critical
Publication of JP6011788B2 publication Critical patent/JP6011788B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は車両用制御装置に係り、より詳細には、車両状態、車外状態及び乗員状態に応じて車両の制御アルゴリズムを動的に変化させ得る車両用制御装置に関する。
下記の特許文献1には、条件により目的関数が変化する最適化対象の決定変数を短時間で効率良く最適化する方法が記載されている。また、下記の特許文献2には、ドライバの運転操作と外部環境との関連性を随時学習して、ドライバの普段の内部状態からの逸脱を認識する方法が記載されている。
特開2009−99051号公報 特開2009−73465号公報
ところで、上記特許文献1に記載の技術では、条件により目的変数が変化する最適化対称の決定変数を短時間で効率よく最適化する方法が提案されているが、目的関数を運転行動から推定し自律的に変化させることは困難である。
また、上記特許文献2に記載の技術では、ドライバによる運転操作と外部環境との関連性を随時学習し、ドライバの普段の内部状態からの逸脱を認識する方法が提案されているが、プログラムやモデル構造を動的に変更することは困難である。
このように、従来の車両用制御装置では、制御アルゴリズムの設計段階で設定されていなかった状況に車両が遭遇したときに、その状況に対応して車両制御を行うことは困難であった。
そこで、本発明は、より多様な走行場に対応できるように、車両の遭遇している走行場を的確に推定することができる車両用制御装置の提供を目的としている。
上記の目的を達成するため、本発明の車両用制御装置は、車両を運転するドライバの状態、車外環境状態、及び車両状態の少なくとも一つの状態データを検出する検出手段と、上記検出手段によって検出された状態データに基づいて、車両が遭遇している走行場を推定する推定手段と、有し、上記推定手段は、恒等写像モデルと、非線形の階層型モデルとを有し、上記恒等写像モデルの入力層及び出力層の各ユニットに、上記状態データがパラメータとして入力され、上記恒等写像モデルの中間層の各ユニットのパラメータが、上記階層型モデルの入力層の各ユニットにそれぞれ入力され、上記階層型モデルの出力層の各ユニットは、複数の走行場にそれぞれ対応し、上記推定手段は、上記階層型モデルの出力層に出力されたパラメータに基づいて、上記複数の走行場の一つとして、車両が遭遇している走行場を推定し、評価学習手段を更に有し、上記評価学習手段は、上記恒等写像モデルの上記中間層に出力されるパラメータに基づいて進化的アルゴリズムによって生成された制御アルゴリズムをモニタし、上記制御アルゴリズムにおいて、同じノードを有する新たな制御アルゴリズムが繰り返し出現した場合に、上記新たな制御アルゴリズムに対応する走行場を新たな走行場として認識し、上記階層型モデルの出力層に、上記新たな走行場に対応する新たな出力ユニットを追加した学習用階層型モデルを生成して、上記学習用階層型モデルで学習を行い、上記推定手段は、上記階層型モデルを上記学習用階層型モデルに更新し、上記評価学習手段による処理は、上記推定手段による処理とは非同期にて行われ、上記評価学習手段による処理周期は、上記推定手段による処理周期よりも長い、ことを特徴としている。
このように構成された本発明によれば、検出手段によって検出された状態のデータの情報は、恒等写像モデルの中間層の出力として圧縮抽出される。
なお、恒等写像モデルは、入力層と出力層に同一データを提示して、恒等写像としての中間層出力を学習させる階層型モデルである。恒等写像モデルでは、曖昧で不完全な多種多様な情報を入力及び出力とし、問題解決に必要な縮約された情報を自動的に抽出することができる。特に、恒等写像モデルでは、教師信号を必要としないため、未知の予め想定されていなかった未知の走行場を推定するのに用いて好適である。
さらに、本発明では、恒等写像モデルで圧縮抽出された情報に基づいて、階層型モデルの出力層の各ユニットに対応する複数の走行場の一つとして、車両が遭遇している走行場が推定される。これにより、より多様な走行場に対応できるように、車両の遭遇している走行場を的確に推定することができる。
恒等写像モデルとしては、ニューラルネットワークの恒等写像モデルをはじめ、自己組織化写像(SOM)やサポートベクターマシン(SVM)といった種々のモデルを使用することができる。
また、非線形の階層型モデルも、ニューラルネットワークの階層型モデルをはじめ、種々のモデルを使用することができる。
また、本発明によれば、同じノードを有する新たな制御アルゴリズムが繰り返し出現した場合に、新たな制御アルゴリズムに対応する走行場を新たな走行場として認識することにより、車両が、予め設定されていなかった新たな走行場に遭遇したときに、その新たな走行場に対応することが可能となる。
なお、進化的アルゴリズムとしては、遺伝的ネットワークプログラミングをはじめとして、遺伝的アルゴリズム、遺伝的プログラミング、進化的プログラミングといった種々のアルゴリズムを使用することができる。
特に、遺伝的ネットワークプログラミングでは、有向グラフ(ネットワーク)を用いて制御アルゴリズムの遺伝子型が表現されるため、従来の遺伝的アルゴリズムでは表現が困難であった数式やプログラムのコードなど、構造を有するデータを表現することができる。このため、遺伝的ネットワークプログラミングは、新たな走行場に対する適切な制御アルゴリズムを生成するのに用いて好適である。
また、本発明において好ましくは、走行場と車両の制御アルゴリズムとが互いに対応付けて記憶された記憶手段と、前記記憶手段に記憶された制御アルゴリズムから、上記推定手段によって推定された走行場に対応する制御アルゴリズムを選択する選択手段と、選択された制御アルゴリズムを車両の制御パラメータに変換する変換手段とを更に有し、上記階層型モデルが更新された場合に、上記新たな制御アルゴリズムを上記新たな走行場と対応付けて上記記憶手段に記憶する。
これにより、予め設定されていなかった新たな走行場を含む、より多様な走行場に対応することができる。
また、本発明において好ましくは、車両を運転するドライバを識別するドライバ識別手段を更に有し、上記推定手段は、ドライバごとに個別に設けられている。
このように、ドライバごとに推定手段を個別に設けることにより、個々のドライバの運転傾向に合わせて、走行場を的確に推定することができる。
本発明の車両用制御装置によれば、より多様な走行場に対応できるように、車両の遭遇している走行場を的確に推定することができる。
本発明の実施形態による車両用制御装置の構成を示すブロック図である。 本発明の実施形態による車両用制御装置の接続関係を示すブロック図である。 判定部の恒等写像モデル及び非線形階層型モデルの模式図である。 遺伝的アルゴリズム(GA)の基本的なアルゴリズムの流れを示すフローチャートである。 遺伝的ネットワークプログラミング(GNP)における集団と、その集団を構成する一つの個体の有向グラフの模式図である。 遺伝的ネットワークプログラミング(GNP)の一個体の遺伝子の表現型、遺伝子型及びノードライブラリの一例を示す図表である。 遺伝的ネットワークプログラミング(GNP)の交叉の例を示す模式図である。 遺伝的ネットワークプログラミング(GNP)の突然変異の例を示す模式図である。 本発明の実施形態による車両用制御装置の作動を示すフローチャートである。 (1)〜(9)は、遺伝的ネットワークプログラミング(GNP)の有向グラフ構造の模式図である。 (A)は、更新前の学習用の非線形階層型モデルの模式図であり、(B)は、更新後の学習用非線形階層型モデルの模式図である。 (A)は、更新前の非線形階層型モデルの出力パラメータによる走行場のマッピング例であり、(B)は、更新後の非線形階層型モデルの出力パラメータによる走行場のマッピング例である。
以下、添付の図面を参照して、本発明の車両用制御装置の実施形態を説明する。
まず、図1及び図2を参照して、本発明の実施形態による車両用制御装置の構成について説明する。図1は、実施形態による車両用制御装置の接続関係を示すブロック図であり、図2は、車両用制御装置の構成を示すブロック図である。
図1において、実施形態による車両用制御装置の主要部は、コアモジュールECU(electric control unit:電子制御装置)100における処理機能に相当する。コアモジュールECU100は、車内LAN70を介して、検出部10及び種々のアクチュエータとしてのECUに接続されている。種々のECUには、エンジン81を制御するパワートレーン制御モジュール71、モータ/発電機82を制御するモータ制御ユニット72、高圧バッテリ83を制御するバッテリ制御モジュール73及びブレーキ84を制御するブレーキ制御モジュール74が含まれる。
図2に、検出部10及びコアモジュールECU100の構成を示す。図2に示すように、検出部10は、車両を運転するドライバの状態を検出するドライバ状態モニタ11、車外環境状態を検出する車外環境モニタ12及び車両状態を検出する車両状態モニタ13を含む。
検出部10を構成するドライバ状態モニタ11の例としては、車室内に配置されてドライバの視線や、顔の動きを撮像するモニタカメラ及び画像処理システムや、ドライバのブレーキの踏込量を検出するセンサが挙げられる。また、車外環境モニタ12の例としては、先行車両を含む障害物までの距離や相対速度を検出する車両前方に向けたレーダや、車両の側方又は後方に向けたレーダや、車外に向けたモニタカメラ及び画像処理システムが挙げられる。また、車両状態モニタ13の例としては、車速センサ、加速度センサ、ブレーキ踏込量センサ、アクセル踏込量センサ、及び操舵角センサが挙げられる。
なお、検出部10は、ドライバ状態モニタ11、車外環境モニタ12及び車両状態モニタ13の3つを常に設ける必要はなく、これらのうちの1つ又は2つだけを設けたものであってもよい。
また、コアモジュールECU100は、同期処理モジュール110と非同期処理モジュール120とを含む。同期処理モジュール110は、車両の走行中に、逐次、車両の遭遇する走行場を推定する処理を行う。これに対し、非同期処理モジュール120は、車両のショートトリップごと、或いは、所定の日数ごとなど、より長いタイムスケールにおいて、車両の遭遇した走行場のデータを蓄積し、走行場に適した車両制御アルゴリズムを遺伝的ネットワークプログラミング(GNP)によって学習評価する。
なお、車両の遭遇する「走行場(走行シーン)」とは、車両の遭遇している状況、状態、事態又は場面を含み、停止状態を含む車両の走行状態、車外環境の状況、及び車両のドライバの挙動、認識(例えば危機感)及び意図をも含む。
まず、同期処理モジュール110を説明する。同期処理モジュール110は、検出部10によって検出された状態データに基づいて、車両が遭遇している走行場を推定する推定部20と、走行場と車両の制御アルゴリズムとが互いに対応付けて記憶されたメモリ30と、メモリ30に記憶された制御アルゴリズムから、推定部20によって推定された走行場に対応する制御アルゴリズムを選択する選択部40と、選択された制御アルゴリズムを車両の制御パラメータに変換する変換部50とを有する。例えば、変換部50が、制御アルゴリズムに基づいてスロットルの開度のパラメータ信号を生成し、これを、車内LAN70を介して、パワートレーン制御モジュール71に送ることによって、エンジン81の回転数が制御される。
推定部20は、ニューラルネットワークの恒等写像モデル21と、ニューラルネットワークの非線形の階層型モデル22とを有する。恒等写像モデルは、入力層と出力層に同一データを提示して、恒等写像としての中間層出力を学習させる階層型ニューラルネットワークである。恒等写像モデルでは、曖昧で不完全な多種多様な情報を入力及び出力とし、問題解決に必要な縮約された情報を自動的に抽出することができる。特に、恒等写像モデルでは、教師信号を必要としないため、未知の予め想定されていなかった未知の走行場を推定するのに用いて好適である。
ここでは、恒等写像モデル21の入力層及び出力層の各ユニットには、検出部10によって検出された状態データがパラメータとして入力される。図3に示す例では、恒等写像モデル21の入力層及び出力層の両方に、「アクセル」、「ブレーキ」、「車間距離」、「車間距離微分」、「車速」及び「加速度」のパラメータが入力される。そして、恒等写像モデルの中間層の出力として、これらの状態データが圧縮抽出される。
上記恒等写像モデル21の中間層の各ユニットから圧縮抽出されたパラメータは、非線形の階層型モデル22の入力層の各ユニットにそれぞれ入力される。この階層型モデル22の出力層の各ユニットは、複数の走行場にそれぞれ対応している。図3に示す例では、階層型モデル22の出力層の各ユニットは、「渋滞」、「平坦」、「上り」及び「下り」の4つの走行場に対応している。そして、推定部20は、階層型モデル22の出力層に出力されたパラメータに基づいて、4つの走行場の一つとして、車両が遭遇している走行場を推定する。
このように、検出部10によって検出された状態のデータの情報は、恒等写像モデル21の中間層の出力として圧縮抽出される。さらに、恒等写像モデル21で圧縮抽出された情報に基づいて、階層型モデル22の出力層の各ユニットに対応する複数の走行場の一つとして、車両が遭遇している走行場が推定される。これにより、より多様な走行場に対応できるように、車両の遭遇している走行場を的確に推定することができる。
メモリ30には、これら4つの走行場それぞれについて、最適な制御アルゴリズムが記憶されている。選択部40は、これら4つの走行場の中から推定部20が推定した走行場に対応する制御アルゴリズムを選択して読み出す。例えば、推定部20が、車両が遭遇している走行場が「平坦」の走行場であると推定した場合、選択部40は、メモリ30から、「平坦」に対応する制御アルゴリズムを選択して読み出す。
そして、変換部50は、走行路が「平坦」であるときの制御アルゴリズムに基づいて、例えばスロットルの開度の制御パラメータを生成する。この制御パラメータの信号が、車内LAN70を介して、パワートレーン制御モジュール71に送られることによって、エンジン81の回転数が制御される。
また、制御パラメータに従って、エンジン及びモータ以外に、ハンドルやブレーキといったアクチュエータを制御してもよい。例えば、制御アルゴリズムから変換された舵角に従って、ハンドルを自動操作するようにしてもよいし、制御アルゴリズムから変換された車速に従って、ブレーキを自動的に作動させてもよい。
また、制御パラメータに従って、スピーカやディスプレイ等のヒューマン・マシン・インターフェイス(human machine interface:HMI)を制御してもよい。例えば、制御アルゴリズムから変換された舵角や車速に従って車両が走行するように、ドライバを音声で誘導するようにしてもよい。
次に、非同期処理モジュール120を説明する。
非同期処理モジュール120は、学習評価部60を有する。学習評価部60は、恒等写像モデル21の中間層に出力されるパラメータを入力して、制御アルゴリズムを学習評価する遺伝的ネットワークプログラミング(GNP)61と、ニューラルネットワークの学習用の非線形の階層型モデル62とを有する。
学習評価部60は、このGNP61によって生成された制御アルゴリズムをモニタし、その制御アルゴリズムにおいて、同じノードを有する新たな制御アルゴリズムが繰り返し出現した場合に、その新たな制御アルゴリズムに対応する走行場を新たな走行場として認識する。そして、学習用の階層型モデル62の出力層に、その新たな走行場に対応する新たな出力ユニットを追加した新たな学習用階層型モデルを生成し、その学習用階層型モデルで学習を行う。
さらに、推定部20の階層型モデル22を、新しい学習用階層型モデルに更新する。この更新により、例えば、階層型モデル22の出力層のユニットが1つ増加するとともに、出力層の各ユニットのパラメータの閾値が変更される。すなわち、新たな走行場が単に追加されるだけでなく、更新前の出力層の各ユニットに対応する各走行場の閾値もそれぞれ変化することがある。
さらに、階層型モデル22が更新された場合に、同じノードを有する新たな制御アルゴリズムを新たな走行場と対応付けてメモリ30に記憶する。
ここで、遺伝的ネットワークプログラミング(GNP:Genetic Network Programming)61について説明する。
遺伝的ネットワークプログラミングは、生物の進化過程を模倣して最適解又は準最適解を求める進化論的計算手法の一つであって、遺伝的アルゴリズム(GA:Genetic Algorithm)を拡張した遺伝的プログラミング(GP:Genetic Programming )を更に拡張したものである。
(遺伝的アルゴリズム(GA))
遺伝的アルゴリズム(GA)は、生物の進化過程において見られる、染色体の選択、交差及び突然変異を模倣し、工学的に応用した計算手法である。遺伝的アルゴリズムでは、設計変数を遺伝子とみなし、遺伝子をビット列構造で表現する。
ここで、図4のフローチャートを参照して、遺伝的アルゴリズムの基本的なアルゴリズムの流れを説明する。
先ず、初期集団を作成する(S41)。初期集団は、個体の集合であり、各個体は、解候補を記号化したものであって、それぞれが一つの遺伝子を有する。
次いで、各個体における評価値を計算する(S42)。
評価値とは、各個体の有効性を定量的に示す指標をいい、例えば、燃費の良さを評価値とすることができる。
次いで、評価値に基づいて個体を選択する(S43)。
個体の選択とは、次世代に残す個体を選出することをいう。
次いで、選択された個体の交叉及び突然変異を行う(S44)。
交叉とは、親世代の遺伝子を交換し、子世代として新しい遺伝子を作成することをいう。また、突然変異とは、親世代に遺伝子の一部をランダムに書き換え、子世代とすることをいう。
次いで、最終世代の判定を行う(S45)。
最終世代になるまで、上記のS42〜S44のステップを繰り返す。
このようにして、最適解又は準最適解を探索する。
(遺伝的プログラミング(GP))
遺伝的プログラミング(GP)のアルゴリズムの流れも、図4に示したものと基本的に同じであるが、遺伝的プログラミング(GP)では、遺伝子を、ノード関数を用いた木構造で表現する。そして、ノード関数を用いてif−then文による条件判断を行い、処理を実行する。これにより、遺伝的プログラミングでは(GP)では、遺伝的アルゴリズム(GA)のビット列構造では扱えなかった構造的なシステムを扱うことができる。
(遺伝的ネットワークプログラミング(GNP))
遺伝的ネットワークプログラミング(GNP)のアルゴリズムの流れも、図4に示したものと基本的に同じであるが、遺伝的ネットワークプログラミング(GNP)では、図5に示すように、集団を構成する各個体が、ノード関数が有向枝によって相互に接続された有向グラフ(ネットワーク)構造を有する。ノード関数は、判定ノードと処理ノードの二種類のノードから構成される。判定ノードは、if−then文による条件判断及び分岐を担う。一方、処理ノードは、定められた処理(行動)を実行する役割を有する。また、判定ノードからは、分岐の数だけ有向枝が伸びる。一方、処理ノードからは、一本の有向枝のみが伸びる。
なお、遺伝的ネットワークプログラミング(GNP)では、どの個体でもノード数が一定であるため、ブロート(解の膨張)が発生しない。
さらに、図6に、遺伝的ネットワークプログラミング(GNP)の一個体の遺伝子の一例を示す。遺伝子は、図6に示す表現型のようにネットワーク状に表現され、プログラム上では、図6に示す遺伝子型のように記述される。遺伝子型の「NIDi」は、ノードiのIDであり、設定したノードの数だけ存在する。また、遺伝子型の「NTi」は、ノード関数を表し、「NTi=1」ならば判定ノードを表し、「NTi=2」ならば処理ノードを表す。遺伝子型の「IDi」は、ノード関数IDを表し、判定ノード及び処理ノード内容を記述したノートライブラリのラベルを示す。そして、「NTi」と「IDi」によって、ノートライブラリに記述されたノード内容のうち、実行されるノード内容が決定される。遺伝子型の「Ci1」及び「Ci2」は、ノードiから伸びる有向枝の接続先情報であり、接続するノードIDが記載される。なお、処理ノードは、接続先が一つしかないため、処理ノードにCi2は存在しない。
このような各個体の評価値は、個体の達成度や有効性を数値化したものであり、その値は、評価換算によって求められる。評価関数の計算式は、問題に依存して設計者によって設定される。そして、個体の評価値に基づいて遺伝子操作が行われるので、遺伝的ネットワークプログラミング(GNP)の最適化は、評価値の最適化に対応する。
そして、交叉や突然変異を実行する前に、選択により、評価値の高い個体を優先的に選出する。これにより、評価値の高い個体の遺伝子が次世代へ受け継がれる。選択方式の例として、ルーレット選択、トーナメント選択及びエリート保存選択が挙げられる。
ルーレット選択では、交叉及び突然変異操作を加える個体を選出するため、各個体の子孫は、その評価値に比例した確率で選ばれる。i番目の個体の評価値をfiとすると、下記の(1)式により、i番目の個体が選ばれる確率piが求まる。
pi=fi/Σf ・・・(1)
トーナメント選択では、交叉及び突然変異操作を加える個体を選出するため、予め設計者によって決められた数だけ個体集団の中からランダムで個体を取り出し、その中で最も適応度の高い個体を選択する。これを必要な個体数が得られるまで繰り返す。
エリート保存選択では、その世代における評価値の高い個体を一定数そのまま次世代へ残す操作を行う。これにより、最適個体の評価が悪化することを防ぐことができる。
交叉は、選択された2個の個体間で行われ、2個の子個体を生成する。このとき、交叉するノードどうしの遺伝子情報は全て交換される。ここで、図7を参照して、交叉の手順について説明する。
先ず、親個体の集団から2個の親個体を任意に選択する。図7では、「親1」及び「親2」が選択される。次いで、選択した親個体の一方「親1」において、設定した交叉確率に基づいて、交叉すべきノードを選択する。図7では、「親1」のノード「P1」が選択される。次いで、一方の親個体「親1」で選択されたノード「P1」と、他方の親個体「親2」における「P1」と同一識別番号のノード「P2」との間で、全ての遺伝子を交換する。このようにして生成された2個の個体「子1」及び「子2」が、次世代の個体となる。
突然変異は、1個の親個体内で行われ、1個の子個体が生成される。突然変異には、接続先ノードを変更するものと、ノード内容を変更するものとの2種類がある。ここで、図8を参照して、突然変異について説明する。
まず、接続先ノードを変更する突然変異(突然変異A)では、1個体を任意に選択し、設定した突然変異確率に基づき、突然変異させるべきノードを選択する。そして、選択されたノードの接続先をランダムに変更する。図8では、突然変異Aにおいて、ノードP1の接続先ノードが、右上の処理ノードから、左上の判断ノードへ切り替えられている。
また、ノード内容を変更する突然変異(突然変異B)では、1個体を任意に選択し、設定した突然変異確率に基づき、突然変異させるべきノードを選択する。そして、選択されたノードのラベルをランダムに変更する。図8では、突然変異Bにおいて、選択されたノードP1がノードP2に変更されている。このようにして、次世代の個体が生成される。
次に、図9のフローチャートを参照して、本実施形態による車両用制御装置の動作について説明する。
なお、図9のフローチャートの左側部分は、同期処理モジュール110に処理に対応し、右側部分は、非同期処理モジュール120の処理に対応する。
まず、同期処理モジュール110の処理に対応する処理を説明する。図9に示すように、まず検出手段10によって検出された、車両を運転するドライバの状態、車外環境状態、及び車両状態車両状況の状況データが、恒等写像モデル21の入力層及び出力層の各ユニットにパラメータとして入力される(S91)。
続いて、恒等写像モデル21の中間層から、状況データを圧縮したパラメータが抽出される(S92)。
まず、非線形型階層モデルの閾値が更新されていない場合(S93で「no」の場合)を説明する。
この場合、恒等写像モデル21の中間層から出力されたパラメータを、ニューラルネットワークの非線形階層型モデルの入力層に入力して、走行場を推定する(S95)。その結果、図3の示す非線形階層型モデル22では、出力層の「渋滞」、「平坦」、「上り」及び「下り」の4つユニットの何れかに対応する走行場が推定される。
続いて、メモリ30から、推定された走行場に対応する制御アルゴリズムが読み出される。車両が遭遇している走行場が「平坦」の走行場であると推定された場合には、メモリ30から、「平坦」の走行場に対応する制御アルゴリズムが読み出される。そして、この制御アルゴリズムに基づいて、車両が制御される。
次に、非同期処理モジュール120の処理に対応する処理を説明する。非同期処理モジュール120の学習評価部60では、ステップS92で恒等写像モデル21の中間層から出力されたパラメータを入力して、遺伝的ネットワークプログラミング(GNP)61により、制御アルゴリズムを学習評価する(S97)。
このGNP61によって生成された制御アルゴリズムにおいて、同じノードを有する新たな制御アルゴリズムが繰り返し出現した場合(S98で「yes」の場合)に、その新たな制御アルゴリズムに対応する走行場を新たな走行場として認識する(S99)。
ここで、図10に、GNP61によって生成された制御アルゴリズムの有向グラフ構造例を示す。図10の(1)〜(4)の有向グラフ構造は、それぞれ、「渋滞」、「平坦」、「上り」及び「下り」の走行場に対応する制御アルゴリズムを表している。これに対して、図10の(5)〜(9)の有向グラフ構造は、走行場として想定されていないものに対応する制御アルゴリズムを表している。
そして、図10の(5)〜(9)の有向グラフ構造のうち、図10の(8)に示す有向グラフ構造と同じノードを有するものが、繰り返し出現した場合に、その有向グラフ構造で表される新たな制御アルゴリズムに対応する走行場が新たな走行場として認識される。
なお、新たな走行場を認識するための、同じノードを有する有向グラフ構造の出現の繰り返し回数は、経験的に任意の回数を設定するとよい。
続いて、学習用の非線形階層型モデル62の出力層に、その新たな走行場に対応する新たな出力ユニットを追加した新たな学習用階層型モデルを生成し、その学習用の非線形型階層型モデルで学習を行う(S100)。図11(A)に示す古い学習用の非線形階層型モデル62では、出力層は、「渋滞」、「平坦」、「上り」及び「下り」の走行場に対応する4つのユニットを有していた。これに対して、図11(B)に示す新しい学習用の非線形階層型モデル62では、出力層は、「渋滞」、「平坦」、「上り」及び「下り」の走行場に加えて、「新たな走行場」に対応する5つのユニットを有している。
そして、新たな学習用の非線形階層型モデル62で学習することにより、出力層の各ユニットのパラメータの閾値が変更される。
ここで、図12に、非線形階層型モデルの出力層のパラメータの閾値を模式的に示す。なお、図12では、便宜的に、縦軸と横軸で表された2つのパラメータの組合せで閾値を示しているが、一般に、パラメータの数は3以上である。
図12(A)は、非線形階層型モデルの出力層が4つのユニットを有するときの4つの走行場それぞれのパラメータの閾値を示す模式図である。これに対し、図12(B)は、非線形階層型モデルの出力層が、5つのユニットを有するときの5つの走行場それぞれのパラメータの閾値を示す模式図である。図12(A)及び(B)から分かるように、「新たな走行場」が追加されたことにより、残りの「渋滞」、「平坦」、「上り」及び「下り」の4つの走行場のパラメータの閾値も更新される。
そして、非線形階層型モデルの出力層のパラメータの閾値が更新された場合(S93で「yes」の場合)、非線形階層型モデル22も図11(B)に示すものに更新される。
これにより、予め設定されていなかった新たな走行場を含む、より多様な走行場に対応することが可能となる。
以下、本発明の第2実施形態を説明する。第2実施形態による車両用制御装置では、車両を運転するドライバを識別するドライバ識別部(図示せず)を更に有し、推定部20は、ドライバごとに個別に設けられている。
一般に、車両の運転特性の傾向はドライバごとに異なっている。このため、同じ「渋滞」や「平坦」といった走行場であっても、ドライバによって、検出されるデータの内容の傾向が異なることがある。
そこで、第2実施形態では、登録されたドライバごとに推定部20をそれぞれ設けている。また、ドライバごとに走行場を推定する以外は、上記第1実施形態による処理を同じ処理を行う。
なお、ドライバ識別部によるドライバの識別にあたっては、例えば、車内カメラにより撮像されたドライバの頭部の画像を画像認識してドライバを識別してもよいし、また、車両のキーにドライバごとの識別信号を付与して、ドライバを識別してもよいし、また、検出部10によって検出された車両の運転特性からドライバを識別してもよい。
このように、ドライバごとに推定手段を個別に設けることにより、個々のドライバの運転特性の傾向に合わせて、走行場を的確に推定することができる。
上述の実施形態においては、本発明を特定の条件で構成した例について説明したが、本発明は種々の変更及び組み合わせを行うことができ、これに限定されるものではない。例えば、ニューラルネットワークの降等写像モデル及び非線形階層型モデルのユニット数及び層数は、実施例のものに限定されない。
10 検出部
11 ドライバ状態モニタ
12 車外環境モニタ
13 車両状態モニタ
20 推定部
30 選択部
40 変換部
50 メモリ
60 学習評価部
61 遺伝的ネットワークプログラミング(GNP)
62 学習用階層型モデル
70 車内LAN
71 パワートレーン制御モジュールECU
72 モータ制御ユニットECU
73 バッテリ制御モジュールECU
74 ブレーキ制御モジュールECU
81 エンジン
82 モータ/発電機
83 高圧バッテリ
84 ブレーキ
100 コアモジュールECU
110 同期処理モジュール
120 非同期処理モジュール

Claims (3)

  1. 車両を運転するドライバの状態、車外環境状態、及び車両状態の少なくとも一つの状態データを検出する検出手段と、
    上記検出手段によって検出された状態データに基づいて、車両が遭遇している走行場を推定する推定手段と、
    を有し、
    上記推定手段は、恒等写像モデルと、非線形の階層型モデルとを有し、
    上記恒等写像モデルの入力層及び出力層の各ユニットに、上記状態データがパラメータとして入力され、
    上記恒等写像モデルの中間層の各ユニットのパラメータが、上記階層型モデルの入力層の各ユニットにそれぞれ入力され、上記階層型モデルの出力層の各ユニットは、複数の走行場にそれぞれ対応し、
    上記推定手段は、上記階層型モデルの出力層に出力されたパラメータに基づいて、上記複数の走行場の一つとして、車両が遭遇している走行場を推定し、
    評価学習手段を更に有し、上記評価学習手段は、
    上記恒等写像モデルの上記中間層に出力されるパラメータに基づいて進化的アルゴリズムによって生成された制御アルゴリズムをモニタし、
    上記制御アルゴリズムにおいて、同じノードを有する新たな制御アルゴリズムが繰り返し出現した場合に、上記新たな制御アルゴリズムに対応する走行場を新たな走行場として認識し、
    上記階層型モデルの出力層に、上記新たな走行場に対応する新たな出力ユニットを追加した学習用階層型モデルを生成して、上記学習用階層型モデルで学習を行い、
    上記推定手段は、上記階層型モデルを上記学習用階層型モデルに更新し、
    上記評価学習手段による処理は、上記推定手段による処理とは非同期にて行われ、上記評価学習手段による処理周期は、上記推定手段による処理周期よりも長い、
    ことを特徴とする車両用制御装置。
  2. 走行場と車両の制御アルゴリズムとが互いに対応付けて記憶された記憶手段と、
    前記記憶手段に記憶された制御アルゴリズムから、上記推定手段によって推定された走行場に対応する制御アルゴリズムを選択する選択手段と、
    選択された制御アルゴリズムを車両の制御パラメータに変換する変換手段と、
    を更に有し、
    上記階層型モデルが更新された場合に、上記新たな制御アルゴリズムを上記新たな走行場と対応付けて上記記憶手段に記憶する
    ことを特徴とする請求項記載の車両用制御装置。
  3. 車両を運転するドライバを識別するドライバ識別手段を更に有し、
    上記推定手段は、ドライバごとに個別に設けられている
    ことを特徴とする請求項1又は2に記載の車両用制御装置。
JP2012193499A 2012-09-03 2012-09-03 車両用制御装置 Expired - Fee Related JP6011788B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012193499A JP6011788B2 (ja) 2012-09-03 2012-09-03 車両用制御装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012193499A JP6011788B2 (ja) 2012-09-03 2012-09-03 車両用制御装置

Publications (2)

Publication Number Publication Date
JP2014046889A JP2014046889A (ja) 2014-03-17
JP6011788B2 true JP6011788B2 (ja) 2016-10-19

Family

ID=50606965

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012193499A Expired - Fee Related JP6011788B2 (ja) 2012-09-03 2012-09-03 車両用制御装置

Country Status (1)

Country Link
JP (1) JP6011788B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101814364B1 (ko) * 2008-09-17 2018-01-03 사우디 아람코 테크놀로지스 컴퍼니 폴리카보네이트의 정제

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6796527B2 (ja) 2017-03-29 2020-12-09 株式会社日立製作所 車両状態監視装置、車両状態監視システム及び車両状態監視方法
KR102070527B1 (ko) * 2017-06-22 2020-01-28 바이두닷컴 타임즈 테크놀로지(베이징) 컴퍼니 리미티드 자율 주행 차량 교통 예측에서 예측되는 궤적에 대한 평가 프레임 워크
WO2019186996A1 (ja) * 2018-03-30 2019-10-03 日本電気株式会社 モデル推定システム、モデル推定方法およびモデル推定プログラム
CN109177979B (zh) * 2018-08-27 2021-01-05 百度在线网络技术(北京)有限公司 评估乘车舒适度的数据处理方法、装置及可读存储介质
CN111806445A (zh) * 2020-05-29 2020-10-23 北汽福田汽车股份有限公司 车辆横向控制方法和装置、介质、设备、车辆
CN115556758A (zh) * 2022-09-26 2023-01-03 湖北大学 一种基于增强现实的预警系统及预警方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10283334A (ja) * 1997-04-10 1998-10-23 Fuji Electric Co Ltd ニューラルネットワークの入力層最適化方法
JP2004034881A (ja) * 2002-07-05 2004-02-05 Honda Motor Co Ltd 車両の走行制御装置
JP2009073465A (ja) * 2007-08-28 2009-04-09 Fuji Heavy Ind Ltd 安全運転支援システム
JP5156329B2 (ja) * 2007-10-18 2013-03-06 ヤマハ発動機株式会社 パラメトリック多目的最適化装置、パラメトリック多目的最適化方法およびパラメトリック多目的最適化プログラム
JP5665400B2 (ja) * 2010-07-21 2015-02-04 学校法人慶應義塾 車両用制御装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101814364B1 (ko) * 2008-09-17 2018-01-03 사우디 아람코 테크놀로지스 컴퍼니 폴리카보네이트의 정제
KR20180001589A (ko) * 2008-09-17 2018-01-04 사우디 아람코 테크놀로지스 컴퍼니 폴리카보네이트의 정제
KR102028314B1 (ko) * 2008-09-17 2019-10-07 사우디 아람코 테크놀로지스 컴퍼니 폴리카보네이트의 정제

Also Published As

Publication number Publication date
JP2014046889A (ja) 2014-03-17

Similar Documents

Publication Publication Date Title
JP6011788B2 (ja) 車両用制御装置
JP7361775B2 (ja) 自律運転のための個人運転スタイル学習
CN110949398B (zh) 一种车辆编队行驶中头车驾驶员异常驾驶行为检测方法
KR102461831B1 (ko) 자율주행 차량 군집 운행을 위한 비신호 교차로에서의 강화학습기반 통행 개선을 위한 장치 및 방법
Brown et al. A taxonomy and review of algorithms for modeling and predicting human driver behavior
JP2022532972A (ja) 敵対的模倣学習に基づく無人運転車両車線変更決定方法及びシステム
CN109739219A (zh) 通行路径的规划方法、装置、设备及可读存储介质
US11465650B2 (en) Model-free reinforcement learning
EP0978790A1 (en) Control system and method for controlling object using emotions and personality generated in the object
CN107179870A (zh) 信息提供装置及存储信息提供程序的存储介质
JP7060080B2 (ja) 組み合わせ制御システム、組み合わせ制御方法、および、組み合わせ制御プログラム
Deng et al. Prediction of human driver behaviors based on an improved HMM approach
CN109784526A (zh) 通行路径的规划方法、装置、设备及可读存储介质
WO2007011976A2 (en) Crash prediction network with visual input for vehicle
JP2009051430A (ja) 走行支援システム
Xie et al. A driving behavior awareness model based on a dynamic Bayesian network and distributed genetic algorithm
JP6924629B2 (ja) 自動制御装置およびその制御方法
WO2018173933A1 (ja) 情報処理装置、走行データ処理方法、車両およびプログラム記録媒体
Vasquez et al. Multi-objective autonomous braking system using naturalistic dataset
Odeh Hybrid algorithm: fuzzy logic-genetic algorithm on traffic light intelligent system
JP2019093896A (ja) 情報処理装置、分類方法およびコンピュータ・プログラム
JP5665400B2 (ja) 車両用制御装置
Selvaraj et al. An ML-aided reinforcement learning approach for challenging vehicle maneuvers
JP7350188B2 (ja) 運転支援装置、学習装置、運転支援方法、運転支援プログラム、学習済モデルの生成方法、学習済モデル生成プログラム
KR102046518B1 (ko) 복수의 이동체의 주위 환경 추정 시스템, 주위 환경 추정을 위한 서버, 및 서버의 복수의 이동체에 대한 주위 환경 추정 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150312

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160203

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160404

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160824

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160906

R150 Certificate of patent or registration of utility model

Ref document number: 6011788

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees