JP2015170126A

JP2015170126A - パラメータ学習装置、運転支援装置、及びプログラム

Info

Publication number: JP2015170126A
Application number: JP2014044321A
Authority: JP
Inventors: 峻田口; Shun Taguchi
Original assignee: Toyota Central R&D Labs Inc
Current assignee: Toyota Central R&D Labs Inc
Priority date: 2014-03-06
Filing date: 2014-03-06
Publication date: 2015-09-28
Anticipated expiration: 2034-03-06
Also published as: JP6299289B2

Abstract

【課題】ドライバに合ったモデルパラメータを学習することができるようにする。
【解決手段】情報取得部２６が、車両の走行状態を示すセンサ情報を取得する。そして、パラメータ学習部３６が、センサ情報を用いて車両のドライバの複数の運転行動を離散的にモデル化し、かつ、条件分岐により切り替えるようにモデル化した運転行動モデルを、連続かつ微分可能な関数で近似した近似モデルと、情報取得部２６によって取得された車両のセンサ情報とに基づいて、運転行動モデルの条件分岐で用いられる条件パラメータを含むモデルパラメータを学習する。
【選択図】図１

Description

本発明は、パラメータ学習装置、運転支援装置、及びプログラムに係り、特に、ドライバの運転行動モデルのモデルパラメータを学習するパラメータ学習装置、運転支援装置、及びプログラムに関する。

従来より、車両の挙動を表す挙動データ及びドライバの操作を表す操作データからなる検出データを取得する検出データ取得手段と、様々な運転環境にて取得された前記検出データをクラスタリングすることで予め生成され、それぞれが異なった運転環境に対応する複数のクラスタからなるクラスタ分布を使用し、前記検出データ取得手段にて逐次取得される検出データを前記クラスタ分布と照合することによって、車両の運転環境を判定する環境判定手段と、前記環境判定手段での判定結果の種類毎に用意され、ドライバの運転傾向をモデル化した推定モデルを記憶するモデル記憶手段と、前記検出データ取得手段にて取得された検出データに基づいて前記推定モデルを学習する学習手段と、前記運転環境判定装置での判定結果に従って選択した推定モデルを用い、前記検出データに基づいてドライバの運転状況を推定する推定手段と、を備え、前記検出データには、自車速及び先行車との車間距離が少なくとも含まれ、前記学習手段は、前記自車速と前記車間距離に関わる車間パラメータとの関係に基づいて、前記自車速から前記車間パラメータの目標値を推定するための推定モデルを生成し、前記推定手段は、前記自車速と前記推定モデルとによって設定された目標値と前記車間パラメータの実測値との差から前記運転状況を推定し、前記車間パラメータが、車間距離の逆数、もしくは衝突余裕時間の逆数のうち少なくとも一方を含むことを特徴とする運転状況推定装置が知られている（例えば、特許文献１）。

特開２０１３−１７８８２７号公報

しかしながら、上記の特許文献１に記載の技術では、モデルにおける切り替え部（運転環境判定部）の切り替え条件は、実測データから逐次的に学習することはできないため、市場においては、個々のドライバに合わせて切り替え条件を学習することができない。

本発明は、上記の事情に鑑みてなされたもので、ドライバに合ったモデルパラメータを学習することができる車両挙動予測装置及びプログラムを提供することを目的とする。

上記の目的を達成するために本発明に係るパラメータ学習装置は、車両の走行状態を示すセンサ情報を取得する取得手段と、前記センサ情報を用いて車両のドライバの複数の運転行動を離散的にモデル化し、かつ、条件分岐により切り替えるようにモデル化した運転行動モデルを、連続かつ微分可能な関数で近似した近似モデルと、前記取得手段によって取得された前記車両のセンサ情報とに基づいて、前記運転行動モデルの前記条件分岐で用いられる条件パラメータを含むモデルパラメータを学習するパラメータ学習手段と、を含んで構成されている。

本発明に係るプログラムは、コンピュータを、車両の走行状態を示すセンサ情報を取得する取得手段、及び前記センサ情報を用いて車両のドライバの複数の運転行動を離散的にモデル化し、かつ、条件分岐により切り替えるようにモデル化した運転行動モデルを、連続かつ微分可能な関数で近似した近似モデルと、前記取得手段によって取得された前記車両のセンサ情報とに基づいて、前記運転行動モデルの前記条件分岐で用いられる条件パラメータを含むモデルパラメータを学習するパラメータ学習手段として機能させるためのプログラムである。

本発明によれば、取得手段によって、車両の走行状態を示すセンサ情報を取得する。

そして、パラメータ学習手段によって、センサ情報を用いて車両のドライバの複数の運転行動を離散的にモデル化し、かつ、条件分岐により切り替えるようにモデル化した運転行動モデルを、連続かつ微分可能な関数で近似した近似モデルと、取得手段によって取得された車両のセンサ情報とに基づいて、運転行動モデルの条件分岐で用いられる条件パラメータを含むモデルパラメータを学習する。

このように、センサ情報を用いて車両のドライバの複数の運転行動を離散的にモデル化し、かつ、条件分岐により切り替えるようにモデル化した運転行動モデルを、連続かつ微分可能な関数で近似した近似モデルと、取得された車両のセンサ情報とに基づいて、運転行動モデルの条件分岐で用いられる条件パラメータを含むモデルパラメータを学習することにより、ドライバに合ったモデルパラメータを学習することができる。

本発明に係る、前記近似モデルは、前記運転行動モデルをシグモイド関数によって連続かつ微分可能な関数で近似した近似モデルであるようにすることができる。

また、前記取得手段は、前記車両の位置情報を含むセンサ情報を取得し、前記パラメータ学習手段は、拡張カルマンフィルタを用いて、前記取得手段によって取得した前記車両の位置情報を観測値として、前記モデルパラメータを学習するようにすることができる。

また、前記取得手段は、前記車両が走行する走路における定常走行速度と、前記車両が走行する走路の曲率と、前記車両の前方を走行する車両との距離を示す前方車両情報とを含むセンサ情報を取得し、前記運転行動モデルは、前記車両の走路上の目標位置を決定し、前記定常走行速度を、定常走行に関する速度制約条件を満たす上限速度として算出し、前記走路の曲率に基づいて、カーブ走行に関する速度制約条件を満たす上限速度を算出し、前記前方車両情報に基づいて、前方車両追従に関する速度制約条件を満たす上限速度を算出し、前記決定された走路上の目標位置に基づいて、前後位置制御に関する速度制約条件を満たす上限速度を算出し、前記算出された上限速度のうちの何れかを目標速度として選択するようにモデル化されたようにすることができる。

また、前記取得手段は、前記車両の走路上の信号情報と、前記車両の目的地とを含むセンサ情報を取得し、前記運転行動モデルは、前記信号情報に基づいて、信号停止に関する位置制約条件を満たす車両位置を算出し、前記車両の目的地に基づいて求められた経路情報に基づいて、経路に関する位置制約条件を満たす車両位置を算出し、前記算出された車両位置のうちの何れかを選択し、選択した位置を目標位置として決定するようにモデル化されたようにすることができる。

本発明に係る運転支援装置は、上記のパラメータ学習装置と、パラメータ学習装置によって学習された前記モデルパラメータと、前記運転行動モデルと、前記取得手段によって取得された前記センサ情報とに基づいて、前記車両のドライバの運転支援を行う運転支援手段と、を含んで構成されている。

また、本発明のプログラムは、記憶媒体に格納して提供することも可能である。

以上説明したように、本発明のパラメータ学習装置及びプログラムによれば、センサ情報を用いて車両のドライバの複数の運転行動を離散的にモデル化し、かつ、条件分岐により切り替えるようにモデル化した運転行動モデルを、連続かつ微分可能な関数で近似した近似モデルと、取得された車両のセンサ情報とに基づいて、運転行動モデルの条件分岐で用いられる条件パラメータを含むモデルパラメータを学習することにより、ドライバに合ったモデルパラメータを学習することができる、という効果が得られる。
また、本発明の運転支援装置及びプログラムによれば、運転特性パラメータ学習装置によって学習されたモデルパラメータと、運転行動モデルと、取得されたセンサ情報とに基づいて、車両のドライバの運転支援を行うことにより、ドライバに合った運転支援を行うことができる、という効果が得られる。

本発明の第１の実施の形態に係る運転支援装置を示すブロック図である。本発明の第１の実施の形態に係る運転支援装置における予測処理の概念を示す概念図である。本発明の第１の実施の形態に係る運転支援装置におけるフィルタリング処理の概念を示す概念図である。本発明の第１の実施の形態に係るパラメータ学習部３６の詳細を示すブロック図である。本発明の第１の実施の形態に係る運転支援装置における運転支援処理ルーチンの内容を示すフローチャートである。本発明の第１の実施の形態に係る運転支援装置における目標速度計算処理ルーチンの内容を示すフローチャートである。本発明の第１の実施の形態に係る運転支援装置におけるパラメータ学習処理ルーチンの内容を示すフローチャートである。本発明の第１の実施の形態に係る運転支援装置における予測処理ルーチンの内容を示すフローチャートである。本発明の第１の実施の形態に係る運転支援装置におけるフィルタリング処理ルーチンの内容を示すフローチャートである。本発明の第２の実施の形態に係る状態空間モデルを示す図である。本発明の第２の実施の形態に係る運転支援装置を示すブロック図である。本発明の第２の実施の形態に係る目標運転操作量計算部２３０の詳細を示すブロック図である。本発明の第２の実施の形態に係る運転行動モデル計算部２５０の詳細を示すブロック図である。本発明の第２の実施の形態に係る車両物理モデル計算部３５０の詳細を示すブロック図である。本発明の第２の実施の形態に係るパラメータ学習部２３６の詳細を示すブロック図である。本発明の第２の実施の形態に係る予測部２３６０の詳細を示すブロック図である。本発明の第２の実施の形態に係る近似運転行動モデル計算部２４００の詳細を示すブロック図である。本発明の第２の実施の形態に係る車両物理モデル計算部２５００の詳細を示すブロック図である。本発明の第２の実施の形態に係る運転支援装置における運転支援処理ルーチンの内容を示すフローチャートである。本発明の第２の実施の形態に係る運転支援装置における目標運転操作量計算処理ルーチンの内容を示すフローチャートである。本発明の第２の実施の形態に係る運転支援装置におけるパラメータ学習処理ルーチンの内容を示すフローチャートである。本発明の第２の実施の形態に係る運転支援装置における予測処理ルーチンの内容を示すフローチャートである。

以下、図面を参照して、本発明の実施の形態について説明する。本実施の形態では、運転行動モデルのモデルパラメータを学習すると共に、運転行動モデル用いて車両のドライバの運転支援を行う運転支援装置に、本発明を適用した場合を例に説明する。なお、本実施の形態では、複数の運転行動を切り替えるためのパラメータを学習するアルゴリズムとして、拡張カルマンフィルタを用いた場合を例に説明する。

＜第１の実施の形態＞
図１に示すように、第１の実施の形態に係る運転支援装置１０は、自車両の車速を検出する車速センサ１２と、自車両の位置を計測する位置計測部１４と、自車両の前方を走行する前方車両を検出する前方車情報取得部１６と、地図情報（道路ネットワークデータ）、道路情報、及び信号情報を記憶した道路ネットワークデータベース１８と、道路ネットワークデータベース１８から取得した信号情報に基づいて、次の信号の状態Ｓを取得する信号状態取得部２０と、次の信号機の停止線の位置を取得し、当該停止線の位置に基づいて停止減速度Ｄを算出する停止減速度取得部２２と、運転支援アクチュエータ４０を制御するコンピュータ２４と、運転支援を行うための運転支援アクチュエータ４０とを備えている。

位置計測部１４は、例えば、ＧＰＳセンサを用いて構成され、自車両の現時刻ｔの前後位置情報ｘ^＊ _ｔを計測する。

前方車情報取得部１６は、例えばレーザレーダ装置が該当し、自車両に対する前方車両までの走行方向の相対距離ｘ_ｆを計測し、相対距離ｘ_ｆと前方車両との相対速度とを前方車両情報として各時刻ｔについて取得する。なお、相対速度は、相対距離を時間微分することにより得られる。

道路ネットワークデータベース１８には、地図情報、道路情報、及び信号情報が記憶されている。地図情報及び道路情報には、信号機の位置と当該信号機に対する停止線の位置を示すデータが含まれている。信号情報には、信号機の位置と当該信号機の信号変化の周期を示すデータが含まれている。

信号状態取得部２０は、道路ネットワークデータベース１８から取得した信号情報に基づいて、時刻ｔにおける次の信号の状態Ｓを取得する。

停止減速度取得部２２は、道路ネットワークデータベース１８から取得した地図情報及び道路情報と、信号状態取得部２０によって取得された時刻ｔにおける次の信号の状態Ｓとに基づいて、次の信号の状態Ｓが青でない場合には、次の信号機の停止線の位置を取得し、当該停止線の位置に基づいて、停止減速度Ｄを算出する。

コンピュータ２４は、ＣＰＵと、ＲＡＭと、後述する運転支援処理ルーチン、目標速度計算処理ルーチン、パラメータ学習処理ルーチン、予測処理ルーチン、及びフィルタリング処理ルーチンを実行するためのプログラムを記憶したＲＯＭとを備え、機能的には次に示すように構成されている。コンピュータ２４は、車両の走行状態を示すセンサ情報を各時刻ｔについて取得する情報取得部２６と、運転特性パラメータが格納されている運転特性パラメータデータベース２８と、情報取得部２６によって取得されたセンサ情報と、運転特性パラメータデータベース２８に格納された運転特性パラメータに基づいて、運転支援のための目標速度を計算する目標速度計算部３０と、計算された目標速度及び情報取得部２６によって取得されたセンサ情報に基づいて、運転支援アクチュエータを制御する運転支援制御部３２と、近似モデルデータベース３４と、パラメータ学習部３６とを備えている。

情報取得部２６は、車両の走行状態を示すセンサ情報を各時刻ｔについて取得する。
具体的には、情報取得部２６は、車両のドライバの運転支援を行うときに、車速センサ１２によって計測された車速と、位置計測部１４によって計測された車両の前後位置ｘ^＊ _ｔと、前方車情報取得部１６によって取得された前方車両情報と、信号状態取得部２０によって取得された次の信号の状態Ｓと、停止減速度取得部２２によって算出された停止減速度Ｄとを逐次取得して、センサ情報として蓄積する。情報取得部２６は取得手段の一例である。

情報取得部２６は、取得したセンサ情報を、パラメータ学習部３６と、目標速度計算部３０とへ出力する。

運転特性パラメータデータベース２８には、後述するパラメータ学習部３６によって学習された運転特性パラメータが格納されている。

目標速度計算部３０は、情報取得部２６によって取得されたセンサ情報と、運転特性パラメータデータベース２８に格納された運転特性パラメータと、運転行動モデルとに基づいて、車両の目標速度を計算する。運転行動モデルは、センサ情報を用いて車両のドライバの複数の運転行動を離散的にモデル化し、かつ、条件分岐により切り替えるようにモデル化したものである。

例えば、運転行動モデルでは、条件分岐により、第１の運転行動、第２の運転行動、及び第３の運転行動を切り替え、切り替えられた運転行動に従って目標速度を計算する。第１〜第３の運転行動は、以下の条件分岐によって切り替えられる。

ここで、Ｓは車両からみて次の信号の色（信号の状態）を表し、Ｓ_ｂｌｕｅは青信号をあらわす。また、Ｄは次の信号の停止線で停止するのに必要な減速度（停止減速度）を表し、ｘ_ｆは前方車両との距離（前方車距離）を表し、ｖ_ｒは目標速度を表し、ｖは自車速度を表す。また、運転特性パラメータのうち、aとｂとは条件分岐で用いられる条件パラメータであり、ｃとｄとは目標速度を算出するためのモデルパラメータである。

運転支援制御部３２は、目標速度計算部３０によって計算された目標速度と、情報取得部２６によって取得されたセンサ情報に含まれる時刻ｔの車速とに基づいて、目標速度ｖ_ｒと時刻ｔの車速との差に応じて、運転支援アクチュエータ４０を制御する。

運転支援アクチュエータ４０は、例えば、アクセル操作量やブレーキ操作量を調整するためのアクチュエータである。

本実施の形態では、拡張カルマンフィルタを用いて、運転特性パラメータを学習する。以下、拡張カルマンフィルタの原理について説明する。

本実施の形態では、車両の前後位置ｘ_ｔと、車両の速度ｘ^・ _ｔと、車両の加速度ｘ^・・ _ｔと、運転特性パラメータ［ａ_ｔ，ｂ_ｔ，ｃ_ｔ，ｄ_ｔ］とを、以下の式（２）に示すように状態ベクトルＸ_ｔ＝［ｘ_ｔ，ｘ^・ _ｔ，ｘ^・・ _ｔ，ａ_ｔ，ｂ_ｔ，ｃ_ｔ，ｄ_ｔ］として構成する。なお、運転特性パラメータのうち［ａ_ｔ，ｂ_ｔ］は条件パラメータである。
また、以下の式（３）に示すように、位置計測部１４によって計測された車両の位置情報を観測値Ｙ_ｔ＝［ｘ_ｔ ^＊］として構成する。

（１）予測ステップ
まず、予測ステップにおける処理の概要について説明する。予測ステップでは、以下の式（４）に示すように、時刻ｔの状態ベクトルＸ_ｔ−１＝［ｘ_ｔ−１，ｘ^・ _ｔ−１，ｘ^・・ _ｔ−１，ａ_ｔ−１，ｂ_ｔ−１，ｃ_ｔ−１，ｄ_ｔ−１］と、システムノイズｕ_ｔ（誤差項）とに基づいて、時刻ｔの状態ベクトルＸ_ｔを算出する。以下の式（４）におけるｆ_ｔはシステムモデルである。本実施の形態では、システムモデルは、運転支援装置１０の目標速度計算部３０の運転行動モデルを近似した後述する近似モデルと、車両物理モデルとを含むモデルである。

また、観測値Ｙ_ｔは、観測行列Ｈ_ｔと観測ノイズｗ_ｔ（誤差項）とに基づいて、以下の式（５）に示すように算出される。なお、観測行列Ｈ_ｔは予め求められている。

図２に、予測ステップの概念図を示す。図２に示すように、予測ステップでは、フィルタリングステップで推定された時刻ｔ−１の状態ベクトルＸ_{ｔ−１｜ｔ−１}に基づいて、時刻ｔの状態ベクトルＸ_{ｔ｜ｔ−１}を予測する（中心値の予測）。なお、Ｘ_{ｔ｜ｔ−１}は、時刻ｔ−１までに利用可能なデータに基づき予測された時刻ｔの状態ベクトルを表す。また、Ｘ_{ｔ−１｜ｔ−１}は、時刻ｔ−１までに利用可能なデータに基づき推定された時刻ｔ−１の状態ベクトルを表す。

なお、以下では、添え字ｔ｜ｔ−１が付与された値は、時刻ｔ−１までに利用可能なデータに基づき予測された時刻ｔの事前推定値を表す。また、添え字ｔ｜ｔ（又は、ｔ−１｜ｔ−１）が付与された値は、時刻ｔまでに利用可能なデータに基づき推定された時刻ｔの事後推定値を表す。

また、予測ステップでは、システムモデルｆ_ｔを偏微分して得られる行列＾Ｆ_ｔと行列＾Ｇ_ｔとを、以下の式（６）〜（７）に従って算出する。

ここで、「’」はベクトルの転置を表す。

そして、上記式（６）〜（７）に従って算出した行列＾Ｆ_ｔと行列＾Ｇ_ｔと、前回のフィルタリングステップで推定された事前誤差共分散行列Ｐ_{ｔ｜ｔ−１}とに基づいて、以下の式（８）に従って、事前誤差共分散行列Ｐ_{ｔ｜ｔ−１}を算出する（分散の予測）。

なお、上記式（８）におけるＱ_ｔは、システム雑音ｕ_ｔ（誤差項）の分散を表す。

すなわち、予測ステップでは、時刻ｔの状態ベクトルＸ_{ｔ｜ｔ−１}を中心値とし、事前誤差共分散行列Ｐ_{ｔ｜ｔ−１}を分散とする確率分布を予測していることになる。

（２）フィルタリングステップ
次に、フィルタリングステップについての概要を説明する。図３に、フィルタリングステップの概念図を示す。図３に示すように、フィルタリングステップでは、上記式（２）で示した時刻ｔの状態ベクトルＸ_ｔの要素である車両の前後位置［ｘ_ｔ］と、上記式（３）で示した時刻ｔの車両の前後位置情報［ｘ^＊ _ｔ］（観測中心）とに基づいて、フィルタリングを行い、予測ステップで出力された時刻ｔの状態ベクトルＸ_{ｔ｜ｔ−１}を修正してＸ_ｔ｜ｔを算出すると共に、事前誤差共分散行列Ｐ_{ｔ｜ｔ−１}を修正して事後誤差共分散行列Ｐ_ｔ｜ｔを算出する。

具体的には、まず、フィルタリングステップでは、予測ステップで算出された事前誤差共分散行列Ｐ_{ｔ｜ｔ−１}と、観測行列Ｈ_ｔと、観測ノイズｗ_ｔ（誤差項）の分散Ｒ_ｔとに基づいて、以下の式（９）に従って、カルマンゲインＫ_ｔを算出する。

次に、算出されたカルマンゲインＫ_ｔと、予測ステップで算出された時刻ｔにおける状態ベクトルＸ_{ｔ｜ｔ−１}と、上記式（３）で示したＹ_ｔ＝［ｘ^＊ _ｔ］と、観測行列Ｈ_ｔとに基づいて、以下の式（１０）に従って、時刻ｔにおける状態ベクトルＸ_ｔ｜ｔを推定する。

そして、予測ステップで算出された事前誤差共分散行列Ｐ_{ｔ｜ｔ−１}と、算出されたカルマンゲインＫ_ｔと、観測行列Ｈ_ｔとに基づいて、以下の式（１１）に従って、事後誤差共分散行列Ｐ_ｔ｜ｔを算出する。

フィルタリングステップで算出された各値（カルマンゲインＫ_ｔ、状態ベクトルＸ_ｔ｜ｔ、事後誤差共分散行列Ｐ_ｔ｜ｔ）は、次回の予測ステップにおける処理で用いられる。

近似モデルデータベース３４には、目標速度計算部３０において用いられる運転行動モデルを、連続かつ微分可能な関数で近似した近似モデルが格納されている。本実施の形態では、条件パラメータである［ａ_ｔ，ｂ_ｔ］を、シグモイド関数によって連続かつ微分可能な関数で近似した近似モデルを用いる。
ここで、運転行動モデルを近似する方法について説明する。まず、上記式（１）のうち、以下の［］で示した、条件パラメータｂを用いた条件分岐の部分を、近似モデルによって近似する。

上記式（１２）における［］の部分は、以下の式（１３）に示すように近似することができる。

ここで、ｐ_１は、条件分岐の曖昧さを表す予め求められたパラメータである。また、上記式（１２）及び（１３）を、Ｖ_１を用いて書き直すと、以下の式（１４）、（１５）のようになる。

上記式（１４）の［］で示した、条件パラメータａを用いた条件分岐の部分は、以下の式（１６）に示すように近似することができる。

ここで、ｐ_２は、条件分岐の曖昧さを表す予め求められたパラメータである。そして、上記式（１）を、上記式（１５）と（１６）とを用いて書き直すと、以下の式（１７）のように表すことができる。

以上のように、条件パラメータａ、ｂを用いた運転行動モデルについて、上記式（１７）に示すようにシグモイド関数によって連続かつ微分可能な関数で近似した近似モデルを導出することができる。

パラメータ学習部３６は、近似モデルデータベース３４に格納された近似モデルと、情報取得部２６によって取得された車両の前後位置情報とに基づいて、運転行動モデルの条件分岐で用いられる条件パラメータａ，ｂを含む運動特性パラメータを学習する。図４に示すように、パラメータ学習部３６は、予測部３６０と、フィルタリング部３６２とを備えている。

予測部３６０は、近似モデルデータベース３４に格納された近似モデルと、フィルタリング部３６２によって前回推定された時刻ｔ−１の状態ベクトルＸ_ｔ−１とに基づいて、上記式（４）に従って、時刻ｔの状態ベクトルＸ_ｔを予測する（予測ステップ）。予測部３６０における処理は、拡張カルマンフィルタの予測ステップに対応する。

具体的には、まず、予測部３６０は、情報取得部２６によって取得されたセンサ情報に含まれる次の信号の状態Ｓ、前方車両との相対距離ｘ_ｆ、及び停止減速度Ｄと、近似モデルデータベース３４に格納された近似モデルとに基づいて、上記式（１７）に従って、目標速度ｖ_ｒを算出する。

次に、予測部３６０は、算出された目標速度ｖ_ｒと、時刻ｔ−１の状態ベクトルＸ_ｔ−１の要素である車両の速度ｘ^・ _ｔ−１とに基づいて、時刻ｔの加速度ｘ^・・ _ｔを予測する。例えば、予測部３６０は、車両物理モデルである比例制御モデルを用いて、車速ｘ^・ _ｔ−１と目標速度ｖ_ｒとの差に応じて、時刻ｔの加速度ｘ^・・ _ｔを予測する。

また、予測部３６０は、時刻ｔ−１の状態ベクトルＸ_ｔ−１の要素である［ｘ^・ _ｔ−１，ｘ^・・ _ｔ−１］とに基づいて、車両物理モデルに従って、時刻ｔの車速ｘ^・ _ｔを予測する。例えば、速度算出式ｘ^・ _ｔ＝ｘ^・ _ｔ−１＋ｘ^・・ _ｔ−１Ｔに従って、時刻ｔの車速ｘ^・ _ｔを予測する。Ｔは、時刻ｔから時刻ｔ−１までの経過時間を表す。

そして、予測部３６０は、予測された車両の速度ｘ^・ _ｔと、時刻ｔ−１の状態ベクトルＸ_ｔ−１の要素であるｘ_ｔ−１とに基づいて、車両物理モデルに従って、時刻ｔの車両の位置［ｘ_ｔ］を予測する。

上記式（２）における［ｘ_ｔ，ｘ^・ _ｔ，ｘ^・・ _ｔ］については、以上のように予測するが、運動特性パラメータ［ａ_ｔ，ｂ_ｔ，ｃ_ｔ，ｄ_ｔ］については、時刻ｔ−１の運動特性パラメータ［ａ_ｔ−１，ｂ_ｔ−１，ｃ_ｔ−１，ｄ_ｔ−１］をそのまま代入する。

また、予測部３６０は、上記式（６）〜（７）に従って、上記式（１７）で示した近似モデルの偏微分を行い、行列＾Ｆ_ｔと行列＾Ｇ_ｔとを算出する。上記式（１７）における目標速度は、シグモイド関数によって連続かつ微分可能な関数で近似されているため、偏微分をすることができる。

そして、予測部３６０は、算出された行列＾Ｆ_ｔと行列＾Ｇ_ｔと、前回フィルタリング部３６２によって推定された事前誤差共分散行列Ｐ_{ｔ｜ｔ−１}とに基づいて、上記式（８）に従って、事前誤差共分散行列Ｐ_{ｔ｜ｔ−１}を算出する。

フィルタリング部３６２は、情報取得部２６によって取得されたセンサ情報に含まれる車両の前後位置情報ｘ^＊ _ｔと、予測部３６０によって予測された時刻ｔの状態ベクトルＸ_ｔと、予測部３６０によって算出された事前誤差共分散行列Ｐ_{ｔ｜ｔ−１}とに基づいて、時刻ｔにおける状態ベクトルＸ_ｔを推定する（フィルタリングステップ）。フィルタリング部３６２における処理は、拡張カルマンフィルタにおけるフィルタリングステップに対応する。

具体的には、フィルタリング部３６２は、情報取得部２６によって取得されたセンサ情報に含まれる時刻ｔの車両の前後位置情報ｘ^＊ _ｔと、予測部３６０によって予測された時刻ｔの車両の前後位置情報ｘ_ｔと、予測部３６０によって算出された事前誤差共分散行列Ｐ_{ｔ｜ｔ−１}とに基づいて、上記式（９）に従って、カルマンゲインＫ_ｔを算出する。そして、フィルタリング部３６２は、算出されたカルマンゲインＫ_ｔと、予測部３６０によって算出された時刻ｔにおける状態ベクトルＸ_{ｔ｜ｔ−１}と、上記式（３）で示したＹ_ｔ＝［ｘ^＊ _ｔ］とに基づいて、上記式（１０）に従って、時刻ｔにおける状態ベクトルＸ_ｔ｜ｔを推定する。

また、フィルタリング部３６２は、算出されたカルマンゲインＫ_ｔと、予測部３６０によって算出された事前誤差共分散行列Ｐ_{ｔ｜ｔ−１}に基づいて、上記式（１１）に従って、事後誤差共分散行列Ｐ_ｔ｜ｔを算出する。

そして、フィルタリング部３６２は、推定された状態ベクトルＸ_ｔ｜ｔの要素である［ａ_ｔ，ｂ_ｔ，ｃ_ｔ，ｄ_ｔ］を運転特性パラメータとして更新し、運転特性パラメータデータベース２８へ格納する。

＜運転支援装置１０の動作＞
次に、第１の実施の形態に係る運転支援装置１０の動作について説明する。まず、ドライバの運転操作により車両が走行し、運転支援装置１０の情報取得部２６によってセンサ情報が各時刻ｔについて取得されているときに、運転支援装置１０において、図５に示す運転支援処理ルーチンが実行される。

まず、ステップＳ１００において、目標速度計算部３０によって、運転特性パラメータデータベース２８に格納された運動特性パラメータが読み出される。

次に、ステップＳ１０２において、情報取得部２６によって、時刻ｔ−１のセンサ情報を受け付ける。

ステップＳ１０４において、目標速度計算部３０によって、上記ステップＳ１０２で受け付けたセンサ情報と、上記ステップＳ１００で読み出された運転特性パラメータとに基づいて、目標速度ｖ_ｒを計算する。ステップＳ３０６は、図６に示す目標速度計算処理ルーチンによって実現される。

＜目標速度計算処理ルーチン＞
まず、ステップＳ２００において、上記ステップＳ１０２で取得されたセンサ情報に含まれる時刻ｔ−１の信号の状態Ｓに基づいて、車両からみて次の信号が青であるか否かを判定する。次の信号が青である場合には、ステップＳ２０２へ進む。一方、次の信号が青でない場合には、ステップＳ２０４へ進む。

ステップＳ２０２において、上記ステップＳ１０２で取得されたセンサ情報に含まれる時刻ｔ−１の前方車距離ｘ_ｆと、上記ステップＳ１００で読み出された運転特性パラメータｂとに基づいて、前方車距離ｘ_ｆが運転特性パラメータｂより大きいか否かを判定する。前方車距離ｘ_ｆが運転特性パラメータｂより大きい場合には、ステップＳ２０６へ進む。一方、前方車距離ｘ_ｆが運転特性パラメータｂ以下の場合には、ステップＳ２０８へ進む。

ステップＳ２０４において、上記ステップＳ１０２で取得されたセンサ情報に含まれる時刻ｔ−１の停止減速度Ｄと、上記ステップＳ１００で読み出された運転特性パラメータａとに基づいて、停止減速度Ｄが運転特性パラメータａより大きいか否かを判定する。停止減速度Ｄが運転特性パラメータａより大きい場合には、ステップＳ２０２へ移行する。一方、停止減速度Ｄが運転特性パラメータａ以下の場合には、ステップＳ２１０へ進む。

ステップＳ２０６において、目標速度ｖ_ｒに上記ステップＳ１００で読み出された運転特性パラメータｃを代入する。

ステップＳ２０８において、上記ステップＳ１００で読み出された運転特性パラメータｄと、上記ステップＳ１０２で取得されたセンサ情報に含まれる時刻ｔ−１の前方車距離ｘ_ｆと、センサ情報に含まれる時刻ｔ−１の車速とに基づいて、算出式ｄ×（前方車距離ｘ_ｆ／車速）に従って、目標速度ｖ_ｒを算出する。

ステップＳ２１０において、目標速度ｖ_ｒに０を代入する。

ステップＳ２１２において、上記ステップＳ２０６で算出された目標速度ｖ_ｒ、上記ステップＳ２０８で算出された目標速度ｖ_ｒ、及び上記ステップＳ２１０で算出された目標速度ｖ_ｒの何れか１つを、目標速度として出力して、目標速度計算処理ルーチンを終了する。

次に、運転支援処理ルーチンに戻り、ステップＳ１０６において、運転支援制御部３２によって、上記ステップＳ３０６で出力された目標速度ｖ_ｒと、センサ情報に含まれる時刻ｔ−１の車速とに基づいて、運転支援アクチュエータ４０の制御量を算出する。

ステップＳ１０８において、上記ステップＳ１０６で算出された制御量に基づいて、運転支援アクチュエータ４０を制御し、ドライバの運転支援を行う。

ステップＳ１１０において、パラメータ学習部３６によって、運動特性パラメータを学習する。ステップＳ１１０は、図７に示すパラメータ学習処理ルーチンによって実現される。

＜パラメータ学習処理ルーチン＞
まず、ステップＳ３００において、予測部３６０によって、予測処理を実行する。ステップＳ３００は、図８に示す予測処理ルーチンによって実現される。

＜予測処理ルーチン＞
まず、ステップＳ４００において、予測部３６０によって、上記ステップＳ１０２で受け付けたセンサ情報に含まれる次の信号の状態Ｓ、前方車両との相対距離ｘ_ｆ、及び停止減速度Ｄと、近似モデルデータベース３４に格納された近似モデルとに基づいて、上記式（１７）に従って、目標速度ｖ_ｒを予測する。

ステップＳ４０２において、予測部３６０によって、上記ステップＳ４００で予測された目標速度と、前回のステップＳ３０２で推定された時刻ｔ−１の状態ベクトルＸ_ｔ−１の要素［ｘ_ｔ−１，ｘ^・ _ｔ−１，ｘ^・・ _ｔ−１］とに基づいて、時刻ｔの［ｘ_ｔ，ｘ^・ _ｔ，ｘ^・・ _ｔ］を予測する。また、運動特性パラメータ［ａ_ｔ，ｂ_ｔ，ｃ_ｔ，ｄ_ｔ］については、時刻ｔ−１の運動特性パラメータ［ａ_ｔ−１，ｂ_ｔ−１，ｃ_ｔ−１，ｄ_ｔ−１］（上記ステップＳ１００で読み出された運動特性パラメータ）をそのまま代入する。そして、時刻ｔの状態ベクトルＸ_ｔ［ｘ_ｔ，ｘ^・ _ｔ，ｘ^・・ _ｔ，ａ_ｔ，ｂ_ｔ，ｃ_ｔ，ｄ_ｔ］を構成する。

ステップＳ４０４において、予測部３６０によって、上記ステップＳ４０２で予測された時刻ｔの状態ベクトルＸ_ｔに基づいて、上記式（６）〜（７）に従って、近似モデルの偏微分を行い、行列＾Ｆ_ｔと行列＾Ｇ_ｔとを算出する。そして、予測部３６０によって、行列＾Ｆ_ｔと行列＾Ｇ_ｔと、前回のステップＳ３０２で推定された事後誤差共分散行列Ｐ_{ｔ−１｜ｔ−１}とに基づいて、上記式（８）に従って、事前誤差共分散行列Ｐ_{ｔ｜ｔ−１}を算出する。

ステップＳ４０６において、上記ステップＳ４０２で予測された時刻ｔの状態ベクトルＸ_ｔと、上記ステップＳ４０４で算出された事前誤差共分散行列Ｐ_{ｔ｜ｔ−１}とを結果として出力する。

次に、パラメータ学習処理ルーチンに戻り、ステップＳ３０２において、フィルタリング処理を実行する。ステップＳ３０２は、図９に示すフィルタリング処理ルーチンによって実現される。

＜フィルタリング処理ルーチン＞
まず、ステップＳ５００において、上記ステップＳ３００で出力された時刻ｔの状態ベクトルＸ_ｔと、事前誤差共分散行列Ｐ_{ｔ｜ｔ−１}とを受け付ける。

次に、ステップＳ５０２において、フィルタリング部３６２によって、上記ステップＳ５００で受け付けた事前誤差共分散行列Ｐ_{ｔ｜ｔ−１}に基づいて、上記式（９）に従って、カルマンゲインＫ_ｔを算出する。

ステップＳ５０４において、フィルタリング部３６２によって、上記ステップＳ５０２で算出されたカルマンゲインＫ_ｔと、上記ステップＳ５００で受け付けた時刻ｔにおける状態ベクトルＸ_{ｔ｜ｔ−１}と、上記ステップＳ１００で受け付けたセンサ情報に含まれる車両の前後位置情報ｘ^＊ _ｔとに基づいて、上記式（１０）に従って、時刻ｔにおける状態ベクトルＸ_ｔ｜ｔを推定する。

ステップＳ５０６において、上記ステップＳ５００で受け付けた事前誤差共分散行列Ｐ_{ｔ｜ｔ−１}と、上記ステップＳ５０２で算出されたカルマンゲインＫ_ｔに基づいて、上記式（１１）に従って、事後誤差共分散行列Ｐ_ｔ｜ｔを算出する。

ステップＳ５０８において、上記ステップＳ３０６で推定された時刻ｔにおける状態ベクトルＸ_ｔ｜ｔと、上記ステップＳ５０６で算出された事後誤差共分散行列Ｐ_ｔ｜ｔとを、結果として出力する。

次に、パラメータ学習処理ルーチンに戻り、ステップＳ３０４において、上記ステップＳ３０２で出力された時刻ｔにおける状態ベクトルＸ_ｔ｜ｔのうち、運転特性パラメータ［ａ_ｔ，ｂ_ｔ，ｃ_ｔ，ｄ_ｔ］を、新たな運転特性パラメータとして更新し、運転特性パラメータデータベース２８に格納する。

以上説明したように、第１の実施の形態に係る運転支援装置によれば、センサ情報を用いて車両のドライバの複数の運転行動を離散的にモデル化し、かつ、条件分岐により切り替えるようにモデル化した運転行動モデルを、連続かつ微分可能な関数で近似した近似モデルと、取得された車両のセンサ情報とに基づいて、運転行動モデルの条件分岐で用いられる条件パラメータを含む運転特性パラメータを学習することにより、ドライバに合ったモデルパラメータを学習することができる。

また、以上説明したように、第１の実施の形態に係る運転支援装置によれば、学習された運転特性パラメータと、運転行動モデルと、取得されたセンサ情報とに基づいて、車両のドライバの運転支援を行うことにより、ドライバに合った運転支援を行うことができる。

また、市街地走行時の運転支援システムを考慮すると、運転行動に応じた離散的な運転行動モデルが不可欠であり、その離散的な運転行動モデルのパラメータを、実測データから逐次に学習することで、より精度の高い運転支援が可能となる。

また、従来では、離散状態の切り替えとしてモデル化された運転行動モデルの学習は困難であった。また、クラスタリングなどに代表される判断モデルの同定手法を用いることで学習することも可能だが、学習に時間がかかるうえ、逐次的な学習が困難であった。本実施の形態の形態によれば、非連続な関数である運転行動モデルを、シグモイド関数を用いて、連続かつ微分可能な関数で近似し、拡張カルマンフィルタを用いることにより、より早く、逐次的に、離散的な運転行動モデルのパラメータを学習することができ、より精度のよい運転支援が可能となる。

また、更新したパラメータを次回実行時の運転行動モデルのパラメータとして使用することで、パラメータを逐次更新して精度を上げながら運転支援を行うことができる。

＜第２の実施の形態＞
次に、第２の実施の形態について説明する。なお、第１の実施の形態と同様の構成となる部分については、同一符号を付して説明を省略する。

第２の実施の形態では、目標位置、走路速度情報、及び走路曲率情報を更に考慮して加速度及び操舵角を含む目標の運転操作量を計算する点が、第１の実施の形態と異なっている。第２の実施の形態における状態空間モデルは、図１０に示すように、ドライバモデルと車両物理モデルとで表現される。第２のシステムモデルｆ_ｔは、図１０に示すドライバモデルと車両物理モデルとで表現される。

図１１に示すように、第２の実施の形態に係る運転支援装置２１０は、ドライバが目的地を入力するための入力操作部２１２と、自車両の位置を計測する位置計測部１４と、自車両の前方を走行する前方車両を検出する前方車情報取得部１６と、地図情報（道路ネットワークデータ）、道路情報、及び信号情報を記憶した道路ネットワークデータベース２１８と、道路ネットワークデータベース２１８から取得した信号情報に基づいて、次の信号の状態Ｓを取得する信号状態取得部２０と、運転支援アクチュエータ４０を制御するコンピュータ２４と、運転支援を行うための運転支援アクチュエータ４０とを備えている。

道路ネットワークデータベース２１８に記憶されている地図情報及び道路情報には、走路速度情報及び走路曲率情報が含まれている。走路速度情報には、当該走路における定常走行速度に関する情報が含まれている。定常走行速度は、当該走路における過去の走行データ及び制限速度等から算出される。また、走路曲率情報には、当該走路の曲率に関する情報が含まれている。

情報取得部２２６は、更に、入力操作部２１２により受け付けた目的地情報と、道路ネットワークデータベース２１８より得られた走路速度情報及び走路曲率情報とを各時刻ｔについて取得する。

運転特性パラメータデータベース２２８には、後述するパラメータ学習部２３６によって学習された運転特性パラメータが格納されている。

なお、第２の実施の形態では、車両の位置［ｘ_ｔ，ｙ_ｔ］と、車両の向きθ_ｔと、車両の速度ｖ_ｔと、車両の加速度ａ_ｔと、車両の曲率δ_ｔと、後述する条件パラメータｐ_{ｓｉｇｎａｌ}と、目標速度を算出するためのモデルパラメータｐ_ｒｏａｄ、ｐ_ｆ、及びｐ_ｃとを、以下の式（１８）に示すように状態ベクトルＸ_ｔ＝［ｘ_ｔｙ_ｔθ_ｔｖ_ｔａ_ｔδ_ｔｐ_ｒｏａｄｐ_ｆｐ_ｃｐ_{ｓｉｇｎａｌ}］として構成する。ｐ_ｒｏａｄ、ｐ_ｆ、ｐ_ｃ、及びｐ_{ｓｉｇｎａｌ}は、運転特性パラメータである。また、以下の式（１９）に示すように、位置計測部１４によって計測された車両の位置情報を観測ベクトルＹ_ｔ＝［ｘ_ｔ ^＊ｙ_ｔ ^＊］として構成する。

目標運転操作量計算部２３０は、情報取得部２２６によって取得されたセンサ情報と、運転特性パラメータデータベース２２８に格納された運転特性パラメータと、運転行動モデルとに基づいて、加速度及び操舵角を含む目標の運転操作量を計算する。目標運転操作量計算部２３０は、図１２に示すように、運転行動モデル計算部２５０と、車両物理モデル計算部３５０とを備えている。

運転行動モデル計算部２５０は、情報取得部２２６によって取得されたセンサ情報と、運転特性パラメータデータベース２２８に格納された運転特性パラメータと、運転行動モデルと、後述する車両物理モデル計算部３５０によって前回計算された車両の速度ｖ_ｔ−１、及び車両の向きθ_ｔ−１とに基づいて、時刻ｔの加速度及び操舵角を含む目標の運転操作量を計算する。運転行動モデル計算部２５０は、図１３に示すように、運転操作受付部２５２と、経路生成部２５４と、目標位置制約部２５６と、目標位置選択部２６２と、横位置制御部２６４と、目標速度制約部２６６と、目標速度選択部２７６と、速度制御部２７８と、運転操作出力部２８０とを備えている。

運転操作受付部２５２は、車両物理モデル計算部３５０によって前回計算された時刻ｔ−１の車両の速度ｖ_ｔ−１、及び車両の向きθ_ｔ−１と、運転特性パラメータデータベース２２８に格納されている運転特性パラメータｐ_ｒｏａｄ、ｐ_ｆ、ｐ_ｃ、及びｐ_{ｓｉｇｎａｌ}を受け付ける。

経路生成部２５４は、情報取得部２２６によって取得されたセンサ情報に含まれる目的地情報、地図情報、及び車両の位置［ｘ^＊ _ｔ−１，ｙ^＊ _ｔ−１］に基づいて、最短経路を探索するアルゴリズムや、最短時間の経路を探索するアルゴリズムなど（例えば、Ａ＊アルゴリズム）を用いて、出発地から目的地までの最短経路を生成する。

目標位置制約部２５６は、情報取得部２２６によって取得されたセンサ情報に含まれる車両の位置［ｘ^＊ _ｔ−１，ｙ^＊ _ｔ−１］に基づいて、複数の位置制約条件を満たす車両位置を算出する。目標位置制約部２５６は、信号制約部２５８と、経路制約部２６０とを備えている。

信号制約部２５８は、情報取得部２２６によって取得されたセンサ情報に含まれる信号情報、車両の位置［ｘ^＊ _ｔ−１，ｙ^＊ _ｔ−１］、及び運転操作受付部２５２によって受け付けた時刻ｔ−１の車両の速度ｖ_ｔ−１と、運転特性パラメータデータベース２２８に格納されている運転特性パラメータｐ_{ｓｉｇｎａｌ}とに基づいて、信号停止に関する予め定められた位置制約条件を満たす車両位置を算出する。具体的には、信号制約部２５８は、以下の式（２０）に示す位置制約条件を満たす車両位置［ｘ_ｒ，ｙ_ｒ］を算出する。

ここで、［ｘ_ｒ，ｙ_ｒ］^Ｔは車両位置、［ｘ^＊ _ｔ−１，ｙ^＊ _ｔ−１］^Ｔは時刻ｔ−１の車両の位置、［ｘ_{ｓｔｏｐｌｉｎｅ}，ｙ_{ｓｔｏｐｌｉｎｅ}］^Ｔは信号に対応した停止線の位置、Ｓ_ｔ−１は前回の信号の状態（赤、黄、青）、Ｓ_ｒｅｄは赤信号、ｖ_ｔ−１は、時刻ｔ−１の車両の速度である。ｐ_{ｓｉｇｎａｌ}は、停止するか否かを決定するためのパラメータであり、後述するパラメータ学習部２３６によって学習される。本実施の形態の形態では、ｐ_{ｓｉｇｎａｌ}が条件パラメータに対応する。

経路制約部２６０は、経路生成部２５４によって車両の目的地に基づいて求められた経路情報と、情報取得部２２６によって取得されたセンサ情報に含まれる車両の位置［ｘ^＊ _ｔ−１，ｙ^＊ _ｔ−１］とに基づいて、経路に関する位置制約条件を満たす車両位置を算出する。例えば、経路制約部２６０は、目的地までの経路上における、車両の位置［ｘ^＊ _ｔ−１，ｙ^＊ _ｔ−１］から１００ｍ先の地点を車両位置として算出する。

目標位置選択部２６２は、信号制約部２５８によって算出された車両位置、及び経路制約部２６０によって算出された車両位置の何れかを選択し、選択された車両位置を目標位置［ｘ_ｒ，ｙ_ｒ］として決定する。例えば、目標位置選択部２６２は、センサ情報に含まれる車両の位置［ｘ^＊ _ｔ−１，ｙ^＊ _ｔ−１］から最も近い車両位置を目標位置［ｘ_ｒ，ｙ_ｒ］として選択する。

横位置制御部２６４は、目標位置選択部２６２によって選択された目標位置［ｘ_ｒ，ｙ_ｒ］と、センサ情報に含まれる車両の位置［ｘ^＊ _ｔ−１，ｙ^＊ _ｔ−１］と、運転操作受付部２５２によって受け付けた時刻ｔ−１の［ｖ_ｔ−１，θ_ｔ−１］とに基づいて、例えば前方注視モデルを用いて、ドライバの目標のステアリング操作量を計算する。そして、横位置制御部２６４は、計算された目標のステアリング操作量に基づいて、目標の車両の曲率δを算出する。ステアリング操作量と曲率δとの関係は予め求められている。

目標速度制約部２６６は、情報取得部２２６によって取得されたセンサ情報と、目標位置選択部２６２によって選択された目標位置［ｘ_ｒ，ｙ_ｒ］と、運転操作受付部２５２によって受け付けた時刻ｔ−１の車両の速度ｖ_ｔ−１及び車両の向きθ_ｔ−１とに基づいて、複数の速度制約条件の各々を満たす上限速度を算出する。複数の速度制約条件の各々は、運転操作における様々なシーンに対応する。目標速度制約部２６６は、前後位置制御制約部２６８と、定常走行制約部２７０と、追従制約部２７２と、カーブ制約部２７４とを備えている。

前後位置制御制約部２６８は、センサ情報に含まれる車両の位置［ｘ^＊ _ｔ−１，ｙ^＊ _ｔ−１］と、目標位置選択部２６２によって選択された走路上の目標位置［ｘ_ｒ，ｙ_ｒ］とに基づいて、前後位置制御に関する速度制約条件を満たす上限速度を算出する。例えば、前後位置制御制約部２６８は、比例制御モデルを用いて、センサ情報に含まれる車両の位置［ｘ^＊ _ｔ−１，ｙ^＊ _ｔ−１］と目標位置［ｘ_ｒ，ｙ_ｒ］との差に応じて、上限速度を算出する。

定常走行制約部２７０は、センサ情報に含まれる車両の位置［ｘ^＊ _ｔ−１，ｙ^＊ _ｔ−１］と、情報取得部２２６によって取得されたセンサ情報の道路情報に含まれる走路速度情報に基づいて、当該走路の定常走行速度を、以下の式（２１）に示す定常走行に関する速度制約条件を満たす上限速度として算出する。具体的には、定常走行制約部２７０は、センサ情報に含まれる車両の位置［ｘ^＊ _ｔ−１，ｙ^＊ _ｔ−１］に基づいて、当該位置の走路速度情報から得られる、車両が現在走行中の走路の一般的な最高速度を表すパラメータｐ_ｒｏａｄ（定常走行速度）を取得し、上限速度とする。ｐ_ｒｏａｄは、当該走路での過去の走行データや制限速度等から算出される。ｐ_ｒｏａｄは、後述するパラメータ学習部２３６によって学習される。

追従制約部２７２は、運転操作受付部２５２によって受け付けた時刻ｔ−１の車両の速度ｖ_ｔ−１と、センサ情報に含まれる前方車情報（前方車との相対速度）とに基づいて、以下の式（２２）に示す前方車両追従に関する速度制約条件を満たす上限速度を算出する。具体的には、追従制約部２７２は、運転操作受付部２５２によって受け付けた時刻ｔ−１の車両の速度［ｖ_ｔ−１］と前方車との相対速度に基づいて、等速予測により、Ｔ秒先の前方車との車間距離の予測値＾ｘ_ｆ（ｔ＋Ｔ）を算出する。そして、追従制約部２７２は、式（２２）の制約条件を満たす上限速度を算出する。

ここで、ｐ_ｆは後述されるパラメータ学習部２３６によって学習される。Ｌは車両の長さである。

カーブ制約部２７４は、センサ情報に含まれる車両の位置［ｘ^＊ _ｔ−１，ｙ^＊ _ｔ−１］と、情報取得部２２６によって取得されたセンサ情報の地図情報に含まれる走路曲率情報に基づいて、以下の式（２３）に示すカーブ走行に関する速度制約条件を満たす上限速度を算出する。具体的には、カーブ制約部２７４は、センサ情報に含まれる車両の位置［ｘ^＊ _ｔ−１，ｙ^＊ _ｔ−１］に基づいて、当該位置におけるＴ秒先の走路の曲率の絶対値の予測値｜＾δ（ｔ＋Ｔ）｜を算出し、算出された予測値｜＾δ（ｔ＋Ｔ）｜に基づいて、式（２３）を満たす上限速度を算出する。

なお、ｐ_ｃは後述されるパラメータ学習部２３６によって学習される。

目標速度選択部２７６は、目標速度制約部２６６によって算出された上限速度のうち、最も低い速度を目標速度ｖ_ｒとして選択する。

速度制御部２７８は、目標速度選択部２７６によって選択された目標速度ｖ_ｒと、時刻ｔ−１の車両の速度ｖ_ｔ−１とに基づいて、目標のアクセルペダル操作量を計算する。そして、速度制御部２７８は、計算された目標のアクセルペダル操作量に基づいて、目標の車両の加速度ａ_ｔを算出する。例えば、速度制御部２７８は、比例制御モデルを用いて、目標速度ｖ_ｒと推定された時刻ｔ−１の車両の速度ｖ_ｔ−１との差に応じて、加速度ａ_ｔを算出する。

運転操作出力部２８０は、横位置制御部２６４によって算出された目標の曲率δ_ｔと、速度制御部２７８によって算出された目標の加速度ａ_ｔとを、目標の運転操作量として運転支援制御部２３２へ出力する。また、運転操作出力部２８０は、曲率δ_ｔと加速度ａ_ｔとを車両物理モデル計算部３５０へ出力する。

車両物理モデル計算部３５０は、運転操作出力部２８０によって出力された目標の曲率δ_ｔと目標の加速度ａ_ｔとに基づいて、車両の物理量を計算する。車両物理モデル計算部３５０は、図１４に示すように、速度算出部３５２と、向き算出部３５４と、位置算出部３５６と、車両物理モデル出力部３５８とを備えている。

速度算出部３５２は、運転操作出力部２８０によって出力された目標の車両の加速度ａ_ｔと、速度算出部３５２で前回算出された車両の速度ｖ_ｔ−１とに基づいて、車両の速度ｖ_ｔを予測する。例えば、速度算出部３５２は、速度算出式ｖ_ｔ＝ｖ_ｔ−１＋ａ_ｔＴに従って、車両の速度ｖ_ｔを予測する。

向き算出部３５４は、運転操作出力部２８０によって出力された目標の曲率δ_ｔと、向き算出部３５４で前回算出されたθ_ｔ−１と、速度算出部３５２によって予測された車両の速度ｖ_ｔとに基づいて、車両の向きθ_ｔを予測する。

位置算出部３５６は、速度算出部３５２によって予測された車両の速度ｖ_ｔと、向き算出部３５４によって予測された車両の向きθ_ｔと、センサ情報に含まれる車両の位置［ｘ^＊ _ｔ−１，ｙ^＊ _ｔ−１］とに基づいて、車両の位置［ｘ_ｔ，ｙ_ｔ］を予測する。

車両物理モデル出力部３５８は、速度算出部３５２よって予測された車両の速度ｖ_ｔと、向き算出部３５４によって予測された車両の向きθ_ｔと、位置算出部３５６によって予測された車両の位置［ｘ_ｔ，ｙ_ｔ］とを出力する。出力された車両の速度ｖ_ｔと車両の向きθ_ｔとは、運転行動モデル計算部２５０によって次回用いられる。

運転支援制御部２３２は、目標運転操作量計算部２３０によって計算された目標の加速度ａ_ｔと目標の曲率δ_ｔとを実現するように、運転支援アクチュエータ４０を制御する。

近似モデルデータベース２３４には、目標運転操作量計算部２３０において用いられる運転行動モデルを、連続かつ微分可能な関数で近似した近似モデルが格納されている。本実施の形態では、条件パラメータｐ_{ｓｉｇｎａｌ}を用いた運動行動モデルについて、以下の式（２４）に示すように、シグモイド関数によって連続かつ微分可能な関数で近似した近似モデルを導出することができる。具体的には、上記式（２０）のうち、以下のｉｆ文内の（）で示した条件パラメータｐ_{ｓｉｇｎａｌ}についての条件分岐の部分を、近似モデルによって近似する。上記式（２０）を近似する場合、信号停止における条件分岐（ｉｆ節）のパラメータｐ_{ｓｉｇｎａｌ}を学習するため、この信号停止における条件分岐を以下の式（２４）のようにシグモイド関数で連続化する。

ここで、ｐ_ｓｉｇａは切り替え条件の不確かさを表すパラメータである。

パラメータ学習部２３６は、近似モデルデータベース２３４に格納された近似モデルと、情報取得部２２６によって取得されたセンサ情報に含まれる車両の位置情報［ｘ_ｔ ^＊，ｙ_ｔ ^＊］とに基づいて、運転行動モデルの条件分岐で用いられる条件パラメータｐ_{ｓｉｇｎａｌ}を含む運動特性パラメータを学習する。図１５に示すように、パラメータ学習部２３６は、予測部２３６０と、フィルタリング部２３６２とを備えている。

予測部２３６０は、図１６に示すように、近似運転行動モデル計算部２４００と、車両物理モデル計算部２５００とを備えている。

近似運転行動モデル計算部２４００は、上記式（２４）で近似された運転行動を含む運転行動モデルを計算する。近似運転行動モデル計算部２４００は、図１７に示すように、運転操作受付部２４０２と、経路生成部２４０４と、目標位置制約部２４０６と、目標位置選択部２４１２と、横位置制御部２４１４と、目標速度制約部２４１６と、目標速度選択部２４２６と、速度制御部２４２８と、運転操作出力部２４３０とを備えている。また、目標位置制約部２４０６は、信号制約部２４０８と、経路生成部２４０４とを備えている。また、目標位置制約部２４０６は、信号制約部２４０８と、経路生成部２４０４とを備えている。目標速度制約部２４１６は、前後位置制御制約部２４１８と、定常走行制約部２４２０と、追従制約部２４２２と、カーブ制約部２４２４とを備えている。

信号制約部２４０８で計算する運転行動モデルは、上記式（２４）に示すように、信号制約部２５８において用いられる運転行動モデルを近似したものである。従って、信号制約部２４０８における運転行動以外は、運転行動モデル計算部２５０の各部と同様に計算が行われる。

運転操作受付部２４０２は、フィルタリング部２３６２によって推定された時刻ｔ−１の状態ベクトルＸ_ｔ−１の要素である［ｘ_ｔ−１，ｙ_ｔ−１，θ_ｔ−１，ｖ_ｔ−１，ａ_ｔ−１，δ_ｔ−１］と、運転特性パラメータデータベース２２８に格納されている運転特性パラメータｐ_ｒｏａｄ、ｐ_ｆ、ｐ_ｃ、及びｐ_{ｓｉｇｎａｌ}とを受け付ける。

経路生成部２４０４は、情報取得部２２６によって取得されたセンサ情報に含まれる目的地情報、及び地図情報と、運転操作受付部２４０２によって受け付けた時刻ｔ−１の状態ベクトルＸ_ｔ−１の要素である［ｘ_ｔ−１，ｙ_ｔ−１］とに基づいて、経路生成部２５４と同様に、出発地から目的地までの最短経路を生成する。

信号制約部２４０８は、情報取得部２２６によって取得されたセンサ情報に含まれる信号情報と、運転操作受付部２４０２によって受け付けた状態ベクトルＸ_ｔ−１の要素である［ｘ_ｔ−１，ｙ_ｔ−１，ｖ_ｔ−１］と、運転特性パラメータデータベース２２８に格納されている運転特性パラメータｐ_{ｓｉｇｎａｌ}とに基づいて、信号停止に関する予め定められた位置制約条件を満たす車両位置を算出する。具体的には、信号制約部２４０８は、上記式（２２）に示す位置制約条件を満たす車両位置［ｘ_ｒ，ｙ_ｒ］を算出する。

経路制約部２４１０は、経路生成部２４０４によって車両の目的地に基づいて求められた経路情報と、運転操作受付部２４０２によって受け付けた時刻ｔ−１の状態ベクトルＸ_ｔ−１の要素である［ｘ_ｔ−１，ｙ_ｔ−１］とに基づいて、経路制約部２６０と同様に、経路に関する位置制約条件を満たす車両位置を算出する。

目標位置選択部２４１２は、目標位置選択部２６２と同様に、信号制約部２４０８によって算出された車両位置、及び経路制約部２４１０によって算出された車両位置の何れかを選択し、選択された車両位置を目標位置［ｘ_ｒ，ｙ_ｒ］として決定する。

横位置制御部２４１４は、目標位置選択部２４１２によって選択された目標位置［ｘ_ｒ，ｙ_ｒ］と、運転操作受付部２４０２によって受け付けた時刻ｔ−１の状態ベクトルＸ_ｔ−１の要素である［ｘ_ｔ−１，ｙ_ｔ−１，ｖ_ｔ−１，θ_ｔ−１］とに基づいて、横位置制御部２６４と同様に、ドライバのステアリング操作量を予測する。

前後位置制御制約部２４１８は、運転操作受付部２４０２によって受け付けた時刻ｔ−１の状態ベクトルＸ_ｔ−１の要素である［ｘ_ｔ−１，ｙ_ｔ−１］と、目標位置選択部２４１２によって選択された走路上の目標位置［ｘ_ｒ，ｙ_ｒ］とに基づいて、前後位置制御制約部２６８と同様に、前後位置制御に関する速度制約条件を満たす上限速度を算出する。

定常走行制約部２４２０は、運転操作受付部２４０２によって受け付けた時刻ｔ−１の状態ベクトルＸ_ｔ−１の要素である［ｘ_ｔ−１，ｙ_ｔ−１］と、情報取得部２２６によって取得されたセンサ情報の道路情報に含まれる走路速度情報に基づいて、定常走行制約部２７０と同様に、定常走行に関する速度制約条件を満たす上限速度を算出する。

追従制約部２４２２は、運転操作受付部２４０２によって受け付けた時刻ｔ−１の状態ベクトルＸ_ｔ−１の要素であるｖ_ｔ−１と、センサ情報に含まれる前方車情報（前方車との相対速度）とに基づいて、追従制約部２７２と同様に、前方車両追従に関する速度制約条件を満たす上限速度を算出する。

カーブ制約部２４２４は、運転操作受付部２４０２によって受け付けた時刻ｔ−１の状態ベクトルＸ_ｔ−１の要素である［ｘ_ｔ−１，ｙ_ｔ−１］と、情報取得部２２６によって取得されたセンサ情報の地図情報に含まれる走路曲率情報に基づいて、カーブ制約部２７４と同様に、カーブ走行に関する速度制約条件を満たす上限速度を算出する。

目標速度選択部２４２６は、目標速度選択部２７６と同様に、目標速度制約部２４１６によって算出された上限速度のうち、最も低い速度を目標速度ｖ_ｒとして選択する。

速度制御部２４２８は、目標速度選択部２４２６によって選択された目標速度ｖ_ｒと、運転操作受付部２４０２によって受け付けた時刻ｔ−１の車両の速度ｖ_ｔ−１とに基づいて、速度制御部２７８と同様に、アクセルペダルの操作量を予測し、車両の加速度ａ_ｔを算出する。

運転操作出力部２４３０は、横位置制御部２４１４によって算出された曲率δ_ｔと、速度制御部２４２８によって算出された加速度ａ_ｔとを車両物理モデル計算部２５００へ出力する。

車両物理モデル計算部２５００は、運転操作出力部２４３０によって出力された曲率δ_ｔと加速度ａ_ｔとに基づいて、車両の物理量を計算する。車両物理モデル計算部２５００は、図１８に示すように、車両物理モデル受付部２５０２と、速度算出部２５０４と、向き算出部２５０６と、位置算出部２５０８と、車両物理モデル出力部２５１０とを備えている。

車両物理モデル受付部２５０２は、フィルタリング部２３６２によって推定された時刻ｔ−１の［ｘ_ｔ−１，ｙ_ｔ−１，θ_ｔ−１，ｖ_ｔ−１，ａ_ｔ−１，δ_ｔ−１］を受け付ける。

速度算出部２５０４は、運転操作出力部２４３０によって出力された車両の加速度ｖ_ｔと、車両物理モデル受付部２５０２によって受け付けた時刻ｔ−１の車両の速度ｖ_ｔ−１とに基づいて、速度算出部３５２と同様に、車両の速度ｖ_ｔを予測する。

向き算出部２５０６は、運転操作出力部２４３０によって出力された曲率δ_ｔと、車両物理モデル受付部２５０２によって受け付けた時刻ｔ−１の車両の向きθ_ｔ−１と、速度算出部２５０４によって予測された車両の速度ｖ_ｔとに基づいて、向き算出部３５４と同様に、車両の向きθ_ｔを予測する。

位置算出部２５０８は、速度算出部２５０４によって予測された車両の速度ｖ_ｔと、向き算出部２５０６によって予測された車両の向きθ_ｔと、車両物理モデル受付部２５０２によって受け付けた時刻ｔ−１の車両の位置［ｘ_ｔ−１，ｙ_ｔ−１］とに基づいて、位置算出部３５６と同様に、車両の位置［ｘ_ｔ，ｙ_ｔ］を予測する。

上記式（１８）における［ｘ_ｔ，ｙ_ｔ，θ_ｔ，ｖ_ｔ，ａ_ｔ，δ_ｔ］については、以上のように予測するが、運動特性パラメータｐ_ｒｏａｄ、ｐ_ｆ、ｐ_ｃ、及びｐ_{ｓｉｇｎａｌ}については、時刻ｔ−１の運動特性パラメータｐ_ｒｏａｄ、ｐ_ｆ、ｐ_ｃ、及びｐ_{ｓｉｇｎａｌ}をそのまま代入する。

また、予測部２３６０は、上記式（６）〜（７）に従って、上記式（２４）で示した近似モデルを含む運転行動モデルの偏微分を行い、行列＾Ｆ_ｔと行列＾Ｇ_ｔとを算出する。上記式（２４）は、シグモイド関数によって連続かつ微分可能な関数で近似されているため、偏微分をすることができる。

そして、予測部２３６０は、上記式（８）に従って、事前誤差共分散行列Ｐ_{ｔ｜ｔ−１}を算出する。

フィルタリング部２３６２は、情報取得部２２６によって取得されたセンサ情報に含まれる車両の位置情報［ｘ^＊ _ｔ，ｙ^＊ _ｔ］と、予測部２３６０によって予測された時刻ｔの状態ベクトルＸ_ｔと、予測部２３６０によって算出された事前誤差共分散行列Ｐ_{ｔ｜ｔ−１}とに基づいて、第１の実施の形態と同様に、時刻ｔにおける状態ベクトルＸ_ｔを推定する（フィルタリングステップ）。そして、フィルタリング部２３６２は、推定された状態ベクトルＸ_ｔ｜ｔの要素である［ｐ_ｒｏａｄ，ｐ_ｆ，ｐ_ｃ，ｐ_{ｓｉｇｎａｌ}］を運転特性パラメータとして更新し、運転特性パラメータデータベース２２８へ格納する。

＜運転支援装置２１０の動作＞
次に、第２の実施の形態に係る運転支援装置２１０の動作について説明する。まず、ドライバの運転操作により車両が走行し、運転支援装置２１０の情報取得部２２６によってセンサ情報が各時刻ｔについて取得されているときに、運転支援装置２１０において、図１９に示す運転支援処理ルーチンが実行される。

ステップＳ２１０４において、目標運転操作量計算部２３０によって、上記ステップＳ１０２で受け付けたセンサ情報と、上記ステップＳ１００で読み出された運転特性パラメータｐ_{ｓｉｇｎａｌ}とに基づいて、現時刻ｔにおける加速度及び操舵量を含む目標の運転操作量を計算する。ステップＳ２１０４は、図２０に示す目標運転操作量計算処理ルーチンによって実現される。

＜目標運転操作量計算処理ルーチン＞
まず、ステップＳ６００において、経路生成部２５４によって、上記ステップＳ１０２で受け付けたセンサ情報に含まれる目的地情報、及び車両の位置［ｘ^＊ _ｔ−１，ｙ^＊ _ｔ−１］とに基づいて、出発地から目的地までの最短経路を生成する。

ステップＳ６０２において、信号制約部２５８によって、上記ステップＳ１０２で受け付けた時刻ｔ−１の車両のセンサ情報に含まれる信号情報、及び車両の位置［ｘ^＊ _ｔ−１，ｙ^＊ _ｔ−１］と、前回のステップＳ６１８で予測された時刻ｔ−１の車両の速度ｖ_ｔ−１とに基づいて、上記式（２０）に従って、信号停止に関する予め定められた位置制約条件を満たす車両位置［ｘ_ｒ，ｙ_ｒ］を設定する。

ステップＳ６０４において、経路制約部２６０によって、上記ステップＳ６００で生成された経路情報と、上記ステップＳ１０２で受け付けたセンサ情報に含まれる車両の位置［ｘ^＊ _ｔ−１，ｙ^＊ _ｔ−１］とに基づいて、経路上における位置［ｘ_ｒ，ｙ_ｒ］を設定する。

ステップＳ６０６において、目標位置選択部２６２によって、上記ステップＳ６０２で設定された車両位置と、上記ステップＳ６０４で設定された車両位置と、上記ステップＳ１０２で受け付けたセンサ情報に含まれる車両の位置［ｘ^＊ _ｔ−１，ｙ^＊ _ｔ−１］とに基づいて、［ｘ^＊ _ｔ−１，ｙ^＊ _ｔ−１］から最も近い経路上における位置［ｘ_ｒ，ｙ_ｒ］を目標位置として選択する。

ステップＳ６０８において、横位置制御部２６４によって、上記ステップＳ６０６で選択された目標位置［ｘ_ｒ，ｙ_ｒ］と、上記ステップＳ１０２で受け付けたセンサ情報に含まれる車両の位置［ｘ^＊ _ｔ−１，ｙ^＊ _ｔ−１］と、前回のステップＳ６１８で計算された時刻ｔ−１の車両の目標速度ｖ_ｔ−１，及び目標の車両の向きθ_ｔ−１とに基づいて、ドライバの目標のステアリング操作量を計算する。そして、計算された目標のステアリング操作量に基づいて、目標の車両の曲率δを算出する。

ステップＳ６１０において、複数の速度制約条件の各々を満たす上限速度を算出する。
本ステップでは、まず、前後位置制御制約部２６８によって、上記ステップＳ１０２で受け付けたセンサ情報に含まれる車両の位置［ｘ^＊ _ｔ−１，ｙ^＊ _ｔ−１］と、上記ステップＳ６０６で選択された目標位置［ｘ_ｒ，ｙ_ｒ］とに基づいて、上限速度を算出する。
次に、定常走行制約部２７０によって、上記ステップＳ１０２で受け付けたセンサ情報に含まれる車両の位置［ｘ^＊ _ｔ−１，ｙ^＊ _ｔ−１］と、上記ステップＳ１０２で受け付けたセンサ情報に含まれる走路速度情報に基づいて、当該走路の定常走行速度を、上記式（１９）に示す速度制約条件の上限速度として算出する。
また、追従制約部２７２によって、前回のステップＳ６１８で推定された時刻ｔ−１の車両の速度ｖ_ｔ−１と、上記ステップＳ１０２で受け付けたセンサ情報に含まれる前方車情報（前方車との相対速度）とに基づいて、上記式（２０）に示す速度制約条件の上限速度を算出する。
そして、カーブ制約部２７４によって、上記ステップＳ１０２で受け付けたセンサ情報に含まれる車両の位置［ｘ^＊ _ｔ−１，ｙ^＊ _ｔ−１］と、上記ステップＳ１０２で受け付けたセンサ情報の地図情報に含まれる走路曲率情報に基づいて、上記式（２１）に示す速度制約条件の上限速度を算出する。

ステップＳ６１２において、目標速度選択部２７６によって、上記ステップＳ６１０で算出された上限速度のうち、最も低い速度を目標速度ｖ_ｒとして選択する。

ステップＳ６１４において、速度制御部２７８によって、上記ステップＳ６１２で選択された目標速度ｖ_ｒと、前回のステップＳ１１０で推定された時刻ｔ−１の状態ベクトルＸ_ｔ−１の要素である［ｖ_ｔ−１］とに基づいて、目標のアクセルペダル操作量を計算する。そして、計算された目標のアクセルペダル操作量に基づいて、目標の車両の加速度ａを算出する。

ステップＳ６１６において、運転操作出力部２８０によって、上記ステップＳ６０８で算出された目標の曲率δと、上記ステップＳ６１４で算出された目標の加速度ａとを、時刻ｔにおける目標の曲率δ_ｔと加速度ａ_ｔとして出力する。

ステップＳ６１８において、速度算出部３５２によって、上記ステップＳ６１６で算出された車両の加速度ａ_ｔと、前回本ステップＳ６１８で算出された車両の速度ｖ_ｔ−１とに基づいて、車両の速度ｖ_ｔを予測する。

ステップＳ６２０において、向き算出部３５４によって、上記ステップＳ６１６で算出された曲率δ_ｔと、前回本ステップＳ６２０で算出されたθ_ｔ−１と、上記ステップＳ６１８で予測された車両の速度ｖ_ｔとに基づいて、車両の向きθ_ｔを予測する。

ステップＳ６２２において、位置算出部３５６によって、上記ステップＳ６１８で予測された車両の速度ｖ_ｔと、上記ステップＳ６２０で予測された車両の向きθ_ｔと、センサ情報に含まれる車両の位置［ｘ^＊ _ｔ−１，ｙ^＊ _ｔ−１］とに基づいて、車両の位置［ｘ_ｔ，ｙ_ｔ］を予測する。

ステップＳ６２４において、上記ステップＳ６１６で予測された時刻ｔにおける曲率δ_ｔと加速度ａ_ｔとを結果として出力して目標運転操作量計算処理ルーチンを終了する。

次に、運転支援処理ルーチンに戻り、ステップＳ２１１０において、パラメータ学習処理を実行する。ステップＳ２１１０は、図２１に示す、パラメータ学習処理ルーチンによって実現される。

＜パラメータ学習処理ルーチン＞
まず、ステップＳ２３００において、予測部２３６０によって、予測処理を実行する。ステップＳ２３００は、図２２に示す予測処理ルーチンによって実現される。

＜予測処理ルーチン＞
まず、ステップＳ７００において、経路生成部２４０４によって、上記ステップＳ１０２で受け付けたセンサ情報に含まれる目的地情報と、前回のステップＳ３０２で推定された時刻ｔ−１の状態ベクトルＸ_ｔ−１の要素［ｘ_ｔ−１，ｙ_ｔ−１］とに基づいて、出発地から目的地までの最短経路を生成する。

ステップＳ７０２において、信号制約部２４０８によって、上記ステップＳ１０２で受け付けた時刻ｔ−１の車両のセンサ情報に含まれる信号情報と、前回のステップＳ３０２で推定された時刻ｔ−１の状態ベクトルＸ_ｔ−１の要素［ｘ_ｔ−１，ｙ_ｔ−１，ｖ_ｔ−１］とに基づいて、上記式（２４）に従って、信号停止に関する予め定められた位置制約条件を満たす車両位置［ｘ_ｒ，ｙ_ｒ］を設定する。

ステップＳ７０４において、経路制約部２４１０によって、上記ステップＳ７０２で生成された経路情報と、前回のステップＳ３０２で推定された時刻ｔ−１の状態ベクトルＸ_ｔ−１の要素［ｘ_ｔ−１，ｙ_ｔ−１］とに基づいて、経路上における位置［ｘ_ｒ，ｙ_ｒ］を設定する。

ステップＳ７０６において、目標位置選択部２４１２によって、上記ステップＳ７０２で設定された車両位置と、上記ステップＳ７０４で設定された車両位置と、前回のステップＳ３０２で推定された時刻ｔ−１の状態ベクトルＸ_ｔ−１の要素［ｘ_ｔ−１，ｙ_ｔ−１］とに基づいて、［ｘ_ｔ−１，ｙ_ｔ−１］から最も近い経路上における位置［ｘ_ｒ，ｙ_ｒ］を目標位置として選択する。

ステップＳ７０８において、横位置制御部２４１４によって、上記ステップＳ７０６で選択された目標位置［ｘ_ｒ，ｙ_ｒ］と、前回のステップＳ３０２で推定された時刻ｔ−１の状態ベクトルＸ_ｔ−１の要素［ｘ_ｔ−１，ｙ_ｔ−１，ｖ_ｔ−１，θ_ｔ−１］とに基づいて、ドライバのステアリング操作量を予測する。そして、予測されたステアリング操作量に基づいて、車両の曲率δ_ｔを算出する。

ステップＳ７１０において、複数の速度制約条件の各々を満たす上限速度を算出する。
本ステップでは、まず、前後位置制御制約部２４１８によって、前回のステップＳ３０２で推定された時刻ｔ−１の状態ベクトルＸ_ｔ−１の要素［ｘ_ｔ−１，ｙ_ｔ−１］と、上記ステップＳ７０６で選択された目標位置［ｘ_ｒ，ｙ_ｒ］とに基づいて、上限速度を算出する。
次に、定常走行制約部２４２０によって、前回のステップＳ３０２で推定された時刻ｔ−１の状態ベクトルＸ_ｔ−１の要素［ｘ_ｔ−１，ｙ_ｔ−１］と、上記ステップＳ１０２で受け付けたセンサ情報に含まれる走路速度情報に基づいて、当該走路の定常走行速度を、上記式（１９）に示す速度制約条件の上限速度として算出する。
また、追従制約部２４２２によって、前回のステップＳ３０２で推定された時刻ｔ−１の状態ベクトルＸ_ｔ−１の要素ｖ_ｔ−１と、上記ステップＳ１０２で受け付けたセンサ情報に含まれる前方車情報（前方車との相対速度）とに基づいて、上記式（２０）に示す速度制約条件の上限速度を算出する。
そして、カーブ制約部２４２４によって、前回のステップＳ３０２で推定された時刻ｔ−１の状態ベクトルＸ_ｔ−１の要素［ｘ_ｔ−１，ｙ_ｔ−１］と、上記ステップＳ１０２で受け付けたセンサ情報の地図情報に含まれる走路曲率情報に基づいて、上記式（２１）に示す速度制約条件の上限速度を算出する。

ステップＳ７１２において、目標速度選択部２４２６によって、上記ステップＳ７１０で算出された上限速度のうち、最も低い速度を目標速度ｖ_ｒとして選択する。

ステップＳ７１４において、速度制御部２４２８によって、上記ステップＳ７１２で選択された目標速度ｖ_ｒと、前回のステップＳ３０２で推定された時刻ｔ−１の状態ベクトルＸ_ｔ−１の要素［ｖ_ｔ−１］とに基づいて、アクセルペダルの操作量を予測する。そして、予測されたアクセルペダルの操作量に基づいて、車両の加速度ａを算出する。

ステップＳ７１６において、運転操作出力部２４３０によって、前回のステップＳ３０２で推定された時刻ｔ−１の状態ベクトルＸ_ｔ−１の要素［ａ_ｔ−１，δ_ｔ−１］と、上記ステップＳ７０８で算出された曲率δと、上記ステップＳ７１４で算出された加速度ａとに基づいて、時刻ｔにおける曲率δ_ｔと加速度ａ_ｔとを予測する。

ステップＳ７１８において、速度算出部２５０４によって、上記ステップＳ７１６で算出された車両の加速度ａ_ｔと、前回のステップＳ３０２で推定された時刻ｔ−１の状態ベクトルＸ_ｔ−１の要素ｖ_ｔ−１とに基づいて、車両の速度ｖ_ｔを予測する。

ステップＳ７２０において、向き算出部２５０６によって、上記ステップＳ７１６で算出された曲率δ_ｔと、前回のステップＳ３０２で推定された時刻ｔ−１の状態ベクトルＸ_ｔ−１の要素θ_ｔ−１と、上記ステップＳ７１８で予測された車両の速度ｖ_ｔとに基づいて、車両の向きθ_ｔを予測する。

ステップＳ７２２において、位置算出部２５０８によって、上記ステップＳ７１８で予測された車両の速度ｖ_ｔと、上記ステップＳ７２０で予測された車両の向きθ_ｔと、前回のステップＳ３０２で推定された時刻ｔ−１の状態ベクトルＸ_ｔ−１の要素［ｘ_ｔ−１，ｙ_ｔ−１］とに基づいて、車両の位置［ｘ_ｔ，ｙ_ｔ］を予測する。

ステップＳ７２４において、上記ステップＳ７１６で予測された時刻ｔにおける曲率δ_ｔと加速度ａ_ｔと、上記ステップＳ７１８で予測された車両の速度ｖ_ｔと、上記ステップＳ７２０で予測された車両の向きθ_ｔと、上記ステップＳ７２２で予測された車両の位置［ｘ_ｔ，ｙ_ｔ］とを状態ベクトルＸ_ｔとして構成する。なお、運動特性パラメータｐ_ｒｏａｄ、ｐ_ｆ、ｐ_ｃ、及びｐ_{ｓｉｇｎａｌ}については、時刻ｔ−１の運動特性パラメータｐ_ｒｏａｄ、ｐ_ｆ、ｐ_ｃ、及びｐ_{ｓｉｇｎａｌ}をそのまま代入し、状態ベクトルＸ_ｔを［ｘ_ｔ，ｙ_ｔ，θ_ｔ，ｖ_ｔ，ａ_ｔ，δ_ｔ，ｐ_ｒｏａｄ，ｐ_ｆ，ｐ_ｃ，ｐ_{ｓｉｇｎａｌ}］として構成する。

ステップＳ７２６において、予測部２３６０によって、上記ステップＳ７２４で構成された時刻ｔの状態ベクトルＸ_ｔに基づいて、上記式（６）〜（７）に従って、近似モデルの偏微分を行い、行列＾Ｆ_ｔと行列＾Ｇ_ｔとを算出する。そして、予測部２３６０によって、行列＾Ｆ_ｔと行列＾Ｇ_ｔと、前回のステップＳ３０２で推定された事後誤差共分散行列Ｐ_{ｔ−１｜ｔ−１}とに基づいて、上記式（８）に従って、事前誤差共分散行列Ｐ_{ｔ｜ｔ−１}を算出する。

ステップＳ７２８において、予測部２３６０によって、上記ステップＳ７２４で構成された時刻ｔの状態ベクトルＸ_ｔと、上記ステップＳ７２６で算出された事前誤差共分散行列Ｐ_{ｔ｜ｔ−１}とを結果として出力する。

次に、パラメータ学習処理ルーチンに戻り、ステップＳ３０２において、フィルタリング部２３６２によって、第１の実施の形態と同様に、時刻ｔにおける状態ベクトルＸ_ｔを推定する（フィルタリングステップ）。

そして、ステップＳ３０４において、上記ステップＳ３０２で推定された状態ベクトルＸ_ｔ｜ｔの要素である［ｐ_ｒｏａｄ，ｐ_ｆ，ｐ_ｃ，ｐ_{ｓｉｇｎａｌ}］を運転特性パラメータとして更新し、運転特性パラメータデータベース２２８へ格納する。

なお、第２の実施の形態に係る運転支援装置の他の構成及び作用については、第１の実施の形態と同様であるため、説明を省略する。

以上説明したように、第２の実施の形態に係る運転支援装置によれば、運転行動モデルとして、定常走行に関する速度制約条件を満たす上限速度として算出し、カーブ走行に関する速度制約条件を満たす上限速度を算出し、前方車両追従に関する速度制約条件を満たす上限速度を算出し、前後位置制御に関する速度制約条件を満たす上限速度を算出し、算出された上限速度のうちの何れかを目標速度として選択し、かつ信号停止に関する位置制約条件を満たす車両位置を算出し、経路に関する位置制約条件を満たす車両位置を算出し、算出された車両位置のうちの何れかを選択し、選択した位置を目標位置として決定し、運転行動モデルの条件分岐で用いられる条件パラメータを含むモデルパラメータを学習することにより、ドライバに合ったモデルパラメータを学習することができる。

また、以上説明したように、第２の実施の形態に係る運転支援装置によれば、学習された運転特性パラメータと、運転行動モデルと、取得されたセンサ情報とに基づいて、車両のドライバの運転支援を行うことにより、ドライバに合った運転支援を行うことができる。

なお、上記の実施の形態では、パラメータ学習部３６（２３６）と、運転支援制御部３２（２３２）とが１つの装置で構成される場合を例に説明したが、これに限定されるものではなく、別々の装置として構成してもよい。

また、上記の実施の形態における前方車情報取得部１６は、レーザレーダ装置を用いる場合を例に説明したが、これに限定されるものではない。例えば、前方車情報取得部１６として、車車間通信装置や、路車間通信装置等を用いて、前方車両情報を取得してもよい。

また、上記の実施の形態では、上述の運転支援装置は、道路ネットワークデータベース１８（２１８）を備えている場合を例に説明したが、これに限定されるものではなく、例えば、道路ネットワークデータベース１８（２１８）が車両挙動予測装置の外部装置に設けられ車両挙動予測装置は、外部装置と通信手段を用いて通信することにより、道路ネットワークデータベース１８（２１８）を参照するようにしてもよい。

また、第２の実施の形態では、目標速度制約部２６６において、複数の速度制約条件の各々を満たす上限速度を算出し、目標速度選択部２７６において、上限速度のうち最も低いものを目標速度として選択する場合を例に説明したが、これに限定されるものではなく、複数の速度制約条件の各々の組み合わせに基づいて、目標速度を選択するようにしてもよい。

また、本実施の形態では、運転支援の方法として車両の制御を行う場合を例に説明したが、これに限定されるものではなく、例えば、ドライバへの情報提示であってもよい。

なお、本発明のプログラムは、記録媒体に格納して提供することができる。

１０，２１０運転支援装置
１２車速センサ
１４位置計測部
１６前方車情報取得部
１８，２１８道路ネットワークデータベース
２０信号状態取得部
２２停止減速度取得部
２４コンピュータ
２６，２２６情報取得部
２８，２２８運転特性パラメータデータベース
３０目標速度計算部
３２，２３２運転支援制御部
３４，２３４近似モデルデータベース
３６，２３６パラメータ学習部
４０運転支援アクチュエータ
２１２入力操作部
２３０目標運転操作量計算部
２５０運転行動モデル計算部
２５２運転操作受付部
２５４，２４０４経路生成部
２５６，２４０６目標位置制約部
２５８，２４０８信号制約部
２６０，２４１０経路制約部
２６２，２４１２目標位置選択部
２６４，２４１４横位置制御部
２６６，２４１６目標速度制約部
２６８，２４１８前後位置制御制約部
２７０，２４２０定常走行制約部
２７２，２４２２追従制約部
２７４，２４２４カーブ制約部
２７６，２４２６目標速度選択部
２７８，２４２８速度制御部
２８０，２４３０運転操作出力部
３５０，２５００車両物理モデル計算部
３５２，２５０４速度算出部
３５４，２５０６向き算出部
３５６，２５０８位置算出部
３５８，２５１０車両物理モデル出力部
３６０，２３６０予測部
３６２，２３６２フィルタリング部
２４００近似運転行動モデル計算部
２４０２運転操作受付部
２５０２車両物理モデル受付部

Claims

車両の走行状態を示すセンサ情報を取得する取得手段と、
前記センサ情報を用いて車両のドライバの複数の運転行動を離散的にモデル化し、かつ、条件分岐により切り替えるようにモデル化した運転行動モデルを、連続かつ微分可能な関数で近似した近似モデルと、前記取得手段によって取得された前記車両のセンサ情報とに基づいて、前記運転行動モデルの前記条件分岐で用いられる条件パラメータを含むモデルパラメータを学習するパラメータ学習手段と、
を含むパラメータ学習装置。
前記近似モデルは、前記運転行動モデルをシグモイド関数によって連続かつ微分可能な関数で近似した近似モデルである請求項１記載のパラメータ学習装置。
前記取得手段は、前記車両の位置情報を含むセンサ情報を取得し、
前記パラメータ学習手段は、拡張カルマンフィルタを用いて、前記取得手段によって取得した前記車両の位置情報を観測値として、前記モデルパラメータを学習する請求項１又は２記載のパラメータ学習装置。
前記取得手段は、前記車両が走行する走路における定常走行速度と、前記車両が走行する走路の曲率と、前記車両の前方を走行する車両との距離を示す前方車両情報とを含むセンサ情報を取得し、
前記運転行動モデルは、前記車両の走路上の目標位置を決定し、前記定常走行速度を、定常走行に関する速度制約条件を満たす上限速度として算出し、前記走路の曲率に基づいて、カーブ走行に関する速度制約条件を満たす上限速度を算出し、前記前方車両情報に基づいて、前方車両追従に関する速度制約条件を満たす上限速度を算出し、前記決定された走路上の目標位置に基づいて、前後位置制御に関する速度制約条件を満たす上限速度を算出し、前記算出された上限速度のうちの何れかを目標速度として選択するようにモデル化された請求項１〜請求項３の何れか１項記載のパラメータ学習装置。
前記取得手段は、前記車両の走路上の信号情報と、前記車両の目的地とを含むセンサ情報を取得し、
前記運転行動モデルは、前記信号情報に基づいて、信号停止に関する位置制約条件を満たす車両位置を算出し、前記車両の目的地に基づいて求められた経路情報に基づいて、経路に関する位置制約条件を満たす車両位置を算出し、前記算出された車両位置のうちの何れかを選択し、選択した位置を目標位置として決定するようにモデル化された請求項１〜請求項４の何れか１項記載のパラメータ学習装置。
請求項１〜請求項５の何れか１項記載のパラメータ学習装置と、
前記パラメータ学習装置によって学習された前記モデルパラメータと、前記運転行動モデルと、前記取得手段によって取得された前記センサ情報とに基づいて、前記車両のドライバの運転支援を行う運転支援手段と、
を含む運転支援装置。
コンピュータを、
車両の走行状態を示すセンサ情報を取得する取得手段、及び
前記センサ情報を用いて車両のドライバの複数の運転行動を離散的にモデル化し、かつ、条件分岐により切り替えるようにモデル化した運転行動モデルを、連続かつ微分可能な関数で近似した近似モデルと、前記取得手段によって取得された前記車両のセンサ情報とに基づいて、前記運転行動モデルの前記条件分岐で用いられる条件パラメータを含むモデルパラメータを学習するパラメータ学習手段
として機能させるためのプログラム。