JP7433205B2 - 車両制御装置、車両制御方法、およびプログラム - Google Patents

車両制御装置、車両制御方法、およびプログラム Download PDF

Info

Publication number
JP7433205B2
JP7433205B2 JP2020209225A JP2020209225A JP7433205B2 JP 7433205 B2 JP7433205 B2 JP 7433205B2 JP 2020209225 A JP2020209225 A JP 2020209225A JP 2020209225 A JP2020209225 A JP 2020209225A JP 7433205 B2 JP7433205 B2 JP 7433205B2
Authority
JP
Japan
Prior art keywords
vehicle
evaluation
overtake
lane
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020209225A
Other languages
English (en)
Other versions
JP2022096232A (ja
Inventor
建 後藤
政宣 武田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honda Motor Co Ltd
Original Assignee
Honda Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honda Motor Co Ltd filed Critical Honda Motor Co Ltd
Priority to JP2020209225A priority Critical patent/JP7433205B2/ja
Publication of JP2022096232A publication Critical patent/JP2022096232A/ja
Application granted granted Critical
Publication of JP7433205B2 publication Critical patent/JP7433205B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、車両制御装置、車両制御方法、およびプログラムに関する。
車両を自動的に(Automatedly)走行させる技術について研究および実用化が進められている。特許文献1には、車両を自動的に車線変更させる際の車線変更先の位置を決定することについて記載されている。また、運転者の運転行動を学習することにより、運転者の感覚に近い車線変更先を選択することについても記載されている。
特開2019-217828号公報
上記特許文献1に記載の発明は、目標速度を維持しながら走行する中で、前走車両を追い越す好適なタイミングについて言及されていない。仮に、前走車両の追い越しを行うか否かの判定を、単純なIf-Thenルールで行った場合、周辺車両との関係が好適に維持されるとは限らず、典型的な例としては、一度車線変更をして元の車線変更に戻る場合の車線変更先において、後続車両との間隔が短くなり過ぎる可能性がある。
一方で、強化学習を用いてより高度な判断をすることについて研究が進められている。強化学習は、モデル構築の自由度が高く、複雑な判断を可能にするものであるが、車載コンピュータに搭載するには処理負荷が高く、処理遅延や消費電力増大等の問題が生じ得る。
本発明は、このような事情を考慮してなされたものであり、処理負荷の増大を抑制しつつ、車両に前走車両を追い越させるか否かを適切に判断することができる車両制御装置、車両制御方法、およびプログラムを提供することを目的の一つとする。
この発明に係る車両制御装置、車両制御方法、およびプログラムは、以下の構成を採用した。
(1):この発明の一態様に係る車両制御装置は、車両の周辺状況を認識する認識部と、車両の乗員の操作に依らずに前記車両の加減速および操舵を制御する運転制御部と、を備え、前記運転制御部は、複数の評価関数が出力する複数の評価値を統合した値を閾値と比較することで、前記車両と同一の車線上における前記車両の前方を走行する前走車両を追い越すか否かを決定する追い越し制御部を備え、前記複数の評価関数のそれぞれは、前記認識部により認識された前記車両の周辺状況を示す複数の指標値のうち一つが入力されると評価値を出力するものであり、事前環境において強化学習によって出力傾向が調整されたものである。
(2):上記(1)の態様において、前記追い越し制御部は、前記複数の評価値の積が前記閾値以上である場合に、前記前走車両を追い越すことを決定し、前記車両に前記前走車両を追い越させるものである。
(3):上記(1)または(2)の態様において、前記複数の指標値は、前記車両の目標速度と前記前走車両の速度との差を含むものである。
(4):上記(1)から(3)のいずれかの態様において、前記複数の指標値は、前記車両と前記前走車両との距離を含むものである。
(5):上記(1)から(4)のいずれかの態様において、前記複数の指標値は、前記車両と、前記車両が追い越しの際に車線変更する先の隣接車線において前記車両よりも後方に居る隣接後方車両との距離を含むものである。
(6):上記(1)から(5)のいずれかの態様において、前記複数の評価関数のそれぞれは、Actor-Critic法によって前記出力傾向が調整されたものである。
(7):本発明の他の態様に係る車両制御方法は、車両制御装置が、車両の周辺状況を認識し、車両の乗員の操作に依らずに前記車両の加減速および操舵を制御し、前記制御することは、複数の評価関数が出力する複数の評価値を統合した値を閾値と比較することで、前記車両と同一の車線上における前記車両の前方を走行する前走車両を追い越すか否かを決定することを含み、前記複数の評価関数のそれぞれは、前記認識された前記車両の周辺状況を示す複数の指標値のうち一つが入力されると評価値を出力するものであり、事前環境において強化学習によって出力傾向が調整されたものである。
(8):本発明の他の態様に係るプログラムは、車両に搭載されたコンピュータに、車両の周辺状況を認識させ、車両の乗員の操作に依らずに前記車両の加減速および操舵を制御させ、前記制御させることは、複数の評価関数が出力する複数の評価値を統合した値を閾値と比較することで、前記車両と同一の車線上における前記車両の前方を走行する前走車両を追い越すか否かを決定させることを含み、前記複数の評価関数のそれぞれは、前記認識された前記車両の周辺状況を示す複数の指標値のうち一つが入力されると評価値を出力するものであり、事前環境において強化学習によって出力傾向が調整されたものである。
上記(1)~(8)の態様によれば、処理負荷の増大を抑制しつつ、車両に前走車両を追い越させる制御を好適に行うことができる。
実施形態に係る車両制御装置を利用した車両システム1の構成図である。 第1制御部120および第2制御部160の機能構成図である。 追い越し制御が行われる場面と各種定義について説明するための図である。 自車両Mが前走車両mAを追い越す動作について説明するための図である。 追い越し制御部142による追い越し判断処理の概要を示す図である。 事前環境における評価関数の学習処理について説明するための図である。 追い越し制御部142により実行される処理の流れの一例を示すフローチャートである。
以下、図面を参照し、本発明の車両制御装置、車両制御方法、およびプログラムの実施形態について説明する。
[全体構成]
図1は、実施形態に係る車両制御装置を利用した車両システム1の構成図である。車両システム1が搭載される車両は、例えば、二輪や三輪、四輪等の車両であり、その駆動源は、ディーゼルエンジンやガソリンエンジンなどの内燃機関、電動機、或いはこれらの組み合わせである。電動機は、内燃機関に連結された発電機による発電電力、或いは二次電池や燃料電池の放電電力を使用して動作する。
車両システム1は、例えば、カメラ10と、レーダ装置12と、LIDAR(Light Detection and Ranging)14と、物体認識装置16と、通信装置20と、HMI(Human Machine Interface)30と、車両センサ40と、ナビゲーション装置50と、MPU(Map Positioning Unit)60と、運転操作子80と、自動運転制御装置100と、走行駆動力出力装置200と、ブレーキ装置210と、ステアリング装置220とを備える。これらの装置や機器は、CAN(Controller Area Network)通信線等の多重通信線やシリアル通信線、無線通信網等によって互いに接続される。なお、図1に示す構成はあくまで一例であり、構成の一部が省略されてもよいし、更に別の構成が追加されてもよい。
カメラ10は、例えば、CCD(Charge Coupled Device)やCMOS(Complementary Metal Oxide Semiconductor)等の固体撮像素子を利用したデジタルカメラである。カメラ10は、車両システム1が搭載される車両(以下、自車両M)の任意の箇所に取り付けられる。前方を撮像する場合、カメラ10は、フロントウインドシールド上部やルームミラー裏面等に取り付けられる。カメラ10は、例えば、周期的に繰り返し自車両Mの周辺を撮像する。カメラ10は、ステレオカメラであってもよい。
レーダ装置12は、自車両Mの周辺にミリ波などの電波を放射すると共に、物体によって反射された電波(反射波)を検出して少なくとも物体の位置(距離および方位)を検出する。レーダ装置12は、自車両Mの任意の箇所に取り付けられる。レーダ装置12は、FM-CW(Frequency Modulated Continuous Wave)方式によって物体の位置および速度を検出してもよい。
LIDAR14は、自車両Mの周辺に光(或いは光に近い波長の電磁波)を照射し、散乱光を測定する。LIDAR14は、発光から受光までの時間に基づいて、対象までの距離を検出する。照射される光は、例えば、パルス状のレーザー光である。LIDAR14は、自車両Mの任意の箇所に取り付けられる。
物体認識装置16は、カメラ10、レーダ装置12、およびLIDAR14のうち一部または全部による検出結果に対してセンサフュージョン処理を行って、物体の位置、種類、速度などを認識する。物体認識装置16は、認識結果を自動運転制御装置100に出力する。物体認識装置16は、カメラ10、レーダ装置12、およびLIDAR14の検出結果をそのまま自動運転制御装置100に出力してよい。車両システム1から物体認識装置16が省略されてもよい。
通信装置20は、例えば、セルラー網やWi-Fi網、Bluetooth(登録商標)、DSRC(Dedicated Short Range Communication)などを利用して、自車両Mの周辺に存在する他車両と通信し、或いは無線基地局を介して各種サーバ装置と通信する。
HMI30は、自車両Mの乗員に対して各種情報を提示すると共に、乗員による入力操作を受け付ける。HMI30は、各種表示装置、スピーカ、ブザー、タッチパネル、スイッチ、キーなどを含む。
車両センサ40は、自車両Mの速度を検出する車速センサ、加速度を検出する加速度センサ、鉛直軸回りの角速度を検出するヨーレートセンサ、自車両Mの向きを検出する方位センサ等を含む。
ナビゲーション装置50は、例えば、GNSS(Global Navigation Satellite System)受信機51と、ナビHMI52と、経路決定部53とを備える。ナビゲーション装置50は、HDD(Hard Disk Drive)やフラッシュメモリなどの記憶装置に第1地図情報54を保持している。GNSS受信機51は、GNSS衛星から受信した信号に基づいて、自車両Mの位置を特定する。自車両Mの位置は、車両センサ40の出力を利用したINS(Inertial Navigation System)によって特定または補完されてもよい。ナビHMI52は、表示装置、スピーカ、タッチパネル、キーなどを含む。ナビHMI52は、前述したHMI30と一部または全部が共通化されてもよい。経路決定部53は、例えば、GNSS受信機51により特定された自車両Mの位置(或いは入力された任意の位置)から、ナビHMI52を用いて乗員により入力された目的地までの経路(以下、地図上経路)を、第1地図情報54を参照して決定する。第1地図情報54は、例えば、道路を示すリンクと、リンクによって接続されたノードとによって道路形状が表現された情報である。第1地図情報54は、道路の曲率やPOI(Point Of Interest)情報などを含んでもよい。地図上経路は、MPU60に出力される。ナビゲーション装置50は、地図上経路に基づいて、ナビHMI52を用いた経路案内を行ってもよい。ナビゲーション装置50は、例えば、乗員の保有するスマートフォンやタブレット端末等の端末装置の機能によって実現されてもよい。ナビゲーション装置50は、通信装置20を介してナビゲーションサーバに現在位置と目的地を送信し、ナビゲーションサーバから地図上経路と同等の経路を取得してもよい。
MPU60は、例えば、推奨車線決定部61を含み、HDDやフラッシュメモリなどの記憶装置に第2地図情報62を保持している。推奨車線決定部61は、ナビゲーション装置50から提供された地図上経路を複数のブロックに分割し(例えば、車両進行方向に関して100[m]毎に分割し)、第2地図情報62を参照してブロックごとに推奨車線を決定する。推奨車線決定部61は、左から何番目の車線を走行するといった決定を行う。推奨車線決定部61は、地図上経路に分岐箇所が存在する場合、自車両Mが、分岐先に進行するための合理的な経路を走行できるように、推奨車線を決定する。
第2地図情報62は、第1地図情報54よりも高精度な地図情報である。第2地図情報62は、例えば、車線の中央の情報あるいは車線の境界の情報等を含んでいる。また、第2地図情報62には、道路情報、交通規制情報、住所情報(住所・郵便番号)、施設情報、電話番号情報などが含まれてよい。第2地図情報62は、通信装置20が他装置と通信することにより、随時、アップデートされてよい。
運転操作子80は、例えば、アクセルペダル、ブレーキペダル、シフトレバー、ステアリングホイール、異形ステア、ジョイスティックその他の操作子を含む。運転操作子80には、操作量あるいは操作の有無を検出するセンサが取り付けられており、その検出結果は、自動運転制御装置100、もしくは、走行駆動力出力装置200、ブレーキ装置210、およびステアリング装置220のうち一部または全部に出力される。
自動運転制御装置100は、例えば、第1制御部120と、第2制御部160とを備える。第1制御部120と第2制御部160は、それぞれ、例えば、CPU(Central Processing Unit)などのハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。また、これらの構成要素のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)などのハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予め自動運転制御装置100のHDDやフラッシュメモリなどの記憶装置(非一過性の記憶媒体を備える記憶装置)に格納されていてもよいし、DVDやCD-ROMなどの着脱可能な記憶媒体に格納されており、記憶媒体(非一過性の記憶媒体)がドライブ装置に装置に装着されることで自動運転制御装置100のHDDやフラッシュメモリにインストールされてもよい。自動運転制御装置100は「車両制御装置」の一例であり、行動計画生成部140と第2制御部160を合わせたものが「運転制御部」の一例である。
図2は、第1制御部120および第2制御部160の機能構成図である。第1制御部120は、例えば、認識部130と、行動計画生成部140とを備える。認識部130は、指標値導出部132を備える。行動計画生成部140は、追い越し制御部142を備える。指標値導出部132と追い越し制御部142の機能については後述する。第1制御部120は、例えば、AI(Artificial Intelligence;人工知能)による機能と、予め与えられたモデルによる機能とを並行して実現する。例えば、「交差点を認識する」機能は、ディープラーニング等による交差点の認識と、予め与えられた条件(パターンマッチング可能な信号、道路標示などがある)に基づく認識とが並行して実行され、双方に対してスコア付けして総合的に評価することで実現されてよい。これによって、自動運転の信頼性が担保される。
認識部130は、カメラ10、レーダ装置12、およびLIDAR14から物体認識装置16を介して入力された情報に基づいて、自車両Mの周辺にある物体の位置、および速度、加速度等の状態を認識する。物体の位置は、例えば、自車両Mの代表点(重心や駆動軸中心など)を原点とした絶対座標上の位置として認識され、制御に使用される。物体の位置は、その物体の重心やコーナー等の代表点で表されてもよいし、表現された領域で表されてもよい。物体の「状態」とは、物体の加速度やジャーク、あるいは「行動状態」(例えば車線変更をしている、またはしようとしているか否か)を含んでもよい。
また、認識部130は、例えば、自車両Mが走行している車線(走行車線)を認識する。例えば、認識部130は、第2地図情報62から得られる道路区画線のパターン(例えば実線と破線の配列)と、カメラ10によって撮像された画像から認識される自車両Mの周辺の道路区画線のパターンとを比較することで、走行車線を認識する。なお、認識部130は、道路区画線に限らず、道路区画線や路肩、縁石、中央分離帯、ガードレールなどを含む走路境界(道路境界)を認識することで、走行車線を認識してもよい。この認識において、ナビゲーション装置50から取得される自車両Mの位置やINSによる処理結果が加味されてもよい。また、認識部130は、一時停止線、障害物、赤信号、料金所、その他の道路事象を認識する。
認識部130は、走行車線を認識する際に、走行車線に対する自車両Mの位置や姿勢を認識する。認識部130は、例えば、自車両Mの基準点の車線中央からの乖離、および自車両Mの進行方向の車線中央を連ねた線に対してなす角度を、走行車線に対する自車両Mの相対位置および姿勢として認識してもよい。これに代えて、認識部130は、走行車線のいずれかの側端部(道路区画線または道路境界)に対する自車両Mの基準点の位置などを、走行車線に対する自車両Mの相対位置として認識してもよい。
行動計画生成部140は、原則的には推奨車線決定部61により決定された推奨車線を走行し、更に、自車両Mの周辺状況に対応できるように、自車両Mが自動的に(運転者の操作に依らずに)将来走行する目標軌道を生成する。目標軌道は、例えば、速度要素を含んでいる。例えば、目標軌道は、自車両Mの到達すべき地点(軌道点)を順に並べたものとして表現される。軌道点は、道なり距離で所定の走行距離(例えば数[m]程度)ごとの自車両Mの到達すべき地点であり、それとは別に、所定のサンプリング時間(例えば0コンマ数[sec]程度)ごとの目標速度および目標加速度が、目標軌道の一部として生成される。また、軌道点は、所定のサンプリング時間ごとの、そのサンプリング時刻における自車両Mの到達すべき位置であってもよい。この場合、目標速度や目標加速度の情報は軌道点の間隔で表現される。
行動計画生成部140は、目標軌道を生成するにあたり、自動運転のイベントを設定してよい。自動運転のイベントには、定速走行イベント、低速追従走行イベント、車線変更イベント、分岐イベント、合流イベント、テイクオーバーイベントなどがある。行動計画生成部140は、起動させたイベントに応じた目標軌道を生成する。
第2制御部160は、行動計画生成部140によって生成された目標軌道を、予定の時刻通りに自車両Mが通過するように、走行駆動力出力装置200、ブレーキ装置210、およびステアリング装置220を制御する。
図2に戻り、第2制御部160は、例えば、取得部162と、速度制御部164と、操舵制御部166とを備える。取得部162は、行動計画生成部140により生成された目標軌道(軌道点)の情報を取得し、メモリ(不図示)に記憶させる。速度制御部164は、メモリに記憶された目標軌道に付随する速度要素に基づいて、走行駆動力出力装置200またはブレーキ装置210を制御する。操舵制御部166は、メモリに記憶された目標軌道の曲がり具合に応じて、ステアリング装置220を制御する。速度制御部164および操舵制御部166の処理は、例えば、フィードフォワード制御とフィードバック制御との組み合わせにより実現される。一例として、操舵制御部166は、自車両Mの前方の道路の曲率に応じたフィードフォワード制御と、目標軌道からの乖離に基づくフィードバック制御とを組み合わせて実行する。
走行駆動力出力装置200は、車両が走行するための走行駆動力(トルク)を駆動輪に出力する。走行駆動力出力装置200は、例えば、内燃機関、電動機、および変速機などの組み合わせと、これらを制御するECU(Electronic Control Unit)とを備える。ECUは、第2制御部160から入力される情報、或いは運転操作子80から入力される情報に従って、上記の構成を制御する。
ブレーキ装置210は、例えば、ブレーキキャリパーと、ブレーキキャリパーに油圧を伝達するシリンダと、シリンダに油圧を発生させる電動モータと、ブレーキECUとを備える。ブレーキECUは、第2制御部160から入力される情報、或いは運転操作子80から入力される情報に従って電動モータを制御し、制動操作に応じたブレーキトルクが各車輪に出力されるようにする。ブレーキ装置210は、運転操作子80に含まれるブレーキペダルの操作によって発生させた油圧を、マスターシリンダを介してシリンダに伝達する機構をバックアップとして備えてよい。なお、ブレーキ装置210は、上記説明した構成に限らず、第2制御部160から入力される情報に従ってアクチュエータを制御して、マスターシリンダの油圧をシリンダに伝達する電子制御式油圧ブレーキ装置であってもよい。
ステアリング装置220は、例えば、ステアリングECUと、電動モータとを備える。電動モータは、例えば、ラックアンドピニオン機構に力を作用させて転舵輪の向きを変更する。ステアリングECUは、第2制御部160から入力される情報、或いは運転操作子80から入力される情報に従って、電動モータを駆動し、転舵輪の向きを変更させる。
[追い越し制御]
以下、自動運転制御装置100が行う追い越し制御について説明する。行動計画生成部140の追い越し制御部142は、例えば、定速走行イベントが実行されているときに作動する。追い越し制御部142は、自車両Mと同一の車線上における自車両Mの前方(直前)を走行する前走車両を追い越すために、自車両Mを一度隣接車線に車線変更し、自車両Mが前走車両であった車両よりも十分に前に出たときに元の車線に戻らせる。「直前」とは、間に車両が無いという意味である。
図3は、追い越し制御が行われる場面と各種定義について説明するための図である。図中、mAは前走車両、L1は自車両Mが居る車線、L2は隣接車線であり、且つ自車両Mが前走車両mAを追い越す際に車線変更する先の車線である。Vは自車両Mの速度、VmAは前走車両mAの速度である。また、mBは隣接車線L2における自車両Mよりも前方に居る隣接車線前方車両であり、mCは隣接車線L2における自車両Mよりも後方に居る隣接車線後方車両であり、mDは後続車両である。「後方」とは、例えば、代表点(重心など)の位置関係を道路延在方向(図中X方向)に関して比較した結果、後方であることをいう。また、自車両Mの後端部よりも前端部が道路延在方向(図中X方向)に関して後方に居ることを意味してもよい。前方に関しても同様である。なお、自車両Mが居る車線の両側に隣接車線がある場合、何らかの手法で車線変更先の車線を決定し、決定した車線を隣接車線としてよい。
認識部130の指標値導出部132は、前述した認識処理の結果として、(1)自車両Mの目標速度V*から前走車両mAの速度VmAを差し引いた速度差ΔV(=V*-VmA)、(2)自車両Mと前走車両mAとの距離DMA、(3)自車両Mと隣接車線後方車両mCとの距離DMCなどの指標値を導出する。目標速度V*は、法定速度、乗員がセットしたセット速度などに基づいて決定される。距離DMAは自車両Mの前端部と前走車両mAの後端部との道路延在方向に関する距離であるものとしたが、自車両Mの代表点と前走車両mAの代表点との道路延在方向に関する距離であってもよい。また、距離DMCは自車両Mの後端部と前走車両mCの前端部との道路延在方向に関する距離であるものとしたが、自車両Mの代表点と前走車両mCの代表点との道路延在方向に関する距離であってもよい。指標値導出部132は、前述した(1)~(3)の指標値のうち一部のみを導出してもよく、追い越し時の自車両Mの環境を示すものである限り、別の指標値を導出してもよい。例えば、指標値導出部132は、自車両Mと隣接車線前方車両mBとの距離、前走車両mAの速度の変動度合い(例えば分散)や道路幅方向(図中Y方向)に関する位置(横位置)などを指標値として導出してもよい。
追い越し制御部142は、複数の指標値のそれぞれを、指標値ごとの評価関数に入力することで、指標値ごとの評価値を取得する。そして、追い越し制御部142は、複数の評価値を統合した値を閾値と比較することで、前走車両mAを追い越すか否かを決定する。より具体的に、追い越し制御部142は、複数の評価値の積が閾値以上である場合に、前走車両mAを追い越すことを決定し、自車両Mに前走車両mAを追い越させる。
図4は、自車両Mが前走車両mAを追い越す動作について説明するための図である。追い越し制御部142は、まず、自車両Mを隣接車線L2における隣接車線後方車両mCの前方に車線変更させ、次いで、元の車線L1における前走車両mAの前方に車線変更させる。この際の速度制御や操舵制御に関しては本発明の中核をなさないため説明を省略する。係る動作を実行するかどうか判断する際に、自動運転制御装置100は、少なくとも前走車両mA、隣接車線前方車両mB、隣接車線後方車両mCの位置や速度、それらの変化に応じた判断をしなければならず、乗員に違和感を感じさせないようにするためには、高度な判断が要求される。
そこで、追い越し制御部142は、事前環境において強化学習によって出力傾向が調整された複数の評価関数を用いて、前走車両mAを追い越すか否かを決定する。事前環境とは、自車両Mにソフトウェアが適用する前の、シミュレーション環境あるいは実車を使用したテスト環境をいう。複数の評価関数のそれぞれは、指標値が入力されると評価値を出力するものである。図5は、追い越し制御部142による追い越し判断処理の概要を示す図である。追い越し制御部142は、速度差ΔV、距離DMA、距離DMCなどの指標値1、2、3、…nを、それぞれに対応する評価関数1、2、3、…、nに入力し、得られた評価値E1~Enの総乗を計算する。そして、総乗が閾値Th以上である場合に、前走車両mAを追い越すことを決定する。それぞれの評価関数の出力する値は、自車両Mの乗員の追い越す欲求を示す値である。それぞれの評価関数の出力する値は、例えばゼロから1の間の値をとるように調整されている。
[事前環境]
図6は、事前環境における評価関数の学習処理について説明するための図である。事前環境における評価関数の学習処理は、任意のコンピュータ装置によって実行される。なお、シミュレーション環境に代えて、テストコースなどの実環境が利用されてもよい。まずActor300として、追い越し制御部142と同等の機能(状態に含まれる指標値を評価関数に入力して得られる評価値の積が閾値以上である場合に追い越し実行すると判断するもの)を用意する。Actor300の判断結果を反映するシミュレーション環境の出力である状態は、Actor300と、報酬関数310とに入力される。
報酬関数310は、状態に含まれる指標値(Actorに入力される指標値と一部または全部が重複してもよいし、全く別の指標値でもよい)を、指標値ごとの報酬関数に入力し、複数の報酬関数値R1、R2、R3、…、Rmを得る。報酬関数310における指標値は、例えば、自車両Mの目標速度V*から実速度Vを差し引いた速度差ΔV#(=V*-V)、自車両Mと前走車両mAとの距離DMA、自車両Mと後続車両mDとの距離DMDなどであり、それぞれの報酬関数は、自車両Mの巡航の快適さを表す報酬関数値を出力する。そして、報酬関数値R1、R2、R3、…、Rmの総乗が統合報酬関数値RtotalとしてCritic320に出力される。
Critic320は、入力された統合報酬関数値Rtotalに基づいて、将来の報酬和を推定し、Actor300の行動の適切さを評価し、評価結果に基づいてActor300の評価関数のパラメータを調整する。そして、十分に調整が完了した段階のActor300の評価関数が、追い越し制御部142が用いる評価関数として自車両Mに搭載される。Critic320は、係る処理のためにDNN(Deep Neural Network)を用いた処理を行う。Critic320の処理は、例えば公知のActor-Critic法に基づくものであり、詳細な説明を省略する。係る処理は、処理負荷が高いものであるが、車両に搭載する前の事前環境において行われるため、車両に搭載した場合の処理負荷等の問題は生じない。また、DNN等の高度な処理を行うことで、状態価値を正確に推定することができる。なお、Actor-Critic法に代えて、他の強化学習の手法が用いられてもよい。
[処理フロー]
図7は、追い越し制御部142により実行される処理の流れの一例を示すフローチャートである。本フローチャートの処理は、例えば、定速走行イベントが実行されている間、繰り返し実行される。
まず、追い越し制御部142は、指標値導出部132から複数の指標値を取得し(ステップS100)、複数の指標値をそれぞれに対応する評価関数に入力する(ステップS102)。そして、追い越し制御部142は、評価値の総乗が閾値Th以上であるか否かを判定する(ステップS104)。評価値の総乗が閾値Th以上である場合、追い越し制御部142は、自車両Mに前走車両mAを追い越させる(ステップS106)
以上説明した実施形態によれば、車両(M)の周辺状況を認識する認識部(130、132)と、車両の乗員の操作に依らずに車両の加減速および操舵を制御する運転制御部(140、160)と、を備え、運転制御部は、複数の評価関数が出力する複数の評価値を統合した値を閾値と比較することで、車両と同一の車線上における車両の前方を走行する前走車両を追い越すか否かを決定する追い越し制御部(142)を備え、複数の評価関数のそれぞれは、認識部により認識された車両の周辺状況を示す複数の指標値が入力されると評価値を出力するものであり、事前環境において強化学習によって出力傾向が調整されたものであるため、処理負荷の増大を抑制しつつ、車両に前走車両を追い越させるか否かを適切に判断することができる。
上記説明した実施形態は、以下のように表現することができる。
プログラムを記憶した記憶装置と、
ハードウェアプロセッサと、を備え、
前記ハードウェアプロセッサが前記記憶装置に記憶されたプログラムを実行することにより、
車両の周辺状況を認識し、
車両の乗員の操作に依らずに前記車両の加減速および操舵を制御し、
前記制御することは、複数の評価関数が出力する複数の評価値を統合した値を閾値と比較することで、前記車両と同一の車線上における前記車両の前方を走行する前走車両を追い越すか否かを決定することを含み、
前記複数の評価関数のそれぞれは、
前記認識部により認識された前記車両の周辺状況を示す複数の指標値が入力されると評価値を出力するものであり、
事前環境において強化学習によって出力傾向が調整されたものである、
ように構成されている、車両制御装置。
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
100 自動運転制御装置
130 認識部
132 指標値導出部
140 行動計画生成部
142 追い越し制御部

Claims (4)

  1. 車両の周辺状況を認識する認識部と、
    車両の乗員の操作に依らずに前記車両の加減速および操舵を制御する運転制御部と、を備え、
    前記運転制御部は、複数の評価関数が出力する複数の評価値を統合した値を閾値と比較することで、前記車両と同一の車線上における前記車両の前方を走行する前走車両を追い越すか否かを決定する追い越し制御部を備え、
    前記複数の評価関数のそれぞれは、
    前記認識部により認識された前記車両の周辺状況を示す複数の指標値のうち一つが入力されると評価値を出力するものであり、
    事前環境において強化学習によって出力傾向が調整されたものであ
    前記追い越し制御部は、前記複数の評価値の積が前記閾値以上である場合に、前記前走車両を追い越すことを決定し、前記車両に前記前走車両を追い越させ、
    前記複数の指標値は、前記車両の目標速度と前記前走車両の速度との差、前記車両と前記前走車両との距離、および、前記車両と、前記車両が追い越しの際に車線変更する先の隣接車線において前記車両よりも後方に居る隣接後方車両との距離を全て含む、
    車両制御装置。
  2. 前記複数の評価関数のそれぞれは、Actor-Critic法によって前記出力傾向が調整されたものである、
    請求項1記載の車両制御装置。
  3. 車両制御装置が、
    車両の周辺状況を認識し、
    車両の乗員の操作に依らずに前記車両の加減速および操舵を制御し、
    前記制御することは、複数の評価関数が出力する複数の評価値を統合した値を閾値と比較することで、前記車両と同一の車線上における前記車両の前方を走行する前走車両を追い越すか否かを決定することを含み、
    前記複数の評価関数のそれぞれは、
    前記認識された前記車両の周辺状況を示す複数の指標値のうち一つが入力されると評価値を出力するものであり、
    事前環境において強化学習によって出力傾向が調整されたものであ
    前記車両制御装置が、前記複数の評価値の積が前記閾値以上である場合に、前記前走車両を追い越すことを決定し、前記車両に前記前走車両を追い越させ、
    前記複数の指標値は、前記車両の目標速度と前記前走車両の速度との差、前記車両と前記前走車両との距離、および、前記車両と、前記車両が追い越しの際に車線変更する先の隣接車線において前記車両よりも後方に居る隣接後方車両との距離を全て含む、
    車両制御方法。
  4. 車両に搭載されたコンピュータに、
    車両の周辺状況を認識させ、
    車両の乗員の操作に依らずに前記車両の加減速および操舵を制御させ、
    前記制御させることは、複数の評価関数が出力する複数の評価値を統合した値を閾値と比較することで、前記車両と同一の車線上における前記車両の前方を走行する前走車両を追い越すか否かを決定させることを含み、
    前記複数の評価関数のそれぞれは、
    前記認識された前記車両の周辺状況を示す複数の指標値のうち一つが入力されると評価値を出力するものであり、
    事前環境において強化学習によって出力傾向が調整されたものであ
    前記コンピュータに、前記複数の評価値の積が前記閾値以上である場合に、前記前走車両を追い越すことを決定させ、前記車両に前記前走車両を追い越させることを行わせ、
    前記複数の指標値は、前記車両の目標速度と前記前走車両の速度との差、前記車両と前記前走車両との距離、および、前記車両と、前記車両が追い越しの際に車線変更する先の隣接車線において前記車両よりも後方に居る隣接後方車両との距離を全て含む、
    プログラム。
JP2020209225A 2020-12-17 2020-12-17 車両制御装置、車両制御方法、およびプログラム Active JP7433205B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020209225A JP7433205B2 (ja) 2020-12-17 2020-12-17 車両制御装置、車両制御方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020209225A JP7433205B2 (ja) 2020-12-17 2020-12-17 車両制御装置、車両制御方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2022096232A JP2022096232A (ja) 2022-06-29
JP7433205B2 true JP7433205B2 (ja) 2024-02-19

Family

ID=82163796

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020209225A Active JP7433205B2 (ja) 2020-12-17 2020-12-17 車両制御装置、車両制御方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP7433205B2 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018030479A (ja) 2016-08-25 2018-03-01 スズキ株式会社 車両の走行制御装置
JP2019031268A (ja) 2017-05-12 2019-02-28 トヨタ モーター エンジニアリング アンド マニュファクチャリング ノース アメリカ,インコーポレイティド 能動的探索なしの強化学習に基づく制御ポリシー学習及び車両制御方法
WO2020230306A1 (ja) 2019-05-15 2020-11-19 日産自動車株式会社 車両の走行制御方法及び走行制御装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018030479A (ja) 2016-08-25 2018-03-01 スズキ株式会社 車両の走行制御装置
JP2019031268A (ja) 2017-05-12 2019-02-28 トヨタ モーター エンジニアリング アンド マニュファクチャリング ノース アメリカ,インコーポレイティド 能動的探索なしの強化学習に基づく制御ポリシー学習及び車両制御方法
WO2020230306A1 (ja) 2019-05-15 2020-11-19 日産自動車株式会社 車両の走行制御方法及び走行制御装置

Also Published As

Publication number Publication date
JP2022096232A (ja) 2022-06-29

Similar Documents

Publication Publication Date Title
JP7474314B2 (ja) 車両制御装置、車両制御方法、およびプログラム
JP7043295B2 (ja) 車両制御装置、車両制御方法、およびプログラム
JP7345349B2 (ja) 車両制御装置、車両制御方法、およびプログラム
JP7112374B2 (ja) 車両制御装置、車両制御方法、およびプログラム
JP2019159428A (ja) 車両制御装置、車両制御方法及びプログラム
JP2019137189A (ja) 車両制御システム、車両制御方法、およびプログラム
JP7406432B2 (ja) 移動体制御装置、移動体制御方法、およびプログラム
JP7161458B2 (ja) 車両制御装置、車両制御方法、およびプログラム
JP6966626B2 (ja) 車両制御装置、車両制御方法、及びプログラム
JP7183237B2 (ja) 車両制御装置、車両制御方法、およびプログラム
JP7376634B2 (ja) 車両制御装置、車両制御方法、およびプログラム
JP2024030413A (ja) 車両制御装置、車両制御方法、およびプログラム
JP7308880B2 (ja) 車両制御装置、車両制御方法、およびプログラム
JP7125969B2 (ja) 車両制御装置、車両制御方法、およびプログラム
JP7449751B2 (ja) 車両制御装置、車両制御方法、およびプログラム
CN115140086A (zh) 车辆控制装置、车辆控制方法及存储介质
JP7166988B2 (ja) 車両制御装置、車両制御方法、およびプログラム
JP7091290B2 (ja) 車両制御装置、車両制御方法、およびプログラム
JP7433205B2 (ja) 車両制御装置、車両制御方法、およびプログラム
JP2022142264A (ja) 移動体制御システム、移動体制御方法、およびプログラム
JP2022142863A (ja) 移動体制御装置、移動体制御方法、およびプログラム
JP2021149390A (ja) 車両制御装置、車両制御方法、およびプログラム
JP7425133B1 (ja) 車両制御装置、車両制御方法、およびプログラム
JP7132190B2 (ja) 車両制御装置、車両制御方法、およびプログラム
JP7345515B2 (ja) 車両制御装置、車両制御方法、およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230131

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230822

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231017

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240109

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240206

R150 Certificate of patent or registration of utility model

Ref document number: 7433205

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150