JP7469167B2 - 制御装置及び制御方法並びに車両 - Google Patents

制御装置及び制御方法並びに車両 Download PDF

Info

Publication number
JP7469167B2
JP7469167B2 JP2020117307A JP2020117307A JP7469167B2 JP 7469167 B2 JP7469167 B2 JP 7469167B2 JP 2020117307 A JP2020117307 A JP 2020117307A JP 2020117307 A JP2020117307 A JP 2020117307A JP 7469167 B2 JP7469167 B2 JP 7469167B2
Authority
JP
Japan
Prior art keywords
evaluation value
condition
action
value
evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020117307A
Other languages
English (en)
Other versions
JP2022014769A (ja
Inventor
アディティヤ マハジャン
孝保 熊野
裕司 安井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honda Motor Co Ltd
Original Assignee
Honda Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honda Motor Co Ltd filed Critical Honda Motor Co Ltd
Priority to JP2020117307A priority Critical patent/JP7469167B2/ja
Priority to US17/363,086 priority patent/US20220009494A1/en
Priority to CN202110756944.1A priority patent/CN113911135B/zh
Publication of JP2022014769A publication Critical patent/JP2022014769A/ja
Application granted granted Critical
Publication of JP7469167B2 publication Critical patent/JP7469167B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W30/00Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units
    • B60W30/18Propelling the vehicle
    • B60W30/18009Propelling the vehicle related to particular drive situations
    • B60W30/18163Lane change; Overtaking manoeuvres
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W60/00Drive control systems specially adapted for autonomous road vehicles
    • B60W60/001Planning or execution of driving tasks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Transportation (AREA)
  • Mechanical Engineering (AREA)
  • Human Computer Interaction (AREA)
  • Traffic Control Systems (AREA)
  • Control Of Driving Devices And Active Controlling Of Vehicle (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)

Description

本発明は、制御装置及び制御方法並びに車両に関する。
自動運転車両が実用化されてきている。自動運転車両では、車両の制御装置自体が特定の行動を実行するかどうかを判定する。特許文献1には、運転支援装置の車線変更の中止判断として、後続車両の後続車速に対して設定閾値以上であるかを判定したあと、後続車速が、より大きな閾値以上であるかを判定する技術が記載されている。
特開2016-009201号公報
車両のような移動体の行動を開始するタイミングを決定するために、強化学習によって得られた評価関数を利用することが考えられる。評価関数の出力値、すなわち評価値が最大な動作を行うだけでは、適切なタイミングで行動を開始できるとは限らない。本発明の一部の側面は、移動体が特定の行動を開始するのに適したタイミングを決定するための技術を提供することを目的とする。
上記課題に鑑みて、移動体の制御装置であって、前記移動体の行動を計画する計画部と、第1評価値及び第2評価値を取得する取得部であって、前記第1評価値は、強化学習によって生成された評価関数を使用して、前記行動を開始しないことに対して算出された評価値であり、前記第2評価値は、前記評価関数を使用して、前記行動を開始することに対して算出された評価値であり、前記第2評価値が高いほど前記行動に成功する可能性が高い、取得部と、前記第1評価値に対する前記第2評価値の相対値を算出する算出部と、第1時刻において取得された前記第1評価値及び前記第2評価値が第1条件を満たし、かつ前記第1時刻よりも後の第2時刻において取得された前記第1評価値及び前記第2評価値が第2条件を満たした場合に、前記行動を開始すると判定する判定部と、を備え、前記第2条件は、前記第1条件よりも厳しく、前記第1条件は、前記第1評価値及び前記第2評価値について算出された前記相対値が第1閾値よりも大きいことを含み、前記第2条件は、前記第1評価値及び前記第2評価値について算出された前記相対値が第2閾値よりも大きいことを含み、前記第2閾値は、前記第1閾値よりも大きい、制御装置が提供される。
上記手段により、移動体が特定の行動を開始するのに適したタイミングを決定できる。
本発明の実施形態の車両の構成例を説明する図。 本発明の実施形態の車両の制御装置の構成例を説明する図。 本発明の実施形態の車両の制御方法の例を説明する図。 本発明の実施形態の行動開始条件の例を説明する図。 本発明の実施形態の車線変更の状況を説明する図。
以下、添付図面を参照して実施形態を詳しく説明する。尚、以下の実施形態は特許請求の範囲に係る発明を限定するものでなく、また実施形態で説明されている特徴の組み合わせの全てが発明に必須のものとは限らない。実施形態で説明されている複数の特徴のうち二つ以上の特徴が任意に組み合わされてもよい。また、同一若しくは同様の構成には同一の参照番号を付し、重複した説明は省略する。
以下に説明する実施形態は、移動体の制御、特に移動体が行動を開始すべきかどうかの判定に関する。以下の実施形態では、移動体の一例として車両を扱う。しかし、以下の実施形態は、車両以外の移動体、例えば船舶、航空機、ドローンなどにも適用可能である。
図1は、本発明の一実施形態に係る車両1のブロック図である。図1において、車両1はその概略が平面図と側面図とで示されている。車両1は一例としてセダンタイプの四輪の乗用車である。車両1はこのような四輪車両であってもよいし、二輪車両や他のタイプの車両であってもよい。
車両1は、車両1を制御する車両用制御装置2(以下、単に制御装置2と呼ぶ)を含む。制御装置2は車内ネットワークにより通信可能に接続された複数のECU20~29を含む。各ECUは、CPUに代表されるプロセッサ、半導体メモリ等のメモリ、外部デバイスとのインタフェース等を含む。メモリにはプロセッサが実行するプログラムやプロセッサが処理に使用するデータ等が格納される。各ECUはプロセッサ、メモリおよびインタフェース等を複数備えていてもよい。例えば、ECU20は、プロセッサ20aとメモリ20bとを備える。メモリ20bに格納されたプログラムが含む命令をプロセッサ20aが実行することによって、ECU20による処理が実行される。これに代えて、ECU20は、ECU20による処理を実行するためのASIC等の専用の集積回路を備えてもよい。他のECUについても同様である。
以下、各ECU20~29が担当する機能等について説明する。なお、ECUの数や、担当する機能については適宜設計可能であり、本実施形態よりも細分化したり、統合したりすることが可能である。
ECU20は、車両1の自動走行に関わる制御を実行する。自動運転においては、車両1の操舵と、加減速の少なくともいずれか一方を自動制御する。ECU20による自動走行は、運転者による走行操作を必要としない自動走行(自動運転とも呼ばれうる)と、運転者による走行操作を支援するための自動走行(運転支援とも呼ばれうる)とを含んでもよい。
ECU21は、電動パワーステアリング装置3を制御する。電動パワーステアリング装置3は、ステアリングホイール31に対する運転者の運転操作(操舵操作)に応じて前輪を操舵する機構を含む。また、電動パワーステアリング装置3は操舵操作をアシストしたり、前輪を自動操舵したりするための駆動力を発揮するモータや、操舵角を検知するセンサ等を含む。車両1の運転状態が自動運転の場合、ECU21は、ECU20からの指示に対応して電動パワーステアリング装置3を自動制御し、車両1の進行方向を制御する。
ECU22および23は、車両の周囲状況を検知する検知ユニット41~43の制御および検知結果の情報処理を行う。検知ユニット41は、車両1の前方を撮影するカメラであり(以下、カメラ41と表記する場合がある。)、本実施形態の場合、車両1のルーフ前部でフロントウィンドウの車室内側に取り付けられる。カメラ41が撮影した画像の解析により、物標の輪郭抽出や、道路上の車線の区画線(白線等)を抽出可能である。
検知ユニット42は、ライダ(Light Detection and Ranging)であり(以下、ライダ42と表記する場合がある)、車両1の周囲の物標を検知したり、物標との距離を測距したりする。本実施形態の場合、ライダ42は5つ設けられており、車両1の前部の各隅部に1つずつ、後部中央に1つ、後部各側方に1つずつ設けられている。検知ユニット43は、ミリ波レーダであり(以下、レーダ43と表記する場合がある)、車両1の周囲の物標を検知したり、物標との距離を測距したりする。本実施形態の場合、レーダ43は5つ設けられており、車両1の前部中央に1つ、前部各隅部に1つずつ、後部各隅部に一つずつ設けられている。
ECU22は、一方のカメラ41と、各ライダ42の制御および検知結果の情報処理を行う。ECU23は、他方のカメラ41と、各レーダ43の制御および検知結果の情報処理を行う。車両の周囲状況を検知する装置を二組備えたことで、検知結果の信頼性を向上でき、また、カメラ、ライダ、レーダといった種類の異なる検知ユニットを備えたことで、車両の周辺環境の解析を多面的に行うことができる。
ECU24は、ジャイロセンサ5、GPSセンサ24b、通信装置24cの制御および検知結果あるいは通信結果の情報処理を行う。ジャイロセンサ5は車両1の回転運動を検知する。ジャイロセンサ5の検知結果や、車輪速等により車両1の進路を判定することができる。GPSセンサ24bは、車両1の現在位置を検知する。通信装置24cは、地図情報や交通情報を提供するサーバと無線通信を行い、これらの情報を取得する。ECU24は、メモリに構築された地図情報のデータベース24aにアクセス可能であり、ECU24は現在地から目的地へのルート探索等を行う。ECU24、地図データベース24a、GPSセンサ24bは、いわゆるナビゲーション装置を構成している。
ECU25は、車車間通信用の通信装置25aを備える。通信装置25aは、周辺の他車両と無線通信を行い、車両間での情報交換を行う。
ECU26は、パワープラント6を制御する。パワープラント6は車両1の駆動輪を回転させる駆動力を出力する機構であり、例えば、エンジンと変速機とを含む。ECU26は、例えば、アクセルペダル7Aに設けた操作検知センサ7aにより検知した運転者の運転操作(アクセル操作あるいは加速操作)に対応してエンジンの出力を制御したり、車速センサ7cが検知した車速等の情報に基づいて変速機の変速段を切り替えたりする。車両1の運転状態が自動運転の場合、ECU26は、ECU20からの指示に対応してパワープラント6を自動制御し、車両1の加減速を制御する。
ECU27は、方向指示器8(ウィンカ)を含む灯火器(ヘッドライト、テールライト等)を制御する。図1の例の場合、方向指示器8は車両1の前部、ドアミラーおよび後部に設けられている。
ECU28は、入出力装置9の制御を行う。入出力装置9は運転者に対する情報の出力と、運転者からの情報の入力の受け付けを行う。音声出力装置91は運転者に対して音声により情報を報知する。表示装置92は運転者に対して画像の表示により情報を報知する。表示装置92は例えば運転席表面に配置され、インストルメントパネル等を構成する。なお、ここでは、音声と表示を例示したが振動や光により情報を報知してもよい。また、音声、表示、振動または光のうちの複数を組み合わせて情報を報知してもよい。更に、報知すべき情報のレベル(例えば緊急度)に応じて、組み合わせを異ならせたり、報知態様を異ならせたりしてもよい。入力装置93は運転者が操作可能な位置に配置され、車両1に対する指示を行うスイッチ群であるが、音声入力装置も含まれてもよい。
ECU29は、ブレーキ装置10やパーキングブレーキ(不図示)を制御する。ブレーキ装置10は例えばディスクブレーキ装置であり、車両1の各車輪に設けられ、車輪の回転に抵抗を加えることで車両1を減速あるいは停止させる。ECU29は、例えば、ブレーキペダル7Bに設けた操作検知センサ7bにより検知した運転者の運転操作(ブレーキ操作)に対応してブレーキ装置10の作動を制御する。車両1の運転状態が自動運転の場合、ECU29は、ECU20からの指示に対応してブレーキ装置10を自動制御し、車両1の減速および停止を制御する。ブレーキ装置10やパーキングブレーキは車両1の停止状態を維持するために作動することもできる。また、パワープラント6の変速機がパーキングロック機構を備える場合、これを車両1の停止状態を維持するために作動することもできる。
図2を参照して、ECU20の機能ブロックの例について説明する。図2では、ECU20の機能のうち自動運転に関するものを記載する。ECU20は、行動計画部201と、環境取得部202と、評価関数記憶部203と、評価値算出部204と、評価値記憶部205と、開始判定部206と、走行制御部207とを含む。行動計画部201と、環境取得部202と、評価値算出部204と、開始判定部206と、走行制御部207とは、プロセッサ20aによって実現されてもよい。具体的に、これらの機能部の動作は、メモリ20bに格納されたプログラムをプロセッサ20aが実行することによって行われてもよい。これにかえて、これらの機能部の一部又は全部は、ASIC(特定用途向け集積回路)やFPGA(フィールドプログラマブルゲートアレイ)のような専用回路によって実現されてもよい。評価関数記憶部203と、評価値記憶部205とは、メモリ20bによって実現されてもよい。
行動計画部201は、車両1の行動を計画する。行動計画部201によって計画される行動は、車線変更、右折、左折、自動ブレーキ、自動駐車など、車両1に関するどのような行動であってもよい。行動計画部201は、運転者からの指示に基づいて行動を計画してもよいし、走行予定(例えば、目的地への経路)に従って行動を計画してもよい。
環境取得部202は、車両1の走行環境に関する情報を取得する。車両1の走行環境に関する情報は、車両1の情報と、車両1の周囲の情報とを含んでもよい。車両1に関する情報として、動的な情報(現在の速度、現在の加速度、現在の地理的位置など)と、静的な情報(車両1の車長、車幅、重量など)とを含んでもよい。車両1に関する情報は、車両1の各アクチュエータに設置されたセンサからの出力に基づいて取得されてもよい。車両1の周囲の情報は、車両1の周囲にある動的オブジェクト(例えば、他の車両や歩行者など)に関する情報と、車両1にある静的オブジェクト(例えば、道路や信号機、交通標識など)とを含んでもよい。周囲の車両に関する情報は、個々の車両と車両1との相対的な関係(相対位置、相対速度、相対加速度など)を含んでもよい。周囲に関する情報は、車両1の検知ユニット41~43からの出力に基づいて取得されてもよい。
評価関数記憶部203は、車両1の行動に対する評価値を算出するための評価関数を記憶する。具体的に、この評価関数は、車両1に関する現在の走行環境と、この走行環境における車両の行動とを引数として、この行動に対する評価値を出力する。評価値が高いほど、特定の行動に成功する可能性が高い。例えば、車両1が車線変更を行う場合に、評価値が高い時刻で車線変更を開始する方が、評価値が低い時刻で車線変更を開始するよりも、車線変更に成功する可能性が高い。
評価関数は、事前の強化学習によって生成され、評価関数記憶部203に記憶されてもよい。評価関数は、車両1の製造時に評価関数記憶部203に記憶されてもよいし、車両1の販売後に評価関数記憶部203に記憶されてもよい。さらに、評価関数記憶部203に記憶された評価関数は、通信ネットワークを介して更新されてもよい。
評価関数は、例えば強化学習を行うことによって生成される。強化学習として、Q学習が使用されてもよい。さらに、強化学習は、アンサンブル学習、例えばランダムフォレストを利用するものであってもよい。強化学習における環境として、環境取得部202が取得可能な種類の情報が使用されてもよい。これらの環境はシミュレーションによって生成されてもよい。
評価値算出部204は、評価関数記憶部203に記憶された評価関数を使用して、環境取得部202が取得した車両環境に対して、行動計画部201によって決定された行動を開始すること及び開始しないこと(待機すること)のそれぞれについて評価値を算出する。評価値算出部204は、算出した評価関数を評価値記憶部205に記憶する。この実施形態では、評価値算出部204が評価値を算出する。これにかえて、ECU20は、車両環境に関する情報を外部サーバに送信し、この外部サーバから評価値を受信することによって評価値を取得してもよい。この場合に、評価関数記憶部203は省略されてもよい。
開始判定部206は、評価値に基づいて、行動計画部201において決定された行動を開始するかどうかを判定する。走行制御部207は、開始判定部206で開始すると判定された行動を実現するために車両1の各アクチュエータの動作を制御する。具体的に、走行制御部207は、車両1の操舵と、加減速の少なくともいずれか一方を制御する。例えば、車線変更を開始すると判定された場合に、走行制御部207は、車両1の操舵と加減速との両方を制御することによって、隣接する車線に移動する。
図3を参照して、ECU20、具体的はその機能ユニットが行う制御方法の一例について説明する。この方法は、車両1の自動運転が開始することに応じて開始されてもよい。この方法は、車両1の自動運転が終了するまで繰り返し実行されてもよい。
ステップS301で、環境取得部202は、車両1の走行環境に関する情報を取得する。取得される情報の具体例は上述したとおりである。
ステップS302で、行動計画部201は、特定の行動を実行する必要があるかどうかを判定する。特定の行動を実行する必要があると判定された場合(ステップS302で「YES」)に、処理はステップS303に遷移し、それ以外の場合(ステップS302で「NO」)に、処理はステップS301に遷移する。ステップS301に遷移した場合には、走行環境に関する情報(前回の取得から何らかの時間が経過後の情報)が取得される。
例えば、行動計画部201は、目的地に向かうために、車両1を車線変更する必要があると判定してもよい。この場合に、特定の行動として、車線変更が計画される。また、行動計画部201は、駐車場で車両1を停車する必要があると判定してもよい。この場合に、特定の行動として、自動駐車機能の実行が計画される。
ステップS303で、評価値算出部204は、評価関数記憶部203に記憶されている評価関数を使用して、現在の走行環境に対して、特定の行動を現時点で開始することに対する評価値と、特定の行動を現時点で開始しないこと(言い換えると、待機すること)に対する評価値とを算出し、これらの評価値を評価値記憶部205に記憶する。現在の走行環境とは、ステップS301の直近の実行によって取得された走行環境のことである。特定の行動を開始することに対する評価値を開始評価値と呼ぶ。特定の行動を現時刻で開始しないこと(言い換えると、待機すること)に対する評価値を待機評価値と呼ぶ。
ステップS304で、開始判定部206は、複数の時刻において算出された開始評価値が所定の条件を満たすかどうかを判定する。所定の条件については後述する。各時刻に算出された開始評価値及び待機評価値は、ステップS303で評価値記憶部205に記憶されている。開始評価値が所定の条件を満たすと判定された場合(ステップS304で「YES」)に、処理はステップS305に遷移し、それ以外の場合(ステップS304で「NO」)に、処理はステップS301に遷移する。ステップS305で、走行制御部207は、特定の行動を開始する。そのため、ステップS304の所定の条件は、車両1が特定の行動を開始するための条件であるともいえる。そこで、ステップS304で判定される所定の条件を、以下では行動開始条件と呼ぶ。
ステップS304の実行の直近に評価値を算出した(すなわち、ステップS303を実行した)時刻とT2とし、時刻T2の前に評価値を算出した時刻をT1とする。時刻T2は、時刻T1の次に評価値を取得する時刻であってもよいし、時刻T1と時刻T2との間の別の時刻に評価値が取得されてもよい。以下では、時刻T1と時刻T2とが連続しているとする。行動開始条件は、時刻t=T1で算出された評価値が以下の式(1)の条件(以下、条件1と呼ぶ)を満たし、かつ時刻t=T2で算出された評価値が以下の式(2)の条件(以下、条件2と呼ぶ)を満たすことを含んでもよい。
式1
式2
式(1)及び式(2)について説明する。stは、時刻tにおける走行環境を表す。stはベクトル値であってもよい。atは、時刻tにおける動作を表す。特定の行動を開始する場合のatの値をSTARTで表し、特定の行動を開始しない(待機する)場合のatの値をWAITで表す。Q(st,at)は、走行環境stに対して動作atを行った場合の評価値を表す。強化学習がQ学習であった場合に、この評価値はQ値と呼ばれてもよい。式(1)の左辺及び式(2)の左辺は同じ値であり、待機評価値に対する開始評価値の相対値を示す。具体的に、左辺は、開始評価値と待機評価値との和に対する開始評価値の比率を表す。この比率を求める関数は、ソフトマックス関数と呼ばれる関数である。待機評価値に対する開始評価値の相対値は、ソフトマックス関数以外の関数を用いて算出されてもよい。
θ1及びθ2は、事前に決定された閾値である。θ1<θ2を満たす。したがって、条件2は、条件1よりも厳しい条件となる。条件2が条件1よりも厳しいとは、条件2を満たすならば条件1も満たすことを意味する。このように、開始判定部206は、ある時刻(T1)で条件1を満たした後、次の時刻(T2)で条件1よりも厳しい条件2を満たした場合に、行動開始条件を満たすと判定する。この2段階の条件を含む行動開始条件を満たす場合に、車両1の走行環境は、特定の行動を開始するのに適する方向に変化しているといえる。そのため、開始判定部206は、1段階の条件で判定する場合と比較して、特定の行動を開始するのにより適したタイミングを決定できる。
図4を参照して、上述の行動開始条件についての具体例を説明する。図4のグラフの横軸は時刻であり、縦軸は式(1)の左辺及び式(2)の左辺(すなわち、待機評価値に対する開始評価値の相対値)である。時刻t1、t2、t4は、条件1も条件2も満たさない。時刻t5、t6は、条件1を満たすものの、条件2を満たさない。時刻t3、t7は、条件1及び条件2をともに満たす。
時刻t3では条件1及び条件2を満たすものの、その次の時刻t4では条件2を満たさない。そのため、車両1の走行環境は、特定の行動を開始するのに適する方向に変化しているとはいえないので、開始判定部206は、特定の行動を開始するとは判定しない。時刻t5で条件1を満し、その次の時刻t6では条件1を満たすものの、条件2を満たさない。そのため、車両1の走行環境は、特定の行動を開始するのに適する方向に変化しているとはいえないので、開始判定部206は、特定の行動を開始するとは判定しない。時刻t6で条件1を満し、その次の時刻t7で、条件1よりも厳しい条件2を満たす。そのため、車両1の走行環境は、特定の行動を開始するのに適する方向に変化している可能性が高い。そこで、開始判定部206は、特定の行動を開始すると判定する。
上述の式1及び式2を使用した条件にかえて、又はこの条件に加えて、行動開始条件は、時刻t=T1で算出された評価値が以下の式(3)の条件(以下、条件3と呼ぶ)を満たし、かつ時刻t=T2で算出された評価値が以下の式(4)の条件(以下、条件4と呼ぶ)を満たすことを含んでもよい。
式3
式4
θ3及びθ4は、事前に決定された閾値である。θ3<θ4を満たす。したがって、条件4は、条件3よりも厳しい条件となる。条件4が条件3よりも厳しいとは、条件4を満たすならば条件3も満たすことを意味する。この場合でも、開始判定部206は、ある時刻(T1)で条件3を満たした後、次の時刻(T2)で条件3よりも厳しい条件4を満たした場合に、行動開始条件を満たすと判定する。条件3及び条件4では、待機評価値に対する開始評価値の相対値ではなく、開始評価値そのものを閾値と比較する。
上述の例では、2つの連続した時刻における評価値を用いて行動開始条件を満たすかどうかを判定した。これにかえて、3つ以上の連続した又は不連続な時刻における評価値を用いて行動開始条件を満たすかどうかを判定してもよい。ステップS304で行動開始条件を満たさない間、ステップS301~ステップS304の処理が反復される。この反復において、特定の行動が必要なくなった場合に、ステップS302で「NO」となり、ステップS303及びステップS304の反復が終了する。例えば、特定の行動が車線変更である場合に、車線変更ができないまま分岐地点を過ぎてしまった場合には、もはや車線変更を行う必要がなくなる。この場合に、行動計画部201は、新たな行動を計画することになる。
図5を参照して、上述の制御方法のユースケースについて説明する。行動計画部201は、車両1が車線501を走行中に、隣接する車線502に車線変更することを計画する。車線502において、車両1の前方を車両503が走行しており、車両1の後方を車両504が走行している。
環境取得部202は、車両1の走行環境として、車両1の速度と、車両1に対する車両503の相対位置及び相対速度と、車両1に対する車両504の相対位置及び相対速度とを取得する。環境取得部202は、IDM(Intelligent Driver Model)を利用して決定された車両503及び車両504の意図を車両1の走行環境としてさらに取得してもよい。車両503及び車両504の意図は、車両1に対する車両503及び車両504の相対加速度から決定されてもよい。
評価値算出部204は、車両1が車線501における走行を継続中に、車線変更を開始することに対する評価値と、車線変更を開始しないことに対する評価値とを繰り返し算出する。この評価値を算出するために使用される評価関数は、上述と同じ種類の走行環境を使用する強化学習によって得られた関数である。開始判定部206は、算出された評価値が上述の行動開始条件を満たした場合に、車線変更を開始すべきであると判定する。この判定に応じて、走行制御部207は、車線変更を開始する。
<実施形態のまとめ>
[項目1]
移動体(1)の制御装置(20)であって、
前記移動体の行動を計画する計画部(201)と、
前記行動を開始することの評価値を取得する取得部(204)と、
第1時刻において取得された前記評価値が第1条件を満たし、かつ前記第1時刻よりも後の第2時刻において取得された前記評価値が第2条件を満たした場合に、前記行動を開始すると判定する判定部(206)と、を備え、
前記第2条件は、前記第1条件よりも厳しい、制御装置。
この項目によれば、移動体が特定の行動を開始するのに適したタイミングを決定できる。
[項目2]
前記第2時刻は、前記第1時刻の次に前記評価値を取得する時刻である、項目1に記載の制御装置。
この項目によれば、移動体が特定の行動を開始するのに適したタイミングを一層精度よく決定できる。
[項目3]
前記判定部は、前記行動を開始しないことの評価値に対する、前記行動を開始することの評価値の相対値を取得し、
前記第1条件は、前記第1時刻についての前記相対値が第1閾値よりも大きいことを含み、
前記第2条件は、前記第2時刻についての前記相対値が第2閾値よりも大きいことを含み、
前記第2閾値は、前記第1閾値よりも大きい、項目1又は2に記載の制御装置。
この項目によれば、移動体が特定の行動を開始するのに適したタイミングを一層精度よく決定できる。
[項目4]
前記相対値は、ソフトマックス関数を用いて算出される、項目3に記載の制御装置。
この項目によれば、移動体が特定の行動を開始するのに適したタイミングを一層精度よく決定できる。
[項目5]
前記第1条件は、前記第1時刻において前記行動を開始することの評価値が第3閾値よりも大きいことを含み、
前記第2条件は、前記第時刻において前記行動を開始することの評価値が第4閾値よりも大きいことを含み、
前記第4閾値は、前記第3閾値よりも大きい、項目1又は2に記載の制御装置。
この項目によれば、移動体が特定の行動を開始するのに適したタイミングを一層精度よく決定できる。
[項目6]
前記行動は、車線変更を含む、項目1乃至5の何れか1項に記載の制御装置。
この項目によれば、車線変更を開始するのに適したタイミングを一層精度よく決定できる。
[項目7]
項目1乃至6の何れか1項に記載の制御装置を備える車両(1)。
この項目によれば、上記の利点を有する車両が提供される。
[項目8]
コンピュータを、項目1乃至6の何れか1項に記載の制御装置として機能させるためのプログラム。
この項目によれば、上記の利点を有するプログラムが提供される。
[項目9]
移動体(1)の制御方法であって、
前記移動体の行動を計画すること(S302)と、
前記行動を開始することの評価値を取得すること(S303)と、
第1時刻において取得された前記評価値が第1条件を満たし、かつ前記第1時刻よりも後の第2時刻において取得された前記評価値が第2条件を満たした場合に、前記行動を開始すると判定すること(S304)と、を備え、
前記第2条件は、前記第1条件よりも厳しい、制御方法。
この項目によれば、移動体が特定の行動を開始するのに適したタイミングを決定できる。
発明は上記の実施形態に制限されるものではなく、発明の要旨の範囲内で、種々の変形・変更が可能である。
1 車両、20 ECU、201 行動計画部、202 環境取得部、203 評価関数記憶部、204 評価値算出部、205 評価値記憶部、206 開始判定部、207 走行制御部

Claims (10)

  1. 移動体の制御装置であって、
    前記移動体の行動を計画する計画部と、
    第1評価値及び第2評価値を取得する取得部であって、前記第1評価値は、強化学習によって生成された評価関数を使用して、前記行動を開始しないことに対して算出された評価値であり、前記第2評価値は、前記評価関数を使用して、前記行動を開始することに対して算出された評価値であり、前記第2評価値が高いほど前記行動に成功する可能性が高い、取得部と、
    前記第1評価値に対する前記第2評価値の相対値を算出する算出部と、
    第1時刻において取得された前記第1評価値及び前記第2評価値が第1条件を満たし、かつ前記第1時刻よりも後の第2時刻において取得された前記第1評価値及び前記第2評価値が第2条件を満たした場合に、前記行動を開始すると判定する判定部と、を備え、
    前記第2条件は、前記第1条件よりも厳しく、
    前記第1条件は、前記第1評価値及び前記第2評価値について算出された前記相対値が第1閾値よりも大きいことを含み、
    前記第2条件は、前記第1評価値及び前記第2評価値について算出された前記相対値が第2閾値よりも大きいことを含み、
    前記第2閾値は、前記第1閾値よりも大きい、制御装置。
  2. 前記判定部は、前記第1時刻において取得された前記第1評価値及び前記第2評価値が前記第1条件を満たさず、かつ前記第2時刻において取得された前記第1評価値及び前記第2評価値が前記第2条件を満たした場合に、前記行動を開始しないと判定する、請求項1に記載の制御装置。
  3. 前記判定部は、前記第1時刻において取得された前記第1評価値及び前記第2評価値が前記第1条件を満たし、かつ前記第2時刻において取得された前記第1評価値及び前記第2評価値が前記第2条件を満たさなかった場合に、前記行動を開始しないと判定する、請求項1又は2に記載の制御装置。
  4. 前記判定部は、前記第1時刻において取得された前記第1評価値及び前記第2評価値が前記第1条件を満たさず、かつ前記第2時刻において取得された前記第1評価値及び前記第2評価値が前記第2条件を満たさなかった場合に、前記行動を開始しないと判定する、請求項1乃至3の何れか1項に記載の制御装置。
  5. 前記取得部は、前記第1評価値及び前記第2評価値を繰り返し取得し、
    前記第2時刻は、前記第1評価値及び前記第2評価値の取得の繰り返しにおいて前記取得部が前記第1時刻の次に前記第1評価値及び第2評価値を取得する時刻である、請求項1乃至4の何れか1項に記載の制御装置。
  6. 前記相対値は、ソフトマックス関数を用いて算出される、請求項1乃至5の何れか1項に記載の制御装置。
  7. 前記行動は、車線変更を含む、請求項1乃至の何れか1項に記載の制御装置。
  8. 請求項1乃至の何れか1項に記載の制御装置を備える車両。
  9. 移動体のプロセッサに、
    前記移動体の行動を計画することと、
    第1評価値及び第2評価値を取得することであって、前記第1評価値は、強化学習によって生成された評価関数を使用して、前記行動を開始しないことに対して算出された評価値であり、前記第2評価値は、前記評価関数を使用して、前記行動を開始することに対して算出された評価値であり、前記第2評価値が高いほど前記行動に成功する可能性が高い、ことと、
    前記第1評価値に対する前記第2評価値の相対値を算出することと、
    第1時刻において取得された前記第1評価値及び前記第2評価値が第1条件を満たし、かつ前記第1時刻よりも後の第2時刻において取得された前記第1評価値及び前記第2評価値が第2条件を満たした場合に、前記行動を開始すると判定することと、を実行させるためのプログラムであって、
    前記第2条件は、前記第1条件よりも厳しく、
    前記第1条件は、前記第1評価値及び前記第2評価値について算出された前記相対値が第1閾値よりも大きいことを含み、
    前記第2条件は、前記第1評価値及び前記第2評価値について算出された前記相対値が第2閾値よりも大きいことを含み、
    前記第2閾値は、前記第1閾値よりも大きい、プログラム。
  10. 移動体の制御方法であって、
    前記移動体の行動を計画することと、
    第1評価値及び第2評価値を取得することであって、前記第1評価値は、強化学習によって生成された評価関数を使用して、前記行動を開始しないことに対して算出された評価値であり、前記第2評価値は、前記評価関数を使用して、前記行動を開始することに対して算出された評価値であり、前記第2評価値が高いほど前記行動に成功する可能性が高い、ことと、
    前記第1評価値に対する前記第2評価値の相対値を算出することと、
    第1時刻において取得された前記第1評価値及び前記第2評価値が第1条件を満たし、かつ前記第1時刻よりも後の第2時刻において取得された前記第1評価値及び前記第2評価値が第2条件を満たした場合に、前記行動を開始すると判定することと、を備え、
    前記第2条件は、前記第1条件よりも厳しく、
    前記第1条件は、前記第1評価値及び前記第2評価値について算出された前記相対値が第1閾値よりも大きいことを含み、
    前記第2条件は、前記第1評価値及び前記第2評価値について算出された前記相対値が第2閾値よりも大きいことを含み、
    前記第2閾値は、前記第1閾値よりも大きい、制御方法。
JP2020117307A 2020-07-07 2020-07-07 制御装置及び制御方法並びに車両 Active JP7469167B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2020117307A JP7469167B2 (ja) 2020-07-07 2020-07-07 制御装置及び制御方法並びに車両
US17/363,086 US20220009494A1 (en) 2020-07-07 2021-06-30 Control device, control method, and vehicle
CN202110756944.1A CN113911135B (zh) 2020-07-07 2021-07-05 控制装置及控制方法以及车辆

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020117307A JP7469167B2 (ja) 2020-07-07 2020-07-07 制御装置及び制御方法並びに車両

Publications (2)

Publication Number Publication Date
JP2022014769A JP2022014769A (ja) 2022-01-20
JP7469167B2 true JP7469167B2 (ja) 2024-04-16

Family

ID=79173497

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020117307A Active JP7469167B2 (ja) 2020-07-07 2020-07-07 制御装置及び制御方法並びに車両

Country Status (3)

Country Link
US (1) US20220009494A1 (ja)
JP (1) JP7469167B2 (ja)
CN (1) CN113911135B (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102019129879A1 (de) * 2019-11-06 2021-05-06 Zf Friedrichshafen Ag Verfahren sowie Steuergerät zum Steuern eines Kraftfahrzeugs
JP2023112819A (ja) 2022-02-02 2023-08-15 株式会社オートネットワーク技術研究所 監視装置、車両監視システムおよび車両監視方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007034383A (ja) 2005-07-22 2007-02-08 Toyota Motor Corp 車両制御装置
JP2016009201A (ja) 2014-06-20 2016-01-18 富士重工業株式会社 車両の運転支援装置
JP2017146794A (ja) 2016-02-17 2017-08-24 本田技研工業株式会社 車両制御装置、車両制御方法、および車両制御プログラム
JP2018184042A (ja) 2017-04-25 2018-11-22 株式会社デンソー 車両の制動支援装置および制動支援方法
JP2019026129A (ja) 2017-08-01 2019-02-21 トヨタ自動車株式会社 運転支援装置
JP2019053574A (ja) 2017-09-15 2019-04-04 本田技研工業株式会社 車両制御装置、車両制御方法、およびプログラム
JP2019087096A (ja) 2017-11-08 2019-06-06 本田技研工業株式会社 行動決定システム及び自動運転制御装置
JP2020097346A (ja) 2018-12-19 2020-06-25 トヨタ自動車株式会社 車両の走行制御装置
JP2021003952A (ja) 2019-06-25 2021-01-14 株式会社Subaru 操舵制御装置

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09287943A (ja) * 1996-04-18 1997-11-04 Omron Corp 距離測定装置及び安全走行システム
DE102008003205A1 (de) * 2008-01-04 2009-07-09 Wabco Gmbh Vorrichtung, Verfahren und Computerprogramm zur Kollisionsvermeidung oder zur Verminderung der Kollisionsschwere infolge einer Kollision für Fahrzeuge, insbesondere Nutzfahrzeuge
US9188985B1 (en) * 2012-09-28 2015-11-17 Google Inc. Suggesting a route based on desired amount of driver interaction
US9187088B1 (en) * 2014-08-15 2015-11-17 Google Inc. Distribution decision trees
JP6176264B2 (ja) * 2015-01-19 2017-08-09 トヨタ自動車株式会社 自動運転車両システム
US9522586B2 (en) * 2015-02-10 2016-12-20 Ford Global Technologies, Llc Enhanced road characterization for adaptive mode drive
JP6344275B2 (ja) * 2015-03-18 2018-06-20 トヨタ自動車株式会社 車両制御装置
JP6859931B2 (ja) * 2017-11-15 2021-04-14 トヨタ自動車株式会社 自動運転システム
US11948074B2 (en) * 2018-05-14 2024-04-02 Samsung Electronics Co., Ltd. Method and apparatus with neural network parameter quantization
CN108875603B (zh) * 2018-05-31 2021-06-04 上海商汤智能科技有限公司 基于车道线的智能驾驶控制方法和装置、电子设备
WO2020016621A1 (ja) * 2018-07-16 2020-01-23 日産自動車株式会社 走行支援方法及び走行支援装置
EP3824404A4 (en) * 2018-07-20 2022-04-27 May Mobility, Inc. MULTI-PERSPECTIVE SYSTEM AND BEHAVIORAL POLICY SELECTION PROCESS BY AN AUTONOMOUS AGENT
JP7172257B2 (ja) * 2018-08-01 2022-11-16 トヨタ自動車株式会社 自動運転システム
US10678252B2 (en) * 2018-08-09 2020-06-09 GM Global Technology Operations LLC Systems, apparatus, and methods for embedded encodings of contextual information using a neural network with vector space modeling
US10940863B2 (en) * 2018-11-01 2021-03-09 GM Global Technology Operations LLC Spatial and temporal attention-based deep reinforcement learning of hierarchical lane-change policies for controlling an autonomous vehicle
JP2020104547A (ja) * 2018-12-26 2020-07-09 株式会社日立製作所 外界センサの故障検出装置、及び、外界センサの故障検出方法
WO2020230301A1 (ja) * 2019-05-15 2020-11-19 日産自動車株式会社 車両の走行制御方法及び走行制御装置
US20200409362A1 (en) * 2019-06-26 2020-12-31 Byton North America Corporation Autonomous driving handoff systems and methods
US11994862B2 (en) * 2019-07-06 2024-05-28 Huawei Technologies Co., Ltd. Method and system for training reinforcement learning agent using adversarial sampling
JP7342491B2 (ja) * 2019-07-25 2023-09-12 オムロン株式会社 推論装置、推論方法、及び推論プログラム
US11648934B2 (en) * 2019-08-29 2023-05-16 Nissan Motor Co., Ltd. Parking assistance method and parking assistance device
US11568655B2 (en) * 2020-03-26 2023-01-31 Intel Corporation Methods and devices for triggering vehicular actions based on passenger actions
JP7380409B2 (ja) * 2020-04-29 2023-11-15 株式会社デンソー 車両用記録装置、情報記録方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007034383A (ja) 2005-07-22 2007-02-08 Toyota Motor Corp 車両制御装置
JP2016009201A (ja) 2014-06-20 2016-01-18 富士重工業株式会社 車両の運転支援装置
JP2017146794A (ja) 2016-02-17 2017-08-24 本田技研工業株式会社 車両制御装置、車両制御方法、および車両制御プログラム
JP2018184042A (ja) 2017-04-25 2018-11-22 株式会社デンソー 車両の制動支援装置および制動支援方法
JP2019026129A (ja) 2017-08-01 2019-02-21 トヨタ自動車株式会社 運転支援装置
JP2019053574A (ja) 2017-09-15 2019-04-04 本田技研工業株式会社 車両制御装置、車両制御方法、およびプログラム
JP2019087096A (ja) 2017-11-08 2019-06-06 本田技研工業株式会社 行動決定システム及び自動運転制御装置
JP2020097346A (ja) 2018-12-19 2020-06-25 トヨタ自動車株式会社 車両の走行制御装置
JP2021003952A (ja) 2019-06-25 2021-01-14 株式会社Subaru 操舵制御装置

Also Published As

Publication number Publication date
CN113911135B (zh) 2024-06-07
CN113911135A (zh) 2022-01-11
US20220009494A1 (en) 2022-01-13
JP2022014769A (ja) 2022-01-20

Similar Documents

Publication Publication Date Title
JP6934544B2 (ja) 車輪姿勢を使用した将来の進行方向の決定
KR102070530B1 (ko) 모션 계획에 기초한 자율 주행 차량의 운행 방법 및 시스템
CN108068825B (zh) 用于无人驾驶车辆(adv)的视觉通信系统
JP6841854B2 (ja) 車両並びにその制御装置及び制御方法
US11740628B2 (en) Scenario based control of autonomous driving vehicle
US11285957B2 (en) Traveling control apparatus, traveling control method, and non-transitory computer-readable storage medium storing program
JPWO2019043847A1 (ja) 走行制御装置、車両および走行制御方法
US11465627B2 (en) Traveling control apparatus, traveling control method, and non-transitory computer-readable storage medium storing program for controlling traveling of a vehicle
US20200310448A1 (en) Behavioral path-planning for a vehicle
JP7053707B2 (ja) 車両及びその制御装置
CN111587206B (zh) 车辆控制装置、具有该车辆控制装置的车辆以及控制方法
JP7469167B2 (ja) 制御装置及び制御方法並びに車両
US20200298885A1 (en) Vehicle control apparatus, vehicle control method, vehicle, and storage medium
US20200385023A1 (en) Vehicle control apparatus, vehicle, operation method of vehicle control apparatus, and non-transitory computer-readable storage medium
US20200384992A1 (en) Vehicle control apparatus, vehicle, operation method of vehicle control apparatus, and non-transitory computer-readable storage medium
JP2019156295A (ja) 走行制御装置、車両および走行制御方法
JP6982051B2 (ja) 車両及びその制御装置
JP7028905B2 (ja) 車両及びその制御装置
US11260884B2 (en) Vehicle control apparatus, vehicle, operation method of vehicle control apparatus, and non-transitory computer-readable storage medium
JP2020200029A (ja) 車両制御装置、車両、車両制御装置の動作方法およびプログラム
JP2021143908A (ja) 車両制御装置、車両、車両制御方法およびプログラム
JP7245859B2 (ja) 車両制御装置、車両、車両制御方法およびプログラム
JP7372367B2 (ja) 車両並びにその制御装置及び制御方法
JP7393258B2 (ja) 制御装置及び車両
US20200384991A1 (en) Vehicle control apparatus, vehicle, operation method of vehicle control apparatus, and non-transitory computer-readable storage medium

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20210103

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210125

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221128

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230929

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231027

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231222

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240315

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240404

R150 Certificate of patent or registration of utility model

Ref document number: 7469167

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150