JP7234970B2 - 車両行動生成装置、車両行動生成方法、および車両行動生成プログラム - Google Patents
車両行動生成装置、車両行動生成方法、および車両行動生成プログラム Download PDFInfo
- Publication number
- JP7234970B2 JP7234970B2 JP2020024653A JP2020024653A JP7234970B2 JP 7234970 B2 JP7234970 B2 JP 7234970B2 JP 2020024653 A JP2020024653 A JP 2020024653A JP 2020024653 A JP2020024653 A JP 2020024653A JP 7234970 B2 JP7234970 B2 JP 7234970B2
- Authority
- JP
- Japan
- Prior art keywords
- vehicle
- behavior
- reward
- actions
- setting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W60/00—Drive control systems specially adapted for autonomous road vehicles
- B60W60/001—Planning or execution of driving tasks
- B60W60/0011—Planning or execution of driving tasks involving control alternatives for a single driving scenario, e.g. planning several paths to avoid obstacles
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W30/00—Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units, or advanced driver assistance systems for ensuring comfort, stability and safety or drive control systems for propelling or retarding the vehicle
- B60W30/08—Active safety systems predicting or avoiding probable or impending collision or attempting to minimise its consequences
- B60W30/095—Predicting travel path or likelihood of collision
- B60W30/0956—Predicting travel path or likelihood of collision the prediction being responsive to traffic or environmental parameters
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W40/00—Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
- B60W40/02—Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models related to ambient conditions
- B60W40/04—Traffic conditions
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W40/00—Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
- B60W40/10—Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models related to vehicle motion
- B60W40/105—Speed
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W50/00—Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
- B60W50/0097—Predicting future conditions
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W60/00—Drive control systems specially adapted for autonomous road vehicles
- B60W60/001—Planning or execution of driving tasks
- B60W60/0027—Planning or execution of driving tasks using trajectory prediction for other traffic participants
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W60/00—Drive control systems specially adapted for autonomous road vehicles
- B60W60/001—Planning or execution of driving tasks
- B60W60/0027—Planning or execution of driving tasks using trajectory prediction for other traffic participants
- B60W60/00274—Planning or execution of driving tasks using trajectory prediction for other traffic participants considering possible movement changes
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/16—Anti-collision systems
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W50/00—Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
- B60W2050/0062—Adapting control system settings
- B60W2050/0075—Automatic parameter input, automatic initialising or calibrating means
- B60W2050/0083—Setting, resetting, calibration
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W2554/00—Input parameters relating to objects
- B60W2554/40—Dynamic objects, e.g. animals, windblown objects
- B60W2554/404—Characteristics
- B60W2554/4046—Behavior, e.g. aggressive or erratic
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W2554/00—Input parameters relating to objects
- B60W2554/80—Spatial relation or speed relative to objects
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W2555/00—Input parameters relating to exterior conditions, not covered by groups B60W2552/00, B60W2554/00
- B60W2555/60—Traffic rules, e.g. speed limits or right of way
Description
予定走路の走行に際して、自車両が取り得る複数の行動を設定する第1設定部(S240)と、
第1設定部が設定した自車両の複数の行動のそれぞれに対して、自車両の周囲の他車両が取り得る複数の行動を設定する第2設定部(S260)と、
第1設定部が設定した自車両の行動と第2設定部が設定した他車両の行動との組み合わせごとに、自車両と他車両の接触可能性に関する情報を出力する出力部(S280)と、
出力部が出力する情報に基づいて、自車両の行動を選択する選択部(S290、S300、S310)と、を備え、
出力部は、自車両の周辺環境と自車両の状況と他車両の状況との組み合わせが異なる複数の環境下においてシミュレーションを行い、自車両が他車両と接触を回避できた自車両の状況には高い報酬を与え、自車両が他車両と接触に到った自車両の状況にはそれよりも低い報酬を与えるようにして作成された走行状況-報酬データに基づき学習された関数器(50)を備え、この関数器を用いて、自車両の行動と他車両の行動とのそれぞれの組み合わせにおける自車両の行動に報酬を付与し、当該報酬を上記情報として出力し、
選択部は、出力部により最も高い報酬が付与された自車両の行動を選択するように構成される。
また、本開示のもう一つの車両行動生成装置は、
予定走路の走行に際して、自車両が取り得る複数の行動を設定する第1設定部(S240)と、
第1設定部が設定した自車両の複数の行動のそれぞれに対して、自車両の周囲の他車両が取り得る複数の行動を設定する第2設定部(S260)と、
第1設定部が設定した自車両の行動と第2設定部が設定した他車両の行動との組み合わせごとに、自車両と他車両の接触可能性に関する情報を出力する出力部(S280)と、
出力部が出力する情報に基づいて、自車両の行動を選択する選択部(S290、S300、S310)と、を備え、
出力部は、自車両の行動と他車両の行動とのそれぞれの組み合わせにおける自車両の行動に報酬を付与し、当該報酬を上記情報として出力し、
選択部は、自車両の行動と他車両の行動とのそれぞれの組み合わせにおける、自車両の行動に付与される報酬の中で、最も高い報酬と2番目に高い報酬との間に所定値以上の差が生じない場合、第1設定部での、自車両の行動と他車両の行動とのそれぞれの組み合わせに引き続いて自車両がとり得る複数の行動の設定、第2設定部での、自車両のそれぞれの行動に対して他車両が取り得る複数の行動の設定、および、出力部での、自車両の行動と他車両の行動との組み合わせごとの自車両と他車両の接触可能性に関する情報の出力を実行させることにより、選択される行動以外の残り行動の報酬に対して所定値以上の差を有する報酬が付与された行動を選択できるように構成される。
少なくとも1つのプロセッサにより実行される、
予定走路の走行に際して、自車両が取り得る複数の行動を設定する第1設定ステップ(S240)と、
第1設定ステップにて設定された自車両の複数の行動のそれぞれに対して、自車両の周囲の他車両が取り得る複数の行動を設定する第2設定ステップ(S260)と、
第1設定ステップにて設定された自車両の行動と第2設定ステップにて設定された他車両の行動との組み合わせごとに、自車両と他車両の接触可能性に関する情報を出力する出力ステップ(S280)と、
出力ステップにて出力された情報に基づいて、自車両の行動を選択する選択ステップ(S290、S300、S310)と、を備え、
出力ステップでは、自車両の周辺環境と自車両の状況と他車両の状況との組み合わせが異なる複数の環境下においてシミュレーションを行い、自車両が他車両と接触を回避できた自車両の状況には高い報酬を与え、自車両が他車両と接触に到った自車両の状況にはそれよりも低い報酬を与えるようにして作成された走行状況-報酬データに基づき学習された関数器(40)を用いて、自車両の行動と他車両の行動とのそれぞれの組み合わせにおける自車両の行動に報酬が付与され、当該報酬が上記情報として出力され、
選択ステップでは、出力ステップにおいて最も高い報酬が付与された自車両の行動を選択するように構成される。
また、本開示のもう一つの車両行動生成方法は、
少なくとも1つのプロセッサにより実行される、
予定走路の走行に際して、自車両が取り得る複数の行動を設定する第1設定ステップ(S240)と、
第1設定ステップにて設定された自車両の複数の行動のそれぞれに対して、自車両の周囲の他車両が取り得る複数の行動を設定する第2設定ステップ(S260)と、
第1設定ステップにて設定された自車両の行動と第2設定ステップにて設定された他車両の行動との組み合わせごとに、自車両と他車両の接触可能性に関する情報を出力する出力ステップ(S280)と、
出力ステップにて出力された情報に基づいて、自車両の行動を選択する選択ステップ(S290、S300、S310)と、を備え、
出力ステップでは、自車両の行動と他車両の行動とのそれぞれの組み合わせにおける自車両の行動に報酬が付与され、当該報酬が上記情報として出力され、
選択ステップにおいて、自車両の行動と他車両の行動とのそれぞれの組み合わせにおける、自車両の行動に付与される報酬の中で、最も高い報酬と2番目に高い報酬との間に所定値以上の差が生じない場合、第1設定ステップによる、自車両の行動と他車両の行動とのそれぞれの組み合わせに引き続いて自車両がとり得る複数の行動の設定、第2設定ステップによる、自車両のそれぞれの行動に対して他車両が取り得る複数の行動の設定、および、出力ステップによる、自車両の行動と他車両の行動との組み合わせごとの自車両と他車両の接触可能性に関する情報の出力が実行されることにより、選択ステップにて、選択される行動以外の残り行動の報酬に対して所定値以上の差を有する報酬が付与された行動を選択できるように構成される。
コンピュータ読み取り可能な非遷移記憶媒体に記憶され、命令を含むプログラムであり、その命令は、少なくとも1つのプロセッサにより実行された場合に、少なくとも1つのプロセッサに、
予定走路の走行に際して、自車両が取り得る複数の行動を設定させ(S240)、
設定された自車両の複数の行動のそれぞれに対して、自車両の周囲の他車両が取り得る複数の行動を設定させ(S260)、
設定された自車両の行動と設定された他車両の行動との組み合わせごとに、自車両と他車両の接触可能性に関する情報を出力させ(S280)、そして、
出力された情報に基づいて、自車両の行動を選択させる(S290、S300、S310)ように構成され、
上記情報を出力させる際に、自車両の周辺環境と自車両の状況と他車両の状況との組み合わせが異なる複数の環境下においてシミュレーションを行い、自車両が他車両と接触を回避できた自車両の状況には高い報酬を与え、自車両が他車両と接触に到った自車両の状況にはそれよりも低い報酬を与えるようにして作成された走行状況-報酬データに基づき学習された関数器(40)を用いて、自車両の行動と他車両の行動とのそれぞれの組み合わせにおける自車両の行動に報酬を付与させ、当該報酬を上記情報として出力させ、
自車両の行動を選択させる際に、最も高い報酬が付与された自車両の行動を選択させる。
また、本開示のもう一つの車両行動生成プログラムは、
コンピュータ読み取り可能な非遷移記憶媒体に記憶され、命令を含むプログラムであり、その命令は、少なくとも1つのプロセッサにより実行された場合に、少なくとも1つのプロセッサに、
予定走路の走行に際して、自車両が取り得る複数の行動を設定させ(S240)、
設定された自車両の複数の行動のそれぞれに対して、自車両の周囲の他車両が取り得る複数の行動を設定させ(S260)、
設定された自車両の行動と設定された他車両の行動との組み合わせごとに、自車両と他車両の接触可能性に関する情報を出力させ(S280)、そして、
出力された情報に基づいて、自車両の行動を選択させる(S290、S300、S310)ように構成され、
情報の出力において、自車両の行動と他車両の行動とのそれぞれの組み合わせにおける自車両の行動に報酬が付与され、当該報酬が上記情報として出力され、
自車両の行動の選択において、自車両の行動と他車両の行動とのそれぞれの組み合わせについて、自車両の行動に付与される報酬の中で、最も高い報酬と2番目に高い報酬との間に所定値以上の差が生じない場合、自車両の行動と他車両の行動とのそれぞれの組み合わせに引き続いて自車両がとり得る複数の行動を算出させ、自車両のそれぞれの行動に対して他車両が取り得る複数の行動を算出させ、および、自車両の行動と他車両の行動との組み合わせごとの自車両と他車両の接触可能性に関する情報の出力を出力させて、自車両の行動として、選択される行動以外の残り行動の報酬に対して所定値以上の差を有する報酬が付与された行動を選択できるようにする。
以下、本開示の実施形態について、図面を参照しつつ詳細に説明する。なお、本実施形態では、車両行動生成装置が、車両の自動運転システムに適用された例について説明する。ただし、本開示による車両行動生成装置の適用例は、車両の自動運転システムに制限されない。例えば、車両行動生成装置によって生成された自車両の行動を、推奨行動として自車両の運転者に提示するシステムに適用されてもよい。
次に、本開示の第2実施形態について説明する。ただし、本実施形態による車両行動生成装置は、第1実施形態の車両行動生成装置と同様に構成されるため、構成に関する説明は省略する。
次に、本開示の第3実施形態について説明する。ただし、本実施形態による車両行動生成装置も、第1実施形態の車両行動生成装置と同様に構成されるため、構成に関する説明は省略する。
Claims (22)
- 予定走路の走行に際して、自車両が取り得る複数の行動を設定する第1設定部(S240)と、
前記第1設定部が設定した前記自車両の前記複数の行動のそれぞれに対して、前記自車両の周囲の他車両が取り得る複数の行動を設定する第2設定部(S260)と、
前記第1設定部が設定した前記自車両の行動と前記第2設定部が設定した前記他車両の行動との組み合わせごとに、前記自車両と前記他車両の接触可能性に関する情報を出力する出力部(S280)と、
前記出力部が出力する情報に基づいて、前記自車両の行動を選択する選択部(S290、S300、S310)と、を備え、
前記出力部は、前記自車両の周辺環境と前記自車両の状況と前記他車両の状況との組み合わせが異なる複数の環境下においてシミュレーションを行い、前記自車両が前記他車両と接触を回避できた前記自車両の状況には高い報酬を与え、前記自車両が前記他車両と接触に到った前記自車両の状況にはそれよりも低い報酬を与えるようにして作成された走行状況-報酬データに基づき学習された関数器(50)を備え、この関数器を用いて、前記自車両の行動と前記他車両の行動とのそれぞれの組み合わせにおける前記自車両の行動に報酬を付与し、当該報酬を前記情報として出力し、
前記選択部は、前記出力部により最も高い報酬が付与された前記自車両の行動を選択する車両行動生成装置。 - 前記シミュレーションは、前記複数の環境下において、前記自車両の行動および速度と、前記他車両の行動および速度との異なる組み合わせを含む請求項1に記載の車両行動生成装置。
- 予定走路の走行に際して、自車両が取り得る複数の行動を設定する第1設定部(S240)と、
前記第1設定部が設定した前記自車両の前記複数の行動のそれぞれに対して、前記自車両の周囲の他車両が取り得る複数の行動を設定する第2設定部(S260)と、
前記第1設定部が設定した前記自車両の行動と前記第2設定部が設定した前記他車両の行動との組み合わせごとに、前記自車両と前記他車両の接触可能性に関する情報を出力する出力部(S280)と、
前記出力部が出力する情報に基づいて、前記自車両の行動を選択する選択部(S290、S300、S310)と、を備え、
前記出力部は、前記自車両の行動と前記他車両の行動とのそれぞれの組み合わせにおける前記自車両の行動に報酬を付与し、当該報酬を前記情報として出力し、
前記選択部は、前記自車両の行動と前記他車両の行動とのそれぞれの組み合わせにおける、前記自車両の行動に付与される報酬の中で、最も高い報酬と2番目に高い報酬との間に所定値以上の差が生じない場合、前記第1設定部での、前記自車両の行動と前記他車両の行動とのそれぞれの組み合わせに引き続いて前記自車両がとり得る複数の行動の設定、前記第2設定部での、前記自車両のそれぞれの行動に対して前記他車両が取り得る複数の行動の設定、および、前記出力部での、前記自車両の行動と前記他車両の行動との組み合わせごとの前記自車両と前記他車両の接触可能性に関する情報の出力を実行させることにより、選択される行動以外の残り行動の報酬に対して所定値以上の差を有する報酬が付与された行動を選択できるようにする車両行動生成装置。 - 前記出力部は、前記自車両の周辺環境と前記自車両の状況と前記他車両の状況との組み合わせが異なる複数の環境下においてシミュレーションを行い、前記自車両が前記他車両と接触を回避できた前記自車両の状況には高い報酬を与え、前記自車両が前記他車両と接触に到った前記自車両の状況にはそれよりも低い報酬を与えるようにして作成された走行状況-報酬データに基づき学習された関数器(50)を備え、この関数器を用いて、前記自車両の行動と前記他車両の行動とのそれぞれの組み合わせにおける前記自車両の行動に報酬を付与し、当該報酬を前記情報として出力する請求項3に記載の車両行動生成装置。
- 前記選択部は、所定回数、前記自車両の行動の選択を繰り返しても、それぞれの前記自車両の行動に付与される報酬に所定値以上の差が生じない場合、最後の選択において最も高い報酬が付与された前記自車両の行動を選択する請求項3に記載の車両行動生成装置。
- 前記第1設定部および前記第2設定部は、道路上の交通を制御する交通信号の状態に基づいて、前記自車両および前記他車両が取り得る行動を設定する請求項1乃至5のいずれか1項に記載の車両行動生成装置。
- 前記第2設定部は、前記他車両の運転特性に基づいて、前記他車両の取り得る行動を設定する請求項1乃至6のいずれか1項に記載の車両行動生成装置。
- 前記第1設定部が設定した前記自車両の行動に応じた前記自車両の進行予定軌道、および、前記第2設定部が設定した前記他車両の行動に応じた前記他車両の進行予定軌道を生成する軌道生成部(S250、S270)を備え、
前記出力部は、前記自車両の進行予定軌道および前記他車両の進行予定軌道の組み合わせに基づいて前記情報を出力する請求項1乃至7のいずれか1項に記載の車両行動生成装置。 - 少なくとも1つのプロセッサにより実行される、
予定走路の走行に際して、自車両が取り得る複数の行動を設定する第1設定ステップ(S240)と、
前記第1設定ステップにて設定された前記自車両の前記複数の行動のそれぞれに対して、前記自車両の周囲の他車両が取り得る複数の行動を設定する第2設定ステップ(S260)と、
前記第1設定ステップにて設定された前記自車両の行動と前記第2設定ステップにて設定された前記他車両の行動との組み合わせごとに、前記自車両と前記他車両の接触可能性に関する情報を出力する出力ステップ(S280)と、
前記出力ステップにて出力された情報に基づいて、前記自車両の行動を選択する選択ステップ(S290、S300、S310)と、を備え、
前記出力ステップでは、前記自車両の周辺環境と前記自車両の状況と前記他車両の状況との組み合わせが異なる複数の環境下においてシミュレーションを行い、前記自車両が前記他車両と接触を回避できた前記自車両の状況には高い報酬を与え、前記自車両が前記他車両と接触に到った前記自車両の状況にはそれよりも低い報酬を与えるようにして作成された走行状況-報酬データに基づき学習された関数器(40)を用いて、前記自車両の行動と前記他車両の行動とのそれぞれの組み合わせにおける前記自車両の行動に報酬が付与され、当該報酬が前記情報として出力され、
前記選択ステップでは、前記出力ステップにおいて最も高い報酬が付与された前記自車両の行動を選択する車両行動生成方法。 - 前記シミュレーションは、前記複数の環境下において、前記自車両の行動および速度と、前記他車両の行動および速度との異なる組み合わせを含む請求項9に記載の車両行動生成方法。
- 少なくとも1つのプロセッサにより実行される、
予定走路の走行に際して、自車両が取り得る複数の行動を設定する第1設定ステップ(S240)と、
前記第1設定ステップにて設定された前記自車両の前記複数の行動のそれぞれに対して、前記自車両の周囲の他車両が取り得る複数の行動を設定する第2設定ステップ(S260)と、
前記第1設定ステップにて設定された前記自車両の行動と前記第2設定ステップにて設定された前記他車両の行動との組み合わせごとに、前記自車両と前記他車両の接触可能性に関する情報を出力する出力ステップ(S280)と、
前記出力ステップにて出力された情報に基づいて、前記自車両の行動を選択する選択ステップ(S290、S300、S310)と、を備え、
前記出力ステップでは、前記自車両の行動と前記他車両の行動とのそれぞれの組み合わせにおける前記自車両の行動に報酬が付与され、当該報酬が前記情報として出力され、
前記選択ステップにおいて、前記自車両の行動と前記他車両の行動とのそれぞれの組み合わせにおける、前記自車両の行動に付与される報酬の中で、最も高い報酬と2番目に高い報酬との間に所定値以上の差が生じない場合、前記第1設定ステップによる、前記自車両の行動と前記他車両の行動とのそれぞれの組み合わせに引き続いて前記自車両がとり得る複数の行動の設定、前記第2設定ステップによる、前記自車両のそれぞれの行動に対して前記他車両が取り得る複数の行動の設定、および、前記出力ステップによる、前記自車両の行動と前記他車両の行動との組み合わせごとの前記自車両と前記他車両の接触可能性に関する情報の出力が実行されることにより、前記選択ステップにて、選択される行動以外の残り行動の報酬に対して所定値以上の差を有する報酬が付与された行動を選択できるようにする車両行動生成方法。 - 前記出力ステップでは、前記自車両の周辺環境と前記自車両の状況と前記他車両の状況との組み合わせが異なる複数の環境下においてシミュレーションを行い、前記自車両が前記他車両と接触を回避できた前記自車両の状況には高い報酬を与え、前記自車両が前記他車両と接触に到った前記自車両の状況にはそれよりも低い報酬を与えるようにして作成された走行状況-報酬データに基づき学習された関数器(40)を用いて、前記自車両の行動と前記他車両の行動とのそれぞれの組み合わせにおける前記自車両の行動に報酬が付与され、当該報酬が前記情報として出力される請求項11に記載の車両行動生成方法。
- 前記選択ステップにおいて、所定回数、前記自車両の行動の選択を繰り返しても、それぞれの前記自車両の行動に付与される報酬に所定値以上の差が生じない場合、最後の選択において最も高い報酬が付与された前記自車両の行動を選択する請求項11に記載の車両行動生成方法。
- 前記第1設定ステップおよび前記第2設定ステップでは、道路上の交通を制御する交通信号の状態に基づいて、前記自車両および前記他車両が取り得る行動を設定する請求項9乃至13のいずれか1項に記載の車両行動生成方法。
- 前記第2設定ステップでは、前記他車両の運転特性を考慮して、前記他車両の取り得る行動を設定する請求項9乃至14のいずれか1項に記載の車両行動生成方法。
- コンピュータ読み取り可能な非遷移記憶媒体に記憶され、命令を含むプログラムであり、前記命令は、少なくとも1つのプロセッサにより実行された場合に、少なくとも1つの前記プロセッサに、
予定走路の走行に際して、自車両が取り得る複数の行動を設定させ(S240)、
設定された前記自車両の前記複数の行動のそれぞれに対して、前記自車両の周囲の他車両が取り得る複数の行動を設定させ(S260)、
設定された前記自車両の行動と設定された前記他車両の行動との組み合わせごとに、前記自車両と前記他車両の接触可能性に関する情報を出力させ(S280)、そして、
出力された前記情報に基づいて、前記自車両の行動を選択させる(S290、S300、S310)ように構成され、
前記情報を出力させる際に、前記自車両の周辺環境と前記自車両の状況と前記他車両の状況との組み合わせが異なる複数の環境下においてシミュレーションを行い、前記自車両が前記他車両と接触を回避できた前記自車両の状況には高い報酬を与え、前記自車両が前記他車両と接触に到った前記自車両の状況にはそれよりも低い報酬を与えるようにして作成された走行状況-報酬データに基づき学習された関数器(40)を用いて、前記自車両の行動と前記他車両の行動とのそれぞれの組み合わせにおける前記自車両の行動に報酬を付与させ、当該報酬を前記情報として出力させ、
前記自車両の行動を選択させる際に、最も高い報酬が付与された前記自車両の行動を選択させる車両行動生成プログラム。 - 前記シミュレーションは、前記複数の環境下において、前記自車両の行動および速度と、前記他車両の行動および速度との異なる組み合わせを含む請求項16に記載の車両行動生成プログラム。
- コンピュータ読み取り可能な非遷移記憶媒体に記憶され、命令を含むプログラムであり、前記命令は、少なくとも1つのプロセッサにより実行された場合に、少なくとも1つの前記プロセッサに、
予定走路の走行に際して、自車両が取り得る複数の行動を設定させ(S240)、
設定された前記自車両の前記複数の行動のそれぞれに対して、前記自車両の周囲の他車両が取り得る複数の行動を設定させ(S260)、
設定された前記自車両の行動と設定された前記他車両の行動との組み合わせごとに、前記自車両と前記他車両の接触可能性に関する情報を出力させ(S280)、そして、
出力された前記情報に基づいて、前記自車両の行動を選択させる(S290、S300、S310)ように構成され、
前記情報の出力において、前記自車両の行動と前記他車両の行動とのそれぞれの組み合わせにおける前記自車両の行動に報酬が付与され、当該報酬が前記情報として出力され、
前記自車両の行動の選択において、前記自車両の行動と前記他車両の行動とのそれぞれの組み合わせについて、前記自車両の行動に付与される報酬の中で、最も高い報酬と2番目に高い報酬との間に所定値以上の差が生じない場合、前記自車両の行動と前記他車両の行動とのそれぞれの組み合わせに引き続いて前記自車両がとり得る複数の行動を算出させ、前記自車両のそれぞれの行動に対して前記他車両が取り得る複数の行動を算出させ、および、前記自車両の行動と前記他車両の行動との組み合わせごとの前記自車両と前記他車両の接触可能性に関する情報の出力を出力させて、前記自車両の行動として、選択される行動以外の残り行動の報酬に対して所定値以上の差を有する報酬が付与された行動を選択できるようにする車両行動生成プログラム。 - 前記命令は、少なくとも1つの前記プロセッサにより実行された場合に、少なくとも1つの前記プロセッサに、さらに、
前記情報を出力させる際に、前記自車両の周辺環境と前記自車両の状況と前記他車両の状況との組み合わせが異なる複数の環境下においてシミュレーションを行い、前記自車両が前記他車両と接触を回避できた前記自車両の状況には高い報酬を与え、前記自車両が前記他車両と接触に到った前記自車両の状況にはそれよりも低い報酬を与えるようにして作成された走行状況-報酬データに基づき学習された関数器(40)を用いて、前記自車両の行動と前記他車両の行動とのそれぞれの組み合わせにおける前記自車両の行動に報酬を付与させ、当該報酬を前記情報として出力させる請求項18に記載の車両行動生成プログラム。 - 前記命令は、少なくとも1つの前記プロセッサにより実行された場合に、少なくとも1つの前記プロセッサに、さらに
前記自車両の行動の選択を所定回数繰り返しても、それぞれの前記自車両の行動に付与される報酬に所定値以上の差が生じない場合、最後の選択において最も高い報酬が付与された前記自車両の行動を前記自車両の行動として選択させる請求項18に記載の車両行動生成プログラム。 - 前記命令は、少なくとも1つの前記プロセッサにより実行された場合に、少なくとも1つの前記プロセッサに、さらに
前記自車両の行動を設定させる際、および前記他車両の行動を設定させる際に、道路上の交通を制御する交通信号の状態に基づいて、前記自車両および前記他車両が取り得る行動を設定させる請求項16乃至20のいずれか1項に記載の車両行動生成プログラム。 - 前記命令は、少なくとも1つの前記プロセッサにより実行された場合に、少なくとも1つの前記プロセッサに、さらに
前記他車両の行動を設定させる際に、前記他車両の運転特性に基づいて、前記他車両の取り得る行動を設定させる請求項16乃至21のいずれか1項に記載の車両行動生成プログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020024653A JP7234970B2 (ja) | 2020-02-17 | 2020-02-17 | 車両行動生成装置、車両行動生成方法、および車両行動生成プログラム |
CN202080096468.9A CN115087574A (zh) | 2020-02-17 | 2020-12-25 | 车辆行动生成装置、车辆行动生成方法以及车辆行动生成程序 |
PCT/JP2020/048688 WO2021166448A1 (ja) | 2020-02-17 | 2020-12-25 | 車両行動生成装置、車両行動生成方法、および車両行動生成プログラム |
US17/819,561 US20220379918A1 (en) | 2020-02-17 | 2022-08-12 | Vehicle behavior generation device, vehicle behavior generation method, and vehicle behavior generation program product |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020024653A JP7234970B2 (ja) | 2020-02-17 | 2020-02-17 | 車両行動生成装置、車両行動生成方法、および車両行動生成プログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2021127095A JP2021127095A (ja) | 2021-09-02 |
JP2021127095A5 JP2021127095A5 (ja) | 2022-01-11 |
JP7234970B2 true JP7234970B2 (ja) | 2023-03-08 |
Family
ID=77390664
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020024653A Active JP7234970B2 (ja) | 2020-02-17 | 2020-02-17 | 車両行動生成装置、車両行動生成方法、および車両行動生成プログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US20220379918A1 (ja) |
JP (1) | JP7234970B2 (ja) |
CN (1) | CN115087574A (ja) |
WO (1) | WO2021166448A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117521725A (zh) * | 2016-11-04 | 2024-02-06 | 渊慧科技有限公司 | 加强学习系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003228800A (ja) | 2002-02-01 | 2003-08-15 | Nissan Motor Co Ltd | 車両用推奨操作量生成装置 |
JP2007230454A (ja) | 2006-03-02 | 2007-09-13 | Toyota Motor Corp | 進路設定方法、装置、プログラム、および自動運転システム |
JP2011221667A (ja) | 2010-04-06 | 2011-11-04 | Toyota Motor Corp | 対象物リスク予測装置 |
JP2013242615A (ja) | 2012-05-17 | 2013-12-05 | Denso Corp | 運転シーン遷移予測装置および車両用推奨運転操作提示装置 |
WO2019106789A1 (ja) | 2017-11-30 | 2019-06-06 | 三菱電機株式会社 | 処理装置及び処理方法 |
WO2019206377A1 (de) | 2018-04-24 | 2019-10-31 | Robert Bosch Gmbh | Verfahren und vorrichtung zum kooperativen abstimmen von zukünftigen fahrmanövern eines fahrzeugs mit fremdmanövern zumindest eines fremdfahrzeugs |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002269146A (ja) * | 2001-03-08 | 2002-09-20 | Fujitsu Ltd | ワードスポッティング情報検索装置とワードスポッティング情報検索装置を実現するための方法及びプログラム |
JP6911798B2 (ja) * | 2018-03-15 | 2021-07-28 | オムロン株式会社 | ロボットの動作制御装置 |
-
2020
- 2020-02-17 JP JP2020024653A patent/JP7234970B2/ja active Active
- 2020-12-25 WO PCT/JP2020/048688 patent/WO2021166448A1/ja active Application Filing
- 2020-12-25 CN CN202080096468.9A patent/CN115087574A/zh active Pending
-
2022
- 2022-08-12 US US17/819,561 patent/US20220379918A1/en active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003228800A (ja) | 2002-02-01 | 2003-08-15 | Nissan Motor Co Ltd | 車両用推奨操作量生成装置 |
JP2007230454A (ja) | 2006-03-02 | 2007-09-13 | Toyota Motor Corp | 進路設定方法、装置、プログラム、および自動運転システム |
JP2011221667A (ja) | 2010-04-06 | 2011-11-04 | Toyota Motor Corp | 対象物リスク予測装置 |
JP2013242615A (ja) | 2012-05-17 | 2013-12-05 | Denso Corp | 運転シーン遷移予測装置および車両用推奨運転操作提示装置 |
WO2019106789A1 (ja) | 2017-11-30 | 2019-06-06 | 三菱電機株式会社 | 処理装置及び処理方法 |
WO2019206377A1 (de) | 2018-04-24 | 2019-10-31 | Robert Bosch Gmbh | Verfahren und vorrichtung zum kooperativen abstimmen von zukünftigen fahrmanövern eines fahrzeugs mit fremdmanövern zumindest eines fremdfahrzeugs |
Also Published As
Publication number | Publication date |
---|---|
JP2021127095A (ja) | 2021-09-02 |
WO2021166448A1 (ja) | 2021-08-26 |
CN115087574A (zh) | 2022-09-20 |
US20220379918A1 (en) | 2022-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11714417B2 (en) | Initial trajectory generator for motion planning system of autonomous vehicles | |
US11822337B2 (en) | Autonomous vehicles featuring machine-learned yield model | |
US11467586B2 (en) | Gridlock solver for motion planning system of an autonomous vehicle | |
US20220171390A1 (en) | Discrete Decision Architecture for Motion Planning System of an Autonomous Vehicle | |
CN111986514B (zh) | 基于交通工具的数据处理方法、装置、设备以及介质 | |
CN112888612A (zh) | 自动驾驶车辆规划 | |
IL287819B (en) | Navigation based on vehicle activity | |
JP6468261B2 (ja) | 自動運転システム | |
Hubmann et al. | A generic driving strategy for urban environments | |
US11565709B1 (en) | Vehicle controller simulations | |
JP7331939B2 (ja) | 車載装置及び運転支援方法 | |
US20220392276A1 (en) | Vehicle behavior evaluation device, vehicle behavior evaluation method, and vehicle behavior evaluation program product | |
US11351996B2 (en) | Trajectory prediction of surrounding vehicles using predefined routes | |
JP7098580B2 (ja) | 予測装置、予測方法、プログラムおよび車両制御システム | |
CN117794803A (zh) | 使用具有响应型代理预测的树搜索和/或代理滤波进行车辆轨迹控制 | |
JP7234970B2 (ja) | 車両行動生成装置、車両行動生成方法、および車両行動生成プログラム | |
Puphal et al. | Comfortable priority handling with predictive velocity optimization for intersection crossings | |
CN114763135A (zh) | 一种车辆行驶控制方法、装置、电子设备及存储介质 | |
JP2022175160A (ja) | 他車両行動予測装置および行動予測モデル学習装置 | |
US20230053243A1 (en) | Hybrid Performance Critic for Planning Module's Parameter Tuning in Autonomous Driving Vehicles | |
WO2023149003A1 (ja) | 車両制御装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211201 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211201 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230124 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230206 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7234970 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |