JP7020097B2 - 車両制御装置、リスクマップ生成装置、及びプログラム - Google Patents

車両制御装置、リスクマップ生成装置、及びプログラム Download PDF

Info

Publication number
JP7020097B2
JP7020097B2 JP2017238692A JP2017238692A JP7020097B2 JP 7020097 B2 JP7020097 B2 JP 7020097B2 JP 2017238692 A JP2017238692 A JP 2017238692A JP 2017238692 A JP2017238692 A JP 2017238692A JP 7020097 B2 JP7020097 B2 JP 7020097B2
Authority
JP
Japan
Prior art keywords
vehicle
classification
risk
traffic
map
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017238692A
Other languages
English (en)
Other versions
JP2019106049A (ja
Inventor
春昭 郭
清澄 城殿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Central R&D Labs Inc
Original Assignee
Toyota Central R&D Labs Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Central R&D Labs Inc filed Critical Toyota Central R&D Labs Inc
Priority to JP2017238692A priority Critical patent/JP7020097B2/ja
Publication of JP2019106049A publication Critical patent/JP2019106049A/ja
Application granted granted Critical
Publication of JP7020097B2 publication Critical patent/JP7020097B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Control Of Driving Devices And Active Controlling Of Vehicle (AREA)
  • Regulating Braking Force (AREA)
  • Traffic Control Systems (AREA)

Description

本発明は、車両制御装置、リスクマップ生成装置、及びプログラムに関する。
従来より、物標を右側の物標と左側の物標とに分類する物標分類手段と、リスクポテンシャルマップMRを、正の数値で表され、リスクポテンシャルが高いほど絶対値が大きくなるように作成する右側物標リスクポテンシャルマップ作成手段と、リスクポテンシャルマップMLを、リスクポテンシャル負の数値で表され、リスクポテンシャルが高いほど数値の絶対値が大きくなるように作成する左側物標リスクポテンシャルマップ作成手段と、総合リスクポテンシャルマップを作成する総合リスクポテンシャルマップ作成手段と、前記総合ポテンシャルマップにおいてリスクポテンシャルが予め設定された値となる経路を生成する経路生成手段とを備える経路生成装置が知られている(特許文献1)。
また、障害物に関する情報を検出する障害物検出手段と、自車両が障害物の現在位置に最接近するまでの余裕時間を算出する余裕時間算出手段と、余裕時間が経過したときの障害物の将来位置を推定する将来位置推定手段と、自車両が回避すべき回避対象領域を設定する回避対象領域設定手段と、回避対象領域を回避する走行経路を設定する走行経路設定手段と、を備え、回避対象領域設定手段は、将来位置及び将来位置の周辺位置における障害物との衝突リスクポテンシャルを評価し、衝突リスクポテンシャルに基づいて、回避対象領域を設定する。不必要な回避支援を削減することができる運転支援装置が知られている(特許文献2)。
また、自車両前方の障害物XMに対する自車両MMのリスクポテンシャルが、予め設定した第1の閾値Th1より高く且つアクセルペダルが操作されていないと判定すると、自車両MMに制動力を付与し、さらに、自車両前方の障害物XMに対する自車両MMのリスクポテンシャルが、第1の閾値Th1よりもリスクポテンシャルが高い第2の閾値Th2よりリスクポテンシャルが高いと判定すると、アクセルペダルの操作状態に関わらず自車両MMに制動力を付与し、自車両前方の障害物XMに対する運転者の支援を、運転者の意図に応じてより適切に実施する車両用制動支援装置が知られている(特許文献3)。
特開2015-232866号公報 特開2012-173786号公報 特開2015-71425号公報
上記の特許文献1に記載の技術では、左右の隣接レーンのみにあるオブジェクトにフォーカスして分類しているため、異なる交通参加者が異なる運転状態にある、本当に複雑な状況には対処できない。また、人間/データ駆動のデータは、ヒューマンライク挙動の生成には使用されない。
また、上記の特許文献2に記載の技術では、衝突までの時間を、明らかなリスクの評価にだけ使用しているため、異なる交通参加者が異なる運転状態にある、本当に複雑な状況には対処できない。また、人間/データ駆動のデータは、ヒューマンライク挙動の生成には使用されない。
また、上記の特許文献3に記載の技術では、自車両前方のオブジェクトにのみ注力しているため、異なる交通参加者が異なる運転状態にある、本当に複雑な状況には対処できない。また、人間/データ駆動のデータは、ヒューマンライク挙動の生成には使用されない。
本発明は、上記の事情を鑑みてなされたもので、ヒューマンライク挙動により車両を制御することができる車両制御装置、リスクマップ生成装置、及びプログラムを提供することを目的とする。
上記目的を達成するために、第1の発明の車両制御装置は、自車両および交通参加者の軌跡、位置、及び車線情報に基づいて、自車両の周囲の交通参加者を、属性及び状態に応じて分類する交通参加者分類部と、自車両の周囲の交通参加者の分類結果と、分類毎に予め学習された顕在リスクとに基づいて、自車両の周囲の交通参加者毎に、分類に応じた顕在リスクを当てはめて、顕在リスクマップを生成する顕在リスクマップ生成部と、自車両の複数の経路候補上の位置に対応する状態のうち、前記顕在リスクマップを用いた報酬関数により求められる報酬が多く得られる状態に遷移又は停止することを、最適な行動として決定する行動決定部と、前記決定された行動に従って自車両を制御する車両制御部と、を含んで構成されている。
第2の発明に係るプログラムは、コンピュータを、自車両および交通参加者の軌跡、位置、及び車線情報に基づいて、自車両の周囲の交通参加者を、属性及び状態に応じて分類する交通参加者分類部、自車両の周囲の交通参加者の分類結果と、分類毎に予め学習された顕在リスクとに基づいて、自車両の周囲の交通参加者毎に、分類に応じた顕在リスクを当てはめて、顕在リスクマップを生成する顕在リスクマップ生成部、自車両の複数の経路候補上の位置に対応する状態のうち、前記顕在リスクマップを用いた報酬関数により求められる報酬が多く得られる状態に遷移又は停止することを、最適な行動として決定する行動決定部、及び前記決定された行動に従って自車両を制御する車両制御部として機能させるためのプログラムである。
第1の発明及び第2の発明によれば、交通参加者分類部によって、自車両および交通参加者の軌跡、位置、及び車線情報に基づいて、自車両の周囲の交通参加者を、属性及び状態に応じて分類する。顕在リスクマップ生成部によって、と、自車両の周囲の交通参加者の分類結果と、分類毎に予め学習された顕在リスクとに基づいて、自車両の周囲の交通参加者毎に、分類に応じた顕在リスクを当てはめて、顕在リスクマップを生成する。
そして、行動決定部によって、自車両の複数の経路候補上の位置に対応する状態のうち、前記顕在リスクマップを用いた報酬関数により求められる報酬が多く得られる状態に遷移又は停止することを、最適な行動として決定する。車両制御部によって、前記決定された行動に従って自車両を制御する。
このように、自車両の周囲の交通参加者毎に、分類に応じた顕在リスクを当てはめて、顕在リスクマップを生成し、自車両の複数の経路候補上の位置に対応する状態のうち、顕在リスクマップを用いた報酬関数により求められる報酬が多く得られる状態に遷移又は停止することを、最適な行動として決定することにより、ヒューマンライク挙動により車両を制御することができる。
第3の発明に係るリスクマップ生成装置は、自車両および交通参加者の軌跡、位置、及び車線情報に基づいて、自車両の周囲の交通参加者を、属性及び状態に応じて分類する交通参加者分類部と、自車両の周囲の交通参加者の分類結果に基づいて、分類毎に、顕在リスクを生成して、データベースに格納する顕在リスク学習部と、を含んで構成されている。
第4の発明に係るプログラムは、コンピュータを、自車両および交通参加者の軌跡、位置、及び車線情報に基づいて、自車両の周囲の交通参加者を、属性及び状態に応じて分類する交通参加者分類部、及び自車両の周囲の交通参加者の分類結果に基づいて、分類毎に、顕在リスクを生成して、データベースに格納する顕在リスク学習部として機能させるためのプログラムである。
第3の発明及び第4の発明によれば、交通参加者分類部によって、自車両および交通参加者の軌跡、位置、及び車線情報に基づいて、自車両の周囲の交通参加者を、属性及び状態に応じて分類する。そして、顕在リスク学習部によって、自車両の周囲の交通参加者の分類結果に基づいて、分類毎に、顕在リスクを生成して、データベースに格納する。
このように、自車両の周囲の交通参加者を、属性及び状態に応じて分類し、分類毎に、顕在リスクを生成して、データベースに格納することにより、ヒューマンライク挙動により車両を制御するための顕在リスクを学習することができる。
なお、本発明のプログラムを記憶する記憶媒体は、特に限定されず、ハードディスクであってもよいし、ROMであってもよい。また、CD-ROMやDVDディスク、光磁気ディスクやICカードであってもよい。更にまた、該プログラムを、ネットワークに接続されたサーバ等からダウンロードするようにしてもよい。
以上説明したように、本発明の車両制御装置及びプログラムによれば、自車両の周囲の交通参加者毎に、分類に応じた顕在リスクを当てはめて、顕在リスクマップを生成し、自車両の複数の経路候補上の位置に対応する状態のうち、顕在リスクマップを用いた報酬関数により求められる報酬が多く得られる状態に遷移又は停止することを、最適な行動として決定することにより、ヒューマンライク挙動により車両を制御することができる、という効果が得られる。
本発明のリスクマップ生成装置及びプログラムによれば、自車両の周囲の交通参加者を、属性及び状態に応じて分類し、分類毎に、顕在リスクを生成して、データベースに格納することにより、ヒューマンライク挙動により車両を制御するための顕在リスクを生成することができる、という効果が得られる。
本発明の第1の実施の形態に係る運転支援制御システムを示すブロック図である。 本発明の第1の実施の形態に係る運転支援制御装置を示すブロック図である。 歩行者の分類の一例を示す図である。 自転車の分類の一例を示す図である。 ベイジアンネットワークモデルの一例を示す図である。 軌跡誘導ポテンシャルの一例を示す図である。 従来手法のポテンシャルの例を示す図である。 分類毎の軌跡誘導ポテンシャルの一例を示す図である。 分類毎のリスク予防ポテンシャルの一例を示す図である。 MDPモデルの一例を示す図である。 決定される最適な一連の行動の例を示す図である。 学習された軌跡誘導ポテンシャルを統合して構築された顕在リスクマップの一例を示す図である。 学習されたリスク予防ポテンシャルを統合して構築された潜在リスクマップの一例を示す図である。 本発明の第1の実施の形態に係る運転支援制御装置のコンピュータにおけるデータ収集処理ルーチンの内容を示すフローチャートである。 本発明の第1の実施の形態に係る運転支援制御装置のコンピュータにおけるオンライン処理ルーチンの内容を示すフローチャートである。 本発明の第2の実施の形態に係る運転支援制御装置を示すブロック図である。
以下、図面を参照して本発明の実施の形態を詳細に説明する。
<本実施の形態の概要>
都市交通の無限の状況を扱うためには、それらのすべてを学習することは不可能であるので、本発明の実施の形態では、道路の複雑さを、すべての動的な交通参加者に関する、分類の異なる個別事象の組み合わせに分解する。具体的には、交通参加者を、自動車、歩行者、バイク、及びその他の移動可能オブジェクトの何れかに分類する。また、自動車は、先行車両、駐車車両、最後尾の車両、流出車両、合流車両、障害になる車両、及びその他の車両に分類される。また、歩行者は、年齢に応じた分類(子供、老人、その他)、状態に応じた分類(停止中、歩行中、ランニング中)に分類される。また、自転車は、年齢に応じた分類(子供、老人、その他)、状態に応じた分類(停止、低速、高速)に分類される。バイクは、先行バイク、駐車中のバイク、最後尾バイク、流出バイク、合流バイク、障害になるバイク、及びその他のバイクに分類される。
また、すべての分類を含むデータベースを作成し、各分類に対する軌跡誘導ポテンシャル及びリスク予防ポテンシャルを学習する。これが、クラウドベースのITSマップ/データベースにおけるナレッジ/セマンテックモデル/情報として役に立つ。
データ/データソースは、路側センサ、車載センサ、通信ユニット、軌跡、位置、画像、ポイントクラウドである。
軌跡誘導ポテンシャルは、所望のローカル軌跡及び目標速度プロファイルを計算するためのものであり、リスク予防ポテンシャルは、安全許容幅(又は衝突までの時間)を増大させるための速度調節のためのものである。複数の事象(連鎖効果を含む)の上記ポテンシャルを統合する際に、ポテンシャルの影響を計算するために、交通参加者間の相互作用を考慮する。
また、報酬関数の学習ポテンシャルを利用して定義したマルコフ決定過程モデルでヒューマンライク挙動を生成する。 マルコフ決定過程モデルでは、状態、行動、報酬を定義する。状態は、ルートを追従する経路候補、レーン内で迂回する経路候補、及び衝突を回避する経路候補における各位置を表す。行動は、前進、経路変更、停止である。報酬は、時間と統合リスクマップに応じて定められる。
[第1の実施の形態]
<システム構成>
図1に示すように、本発明の第1の実施の形態に係る運転支援制御システム100は、各車両に搭載された運転支援制御装置10と、サーバ50とを備えている。運転支援制御装置10と、サーバ50とは、インターネットなどのネットワーク60を介して接続されている。
図2に示すように、運転支援制御装置10は、交通参加者軌跡取得部12と、自車位置情報取得部14と、車線情報取得部16と、画像取得部18と、コンピュータ20と、車両制御部22とを備えている。
車両制御部22は、コンピュータ20により計算された、ヨー角と、スロットル及びブレーキの何れか一方とを有する命令に基づいて、操舵制御、ブレーキ制御、又はアクセル制御を行う。
交通参加者軌跡取得部12は、自車両周辺の交通参加者の各々の軌跡を取得する。具体的には、車、歩行者、自転車、バイク及びその他の移動物体を含む、道路環境における交通参加者の軌跡を、次の2つの方法で取得する。1つ目の方法は、データ収集処理中に、自車両がプローブカーとなって、車載センサを用いて、交通参加者を検出して追跡し、得られた軌跡を蓄積する。もう1つの方法は、路側カメラ、ライダ(LIDAR)/レーダ(RADAR)などの路側センサと、自車両との間の通信ユニットを利用して、交通参加者の軌跡を取得するものである。軌跡情報には、位置、速度及び方向が時間スタンプとともに含まれる。
自車位置情報取得部14は、データ収集処理中に、自車両がプローブカーとなって、自車両の位置と軌跡を取得する。また、自車位置情報取得部14は、オンライン処理中に、自車両の位置と軌跡を取得する。それらは自車両のセンサ又は路側センサによって取得可能であり、通信を介して自車両に送信される。
より具体的には、本発明の実施の形態で使用される自車両の車両位置は、通常の安価なセンサで非常に高精度の位置が取得可能な、次の非特許文献1に記載の方法で取得される。
[非特許文献1] Kojima. Yoshikoら、「GPSドップラ法による高精度軌跡推定に基づく密結合統合を利用した新測位法の提案」、Vehicle System Dynamics 50, no. 6, pp.: 987-1000, 2012.
車線情報取得部16は、デジタルマップから走行レーン情報を取得する。より具体的には、本発明の実施の形態で使用されるレーン情報は、通常の安価なセンサで非常に高精度のレーンレベルのデジタルマップが取得可能な、次の非特許文献2に記載の方法で取得される。
[非特許文献2]Guo, Chunzhaoら、「通常の車内センサを用いた低コストの自動レーンレベルマップ作成方法」、IEEE Transactions on Intelligent Transportation Systems 17.8 (2016): 2355-2366
画像取得部18は、車載カメラを用いて画像を取得する。カメラはステレオカメラでも、単眼カメラであってもよい。画像と自車両位置が同時に取得される。
また、コンピュータ20を機能ブロックで表すと、上記図2に示すように、交通参加者分類部30と、交通環境顕在リスクマップ学習部32と、交通環境潜在リスクマップ学習部34と、交通参加者相互作用学習部36と、ヒューマンライク意思決定学習部38と、通信部40とを備えている。なお、交通環境顕在リスクマップ学習部32は、顕在リスク学習部の一例であり、交通環境潜在リスクマップ学習部34は、潜在リスク学習部の一例であり、交通参加者相互作用学習部36は、相互作用推定部の一例である。
交通参加者分類部30は、自車両および交通参加者の軌跡、位置、及び車線情報に基づいて、自車両の周囲の交通参加者を、属性及び状態に応じて分類する。
人間の運転者は、他の交通参加者がどこにいるかばかりでなく、それらがどのような運転/条件/分類であるかも見るものである。分類が異なれば、人間の運転者は異なる扱いをする。本実施の形態では、人間の運転者の運転能力及び方法の模倣を試みる。これが本発明の実施の形態のキーコンポーネントであり、本発明の実施の形態では、道路の複雑さを、すべての動的な交通参加者に対する分類の異なる個別事象の組合せに分解する。具体的には、周辺の交通参加者を以下のように車両、歩行者、バイク、及びその他の移動可能オブジェクトの何れかに分類する。
また、歩行者は、年齢に応じた分類(子供、老人、その他)、状態に応じた分類(停止中、歩行中、ランニング中)に分類される。また、自転車は、年齢に応じた分類(子供、老人、その他)、状態に応じた分類(停止、低速、高速)に分類される。バイクは、先行バイク、駐車中のバイク、最後尾バイク、流出バイク、合流バイク、障害になるバイク、及びその他のバイクに分類される。
車両は、先行車両、駐車車両、最後尾の車両、流出車両、合流車両、障害になる車両、及びその他の車両に分類される。
ここで、先行車両は、自レーンを先行して移動中の車両であり、自車両と類似の軌跡及び進行方向を有している。 安全条件下では自車両はそれを追随又は模倣すべきである。
また、駐車車両は、自レーンの路側に駐車している先行の停止車両である。自車両は安全条件下でそれを滑らかに迂回しなければならない。
末尾車両は、自レーンの交通の末尾又は交通信号位置にある、先行する停止/徐行車両である。自車両はその後ろに停止し、それが移動し始めた場合には安全条件下で追跡しなければならない。
流出車両は、ターンして自レーンから出ようとする、自レーン内の先行の停止/徐行車両である。自車両は、追随するか、又は安全条件下で自レーンの近傍の実行可能経路でそれを迂回する十分な余地ができるまで後ろで待たなければならない。
合流車両は、自レーンの自車両の前にまさに入ろうとする、隣接レーンで停止/移動中の車両である。自車両は、減速度の大きさが閾値以下の場合、またその時に限って、徐行してその車の合流動作に十分な余地を与えなければならない。そうでなければ、自車両は正常に走行し、安全条件下で合流車両の次の動作に反応しなければならない。
対向車両は、自レーンの隣のレーンを反対方向から来る移動車両である。自車両は、その車両が自車両に接触しそうな場合、又は自車両に非常に近接して衝突の可能性が高くなりそうな場合、そのような車両を回避する経路を計画しなければならない。
他の車両は、上記の分類のいずれにも入らない車両である。自車両は、それとの物理的衝突を回避しつつ、正常に走行すべきである。
歩行者は、図3に示すように2次元的に分類される。 縦軸は歩行者の年齢を、横軸は歩行者の状態を表す。 縦軸のリスクポテンシャルの大小関係は、子供>老人>その他、である。 横軸のリスクポテンシャルの大小関係は、立ち止まり中<歩行中<ランニング中、である。さらに、これらの人が自レーンを横断又は跳び込んでくる確率は、その姿勢、顔/目の方向及びその動きの軌跡を検出することで評価される。
自転車は、図4に示すように2次元的に分類される。 縦軸は自転車に乗っている人の年齢を、横軸は自転車の状態を表す。 縦軸のリスクポテンシャルの大小関係は、子供>老人>その他、である。 横軸のリスクポテンシャルの大小関係は、停止中<低速走行<高速走行、である。 さらに、これらの人が自レーンを横断又は跳び込んでくる確率は、その姿勢、顔/目の方向及びその動きの軌跡を検出することで評価される。
バイクは、先行バイク、駐車中のバイク、末尾バイク、流出するバイク、合流するバイク、対向してくるバイク、その他のバイクに分類される。
先行バイクは、自車両の前方を移動中のバイクである。 ただし、自車両は先行バイクの模倣はしないで、そこから安全距離を維持するだけである。
駐車中のバイクは、自レーンの路側に駐車している先行のバイクである。駐車車両と同様に、自車両は安全条件下でそれを滑らかに迂回しなければならない。
末尾バイクは、自レーンの交通の末尾又は交通信号位置にある、先行する停止/徐行バイクである。末尾車両と同様に、自車両はその後ろに停止し、それが移動し始めた場合には安全条件下で追跡しなければならない。
流出するバイクは、ターンして自レーンから出ようとする、自レーン内の先行の停止/徐行バイクである。流出車両と同様に、自車両は、追随するか、又は安全条件下で自レーンの近傍の実行可能経路でそれを迂回する十分な余地ができるまで後ろで待たなければならない。
合流するバイクは、自レーンの自車両の前にまさに入ろうとする、隣接レーンで停止/移動中のバイクである。合流車両と同様に、自車両は、減速度の大きさが閾値以下の場合、またその時に限って、徐行してその車の合流動作に十分な余地を与えなければならない。そうでなければ、自車両は正常に走行し、安全条件下で合流バイクの次の動作に反応しなければならない。
対向してくるバイクは、自レーンの隣のレーンを反対方向から来る移動バイクである。対向車両と同様に、自車両は、その車両が自車両に接触しそうな場合、又は自車両に非常に近接して衝突の可能性が高くなりそうな場合、そのようなバイクを回避する経路を計画しなければならない。
その他のバイクは、上記の分類のいずれにも入らないバイクである。自車両は、それとの物理的衝突を回避しつつ、正常に走行すべきである。
また、その他の移動可能オブジェクトは、物理的な衝突やその他の危険を回避するように対処しなければならない、交通環境内のその他のオブジェクトである。
分類器は機械学習に基づいて取得される。 本発明の実施の形態において、複数の特徴を有するベイジアンネットワーク(BN)モデルを構築する。 例えば図5に示すような車の分類を例にとると、BNモデルにおける特徴変数は、運転速度D、交差点への至近性I、レーン内のオフセットO、軌跡T、信号S、前方自由空間F、レーンL、次のレーンN、及び一致度Aを含む。
ここで、運転速度Dは、ガウス分布でモデル化される。交差点への至近性Iの値は{真、偽}のいずれかであり、これは車両と最近接交差点との間の距離で判定される。レーン内のオフセットOは、車両と自レーンの中心線との間の横方向距離で判定される。軌跡Tの値は{長、短}のいずれかであり、車両の軌跡の長さで判定される。信号Sの値は{ハザード、ターン、なし}のうちの1つであり、検出車両においてどのシグナルが点灯しているかで判定される。前方自由空間Fの値は{真、偽、不明}のうちの1つであり、検出車両の位置と自レーンに関する自由空間境界を比較して判定される。レーンLの値は{自レーン、隣接レーン、その他}のうちの1つであり、検出車両が走行しているレーンで判定される。次のレーンNの値は{同じ、異なる}のいずれかであり、ある時間後に、検出車両が自車両と同じレーンを走行しているか否かで判定される。一致度Aの値は{高、低}のいずれかであり、検出車両と自車両の軌跡の相互の一致度で判定される。
したがって、車両分類の、本実施の形態のBNモデルの合同確率関数は次の因子形式で定義可能である。
Figure 0007020097000001
上記の式における、各種類の交通参加者の各分類に対する各特徴の確率分布は、分類が既知の、同一状況における交通参加者の軌跡データから学習される。
交通参加者分類部30は、検出された交通参加者のオンライン分類を行う際に、上記の特徴を画像から検出/計算し、それを用いて各分類の学習されたBNモデルよりスコアを計算し、最高スコアを有する分類を、検出された交通参加者の分類として決定する。
交通環境顕在リスクマップ学習部32は、以下に説明するように、顕在リスクマップを生成するための軌跡誘導ポテンシャルを生成する。
人間の運転者が、交通環境内に駐車中の車などのオブジェクトを見た場合には、それからどれくらい距離を取るべきかということではなく、それを処理するのに何をすべきか又はどの経路を通るべきかということを考える。 そのような機構を模倣するために、運転データから、顕在リスクマップを表示するための軌跡誘導ポテンシャルを生成する。検出された(目視できる)各オブジェクト(例えば車両、歩行者、自転車、、、)のそれぞれの分類に対して、軌跡誘導ポテンシャルが生成される。これには、図6に示すように、衝突防止のための反発空間ポテンシャル、所望の軌跡を誘導するための吸引空間ポテンシャル、及び適切な目標速度を誘導するための速度ポテンシャルが含まれる。さらに、プローブカーが各分類の各種の交通参加者に対処するときの、図6の実線で示すような、自然な運転データでのその軌跡を学習する。 そのようなポテンシャルは、周辺車両を安全かつ合理的に扱うことができるように、所望の決定、経路、及び速度を符号化する。
従来方法では、反発力Uv repをオブジェクトへ、吸引力Ur attをルート又はレーンへ、そして、フィードバック力Usを所望の速度に達するために割り当てる(図7参照)。 それに対し本実施の形態では、交通環境顕在リスクマップ学習部32は、検出車両の全てからその分類に従って合力を生成する。図8に示すように、反発力は衝突しないためであり、吸引力は所望の決定、経路、及び速度を符号化して所望の挙動を誘導するためのものである。これは日々の都市交通において人間の運転者により収集された、同一状況の実際の軌跡から学習される。
オンライン処理においては、軌跡誘導ポテンシャルを使用して、所望のローカル軌跡及び目標速度プロファイルが計算される。
交通環境潜在リスクマップ学習部34は、以下に説明するように、潜在リスクマップを生成するためのリスク予防ポテンシャルを生成する。
世の中には極めて多数の人間の運転者がおり、これを単純に2つの分類、すなわち良い運転者と悪い運転者に区分することができる。悪い運転者も大部分の場合には安全運転を守ることができるが、良い運転者は衝突を起こす確率がはるかに低い。 両者の間のキーとなる違いの1つは、交通環境に潜むリスクを予測して、事前に回避不能の衝突を防止するために早期のアクションを取る能力である。本発明の実施の形態では、どんなリスクが予期されるか、どこで用心すべきか、そしてどうやって衝突を防止するか、ということに関して、各オブジェクト分類に対する主要な潜在リスクのすべてを、複数の熟練した人間の運転者に要請して洗い出した。その例を次の図9に示す。
リスク予防ポテンシャルは、洗い出された潜在(不可視)リスクに対処するために生成される。さらに、生成されたリスク予防ポテンシャルは、オンライン処理において自車両の速度制御の調整にのみ適用される。一方で、オンライン処理において、軌跡は軌跡誘導ポテンシャルのみで決定される。その理由は次の2つである。第1に、交通環境内には非常に多くの潜在リスク又は不確定因子があり、それらをいちいち空間的に回避することはできない。 そうでなければ、軌跡は不自然になりすぎて、多くの新たなリスクを生じるであろう。 第2に、そしてより重要には、軌跡誘導ポテンシャルは、同一状況下での過去の人間による自然な運転データから学習され、これらは同一状況下での顕在リスクと潜在リスクの両方に直面したときに人間の運転者が取る軌跡である。 より具体的には、リスク予防ポテンシャルは、各潜在リスクに対応する複数の速度ポテンシャルからなる。 リスク予防ポテンシャルの実効的範囲、強度及び分布(例えば、ガウス分布)は、自然な運転データから学習される。
交通参加者相互作用学習部36は、以下に説明するように、交通参加者間の相互作用を表すモデルのパラメータを推定する。
自車両が周囲の交通参加者と相互作用するばかりでなく、交通参加者同士も相互に作用しあっている。 本実施の形態では、例えば車-車、車-歩行者、車-自転車などの各交通参加者ペアの相互作用が、交通規則、熟練者定義、及び自然交通データ(交通監視カメラデータなど)に基づいてモデル化される。そうしてこのモデルのパラメータが、自然交通データから学習される。 これは次の2通りで使用される。 第1の使用方法では、各交通参加者のポテンシャルの統合は、単純に合計するのではなく、このモジュールで学習されたポテンシャルの相互作用/影響に基づいて結合される。第2の使用方法では、学習された相互作用は、ヒューマンライクマルコフ決定過程での交通参加者予測に使用される。
ヒューマンライク意思決定学習部38は、以下に説明するように、行動を決定するためのモデルと報酬関数を学習する。
周辺オブジェクトとのヒューマンライク相互作用は、マルコフ決定過程(MDP)のフレームワークで実行される。ただし、行動を決定するためのモデルと報酬関数の学習は新規の方法で行われる。 モデル化されたMDPは、対向車両のある場合に駐車車両を通過するタスクを一例として、 {S, A, P, R, r}で表される。
Sは経路候補上の位置に対応する状態を表す。ここで、自車両は、過去の車両軌跡及びオンライン経路計画から複数の経路候補を生成する。複数の経路候補は、ルート追従(RF)、レーン内迂回(IC)、及び障害回避(OA)の3つのグループに区分される。
ルート追従(RF)に区分される経路候補は、自車両を所定のレーンレベルのルートを追従するように導くためのものである。
レーン内迂回(IC)に区分される経路候補は、対向車両を無視して、駐車車両を円滑かつ安全に迂回するように自車両を導くためのものである。
障害回避(OA)に区分される経路候補は、駐車車両と対向車両を含む近隣オブジェクトとの衝突を回避するように自車両を導くためのものである。
MDPの状態(図10の丸印参照)は、対向車両の位置/速度に応じた、標準的速度での経路候補上の各位置に対応している。
Aは、決定される行動を表し、現在の経路候補を前進、経路切り替え、停止の何れかである。
Sは、状態遷移確率P(st+1|st, a)を表す。自車両の状態遷移は、現在の決定、経路、及び速度に従う車両運動により計算される。 具体的には、対向車両の状態遷移は、過去の自然運転データから学習された車両軌跡と対向車両のモデルによって経路候補として生成される。これは自車両の運動が対向車両に与える影響を考慮するために行われる。それは対向車両の運動が自車両の決定/経路に影響するばかりでなく、自車両の運動も対向車両の運動に影響するからである。
Rは、報酬を表し、時間+満足+安全の組合せである。すなわち、報酬=w1*時間スコア + w2* 満足スコア + w3*安全スコアである。
時間スコアは、各ステップに対して-1、停止に対して-3となる。したがって最短/最速の決定が選択される。
満足スコアは、現在の状態遷移にどのスコアを使用するかの判定閾値が与えられているとして、経路切り替えアクション時の進行方向角度の小変化に対して-2、経路切り替えアクション時の進行方向角度の大変化に対して-5となる。
安全スコアは、統合された軌跡誘導ポテンシャルとリスク予防ポテンシャルによって安全スコアが与えられる。
重みw、w、wは、Markov Decision Processによる強化学習に従って自然運転データを用いて学習するか、事前にエンジニアが設定しておけばよい。
rは、割引因子を表し、更なるステップ(未来)からの報酬を考慮するために、0~1の間の実数として定義される。
オンライン処理においてモデルに従って決定される行動の解は次の2つの方法で得ることができる。 1つはQマトリックスが事前に学習されており、Qマトリックスにより行動を決定する。Qマトリックスは自然運転データでの強化学習に基づくすべての状態→アクションマッピングを含む。
もう一つは、ダイナミックプログラミングアルゴリズムを用いて現状況での状態に対してオンラインで行動を決定するものである。本実施の形態では、ダイナミックプログラミングアルゴリズムを用いてオンラインで行動を決定する場合を例に説明する。
こうして図11に示すように、ヒューマンライク挙動パターンが学習MDPによって生成可能となる。
通信部40は、交通参加者分類部30、交通環境顕在リスクマップ学習部32、交通環境潜在リスクマップ学習部34、交通参加者相互作用学習部36、及びヒューマンライク意思決定学習部38による処理結果を、サーバ50へ送信する。
サーバ50は、各運転支援制御装置10から送信された、すべての学習モデルとポテンシャルを記憶する。すべての学習モデルとポテンシャルはナリッジデータベース/レイヤー生成に使用される。これは、自律運転又はADAS/運転支援操作のときにオンライン処理のためのクラウドベース/サーバベースサービスとして利用可能である。
コンピュータ20は、更に、交通環境ダイナミック情報生成部42と、交通環境リスクマップ構築部44と、ヒューマンライク進路決定部46とを備えている。なお、交通環境リスクマップ構築部44は、顕在リスクマップ生成部及び潜在リスクマップ生成部の一例であり、ヒューマンライク進路決定部46は、行動決定部の一例である。
交通環境ダイナミック情報生成部42は、オンライン処理時に、サーバ50から得られる、検出されたオブジェクトとその分類を含む交通シーンの全情報を統合して現状交通シーンの現時点動的マップを生成する。なお、検出されたオブジェクトとその分類を含む交通シーンの情報は、自車両を含む各車両の運転支援制御装置10によって検出されたものだけでなく、車車間通信又は路側との通信により検出されたものを用いても良い。
交通環境リスクマップ構築部44は、サーバ50から得られる、自車両の周囲の交通参加者の分類結果と、分類毎に予め学習された軌跡誘導ポテンシャルとに基づいて、自車両の周囲の交通参加者毎に、分類に応じた軌跡誘導ポテンシャルを当てはめて、顕在リスクマップを生成し、サーバ50から得られる、自車両の周囲の交通参加者の分類結果と、分類毎に予め学習されたリスク予防ポテンシャルとに基づいて、自車両の周囲の交通参加者毎に、分類に応じたリスク予防ポテンシャルを当てはめて、潜在リスクマップを生成し、顕在リスクマップ及び潜在リスクマップを統合した統合リスクマップを生成する。
具体的には、動的交通シーンのオブジェクトの各々に対して、分類毎に予め学習された軌跡誘導ポテンシャル及びリスク予防ポテンシャルに従って、1つずつ対応する軌跡誘導ポテンシャル及びリスク予防ポテンシャルを当てはめて、意思決定と経路計画のための統合リスクマップに統合する。 駐車車両が存在する場合の統合リスクマップの例を図12~図13に示す。
また、統合リスクマップに、交通参加者のペア間の相互作用が反映される。
ヒューマンライク進路決定部46は、現在の状態と、状態遷移確率と、構築された統合リスクマップを用いた報酬関数とに基づいて、自車両の複数の経路候補上の位置に対応する状態のうち、統合リスクマップを用いた報酬関数により求められる報酬が多く得られるように、現在の経路候補に沿って進行するように状態を遷移するか、異なる経路候補上の状態に遷移するか、停止するか、のいずれかを、最適な行動として決定する。このとき、顕在リスクポテンシャル及びリスク予防ポテンシャルに基づいて調整される速度に応じて遷移先となる状態までの距離が決まる。
具体的には、統合リスクマップ上の顕在リスクポテンシャルに基づいて、ルート追従に区分される経路候補、レーン内迂回に区分される経路候補、及び障害回避に区分される経路候補を生成し、統合リスクマップ上の顕在リスクポテンシャル及びリスク予防ポテンシャルに基づいて、車両速度が調整される。そして、調整された速度に応じて、ルート追従に区分される経路候補、レーン内迂回に区分される経路候補、及び障害回避に区分される経路候補の各経路候補上に、各位置に対応する状態を生成し、自車両と対向車両の入力状態と学習MDPモデルによるダイナミックプログラミングを用いて、将来的な報酬を考慮した報酬が得られる最適な行動を決定する。さらに、決定された行動から、ヨー角と、スロットル及びブレーキの何れか一方とを有する命令が計算されて、車両制御部22へ出力される。なお、学習されたQマトリックスから最適な行動を決定しても良い。
<運転支援制御装置10の作用>
次に、本実施の形態の作用について説明する。
運転支援制御装置10は、図14に示すデータ収集処理ルーチンを繰り返し実行する。
まず、ステップS100において、交通参加者軌跡取得部12は、自車両周辺の交通参加者の各々の軌跡を取得する。
ステップS102では、自車位置情報取得部14は、データ収集プロセス中に、自車両がプローブカーとなって、自車両の位置と軌跡を取得する。また、車線情報取得部16は、デジタルマップから走行レーン情報を取得する。画像取得部18は、車載カメラを用いて画像を取得する。
ステップS104では、交通参加者分類部30は、自車両および交通参加者の軌跡、位置、及び車線情報に基づいて、自車両の周囲の交通参加者を、属性及び状態に応じて分類する。
そして、ステップS106において、交通環境顕在リスクマップ学習部32は、検出された交通参加者のそれぞれの分類に対して、顕在リスクマップを生成するための軌跡誘導ポテンシャルを生成する。
ステップS108では、交通環境潜在リスクマップ学習部34は、検出された交通参加者のそれぞれの分類に対して、潜在リスクマップを生成するためのリスク予防ポテンシャルを生成する。
そして、ステップS110では、交通参加者相互作用学習部36は、交通参加者間の相互作用を表すモデルのパラメータを推定する。
ステップS112では、通信部40は、交通参加者分類部30、交通環境顕在リスクマップ学習部32、交通環境潜在リスクマップ学習部34、および交通参加者相互作用学習部36による処理結果を、サーバ50へ送信して、データ収集処理ルーチンを終了する。
次に、運転支援制御装置10は、図15に示すオンライン処理ルーチンを実行する。
まず、ステップS120において、車線情報取得部16は、デジタルマップから走行レーン情報を取得する。画像取得部18は、車載カメラを用いて画像を取得する。
ステップS122において、交通環境ダイナミック情報生成部42は、サーバ50から得られる、検出されたオブジェクトとその分類を含む交通シーンの全情報を統合して現状交通シーンの現時点動的マップを生成する。
そして、ステップS124において、交通環境リスクマップ構築部44は、サーバ50から得られる、自車両の周囲の交通参加者の分類結果と、分類毎に予め学習された軌跡誘導ポテンシャルとに基づいて、自車両の周囲の交通参加者毎に、分類に応じた軌跡誘導ポテンシャルを当てはめて、顕在リスクマップを生成し、自車両の周囲の交通参加者の分類結果と、分類毎に予め学習されたリスク予防ポテンシャルとに基づいて、自車両の周囲の交通参加者毎に、分類に応じたリスク予防ポテンシャルを当てはめて、潜在リスクマップを生成し、顕在リスクマップ及び前記潜在リスクマップを統合した統合リスクマップを生成する。
ステップS126では、ヒューマンライク進路決定部46は、自車両の複数の経路候補上の位置に対応する状態のうち、統合リスクマップを用いた報酬関数により求められる報酬が多く得られる状態に遷移又は停止することを、最適な行動として決定する
そして、ステップS128において、決定された行動から、ヨー角と、スロットル/ブレーキの1つを有する命令を計算し、車両制御部22へ出力し、ステップS120へ戻る。
上記のオンライン処理ルーチンが繰り返し実行されることにより、逐次計算されたヨー角と、スロットル/ブレーキの1つを有する命令が、車両制御部22へ出力され、車両制御部22により、車両制御が行われる。
以上説明したように、本発明の第1の実施の形態に係る運転支援制御システムによれば、自車両の周囲の交通参加者毎に、分類に応じた顕在リスクポテンシャルを当てはめて、顕在リスクマップを生成し、分類に応じたリスク予防ポテンシャルを当てはめて、潜在リスクマップを生成し、自車両の複数の経路候補上の位置に対応する状態のうち、顕在リスクマップ及び潜在リスクマップを統合した統合リスクマップを用いた報酬関数により求められる報酬が多く得られる状態に遷移又は停止することを、最適な行動として決定することにより、人間の運転に近い挙動により車両を制御することができる。
また、自車両の周囲の交通参加者を、属性及び状態に応じて分類し、分類毎に、顕在リスクポテンシャル及びリスク予防ポテンシャルを学習して、サーバに送信することにより、ヒューマンライク挙動により車両を制御するための顕在リスク及び潜在リスクを学習することができる。
また、道路の複雑さを、すべての動的な交通参加者に対する異なる分類の個別事象の組合せに分解する。また、交通参加者を分類するモデルを学習し、分類のそれぞれに対する顕在リスクポテンシャル及びリスク予防ポテンシャルを学習する。学習された顕在リスクポテンシャル及びリスク予防ポテンシャルを用いた報酬関数を利用して、ヒューマンライク挙動を説明するマルコフ決定プロセスモデルが学習される。これにより、複雑な交通環境を個々の事象に分解してモデル化することで多様な走行データから人間らしい運転行動を導出することができる
[第2の実施の形態]
次に、第2の実施の形態に係る運転支援制御装置について説明する。なお、第1の実施の形態と同様の構成となる部分については、同一符号を付して説明を省略する。
第2の実施の形態では、サーバを用いずに、自装置内で得られた学習モデルとポテンシャルを用いてオンライン処理を行っている点が、第1の実施の形態と異なっている。
<システム構成>
図16に示すように、第2の実施の形態に係る運転支援制御装置210のコンピュータ220は、交通参加者分類部30と、交通環境顕在リスクマップ学習部32と、交通環境潜在リスクマップ学習部34と、交通参加者相互作用学習部36と、ヒューマンライク意思決定学習部38と、交通環境ダイナミック情報生成部42と、交通環境リスクマップ構築部44と、ヒューマンライク進路決定部46とを備えている。
交通参加者分類部30による処理結果が、交通環境ダイナミック情報生成部42に出力される。
交通環境顕在リスクマップ学習部32、交通環境潜在リスクマップ学習部34、及び交通参加者相互作用学習部36による処理結果が、交通環境リスクマップ構築部44に出力される。
ヒューマンライク意思決定学習部38による処理結果が、ヒューマンライク進路決定部46に出力される。
なお、第2の実施の形態に係る運転支援制御装置210の他の構成及び作用については、第1の実施の形態と同様であるため、説明を省略する。
以上説明したように、第2の実施の形態に係る運転支援制御装置によれば、自車両の周囲の交通参加者毎に、分類に応じた顕在リスクポテンシャルを当てはめて、顕在リスクマップを生成し、分類に応じたリスク予防ポテンシャルを当てはめて、潜在リスクマップを生成し、自車両の複数の経路候補上の位置に対応する状態のうち、顕在リスクマップ及び潜在リスクマップを統合した統合リスクマップを用いた報酬関数により求められる報酬が多く得られる状態に遷移又は停止することを、最適な行動として決定することにより、人間の運転に近い挙動により車両を制御することができる。
なお、上記の第1、第2の実施の形態では、オンライン処理中に、車載カメラによって撮像された画像から交通参加者を検出する場合を例に説明したが、これに限定されるものではなく、レーザレーダによって観測された自車両の周辺に存在する物体情報に基づいて、周辺の交通参加者を検出してもよい。
10、210 運転支援制御装置
12 交通参加者軌跡取得部
14 自車位置情報取得部
16 車線情報取得部
18 画像取得部
20、220 コンピュータ
22 車両制御部
30 交通参加者分類部
32 交通環境顕在リスクマップ学習部
34 交通環境潜在リスクマップ学習部
36 交通参加者相互作用学習部
38 ヒューマンライク意思決定学習部
40 通信部
42 交通環境ダイナミック情報生成部
44 交通環境リスクマップ構築部
46 ヒューマンライク進路決定部
50 サーバ
100 運転支援制御システム

Claims (6)

  1. 自車両および交通参加者の軌跡、位置、及び車線情報に基づいて、自車両の周囲の交通参加者を、属性及び状態に応じて分類する交通参加者分類部と、
    自車両の周囲の交通参加者の分類結果と、分類毎に予め学習された顕在リスクとに基づいて、自車両の周囲の交通参加者毎に、分類に応じた顕在リスクを当てはめて、顕在リスクマップを生成する顕在リスクマップ生成部と、
    自車両の複数の経路候補上の位置に対応する状態のうち、前記顕在リスクマップを用いた報酬関数により求められる報酬が多く得られる状態に遷移又は停止することを、最適な行動として決定する行動決定部と、
    前記決定された行動に従って自車両を制御する車両制御部と、
    を含み、
    前記報酬関数は、時間に関するスコア、経路候補の切り替えに関するスコア、及び安全に関するスコアを用いて表される車両制御装置。
  2. 自車両の周囲の交通参加者の分類結果と、分類毎に予め学習された潜在リスクとに基づいて、自車両の周囲の交通参加者毎に、分類に応じた潜在リスクを当てはめて、潜在リスクマップを生成する潜在リスクマップ生成部を更に含み、
    前記行動決定部は、自車両の複数の経路候補上の位置に対応する状態のうち、前記顕在リスクマップ及び前記潜在リスクマップを統合した統合リスクマップを用いた報酬関数により求められる報酬が多く得られる状態に遷移又は停止することを、最適な行動として決定する請求項1記載の車両制御装置。
  3. 前記交通参加者の分類結果に基づき、異なる属性及び状態の交通参加者のペア間の影響を推定する相互作用推定部を更に含み、
    前記統合リスクマップに、前記推定された交通参加者のペア間の影響が反映される請求項2記載の車両制御装置。
  4. 前記報酬関数は、Markov Decision Processによる強化学習を用いて予め学習され、
    前記複数の経路候補は、ルートを追従する経路候補、レーン内で回避する経路候補、及び衝突を回避する経路候補を含む請求項1~請求項3の何れか1項記載の車両制御装置。
  5. 前記交通参加者の分類は、車両、歩行者、自転車、及びバイクを含む請求項1~請求項の何れか1項記載の車両制御装置。
  6. コンピュータを、
    自車両および交通参加者の軌跡、位置、及び車線情報に基づいて、自車両の周囲の交通参加者を、属性及び状態に応じて分類する交通参加者分類部、
    自車両の周囲の交通参加者の分類結果と、分類毎に予め学習された顕在リスクとに基づいて、自車両の周囲の交通参加者毎に、分類に応じた顕在リスクを当てはめて、顕在リスクマップを生成する顕在リスクマップ生成部、
    自車両の複数の経路候補上の位置に対応する状態のうち、前記顕在リスクマップを用いた報酬関数により求められる報酬が多く得られる状態に遷移又は停止することを、最適な行動として決定する行動決定部、及び
    前記決定された行動に従って自車両を制御する車両制御部
    として機能させるためのプログラムであって、
    前記報酬関数は、時間に関するスコア、経路候補の切り替えに関するスコア、及び安全に関するスコアを用いて表されるプログラム
JP2017238692A 2017-12-13 2017-12-13 車両制御装置、リスクマップ生成装置、及びプログラム Active JP7020097B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017238692A JP7020097B2 (ja) 2017-12-13 2017-12-13 車両制御装置、リスクマップ生成装置、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017238692A JP7020097B2 (ja) 2017-12-13 2017-12-13 車両制御装置、リスクマップ生成装置、及びプログラム

Publications (2)

Publication Number Publication Date
JP2019106049A JP2019106049A (ja) 2019-06-27
JP7020097B2 true JP7020097B2 (ja) 2022-02-16

Family

ID=67062467

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017238692A Active JP7020097B2 (ja) 2017-12-13 2017-12-13 車両制御装置、リスクマップ生成装置、及びプログラム

Country Status (1)

Country Link
JP (1) JP7020097B2 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11467588B2 (en) * 2019-07-03 2022-10-11 Denso International America, Inc. Systems and methods for controlling an autonomous vehicle using target orientated artificial intelligence
US20220276650A1 (en) * 2019-08-01 2022-09-01 Telefonaktiebolaget Lm Ericsson (Publ) Methods for risk management for autonomous devices and related node
JP7269694B2 (ja) * 2019-08-13 2023-05-09 Kddi株式会社 事象発生推定のための学習データ生成方法・プログラム、学習モデル及び事象発生推定装置
JP7500210B2 (ja) * 2020-02-06 2024-06-17 日産自動車株式会社 車両の走行支援方法及び走行支援装置
KR102350197B1 (ko) * 2020-02-19 2022-01-12 재단법인대구경북과학기술원 주행경로 설정장치 및 주행경로 설정방법
EP4122787B1 (en) 2020-03-19 2024-04-24 NISSAN MOTOR Co., Ltd. Vehicle travel assistance method and vehicle travel assistance device
CN113467438B (zh) * 2020-03-31 2023-07-18 华为技术有限公司 路径规划的方法、装置、控制器及移动物体
JP7475951B2 (ja) * 2020-04-28 2024-04-30 日産自動車株式会社 車両の走行支援方法及び走行支援装置
US12030507B2 (en) * 2020-06-29 2024-07-09 Dr. Ing. H.C. F. Porsche Aktiengesellschaft Method and system for predicting a trajectory of a target vehicle in an environment of a vehicle
KR20220033077A (ko) 2020-09-07 2022-03-16 주식회사 라이드플럭스 속력 프로파일을 이용한 자율주행 차량의 정지 제어 방법, 장치 및 컴퓨터프로그램
WO2022101966A1 (ja) * 2020-11-10 2022-05-19 日本電気株式会社 学習装置、制御システム、学習方法および記録媒体
JP7467323B2 (ja) 2020-12-07 2024-04-15 日産自動車株式会社 走行支援方法及び走行支援装置
JP7355001B2 (ja) * 2020-12-22 2023-10-03 トヨタ自動車株式会社 運転支援システム、運転支援方法、及び運転支援プログラム
CN113561974B (zh) * 2021-08-25 2023-11-24 清华大学 基于车辆行为交互与道路结构耦合的碰撞风险预测方法
CN115635963B (zh) * 2022-12-22 2023-03-07 福思(杭州)智能科技有限公司 目标对象筛选方法、装置、电子装置、存储介质和车辆

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008052473A (ja) 2006-08-24 2008-03-06 Nippon Telegr & Teleph Corp <Ntt> 水中ロボットの動作制御方法、装置、プログラム及びその記録媒体
JP2017182563A (ja) 2016-03-31 2017-10-05 株式会社Subaru 周辺リスク表示装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008052473A (ja) 2006-08-24 2008-03-06 Nippon Telegr & Teleph Corp <Ntt> 水中ロボットの動作制御方法、装置、プログラム及びその記録媒体
JP2017182563A (ja) 2016-03-31 2017-10-05 株式会社Subaru 周辺リスク表示装置

Also Published As

Publication number Publication date
JP2019106049A (ja) 2019-06-27

Similar Documents

Publication Publication Date Title
JP7020097B2 (ja) 車両制御装置、リスクマップ生成装置、及びプログラム
US11783614B2 (en) Pedestrian behavior predictions for autonomous vehicles
US10969789B2 (en) Verifying predicted trajectories using a grid-based approach
US10696298B2 (en) Path prediction for a vehicle
US10372130B1 (en) Communicating reasons for vehicle actions
JP6872861B2 (ja) 車両運転者から追加情報を取得するコミュニケーション・モジュールを備えた車両を自律的又は半自律的に運転するためのシステム及び方法
CN106114507B (zh) 用于智能车辆的局部轨迹规划方法和装置
JP6800575B2 (ja) 自己の乗り物のドライバを支援する方法およびシステム
WO2019106789A1 (ja) 処理装置及び処理方法
JP6880224B2 (ja) 車両制御装置
JP2013242615A (ja) 運転シーン遷移予測装置および車両用推奨運転操作提示装置
CN111661045B (zh) 训练用于察觉碰撞的轨迹预测的生成器单元和鉴别器单元
JP2022083359A (ja) 電子制御装置
Guo et al. Toward human-like behavior generation in urban environment based on Markov decision process with hybrid potential maps
JP7500210B2 (ja) 車両の走行支援方法及び走行支援装置
Siboo et al. An empirical study of ddpg and ppo-based reinforcement learning algorithms for autonomous driving
JP2021160531A (ja) 車両制御装置、車両制御方法、及びプログラム
Ernst et al. Behaviour recognition of traffic participants by using manoeuvre primitives for automated vehicles in urban traffic
Gupta et al. Hylear: Hybrid deep reinforcement learning and planning for safe and comfortable automated driving
JP7400911B1 (ja) 自動運転装置
JP2024505833A (ja) 支援的または自動的に車両案内する方法
US20230415766A1 (en) Lane segment clustering using hybrid distance metrics
Giridhar Artificial Potential Field Based Unsignalized Intersection Driving
JP2024022570A (ja) 車両周辺のオブジェクトを検知して走行する方法、装置及びシステム
CN115092166A (zh) 一种基于社会力模型的交互式自动驾驶速度规划方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201019

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210924

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211005

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211104

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220104

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220117

R150 Certificate of patent or registration of utility model

Ref document number: 7020097

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150