JP2024514078A - マップを改良するために新しい道路を探索するためのルートプランナ及び意思決定 - Google Patents
マップを改良するために新しい道路を探索するためのルートプランナ及び意思決定 Download PDFInfo
- Publication number
- JP2024514078A JP2024514078A JP2023559777A JP2023559777A JP2024514078A JP 2024514078 A JP2024514078 A JP 2024514078A JP 2023559777 A JP2023559777 A JP 2023559777A JP 2023559777 A JP2023559777 A JP 2023559777A JP 2024514078 A JP2024514078 A JP 2024514078A
- Authority
- JP
- Japan
- Prior art keywords
- route
- lane
- road
- vehicle
- action
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000009471 action Effects 0.000 claims abstract description 176
- 238000013439 planning Methods 0.000 claims abstract description 69
- 238000000034 method Methods 0.000 claims description 89
- 230000008569 process Effects 0.000 claims description 29
- 230000033001 locomotion Effects 0.000 claims description 26
- 238000003860 storage Methods 0.000 claims description 8
- 238000004891 communication Methods 0.000 description 80
- 230000015654 memory Effects 0.000 description 40
- 230000007704 transition Effects 0.000 description 38
- 230000006870 function Effects 0.000 description 35
- 238000010586 diagram Methods 0.000 description 16
- 238000005516 engineering process Methods 0.000 description 14
- 230000008859 change Effects 0.000 description 13
- 230000001755 vocal effect Effects 0.000 description 10
- 230000005540 biological transmission Effects 0.000 description 9
- 230000007613 environmental effect Effects 0.000 description 8
- 238000001514 detection method Methods 0.000 description 7
- 238000005457 optimization Methods 0.000 description 7
- 230000004044 response Effects 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 6
- 230000002787 reinforcement Effects 0.000 description 6
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000005352 clarification Methods 0.000 description 5
- 238000013507 mapping Methods 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- FEPMHVLSLDOMQC-UHFFFAOYSA-N virginiamycin-S1 Natural products CC1OC(=O)C(C=2C=CC=CC=2)NC(=O)C2CC(=O)CCN2C(=O)C(CC=2C=CC=CC=2)N(C)C(=O)C2CCCN2C(=O)C(CC)NC(=O)C1NC(=O)C1=NC=CC=C1O FEPMHVLSLDOMQC-UHFFFAOYSA-N 0.000 description 5
- 230000004913 activation Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000003068 static effect Effects 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 238000002485 combustion reaction Methods 0.000 description 3
- 238000005265 energy consumption Methods 0.000 description 3
- 230000009474 immediate action Effects 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 238000003825 pressing Methods 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 229910001416 lithium ion Inorganic materials 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- QELJHCBNGDEXLD-UHFFFAOYSA-N nickel zinc Chemical compound [Ni].[Zn] QELJHCBNGDEXLD-UHFFFAOYSA-N 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- HBBGRARXTFLTSG-UHFFFAOYSA-N Lithium ion Chemical compound [Li+] HBBGRARXTFLTSG-UHFFFAOYSA-N 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000003416 augmentation Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- OJIJEKBXJYRIBZ-UHFFFAOYSA-N cadmium nickel Chemical compound [Ni].[Cd] OJIJEKBXJYRIBZ-UHFFFAOYSA-N 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- LIWAQLJGPBVORC-UHFFFAOYSA-N ethylmethylamine Chemical compound CCNC LIWAQLJGPBVORC-UHFFFAOYSA-N 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 229910052987 metal hydride Inorganic materials 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 229910052759 nickel Inorganic materials 0.000 description 1
- PXHVJJICTQNCMI-UHFFFAOYSA-N nickel Substances [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 1
- -1 nickel metal hydride Chemical class 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 238000012384 transportation and delivery Methods 0.000 description 1
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W60/00—Drive control systems specially adapted for autonomous road vehicles
- B60W60/001—Planning or execution of driving tasks
- B60W60/0015—Planning or execution of driving tasks specially adapted for safety
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/26—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
- G01C21/28—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network with correlation of data from several navigational instruments
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/26—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
- G01C21/34—Route searching; Route guidance
- G01C21/36—Input/output arrangements for on-board computers
- G01C21/3602—Input other than that of destination using image analysis, e.g. detection of road signs, lanes, buildings, real preceding vehicles using a camera
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/26—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
- G01C21/34—Route searching; Route guidance
- G01C21/36—Input/output arrangements for on-board computers
- G01C21/3626—Details of the output of route guidance instructions
- G01C21/3658—Lane guidance
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/38—Electronic maps specially adapted for navigation; Updating thereof
- G01C21/3863—Structures of map data
- G01C21/387—Organisation of map data, e.g. version management or database structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
- G06V20/58—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
- G06V20/588—Recognition of the road, e.g. of lane markings; Recognition of the vehicle driving pattern in relation to the road
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W2552/00—Input parameters relating to infrastructure
- B60W2552/53—Road markings, e.g. lane marker or crosswalk
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W2556/00—Input parameters relating to data
- B60W2556/40—High definition maps
Landscapes
- Engineering & Computer Science (AREA)
- Remote Sensing (AREA)
- Radar, Positioning & Navigation (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Mechanical Engineering (AREA)
- Transportation (AREA)
- Human Computer Interaction (AREA)
- Algebra (AREA)
- Mathematical Physics (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Pure & Applied Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Mathematical Optimization (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Navigation (AREA)
- Traffic Control Systems (AREA)
Abstract
自律走行車の自動運転におけるルートプランニングは、ルートを取得するための高精細マップに加えて、標準精細マップを使用することの指示を取得することと、車両を目的地まで自動運転するために前記ルートを取得することであって、ルートは、標準精細マップの道路を含むことと、安全性決定コンポーネントからポリシーを取得することであって、ポリシーは道路の状態に対するアクションを提供し、アクションは道路に沿って自律走行車の軌道を制約することと、安全性決定コンポーネントから前記アクションを受信することと、アクションに従って道路を自律的に通行することとを含む。
Description
本開示は、一般にルートプランニングに関するものであり、より詳細には、自律走行車の車線レベルルートプランニングに関する。
ルートプランニングアプリケーション及びシステム(集合的に、ルートプランナ)は、車載車両システム又はハンドヘルドデバイスであり得る。ユーザ(例えば、運転者)は、目的地を提供し、ルーティングアプリケーションはユーザの現在位置から目的地へのルートを計算する。
ルートはマップ上にオーバレイされる場合があり、ユーザが目的地に到着するために従うことができる道路及び曲がり角を含む(例えば、示す)場合がある。つまり、ルートは、目的地への進路変更ごとの示を含み得る。通常、ルートは道路及び曲がり角を含んでおり、運転者が特定の道路のどの車線を走行するか、及び出口又は交差点での曲がり角等、いつ車線を切り替えるかを決定するのはユーザ(例えば、運転者)次第である。
従来のルートプランナは、所定の距離(例えば、2マイル)以内に曲がり角(例えば、出口)が近づいていることをユーザに警告又は通知する場合があり、現在の車線からどのように操縦して曲がるかを決定するのはユーザ次第である。このようなルートプランナは、ホスト車両がどの車線にいるかを知らず、単に所定の距離内でユーザに通知するだけで、ユーザは現在の車線から曲がり角の場所に移動するための安全でない操縦を余儀なくされる可能性がある。
このようなルートプランニングアプリケーションは、道路レベルで確定的に計画する場合があり、車線レベル情報/プランニングを考慮しない。ルートプランニングは、ルート時間を最小化しようとする古典的プランニング問題としてモデル化される場合がある。
少なくともこれらの理由から、このようなルートプランニングアプリケーションにおけるプランニングマップは、運転者がまったく関与しないか、せいぜい関与が最小限であり得る自律走行に必要なものを超えた抽象レベルにあり得るため、車線レベルではなく道路レベルルートプランニングは、自律走行には適切ではない(例えば、十分ではない)場合がある。
第1の態様は、自律走行車の自動運転におけるルートプランニングのための方法である。この方法は、ルートを取得するために高精細マップに加えて標準精細マップが使用されるべきことの指示を取得することと、車両を目的地まで自動運転するために前記ルートを取得することであって、前記ルートは、前記標準精細マップの道路を含むことと、安全性決定コンポーネントからポリシーを取得することであって、前記ポリシーは前記道路の状態に対するアクションを提供し、前記アクションは前記道路に沿って前記自律走行車の軌道を制約することと、前記安全性決定コンポーネントから前記アクションを受信することと、前記アクションに従って前記道路を自律的に通行することとを含む。
第2の態様は、自律走行車の自動運転におけるルートプランニングのための装置である。この装置は、ルートを取得するために高精細マップに加えて標準精細マップが使用されるべきことの指示を取得することと、車両を目的地まで自動運転するために前記ルートを取得することであって、前記ルートは、前記標準精細マップの道路を含むことと、安全性決定コンポーネントからポリシーを取得することであって、前記ポリシーは前記道路の状態に対するアクションを提供し、前記アクションは前記道路に沿って前記自律走行車の軌道を制約することと、前記安全性決定コンポーネントから前記アクションを受信することと、前記アクションに従って前記道路を自律的に通行するように前記自律走行車を制御することとを行うように構成されるプロセッサを含む。
第3の態様は、プロセッサによって実行されると、自律走行車の自動運転におけるルートプランニングのための動作の実行を容易にする実行可能命令を含む非一時的なコンピュータ可読記憶媒体である。この動作は、ルートを取得するために高精細地図に加えて標準精細地図を使用することの指示を取得することと、車両を目的地まで自動運転するために前記ルートを取得することであって、前記ルートは、前記標準精細マップの道路を含むことと、安全性決定コンポーネントからポリシーを取得することであって、前記ポリシーは前記道路の状態に対するアクションを提供し、前記アクションは前記道路に沿った前記自律走行車の軌道を制約することと、前記安全性決定コンポーネントから前記アクションを受信することと、前記アクションに従って前記道路を自律的に通行することとを含む。
以下では、本明細書に開示された方法、装置、プロシージャ及びアルゴリズムのこうした及び他の態様、特徴、要素、実装及び実施形態の変形がさらに詳細に記載される。
本明細書に開示された方法及び装置の様々な態様は、以下の記載及び図面において提供される例示を参照することでより明らかになるであろう。ここで同じ参照番号は同じ要素を指している。
前述のように、ルートプランナは、通常、車線情報なしでルートを提供する。このようなルートは、全地球測位システム(GPS)座標の連結グラフに基づいて計画される場合があり、あまりにも抽象的であるため、自律走行には使用できない。自律走行は、車線変更及び意思決定を行い、ルートに従うことができない障害が何らかの理由で発生した場合の偶発事象に備えて計画するために、車線固有の情報を必要とする。従来のルートプランナのマップでは、トポロジー、接続性、及び車線情報は通常利用できない。本明細書で使用される場合、自律走行は、文脈がそうでないことを示す場合を除き、人間の運転者又はテレオペレータ等による手動制御と比較すると、ホスト車両を自動的に実行するための車両走行制御を実行することを含む。
さらに、そのようなルートプランナは、典型的には、1つの目的のみについて解決し得る。それは、時間である。つまり、目的地に到達するまでにかかる時間を最小限に抑えることで、古典的なルートプランニングを実行する。一部のルートプランナでは、ユーザが道路タイプの選好(例えば、地方道路の代わりに高速道路、有料道路の代わりに無料道路)を指定できる場合がある。しかしながら、自律走行では、異なる(例えば、より多くの)基準、制約、及び/又は目的を使用してルートプランニングを行う必要がある。
単純な例を使用して説明すると、従来のルートプランナの場合、運転者が予期した曲がり角で曲がらず、出口を出ない場合、ルートプランナは、通常、代替ルートを識別するために、完了までに少なくとも数秒かかる「再ルーティング」動作を実行する。自律走行の場合、混雑のために自律走行車(AV)が出口を出られなかったと仮定すると、ルーティングアプリケーションが代替ルートを識別する(すなわち、再ルーティングする)までAVがその場で停止し、再ルーティング動作を実行している間に偶発事象ルートを通行したりすることは受け入れられない。
むしろ、本開示に従ったルートプランナは、全ての偶発事象に対して事前に計画することができる。偶発事象は、後述するようにポリシーに組み込まれ得る。一例では、偶発事象は、以前の確率を考慮して計画され得る。確率は、車線セグメント横断の履歴データに基づき得る。確率は、車線変更に成功する確率、交通に基づいて車線変更に失敗する確率、交通履歴の確率、又はその他の確率を含み得る。車線レベルルートプランナは、異なる道路又は道路セグメントでの自律走行の能力レベルに基づいてルートを計画することもできる。能力については、以下にさらに説明する。ルートプランナは、自動運転、ドライバー、および/またはテレオペレータ間の制御の移行を決定(例えば、プランニング)することもできる。車線レベルルートプランナは、確率を組み込んだナビゲーションマップを使用する。
繰り返しになるが、本開示によるルートプランナは、AVが車線変更を行うために制御されるルートに沿った場所を含む目的地への車線レベルルートを決定する。つまり、ルートプランナによって、車線変更、及び、場合によってはルートに沿った障害が計画され得る。追加的に、ルートプランナは、成功及び失敗を想定し、コスト(例えば、目的地までの時間)を最小限に抑える決定論的な計画を取得するだけではなく、ゴール(例えば、目的地)までの全ての可能なルートの偶発事象プランを有し得る。
自律走行車の現実世界での展開には、複数の目的を同時に両立させる必要があり得る。いくつかの目的は、目的地への時間、所望のユーザの快適性(例えば、でこぼこした道路対平坦な道路)、所望のユーザの道路速度、道路ナビゲーション能力(例えば、車両が道路又は車線を通行する能力を有するかどうか)、ジオフェンスエリア間の移行ポイント、及び/又は他の目的を含んでもよい。電気又はハイブリッド電気自動車の場合、追加の目的は、バッテリ効率及び/又は再充電のための停止ポイントに関連し得る。本開示による車線レベルルートプランニングは、このような多目的プランニングを実行することができる。
本開示の態様では、車線レベル情報を含むナビゲーションマップが学習され得る。その後、ナビゲーションマップを使用して車線レベルルートが生成され得る。
従来の自律走行車ルートプランナは、複数の状態特徴又は目的に関して学習しない場合がある。対照的に、本開示の実装に従った車線レベルルートプランニングにおいて、ナビゲーションマップは、道路の車線の複数の車線セグメントに関して、及び学習を介して、本明細書にさらに記載されるように、少なくともいくつかの環境情報、車両情報、人的情報、より少ない、より多い若しくは他の情報、又はそれらの組み合わせを組み込むことができる。
本明細書に記載のリスク認識多目的車線レベルルートプランニングは、自律した接続された車両の多目的空間における考慮として、各車線の確率性及び特定の明確な目的報酬値に合わせて調整されたカスタマイズされた学習が必要であり、それらが本明細書に記載されている。
多目的での学習は、少なくとも、単一目的プランナよりも自動運転をより適応させることができる車線レベルルートプランナによってより多くの懸念を考慮することができるため、単一目的学習よりも有利であり得る。複数の目的が可能な場合、車線レベルルートプランナは、良好な(例えば、所望の、快適な)ルート、交通パターン、ユーザ選好、能力等について学習することができる(又はユーザによって教えられ得る)。例えば、ユーザは、正確に対応する目的で選好を直接エンコードすることができる。
一部のルートプランナは、出口の車線数、出口が近いこと等のルートに関する一般的な情報しかユーザに通知できない。一部の他のルートプランナは、所定のルートが現在のルートよりも長いか短いかを、所定の分数又は何らかの他の測定単位で示す場合がある。しかしながら、このようなルートプランナは、通常、以下を説明することができない。すなわち、所定のルートが別のルートよりも選択された理由についての説明を提供しない。自律走行の文脈では、このようなルートプランナは、アクション(例えば、左に曲がる、右に曲がる、直進する、隣の車線セグメントに移動する等)が実行されるか、又は実行された理由を説明できない場合がある。
一部のルートプランナは、ニューラルネットワーク(例えば、深層学習ニューラルネットワーク等)として実装される場合がある。このようなルートプランナは、人間が理解できる説明を提供できない場合がある。このようなルートプランナの推論モデルは、セマンティックな意味を持たない重み及び活性化値(例えば、数百万の実数)になる。このようなルートプランナの決定(例えば、選択されたアクション)は、重み値を使用してモデルのどのノードが活性化されたかを意味する。このようなルートプランナから説明を抽出することは、たとえ可能であっても、単純ではなく、ルートプランナ自体を説明しようとする追加のシステム(例えば、入力に基づく活性化値の意味)が必要になる場合がある。そのため、ルートプランナは説明不可能なブラックボックスになる。ニューラルネットワークの特定のアクションをもたらす活性化値が出力され得るが、そのような活性化値は解釈が容易ではなく、セマンティックな意味を持たない。別の例では、アクションがルートプランナによって推奨された理由を理解するために、ソースコード及びソースコードへの入力を分析して説明を提供する必要がある場合がある。
対照的に、本開示の実装による車線レベルルートプランナは、本質的に説明可能であり得る。車線レベルルートプランナは、アクション(同等に、ルート、車線、又は車線セグメント)が選択される理由について、人間が理解できる説明を提供することができる。説明は人間が解釈できるものであり、意味論的にも意味がある。説明(例えば、文)は、自律走行の決定が行われた理由を記述し得る。例えば、「なぜ交差点を右に行かなかったか?」、「なぜ私に手動制御を要求しているのか?」等のユーザの質問に答えることができる。ルートプランニングでアクション、道路、又は車線セグメントの選択に関する説明を提供することにより、従来のルートプランナ、特に、自律走行のためのルートプランニングを改善することができる。説明を提供することは、自律走行選択の意思決定においてユーザに快適性を与えることができる。追加的に、所定の選択が行われる理由を理解することにより、ユーザは、例えば、異なる目的及びそれらの目的に対する制約を提供することによって、ルートプランニングの決定基準に影響を与え、ユーザの選好に合うように改良することができる。
さらに、本明細書に記載の車線レベルルートプランナは、セマンティックな意味を有する複数の目的に従って(例えば、使用して、基づいて)ルートを計画することができるので、車線レベルルートプランナは、所定のルートが所定の目的(交通量、選好、人間の運転能力、自動運転等)に対してどのように良いか(又は悪いか)を定量化又は説明することができる。
本開示のさらなる態様では、標準精細マップデータ(又は、単純にSDマップ)を使用してルートを計画することができ、SDマップの道路をマッピングしてHDマップ情報を取得することができる。
ルートプランナは、通常、マップデータを使用してルートを取得する(例えば、計算する)。従来のルートプランナでは、マップデータはSDマップデータであり得る。SDマップは、通常、道路、交差点等を含むが、自律走行(例えば、自律走行における意思決定)及び自動運転のためのルートプランニング(例えば、車線レベルルートプランニング)に必要な十分な詳細又は精度を含んでいない。SDマップは、(例えば、自動運転の意思決定とは対照的に)ナビゲーション用の粗いGPS座標を含む場合がある。自律走行は、高精細(HD)マップを必要とする場合がある。
HDマップデータは、数センチメートル以内の車両交通ネットワークに関する正確な情報を含んでもよい。HDマップデータは、縁石、車線境界、横断歩道、交通信号灯、道路分割器、交通信号機、交通標識、制限速度、ランドマーク等に関する詳細を含んでもよい。
HDマップは高価な場合があり、所定の道路(又は道路の車線)に関する情報を含まない場合がある。道路又はエリアはマッピングされていないと言われる場合がある。HDマップは、マッピングされていない道路及びエリアの情報を含まない。
AVは、意思決定目的又は軌道プランニングのためにHD情報を検出することができるセンサを含むが、AVは、ナビゲーション目的のためにSDマップのみを含む場合がある。SDマップは、自律走行における意思決定にも使用できるように、デフォルトでは、AVのセンサによって観測されるHD情報にローカライズされ且つ一致させることはできない。したがって、問題は、AV(すなわち、その中のモジュール)が自動運転のためのHD情報を依然として知っている必要があるということである。本開示によれば、その後のルートプランニングのためのHD情報を取得するために、SDマップの道路上で自律走行を実行することができる。
本開示の態様において、自律走行のために本明細書に記載の車線レベルルートプランニングにSDマップを使用することができるように、1つ以上の車両からのセンサデータを使用して、SDマップを情報(例えば、HD情報)で補足することができる。このように、センサデータを使用してHDマップを補足することにより、車線レベルルートプランナは、SDマップ又はHDマップ及びSDマップの組み合わせを使用してルートを取得することが可能になる。HDマップは、マッピングされた道路及び車線に使用されてもよく、SDマップは、HDマップにマッピングされていないが、本明細書に記載されているようにHD情報が取得されている道路及び車線に使用することができる。参照を容易にするために、本明細書で使用される場合、拡張HDマップは、SDマップの道路に関して1つ以上のAVのセンサを使用して取得されたデータによって補足されたHDマップを指す。追加的に、又は同等に、ナビゲーションマップは、これらの道路を通行するときに、HDマップの道路の情報で拡張することができる。
拡張HDマップには、ルートプランニング又は意思決定にHDマップが不要になることを含む多くの利点がある。例えば、AV又はAVの車両群は、SDマップの道路を通行するときに独自のHDマップを生成することができる。後述するように、HDマップの生成は、プランニング信念ベースのルートプランナを介して行われ得る。利点には、HDマップが適応可能であることも含まれる。例えば、SDマップで道路車線が再構成されている場合(工事による車線閉鎖又は新しい車線の追加等)、HDマップを変更に適応させることができる。
車線レベルルートプランニングの詳細は、本明細書では、それが実装可能な環境を最初に参照して説明する。
図1は、本明細書に開示の態様、特徴及び要素が実装され得る車両の例を示す図である。図示の実施形態では、車両100は様々な車両システムを含む。車両システムは、シャーシ110、パワートレイン120、コントローラ130、及び車輪140を含む。車両システムの追加の又は異なる組み合わせが使用されてもよい。簡潔のため、車両100は4つの車輪140を含むように示されているが、プロペラ又はトレッド等の1つ以上の任意の他の推進装置が使用されてもよい。図1において、パワートレイン120、コントローラ130及び車輪140等の要素を相互接続する線は、データ又は制御信号等の情報、電力又はトルク等の力、又は情報及び電力の両方が各要素間で伝達され得ることを示している。例えば、コントローラ130は、パワートレイン120から電力を受信して、パワートレイン120、車輪140、又はその両方と通信して、車両100を制御してもよく、これは、車両100を加速、減速、操縦又は他のやり方で制御することを含み得る。
図1の例で示されるパワートレイン120は、電源121、トランスミッション122、ステアリング装置123、及びアクチュエータ124を含む。サスペンション、駆動シャフト、車軸、又は排気システム等のパワートレインの任意の他の要素又は要素の組み合わせが含まれてもよい。別々に示されているが、車輪140は、パワートレイン120に含まれてもよい。
電源121は、エンジン、バッテリ、又はこれらの組み合わせを含む。電源121は、電気エネルギー、熱エネルギー又は運動エネルギー等のエネルギーを提供するように動作する任意のデバイス又はデバイスの組み合わせであってもよい。一例では、電源121は、内燃エンジン、電気モータ又は内燃エンジン及び電気モータの組み合わせ等のエンジンを含み、車輪140の1つ以上に原動力としての運動エネルギーを提供するように動作する。代替的に又は追加的に、電源121は、ニッケルカドミウム(NiCd)、ニッケル亜鉛(NiZn)、ニッケル水素(NiMH)、リチウムイオン(Li-ion)等の1つ以上の乾電池、太陽電池、燃料電池、又はエネルギーを提供することが可能な任意の他のデバイス等のポテンシャルエネルギー装置を含んでもよい。
トランスミッション122は、電源121から運動エネルギー等のエネルギーを受信し、原動力を提供するために車輪140にエネルギーを送る。トランスミッション122は、コントローラ130、アクチュエータ124又はその両方によって制御されてもよい。ステアリング装置123は、コントローラ130、アクチュエータ124又は両方によって制御され、車両を操縦するために車輪140を制御してもよい。アクチュエータ124は、コントローラ130から信号を受信してもよく、車両100を動作させるために電源121、トランスミッション122、ステアリング装置123又はこれらの任意の組み合わせを作動又は制御してもよい。
例示の実施形態では、コントローラ130は、位置決め装置131、電子通信装置132、プロセッサ133、メモリ134、ユーザインターフェース135、センサ136、及び電子通信インターフェース137を含む。これらの要素のうち少数が、コントローラ130の一部として存在し得る。単一の装置として示されているが、コントローラ130の任意の1つ以上の要素が任意の数の分離した物理装置に組み込まれてもよい。例えば、ユーザインターフェース135及びプロセッサ133は、第1の物理装置に組み込まれてもよく、メモリ134は、第2の物理装置に組み込まれてもよい。図1には示されていないが、コントローラ130は、バッテリ等の電源1210を含んでもよい。個別の要素として示されているが、位置決め装置131、電子通信装置132、プロセッサ133、メモリ134、ユーザインターフェース135、センサ136、電子通信インターフェース137、又はこれらの任意の組み合わせは、1つ以上の電子装置、回路又はチップに組み込まれてもよい。
プロセッサ133は、光プロセッサ、量子プロセッサ、分子プロセッサ又はこれらの組み合わせを含む現存する又は今後開発される信号又は他の情報を操作又は処理することが可能な任意のデバイス又はデバイスの組み合わせを含んでもよい。例えば、プロセッサ133は、1つ以上の専用プロセッサ、1つ以上のデジタル信号プロセッサ、1つ以上のマイクロプロセッサ、1つ以上のコントローラ、1つ以上のマイクロコントローラ、1つ以上の集積回路、1つ以上の特定用途向け集積回路、1つ以上のフィールドプログラマブルゲートアレイ、1つ以上のプログラマブルロジックアレイ、1つ以上のプログラマブルロジックコントローラ、1つ以上の状態機械、又はこれらの任意の組み合わせを含んでもよい。プロセッサ133は、位置決め装置131、メモリ134、電子通信インターフェース137、電子通信装置132、ユーザインターフェース135、センサ1360、及びパワートレイン136の1つ以上と動作可能に結合されてもよい。例えば、プロセッサは、通信バス138を介してメモリ134と動作可能に結合されてもよい。
メモリ134は、プロセッサ133によって使用される又はそれと接続される、機械可読命令又はそれに関連付けられる任意の情報を、例えば、保持、記憶、伝達又は搬送することが可能な任意の有形の非一時的なコンピュータ使用可能又はコンピュータ可読記憶媒体を含む。メモリ134は、例えば、1つ以上の半導体ドライブ、1つ以上のメモリカード、1つ以上のリムーバブル媒体、1つ以上の読み取り専用メモリ、1つ以上のランダムアクセスメモリ、ハードディスク、フロッピーディスク、光学ディスクを含む1つ以上のディスク、磁気若しくは光学カード、又は電子情報を記憶するのに適した任意のタイプの非一時的な媒体、又はこれらの任意の組み合わせであってもよい。例えば、メモリは、1つ以上の読み取り専用メモリ(ROM)、1つ以上のランダムアクセスメモリ(RAM)、1つ以上のレジスタ、低電力DDR(LPDDR)メモリ、1つ以上のキャッシュメモリ、1つ以上の半導体メモリデバイス、1つ以上の磁気媒体、1つ以上の光学媒体、1つ以上の磁気光学媒体、又はこれらの任意の組み合わせであってもよい。
通信インターフェース137は、図示のような無線アンテナ、有線通信ポート、光学通信ポート、又は有線若しくは無線電子通信媒体150とインターフェース接続することが可能な任意の他の有線若しくは無線装置であってもよい。図1は単一の通信リンクを介して通信を行う通信インターフェース137が示されているが、通信インターフェースは、複数の通信リンクを介して通信を行うように構成されてもよい。図1は単一の通信インターフェース137を示しているが、車両は、任意の数の通信インターフェースを含んでもよい。
通信装置132は、通信インターフェース137等を介して、有線又は無線電子通信媒体150を介して信号を送信又は受信するように構成される。図1に明示されていないが、通信装置132は、無線周波数(RF)、紫外線(UV)、可視光、光ファイバ、有線回線、又はこれらの組み合わせ等の任意の有線又は無線通信媒体を介して送信、受信又は両方を行うように構成されてもよい。図1は、単一の通信装置132及び単一の通信インターフェース137を示しているが、任意の数の通信装置及び任意の数の通信インターフェースが使用されてもよい。いくつかの実施形態では、通信装置132は、狭域通信(DSRC)装置、車載装置(OBU)、又はこれらの組み合わせを含む。
位置決め装置131は、車両100の経度、緯度、高度、進行方向又は速さ等の地理情報を決定してもよい。一例では、GPSは、広域補強システム(Wide Area Augmentation System;WAAS)対応米国海洋電子機器協会(National MarineElectronics Association;NMEA)装置、無線三角測量装置、又はこれらの組み合わせ等の全地球測位システム(GPS)装置を含む。位置決め装置131は、例えば、車両100の現在の向き、2次元又は3次元での車両100の現在地、車両100の現在の角度方向、又はこれらの組み合わせを表す情報を取得するために使用され得る。
ユーザインターフェース135は、仮想又は物理キーパッド、接触パッド、ディスプレイ、接触ディスプレイ、ヘッドアップディスプレイ、仮想ディスプレイ、拡張現実ディスプレイ、触覚ディスプレイ、視線追跡装置等の特徴追跡デバイス、スピーカ、マイクロホン、ビデオカメラ、センサ、プリンタ、又はこれらの任意の組み合わせ等、人物とインターフェース接続することが可能な任意の装置を含む。ユーザインターフェース135は、図示のようにプロセッサ133と、又はコントローラ130の任意の他の要素と動作可能に結合されてもよい。単一の装置として示されているが、ユーザインターフェース135は、1つ以上の物理装置を含んでもよい。例えば、ユーザインターフェース135は、人物との音声通信を行うためのオーディオインターフェース、及び人物との視覚及びタッチに基づく通信を行うためのタッチディスプレイの両方を含んでもよい。ユーザインターフェース135は、複数の物理的に分離した装置、単一の物理装置の中の複数の定義部分、又はこれらの組み合わせ等の複数のディスプレイを含んでもよい。
センサ136は、車両を制御するために使用され得る情報を提供するように動作可能である。センサ136は、センサのアレイであってもよい。センサ136は、車両動作情報を含む車両100の現在の動作特徴に関する情報を提供してもよい。センサ136は、例えば、速度センサ、加速度センサ、ステアリング角センサ、トラクション関連センサ、ブレーキ関連センサ、ハンドル位置センサ、視線追跡センサ、着座位置センサ、又は任意のセンサ若しくはセンサの組み合わせを含んでもよく、これらは車両100の現在の動的状況の何らかの態様に関する情報を報告するように動作可能である。
センサ136は、動作環境情報等の車両100を取り囲む物理環境に関する情報を取得するように動作可能な1つ以上のセンサを含んでもよい。例えば、1つ以上のセンサが、車線等の道路の形状、及び固定障害物、車両及び歩行者等の障害物を検出してもよい。センサ136は、既知の又は後に開発される、1つ以上のビデオカメラ、レーザ感知システム、赤外線感知システム、音響感知システム、又は任意の他の適切なタイプの車載環境感知デバイス、又はデバイスの組み合わせであるか、又はこれらを含み得る。いくつかの実施形態では、センサ136及び位置決め装置131が結合される。
別に示されてはいないが、車両100は、軌道コントローラを含んでもよい。例えば、コントローラ130が、軌道コントローラを含んでもよい。軌道コントローラは、車両100の現在の状態及び車両100に対して計画されたルートを記述する情報を取得し、この情報に基づいて、車両100に対する軌道を決定及び最適化するように動作可能であってもよい。いくつかの実施形態では、軌道コントローラは、車両100が軌道コントローラによって決定される軌道に従うように、車両100を制御するように動作可能な信号を出力してもよい。例えば、軌道コントローラの出力は、パワートレイン120、車輪140又はその両方に供給され得る最適化された軌道であり得る。いくつかの実施形態において、最適化された軌道は、一組のステアリング角等の制御入力であってもよく、各ステアリング角は1つの時点又は位置に対応する。いくつかの実施形態において、最適化された軌道は、1つ以上の経路、線、曲線、又はこれらの組み合わせであり得る。
1つ以上の車輪140は、ステアリング装置123の制御下でステアリング角に枢動される操縦車輪、トランスミッション122の制御下で車両100を推進するためのトルクを与えられる推進車輪、又は車両100を操縦及び推進し得る操縦及び推進車輪であってもよい。
図1には示されていないが、車両は、エンクロージャ、ブルートゥース(登録商標)モジュール、周波数変調(FM)ラジオ装置、近距離無線通信(NFC)モジュール、液晶表示(LCD)ディスプレイ装置、有機発光ダイオード(OLED)ディスプレイ装置、スピーカ、又はこれらの任意の組み合わせ等の図1に示されていない追加の装置又は要素を含んでもよい。
車両100は、交通網の一部を移動するように、直接的な人間の介入なしで、自律的に制御される自律走行車であってもよい。図1に別に示されていないが、自律走行車は、自律走行車のルーティング、ナビゲーション及び制御を行う自律走行車制御装置を含んでもよい。自律走行車制御装置は、車両の別の装置と一体化されてもよい。例えば、コントローラ130は、自律走行車制御装置を含んでもよい。
存在する場合、自律走行車制御装置は、現在の車両動作パラメータに従って車両交通網の一部を移動するように車両100を制御し又は動作させてもよい。自律走行車制御装置は、車両の駐車等の定義された動作又は操縦を行うように車両100を制御し又は動作させてもよい。自律走行車制御装置は、車両情報、環境情報、車両交通ネットワークを表す車両交通ネットワーク情報、又はこれらの組み合わせに基づいて車両100の現在地等の出発地から目的地への移動ルートを生成してもよく、ルートに従って車両交通ネットワークを移動するように車両100を制御し又は動作させてもよい。例えば、自律走行車制御装置は、軌道コントローラに移動ルートを出力して、生成されたルートを使用して出発点から目的地に移動するように車両100を動作させてもよい。
図2は、本明細書に開示の態様、特徴及び要素が実装され得る車両交通及び通信システムの一部の例示の図である。車両交通及び通信システム200は、図1に示される車両100等の1つ以上の車両210/211を含んでもよく、これは車両交通ネットワーク220の1つ以上の部分を介して移動してもよく、1つ以上の電子通信ネットワーク230を介して通信を行う。図2には明示されていないが、車両はオフロードエリアを通行してもよい。
電子通信ネットワーク230は、例えば、車両210/211と1つ以上の通信デバイス240との間の音声通信、データ通信、映像通信、メッセージング通信、又はこれらの組み合わせ等の通信を提供する多重アクセスシステムであってもよい。例えば、車両210/211は、ネットワーク230を介して通信デバイス240から車両交通ネットワーク220を表す情報等の情報を受信してもよい。
いくつかの実施形態では、車両210/211は、有線通信リンク(図示せず)、無線通信リンク231/232/237、又は任意の数の有線若しくは無線通信リンクの組み合わせを介して通信してもよい。図示のように、車両211/211は、陸上無線通信リンク231を介して、非陸上無線通信リンク232を介して、又はこれらの組み合わせを介して通信する。陸上無線通信リンク231は、イーサネット(登録商標)リンク、シリアルリンク、ブルートゥース(登録商標)リンク、赤外線(IR)リンク、紫外線(UV)リンク、又は電子通信を提供可能な任意のリンクを含んでもよい。
車両210/211は、別の車両210/211と通信してもよい。例えば、ホスト又は対象の車両210が、直接通信リンク237を介して又はネットワーク230を介して、遠隔又はターゲット車両(RV)211から基本安全メッセージ(basic safety message;BSM)等の1つ以上の自律走行車間メッセージを受信してもよい。リモート車両211は、300メートル等の定義されたブロードキャスト範囲内のホスト車両にメッセージをブロードキャストしてもよい。いくつかの実施形態では、ホスト車両210は、信号リピータ(図示せず)又は別のリモート車両(図示せず)等のサードパーティを介してメッセージを受信してもよい。車両210/211は、例えば、100ミリ秒等の定義された間隔に基づいて周期的に1つ以上の自動車両間メッセージを送信してもよい。
自動車両間メッセージは、車両識別情報、経度、緯度若しくは高度情報等の地理空間状態情報、地理空間位置精度情報、車両加速度情報、ヨーレート情報、速度情報、車両方位情報、制動システム状態情報、スロットル情報、ハンドル角度情報若しくは車両ルーティング情報等の運動状態情報、又は送信車両状態に関連する車両サイズ情報、ヘッドライト状態情報、方向指示器情報、ワイパー状態情報、トランスミッション情報若しくは任意の他の情報若しくは情報の組み合わせ等の車両動作状態情報を含んでもよい。例えば、トランスミッション状態情報は、送信車両のトランスミッションがニュートラル状態、駐車状態、前進状態又は後退状態に有るかどうかを示してもよい。
車両210は、アクセスポイント233を介して通信ネットワーク230と通信してもよい。コンピュータ装置を含み得るアクセスポイント233は、無線又は有線通信リンク231/234を介して、車両210と、通信ネットワーク230と、1つ以上の通信デバイス240と、又はこれらの組み合わせと通信するように構成される。例えば、アクセスポイント233は、基地局、BTS(base transceiver station)、Node-B、eNode-B(enhanced Node-B)、HNode-B(Home Node-B)、無線ルータ、有線ルータ、ハブ、リレー、スイッチ、又は任意の類似の有線若しくは無線デバイスであってもよい。ここでは単一の装置として示されているが、アクセスポイントは、任意の数の相互接続要素を含んでもよい。
車両210は、衛星235又は他の非陸上通信デバイスを介して通信ネットワーク230と通信してもよい。コンピュータデバイスを含み得る衛星235は、1つ以上の通信リンク232/236を介して、車両210と、通信ネットワーク230と、1つ以上の通信デバイス240と、又はこれらの組み合わせと通信するように構成される。ここでは単一の装置として示されているが、衛星は、任意の数の相互接続要素を含んでもよい。
電子通信ネットワーク230は、音声、データ、又は任意の他のタイプの電子通信を提供するように構成される任意のタイプのネットワークである。例えば、電子通信ネットワーク230は、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、仮想プライベートネットワーク(VPN)、モバイル若しくはセルラ電話ネットワーク、インターネット、又は任意の他の電子通信システムを含んでもよい。電子通信ネットワーク230は、トランスミッションコントロールプロトコル(TCP)、ユーザデータグラムプロトコル(UDP)、インターネットプロトコル(IP)、リアルタイムトランスポートプロトコル(RTP)、ハイパーテキストトランスポートプロトコル(HTTP)、又はこれらの組み合わせ等の通信プロトコルを使用する。ここでは単一の装置として示されているが、電子通信ネットワークは、任意の数の相互接続要素を含んでもよい。
車両210は、車両交通網220の一部又は状態を識別してもよい。例えば、車両は、速度センサ、車輪速度センサ、カメラ、ジャイロスコープ、光学センサ、レーザセンサ、レーダセンサ、音響センサ、又は車両交通ネットワーク220の一部若しくは状態を決定若しくは識別することが可能な任意の他のセンサ若しくは装置又はこれらの組み合わせであってもよく又はそれを含み得る図1に示されたセンサ136等の少なくとも1つの車載センサ209を含む。
車両210は、交通ネットワーク220を表す情報、1つ以上の車載センサ209、又はこれらの組み合わせ等のネットワーク230を介して伝達される情報を使用して、車両交通ネットワーク220の一部又は複数の部分を通行してもよい。
簡潔のため、図2には1つの1つの車両交通ネットワーク220、1つの電子通信ネットワーク230及び1つの通信デバイス240が示されているが、任意の数のネットワーク又は通信デバイスが使用されてもよい。車両交通及び通信システム200は、図2に示されていないデバイス、装置又は要素を含んでもよい。車両210は単一の装置として示されているが、車両は、任意の数の相互接続要素を含んでもよい。
ネットワーク230を介して通信デバイス240と通信する車両210が示されているが、車両210は、任意の数の直接又は間接通信リンクを介して通信デバイス240と通信してもよい。例えば、車両210は、ブルートゥース(登録商標)通信リンク等の直接通信リンクを介して通信デバイス240と通信してもよい。
図3は、本開示の実施形態によるルートプランニングのための技術の一例を示すフローチャート図である。技術300は、図1に示された車両100、図2に示された車両210/211のうちの1つ、半自律走行車、運転支援機能を含み得る任意の他の車両、又は運転者等によって手動で制御される車両であり得るホスト車両において部分的又は完全に実装され得る。技術300は、図1のメモリ134等のメモリに記憶される命令(例えば、動作)として実装され得る。命令は、図1のプロセッサ133等のプロセッサによって実行され得る。技術300は、専用のハードウェア又はファームウェアを使用して実装され得る。複数のプロセッサ、メモリ、又はその両方が使用されてもよい。
技術300は、車線レベルルートプランナによって部分的又は完全に実装され得る。車線レベルプランナは、図1等に関して説明されたCPU(中央処理装置)、メモリ、及び入出力装置を含むプロセッサを使用して実装され得る。プロセッサを車線レベルルートプランナとして機能させるコンピュータプログラムは、プロセッサにインストールされ且つ実行され得る。これにより、プロセッサを車線レベルルートプランナとして機能させることが可能になる。なお、ここではソフトウェアによって車線レベルルートプランナが実装される例を説明するが、当然のことながら、ここで説明する各情報処理を実行するために用意された専用のハードウェアによっても車線レベルルートプランナは実装され得る。
ステップ302において、技術300は目的地を受信する。一例では、ユーザ(例えば、運転者)は、ルーティングアプリケーションのユーザインターフェースを介して目的地を提供することができる。一例では、ユーザは、ユーザのポータブルデバイス上で実行され得るルーティングアプリケーションに目的地を提供することができる。別の例では、車両は、サービス(例えば、ロボタクシーサービス)を実行しており、目的地は、配車プロセスを介して技術300に提供されてもよく、これにより、車両は、顧客又は荷物のピックアップ場所又は顧客又は荷物のドロップオフ場所であり得る目的地に移動する。技術300に目的地を提供する他のやり方も可能である。目的地は、住所、ランドマーク、会場、又は他の目的地タイプであってもよい。技術300は、受信した目的地をGPS座標の集合に変換することができる。
ステップ304において、技術300は、マップ(すなわち、ナビゲーションマップ又は車線レベルナビゲーションマップ)を使用して目的地への車線レベルルートを取得する。車線レベルルートは、道路の第1の車線の第1のセグメントから道路の第2の車線の第2のセグメントへの遷移(すなわち、遷移のためのアクション)を含む。一例では、目的地は、車線レベルルートを計算する図2の通信デバイス240等のサーバ(例えば、クラウド型のサーバ)に(無線で)送信されて提供されてもよい。図4に関して、マップ及び車線レベルルートの一例を説明する。
図4は、本開示の実装によるマップの一例を示す図である。マップ400は、目的地が車線セグメント401にあることを示す。マップ400は、3つの車線、車線404A~404Cを含む道路402を含む。マップ400の車線は、車線セグメントに分割される。車線セグメントは、マップ400の番号付きセグメントによって示される。例えば、車線404Aは、車線セグメント406A~406Cを含む。車両403は、現在、車線セグメント406Aにあり、車線セグメント401の目的地に向かっている。車線セグメント406Aは、車両403の出発点(図示せず)と目的地との間の中間車線セグメントであってもよい。
一例では、全ての道路セグメントは、同じ長さ(例えば、100メートル、200メートル、又はその他のセグメント長)を有し得る。一例では、車線セグメントの長さの少なくとも一部は、車線セグメントの道路に沿った速度に依存し得る。例えば、高速では、車線セグメントは、500メートル等のより長い長さを有してもよい。一例では、一部の車線セグメントの長さは調整され得る。つまり、例えば、第1の車線レベルルートを生成する場合、第1の車線レベルルートは、第1の長さを有する車線セグメントの一部により生成されてもよく、第2の車線レベルルートを生成する場合、第2の車線レベルルートは、第2の長さを有する車線セグメントの一部により生成されてもよい。車線セグメントの長さは、道路における速度、時刻(例えば、ラッシュアワー対週末)、社会地理的領域(例えば、スクールゾーン、住宅街)、天候(例えば、晴れ対雪)、道路タイプ(例えば、高速道路対市街地道路)、より多い、より少ない、その他の基準、又はそれらの組み合わせに基づいて変更され得る。例えば、視覚的に示されているように、車線セグメント406Eは、車線セグメント406Cよりも短い。しかし、車線セグメント406Dは、車線セグメント406Cよりも長い。
マップ400において、車線セグメントは、識別番号(ID)を有し得る。例えば、車線セグメント406A~406Eは、それぞれID1、2、3、7、13を有する。車線セグメントの少なくとも一部は、メタデータに関連付けられ得る。一例では、メタデータには、1つ以上の分類(例えば、指定)が含まれ得る。例えば、マップ400は、(異なる陰影を使用して)IDが1、2、及び3の車線セグメントが高速セグメントであることを示し、IDが4、5、6、7、及び11の車線セグメントが標準速度(例えば、速度制限)セグメントであることを示し、IDが8、9、及び10の車線セグメントが快適(例えば、低速)セグメントであることを示し、IDが12、13、及び15の車線セグメントが市街地車線セグメントであることを示し、IDが14、16、及び17の車線セグメントが手動運転の車線セグメントであることを示している。これらの分類は、必ずしも相互に排他的ではない。例えば、市街地車線セグメントは手動運転車線セグメントであり得る。
快適性車線セグメントとは、車線セグメントの道路上の制限速度の-10マイル/時間(又はその他の閾値速度)以内の速度で交通が移動し得る車線セグメントであってもよい。手動運転車線セグメントとは、自律的に通行できない、又は十分な信頼度で自律的に通行できない車線セグメントである。このような車線セグメントは、運転者又はテレオペレータ等の手動運転制御の下で通行する必要がある。そのため、車線レベルルートプランナは、車線セグメントの一定時間前に、ユーザが車両の手動運転制御を引き継ぐ必要があることをユーザ(例えば、運転者)に通知するアクションを含んでもよい。
一例では、車線レベルルートを取得することは、起点位置から目的地まで車線セグメントを通行するためのポリシーを取得することを含んでもよい。ポリシーには、車線遷移が含まれる。より正確には、後述するように、ポリシーは、車両が現在の車線セグメント内にあることを考慮したアクションを提供する。一例では、ポリシーは確定的なポリシーであり得る。別の例では、ポリシーは確率モデルに基づき得る。
ルートプランニングでは、目的地への時間を最小化することがルートプランナの通常の目的であるが、本開示に従った車線レベルルートプランナは、以下にさらに説明するように、いくつかの目的のために最適化することによって車線レベルルートを取得することができる。
車線レベルルートは、マルコフ決定過程(MDP)モデルのタイプを使用して取得され得る。車線レベルルートプランニングは、トポロジカル部分観測マルコフ決定過程(TPOMDP)又はその完全に観測可能なサブクラスのトポロジカルマルコフ決定過程(TMDP)としてモデル化され得る。TPOMDP及びTMDPは、安全性、円滑性、及び/又は他の人の選好を最大化する等の追加的な目的尺度を、移動時間又は移動距離の最小化等、典型的な部分観測マルコフ決定過程モデル(POMDP)又はマルコフ決定過程(MDP)の目的に組み込むことを可能にする。TPOMDPモデルを解くことは、TMDPモデルを解くことに似ている場合があるが、TPOMDPが信念状態(すなわち、確率)に基づいており、それぞれの状態の確率を表し、それぞれの状態の観測値の生成に対応する観測確率に従うという点が異なる。他のモデルタイプも可能である。例えば、モデルはスカラー化された多目的マルコフ決定過程(MOMDP)、スカラー化された部分観測多目的マルコフ決定過程(MOPOMDP)、制約付きマルコフ決定過程(CMDP)、又は制約付き部分観測マルコフ決定過程(CPOMDP)のいずれかであり得る。
一般性を失わずに説明するために、ユーザは低速車線の選好を示してもよい。そのため、ルートプランナはどのように目的地に到達するかの計算に「快適性」の目的を組み込むことができる。別の例では、ユーザは、追加的に又は代替的に、エネルギー消費を最小限に抑える車線の選好を示し得る。例えば、一部の車線セグメントにおける交通がノロノロ運転であり、より多くのエネルギー消費を必要とする傾向がある場合、ルートプランナは他の道路セグメントを優先してもよい。別の例として、上り坂下り坂の多い道路はエネルギー消費が多くなる傾向があるため、ルートプランナによってそのような道路よりも円滑な道路が優先される。別の例として、充電ステーションが少ない別の道路よりも、充電ステーションが多い道路が優先されてもよい。
一般性を失わずに、モデル(例えば、TMDP又はTPOMDP)を確率的最短経路(SSP)構造用語(例えば、報酬の代わりにコスト、及び到着時に自己ループするターゲット状態としての目標)で記述され得る。
連結グラフ(V、E、R)は、タプル<S,A,T,C,E,δ,s0,sg>で表されるモデルに変換され得る。各頂点v∈Vは、ルーティング決定が行われ得る点のGPS座標であり得る。そのため、頂点は、交差点、(例えば、ID9の車線セグメントからID11の車線セグメントへの)車線変更位置、合流点等のGPS座標であり得る。説明するために、マップ400では、頂点vは、車線セグメントの特定の点の座標であり得る。例えば、特定の点は、車線セグメントの中点であり得る。連結グラフの各エッジe∈Eは、長さ又は通行時間R(e)の頂点の有向グラフを記述し得る。例えば、マップ400の下にある連結グラフでは、ID9の車線セグメントに対応する頂点は、ID10及び11の車線セグメントに接続される。
次に、形式モデルTMDPの概要を示す。前述のように、このモデルは形式的にタプル<S,A,T,C,E,δ,s0,sg>として記述され得る。Sは、状態又は頂点v∈Vの有限集合であり得る。Aは、後続車線セグメント(言い換えれば、後続の頂点)を選択するための各頂点におけるアクション空間である。一般性を損なわずに説明するために、アクション空間Aには、「左に移動する」、「右に移動する」、「真っすぐ移動する」、又は「斜めに移動する」というアクションを含み得る。しかしながら、より多い、より少ない、他のアクション、又はそれらの組み合わせも可能である。例えば、アクション空間Aは、手動制御を引き継ぐようにユーザに通知するアクション、手動制御に切り替えるアクション、制御が自動制御に切り替わることをユーザに通知するアクション、自動制御に切り替えるアクション等を含み得る。
s0は初期状態であり、これはルートプランナが車線レベルルートを計算するときの車両の現在位置であり得る。sgは目標状態であり、これは目的地であり得る。目標状態sgに達すると、どのアクションが実行されても目標状態が維持され、目標状態sgで実行される全てのアクションは0のコストを有する。
T(つまり、T:S×A×S→[0,1])は、状態s∈Sでアクションa∈Aを実行した後に後続の状態s’∈Sが発生する確率を表す状態遷移関数であり得る。したがって、Tは、各アクションの確率的な成功/失敗を記述する状態遷移関数である。状態遷移関数T(s,a,s’)=Pr(s’|s,a)は、アクションaが状態sで実行されたことを考慮した後続(車線セグメント又は頂点)の確率s’である。一例では、状態遷移関数は、頂点(例えば、車線セグメント)の隣接する頂点(例えば、車線セグメント)の少なくともいくつか(例えば、それぞれ)の各確率を含んでもよい。説明のため、ID1(すなわち、車線セグメント406A)の車線セグメントに関して、状態遷移関数Tは、ID1の車線セグメントからID4の車線セグメントへの遷移、ID1の車線セグメントからID2の車線セグメントへの遷移、及び/又はID1の車線セグメントからID5の車線セグメントへの遷移のいくつかについて各遷移確率を含んでもよい。いくつかの例では、状態遷移関数は、より離れた近隣へ(例えば、ID1の車線セグメントからID3の車線セグメントへ)の遷移確率を含んでもよい。
そのため、マップを使用して目的地への車線レベルルートを取得することは、AVがマップの第1の車線セグメント上にある場合に、第1の車線セグメントに隣接する第2の車線セグメントに移動するようにAVを制御するアクションを提供するポリシーを取得することを含んでもよい。
確率は、速度制限、エッジeの車線長、AVの仕様、時刻及び場所、交通渋滞情報、より多くの基準、より少ない基準、他の基準、又はそれらの組み合わせを含む基準に基づいて導出され得る。一例では、これらの確率(及び/又は遷移確率を取得するために使用される基準)は、以下でさらに説明するように学習され得る。
目的は、有向非巡回グラフ(DAG)Eに続く選好順位付けで配置され得る。図5を用いて選好順位付けグラフの例を説明する。各目的は非負のスラックδを有し得る。δ :e → R+は、ユーザが他の目的の価値を向上させるために、ある目的の価値にどれだけ「費やす」意思があるかを記述する。このように、1つ以上の目的は、スラック変数を含む選好順位付けで関連付けられる。
モデルに対する解は、ポリシーπ:S→Aであってもよい。ポリシーπの下では、アクションa(すなわち、π(s))が状態sに対して選択される。つまり、ポリシーπは、状態sでアクションπ(s)∈Aを実行する必要があることを示し得る。ポリシーπは、ポリシーπに従って状態sから目的地(すなわち、目標状態sg)に到達するために期待される累積コストVπ(s)を表し得る価値関数Vπ:S→Cを含んでもよい。つまり、価値関数は、開始状態から目標状態に達するまでの各中間状態si,の期待されるコスト(すなわち、価値)を提供し得る。
式(1)において、St及びAtは、時間ステップtにおける状態及びアクションのランダム変数をそれぞれ表す。一般に、モデルを解くには、適切なポリシーが存在する必要がある。適切なポリシーπは、次の特性を有する。(1)確率1で目標に到達するポリシーが存在し、(2)確率1で目標に到達しない全ての状態は無限のコストをもたらす。
図3のステップ306において、技術300は、車線レベルルートを通行するようにAVを制御する。図4に戻り、図4の矢印は、決定されたポリシーπの下でのアクションを示す。矢印408Aは、「状態がID1の車線セグメントと等しい場合に、右のアクションを実行し、その結果、車両はID4の車線セグメントと等しい状態で終了する」というアクションを示す。この場合の「アクションを実行する」とは、アクセルペダルの動作量、ブレーキペダルの動作量、ハンドルのステアリング角等の変更により、「車両が制御される」ことを意味する。
決定されたポリシーπには、偶発事象に備えたルートが組み込まれている(例えば、含まれる)。したがって、得られた車線レベルルートには偶発事象に備えたルートが含まれる。説明のため、車両がID9の車線セグメント内にある場合、ポリシーは車両がID11の車線セグメントに移動するように制御されることを示す。しかしながら、車両がID11の車線セグメントを取ることができず、ID10の車線セグメントに入ってしまった場合、ポリシーは車両をID6の車線セグメントに移動させ、且つID7の車線セグメントに移動させる「左のアクションを実行する」を示す。したがって、車線レベルルートを通行するようにAVを制御することは、第1のセグメントから第2のセグメントに遷移できないことに応答して、偶発事象ルートに従ってAVを制御することを含んでもよい。
図5は、本開示の実装に従った目的の選好順位付けグラフの例500を示す。上述したように、モデルの目的はトポロジカルに順序付けすることであってもよい。トポロジカルに順序付けされた制約は、先行目的に対して最初の信念又は全ての信念のスラックを満たさせ得る。車線レベルルートプランナは、トポロジカルに順序付けされた制約グラフで順序付けされたポリシーを計算するために、目的について推論することができる。3つの異なる選好順位が記述されているが、本開示はそれに限定されず、他の構成(すなわち、選好順位)も可能である。
例500に示される目的は、速度の最適化(すなわち、目的512,538及び556等のHとラベルされたバブル)、快適性の最適化(すなわち、目的514,534及び554等のCとラベルされたバブル)、市街地運転の最適化(すなわち、目的516,532及び552等のUとラベルされたバブル)、及び手動運転の最適化(すなわち、目的518,536及び558等のMとラベルされたバブル)に関連する。例示された目的は例であり、他の目的も可能である。さらに、例示された選好順位付けグラフは非限定的な例であり、同じ又は異なる目的及びトポロジーを含む他の選好順位付けグラフも可能である。これらの目的のそれぞれは、人間にとって有意であり得るそれぞれの意味ラベルに関連付けられる。本明細書でさらに説明するように、ユーザは、意味ラベルを使用して、車線レベルルートプランナのためのルート選好を示すことができる。
例510は、連鎖選好順位付けグラフの例である。例510の選好順位付けグラフを使用する場合(すなわち、目的が連鎖的に関連している場合)、第1の高速目的が最大化され(すなわち、目的512)、次に、快適性目的(すなわち、目的514)は、それが高速目的のスラック513(例えば、3のスラック)内であれば最大化され、次に、市街地目的(すなわち、目的516)は、快適性目的のスラック515(例えば、1のスラック)内であれば最大化され、これはそれが最初の目的のスラック513内であることを保証するためにすでに制約されており、最後に、手動走行目的(すなわち、目的518)は、すでに制約されている市街地目的のスラック517(例えば、7のスラック)以内であれば最大化される。
例510は、車線レベルルートプランナが高速道路(すなわち、目的512)を好むが、ルートプランナがより快適な別の代替ルート(すなわち、目的514)を選択するために、3分の余分な時間(すなわち、スラック513)を許容すると解釈されてもよく(例えば、理解され得る)、この代替ルートも快適性目的を最大化する。そのため、ユーザは、「可能な限り最速の道路を与えてもらうが、より快適な車線を運転するために、最速よりも3分長いルートを許可する」を本質的に示す入力を提供(例えば、コマンドを発行)してもよい。また、例510の他の目的についても同様である。スラック変数の測定単位は、それが制約する目的の測定単位と同じであることに注意すべきである。
以下でさらに説明するように、ユーザは、ルートプランナがグラフィカルユーザインタフェース(例えば、ドラッグアンドドロップインターフェース、リスト等)を介して、又はユーザが選好を提供するための他のやり方を介して、選好順位付けグラフに変換し得る口頭コマンドを使用して、目的の選好を指定することができる。
例530は、扇形の選好順位付けグラフの一例である。例530の選好順位付けグラフが使用される場合(つまり、目的がこのような扇形のような関係を持っている場合)、最適ポリシーは、市街地目的(すなわち、目的532)、快適性目的(すなわち、目的534)、及び手動運転目的(すなわち、目的536)に対して同時に計算される。次に、3つの最初の目的のスラック533,535及び537(すなわち、それぞれスラック値5、9、及び2)を条件として、高速目的(すなわち、目的538)を最大化する最終ポリシーが決定される。これは、最初の3つの目的のポリシー集合の交点を取得し、最後の目的のためにその空間を検索することと等価である。
例550は、例510及び530を混合した有向グラフの一例である。
各目的(例えば、例500のバブル)に対して、車線レベルルートプランナは、その目的を満たすルートの集合を取得する。例えば、目的552に関して、車線レベルルートプランナは、最適ルート(例えば、できるだけ多くの市街地車線で目的地に到達するための最小ルート)を識別する。目標に到達するために、1分間のスラック(すなわち、スラック553)が許容される。そのため、ルートプランナは、目標到達の周囲で可能性のエンベロープを提供すると考えることができる。つまり、ルートプランナは、最も最適な時間の1分以内にある全てのルート、及びそれらが市街地道路上にあるかどうかを識別することができる。したがって、スラック553内で目的552を満たすルートの最初の集合が返される。
ルートの第2の集合は、目的554(すなわち、快適とマークされた車線を走行すること)を満たし、最も快適なルートの6分(すなわち、スラック555)以内である。同様に、9分(すなわち、スラック557)以内に手動運転目的を満たす第3のルートの集合も得られ、以下同様である。取得されたルートの全ての集合は目的556に渡され、このシンク目的から取得されたルートは、取得されたルートの全ての集合に入っている必要がる。状況によっては、全ての制約及びスラックを満たすルートは不可能な場合がある。
例500のバブルへの入力矢印は、その目的が与えられたルートの集合(又は、選好順位付けグラフの構成に応じて、複数の集合)内にあるようにその目的を制約すると考えることができることに留意されたい。したがって、親矢印がない(つまり、入力矢印がない)場合、任意のスラック(存在する場合)内で目的を満たす任意のルートがルートプランナによって選択され得る。一方、選択された(複数の)ルートは、親の目的によって提供されたルート内に入っている必要がある。そのため、下流の目的は、提供された(例えば、入力の)ルートの(複数の)集合のプルーニングと考えることができる。
一例では、選好順位付けグラフの代わりに、スカラー化関数を使用して、全ての報酬(例えば、コスト)を単一の値にマッピング(例えば、結合等)することができる。スカラー化関数を使用して、モデル/問題を最短経路最適化問題(SSP)MDP又はPOMDPに変換することができる。スカラー化関数を使用して、次の即時アクションの長期的な有用性を示す単一の値が取得されてもよく、これは単一の値を取得するために期待されるコストを結合する。形式的には、スカラー化関数f:C→Rは、単一の値に関してf(V(s))=Vf(s)であり、コスト関数に関してf(C(s))=Cf(s)であるようなものであってもよい。一例では、スカラー化関数は、目的の加重和又は目的の非線形関数であってもよい。所望の最適化に応じて、異なる重みが使用されてもよい。一例では、車線レベルルートプランニングは、確率を除去することによって、古典的プランニング(CP)問題としてモデル化され得る。
使用するモデルに関係なく、車線レベルルートプランニングは階層的であってもよい。理解できるように、可能な車線の数が多いほど、仮にあった場合に、ポリシーの計算に時間がかかる可能性がある。車線レベルルートプランナが推論する車線セグメントの数を制限するために、車線レベルルートプランニングは階層的なやり方で実行され得る。例えば、フロリダ州マイアミの出発地及びアラスカ州フェアバンクスの目的地の場合、車線レベルルートプランナは、米国の道路をクラスタにグループ化し、クラスタ間の車線レベルルートを計画してから、ルートの各クラスタ内でルートレベルプランニングを実行してもよい。
一例では、前述のように、車線レベルルートプランニングは、トポロジカル部分観測MDP(TPOMDP)としてモデル化され、例えば、(1)各州の交通レベル、(2)運転者及び/又は車両のうちの少なくとも1つの能力、及び/又は(3)様々な目的コストに対する信念を可能にしてもよい。
より形式的には、TPOMDPはタプル<S,A,Ω,T,O,R,E,δ>として記述され得る。
Sは有限の状態集合である。Aは有限のアクション集合である。Ωは有限の観測集合である。Tは状態遷移関数であり、T(s,a,s’)=Pr(s’|s,a)は、アクションaが状態sで実行されたことを考慮した後続状態s’の確率である。Oは観測関数であり、O(a,s’,ω)=Pr(w|a,s’)は、アクションaが実行された結果、後続状態s'になったことを考慮した観測確率ωである。
Rは報酬関数のベクトルであり、これは前述のコストベクトルCと等価であり得る。前述のように、Eはk個の報酬(例えば、コスト)に対するエッジの集合であり、一般性を失うことなく、報酬頂点kである1つのリーフ(すなわち、シンク)の報酬頂点を有する有向非巡回グラフを形成する。δは、エッジe=<i,j>∈Eを非負のスラック制約δ(e)≧0又は同等にδ(i,j)≧0にマッピングする関数である。
TPOMDPは、世界の信念b∈B⊆Δ|S|に対して動作し、ここで、Δ|S|は状態Sに対する確率分布であり、且つ標準|S|-simplexとしてである。信念bは、状態に対する確率分布である。信念は、全ての時間ステップ、及び全ての前方、後方、後続、先行等の車線セグメントに存在し得る。信念bの場合、アクションaを実行して観察ωを行った後で、状態s’に対する次の信念bbaωは、
であり、ここで、∝は比例を意味する。
前述のように、TMDPはΩ=S及びO(a,s,s’)=1であるTPOMDPのサブクラスであり、到達可能な信念b∈Bは全てのs∈Sに対してb(s)=1である。
無限区間TPOMDPの目的は、割引係数γ∈[0,1)の初期信念b0から期待される割引報酬を最大化しようとすることである。ポリシーπの場合、期待される割引報酬は、
によって与えられてもよく、btは、遷移関数T及び観測関数Oに続いて生成された時間tの信念に対する確率変数を表し、これはアクションaが実行された結果として後続状態s’となったことを考慮した特定の観測の確率である。
式(3)において、R(b,a)=Σsb(s)R(s,a)及びbbπ(b)ω’は式(2)の信念の更新に従う。
ここで述べたように、車線レベルルートプランナは、ナビゲーションマップを使用してポリシーを取得する。一例では、ナビゲーションマップは学習され得る。ここで使用される場合、学習されるとは、ナビゲーションマップが進化され得ることを含む。ナビゲーションマップは、事前に設定された車線情報を含んでもよく、車線レベル情報が1つ以上の車両から取得されると、事前に設定された車線情報は、取得された車線レベル情報を反映する(例えば、組み込む)ように進化させることができる。ナビゲーションマップは、最初に車線レベル情報を含まなくてもよく、車線レベル情報は、1つ以上の車両から受信した車線レベル情報に基づいて構築(例えば、投入)され得る。
車線レベル情報は、継続的に受信されてもよく、新たに受信した車線レベル情報を使用してナビゲーションマップが定期的に更新されてもよい。ナビゲーションマップは、(例えば、特定の車両に配備される)特定の車両のナビゲーションマップであってもよく、ナビゲーションマップは、車両自身からの車線レベル情報に基づいて更新され得る。
追加的に又は代替的に、ナビゲーションマップは、多くの車両から(サーバ等において)受信した車線レベル情報に基づいて学習され得る。車線レベル情報はサーバと共にあってもよく、これはクラウド型のサーバであり得る。そのため、複数の車両は、その後、(実際に道路を走行する前に)時間に関する正確な初期推定、(新しいエリアの)人気のあるルートに関する選好、及び(同じコード/ハードウェアを共有する車両の)車両軍が通行するルートを計画しているべき場所に関する能力情報を受信し得る。
車線レベル情報は、多くの車両から取得されてもよい。特定の顧客が所有する車両は、車線レベル情報を生成し得る。(タクシーサービス、デリバリーサービス、その他のサービス等を提供する)展開された車両群は、車線レベル情報を生成し得る。車両からの車線レベル情報は、車両のセンサから受信したデータを使用して生成され得る。一例では、生センサデータがサーバに送信され、サーバは、生センサデータを使用して車線レベル情報を生成し得る。
このように、ナビゲーションマップは、異なる車線及び異なる道路の異なる車線セグメントについて学習された過去の走行パターン及び特性を含み得る。過去の走行パターンは、特定の車両、特定の車両の特定の運転者、又は複数の車両の集約された学習された履歴走行パターンのいずれかであり得る。
1人以上の運転者の走行パターンが学習され、車線レベルルートプランニングに使用され得る。ナビゲーションマップは、道路状態に関する情報を含んでもよい。したがって、学習されたナビゲーションマップは、運転者の運転挙動の履歴及び/又は車線(より具体的には車線セグメント)の特性を活用/組み込むことができるものであり、車線レベルルートプランニングを可能にする。
(例えば、クラウド型のサーバに接続されている)複数の接続された車両からの車線レベル情報は、共有ナビゲーションマップに結合されてもよい。接続された各車両は、1つ以上の通信デバイス240等のサーバに車線レベル情報を送信してもよく、これは、取得した車線レベル情報の全てを集約してナビゲーションマップを取得することができる。多車両多目的学習(すなわち、複数の接続車両からの車線レベル情報)は、単一の車両の学習を大幅に高速化することができ、車両が道路自体を走行する前にルートの値(例えば、車線レベル情報)を学習することを可能にする。
経時的に、サーバは、特定の車両が走行した道路だけでなく、多くの運転者がエリア内で走行した多くの車線セグメントに関する情報を受信し得る。また、車線レベル情報は、車両プラットフォーム(例えば、日産リーフ、日産セントラ、日産ローグ等)の識別情報を含んでもよい。いくつかの例では、車線レベル情報は、車線レベル情報が生成された特定の運転者の情報(例えば、選好等)も含み得る。受信した車線レベル情報トレースを使用して、サーバは、その情報を車両(すなわち、車両仕様)、運転スタイル、道路(例えば、車線及び車線セグメント状態を含む)、及び/又はその他の基準に依存するものに分離して、それぞれが特定の車両、特定の車両プラットフォーム、特定の運転者、特定の運転スタイル等に固有の一意のナビゲーションマップを作成することができる。
上述したように、道路の車線の車線セグメントに関して、及び学習を介して、少なくともいくつかの環境情報、車両情報、人的情報、より少ない、より多い、その他の情報、又はそれらの組み合わせが学習され得る。学習された情報は、確率に変換され得る。確率は、本明細書に記載されるように、状態遷移関数に組み込まれてもよく、又は状態遷移関数によって使用され得る。確率は、計算されるルート(例えば、ポリシー)に関して目的を設定する際にも使用され得る。
環境情報は、交通パターン、歩行者パターン、車両(例えば、他のAV)による車線セグメントの通行困難情報、気象情報、負担情報、より多い、より少ない、その他の環境情報の1つ以上、又はこれらの組み合わせを含み得る。車両情報は、車線セグメントごとの平均速度情報、エネルギー使用(例えば、電気自動車のバッテリ使用、ハイブリッド自動車のガソリン及びバッテリ使用、又は内燃機関自動車のガソリン使用)、より多い、より少ない、その他の車両情報のうちの1つ以上、又はこれらの組み合わせを含み得る。
人的情報は、好ましいルート、好ましい車線、制御移行の要求(自動運転から手動運転へ、又は手動運転から自動運転へ等)、運転者のオーバライドによる能力モデルの更新、より多い、より少ない、その他の人的情報、又はそれらの組み合わせのうちの1つ以上を含んでもよい。制御移行の要求は、制御の移行が要求された車線セグメントを含んでもよい。制御移行の要求は、計画された後続車線セグメント、及びどの後続車線セグメントを人間の運転者が取ったかを含んでもよい。
車両がルートを通行しているときに(ナビゲーションマップの現在の状態に基づいているか、又は車線レベルプランナを介してルートを設定していないかにかかわらず)、車両のセンサを使用して、車線レベル情報に変換される情報を収集することができる。つまり、車両はシャドウモードにあり、センサを介して環境を監視していると考えられ得る。
センサからのデータは、例えば、限定されないが、道路(したがって、車線及び車線セグメント)が市街地か高速道路か、車線セグメントが通行困難であるかどうか、交通が密集しているかどうか、密度のレベル等を識別するために使用されてもよい。通行の困難さは、運転者のオーバライド量に基づいて識別されてもよい。つまり、自動運転の決定が人間によってオーバライド又は修正された回数、又は人間が自動制御によって提案されたのとは異なるやり方で車両を制御するように自動制御に指示した回数である。
負荷情報は、選択された車線変更の決定を与えられたユーザ(例えば、車両の乗員)が受け得るストレスのレベルを示し得る。説明するために、特定のルートは、混雑した又は高速の交通エリアで、比較的短い時間又は短い距離内で、車両が3つの車線セグメントを左に移動することを必要とする場合がある。このような状況は、ユーザにストレスを与え得る。このような負荷情報は、混雑エリアよりも前のはるかに早い車線セグメント遷移点を選択し、又はストレスのかかる状況を完全に回避するルートを選択するために使用されてもよい。
車線レベル情報を使用して、カウントが確率に変換され得るように、カウントを実行し得る。例えば、一般性を失うことなく、交通密度のカウントは、道路の1つの車線セグメントを通行して次の車線セグメントに移動するのにかかる時間等、1つの車線セグメントから別の車線セグメントに移動する確率に変換されてもよく、車線セグメント上の交通量が少なかった場合と交通が密集していた場合の履歴の回数のカウントを使用して、交通密度の確率を決定してもよく、車線セグメント上の速度が速い回数のカウントを使用して、車線セグメントを高速であると分類してもよく、車線セグメント上の速度が制限速度の-10マイル以内であった回数のカウントを使用して、車線セグメントが快適性車線セグメントである確率を決定してもよく、以下同様である。
ナビゲーションマップは確率から構築され得る。つまり、ナビゲーションマップに確率を組み込み得る。ナビゲーションマップは、図4に関して説明したような遷移グラフである。ポリシーを取得する際には、車線レベル情報(例えば、確率)に基づいて、次のアクション(例えば、次の車線セグメントに真っすぐ移動する、左隣の車線セグメントに移動する等)が決定され得る。一般性を失わずに説明するために、次のアクションは、例えば、現在の車線セグメントが渋滞しているかどうかに基づいて隣接する車線セグメントが渋滞している確率を含む、本明細書に記載されている隣接する車線セグメントの確率に基づいて確率的に(又は確定的に)決定され得る。
ナビゲーションマップの車線レベル情報の少なくとも一部は、車線レベルルートプランナの目的を設定するために使用され得る。説明のため、限定されないが、前述のように、環境は通行困難を含んでもよく、(例えば、ユーザによって設定された)目的が自動運転を最大化する場合、ルートプランナは通行困難のある車線(又は車線セグメント)を回避するであろう。つまり、ルートプランナポリシーは、通行困難のある車線セグメントを回避するように計算される。
目的地への時間(これには、制限速度、道路の長さ、停止信号、交通密度、車線セグメントが高速車線であるかどうか等が含まれるか又は組み込まれ得る)、選好(これには、快適性、高速道路とは対照的な市街地道路、エネルギー消費等の少なくともいくつかのユーザ選好が含まれ得る)、及び能力(これには、車線セグメントが有能に自動的に通行できるか、又は有能に手動で通行できるかが含まれ得る)についての目的を検討する。
説明のため、限定されないが、時間、優先度、及び能力目的の少なくとも一部を使用してルートを計画することができるように、車両がルートを走行するときはいつでも、特定の車線セグメントを自動的に通行するための時間は完全停止の有無にかかわらず記録され得る。同様に、特定の車線セグメントを手動で通行する時間(つまり、人間が運転しているとき)も記録され得る。したがって、4つの平均持続時間が記録され得る。平均時間を使用して、自己ループ(停止)のTMDP状態遷移を定義し得る。平均時間を使用して、例えば、自動運転(例えば、制御)対手動運転の状態に基づいて、通行時間の報酬/コストを定義し得る。
追加的に、人間が車線セグメントを運転するときはいつでも、後続の車線セグメントが記録され得る。後続の車線セグメントを使用して、選好に関する報酬/コストを[0、1]の範囲で定義してもよく、これは、人間が道路又は車線セグメントを運転した時間の比率であり得る。
さらに、人間が自動制御をオーバライドするか、又は自動制御の下で車両が立ち往生する(すなわち、1分又はその他の時間の閾値等の第1の閾値を超えて前進しない)ときはいつでも、第1の値として-1が記録されてもよく、そうでなければ(例えば、自動制御がオーバライドされず、車両が立ち往生しない場合)、第2の値として0が記録され得る。記録された第1の値及び第2の値の平均は、能力の尺度として使用され得る。その逆は、人間の運転者の能力を学習するために使用され得る。例えば、手動制御の下では、車両が第2の時間の閾値(例えば、1分又はその他の時間閾値)を超えて移動しない場合、第3の値として-1が記録され得る。例えば、運転者車線レベルルートプランナによって識別された禁止された次のアクションに従わない場合、第4の値として-1が記録され得る。例えば、運転者がシームレスに隣接する車線セグメントに進む場合、第5の値として0が記録され得る。第3、第4、及び第5の値の平均は、車両が現在の車線セグメントにあるときに次のアクションを実行する人間の能力の尺度として記録され得る。
すでに述べたように、意味ラベルを使用して、車線レベルルートプランナによって計算されるルートの目的を定義し得る。意味ラベルの例は、「快適性」(及び/又は関連する意味概念)、「市街地」(及び/又は「高速道路」等の関連する意味概念)、「高速」(及び/また関連する意味概念)、「手動運転」(及び/又は「自動運転」等の関連する意味概念)等、図5に関して説明されたものを含む。より少ない、より多い、他の意味ラベル、又はそれらの組み合わせも可能である。説明するために、ユーザが快適な道路の選好を示す場合、車線レベルルートプランナは、「快適」とラベル付けされた車線セグメントを考慮してポリシーを計算する。
ここで、目的から意味ラベルへのマッピングは、1対1のマッピングである必要はないことに留意されたい。そのため、意味ラベルはいくつかの目的を組み合わせてもよく、又は1つの目的を使用して1つ以上の意味ラベルが定義されてもよい。
開示された実装の一態様において、多目的深層強化学習(MODRL)が使用され得る。強化学習又は深層強化学習において、深層ニューラルネットワーク(DNN)を使用してポリシーを学習することができる。DNNは、代替的に又は追加的に、価値関数を学習するために使用され得る。そのため、強化学習技術がプランニング技術の代わりに使用され得る。強化学習では、目的はフィードバックからDNNを介して学習され得る。フィードバックは、車線セグメントを通行する時間、能力に対する人間のオーバライド、又はその他のフィードバックの1つ以上を含み得る。強化学習では、確率を学習する代わりに、確率及びコストを組み合わせて、目標(すなわち、目的地)に到達するための期待値にする。
ある態様では、本明細書に記載のように、TMDPはナビゲーションマップを使用してポリシーを取得し得る。別の態様では、TPOMDPを使用してポリシーを取得し得る。TPOMDPを使用すると、例えば、限定されないが、道路、車線、又は車線セグメント上の交通のレベル;新しい道路、車線、又は車線セグメントの能力の量;又は、本明細書に記載のその他の車線レベル情報に対する信念が有効になる。
図6は、本開示の実装によるナビゲーションマップの学習及び使用の概要600を示す。車線レベルルートプランナは、車線レベル情報を取得する学習モジュールを含んでもよい。車線レベルルートプランナは車両で実行されてもよく、車線レベル情報は車両のナビゲーションマップに組み込まれ得る。車線レベル情報はサーバに送信されてもよく、サーバは複数の車両から車線レベル情報を受信してもよい。サーバは受信した車線レベル情報をナビゲーションマップに組み込み得る。その後、ナビゲーションマップは車線レベルルートプランナを使用してポリシー(例えば、ルート)を取得し得る。
概要600は、起点608から目的地610まで(図示しない同一又は複数の車両によって)3つの異なるルート602,604及び606が取られたことを示す。走行中、車線セグメント612等の車線セグメントについて車線レベル情報が収集される。履歴614は学習された車線遷移を示し、履歴614における車線セグメントの陰影は車線セグメントの学習された特性を示す。履歴614は、本明細書に記載されるように学習された他の車線セグメント情報を含む。
ルートの少なくともいくつか(例えば、全て)に沿った車線セグメントの少なくともいくつか(例えば、全て)の履歴は、本明細書に記載されるように、ナビゲーションマップに結合(例えば、カウント)され得る。本明細書に記載されるように、複数の目的及び他の意味ラベルが、ボックス618によって示されるように、各車線セグメント履歴に記録され得る。
学習に基づいて、遷移グラフ620によって示される状態遷移グラフ構造(すなわち、上述の状態遷移関数T)が生成され得る。状態遷移グラフは、本明細書に記載されるように、SSP MDP又はPOMDPモデルによって使用され得る。次に、車線レベル多目的車線レベルルートプランナのナビゲーションマップが出力される(例えば、生成される)。ナビゲーションマップの車線レベル情報は、車線セグメントの車両の全通行の平均を含む。例えば、車線レベル情報は、速度、停止、認識された交通の密度、バッテリ使用、車線変更成功率等の1つ以上の平均を含む。
学習に基づいて、SSP MDP又はPOMDPモデルで使用されるコスト(報酬)関数も生成され得る。異なる目的の平均が、上記のように時間、制御の移行点、バッテリ使用、速度等を観察して報酬として記録され得る。報酬関数から、目的間においてスラックが可能かどうかを知ることができる。例えば、ルートの期待値が最適値より10分長い場合、少なくとも10のスラックが可能である。このような報酬関数及びスラックは、図5に関して説明され、選好順位付け622で示されるように、選好順位付けを設定するために使用され得る。
図7は、本開示の実施形態によるルートプランニングのためのナビゲーションマップを学習する技術700の一例を示すフローチャート図である。ナビゲーションマップは、車線レベルルートプランナによって使用される。技術300は、図1に示された車両100等のホスト車両、図2に示された車両210/211のうちの1つ、半自律走行車、運転支援機能を含み得る他の車両、又は運転者等によって手動で制御される車両であり得る装置において部分的又は完全に実装され得る。装置は、図2の通信デバイス240であり得るサーバであり得る。
技術700は、メモリに記憶される指示(例えば、命令)として実装され得る。メモリは、図1のメモリ134であり得る。メモリは、サーバのメモリであり得る。命令は、図1のプロセッサ133等のプロセッサによって実行され得る。技術700は、専用のハードウェア又はファームウェアを使用して実装され得る。複数のプロセッサ、メモリ、又はその両方が使用されてもよい。
ステップ702において、技術700は、道路の車線レベル情報を取得する。車線レベル情報は、道路の異なる車線の異なるセグメントの情報を含む。例えば、道路は第1の車線及び第2の車線を含み得る。車線レベル情報は、第1の車線に関連する第1の車線情報、及び第2の車線に関連する第2の車線情報を含む。
車線レベル情報は、ホスト車両で取得されてもよく、車線レベル情報を使用して、ホスト車両の(例えば、ホスト車両の中で使用される、ホスト車両が使用する、ホスト車両で利用可能な)ナビゲーションマップを進化させることができる。車線レベル情報は、複数の車両から車線レベル情報を取得するサーバで取得(例えば、受信)され得る。サーバは、それぞれの車線レベルルートプランナによって使用される進化したナビゲーションマップを車両に送信し得る。サーバは、進化したナビゲーションマップを使用してルート(例えば、ポリシー)を計算し得る。
上述したように、車線レベル情報は、環境情報、車両情報、又は人的情報の少なくとも1つを含んでもよい。環境情報は、車線セグメントの交通パターン、歩行者パターン、又は通行困難情報の少なくとも1つを含んでもよい。車両情報は、ユーザの選好のルート及びユーザによる制御の移行要求を含んでもよい。
一例では、道路の車線レベル情報を取得することは、道路上で停止している道路の自動通行の第1の時間を記録すること、道路上での停止を伴わない道路の自動通行の第2の時間を記録すること、道路上での停止を伴う道路の手動通行の第3の時間を記録すること、及び道路上で停止していない道路の手動通行の第4の時間を記録することを含んでもよい。一例では、道路の車線レベル情報を取得することは、手動通行中に後続車線セグメントを記録することを含んでもよい。一例では、道路の車線レベル情報を取得することは、自動走行制御の人間によるオーバライドを記録すること含んでもよい。道路の自動通行とは、車両が道路を通行するように自動的に制御されることを意味する。道路の手動通行とは、車両が道路を通行するように(人等によって)手動で制御されることを意味する。
ステップ704において、技術700は、車線レベル情報を、目的地へのルートを取得するために使用され得る状態遷移関数に変換する。上述したように、状態遷移関数は、TMDP又はTPOMDPモデルのものであってもよい。目的地へのルートは、上述したように、ポリシーであってもよく、又はそれにカプセル化されてもよい。一例では、ポリシー、つまりルートは確率的である。
ステップ706において、技術700は目的地を受信する。例えば、サーバ(より具体的には、サーバで実行される車線レベルルートプランナ)は、現在位置及び目的地を(例えば、ユーザ装置、車両のマッピングアプリケーション等から)受信して、ルートを取得し得る。例えば、装置で実行される車線レベルルートプランナは、ユーザ(運転者又は乗員等)から目的地を受信してもよく、車線レベルルートプランナはルートを取得し得る。例えば、車線レベルルートプランナは、装置の現在位置等に基づいて、ルートの起点位置を推測し得る。
ステップ708において、技術700は、状態遷移関数を使用するモデルの解としてポリシーを取得する。
図8は、本開示の実装によるルートプランニングの説明を提供する技術800の一例を示すフローチャート図である。技術800は、本明細書に記載の車線レベルルートプランナ等のルートプランナによって部分的又は完全に実装され得る。技術800は、説明モジュール等のルートプランナのモジュールによって実装され得る。車線レベルルートプランナは、ルートに自動的に従うように車両を制御するために使用され得るアクションを提供することができる。技術800は、ルートプランナによって所定の道路、車線又は車線セグメントが選択される理由に関する説明を提供するために使用され得る。
技術800は、メモリに記憶される指示(例えば、命令)として実装され得る。メモリは、図1のメモリ134であり得る。メモリは、サーバのメモリであり得る。命令は、図1のプロセッサ133等のプロセッサによって実行され得る。技術700は、専用のハードウェア又はファームウェアを使用して実装され得る。複数のプロセッサ、メモリ、又はその両方が使用されてもよい。
技術800は、図9を参照してさらに説明される。図9は、本開示の実装に従って、複数の目的に基づく説明を提供する例900を示す図である。
ステップ802において、技術800は、ユーザから受け取った少なくとも2つの目的に基づいてルートを決定(例えば、計算、取得等)することができる。少なくとも2つの目的のうち第2の目的は、少なくとも2つの目的のうち第1の目的の余裕値内に制限され得る。上述したように、余裕値は、第2の目的を改善するために第1の目的からどの程度のずれが許容されるかを示す。
一例では、ルートを決定することは、起点(例えば、現在)位置から目的地までルートをナビゲートするためのポリシーを取得することを意味する。ルートは、本明細書に記載のように、マルコフ決定過程を使用して決定され得る。車線レベルプランナは、本明細書に記載のように、ルートを決定することができる。車線レベルルートプランナは、本明細書に記載のように、ナビゲーションマップを使用して、ルートを決定することができる。ルートプランナは、多目的ルートプランナであってもよい。
少なくとも2つの目的は、任意の数の目的であってもよい。少なくとも2つの目的は、本明細書に記載のように、任意のやり方で関連させる(制約される)ことができる。少なくとも2つの目的は、有向非巡回グラフを使用して関連させ得る。一例では、少なくとも2つの目的は、時間目的、快適目的、自律性目的、又は都市目的の少なくとも2つを含んでもよい。
図9の有向グラフ910は、2つの目的を示している。すなわち、時間目的912及び自律性目的914である。自律性目的914は、時間目的912の3分の余裕値916内に(例えば、余裕値となるように)制約される。一例では、少なくとも2つの目的は、ルートプランナのデフォルト設定であってもよい。一例では、技術800は、ユーザから、第1の目的、第2の目的、及び余裕値を受け取ることができる。
一例では、第1の目的、第2の目的、及び余裕値は、口頭コマンドでユーザから受け取ることができる。例えば、口頭コマンドは、「自律性を高めるために、3分間の余裕を可能にする最速ルートを見つける」であってもよい。口頭コマンドは、ルートプランナのセマンティック処理モジュールを介して、有向グラフ910であるか、又はそれに類似し得る内部表現に変換され得る。セマンティックプロセッサは、目的、目的間の関係、及び口頭コマンドにおける任意の余裕値を識別することができる。例えば、セマンティックプロセッサは、「最速ルート」、「自律性を高める」、及び「3分間の余裕を可能にする」という言葉を、それぞれ時間目的912、自律性目的914、及び余裕値916に変換してもよい。
一例では、ユーザは、オブジェクト及び余裕値を指定できるグラフィカルユーザインタフェースを提供され得る。グラフィカルユーザインタフェースの例は、図10及び図11に関して説明される。グラフィカルユーザインタフェースは、車両のディスプレイ又はユーザのデバイスのディスプレイ等のディスプレイ上に提供され得る。グラフィカルユーザインタフェースは、ユーザが利用可能な制約を表すアイコン(例えば、バブル、ボックス、言葉等)をドラッグし、アイコンを接続して図5に関して説明したようなDAGを形成するようにドラッグアンドドロップのインターフェースを提供することができる。2つの制約間の接続をクリックすることにより、ユーザは余裕値を提供することができる。一例では、ルートプランナのセマンティックプロセッサは、DAGをディスプレイに表示され得る記述に変換することができる。一例では、ユーザはリスト(例えば、一連の目的)であるDAGの形成に制限され得る。
一例では、ユーザの口頭コマンドはディスプレイにテキストで表示され得る。一例では、ユーザの口頭コマンドを表すDAGがディスプレイに表示され得る。
ステップ804において、技術800は、ユーザから、ルートに沿ったアクションに関する説明の要求を受け取る。この要求は、まだ実行されていないアクション又はすでに実行されたアクションに関する説明に対してであってもよい。
決定されたルートは、ディスプレイに表示され得る。図9のマップ920等に示すように、ルートをマップ上にオーバレイされてもよい。マップ920は、起点923から目的地924へのルート922を含む。起点923は、車両の現在位置であってもよく、車両がルート922を通行するときに更新され得る。
マップ920は、次に取られるべきセグメントが車線セグメント929であることを示す。マップは、ユーザが情報を取得し又は説明を取得するために使用(例えば、押す)ことができるコントロールも含み得る。例えば、マップ920は、ルートプランナが選択することができた代替車線セグメントセレクタ926を含む。ユーザが説明コントロール925を押すことに応答して、技術800は説明を提供する。情報コントロール927は、ユーザによって、情報コントロール927がその隣に表示されている車線セグメント、車線、又は道路に関する情報を要求するために使用され得る。情報コントロール927が押されることに応答して、技術800は、上述のように、ナビゲーションマップで利用可能な車線セグメントに関する情報を提供することができる。説明コントロール925、代替車線セグメントセレクタ926及び情報コントロール927の他の配置又は視覚的描写も可能である。
一例では、技術800は、ユーザからの口頭要求を介して説明の要求を受信し得る。
説明の要求は、現在の状態における特定の可能なアクションに関する要求であってもよい。例えば、ユーザは、「なぜ右に行かないのか?」と質問して、ルートプランナによって選択された次の即時アクションに関する説明を受け取ってもよい。このような要求では、ルートプランナは、ルートプランナの現在の状態において選択されたアクションを特定の可能なアクションと比較することによって回答を提供する。
説明の要求は、現在の状態における全ての可能なアクションを含む要求であってもよい。例えば、ユーザは、「なぜ直進しているのか?」と質問して、ルートプランナによって選択された次の即時アクションに関する説明を受け取ってもよい。このような要求では、ルートプランナは、ルートプランナの現在の状態において選択されたアクションを、現在の状態における他の可能なアクションと比較することによって回答を提供する。例では、ユーザは、ルートプランナが様々な可能なアクションから選択し得るポイント928等、マップ上の特定のポイントを選択(例えば、クリック)し得る。
ユーザは、ルートプランナによって既に実行された、又は実行されるように選択されたアクションに関する説明を要求してもよい。例えば、ユーザは「なぜ右に行かなかったのか?」と質問してもよい。別の例では、ユーザは「どうして直進したのか?」と質問してもよい。
一例では、ユーザは手動でアクションをオーバライドしてもよい。ユーザは、代替車線セグメントセレクタ926を選択(例えば、押す等)するか、又は「次に右へ行く」等の口頭コマンドを発行することによって、手動でアクションをオーバライドすることができる。ユーザは、車両を手動で制御することによって、手動でアクションをオーバライドすることができる。ユーザは、説明を受け取る前又は後にアクションをオーバライドすることができる。
ユーザがマップ920上のポイントを選択して説明を要求すると、マップ上の位置が状態に変換される。状態sは、任意のルートプランニングモデルに関して上述したものであってもよい。
ステップ806において、技術800は、ユーザに説明を提供する。説明は、余裕値に違反する程度を記述する(例えば、含む)ことができる。
ルート(例えば、ポリシー)を計算するとき、及び少なくともいくつかの目的について、ルートプランナは、上記のように、少なくともいくつかの状態(例えば、車線セグメント)及び可能なアクションについて、それぞれの期待割引報酬Qo(s,a)を維持(例えば、記憶)してもよく、ここで、oは目的であり、sは状態であり、aはアクションである。Q(s,a)=[Q1(s,a),…,Qk(s,a)]は、特定の状態s及びアクションaについての1,..,kの目的の期待割引報酬のベクトルである。期待割引報酬の取得は、ポリシーに依存する。Qo(s,a)は、状態sで一度アクションaを実行し、その後ポリシーに従った場合の目的oの期待割引報酬である。
一例では、ルートプランナは、複数の状態の間で、及び各目的に対して、どの程度の変化が発生するかによる利得値を記憶し得る。値の差が最も大きい上位状態(例えば、ルートに沿った車線又は車線セグメント)が説明として選択され得る。
例示すると、期待割引報酬値Qは、期待割引報酬値のアクションに対して状態sで並べ替えされ得る。一例では、値は目的ごとに個別に記憶され得る。目的iの場合、アクションに対する順序付けが、Qi(s,a2)>Qi(s,a4)>Qi(s,a3)>Qi(s,a1)であるように計算されてもよく、ここで、a1、a2、a3及びa4はs状態における可能なアクションである。したがって、アクションa2は目的iの最適なアクションと見なされ得る。しかし、別の目的jに関して、順序付けはQj(s,a4)>Qj(s,a1)>Qj(s,a2)>Qj(s,a3)であってもよい。したがって、アクションa4は、目的jの最適なアクションと見なされ得る。さらに、アクションa4が状態sに対して最終的に選択されたアクションであると仮定する。そのため、目的iに対する期待割引報酬はQi(s,a2)-Qi(s,a4)だけ減少する。
アクションa1、a2、a3、及びa4並びに状態のセマンティックな意味を使用して説明を提供することができる。状態sは、マップ位置として意味を有し得る。例えば、状態sはマップ内のGPSポイントであってもよい。例えば、状態sはマップ内の交差点におけるGPSポイントであってもよい。アクションaは、左に曲がる、右に曲がる、直進する、交差点でUターンする等の意味も有し得る。そのため、プレースホルダ(又は変数)を持つ説明文が構築され得る。例えば、文は、「<状態>において<アクションa>が選択されたのは、期待時間が<Qi(s,aoptimal)-Qi(s,a)>分だけ長いからであり、それには<余裕>の余裕が割り当てられる」というテンプレートから構築され得る。このような文の例は以下であってもよい。BarrowsとWatsonとの交差点においてUターンが選択されたのは、期待時間が1.2分しか長くならなかったからであり、それには3.0の余裕が割り当てられる。
例示すると、ユーザは、「なぜ右に行かなかったのか?」と質問してもよい。すなわち、ユーザは、ルートプランナによってマップ940のルート942が選択されなかった理由を質問している。技術800は、状態sがポイント928におけるGPS位置であることを決定する。技術800は、ユーザが比較(例えば、説明)することを求めている各目的及び各アクションの期待割引報酬値を決定(例えば、計算、メモリ又はストレージから回収、取得、検索)する。このように、技術800は、時間及び自律性の各目的及び直進(go_straight)及び右折(turn_right)の各アクションについての利得値を決定する。したがって、技術800は、ルート922に対応するQtime(s,a=go_straight)及びQautonomy(s,a=go_straight)を決定し、ルート942に対応するQtime(s,a=go_right)及びQautonomy(s,a=go_right)を決定し、ここで、s=ポイント928におけるGPS位置である。
つまり、ルート922が通行するのに2分かかると決定され、ルート922に沿って1分、車両は自律走行することができ、ルート942は6分かかると決定され、車両はルート942に沿って4分自律走行する。
ルート942が自律性目的914を満足させるより自律的な走行をもたらすとしても、技術800はルート942が余裕値916内にないと決定する。ルート942と922との間の時間差は、Qtime(s,a=goright )-Qtime(s,a=gostraight )=6-2=4minutesである。この時間差(4分)は余裕値(3分)内にない。
代替ルートに沿った状態に対して、期待割引報酬が計算される。そのため、ユーザは、ルート又は代替ルートに沿った状態に関する説明を要求し得る。ルートを計画すると、確率的に多数の偶発計画が考慮されることになる。そのため、他の所定のルートが選択されない理由についての説明が提供され得る。例えば、ユーザが代替ルートを選択したことに応答して、説明モジュールは、選択されたルートと代替ルートとの間の差の車線/道路のみを除いて、上記の並べ替えアルゴリズムを使用することができる。したがって、それは、ルート間の目的間のコスト差が最も大きい原因を特定することができる。
次に、技術800は、説明を構築することができる。一例では、ルートプランナの説明モジュールは、説明を構築することができる。説明は、第1のアクション、第2のアクション、第1の目的、第2の目的、及び第2のアクションが余裕値に違反する程度のそれぞれの記述子を含んでもよい。
一例では、説明を構築することは、テンプレート内のプレースホルダを記述子で置き換える(例えば、挿入する)ことを意味し得る。一例では、テンプレートは、“<取られたアクション>に行った理由は、<代替アクション>によって、<被違反目的>が<違反目的>を改善するために<余裕量>の割り当て余裕外にあるからです。”というフォーマットを有してもよく、ここで、<取られたアクション>、<代替アクション>、<被違反目的>、<余裕量>、及び<違反量>の各々は、それぞれのセマンティック記述子のプレースホルダである。
<取られたアクション>のプレースホルダは、ルートプランナによって選択されたアクションのプレースホルダであってもよく、<代替アクション>のプレースホルダは、1つ以上の代替アクションのプレースホルダであってもよく、<被違反目的>のプレースホルダは、代替アクションの1つによるその値が最適値の余裕値内にない目的であってもよく、<余裕値>は余裕値であってもよく、<違反目的>は、その値によって、違反している目的の値が余裕値内にない原因となる目的であってもよい。したがって、上記の例を使用すると、説明は、「直進した理由は、右折が自律性を改善させるために、3分間の割り当てられた余裕外の時間を引き起こすからです」であってもよい。
一例では、複数のテンプレートが利用可能であってもよく、説明モジュールはテンプレートの1つを選択し得る。一例では、テンプレートは、上記のプレースホルダの1つ以上を含まなくてもよい。テンプレートは、“<取られたアクション>に行った理由は<車線セグメントに関する状態>だからです”又は“<取られなかったアクション>を行わなかった理由は<車線セグメントに関する状態>だからです”であってもよい。例示すると、ユーザが自律性を最大化するという主要な目的を提供し、ルートプランナがマップ940のルート942を選択する場合、ユーザは「どうして直進しないのか?」と質問するかもしれない。ルートプランナがルート942を選択するのは、車線セグメント944が通常は交通渋滞を含み、そのため車両が自律的に車線セグメントを通行する能力がないことを示す情報がナビゲーションマップに含まれるからである。説明は、“直進しなかった理由は自律的に車線を通行する能力がないからです”であってもよい。一例では、車線セグメントは、説明が関係する車線セグメントをユーザに示すために、マップ940上で同時に強調表示されてもよい。上述したように、一例では、ナビゲーションマップ内の能力情報を学習することができる。一例では、能力情報は、ナビゲーションマップ内に事前ロード(例えば、事前に設定)されてもよい。
一例では、説明は、1つ以上の様式で提供(例えば、ユーザに出力)されてもよい。説明は、視覚、触覚、又は聴覚様式の少なくとも1つで提供されてもよい。視覚様式では、説明は、車両のディスプレイ等で、ユーザに表示されてもよい。聴覚様式では、説明は、ユーザに音読されてもよい。
触覚フィードバックは、例えば、聴覚及び/又は視覚障害ユーザに有用であってもよい。触覚説明は、車両の1つ以上の物理的コンポーネント(例えば、ハンドル、シート、ペダル等)を振動させることによって提供されてもよい。
異なる振動パターン及び位置(例えば、ハンドルの左側、ハンドルの右側、シートクッションの左側、シートクッションの右側、ハンドルの両側、シートの両側等)を使用して、説明の異なる側面を伝えることができる。一例では、ハンドルは、人がハンドルを保持していることをハンドルのセンサが検出するような状況で使用されてもよい。
異なる振動パターンを使用して、テンプレートプレースホルダの異なる値を伝えることができる。触覚説明は、「<取られたアクション振動パターン>---<代替アクション振動パターン>---<被違反目的振動パターン>---<違反目的振動パターン>」という形式になってもよい。振動パターンは、ここでは「R」及び「-」を使用して表され、ここで、「R」は振動又は振動音を表し、「-」は一時停止を表してもよく、代替的に、「R」は高強度の振動又は振動音を表し、「-」は低強度の振動又は振動音を表してもよい。
実行されるアクションごとに、識別可能な振動が利用可能であってもよい。例えば、「右に移動する」、「左に移動する」、「直進する」、「斜めに移動する」というアクションは、それぞれ振動パターン「RR」、「R-」、「-R」、「--」で表されてもよい。他のプレースホルダの値にも同様のパターンを利用可能であってもよい。説明は、振動及び一時停止のシーケンスとして構築されてもよく、振動及び一時停止の各サブセットがプレースホルダの値を表している。振動及び一時停止のシーケンスは、説明の開始を通知する(例えば、表示する)シーケンスが前に置かれてもよい。
図10は、本開示の実装による車線レベルルートプランナのための多目的設定のためのユーザインターフェース1000の一例を示す図である。ユーザインターフェース1000は、ユーザインターフェース135等の車両のユーザインターフェースを含む。ユーザインターフェース1000は、第1の目的を表す第1のオブジェクト1010と、第2の目的を表す第2のオブジェクト1020とを含む。ここで、第3の目的は、多目的ポリシーに含まれるので、表現は、第3の目的を表す第3のオブジェクト1030を含む。ユーザインターフェース1000上の表現内の第1のオブジェクト1010及び第2のオブジェクト1020の配置は、第2の目的に対する第1の目的の優先度(例えば、関係等)を示す。同様に、第3の目的の包含により、ユーザインターフェース1000上の表現内の第3のオブジェクト1030の配置は、第1の目的又は第2の目的の少なくとも一方に対する第3の目的の優先度をさらに示す。
より具体的には、図10の配置では、第1のオブジェクト1010、第2のオブジェクト1020、及び第3のオブジェクト1030がリスト内で並べられており、第1のオブジェクト1010がリストの下部に位置し、第2のオブジェクト1020がリスト内の第1のオブジェクト1010の上部に位置し、第3のオブジェクト1030がリスト内の第2のオブジェクトの上部に位置する。この配置は、第1の目的が第2の目的によって制約され、第2の目的が第3の目的によって制約されることを示す。各オブジェクト1010、1020、1030は、それぞれの目的の記述子を含んでもよい。この例では、第1の目的は、速度又は目標を完了するまでの時間に関連し、「時間」の記述子を有し、第2の目的は、快適な車線に対するユーザの選好に関連し、「快適性」の記述子を有し、第3の目的は、自律走行を最大化するためのユーザの選好に関連し、「自律性」の記述子を有する。別の例では、図9に関して上述したように、目的の順序は、制約されていない目的がリストの先頭に来るようにすることができる。
また、優先度は、余裕値を含んでもよい。コントロール1022及びコントロール1034を介して、ユーザは、それぞれ余裕値1024及び余裕値1032を設定することができる。この例では、コントロール1022及び1034はスライダとして示されている。しかしながら、他のタイプのコントロールも可能である。
この例では、第1のオブジェクト1010、第2のオブジェクト1020、及び第3のオブジェクト1030は、それぞれドラッグアンドドロップのオブジェクトであってもよい。グラフィカルユーザインタフェース内のオブジェクトのいずれかを移動させる形式のフィードバックは、多目的ポリシーの変更を構成する。例えば、第2のオブジェクト1020及び第3のオブジェクト1030の位置を入れ替えると、第2のオブジェクト及び第3のオブジェクトが入れ替わる。また、オブジェクト1010、1020、1030のうちの1つ以上が、それぞれのオブジェクトに関連付けるために、候補目的のグループから1つの目的を選択するプルダウンメニューを含んでもよい。プルダウンメニューにより、車線レベルルートプランナの多目的ポリシーの変更は、第1の目的をグループの別の候補目的に変更すること、第2の目的をグループの別の候補目的に変更すること、存在する場合には第3の目的をグループの別の候補目的に変更すること、別の目的に対する新しい目的の優先度を持つグループからの新しい目的を追加すること、目的を削除すること、又はこれらの変更のいくつかの組み合わせを含むことが可能になり得る。
図11は、本開示の実装による車線レベルルートプランナの多目的を設定するためのユーザインターフェース1100の別の例を示す図である。ユーザインターフェース1100の多目的は、有向非巡回グラフに配置される。ユーザインターフェース1100は、ユーザインターフェース135等の車両のユーザインターフェースを含む。この表現は、第1の目的(すなわち、「時間」)を表す第1のオブジェクト1120と、第2の目的(「快適性」)を表す第2のオブジェクト1130と、第3の目的(「自律性」)を表す第3の目的1110とを含む。ユーザインターフェース1100上の表現内の第1のオブジェクト1110、第2のオブジェクト1120、及び第3のオブジェクト1130の配置は、目的の関係(例えば、優先度)を示す。
ユーザインターフェース1100では、第2のオブジェクト1120及び第3のオブジェクト1130は、グラフィカルユーザインタフェースの上部と平行に一列に互いに隣接して配置され、第1のオブジェクト1110は、第2のオブジェクト1120及び第3のオブジェクト1130の下に位置する。これは、第2の目的に対する第1の目的の優先度及び第1の目的に対する第3の目的の優先度をグラフィカルに表す。第1のオブジェクト1110、第2のオブジェクト1120、及び第3のオブジェクト1130は、それぞれ図示されているようにドラッグアンドドロップのオブジェクトであってもよいが、多目的ポリシーを変更するためにフィードバックを介して操作してことができるそれ以外のオブジェクトであってもよい。例えば、オブジェクト1110、1120、1130のうちの1つ以上は、プルダウンメニューを含んでもよい。オブジェクト1110、1120、1130は、異なる実装における他の目的を表してもよい。
図11の表現は、図10のものと同様に形成された目的を表すオブジェクト、すなわち、多目的優先度の2つの目的間の相対優先度を調整するために使用され得る埋め込みオブジェクトを含むオブジェクトを使用することができる。しかしながら、図11は、相対的な優先度を調整するために各目的のオブジェクト1110、1120、1130を使用しない異なる配置を示している。その代わりに、この表現は、余裕値を識別し、且つ接触に応答して第1の余裕値を変更する第4のオブジェクト1140を含む。第4のオブジェクト1140は、ユーザインターフェース1100内の第1のオブジェクト1110と第2のオブジェクト1120との間に配置される。また、この表現は、第2の余裕値を識別し、且つ接触に応答して第2の余裕値を変更する第5のオブジェクト1150を含む。第5のオブジェクト1150は、ユーザインターフェース1100内の第1のオブジェクト1110と第3のオブジェクト1130との間に配置される。
この例における第4のオブジェクト1140及び第5のオブジェクト1150は、それぞれプルダウンメニューであってもよい。すなわち、接触時に、可能な新しい第1の余裕値又は第2の余裕値を適宜含むメニューが表示されてもよい。オブジェクト1140、1150のうちの1つ以上は、それに関連付けられた値を変更し、更新された多目的ポリシーに含めるためにその値をプロセッサに提供するために、ユーザインターフェース1100上で操作可能なスライダ又は他のオブジェクトであってもよい。
目的間の関係の他の指標も、多目的ポリシーの表現において使用されてもよい。例えば、図11の表現は、第2の目的1120から第1の目的1110に向けられた矢印と、第3の目的1130から第1の目的1110に向けられた矢印とを含み、これはそれぞれの関連目的間の制約関係を示す。
図12は、本開示の実装による自律走行におけるルートプランニングのための標準精細(SD)マップの使用を示すマップの一例を示す図である。マップ1200において、ルート1202は、HDマップを使用して車線レベルルートプランナによって計画される。本明細書に記載されるような車線レベルルートプランナ等のプランナは、例えば、ナビゲーションマップ情報によれば、AVがルート1202の車線セグメントを自律走行する能力があると判断されるので、ルート1202を選択したのであってもよい。車線セグメント上の能力は、確率、閾値、許容範囲等で示され得る。
部分1204は、マッピングされていない道路をAVが自律走行する能力がないことをプランナが考慮し得るため、プランナが考慮しなかったマッピングされていない側道を示す。追加的に、このような側道は、HDマップでは利用できない(例えば、含まれていない)可能性がある。しかしながら、AVが部分1204を走行する能力がある場合、部分1204を使用することは、より短いルート(例えば、1分短縮)につながり得る。したがって、マッピングされていない部分1204を探索及びマッピングすることは有益であり得る。
したがって、本開示の態様において、プランナは、マッピングされていない道路のHD情報を追加するために、マッピングされていない道路を探索するように構成されてもよい。この文脈で使用される「探索」は、ルートプランナが、ルートプランニングのためにHDマップにないSDマップの道路を使用することが可能であり、車両がこれらのマッピングされていないルートを通行するように制御され得ることを意味し得る。別の例では、AVは、SDマップの道路を通行するように案内され得る。例えば、ユーザ(例えば、テレオペレータ等)は、SDマップの道路を通行するように車両に指示を送ることができる。AVがマッピングされていない道路を通行している間、センサデータを使用してHD情報を収集することができる。HD情報は、AVのHDマップを構築し、又はHDマップを拡張するために使用され得る。探索によって、新しい道路及び車線セグメントの情報がナビゲーションマップに追加され得る。少なくとも部分的なHDマップが探索によって構築され得る。車線、縁石、速度バンプ、停止線、(3次元空間における)交通信号機位置等に関する情報がHDマップに追加され、又はHDマップを構成し得る。場合によっては、この情報は、市販の(例えば、購入した)HDマップによって提供され得るものと同一であってもよい。取得された情報の質は、車両のセンサ及び検出及び識別アルゴリズムに依存してもよい。しかしながら、これらの種類のHD特徴のノイズの多い情報であっても、SDマップの探索された道路の将来の通行に関する意思決定及び軌道計画に有用であり得る。SDマップの道路の1回の通行は、自律走行及び通行のための後の車線レベルルートプランニングに十分であり得る。より多くの通行は、意思決定及び軌道計画によって使用されるHDマップの品質を向上させ得る。
図13は、本開示の実装に従ってマップを改善するために新しい道路を探索するためのシステム1300の図である。システム1300は、プランナ1302、マッパ1304、及び安全性決定コンポーネント(DC)1306を含んでもよい。システム1300の他の実装も利用可能である。いくつかの実装形態では、システム1300の追加コンポーネント(例えば、要素、モジュール等)が追加されてもよく、所定の要素が組み合わされてもよく、及び/又は所定の要素が除去されてもよい。
システム1300又はその中のコンポーネントは、図1の車両100等の車両に実装され得る。車両は、自律又は半自律車両であり得る。システム1300又はその中のコンポーネントは、図1のメモリ134等のメモリに記憶され、且つ図1のプロセッサ133等のプロセッサによって実行され得る実行可能命令として実装可能である。システム1300のコンポーネントの1つ以上は、後述する各情報処理を実行するために準備された専用ハードウェアによって実装され得る。
プランナ1302は、車線レベルのルートプランナであってもよく、又はその一部であってもよい。プランナ1302は、SDマップ道路の探索コストと(例えば、そのコストと比較して)HDマップ道路のみを使用した計画を比較検討することができる。プランナ1302はSSP MDPルートプランナであってもよく、この比較検討はルートプランナのコスト関数に組み込まれてもよく又は含まれてもよい。プランナ1302はPOMDPルートプランナであってもよく、コストは明示的信念であってもよい。POMDPモデルの状態空間は、S=Sr×Stで与えられてもよく、ここで、Srは道路の集合であり、Stは道路がどの程度通行可能かを示す。アクション空間Aは、後続道路を選択するためのアクションの集合である。後続道路は、HDマップの道路(例えば、車線セグメント)又はSDマップの道路であり得る。
SDマップは、状態空間Srの少なくともいくつかの状態(例えば、可能な車線又は道路)を提供する。最初は、SDマップのいずれかの道路が少なくとも1回通行される前に、そのような道路のいずれの車線もまだ知られていない。通行可能性(例えば、St)に関しては、SD道路は最初は不確実であり得る。例えば、任意の所与のSD道路の通行可能性が小さな値に設定されてもよい。車両がSDマップの道路上で自動的に制御されるように、プランナはPOMDP計画によって探索と利用とのトレードオフのバランスを取ることができる。
所定の周波数(例えば、1Hz又は他の周波数)でルートを更新し得るオンライン車線レベルルートプランナにおいて、道路の通行可能性Stは継続的に更新されてもよい。通行可能性は、ルートと同じ周波数で更新され得る。車線レベルのルートプランナは、事前に定義された秒数(例えば、1秒)ごとに、GPS情報に基づいてマップ内の現在の道路(すなわち、状態)を考慮し、事前に定義された量の計画時間(これは正確に事前に定義された秒数であり得る)の計画を実行してもよい。事前に定義された量の計画時間の後で、車線レベルのルートプランナは、(計算されたポリシーに基づいて)車線レベルのルートプランナが取得した最適なルートを提供してもよい。車両が増分的に移動するように制御される場合、車線レベルのルートプランナは新しい道路(これは以前の道路と同じであり得る)を取得してもよく、以前のルートプランを更新する。
オフラインの車線レベルのルートプランナの場合、ルートを再計画する間に通行可能性Stが更新され得る。オフラインの車線レベルのルートプランナは、ルートプランニングを提供するクラウド型のサービスであってもよい。
一例では、プランナは、ユーザによって提供された目的に基づいて、マッピングされていない道路を探索するように構成されてもよい。プランナは、ルートを取得するために高精細マップに加えて標準精細マップが使用されることを示す目的を取得し得る。この目的は暗黙的又は明示的であり得る。ルートプランナは、新しい道路を探索することを選択し、顧客の目標に到達することと、AVが走行するように制御され得るとルートプランナが判断した道路を試すこととの間のトレードオフを比較検討するように構成され得る。
例えば、ユーザは最速ルートから2分以内のルートに対して優先度を示してもよい。最速ルートは、最初にHDマップに基づいて計算される。プランナは、マッピングされていない道路を考慮するための暗黙的な目的として、2分の余裕値を使用し得る。一例では、ユーザはマッピングされていない道路に関連する明示的な目的を提供し得る。例えば、ユーザが設定できる利用可能な目的は、「探索目的」であってもよい。ユーザは、本明細書に記載の探索目的を提供し得る。例えば、ユーザは、自律性目的914が探索目的に置き換えられ得る図9の有向グラフ910に類似した目的の有向グラフを提供(例えば、構築)し得る。一例では、ユーザは、図10及び図11に関して説明したようなユーザインターフェースを使用して目的を提供し得る。余裕値が0に設定されている場合、プランナはHDルートのみを使用してルートを取得する。
マッパ1304は、図1のセンサ136等の車両のHDセンサからデータを記録する。HDセンサデータは、道路がマッピングされてナビゲーションマップに追加される前に、車両がSD道路の道路を通行するように記録されてもよい。例えば、HDセンサデータは、点群、画像、GPS座標、追跡対象オブジェクト等を含んでもよい。一例では、中央サーバ等で、SDマップの道路を通行する他の車両のセンサからのデータが取得されてもよい。他の車両のセンサからのデータを使用して、HDマップデータを取得することもできる。したがって、より一般的には、センサデータのソースに関係なく、HDマップ情報は、センサデータに基づいてSDマップの道路に関して取得され得る。サーバで取得したHDマップ情報が車両に送信され得る。
したがって、マッパ1304は、SD車線又はSDルートセグメントを通行中に収集されたHDセンサのデータを使用することができる。HDセンサデータは、そのSD車線又はSDルートセグメントに対するHDマップになると言える。一例では、SD車線又はSDルートセグメントは、SD車線又はSDルートセグメントに対するHDマップを取得するためにHDセンサを装備した1つ以上の車両を人間が制御することによって通行(例えば、走行)することができる。取得されたHDマップは、SD車線又はSDルートセグメントを再訪問(すなわち、再通行)することによって改善され得る。
センサデータは、道路の特徴を識別するために使用され得る。例えば、オブジェクトの検出、出現、又は消失をセンサデータから検出することができる。例えば、データは、SD道路の道路(例えば、1メートル、2メートル、又は何らかの他の検出セグメント)の検出セグメントごとに、オブジェクトの有無、(画像処理又はデータ分析等を使用して認識された場合)オブジェクトの識別(例えば、タイプ)、障害物の有無、オブジェクト又は障害物の位置(例えば、道路の左、右、中央、何らかの他の位置)、オブジェクトが消失する前のオブジェクトの存在した期間等を示す。
SDマップの道路の複数回の通行(車両の通行又は複数の通行等)から収集されたデータを集約して、SD道路での自律走行のためのルートを取得するために使用できる状態確率を取得することができる。確率の例示は、オブジェクトが0.823の確率で第1の場所に出現し、オブジェクトが0.1の確率で第2の場所に出現し、第3の場所にあるオブジェクトが平均時速3.5マイルで移動し、第3の場所にあるオブジェクトが0.9の確率で子として分類されること等を含んでもよい。このような確率は、軌道計画に使用され得る。道路を通行するための軌道を計算するために、道路又は道路のセグメントの長さにわたって確率を合成し得る。
確率は、不確実性(すなわち、知識の欠如)を示す値に初期化されてもよい。確率は、SDマップの道路の通行中に収集されたセンサデータに基づいて更新され得る。
SDマップの道路上で遭遇し得る意思決定コンポーネント(DC)のタイプに関する情報は、センサデータを使用して識別されてもよく、記録されてもよい。意思決定コンポーネント(DC)タイプに関する情報は、道路を通行するために必要とされてもよい(例えば、インスタンス化される)。DCコンポーネントの例は、横断歩道、交差点、駐車場等に関するDCコンポーネントを含んでもよい。決定コンポーネントは、2019年11月26日に出願された米国特許出願第16/696,235号及び2020年1月31日に出願された米国特許出願第16/778,890号に記載されており、その全開示は参照により本明細書に組み込まれている。
決定コンポーネントは、自律走行におけるシナリオの特定の態様(例えば、動作シナリオ)を解決するように指示され得る(又は解決することができる)。DCは、AVを制御するためのアクションを提供し得る。
決定コンポーネントは、決定問題のインスタンスであってもよい。決定問題は、シーン内の潜在的な対相互作用問題を記述する。決定問題は、環境の現在の状態を考慮して自律走行のアクション(例えば、停止、少しずつ進む、発進、右側から追い越す、左側から追い越す等)を提供するために、事前に知られており、且つオフラインで解決される自律走行の特定の抽象的な問題であり得る。決定コンポーネントは、決定問題が解決する動作シナリオに遭遇したときに、走行中にオンラインで作成され得る(すなわち、解決された決定問題からインスタンス化される)。一例では、決定問題及び対応する決定コンポーネントは、シナリオ固有の動作制御評価モジュール及びそのインスタンスに関して以下に説明するようになり得る。動作シナリオの例は、歩行者シナリオ、交差点シナリオ、車線変更シナリオ、又は外部オブジェクトに対応する他の車両動作シナリオ又は車両動作シナリオの組み合わせを含む。一例では、決定コンポーネントは、マルコフ決定過程又は部分観測マルコフ決定過程であってもよい。
シナリオ固有の動作制御評価モジュールは、それぞれの動作シナリオの部分観測マルコフ決定過程(POMDP)モデル等のモデルであってもよい。つまり、各モデルが、特定のシナリオを処理するように構成され得る。自律走行車の動作管理コントローラは、対応する動作シナリオの検出に応答して、シナリオ固有の動作制御評価モジュールの各インスタンスを作成してもよい。
言い換えると、特定の動作シナリオのPOMDPを事前に(例えば、オフラインで)解決して、ポリシーを生成してもよい。ポリシーは、現在観測されている状態及び/又は予測されている状態を考慮してAVを制御するための1つ以上のアクションを含んでもよい。自律走行中に(例えば、オンラインで)特定の動作シナリオに遭遇すると、POMDPがインスタンス化されてもよく、そのポリシーをインスタンスによって使用して、各タイムステップで、そのタイムステップにおいて観測された状態及び/又は予測された状態に基づいてAVを制御するためのそれぞれのアクションを提供し得る。
自律走行車動作管理コントローラは、インスタンス化されたそれぞれのシナリオ固有の動作管理評価モジュール(SSOCEM)インスタンスから候補車両制御アクションを受信し、候補車両制御アクションから車両制御アクションを識別し、識別された車両制御アクションに従って車両交通ネットワークの一部を通行するように自律走行車を制御してもよい。
HDセンサ及びSDマップの道路の新たに生成されたHPマップに基づいて決定されたDC情報は、車両が道路上で遭遇し得るDCに基づいて通行時間を予測するために、上述のように、車線レベルルートプランナによる後続の計画に使用され得る。したがって、車両は、例えば、車両のメモリ内に、メモリに記憶された実行可能命令として、又は専用ハードウェアとしてDCを含んでもよい(図示せず)。
安全性DC1306は、リスクを認識した決定を行うことができる。安全性DC1306は、HDマップ道路に向かってSDマップ道路上での注意深いナビゲーションを監視することによって、リスクを認識した決定を取得することができる。安全性DC1306の全体的な目的は、障害物が存在し、経路を閉塞し、車両と相互作用するように移動する可能性がある場合に、信念に基づく相互作用を考慮することによって安全な通行を確保するために、SDマップの道路上の車両の軌道を制約するアクションを提供することである。安全性DC1306によって提供(例えば、選択)されるアクションは、SDマップの道路を通行するために車両のアクチュエータを制御するために、図1のコントローラ130等のコントローラに提供され得る。SDマップの道路は、HDマップの詳細の欠如のために自律的に通行することが危険であり得るので、安全性DC1306は、道路を自律的に通行することを継続すべきか停止すべきかを決定するために使用され得る。安全性DC1306が道路を自律的に通行することを停止すべきであると決定した場合、テレオペレータ要求が開始され、それによりテレオペレータが道路の残りの部分を通行するように車両を遠隔制御し得る。一例では、安全性DC1306は、車両のユーザ(例えば、運転者)に車両を手動制御するように指示し得る。
車両が道路を通行しているとき、安全性DC1306は、各タイムステップで、道路を通行し続けることが安全かどうかを決定し得る。安全性DC1306は、MDP又はPOMDP等のマルコフ決定過程であり得る。
安全性DC1306は、次の時間ステップに対する速度を決定してもよく、アクション(例えば、左に行く、右に行く、直進する、停止する等)を選択し得る。安全性DC1306は、最も近いHDマップ車線の方向に基づいて速度又は方向を選択し得る。
一例では、安全性DC1306は、道路の走行可能領域を通行するためのアクションを決定し得る。道路の走行可能領域は、AVを安全に動作させることができる道路の領域である。走行可能領域の決定は、2018年5月31日に出願されたPCT特許出願第PCT/US2018/035441号に記載されている通りであってもよく、その全体の開示は、本明細書に組み込まれている。したがって、走行可能領域の取得は、以下の通りであってもよい。最初に、走行可能領域は、車両が安全に走行することが予測できない領域(例えば、先読みウインドウ内の道路全体)を含んでもよい。車両のセンサデータに基づいて、静的及び動的(例えば、移動)オブジェクトが検出(例えば、感知、観測等)され得る。車両が安全に走行すると予測できない領域は、道路から切り取られ得る(例えば、除外される、区分けされる)。静的オブジェクトが位置している(例えば、観測された、検出された)道路の部分が、最初に走行可能領域から削除される。走行可能領域は、動的オブジェクトに対してさらに調整され得る。各動的オブジェクトのそれぞれの予測軌道に基づいて、走行可能領域の一部がさらに切り取られ得る。車両の将来の位置は、動的な(すなわち、識別された移動)オブジェクトの将来の予測(例えば、期待)位置に対して評価され得る。次に、車両の走行可能領域は、動的オブジェクトの(例えば、重複)位置に対応する走行可能領域の中の領域を削除するように調整され得る。
走行可能領域は、車両が道路を通行するように制御されるトンネルを車両の周りに形成することによってさらに調整され得る。トンネルは、走行可能領域をさらに制限するものと見なされ得る。左境界及び右境界は、車両の左右の側に沿って横方向に延長され得る。左境界及び右境界は、車両の左右の側から定義された距離であってもよい。定義された距離は、可能性のある外部オブジェクトからの車両の所望のクリアランスに基づいてもよい。例えば、駐車している車両のドアが開くことがある。車のドアの最大サイズは約1メートルであるため、車両と左右の境界のそれぞれとの間の定義された距離は1メートルであってもよい。定義された距離は、事前に定義された間隔の許容値に基づいてもよい。定義された距離は、例えば、外部オブジェクトの存在を考慮するように変化してもよい。例えば、定義された距離は、車両によって外部オブジェクトが検出されない場合の第1の値であってもよく、外部オブジェクトが検出された場合の第1の値より小さい第2の値であってもよい。左境界及び右境界は、車両から、つまり異なる距離だけ車両から離れていてもよい(例えば、車両の一方の側には外部オブジェクトがあるが、他方の側にはない場合、又は車両の反対側に2つの異なる外部オブジェクトがあり、それにより2つの異なる定義された距離が生じる場合)。
安全性DC1306は、(センサからHDマップを学習しながら)SDマップの道路をナビゲートするために使用され得る。安全性DC1306は、道路に沿った軌道の時間ステップ間(例えば、秒から秒)の制約を提供し得る。
安全性DC1306の状態空間は、S=Sl×Sm×Sbによって与えられてもよく、ここで、Slは、SDマップの道路に沿った位置のセットであり、Smは、それらの位置でモーション(例えば、他の車両、歩行者、自転車等の動的オブジェクトのモーション)が検出されるかどうかを示し、Sbは、それらの位置で障害物(例えば、静的オブジェクト)が検出されるかどうかを示す。別の言い方をすると、状態空間Sは、位置Smにモーションがある場合、及びその位置Sbに障害物がある場合に、SDマップSlの道路に沿った位置を考慮する。道路の車線はまだ知られていない(例えば、マッピングされていない)ことに留意されたい。
安全性DC1306のアクション空間は、A=Am×Aoによって与えられてもよく、これは、アクション及び方向を考慮する。Amは、「停止」、「少しずつ進む」、「進む」等の動作を記述する。Aoは、「車線の左」、「車線の中央」、「車線の右」等の方向調整アクションを記述する。
モデルの遷移関数に関して、状態係数Slは距離又は速度制限に比例する確率で前方に遷移し得る。例えば、マップ内で通行する及び少しずつ進む最大通行時間がtmax(例えば、42.23)秒である場合、最大通行時間遷移の確率が1になるように、この最大通行時間を正規化スケールとして使用し得る。tの通行時間を有する他の全ての遷移は、確率t/tmaxで前進し得る。制限速度又は道路の距離等の他の変数を使用して同様の計算が実行され得る。代替的に、遷移確率は、(プラニング段階中に)常に進むことを示す定数1.0に設定されてもよい。
モーション検出状態係数Sm、及び障害物検出状態係数Sbは、到着又は他の形態の道路ユーザの量の履歴データから導出され得る。例示すると、探索中の道路で自転車車線が検出された場合(又はSDマップで自転車車線がすでに認識されている場合)であって、自転車車線のある道路には毎分0.123の確率で自転車が到着することが、過去に走行したルートから認識されている場合、このような履歴情報を使用して、自転車がない状態から自転車がある状態に遷移Smし得る。すなわち、(1-0.123=0.877)は、自転車なしの残りの確率であり得る。状態係数Sbは状態係数Smに似ているが、あるタイプのオブジェクトの静的バージョンに使用される。車両、歩行者、及び検出され得る他のオブジェクトに同じ原理が適用され得る。
状態係数Sm及びSbは、移動及び閉塞するオブジェクトに対して、それぞれ0及び1のバイナリ値を有し得る。状態係数値Sm及びSbのバイナリ値は、安全性及び通行可能性を推定するのに十分であり得る。別の例では、追加的な又は代替的な状態変数が使用され得る。例えば、所定のタイプの期待されるオブジェクトの数(例えば、濃度)を示す状態変数も使用され得る。このような状態変数は、整数値(例えば、0,1,2,...)を有してもよく、ポアソン/指数又は出生死滅過程に従うようにモデル化され得る。例えば、状態変数Sve、Spe及びSbiは、シーンで予想される車両、自転車、及び歩行者の数をそれぞれ示し得る。
報酬関数は、アクションが実行された後の車両の観測に基づき得る。例えば、報酬は、オブジェクトが検出されたか否か、オブジェクトが右側に検出されたか否か、オブジェクトが左側に検出されたか否か、経路が妨害されているか否か、検出されたオブジェクトが分類(例えば、認識)されるか否か、検出されたオブジェクトが危険であるとみなされるか否か、より少ない基準、より多い基準、又はそれらの組み合わせに基づいてもよい。
言い換えると、知覚された特徴(移動オブジェクト、道路の閉塞、障害物、その他のオブジェクト等)があるかどうかに関わらず、状態はSDマップに沿った位置を示す。例えば、道路の右側に建物があり、道路の左側に高いフェンスがあり得る。これらの特徴は、さもなければHDマップでは利用可能であり得るが、SDマップでは利用可能でない場合がある。したがって、車両のセンサデータは、これらの特徴(障害物等)を認識するために使用されてもよい。安全性DC1306は、アクションの方向(例えば、左、右、中央)と共に、SDマップ上の各ポイントにおいて(例えば、10、20,100メートル又は何らかの他の距離ごとに)アクション(例えば、停止、少しずつ進む、又は進行を決定し得る。
一例では、安全性DC1306は、POMDPの代わりに、目標不確定確率最短経路(goal uncertain Stochastic Shortest Path;GU-SSP)を使用し得る。GU-SSPは、目標不確定性のある確率的環境におけるルートプランニング及び意思決定のモデル化に使用され得る。GU-SSPは、S.Saisubramanian,K.H.Wray,L.Pineda及びS.Zilbersteinによる,“Planning in Stochastic Environments with Goal Uncertainty,”2019 IEEE/RSJ International Conference on Intelligent Robots and Systems(IROS),Macau,China,2019,pp.1649-1654,doi:10.1309/IROS40897.2019.8967718.に記載されている。
図14は、本開示の実装によるSDマップの道路のマッピングの例1400に関する説明図である。例1400は、AV1402がAV1402のセンサを使用してSDマップの道路をどのようにマッピングするかを示す。AVのセンサからのデータは、SDマップの道路のHD情報を検出するために使用され得る。
例1400は、車両のHDマップに含まれていない道路1404を含むマップを示している。つまり、道路1404はマッピングされていない。しかしながら、道路1404は車両のSDマップに含まれている。道路1404の初期の幅又は車線は、SDマップから推定され得る。幅及び車線は、任意の車線認識技術を使用して推定され得る。円1406等の円は、図13の安全性DC1306の決定がAV1402の軌道プランナにアクションを提供する道路に沿った位置を示す。
図13のマッパ1304によって、オブジェクト1408が検出される。オブジェクト1408に関連する特定の動作シナリオが識別されてもよく、オブジェクト1408を処理(例えば、対処、回避、迂回等)するために対応するDCがインスタンス化される。例えば、オブジェクト1408は、動作シナリオが「通過車両シナリオ」であることを示す駐車車両であると判断してもよく、対応するDCはオブジェクト1408を迂回するためにインスタンス化される。領域1410A、1410Bは、走行不可能領域として認識されてもよく、車両1402のHDセンサから計算される。
軌道1412は、車両1402が道路1404上で辿った軌道を示す。軌道1412は、車両の意思決定過程によって決定されてもよく、これは、少なくとも図13のプランナ1302及び安全性DC1306であり得るか又はそれを含んでもよい。意思決定過程は、車両1402を制御するためのアクションを選択する。アクションは、右に行く、左に行く、直進する、停止する、少しずつ進む等の上述したものであってもよい。
図15は、本開示の実装に従った自律走行車の自動運転におけるルートプランニングの技術1500の一例を示すフローチャートである。技術1500は、自律走行車によって、又は自律走行車内で実装され得る。自律走行車は、半自律走行車であってもよい。技術1500は、図1のメモリ134等のメモリに記憶される命令(例えば、動作)として実装され得る。命令は、図1のプロセッサ133等のプロセッサによって実行され得る。技術300は、専用のハードウェア又はファームウェアを使用して実装され得る。複数のプロセッサ、メモリ、又はその両方が使用されてもよい。
ステップ1502において、この技術1500は、ルートを取得するために高精細マップに加えて標準精細マップが使用されるべきことの指示を取得する。この指示は、AVのユーザ(例えば、運転者、乗員)から取得され得る。一例では、指示は、テレオペレータから取得され得る。一例では、指示は、ルートを取得するルートプランナに目的として提供され得る。ルートプランナは、本明細書に記載の多目的ルートプランナであり得る。目的は、例えば、図10及び図11に関して本明細書に記載されているようなユーザインターフェースを使用して提供され得る。一例では、指示は、「マッピングされていない道路を探索する」というコマンドを本質的に伝えることができる口頭コマンドを介して提供され得る。
ステップ1504において、技術1500は、車両を目的地まで自動運転するためのルートを取得する。ルートは、標準精細マップの道路を含む。ルートは、マルコフ決定過程(MDP)を使用して取得され得る。マルコフ決定過程はPOMDPであってもよい。マルコフ決定過程は、道路の通行可能性Stに関して上述したように、道路の通行可能性を示す状態空間を含んでもよい。
ステップ1506において、技術1500は、安全性決定コンポーネントからポリシーを取得する。安全性決定コンポーネントは、図13の安全性DC1306に関して上述したようなものであってもよい。そのため、ポリシーは道路の状態に対するアクションを提供し、アクションは道路に沿った自律走行車の軌道を制約する。上述のように、安全性決定コンポーネントの状態空間は、道路の位置に対して、その位置でモーションが検出されるかどうか、及びその位置で障害物が検出されるかどうかを含む。安全性決定コンポーネントは、アクション空間を含む。道路の位置で取るべきアクション空間のアクションは、移動及び移動の方向を示す。
ステップ1508において、技術1500は、安全性決定コンポーネントからアクションを受信する。安全性決定コンポーネントは、それぞれのタイムステップでアクションを提供し得る。アクションは、ポリシーを使用して取得される。ステップ1510において、技術1500は、アクションに従って自律的に道路を通行する。すなわち、アクションは車両の軌道プランナに提供されてもよく、車両は、道路を通行するアクションに従って制御され得る。アクションに従って道路を自律的に通行することは、ルートに沿って動作シナリオを識別すること、及び動作シナリオに対して決定コンポーネントをインスタンス化することを含んでもよい。例示すると、車両が道路を通行しているときに、車両のセンサデータを使用して交差点が識別されてもよい。その後、交差点を通行するためのDCがインスタンス化されて、交差点を通行するアクションを提供し得る。
一例では、技術1500は、道路の車線セグメントを識別すること、及び車線セグメントの車線セグメント情報をナビゲーションマップに記憶することをさらに含み、これは上述のようにすることができる。
本明細書で使用される場合、「命令」という用語は、本明細書に開示の任意の方法を実行するための指示若しくは表現、又はその任意の部分若しくは複数の部分を含んでもよく、ハードウェア、ソフトウェア又はこれらの任意の組み合わせで実現されてもよい。例えば、命令は、本明細書に記載の各方法、アルゴリズム、態様又はこれらの組み合わせのいずれかを行うためにプロセッサによって実行され得るメモリに記憶されたコンピュータプログラム等の情報として実装されてもよい。命令又はその一部は、本明細書に記載の任意の方法、アルゴリズム、態様又はその組み合わせを行うための専用ハードウェアを含み得る専用プロセッサ又は回路として実装されてもよい。いくつかの実装では、命令の部分は、直接的に又はローカルエリアネットワーク、ワイドエリアネットワーク、インターネット又はこれらの組み合わせ等のネットワークを介して通信し得る複数の装置又は単一の装置上の複数のプロセッサに分散されてもよい。
本明細書で使用される場合、「例示」、「実施形態」、「実装」、「態様」、「特徴」又は「要素」という用語は、用例、例示又は実例としての役割を果たすことを示している。明示されない限り、任意の例示、実施形態、実装、態様、特徴又は要素が、互いの例示、実施形態、実装、態様、特徴又は要素から独立しており、任意の他の例示、実施形態、実装、態様、特徴又は要素と組み合わせて使用されてもよい。
本明細書で使用される場合、「決定」及び「識別」又はこれらの任意の変形の用語は、図示の及び本明細書に記載の1つ以上の装置を使用するいかなるやり方で選択、確認、計算、検索、受信、決定、確立、取得、又は他のやり方で識別又は決定することを含んでいる。
本明細書で使用される場合、「又は」という用語は、特に明記されていない限り、又は文脈から明らかな場合を除き、排他的な「又は」ではなく包含的な「又は」を意味することが意図されている。さらに、本願及び添付の請求項の中で使用される“a”及び“an”という冠詞は、一般に、単数形を指していることが文脈から明確であるか又は他に特段の定めがない限り、「1つ以上の」を意味すると解釈されるべきである。
さらに、説明の簡潔のため、本明細書の図面及び説明は一連のステップ又は段階又はシーケンスを含み得るが、本明細書に開示の方法の要素は、様々な順番で又は同時に起こってもよい。さらに、本明細書に開示の方法の要素は、本明細書に明示的に提示及び開示されていない他の要素と共に起こってもよい。さらに、本明細書に記載の方法の全ての要素が、本開示による方法を実装することを要求されるとは限らない。態様、特徴及び要素は特定の組み合わせで本明細書に記載されているが、各態様、特徴又は要素は、他の態様、特徴及び要素と共に又はそれらなしで独立して又は様々な組み合わせで使用されてもよい。
上記の態様、例示及び実装は、本開示の理解を容易にするために記載されており、限定するものではない。対照的に、本開示は、添付の特許請求の範囲内に含まれる様々な修正及び等価な構成を包含しており、特許請求の範囲は、法的に認められている全てのこのような修正及び均等構造を包含するように最も広く解釈されるべきである。
Claims (20)
- 自律走行車の自動運転におけるルートプランニングのための方法において、
ルートを取得するために高精細マップに加えて標準精細マップが使用されるべきことの指示を取得することと、
車両を目的地まで自動運転するために前記ルートを取得することであって、前記ルートは、前記標準精細マップの道路を含むことと、
安全性決定コンポーネントからポリシーを取得することであって、前記ポリシーは、前記道路の状態に対するアクションを提供し、前記アクションは、前記道路に沿って前記自律走行車の軌道を制約することと、
前記安全性決定コンポーネントから前記アクションを受信することと、
前記アクションに従って前記道路を自律的に通行することと
を含む、方法。 - 前記車両を前記目的地まで自動運転するために前記ルートを取得することは、
前記ルートを取得するためにマルコフ決定過程を使用することを含み、前記マルコフ決定過程は、前記道路の通行可能性を示す状態空間を含む、請求項1に記載の方法。 - 前記指示は、多目的の中の1つの目的である、請求項2に記載の方法。
- 前記安全性決定コンポーネントは、状態空間を含み、前記状態空間は、前記道路の位置について、モーションが前記位置で検出されるかどうか、及び障害物が前記位置で検出されるかどうかを含む、請求項1に記載の方法。
- 前記安全性決定コンポーネントは、アクション空間を含み、
前記道路の前記位置で取るべき前記アクション空間のアクションは、移動及び前記移動の方向を示す、請求項4に記載の方法。 - 前記アクションに従って前記道路を自律的に通行することは、
前記ルートに沿った動作シナリオを識別することと、
前記動作シナリオに対して決定コンポーネントをインスタンス化することと
を含む、請求項1に記載の方法。 - 前記道路の車線セグメントを識別することと、
ナビゲーションマップ内の前記車線セグメントの車線セグメント情報を記憶することと
をさらに含む、請求項1に記載の方法。 - 自律走行車の自動運転におけるルートプランニングのための装置において、
ルートを取得するために高精細マップに加えて標準精細マップが使用されるべきことの指示を取得することと、
車両を目的地まで自動運転するために前記ルートを取得することであって、前記ルートは、前記標準精細マップの道路を含むことと、
安全性決定コンポーネントからポリシーを取得することであって、前記ポリシーは、前記道路の状態に対するアクションを提供し、前記アクションは、前記道路に沿って前記自律走行車の軌道を制約することと、
前記安全性決定コンポーネントから前記アクションを受信することと、
前記アクションに従って前記道路を自律的に通行するように前記自律走行車を制御することと
を行うように構成されるプロセッサを備える、装置。 - 前記車両を前記目的地まで自動運転するために前記ルートを取得することは、
前記ルートを取得するためにマルコフ決定過程を使用することを含み、前記マルコフ決定過程は、前記道路の通行可能性を示す状態空間を含む、請求項8に記載の装置。 - 前記指示は、多目的の中の1つの目的である、請求項9に記載の装置。
- 前記安全性決定コンポーネントは、状態空間を含み、前記状態空間は、前記道路の位置について、モーションが前記位置で検出されるかどうか、及び障害物が前記位置で検出されるかどうかを含む、請求項8に記載の装置。
- 前記安全性決定コンポーネントは、アクション空間を含み、
前記道路の前記位置で取るべき前記アクション空間のアクションは、移動及び前記移動の方向を示す、請求項11に記載の装置。 - 前記プロセッサは、
前記ルートに沿った動作シナリオを識別することと、
前記動作シナリオに対して決定コンポーネントをインスタンス化することと
を行うようにさらに構成される、請求項8に記載の装置。 - 前記プロセッサは、
前記道路の車線セグメントを識別することと、
ナビゲーションマップ内の前記車線セグメントの車線セグメント情報を記憶することと
を行うようにさらに構成される、請求項8に記載の装置。 - プロセッサによって実行されると、自律走行車の自動運転におけるルートプランニングのための動作の実行を容易にする実行可能命令を含む非一時的なコンピュータ可読記憶媒体において、前記動作は、
ルートを取得するために高精細マップに加えて標準精細マップが使用されるべきことの指示を取得することと、
車両を目的地まで自動運転するために前記ルートを取得することであって、前記ルートは、前記標準精細マップの道路を含むことと、
安全性決定コンポーネントからポリシーを取得することであって、前記ポリシーは、前記道路の状態に対するアクションを提供し、前記アクションは、前記道路に沿って前記自律走行車の軌道を制約することと、
前記安全性決定コンポーネントから前記アクションを受信することと、
前記アクションに従って前記道路を自律的に通行することと
を含む、非一時的なコンピュータ可読記憶媒体。 - 前記車両を前記目的地まで自動運転するために前記ルートを取得することは、
前記ルートを取得するためにマルコフ決定過程を使用することを含み、前記マルコフ決定過程は、前記道路の通行可能性を示す状態空間を含む、請求項15に記載の非一時的なコンピュータ可読記憶媒体。 - 前記指示は、多目的の中の1つの目的である、請求項16に記載の非一時的なコンピュータ可読記憶媒体。
- 前記安全性決定コンポーネントは、状態空間を含み、前記状態空間は、前記道路の位置について、モーションが前記位置で検出されるかどうか、及び障害物が前記位置で検出されるかどうかを含む、請求項15に記載の非一時的なコンピュータ可読記憶媒体。
- 前記安全性決定コンポーネントは、アクション空間を含み、
前記道路の前記位置で取るべき前記アクション空間のアクションは、移動及び前記移動の方向を示す、請求項18に記載の非一時的なコンピュータ可読記憶媒体。 - 前記アクションに従って前記道路を自律的に通行することは、
前記ルートに沿った動作シナリオを識別することと、
前記動作シナリオに対して決定コンポーネントをインスタンス化することと
を含む、請求項15に記載の非一時的なコンピュータ可読記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US17/215,887 US20220306156A1 (en) | 2021-03-29 | 2021-03-29 | Route Planner and Decision-Making for Exploration of New Roads to Improve Map |
US17/215,887 | 2021-03-29 | ||
PCT/US2022/017516 WO2022211932A1 (en) | 2021-03-29 | 2022-02-23 | Route planner and decision-making for exploration of new roads to improve map |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024514078A true JP2024514078A (ja) | 2024-03-28 |
Family
ID=80736119
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023559777A Pending JP2024514078A (ja) | 2021-03-29 | 2022-02-23 | マップを改良するために新しい道路を探索するためのルートプランナ及び意思決定 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20220306156A1 (ja) |
EP (1) | EP4314713A1 (ja) |
JP (1) | JP2024514078A (ja) |
CN (1) | CN117242315A (ja) |
WO (1) | WO2022211932A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112874502B (zh) * | 2021-03-01 | 2022-07-12 | 南京航空航天大学 | 一种智能交通环境下的线控底盘信息物理系统及控制方法 |
US20220388515A1 (en) * | 2021-06-02 | 2022-12-08 | Michael A Carlson | Lane split decision techniques for vehicle lateral control path planning |
US20230066635A1 (en) * | 2021-08-26 | 2023-03-02 | Motional Ad Llc | Controlling vehicle performance based on data associated with an atmospheric condition |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102009047410A1 (de) * | 2009-12-02 | 2011-06-09 | Robert Bosch Gmbh | Verfahren und Navigationsgerät zum dynamischen Ermitteln eines Routenverlaufs |
WO2018087550A2 (en) * | 2016-11-09 | 2018-05-17 | Inventive Cogs (Campbell) Limited | Vehicle route guidance |
US20190113920A1 (en) * | 2017-10-18 | 2019-04-18 | Luminar Technologies, Inc. | Controlling an autonomous vehicle using model predictive control |
EP3701223B1 (en) * | 2017-10-24 | 2023-03-01 | Nissan North America, Inc. | Localization determination for vehicle operation |
KR20190072834A (ko) * | 2017-12-18 | 2019-06-26 | 삼성전자주식회사 | 차량의 종방향 속도를 제어하는 장치 및 방법 |
EP3854646B1 (en) * | 2018-08-14 | 2024-05-29 | Mobileye Vision Technologies Ltd. | Systems and methods for navigating with safe distances |
US11073831B2 (en) * | 2018-10-17 | 2021-07-27 | Baidu Usa Llc | Autonomous driving using a standard navigation map and lane configuration determined based on prior trajectories of vehicles |
US11181922B2 (en) * | 2019-03-29 | 2021-11-23 | Zoox, Inc. | Extension of autonomous driving functionality to new regions |
KR102307861B1 (ko) * | 2019-05-21 | 2021-10-01 | 엘지전자 주식회사 | 경로 제공 장치 및 그것의 경로 제공 방법 |
US10969232B1 (en) * | 2019-12-06 | 2021-04-06 | Ushr Inc. | Alignment of standard-definition and High-Definition maps |
US11143516B2 (en) * | 2019-12-30 | 2021-10-12 | GM Cruise Holdings, LLC | Task management system for high-definition maps |
US11199841B1 (en) * | 2020-07-08 | 2021-12-14 | Nuro, Inc. | Methods and systems for determination of a routing policy for an autonomous vehicle |
-
2021
- 2021-03-29 US US17/215,887 patent/US20220306156A1/en active Pending
-
2022
- 2022-02-23 JP JP2023559777A patent/JP2024514078A/ja active Pending
- 2022-02-23 WO PCT/US2022/017516 patent/WO2022211932A1/en active Application Filing
- 2022-02-23 CN CN202280025725.9A patent/CN117242315A/zh active Pending
- 2022-02-23 EP EP22709892.8A patent/EP4314713A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20220306156A1 (en) | 2022-09-29 |
WO2022211932A1 (en) | 2022-10-06 |
CN117242315A (zh) | 2023-12-15 |
EP4314713A1 (en) | 2024-02-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2734744C1 (ru) | Оперативное управление автономным транспортным средством, включающее в себя работу экземпляра модели частично наблюдаемого марковского процесса принятия решений | |
US11782438B2 (en) | Apparatus and method for post-processing a decision-making model of an autonomous vehicle using multivariate data | |
JP6897938B2 (ja) | 車両交通ネットワークの横断に使用される方法と自律走行車 | |
JP2022163098A (ja) | 自律走行車の動作管理 | |
US11945441B2 (en) | Explainability and interface design for lane-level route planner | |
US20210173402A1 (en) | Systems and methods for determining vehicle trajectories directly from data indicative of human-driving behavior | |
EP3555568A2 (en) | Vehicle route guidance | |
US20220306156A1 (en) | Route Planner and Decision-Making for Exploration of New Roads to Improve Map | |
US11307585B2 (en) | Introspective competence modeling for AV decision making | |
US11921506B2 (en) | Belief state determination for real-time decision-making | |
US11946760B2 (en) | Navigation map learning for intelligent hybrid-electric vehicle planning | |
US20200283014A1 (en) | Continual Planning and Metareasoning for Controlling an Autonomous Vehicle | |
JP6330921B2 (ja) | 乗客ドッキング位置を使用した自律走行車両のルーティング及びナビゲーション | |
US20230174042A1 (en) | Intelligent Engine Activation Planner | |
US11613269B2 (en) | Learning safety and human-centered constraints in autonomous vehicles | |
JP2024517167A (ja) | 系統的最適化を伴う車両案内 | |
US11993281B2 (en) | Learning in lane-level route planner | |
GB2560487A (en) | Vehicle route guidance | |
US20220274624A1 (en) | Learning in Lane-Level Route Planner | |
US20220276653A1 (en) | Lane-Level Route Planner for Autonomous Vehicles |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231211 |