JP2023528078A - 自律エージェントの不確実性推定に基づく決定論的軌道選択のための方法およびシステム - Google Patents
自律エージェントの不確実性推定に基づく決定論的軌道選択のための方法およびシステム Download PDFInfo
- Publication number
- JP2023528078A JP2023528078A JP2022574686A JP2022574686A JP2023528078A JP 2023528078 A JP2023528078 A JP 2023528078A JP 2022574686 A JP2022574686 A JP 2022574686A JP 2022574686 A JP2022574686 A JP 2022574686A JP 2023528078 A JP2023528078 A JP 2023528078A
- Authority
- JP
- Japan
- Prior art keywords
- uncertainty
- trajectory
- learning
- agent
- trained
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 209
- 230000009471 action Effects 0.000 claims abstract description 70
- 238000009826 distribution Methods 0.000 claims description 102
- 230000033001 locomotion Effects 0.000 claims description 64
- 230000008447 perception Effects 0.000 claims description 18
- 238000013507 mapping Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 abstract description 66
- 239000003795 chemical substances by application Substances 0.000 description 144
- 230000006870 function Effects 0.000 description 33
- 238000012549 training Methods 0.000 description 29
- 230000004807 localization Effects 0.000 description 21
- 230000001960 triggered effect Effects 0.000 description 21
- 230000004044 response Effects 0.000 description 18
- 238000001514 detection method Methods 0.000 description 17
- 238000011084 recovery Methods 0.000 description 15
- 238000013459 approach Methods 0.000 description 14
- 238000013528 artificial neural network Methods 0.000 description 13
- 230000007704 transition Effects 0.000 description 13
- 230000006399 behavior Effects 0.000 description 11
- 230000008901 benefit Effects 0.000 description 11
- 230000003068 static effect Effects 0.000 description 11
- 238000012545 processing Methods 0.000 description 10
- 230000004931 aggregating effect Effects 0.000 description 8
- 230000007613 environmental effect Effects 0.000 description 8
- 238000010276 construction Methods 0.000 description 6
- 230000002787 reinforcement Effects 0.000 description 6
- 238000010200 validation analysis Methods 0.000 description 6
- 230000001133 acceleration Effects 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 4
- 206010040030 Sensory loss Diseases 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000001953 sensory effect Effects 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000005096 rolling process Methods 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 230000029305 taxis Effects 0.000 description 2
- 208000009119 Giant Axonal Neuropathy Diseases 0.000 description 1
- 230000001594 aberrant effect Effects 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 239000010426 asphalt Substances 0.000 description 1
- 230000000386 athletic effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 201000003382 giant axonal neuropathy 1 Diseases 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W60/00—Drive control systems specially adapted for autonomous road vehicles
- B60W60/001—Planning or execution of driving tasks
- B60W60/0011—Planning or execution of driving tasks involving control alternatives for a single driving scenario, e.g. planning several paths to avoid obstacles
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/02—Control of position or course in two dimensions
- G05D1/021—Control of position or course in two dimensions specially adapted to land vehicles
- G05D1/0212—Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
- G05D1/0219—Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory ensuring the processing of the whole working surface
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/0088—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots characterized by the autonomous decision making process, e.g. artificial intelligence, predefined behaviours
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/02—Control of position or course in two dimensions
- G05D1/021—Control of position or course in two dimensions specially adapted to land vehicles
- G05D1/0212—Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
- G05D1/0214—Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory in accordance with safety or protection criteria, e.g. avoiding hazardous areas
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/02—Control of position or course in two dimensions
- G05D1/021—Control of position or course in two dimensions specially adapted to land vehicles
- G05D1/0212—Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
- G05D1/0221—Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving a learning process
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2155—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W2556/00—Input parameters relating to data
- B60W2556/20—Data confidence level
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Automation & Control Theory (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Aviation & Aerospace Engineering (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Game Theory and Decision Science (AREA)
- Business, Economics & Management (AREA)
- Human Computer Interaction (AREA)
- Transportation (AREA)
- Mechanical Engineering (AREA)
- Traffic Control Systems (AREA)
- Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
- Control Of Driving Devices And Active Controlling Of Vehicle (AREA)
Abstract
Description
本出願は、2020年6月5日に出願された米国仮出願第63/035,401号、並びに、2020年7月23日に出願された米国仮出願第63/055,794号の利益を主張するものであり、その各々は、この引用によりその全体が援用されるものとする。
図1に示すように、不確実性推定に基づく決定論的軌道選択のためのシステム100は、1または複数のコンピューティングシステムのセットを含む。追加的または代替的には、システムは、自律エージェント(本明細書では同等に、自律車両および/または自己車両ともいう)、車両制御システム、センサシステム、および/または他の任意の適切なコンポーネントまたはコンポーネントの組合せのうちの何れかまたはすべてを含むことができるか、かつ/またはそれらの何れかまたはすべてと相互作用することができる。
不確実性推定を使用する決定論的軌道選択のためのシステムおよび方法は、現在のシステムおよび方法を上回るいくつかの利点を与えることができる。
図1に示すように、不確実性推定に基づく決定論的軌道選択のためのシステム100は、1または複数のコンピューティングシステムのセットを含む。追加的または代替的には、システムは、自律エージェント(本明細書では同等に、自律車両および/または自己車両ともいう)、車両制御システム、センサシステム、および/または他の任意の適切なコンポーネントまたはコンポーネントの組合せのうちの何れかまたはすべてを含むことができるか、かつ/またはそれらの何れかまたはすべてと相互作用することができる。
システム100は、コンピューティングシステムを含み、不確実性推定(例えば、分布外検出を含む)、意思決定、軌道生成、フォールバック動作計画(例えば、古典的な運動プランナによるフォールバック軌道の生成)、緊急計画、軌道の妥当性検証、および/または自律エージェントの他の任意のプロセスの何れかまたはすべてを実行するように機能することができる。追加的または代替的には、コンピューティングシステムは、知覚、位置特定(例えば、位置特定モジュールにおける車両および/または周囲の物体の位置特定)、予測(例えば、予測モジュールにおける車両および/または車両の周囲の物体の経路予測)、情報の記憶、および/または他の任意の適切な機能の何れかまたはすべてを実行するよう機能することができる。
図2に示すように、方法200は、入力のセットを受け取るステップS210と、出力のセットを決定するステップS215と、入力のセットのうちの何れかまたはすべておよび/または出力のセットのうちの何れかまたはすべてに関連する不確実性パラメータを求めるステップと、不確実性パラメータを評価し、それに応じて任意選択的に、プロセスおよび/またはアクションをトリガーするステップS230とを含む。追加的または代替的には、方法200は、他の任意の適切なプロセスおよび/またはプロセスの組合せを含むことができる。
方法200は、入力のセットを受け取るステップS220を含み、これは、方法の後続のプロセスを実行するための情報を受け取るように機能する。これは、例えば、1または複数の出力(例えば、学習済みモデルの出力、中間出力など)を決定すること、1または複数の不確実性の値を計算すること、データが分布内か分布外かを判定すること、および/または他の任意の適切なプロセスを実行する際に用いること、のうちの何れかまたはすべてを実行するための情報を含むことができる。追加的または代替的には、S210は、1または複数のプロセスをトリガーするように、自律エージェントのモジュール(例えば、知覚、予測、位置特定、計画など)のうちの何れかまたはすべてに通知するように、他の方法で自律エージェントを操作するために使用されるように、かつ/または他の任意の適切な位置を実行するように機能することができる。
方法200は、出力のセットS215を決定することを含み、これは、最終的に自律エージェントを制御するための出力を決定するように機能する。追加的または代替的には、S215は、実装する1または複数の学習済みモデルを選択し、エージェントによって実施される軌道の選択肢(例えば、学習対プログラム対最小リスクなど)を提供し、かつ/または他の任意の適切な機能を実行するように機能することができる。
方法200は、入力のセットおよび/または出力のセットに付随する不確実性の値のセットを求めるステップS220を含み、これは、入力のセット(例えば、S210で受信されたもの、モジュールのセットの何れかまたはすべてで受信されたものなど)の何れかまたはすべてが分布外データに対応するかどうか、出力のセットの何れかまたはすべてと付随する不確実性、(例えば、連続する一連の出力に対する、様々な不確実性のタイプ間の)集約された不確実性のうちの何れかまたはすべてを求めるように機能することができ、かつ/またはS220は他の任意の適切な情報を求めるように機能することができる。S220は、追加的または代替的に、S230における1または複数のアクションなど、本方法の1または複数のプロセスをトリガーし、(例えば、出力の不確実性が閾値を超える場合に)本方法の1または複数のプロセスをスキップし、かつ/または他の任意の適切な機能を実行するように機能することができる。
方法200は、不確実性パラメータのセットを評価し、任意選択的にアクションおよび/またはプロセスをトリガーするステップS230を含み、これは、本方法において受け取った入力のセット、本方法により生成された出力のセット、本方法の任意のプロセス、および/またはパラメータの任意の組合せのうちの何れかまたはすべての信頼性を評価し、それに応じて応答するように機能する。追加的または代替的には、S230は、1または複数のプロセスおよび/またはコンポーネントをトリガーし、複数の出力オプションの間で選択し、1または複数のプロセスのスキップをトリガーし(例えば、緊急プランナに直接進み)、1または複数のプロセスのパフォーマンスを変え、システムの安全性を確保し、決定論的軌道の決定を可能にするように機能し、かつ/または1または複数の他の任意の適切な機能を実行することができる。
本方法は、他の任意の適切なプロセス、例えば、選択された軌道(例えば、学習軌道、フォールバック軌道、緊急プランナ軌道など)に従って車両を動作させること、軌道に基づいて制御コマンドのセットを決定すること、制御コマンドのセットに基づいて車両を動作させること、および/または他の任意の適切なプロセスのうちの何れかまたはすべてをさらに含むことができる。
システム100の第1の態様では、本システムが、エージェントの学習軌道の決定に関与する少なくとも1または複数の学習済みモデルのセットを具備および/または実装するコンピューティングシステムと、分布外検出器と、ゲートキーパと、フォールバック運動プランナと、緊急プランナとを含む。追加的または代替的には、本システムは、他のモジュール(例えば、計画、予測、位置特定など)、エージェントのコントローラ、センサシステム、および/または他の任意のコンポーネントおよび/またはコンポーネントの組合せのうちの何れかまたはすべてを具備および/または実装することができる。
Claims (21)
- 自律エージェントの軌道を生成する方法であって、
・入力のセットを受け取るステップと、
・分布外検出器により、前記入力のセットに基づいて、入力の不確実性を求めるステップと、
・1または複数の学習済みモデルのセットにより、自律エージェントの学習軌道を生成するステップと、
・学習軌道に関連付けられかつ前記1または複数の学習済みモデルのセットで求められた出力の不確実性を求めるステップと、
・古典的な運動プランナで、プログラム軌道を求めるステップと、
・ゲートキーパで、
・学習軌道およびプログラム軌道を含む候補軌道のセットと、
・入力の不確実性と、
・出力の不確実性とを受信するステップと、
・前記ゲートキーパで、
・入力の不確実性が第1の閾値を超える場合、候補軌道のセットから学習軌道を除外し、
・出力の不確実性が第2の閾値を超える場合、候補軌道のセットから学習軌道を除外し、
・候補軌道のセットを制約のセットと比較し、
・比較に基づいて最終軌道を決定するステップと、
・前記最終軌道に基づいて自律エージェントを動作させるステップとを備えることを特徴とする方法。 - 請求項1に記載の方法において、
候補軌道のセットに関連する第3の不確実性が第3の閾値を超える場合に、緊急プランナを呼び出して、エージェントの決定論的アクションのセットを決定することを特徴とする方法。 - 請求項2に記載の方法において、
前記緊急プランナが、第2の入力のセットを受信し、前記第2の入力のセットが、自律エージェントの知覚モジュールおよび予測モジュールから受信されることを特徴とする方法。 - 請求項3に記載の方法において、
前記緊急プランナが、前記第2の入力のセットのみを受信することを特徴とする方法。 - 請求項1に記載の方法において、
入力の不確実性が、前記第1の閾値よりも大きい前記第2の閾値を超える場合に、緊急プランナを呼び出して、エージェントの決定論的アクションのセットを決定するステップをさらに含むことを特徴とする方法。 - 請求項1に記載の方法において、
前記1または複数の学習済みモデルのセットが、複数の学習済みモデルを含むことを特徴とする方法。 - 請求項6に記載の方法において、
・前記1または複数の学習済みモデルのセットのうちの第1の学習済みモデルにより、エージェントのアクションを決定するステップと、
・前記アクションに基づいて第2の学習済みモデルを選択するステップと、
・前記第2の学習済みモデルにより、学習軌跡を決定するステップとをさらに含むことを特徴とする方法。 - 請求項7に記載の方法において、
前記第2の学習済みモデルが、前記アクションから前記第2の学習済みモデルへの1:1のマッピングに基づいてさらに選択されることを特徴とする方法。 - 請求項6に記載の方法において、
出力の不確実性が、複数の学習済みモデルの各々に関連付けられたモデルの出力の不確実性のセットに基づいて決定される集約された不確実性を含むことを特徴とする方法。 - 請求項1に記載の方法において、
出力の不確実性が、偶然的不確実性および認識論的不確実性を含むことを特徴とする方法。 - 請求項1に記載の方法において、
前記分布外検出器が、敵対的生成ネットワークを含むことを特徴とする方法。 - 請求項1に記載の方法において、
前記最終軌道が、自律エージェントに規定された固定ルートに沿っていることを特徴とする方法。 - 自律エージェントの軌道を決定する方法であって、
・入力のセットを受け取るステップと、
・前記入力のセットに基づいて、自律エージェントの環境表現を決定するステップと、
・分布外検出器により、前記環境表現に基づいて入力の不確実性を求めるステップと、
・1または複数の学習済みモデルのセットにより、自律エージェントの学習軌道を生成するステップと、
・学習軌道に関連付けられかつ前記1または複数の学習済みモデルのセットで求められた出力の不確実性を決定するステップと、
・古典的な運動プランナで、プログラム軌道を求めるステップと、
・ゲートキーパで、
・学習軌道と、
・入力の不確実性と、
・出力の不確実性と、
・プログラム軌道とを受信するステップと、
・入力の不確実性および出力の不確実性の少なくとも一方を1または複数の閾値のセットと比較するステップと、
・比較に基づいて、自律エージェントの最終軌道を決定するステップと、
・前記最終軌道に基いて、自律エージェントを動作させるステップとを備えることを特徴とする方法。 - 請求項13に記載の方法において、
前記1または複数の学習済みモデルのセットが、複数の学習済みモデルを含み、前記出力の不確実性が、前記複数の学習済みモデルに基づいて求められた集約された不確実性を含むことを特徴とする方法。 - 請求項14に記載の方法において、
・前記1または複数の学習済みモデルのセットのうちの第1の学習済みモデルにより、エージェントのアクションを決定するステップと、
・前記アクションに基づいて第2の学習済みモデルを選択するステップと、
・前記第2の学習済みモデルにより、学習軌跡を求めるステップとをさらに含むことを特徴とする方法。 - 請求項15に記載の方法において、
エージェントのコンテキストに基づいて前記第1の学習済みモデルを選択するステップをさらに含むことを特徴とする方法。 - 請求項16に記載の方法において、
前記入力のセットが、ラベル付きマップを含み、前記コンテキストが、前記ラベル付きマップに基づいて決定され、前記ラベル付きマップが、コンテキスト割り当ての予め設定されたセットを含むことを特徴とする方法。 - 請求項13に記載の方法において、
出力の不確実性が、偶然的不確実性および認識論的不確実性を含むことを特徴とする方法。 - 請求項13に記載の方法において、
前記分布外検出器が、敵対的生成ネットワークを含むことを特徴とする方法。 - 請求項13に記載の方法において、
前記最終軌道が、自律エージェントに規定された固定ルートに沿っていることを特徴とする方法。 - 請求項13に記載の方法において、
比較により学習軌道およびプログラム軌道の両方が除外される場合に、緊急プランナを呼び出して、前記最終軌道を決定するステップをさらに含むことを特徴とする方法。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063035401P | 2020-06-05 | 2020-06-05 | |
US63/035,401 | 2020-06-05 | ||
US202063055794P | 2020-07-23 | 2020-07-23 | |
US63/055,794 | 2020-07-23 | ||
PCT/US2020/066181 WO2021247082A1 (en) | 2020-06-05 | 2020-12-18 | Method and system for deterministic trajectory selection based on uncertainty estimation for an autonomous agent |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023528078A true JP2023528078A (ja) | 2023-07-03 |
JP7530999B2 JP7530999B2 (ja) | 2024-08-08 |
Family
ID=78219000
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022574686A Active JP7530999B2 (ja) | 2020-06-05 | 2020-12-18 | 自律エージェントの不確実性推定に基づく決定論的軌道選択のための方法およびシステム |
Country Status (5)
Country | Link |
---|---|
US (6) | US11157010B1 (ja) |
EP (1) | EP4162338A4 (ja) |
JP (1) | JP7530999B2 (ja) |
CA (1) | CA3180999A1 (ja) |
WO (1) | WO2021247082A1 (ja) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6728495B2 (ja) * | 2016-11-04 | 2020-07-22 | ディープマインド テクノロジーズ リミテッド | 強化学習を用いた環境予測 |
JP6866762B2 (ja) * | 2017-05-18 | 2021-04-28 | いすゞ自動車株式会社 | 車両用情報処理システム |
US12001958B2 (en) * | 2020-03-19 | 2024-06-04 | Nvidia Corporation | Future trajectory predictions in multi-actor environments for autonomous machine |
CA3180994A1 (en) | 2020-06-05 | 2021-12-09 | Gautam Narang | Method and system for data-driven and modular decision making and trajectory generation of an autonomous agent |
US11861494B2 (en) * | 2020-06-26 | 2024-01-02 | Intel Corporation | Neural network verification based on cognitive trajectories |
US11927967B2 (en) * | 2020-08-31 | 2024-03-12 | Woven By Toyota, U.S., Inc. | Using machine learning models for generating human-like trajectories |
US20220254042A1 (en) * | 2021-02-11 | 2022-08-11 | GM Global Technology Operations LLC | Methods and systems for sensor uncertainty computations |
US20220315047A1 (en) * | 2021-03-30 | 2022-10-06 | Honda Research Institute Europe Gmbh | Method, system and vehicle with an uncertainty-based lane positioning control |
US20230020503A1 (en) * | 2021-07-08 | 2023-01-19 | Ford Global Technologies, Llc | Machine control |
CN113963027B (zh) * | 2021-10-28 | 2022-09-09 | 广州文远知行科技有限公司 | 不确定性检测模型的训练、不确定性的检测方法及装置 |
US20230162597A1 (en) * | 2021-11-19 | 2023-05-25 | Qualcomm Incorporated | Managing Vehicle Behavior Based On Predicted Behavior Of Other Vehicles |
CA3240409A1 (en) | 2021-12-16 | 2023-06-22 | Apeksha Kumavat | Method and system for addressing failure in an autonomous agent |
US11675362B1 (en) * | 2021-12-17 | 2023-06-13 | Motional Ad Llc | Methods and systems for agent prioritization |
US12072707B2 (en) * | 2022-01-10 | 2024-08-27 | Aurora Flight Sciences Corporation, a subsidiary of The Boeing Company | Conflict detection and avoidance for a robot based on perception uncertainty |
DE102022206305A1 (de) * | 2022-06-23 | 2023-12-28 | Robert Bosch Gesellschaft mit beschränkter Haftung | Verfahren zum Steuern einer Robotervorrichtung |
US11644842B1 (en) * | 2022-06-23 | 2023-05-09 | Motional Ad Llc | Semi-closed loop rollouts for data augmentation |
US20240166209A1 (en) * | 2022-11-22 | 2024-05-23 | Toyota Motor Engineering & Manufacturing North America, Inc. | System and method for controlling a cruise control system of a vehicle using the moods of one or more occupants |
JP2024131007A (ja) * | 2023-03-15 | 2024-09-30 | オムロン株式会社 | 移動経路決定システム、自律型移動装置、移動経路決定方法、プログラム |
CN118410343A (zh) * | 2024-07-04 | 2024-07-30 | 四川师范大学 | 一种基于智能体建模和贝叶斯网络的农户行为预测方法 |
Family Cites Families (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6292830B1 (en) | 1997-08-08 | 2001-09-18 | Iterations Llc | System for optimizing interaction among agents acting on multiple levels |
US6278965B1 (en) | 1998-06-04 | 2001-08-21 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | Real-time surface traffic adviser |
US8024112B2 (en) | 2005-09-29 | 2011-09-20 | Microsoft Corporation | Methods for predicting destinations from partial trajectories employing open-and closed-world modeling methods |
US7831391B2 (en) | 2007-06-12 | 2010-11-09 | Palo Alto Research Center Incorporated | Using segmented cones for fast, conservative assessment of collision risk |
US8612107B2 (en) | 2008-06-10 | 2013-12-17 | The Regents Of The University Of Michigan | Method, control apparatus and powertrain system controller for real-time, self-learning control based on individual operating style |
US20100131148A1 (en) | 2008-11-26 | 2010-05-27 | Jaime Camhi | System and method for estimated driver intention for driver assistance system control |
US8175617B2 (en) | 2009-10-28 | 2012-05-08 | Digimarc Corporation | Sensor-based mobile search, related methods and systems |
US9679258B2 (en) | 2013-10-08 | 2017-06-13 | Google Inc. | Methods and apparatus for reinforcement learning |
US9910441B2 (en) | 2015-11-04 | 2018-03-06 | Zoox, Inc. | Adaptive autonomous vehicle planner logic |
US9507346B1 (en) | 2015-11-04 | 2016-11-29 | Zoox, Inc. | Teleoperation system and method for trajectory modification of autonomous vehicles |
WO2017159176A1 (ja) * | 2016-03-17 | 2017-09-21 | 株式会社日立製作所 | 自動運転支援システム、および、自動運転支援方法 |
US11645444B2 (en) | 2016-05-10 | 2023-05-09 | Trustees Of Tufts College | Systems and methods enabling online one-shot learning and generalization by intelligent systems of task-relevant features and transfer to a cohort of intelligent systems |
CN105872477B (zh) | 2016-05-27 | 2018-11-23 | 北京旷视科技有限公司 | 视频监控方法和视频监控系统 |
US11648935B2 (en) | 2016-10-31 | 2023-05-16 | Toyota Motor Europe | Driving assistance method and system |
CN110291477B (zh) | 2016-12-02 | 2022-08-16 | 嘉蒂克人工智能公司 | 车辆控制系统及使用方法 |
KR20180094725A (ko) | 2017-02-16 | 2018-08-24 | 삼성전자주식회사 | 자율 주행을 위한 차량 제어 방법, 차량 제어 장치 및 자율 주행을 위한 학습 방법 |
US10883844B2 (en) | 2017-07-27 | 2021-01-05 | Waymo Llc | Neural networks for vehicle trajectory planning |
WO2019051834A1 (en) | 2017-09-18 | 2019-03-21 | Baidu.Com Times Technology (Beijing) Co., Ltd. | DRIVING GUIDELINES BASED ON DRIVING SCENARIOS FOR PLANNING SELF-CONTAINED VEHICLE TRACKS |
EP3467717A1 (en) | 2017-10-04 | 2019-04-10 | Prowler.io Limited | Machine learning system |
US20190146508A1 (en) | 2017-11-14 | 2019-05-16 | Uber Technologies, Inc. | Dynamic vehicle routing using annotated maps and profiles |
US10345811B2 (en) | 2017-11-14 | 2019-07-09 | GM Global Technology Operations LLC | Method and apparatus for scenario generation and parametric sweeps for the development and evaluation of autonomous driving systems |
US10859384B2 (en) | 2017-11-15 | 2020-12-08 | Uatc, Llc | Lightweight vehicle localization systems and methods |
US20190147255A1 (en) | 2017-11-15 | 2019-05-16 | Uber Technologies, Inc. | Systems and Methods for Generating Sparse Geographic Data for Autonomous Vehicles |
US10836379B2 (en) | 2018-03-23 | 2020-11-17 | Sf Motors, Inc. | Multi-network-based path generation for vehicle parking |
US10860022B2 (en) | 2018-04-11 | 2020-12-08 | GM Global Technology Operations LLC | Method and apparatus for automatical rule learning for autonomous driving |
US10906536B2 (en) | 2018-04-11 | 2021-02-02 | Aurora Innovation, Inc. | Control of autonomous vehicle based on determined yaw parameter(s) of additional vehicle |
US11454970B2 (en) * | 2018-05-21 | 2022-09-27 | Cummins Inc. | Adjustment of autonomous vehicle control authority |
EP3579174A1 (en) | 2018-06-08 | 2019-12-11 | Hexagon Technology Center GmbH | Mobile vehicles in manufacturing |
US11454975B2 (en) | 2018-06-28 | 2022-09-27 | Uatc, Llc | Providing actionable uncertainties in autonomous vehicles |
US10845815B2 (en) | 2018-07-27 | 2020-11-24 | GM Global Technology Operations LLC | Systems, methods and controllers for an autonomous vehicle that implement autonomous driver agents and driving policy learners for generating and improving policies based on collective driving experiences of the autonomous driver agents |
US10678245B2 (en) | 2018-07-27 | 2020-06-09 | GM Global Technology Operations LLC | Systems and methods for predicting entity behavior |
US11479243B2 (en) | 2018-09-14 | 2022-10-25 | Honda Motor Co., Ltd. | Uncertainty prediction based deep learning |
US11480972B2 (en) * | 2018-11-13 | 2022-10-25 | Qualcomm Incorporated | Hybrid reinforcement learning for autonomous driving |
US11137762B2 (en) | 2018-11-30 | 2021-10-05 | Baidu Usa Llc | Real time decision making for autonomous driving vehicles |
US10814871B2 (en) | 2018-12-26 | 2020-10-27 | Gm Cruise Holdings Llc | Computing system for assigning maneuver labels to autonomous vehicle sensor data |
US11157784B2 (en) | 2019-05-08 | 2021-10-26 | GM Global Technology Operations LLC | Explainable learning system and methods for autonomous driving |
US11314258B2 (en) * | 2019-12-27 | 2022-04-26 | Intel Corporation | Safety system for a vehicle |
US11562203B2 (en) * | 2019-12-30 | 2023-01-24 | Servicenow Canada Inc. | Method of and server for training a machine learning algorithm for estimating uncertainty of a sequence of models |
US11443277B2 (en) | 2020-03-26 | 2022-09-13 | Fractal Analytics Private Limited | System and method for identifying object information in image or video data |
US20210117760A1 (en) | 2020-06-02 | 2021-04-22 | Intel Corporation | Methods and apparatus to obtain well-calibrated uncertainty in deep neural networks |
-
2020
- 2020-12-18 EP EP20938885.9A patent/EP4162338A4/en active Pending
- 2020-12-18 CA CA3180999A patent/CA3180999A1/en active Pending
- 2020-12-18 WO PCT/US2020/066181 patent/WO2021247082A1/en active Application Filing
- 2020-12-18 US US17/127,599 patent/US11157010B1/en active Active
- 2020-12-18 JP JP2022574686A patent/JP7530999B2/ja active Active
-
2021
- 2021-09-23 US US17/483,539 patent/US11307594B2/en active Active
- 2021-10-07 US US17/496,053 patent/US11320827B2/en active Active
-
2022
- 2022-03-03 US US17/685,905 patent/US11487296B2/en active Active
- 2022-03-25 US US17/704,301 patent/US11586214B2/en active Active
-
2023
- 2023-01-13 US US18/096,695 patent/US20230152816A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US11157010B1 (en) | 2021-10-26 |
US20230152816A1 (en) | 2023-05-18 |
EP4162338A4 (en) | 2024-07-03 |
CA3180999A1 (en) | 2021-12-09 |
US20220011776A1 (en) | 2022-01-13 |
US20220236737A1 (en) | 2022-07-28 |
US11586214B2 (en) | 2023-02-21 |
WO2021247082A1 (en) | 2021-12-09 |
US11320827B2 (en) | 2022-05-03 |
US20220214693A1 (en) | 2022-07-07 |
US11307594B2 (en) | 2022-04-19 |
EP4162338A1 (en) | 2023-04-12 |
US11487296B2 (en) | 2022-11-01 |
JP7530999B2 (ja) | 2024-08-08 |
US20220026913A1 (en) | 2022-01-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7530999B2 (ja) | 自律エージェントの不確実性推定に基づく決定論的軌道選択のための方法およびシステム | |
US11505207B2 (en) | Method and system for context-aware decision making of an autonomous agent | |
US11440564B2 (en) | Method and system for data-driven and modular decision making and trajectory generation of an autonomous agent |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230127 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240130 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240131 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240426 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240702 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240729 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7530999 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |