JP2018037064A - 能動的探索なしの強化学習に基づくオンライン学習法及び車両制御方法 - Google Patents
能動的探索なしの強化学習に基づくオンライン学習法及び車両制御方法 Download PDFInfo
- Publication number
- JP2018037064A JP2018037064A JP2017131700A JP2017131700A JP2018037064A JP 2018037064 A JP2018037064 A JP 2018037064A JP 2017131700 A JP2017131700 A JP 2017131700A JP 2017131700 A JP2017131700 A JP 2017131700A JP 2018037064 A JP2018037064 A JP 2018037064A
- Authority
- JP
- Japan
- Prior art keywords
- vehicle
- cost
- control
- state
- arrival
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 67
- 230000002787 reinforcement Effects 0.000 title description 4
- 238000012545 processing Methods 0.000 claims abstract description 97
- 230000006870 function Effects 0.000 claims description 78
- 230000015654 memory Effects 0.000 claims description 25
- 230000033001 locomotion Effects 0.000 claims description 7
- 230000006399 behavior Effects 0.000 claims description 5
- 230000005855 radiation Effects 0.000 claims 1
- 238000004891 communication Methods 0.000 description 25
- 238000004422 calculation algorithm Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 238000005457 optimization Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 230000007246 mechanism Effects 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 5
- 230000010354 integration Effects 0.000 description 5
- 230000007704 transition Effects 0.000 description 5
- 230000001133 acceleration Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 4
- 238000005183 dynamical system Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000004590 computer program Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000005653 Brownian motion process Effects 0.000 description 1
- -1 and / or (e.g. Substances 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000005537 brownian motion Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 239000002283 diesel fuel Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 238000005312 nonlinear dynamic Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000008080 stochastic effect Effects 0.000 description 1
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W50/00—Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
- B60W50/06—Improving the dynamic response of the control system, e.g. improving the speed of regulation or avoiding hunting or overshoot
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W50/00—Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
- B60W50/0098—Details of control systems ensuring comfort, safety or stability not otherwise provided for
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W60/00—Drive control systems specially adapted for autonomous road vehicles
- B60W60/001—Planning or execution of driving tasks
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/0265—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/041—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a variable is automatically adjusted to optimise the performance
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/02—Control of position or course in two dimensions
- G05D1/021—Control of position or course in two dimensions specially adapted to land vehicles
- G05D1/0212—Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
- G05D1/0221—Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving a learning process
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W50/00—Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
- B60W2050/0001—Details of the control system
- B60W2050/0002—Automatic control, details of type of controller or control system architecture
- B60W2050/0013—Optimal controllers
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W50/00—Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
- B60W2050/0001—Details of the control system
- B60W2050/0002—Automatic control, details of type of controller or control system architecture
- B60W2050/0014—Adaptive controllers
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W50/00—Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
- B60W2050/0062—Adapting control system settings
- B60W2050/0075—Automatic parameter input, automatic initialising or calibrating means
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W50/00—Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
- B60W2050/0062—Adapting control system settings
- B60W2050/0075—Automatic parameter input, automatic initialising or calibrating means
- B60W2050/0083—Setting, resetting, calibration
- B60W2050/0088—Adaptive recalibration
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W2420/00—Indexing codes relating to the type of sensors based on the principle of their operation
- B60W2420/40—Photo, light or radio wave sensitive means, e.g. infrared sensors
- B60W2420/403—Image sensing, e.g. optical camera
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W2420/00—Indexing codes relating to the type of sensors based on the principle of their operation
- B60W2420/40—Photo, light or radio wave sensitive means, e.g. infrared sensors
- B60W2420/408—Radar; Laser, e.g. lidar
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W2520/00—Input parameters relating to overall vehicle dynamics
- B60W2520/10—Longitudinal speed
- B60W2520/105—Longitudinal acceleration
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W2520/00—Input parameters relating to overall vehicle dynamics
- B60W2520/12—Lateral speed
- B60W2520/125—Lateral acceleration
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W2520/00—Input parameters relating to overall vehicle dynamics
- B60W2520/14—Yaw
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W2520/00—Input parameters relating to overall vehicle dynamics
- B60W2520/16—Pitch
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W2520/00—Input parameters relating to overall vehicle dynamics
- B60W2520/18—Roll
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W2520/00—Input parameters relating to overall vehicle dynamics
- B60W2520/28—Wheel speed
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W2556/00—Input parameters relating to data
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W2556/00—Input parameters relating to data
- B60W2556/10—Historical data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/80—Technologies aiming to reduce greenhouse gasses emissions common to all road transportation technologies
- Y02T10/84—Data processing systems or methods, management, administration
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Transportation (AREA)
- Medical Informatics (AREA)
- Human Computer Interaction (AREA)
- Mechanical Engineering (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Computational Mathematics (AREA)
- Mathematical Optimization (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Pure & Applied Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Mathematical Analysis (AREA)
- Algebra (AREA)
- Probability & Statistics with Applications (AREA)
- Aviation & Aerospace Engineering (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Feedback Control In General (AREA)
- Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
Abstract
【解決手段】車両を自律的に制御すべく構成されたコンピュータ処理システムにおけるcriticネットワークにおいて、受動的に収集されたデータのサンプルと、状態コストとを用いて、推定平均コストと、actorネットワークにより適用されたときに車両の到達コストに対する最小値を生成する近似された到達コスト関数とを決定する段階と、criticネットワークに対して作用的に連結されたactorネットワークにおいて、車両に対して適用されて到達コストに対する最小値を生成する制御入力を決定する段階とを備え、actorネットワークは、平均コストと、近似された到達コスト関数から決定された到達コストと、車両の現在の状態に対する制御用動力学的値と、受動的に収集されたデータとを用いて、ノイズレベルを推定することにより制御入力を決定する。
【選択図】図3
Description
、
及び
は、それぞれ、受動的動力学的値、車両制御用動力学的値、及び、過渡的ノイズレベルである。Δtは、時間のステップサイズである。この種の系は、多くの状況において生ずる(例えば、ほとんどの機械系のモデルはこれらの動力学に従う)。関数A(x)、B(x)及びC(x)は、理解されるべく、モデル化されている特定の系に依存する。受動的動力学的値は、車両の環境における変化であって、車両システムに対する制御入力の結果ではない変化を含む。
であり、式中、
及び
は、状態空間及び動作空間である。
は、動作による状態遷移モデルであり、且つ、
は、状態x及び動作uに関する即時コスト関数である。先に記述されたように、制御ポリシー
は、状態xから動作
へとマッピングする関数である。予期される累積コストである、ポリシーπの下での到達コスト関数(cost-to-go function)(又は価値関数)
は、無限時間区間(infinite horizon)の平均コストの最適性判断基準の下で、以下のように定義される。
は平均コストであり、kは時間インデックスであり、且つ、Δtは時間ステップである。最適な到達コスト関数は、以下の離散時間ハミルトン−ヤコビ−ベルマン方程式を満足する。
は動作価値関数であり、且つ、
は積分演算子である。MDPの目的は、以下の関係に従い、無限時間区間に亘り、平均コストを最小化する制御ポリシーを見出すことである。
、
)。
は状態コスト関数であり、且つ、
はクルバック−ライブラー(KL)偏差である。式(3)は、動作のコストを、それが系に対して有する確率論的効果の量に対して関連付け、且つ、それを状態コストに対して加算する。第2の条件は、何らの動作も、受動的動力学の下では達成され得ない新たな遷移を導入しないことを確実とする。式(1)により表された確率論的動力学系は、当然、上記仮定を満足する。
及びZavgは、それぞれ、Z値と称される指数的に変換された到達コスト関数、及び、最適ポリシーの下での平均コストである。(式(1))における状態遷移はガウス性であることから、制御された動力学的値と受動的な動力学的値との間のKL偏差は、
は、xkにおけるxに関する到達コスト関数Vの偏微分値である。Z値及び平均コストは、系の動力学的値が完全に入手可能であるとき、固有値又は固有関数を解くことにより、線形化ベルマン方程式から導かれ得る。
(Z値)を決定し、且つ、actor83により使用される推定平均コスト
を生成する。Z値を推定するために、重み付けされた放射基底関数(RBF)の線形結合(linear combination)が使用され得る。
及び
を真のZ値及び真の平均Z値コストとし、且つ
、
をそれぞれそれらの推定対応物とする。近似された到達コスト関数は、criticネットワークによりリアルタイムで学習され得る。
と、
とを満足するために必要とされる。
は、真の到達コストと推定到達コストとの間の誤差を、線形化ベルマン方程式(LBE)(式(5))から以下のように決定された近似的な時間差的誤差ekにより近似することにより、ラグランジュ緩和時間差(TD)学習に基づいて更新され得る。なぜなら、真の到達コスト及び真の平均コストは、pAC方法に対して使用された情報によっては決定されないからである。
及び
は、学習率であり、且つ、ekはL−MDPに対するTD誤差である。δijはディラックのデルタ関数を表している。下付き文字iは、反復の回数を表している。λ1、λ2、λ3は、制約式(9)に対するラグランジュ乗数である。ωは、式(10)による誤差を最小化すべく、且つ、式(11)による制約を満足すべく更新される。反復とは、(criticに対する重みω及びactorに対するμのような)critic及びactorのパラメータの更新として定義され得る。これに加え、criticネットワークのパラメータの更新は、車両が運動しているときに実施され得る。本明細書中に記述された方法において、criticネットワークの更新の間に使用される唯一のデータは、受動的に収集されたデータである。
及び状態コストqkを用いて、各パラメータを更新する。重みω、推定Z値
、及び、平均コスト
は、車両が運動している間に、式(10)〜(11A)に従い、オンラインで更新され得る。
及び推定平均コスト
と、状態コストq(x)と、車両制御用動力学的モデル87から決定された現在の状態に対する制御用動力学的値情報B(x)と、criticにより使用されて到達コスト関数
を推定且つ推定平均コスト
を生成すべく受動的に収集されたデータのサンプルとを用い、actor83は制御入力を決定し得る。制御入力は、制御ポリシーπを修正すべく使用され得る。特定の実施形態において、ポリシーπは、上述の態様で、収束するまで反復的に修正され、その時点でそれは最適化されたと見做される。actorは、標準的なベルマン方程式を用い、且つ、能動的探索なしで、制御ポリシーを改善する。制御用動力学的値は、車両に対する既知の制御用動力学的モデルから決定され得る。
及び
)、受動的動力学の下でのサンプル、及び、既知の制御用動力学的値を用いて、ノイズレベルρを推定することにより、制御ポリシーを改善又は修正する。ノイズレベルは、重み付けされた各放射基底関数の線形結合により、近似的に学習される。
、
及び
は、最適な制御ポリシーの下での、真の到達コスト関数、平均コスト、及び推定された動作−状態値である。最適制御ポリシーは目的関数を最小化することにより学習され得る。なぜなら、真の動作−価値コストは、ポリシーが最適ポリシーであるとき且つそのときにのみ、
に等しいからである。
及び
は、ノイズレベルを更新するときに、以下の関係に従い、
及び
を決定すべく使用され得る。
は、受動的動力学の下での次の状態であり、且つ、
は、動作ukによる制御された動力学の下での次の状態である。推定到達コスト、平均コスト、及び、それらの微分値は、criticからの推定されたZ値及び平均Z値コストを利用することにより算出され得る。更に、
は、
に関してTD誤差を線形化し得る。
を用いることにより、能動的探索なしでポリシーを改善する。標準的なactor−critic方法は、能動的探索によりポリシーを最適化する。定義されたこれらのactor及びcriticの機能により、コンピュータ処理システム14は、L−MDPを用いて、半モデルフリー強化学習を実現し得る。
と、actorネットワークにより適用されたときに車両の到達コストに対する最小値を生成する近似された到達コスト関数
とを決定し得る。
を用いて、車両に適用されて該車両の到達コストに対する最小値を生成する制御入力を決定し得る。actor83は、制御ポリシーπを修正して、このポリシーを改善し且つ/又はこの制御ポリシーを最適化し得る。
図5及び図6を参照すると、本明細書中に記述された制御入力及びポリシー修正/最適化方法の実施形態の一つの実施例において、自律的な高速道路合流操作がシミュレートされる。この操作は、4次元の状態空間、及び、1次元の動作空間を有する。動力学的値は
は、
の実際の値は一定であるため、
を推定するのにg(x)=1が使用された。上記方法は、受動的動力学的値をシミュレートすることにより収集された10,000個のサンプルから、ポリシーを最適化した。図6は、本明細書中に記述された方法により決定された順次的な制御入力を用い、125個の異なる初期状態から開始し、(収束に対して必要とされる反復の回数として表現された)30秒以内に好首尾に合流する割合を示している。
Claims (20)
- 車両の自律的動作を適応的に制御するコンピュータ実行型方法であって、該方法は、
a)車両を自律的に制御するように構成されたコンピュータ処理システムにおけるcriticネットワークにおいて、受動的に収集されたデータのサンプルと、状態コストとを用いて、推定平均コストと、actorネットワークにより適用されたときに車両の到達コストに対する最小値を生成する近似された到達コスト関数とを決定することと、
b)コンピュータ処理システム内においてcriticネットワークに対して作用的に連結されたactorネットワークにおいて、車両に対して適用されて到達コストに対する最小値を生成する制御入力を決定すること、とを備え、
前記actorネットワークは、推定平均コストと、近似された到達コスト関数から決定された推定到達コストと、車両の現在の状態に対する制御用動力学的値と、受動的に収集されたデータのサンプルとを用いて、ノイズレベルを推定することにより制御入力を決定するように構成される、方法。 - 前記近似された到達コスト関数は、以下の関係に従い、重み付けされた放射基底関数の線形結合を用いて決定され、
は近似された到達コスト関数である、請求項1に記載の方法。 - 前記近似された到達コスト関数において使用される重みωは、以下の関係に従って更新され、
は推定平均コストである、請求項2に記載の方法。 - ベルマン方程式の線形化版を用いて決定された近似的な時間差的誤差を用いて前記criticネットワークのパラメータを更新する段階を更に備える、請求項1に記載の方法。
- 前記criticネットワークパラメータを更新する段階は、前記車両が運動しているときに実施される、請求項4に記載の方法。
- 前記criticネットワークにより決定された推定平均コストは、以下の関係に従って更新され、
は前記近似された到達コスト関数から決定された推定コストであり、
は状態iにおける推定平均コストであり、且つ、
は状態i+1における推定平均コストである、請求項4に記載の方法。 - 前記受動的に収集されたデータは、前記criticネットワークパラメータを更新する間に使用される唯一のデータである、請求項4に記載の方法。
- 以下の関係に従って決定された近似的な時間差的誤差を用いて前記criticネットワークのパラメータを更新する段階を更に備え、
は推定平均コストであり、
は状態kにおける推定到達コストであり、
は状態k+1における推定到達コストであり、且つ、qkは状態kにおける状態コストである、請求項1に記載の方法。 - 前記近似された到達コスト関数は、前記criticネットワークにおいてリアルタイムで学習される、請求項1に記載の方法。
- 前記ノイズレベルは、以下の関係に従い、重み付けされた基底関数の線形結合を用いて学習され、
- 以下の関係に従って決定された近似誤差を用いて前記actorネットワークの重み付けパラメータを更新する段階を更に備え、
は状態kにおいて近似された到達コストであり、
は状態k+1において近似された到達コストであり、
は近似された平均コストであり、且つ、
- 前記actorネットワークの重み付けパラメータの更新は、前記車両が運動しているときに実施される、請求項11に記載の方法。
- 前記actorネットワークの重み付けパラメータは、以下の関係に従って更新され、
は状態i+1における重み付けパラメータの値であり、
は状態iにおける重み付けパラメータの値であり、βiは学習率であり、dkは時間差的誤差であり、且つgは放射基底関数である、請求項11に記載の方法。 - 前記制御入力を用い、前記自律的動作を制御すべく使用可能な制御ポリシーを修正する段階を更に備える、請求項1に記載の方法。
- 前記推定平均コストが収束するまで、前記段階(a)及び(b)を反復的に実施して前記制御入力を再決定することにより、前記自律的動作を制御するために使用可能な制御ポリシーを最適化する段階を更に備える、請求項1に記載の方法。
- 前記制御ポリシーは、能動的探索なしで最適化される、請求項15に記載の方法。
- 車両の自律的動作を適応的に制御するように構成されたコンピュータ処理システムであって、該コンピュータ処理システムは、該コンピュータ処理システムの動作を制御する一つ以上のプロセッサと、該一つ以上のプロセッサにより使用可能なデータ及びプログラム命令を記憶するメモリとを備え、
前記一つ以上のプロセッサは、前記メモリ内に記憶された命令を実行して、
a)受動的に収集されたデータのサンプルと、状態コストとを用いて、推定平均コストと、前記車両の到達コストに対する最小値を生成する近似された到達コスト関数とを決定し、且つ、
b)前記車両に対して適用されて前記到達コストに対する最小値を生成する制御入力を決定する、ように構成され、
前記一つ以上のプロセッサは、前記推定平均コストと、前記近似された到達コスト関数から決定された到達コストと、前記車両の現在の状態に対する制御用動力学的値と、受動的に収集されたデータのサンプルとを用いて、ノイズレベルを推定することにより制御入力を決定するように構成される、コンピュータ処理システム。 - 前記一つ以上のプロセッサは、前記メモリ内に記憶された命令を実行し、前記推定平均コストが収束するまで、前記段階(a)及び(b)を反復的に実施して前記制御入力を再決定することにより、前記自律的動作を制御するために使用可能な制御ポリシーを最適化するように構成される、請求項17に記載のコンピュータ処理システム。
- コンピュータシステムにより実行可能な命令が自身内に記憶された、一時的でないコンピュータ可読媒体であって、
a)受動的に収集されたデータのサンプルと、状態コストとを用いて、推定平均コストと、車両の到達コストに対する最小値を生成する近似された到達コスト関数とを決定することと、
b)前記車両に対して適用されて前記到達コストに対する最小値を生成する制御入力を決定すること、とを備える機能を実施させ、
前記制御入力は、前記到達コストに対する最小値を生成し、且つ前記平均コストと、前記近似された到達コスト関数から決定された到達コストと、前記車両の現在の状態に対する制御用動力学的値と、受動的に収集されたデータのサンプルとを用いて、ノイズレベルを推定することにより制御入力が決定される、一時的でないコンピュータ可読媒体。 - 前記命令は、前記推定平均コストが収束するまで、前記段階(a)及び(b)を反復的に繰り返して前記制御入力を再決定することにより、前記自律的動作を制御するために使用可能な制御ポリシーを最適化するように実行可能である、請求項19に記載の一時的でないコンピュータ可読媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/205,558 US10065654B2 (en) | 2016-07-08 | 2016-07-08 | Online learning and vehicle control method based on reinforcement learning without active exploration |
US15/205,558 | 2016-07-08 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2018037064A true JP2018037064A (ja) | 2018-03-08 |
JP2018037064A5 JP2018037064A5 (ja) | 2020-08-20 |
JP7036545B2 JP7036545B2 (ja) | 2022-03-15 |
Family
ID=60892997
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017131700A Active JP7036545B2 (ja) | 2016-07-08 | 2017-07-05 | 能動的探索なしの強化学習に基づくオンライン学習法及び車両制御方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10065654B2 (ja) |
JP (1) | JP7036545B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108959467A (zh) * | 2018-06-20 | 2018-12-07 | 华东师范大学 | 一种基于强化学习的问句和答案句相关度的计算方法 |
CN112277558A (zh) * | 2019-07-22 | 2021-01-29 | 本田技研工业株式会社 | 减振器控制系统、车辆、信息处理装置及它们的控制方法以及记录介质 |
US11294339B2 (en) | 2018-12-10 | 2022-04-05 | Fuji Electric Co., Ltd. | Control device, control method, and non-transitory recording medium |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10296004B2 (en) * | 2017-06-21 | 2019-05-21 | Toyota Motor Engineering & Manufacturing North America, Inc. | Autonomous operation for an autonomous vehicle objective in a multi-vehicle environment |
US11130497B2 (en) | 2017-12-18 | 2021-09-28 | Plusai Limited | Method and system for ensemble vehicle control prediction in autonomous driving vehicles |
US20190185012A1 (en) | 2017-12-18 | 2019-06-20 | PlusAI Corp | Method and system for personalized motion planning in autonomous driving vehicles |
CN111758017A (zh) * | 2018-02-28 | 2020-10-09 | 索尼公司 | 信息处理装置、信息处理方法、程序及移动体 |
JP7035734B2 (ja) * | 2018-03-30 | 2022-03-15 | 富士通株式会社 | 強化学習プログラム、強化学習方法、および強化学習装置 |
US10990096B2 (en) * | 2018-04-27 | 2021-04-27 | Honda Motor Co., Ltd. | Reinforcement learning on autonomous vehicles |
US11823039B2 (en) | 2018-08-24 | 2023-11-21 | International Business Machines Corporation | Safe and fast exploration for reinforcement learning using constrained action manifolds |
EP3629105A1 (en) * | 2018-09-27 | 2020-04-01 | Bayerische Motoren Werke Aktiengesellschaft | High-level decision making for safe and reasonable autonomous lane changing using reinforcement learning |
US10940863B2 (en) * | 2018-11-01 | 2021-03-09 | GM Global Technology Operations LLC | Spatial and temporal attention-based deep reinforcement learning of hierarchical lane-change policies for controlling an autonomous vehicle |
CN109901572B (zh) * | 2018-12-13 | 2022-06-28 | 华为技术有限公司 | 自动驾驶方法、训练方法及相关装置 |
US20210403041A1 (en) * | 2018-12-13 | 2021-12-30 | Siemens Aktiengesellschaft | Automated system including reachability analysis |
EP3693243A1 (en) * | 2019-02-06 | 2020-08-12 | Zenuity AB | Method and system for controlling an automated driving system of a vehicle |
DE102019206908B4 (de) * | 2019-05-13 | 2022-02-17 | Psa Automobiles Sa | Verfahren zum Trainieren wenigstens eines Algorithmus für ein Steuergerät eines Kraftfahrzeugs, Computerprogrammprodukt, Kraftfahrzeug sowie System |
CN110843746B (zh) * | 2019-11-28 | 2022-06-14 | 的卢技术有限公司 | 一种基于强化学习的防抱死刹车控制方法及系统 |
CN113552869B (zh) * | 2020-04-23 | 2023-07-07 | 华为技术有限公司 | 优化决策规控的方法、控制车辆行驶的方法和相关装置 |
US20210402980A1 (en) * | 2020-06-26 | 2021-12-30 | Mitsubishi Electric Research Laboratories, Inc. | System and Method for Data-Driven Reference Generation |
CN111796522B (zh) * | 2020-07-16 | 2022-06-03 | 上海智驾汽车科技有限公司 | 一种车辆状态估计方法 |
CN112289044B (zh) * | 2020-11-02 | 2021-09-07 | 南京信息工程大学 | 基于深度强化学习的高速公路道路协同控制系统及方法 |
US11682218B2 (en) | 2021-03-17 | 2023-06-20 | Geotab Inc. | Methods for vehicle data collection by image analysis |
US11669593B2 (en) | 2021-03-17 | 2023-06-06 | Geotab Inc. | Systems and methods for training image processing models for vehicle data collection |
US11886196B2 (en) * | 2021-04-05 | 2024-01-30 | Mitsubishi Electric Research Laboratories, Inc. | Controlling machine operating in uncertain environment discoverable by sensing |
CN113253612B (zh) | 2021-06-01 | 2021-09-17 | 苏州浪潮智能科技有限公司 | 一种自动驾驶控制方法、装置、设备及可读存储介质 |
CN113359476B (zh) * | 2021-07-09 | 2022-09-16 | 广东华中科技大学工业技术研究院 | 离散时间下多智能体系统的一致性控制算法设计方法 |
US11693920B2 (en) * | 2021-11-05 | 2023-07-04 | Geotab Inc. | AI-based input output expansion adapter for a telematics device and methods for updating an AI model thereon |
WO2023199610A1 (en) * | 2022-04-14 | 2023-10-19 | Mitsubishi Electric Corporation | System and method for motion and path planning for trailer-based vehicle |
CN116149262B (zh) * | 2023-04-23 | 2023-07-04 | 山东科技大学 | 一种伺服系统的跟踪控制方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10254505A (ja) * | 1997-03-14 | 1998-09-25 | Toyota Motor Corp | 自動制御装置 |
JP2006313512A (ja) * | 2005-04-04 | 2006-11-16 | Sony Corp | 学習制御装置、学習制御方法、およびプログラム |
US20130262353A1 (en) * | 2012-03-30 | 2013-10-03 | Board Of Regents, The University Of Texas System | Optimal online adaptive controller |
US20160092764A1 (en) * | 2011-12-07 | 2016-03-31 | Paul Burchard | Sparse Neural Control |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6169981B1 (en) * | 1996-06-04 | 2001-01-02 | Paul J. Werbos | 3-brain architecture for an intelligent decision and control system |
US6532454B1 (en) * | 1998-09-24 | 2003-03-11 | Paul J. Werbos | Stable adaptive control using critic designs |
US6882992B1 (en) * | 1999-09-02 | 2005-04-19 | Paul J. Werbos | Neural networks for intelligent control |
US6411871B1 (en) | 2000-08-05 | 2002-06-25 | American Gnc Corporation | Autonomous navigation, guidance and control using LDRI |
US8854199B2 (en) | 2009-01-26 | 2014-10-07 | Lytx, Inc. | Driver risk assessment system and method employing automated driver log |
US8812226B2 (en) * | 2009-01-26 | 2014-08-19 | GM Global Technology Operations LLC | Multiobject fusion module for collision preparation system |
US8380367B2 (en) | 2009-03-26 | 2013-02-19 | The University Of North Dakota | Adaptive surveillance and guidance system for vehicle collision avoidance and interception |
ES2474815T3 (es) * | 2009-07-09 | 2014-07-09 | Tomtom International B.V. | Método para comprimir los datos de aceleración de una búsqueda de ruta |
EP2681085B1 (de) | 2011-03-01 | 2017-05-10 | Continental Teves AG & Co. oHG | Verfahren und vorrichtung zur prädiktion und adaption von bewegungstrajektorien von kraftfahrzeugen |
US8965834B2 (en) * | 2011-12-07 | 2015-02-24 | Extendabrain Corporation | Particle methods for nonlinear control |
WO2013123469A1 (en) | 2012-02-17 | 2013-08-22 | Intertrust Technologies Corporation | Systems and methods for vehicle policy enforcement |
US20140142948A1 (en) | 2012-11-21 | 2014-05-22 | Somya Rathi | Systems and methods for in-vehicle context formation |
US20150370228A1 (en) * | 2014-06-20 | 2015-12-24 | Atigeo Corp. | Determining control actions of decision modules |
US20160202670A1 (en) * | 2015-01-08 | 2016-07-14 | Northwestern University | System and method for sequential action control for nonlinear systems |
US9511767B1 (en) * | 2015-07-01 | 2016-12-06 | Toyota Motor Engineering & Manufacturing North America, Inc. | Autonomous vehicle action planning using behavior prediction |
US9916703B2 (en) * | 2015-11-04 | 2018-03-13 | Zoox, Inc. | Calibration for autonomous vehicle operation |
US9568915B1 (en) * | 2016-02-11 | 2017-02-14 | Mitsubishi Electric Research Laboratories, Inc. | System and method for controlling autonomous or semi-autonomous vehicle |
US10061316B2 (en) * | 2016-07-08 | 2018-08-28 | Toyota Motor Engineering & Manufacturing North America, Inc. | Control policy learning and vehicle control method based on reinforcement learning without active exploration |
-
2016
- 2016-07-08 US US15/205,558 patent/US10065654B2/en not_active Expired - Fee Related
-
2017
- 2017-07-05 JP JP2017131700A patent/JP7036545B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10254505A (ja) * | 1997-03-14 | 1998-09-25 | Toyota Motor Corp | 自動制御装置 |
JP2006313512A (ja) * | 2005-04-04 | 2006-11-16 | Sony Corp | 学習制御装置、学習制御方法、およびプログラム |
US20160092764A1 (en) * | 2011-12-07 | 2016-03-31 | Paul Burchard | Sparse Neural Control |
US20130262353A1 (en) * | 2012-03-30 | 2013-10-03 | Board Of Regents, The University Of Texas System | Optimal online adaptive controller |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108959467A (zh) * | 2018-06-20 | 2018-12-07 | 华东师范大学 | 一种基于强化学习的问句和答案句相关度的计算方法 |
CN108959467B (zh) * | 2018-06-20 | 2021-10-15 | 华东师范大学 | 一种基于强化学习的问句和答案句相关度的计算方法 |
US11294339B2 (en) | 2018-12-10 | 2022-04-05 | Fuji Electric Co., Ltd. | Control device, control method, and non-transitory recording medium |
CN112277558A (zh) * | 2019-07-22 | 2021-01-29 | 本田技研工业株式会社 | 减振器控制系统、车辆、信息处理装置及它们的控制方法以及记录介质 |
Also Published As
Publication number | Publication date |
---|---|
US20180009445A1 (en) | 2018-01-11 |
US10065654B2 (en) | 2018-09-04 |
JP7036545B2 (ja) | 2022-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7036545B2 (ja) | 能動的探索なしの強化学習に基づくオンライン学習法及び車両制御方法 | |
US10061316B2 (en) | Control policy learning and vehicle control method based on reinforcement learning without active exploration | |
CN112805198B (zh) | 用于自主驾驶的个人驾驶风格学习 | |
US11493926B2 (en) | Offline agent using reinforcement learning to speedup trajectory planning for autonomous vehicles | |
US11269329B2 (en) | Dynamic model with learning based localization correction system | |
JP6856575B2 (ja) | 能動的探索なしの強化学習に基づく制御ポリシー学習及び車両制御方法 | |
US11467591B2 (en) | Online agent using reinforcement learning to plan an open space trajectory for autonomous vehicles | |
US10994729B2 (en) | System and method for controlling lateral motion of vehicle | |
WO2020243162A1 (en) | Methods and systems for trajectory forecasting with recurrent neural networks using inertial behavioral rollout | |
US11409284B2 (en) | Relaxation optimization model to plan an open space trajectory for autonomous vehicles | |
US11537127B2 (en) | Systems and methods for vehicle motion planning based on uncertainty | |
US11815891B2 (en) | End dynamics and constraints relaxation algorithm on optimizing an open space trajectory | |
US11891087B2 (en) | Systems and methods for generating behavioral predictions in reaction to autonomous vehicle movement | |
US11673584B2 (en) | Bayesian Global optimization-based parameter tuning for vehicle motion controllers | |
CN114846425A (zh) | 移动机器人的预测和规划 | |
US11467584B2 (en) | Multi-layer grid based open space planner | |
KR102589587B1 (ko) | 자율 주행 차량용 동적 모델 평가 패키지 | |
US20210179097A1 (en) | Lane-attention: predicting vehicles' moving trajectories by learning their attention over lanes | |
RU2751734C2 (ru) | Способы и процессоры для управления рулением беспилотным автомобилем | |
US11884287B2 (en) | Enhanced vehicle operation | |
US20230227061A1 (en) | Systems and Methods for Pareto Domination-Based Learning | |
US11453404B2 (en) | Gear based vehicle load inference system | |
WO2024113087A1 (en) | On-board parameter tuning for control module for autonomous vehicles |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200703 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200703 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210528 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210615 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220201 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220303 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7036545 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |