JP2023546810A - 車両軌跡計画方法、車両軌跡計画装置、電子機器、及びコンピュータプログラム - Google Patents

車両軌跡計画方法、車両軌跡計画装置、電子機器、及びコンピュータプログラム Download PDF

Info

Publication number
JP2023546810A
JP2023546810A JP2023520281A JP2023520281A JP2023546810A JP 2023546810 A JP2023546810 A JP 2023546810A JP 2023520281 A JP2023520281 A JP 2023520281A JP 2023520281 A JP2023520281 A JP 2023520281A JP 2023546810 A JP2023546810 A JP 2023546810A
Authority
JP
Japan
Prior art keywords
target vehicle
trajectory
vehicle
target
cost function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023520281A
Other languages
English (en)
Inventor
ユー,チャンシー
Original Assignee
テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド filed Critical テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド
Publication of JP2023546810A publication Critical patent/JP2023546810A/ja
Pending legal-status Critical Current

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W60/00Drive control systems specially adapted for autonomous road vehicles
    • B60W60/001Planning or execution of driving tasks
    • B60W60/0011Planning or execution of driving tasks involving control alternatives for a single driving scenario, e.g. planning several paths to avoid obstacles
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W30/00Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units, or advanced driver assistance systems for ensuring comfort, stability and safety or drive control systems for propelling or retarding the vehicle
    • B60W30/10Path keeping
    • B60W30/12Lane keeping
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W30/00Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units, or advanced driver assistance systems for ensuring comfort, stability and safety or drive control systems for propelling or retarding the vehicle
    • B60W30/18Propelling the vehicle
    • B60W30/18009Propelling the vehicle related to particular drive situations
    • B60W30/18145Cornering
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W30/00Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units, or advanced driver assistance systems for ensuring comfort, stability and safety or drive control systems for propelling or retarding the vehicle
    • B60W30/18Propelling the vehicle
    • B60W30/18009Propelling the vehicle related to particular drive situations
    • B60W30/18163Lane change; Overtaking manoeuvres
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W40/00Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
    • B60W40/02Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models related to ambient conditions
    • B60W40/06Road conditions
    • B60W40/068Road friction coefficient
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W40/00Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
    • B60W40/10Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models related to vehicle motion
    • B60W40/105Speed
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W40/00Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
    • B60W40/10Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models related to vehicle motion
    • B60W40/114Yaw movement
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W60/00Drive control systems specially adapted for autonomous road vehicles
    • B60W60/001Planning or execution of driving tasks
    • B60W60/0015Planning or execution of driving tasks specially adapted for safety
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0217Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory in accordance with energy consumption, time reduction or distance reduction criteria
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2520/00Input parameters relating to overall vehicle dynamics
    • B60W2520/14Yaw
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2552/00Input parameters relating to infrastructure
    • B60W2552/40Coefficient of friction
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2552/00Input parameters relating to infrastructure
    • B60W2552/53Road markings, e.g. lane marker or crosswalk
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2720/00Output or target parameters relating to overall vehicle dynamics
    • B60W2720/10Longitudinal speed
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2720/00Output or target parameters relating to overall vehicle dynamics
    • B60W2720/12Lateral speed
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2720/00Output or target parameters relating to overall vehicle dynamics
    • B60W2720/14Yaw

Abstract

車両軌跡計画方法、装置、コンピュータ可読記憶媒体、電子機器、及びコンピュータプログラム製品であって、自動運転の技術分野に属する。車両軌跡計画方法は、ターゲット計画時間内のターゲット車両の初期参照軌跡を取得するステップであって、初期参照軌跡には、ターゲット計画時間内の少なくとも1つの位置点におけるターゲット車両の初期状態量及び初期制御量が含まれる、ステップと、参照車線軌跡を取得するステップと、幾何学的制約条件及び動力学的制約条件に従って、参照車線軌跡と、少なくとも1つの位置点におけるターゲット車両の初期状態量および初期制御量とを使用して、ターゲット車両の軌跡コストを決定するステップであって、動力学的制約条件には、エネルギー損失、加速度制約、角速度制約のうちのいずれか1つ又は任意の組み合わせが含まれる、ステップと、ターゲット車両の軌跡コストに基づいて、ターゲット車両の初期参照軌跡を目標走行軌跡に調整するステップと、を含む。

Description

本願は、2021年1月7日に中国特許庁に提出された、出願番号が第202110019580.9号であり、発明の名称が「車両軌跡計画方法、装置、記憶媒体、及び機器」である中国特許出願に基づく優先権を主張し、その全ての内容が、参照することにより本願に組み込まれている。
本願は、自動運転の技術分野に関し、特に車両軌跡計画方法、装置、記憶媒体、及び機器に関する。
自動運転技術は、人工知能の重要な応用として近年大きく発展している。自動運転の目標は、車両が無人の状態で自主的に道路に沿って進行し、できるだけ早く目的地に到着しながら、自車の安全を保証し、他の交通参加者の安全を直接又は間接的に脅かさないことも保証することである。
上記の目標を達成するために、自動運転ソフトウェアには複数の肝心なシステムが必要になり、軌跡計画システムがその中の1つである。軌跡計画の目的は、車両の動力学的要求を満たす軌跡を計画することである。この軌跡は、周囲の障害物(車両、歩行者、静的な障害物など)を回避でき、かつ、意思決定層の指示(車線維持、車線変更、路端停車)を満たす必要がある。
本願の実施例では、車両軌跡計画方法が提供されている。
この方法は、
ターゲット計画時間内のターゲット車両の初期参照軌跡を取得するステップであって、前記初期参照軌跡には、前記ターゲット計画時間内の少なくとも1つの位置点における前記ターゲット車両の初期状態量及び初期制御量が含まれる、ステップと、
参照車線軌跡を取得するステップと、
幾何学的制約条件及び動力学的制約条件に従って、前記参照車線軌跡と、前記少なくとも1つの位置点における前記ターゲット車両の初期状態量および初期制御量とを使用して、前記ターゲット車両の軌跡コストを決定するステップであって、前記動力学的制約条件には、エネルギー損失、加速度制約、角速度制約のうちのいずれか1つ又は任意の組み合わせが含まれる、ステップと、
前記ターゲット車両の軌跡コストに基づいて、前記ターゲット車両の初期参照軌跡を目標走行軌跡に調整するステップと、を含む。
本願の実施例では、取得ユニットと、コストユニットと、調整ユニットとを含む車両軌跡計画装置が提供されており、
前記取得ユニットは、ターゲット計画時間内のターゲット車両の初期参照軌跡を取得し、前記初期参照軌跡には、前記ターゲット計画時間内の少なくとも1つの位置点における前記ターゲット車両の初期状態量及び初期制御量が含まれ、
前記取得ユニットは、さらに、参照車線軌跡を取得し、
前記コストユニットは、幾何学的制約条件及び動力学的制約条件に従って、前記参照車線軌跡と、前記少なくとも1つの位置点における前記ターゲット車両の初期状態量および初期制御量とを使用して、前記ターゲット車両の軌跡コストを決定し、前記動力学的制約条件には、エネルギー損失、加速度制約、角速度制約のうちのいずれか1つ又は任意の組み合わせが含まれ、
前記調整ユニットは、前記ターゲット車両の軌跡コストに基づいて、前記ターゲット車両の初期参照軌跡を目標走行軌跡に調整する。
本願の実施例では、コンピュータプログラムを記憶したコンピュータ可読記憶媒体がさらに提供されており、前記コンピュータプログラムは、プロセッサによって実行されると、本願の実施例で提供される車両軌跡計画方法を実現させる。
本願の実施例では、メモリとプロセッサとを備える電子機器がさらに提供されており、前記メモリには、前記プロセッサで実行可能なコンピュータプログラムが記憶され、前記コンピュータプログラムが前記プロセッサによって実行されると、本願の実施例で提供される車両軌跡計画方法を前記プロセッサに実現させる。
本願の実施例の構成をより明確に説明するために、以下に、実施例の説明に必要な図面を簡単に紹介する。明らかに、以下の説明における図面は本願のいくつかの実施例を示しているに過ぎず、当業者であれば、創造的な労働をすることなく、これらの図面から他の図面を得ることもできる。
本願の実施例で提供される車両軌跡計画方法のシステムアーキテクチャの模式図である。 本願の実施例で提供される自動運転システムの構成の模式図である。 本願の実施例で提供される車両軌跡計画方法のフローチャートである。 本願の実施例における軌跡計画の参照点の模式図である。 本願の実施例で提供される1回の軌跡最適化の模式図である。 本願の具体的な実施例で提供される車両軌跡計画方法のフローの模式図である。 本願の実施例で提供される車両軌跡計画装置の構成の模式図である。 本願の実施例で提供される電子機器の構成の模式図である。
本願の目的、構成、及びメリットをより明確にするために、以下、図面を参照しながら、本願をさらに詳しく説明する。明らかなように、説明する実施例は、本願の一部の実施例に過ぎず、全部の実施例ではない。当業者が創造的な労働をせずに本願の実施例から得る全ての他の実施例は、本願の保護範囲に属する。
以下で使用される「例示的」という言葉は、「例や実施例とするか、又は説明的」という意味である。「例示的」として説明されるいかなる実施例も、必ずしも他の実施例よりも優れているか又は良いと解釈される必要はない。
本明細書の「第1」、「第2」という用語は、説明の目的でのみ使用されており、相対的な重要性を明示又は示唆したり、示された技術的特徴の数を暗黙的に指定したりすると理解されるべきではない。したがって、「第1」、「第2」に限定される特徴は、明示的に又は暗黙的にこの特徴を1つ又は複数含むことができる。本願の実施例の説明では、別段の説明がない限り、「複数」は、2つ以上を意味する。
当業者の理解を容易にするために、本願の実施例における用語の一部を以下に解釈して説明する。
自動運転とは、テストドライバーが物理的な運転操作を行うことなく、車両の走行タスクの指導及び意思決定を行うことができ、テストドライバーの操作行動に代わって車両の安全走行を実現する機能を指す。
自動運転システムとは、車両の様々なレベルの自動運転機能を実現するシステムであり、例えば、運転支援システム(L2)、人間の監視が必要な高速自動運転システム(L3)、及び高度/完全自動運転システム(L4/L5)である。
軌跡計画とは、与えられた車両の初期状態(開始位置、速度、及び加速度を含む)、目標状態(目標位置、速度、及び加速度を含む)、障害物の位置、並びに、動力学的及び快適性の制約条件から、1本の滑らかな軌跡を算出し、この軌跡に沿って車両が目標状態に到達できるようにすることである。軌跡計画は、経路計画及び速度計画という2つの部分を含む。経路計画は、開始位置から目標位置までの滑らかな経路の算出を担うが、速度計画は、この経路を基にして各経路点の速度を計算することにより、1本の速度曲線を形成する。
メタメソッドとは、軌跡計画モードであり、軌跡計画問題を解決するための基本的な方法であり、より小さなユニットに分割してはいけない。メタメソッドが一度呼び出されると、開始位置から目標位置までの軌跡が出力される。出発位置から終点位置までの車両の完全な軌跡は、異なる/同じメタメソッドが呼び出され続けることで出力される軌跡の接続によって形成される。
地面座標系とは、地球の表面に固定された座標系である。OX軸は、地面の平面の任意の方向を指す。OZ軸は垂直上向きであり、OY軸は、右手座標系が形成されるように、OX軸及びOZ軸によって形成される平面に垂直である。地球の自転及び地球の質量中心の曲線運動を無視した場合、この座標系は、慣性座標系と見なすことができる。
フレネ(Frenet)座標系は、道路座標系とも呼ばれ、車両の開始位置を原点として、座標軸が互いに垂直であり、s軸方向(即ち、道路参照線の接線に沿った方向であり、横方向と呼ばれる)及びl軸方向(即ち、参照線の現在の法線方向であり、縦方向と呼ばれる)に分けられ、座標が(s,l)で表される。
直角座標系は、車両の開始位置を原点として、座標軸が互いに垂直であり、x方向及びy方向に分けられ、座標が(x,y)で表される。
誘導車とは、自動運転車両の走行中に、車両の前方に(まもなく)現れる、ターゲット車線内の最も近い環境車両である。
強化学習(RL)とは、機械学習の分野の1つであり、最大となる所期の利益を取得するためにどのように環境に応じて行動するかを強調し、動き制御問題に広く使われているものである。強化学習は、本質的に制御アルゴリズムである。RLはモデルのないRLアルゴリズムを指す場合が多く、モデルに依存する制御方法である線形二次レギュレータ(LQR:linear quadratic regulator)やMPCなどは、モデルのあるRLに分類され、環境の動的特性が知られていることを仮説としている。モデルのあるRLは、より高いサンプル利用効率があると考えられることが多い。
以下、図面及び具体的な実施例を参照しながら、本願をさらに詳しく説明する。
軌跡の最適化に関するスキームは数多くあり、例えば、幾何学的な情報に基づいて多項式曲線を用いた2D平面上の軌跡平滑化アルゴリズム、最短実行可能な経路を探す軌跡探索アルゴリズム、最適軌跡サンプリング方法、及び、逐次二次計画(SQP:sequential quadratic programming)又は内点最適化器(Ipopt:interior point optimizer)に基づいて複雑な非線形制約を処理する軌跡最適化器などである。
上述した幾何学的な情報に基づく軌跡平滑化方法は、空間軌跡計画問題のみを処理することが多く、速度計画問題に適用できないとともに、得られる計画軌跡があまり滑らかでないことが多いため、平滑化アルゴリズムを追加で設計する必要がある。このような方法は、道路の幾何学や車両の幾何学的なレベルの制約のみを処理することができ、複雑な非線形的で動的に変化する制約、例えば動力学的制約を処理するのが難しい。つまり、このような方法は、動力学的変化を最適化する能力がなく、自動運転車両に適用される場合、安定性や安全性が低い。サンプリング及び最適化に基づくアルゴリズムは、複雑なシナリオでの軌跡及び速度の計画問題を処理することができるが、設計が柔軟性に欠けており、同時にアルゴリズムの広範な使用がコンピューティングプラットフォームの解を求める効率によって制限されることが多い。上述したスキームは、複雑な非線形問題を処理するのが難しいか、あるいは、解を求める効率が不十分で、コスト制御要求を満たすのが難しい。
関連技術の技術的問題を解決するために、本願の実施例は、車両軌跡計画方法、装置、電子機器、及び記憶媒体を提供する。本願の実施例は、人工知能(AI:Artificial Intelligence)及び機械学習(ML:Machine Learning)の技術に関し、人工知能の自動運転技術及び機械学習に基づいて設計される。
人工知能(AI:Artificial Intelligence)は、デジタルコンピュータ、又はデジタルコンピュータにより制御される機械を用いて、人間の知能のシミュレーション、延長や拡張をし、環境を感知し、知識を取得し、知識を用いて最適な結果を取得する理論、方法、技術、及び応用システムである。言い換えれば、人工知能は、コンピュータ科学の総合的な技術であり、知能の実質を了解することと、人間の知能に類似する方式で反応できる新たな知能機械を生産することとを図る。人工知能は、各種の知能機械の設計原理及び実現方法を研究し、感知、推理、及び意思決定の機能を機械に持たせるものである。
人工知能技術は、総合的な学科であり、関連する分野が幅広く、ハードウェアレベルの技術もソフトウェアレベルの技術もある。人工知能の基礎技術には、一般的に、例えば、センサ、人工知能専用チップ、クラウドコンピューティング、分散記憶、ビッグデータ処理技術、操作/インタラクティブシステム、メカトロニクスなどの技術が含まれる。人工知能のソフトウェア技術は、主に、コンピュータビジョン技術、音声処理技術、自然言語処理技術、及び機械学習/深層学習などのいくつかの方面を含む。
自動運転技術は、通常、高精度マップ、環境感知、行動意思決定、経路計画、動き制御などの技術を含む。自動運転技術には、幅広い応用の可能性がある。
人工知能技術の研究及び進歩に伴って、人工知能技術は、例えば、よくあるスマートホーム、スマートウェアラブルデバイス、バーチャルアシスタント、スマートスピーカー、スマートマーケティング、無人運転、自動運転、ドローン、ロボット、スマート医療、スマート顧客サービスなどの多くの分野で研究及び応用を展開している。技術の発展に伴い、人工知能技術はより多くの分野に適用され、ますます重要な価値を発揮すると信じられている。
機械学習は、分野を横断した学際的な学科であり、確率論、統計学、近似理論、凸解析、アルゴリズム複雑性理論などの複数の学科に関し、コンピュータがどのように人間の学習行動を模倣又は実現して、新しい知識やスキルを取得し、既存の知識構造を改めて組織して自体の性能を持続的に改善するかを専門に研究する。機械学習は、人工知能のコアであり、コンピュータに知能を付与する根本的な手段であり、人工知能の各分野にわたって適用されている。機械学習及び深層学習は、通常、人工ニューラルネットワーク、信念ネットワーク、強化学習、転移学習、帰納学習などの技術を含む。
本願の実施例では、軌跡最適化方法を用いて経路計画及び速度計画の問題を総合的に処理し、道路及び車両の幾何学的なレベルの制約だけでなく、動力学的制約条件にターゲット車両のエネルギー損失、加速度制約、及び角速度制約が含まれるため、動力学的制約での車両軌跡計画の実現可能性も考慮されている。これにより、車両走行中の複雑な非線形で動的に変化する動力学的制約にさらに適応し、自動運転の安全性及び安定性を向上させる。
本願の実施例で提供される車両軌跡計画方法は、L2、L3、L4、及びこれ以上のレベルの自動運転システムを含めた様々な自動運転車に適用することが可能であり、車線維持のシナリオに重点的に適用され、感知の弱い前方箇所の車線境界線のブレや曲率の変化などに自動的に適応し、自動運転の安定性及び快適性を向上させる。本願の実施例では、上位モジュールからターゲット車両の目標車速を取得できると仮定し、上位モジュールが目標車速の調整によって異なるシナリオ(追従、割り込みなど)に適応させることができると仮定する。このため、本願の実施例では、動的障害物の処理方法を議論しない。
本願の実施例で提供される車両軌跡計画方法の1つの応用シナリオは、図1に示されたものを参照すればよい。
図1を参照する。図1には、本願の一実施例で提供される車両軌跡計画システムの応用シナリオの模式図が示されている。この応用シナリオには、衛星11、基地局12、サーバ13、及び自動運転車両14が含まれる。
そのうち、前記自動運転車両14には、車載端末機器が配置されている。この車載端末機器は、スマートフォン、タブレットコンピュータ、ノートパソコン、又はコンピュータなどの電子機器であってもよく、本願の実施例で提供される車両軌跡計画方法を実現するために、本願の実施例の自動運転システムがインストールされている。
もちろん、サーバ13が、車両走行軌跡を計画し、計画した車両走行軌跡を、衛星11及び基地局12を介して自動運転車両14の車載端末機器に送信し、さらに、計画した車両走行軌跡に従って走行するように自動運転車両14を制御するようにしてもよい。
いくつかの実施例では、図1に示されたサーバ13を物理的に配置する際に、サーバ13を独立したサービス機器として配置してもよいし、サーバ13を複数のサービス機器からなるクラスタ機器として配置してもよい。本願の実施例はこれを限定しない。
上記の応用シナリオにおける自動運転システム100は、図2に示すように、環境感知システム200と、走行計画システム300と、車両制御システム600とを含む。理解できるように、自動運転システム100に含まれる上記システムは、いくつかの実施例において、サブシステム又はモジュールと呼ぶことも可能である。以下にそれぞれ説明する。
環境感知システム200は、環境内の障害物の位置、速度、向き、及び物体分類(例えば、車両、歩行者、自転車)が含まれる環境情報を感知する。いくつかの実施例では、車両自身の状態(速度、加速度、及び方向を含む)を感知するか、あるいは、図1の衛星11のように車両のリアルタイム位置の高精度マップを取得することもできる。
走行計画システム300における意思決定システム400は、客観的な物理法則、障害物、周囲の環境、及び蓄積された過去データ知識と組み合わせて、環境情報及び目標位置に基づいて、感知された障害物を予測することにより、マクロな意思決定を行い、車両がスムーズに目標状態に到達できることを保証する。
いくつかの実施例において、意思決定システム400の意思決定は、道路選択、車線選択、参照車速、道路上で障害物(例えば、人、車など)を正常に追従するか否か、障害物(例えば、人、車など)を迂回するか否か、停車するか否か、信号や歩行者に遭遇したときに待避するか否か、交差点での他の車両とのすれ違いなどを含む。
走行計画システム300における軌跡計画システム500は、環境感知情報と、意思決定システム400による意思決定とに基づいて、軌跡が通過する経路点と、各経路点に到達する際の車両の速度、向き、及び加速度などとの選択を含めた理想的な軌跡の計画を行う。経路点は時空間の連続性を保つだけでなく、各経路点の速度、向き、及び加速度などのパラメータは、車両の実際の操作可能な物理的範囲内にある。
車両制御システム600は、軌跡計画システム500によって計画された軌跡を受信し、車体の属性及び外部の物理的要因と組み合わせて動力学的計算を行い、車両を電子制御するためのアクセル量、ブレーキ量、及びハンドル信号などの車両制御パラメータに変換して実行することで、車両を制御して軌跡における軌跡点を実現させる。
本願の実施例の自動運転システムを実現する例示的な応用を引き続いて説明する。
いくつかの実施例において、図2に示すような自動運転システム100の各サブシステムは、一体(例えば、自動運転ソフトウェア)としてパッケージ化されてもよく、様々な可能な機器に配置されることが可能である。例えば、車載端末、ユーザ端末(スマートフォンやタブレットコンピュータを含む)などの端末機器に配置される場合、端末機器は、車両との無線方式又は有線方式の通信によって図1の自動運転車両14を制御し、自動運転車両14の自動運転機能を実現する。また、例えば、図1のサーバ13に配置される場合、サーバ13は、基地局12と自動運転車両14との様々な無線通信によって自動運転車両14を制御し、自動運転車両14の自動運転機能を実現する。
他のいくつかの実施例において、図1に示すような自動運転システム100の各サブシステムは、独立したソフトウェア、モジュール、又はプラグインとしてパッケージ化され、上記の機器に配置されたり、上記の機器に予め配置された自動運転ソフトウェア及び自動ナビゲーションソフトウェアと結合されたりしてもよい。これにより、自動運転機能又は自動運転機能の一部のサブ機能(例えば、軌跡計画)を実現する。
注意すべきものとして、上記で言及された応用シナリオは、本願の精神及び原理の理解を容易にするためにのみ示されており、本願の実施例はこの点で何ら制限されない。逆に、本願の実施例は、適用可能な任意のシナリオに応用することができる。
図3には、本願の一実施例で提供される車両軌跡計画方法のフローチャートが示されている。図3に示すように、この方法は、車載端末機器によって実行され、以下のステップを含む。
ステップS301では、ターゲット計画時間内のターゲット車両の初期参照軌跡を取得し、初期参照軌跡には、ターゲット計画時間内の少なくとも1つの位置点におけるターゲット車両の初期状態量及び初期制御量が含まれる。
ここで、ターゲット車両は自動運転車両であり、ターゲット計画時間は予め設定された時間である。例えば、5秒に設定し、計画ステップ数を20に設定すると、各タイムステップ(time step)それぞれは、dt=T/N=0.25秒である。ここでのタイムステップは、サンプリングされた位置点間の時間である。
具体的な実施プロセスにおいて、状態量は位置、速度、方位角などを含み、制御量は加速度、角速度などを含む。本願の実施例では、ターゲット車両に対してターゲット計画時間内で所定のタイムステップに従ってサンプリングし、各位置点の初期状態量及び初期制御量を取得し、位置、速度、向きなどで状態ベクトルを構成し、加速度及び角速度で対応する制御ベクトルを構成し、さらに、各区間の初期状態量及び初期制御量を接続して初期参照軌跡を形成する。
例えば、5sの時間を20個の0.25sの区間に等分し、各区間のサンプリングを行うことにより、各区間におけるターゲット車両の状態(位置、速度、加速度などを含む)を取得することができる。ここでのサンプリングは、各区間の開始時にサンプリングしてもよく、各区間の終了時にサンプリングしてもよく、各区間の中間時点にサンプリングしてもよく、異なる区間のサンプリング位置が一致するように保持する必要がある。同一の時点に対して、位置、速度、及び向きで初期状態ベクトルを構成し、加速度及び角速度で初期制御ベクトルを構成する。
ステップS302では、参照車線軌跡を取得する。
具体的な実施プロセスにおいて、参照車線軌跡は、ターゲット車両の開始位置及び目標位置に基づいて決定されてもよい。本願の実施例では、障害物が存在するシナリオを考慮しないため、開始位置と目標位置との間の経路から1つの自動車車線をランダムに選択するか、あるいは、該経路における車線の位置などに基づいて1つの適当な自動車車線を選択してもよい。一般的には、該自動車車線の中線を参照車線軌跡とする。もちろん、該車線の境界線を参照車線軌跡としてもよい。本願の実施例はこれを制限しない。
ステップS303では、幾何学的制約条件及び動力学的制約条件に従って、参照車線軌跡と、少なくとも1つの位置点におけるターゲット車両の初期状態量及び初期制御量とを使用して、ターゲット車両の軌跡コストを決定する。
ここで、動力学的制約条件には、エネルギー損失、加速度制約、角速度制約のうちのいずれか1つ又は任意の組み合わせが含まれる。
具体的な実施プロセスでは、参照車線軌跡が決定されると、該参照車線軌跡の各パラメータに基づいてターゲット車両の軌跡コストを決定することができる。具体的には、対応する幾何学的制約条件及び動力学的制約条件を予め設定する。そのうち、幾何学的制約条件は、ターゲット車両に対する道路及び車両の幾何学的なレベルの制約であり、位置制約、車速制約、ヨー角制約などを含んでもよい。幾何学的制約によって、ターゲット車両が、設定された経路に従って始点から終点まで走行できることが保証され、車線維持に良く適用されている。
動力学的制約条件は、ターゲット車両に対する速度計画及び動力学的なレベルの制約であり、エネルギー損失、加速度制約、角速度制約などを含んでもよく、複雑な非線形で動的に変化する走行シナリオ(例えば、旋回、車線変更など)に良く適用でき、自動運転の安定性及び快適性を向上させることができる。
ステップS304では、ターゲット車両の軌跡コストに基づいて、ターゲット車両の初期参照軌跡を目標走行軌跡に調整する。
具体的な実施プロセスでは、強化学習アルゴリズムを使用し、ターゲット車両の軌跡コストに基づいて、ターゲット車両の初期参照軌跡を調整し、軌跡の最適化を行い、反復回数が閾値に達するか軌跡コストが収束するまで、最適化された軌跡を新たな参照軌跡として、複数回の反復最適化を行うことにより、最終的な最適軌跡、即ち、ターゲット車両の目標走行軌跡を取得してもよい。
上記のプロセスは、1つのターゲット計画時間内のターゲット車両の軌跡最適化スキームである。始点位置から終点位置まで走行するようにターゲット車両を誘導するために、複数のターゲット計画時間内のターゲット車両の軌跡を最適化する必要がある。具体的な実施プロセスでは、1番目のターゲット計画時間内の1番目の位置点以外のいずれか1つの位置点におけるターゲット車両の状態量及び制御量、即ち、1番目の目標走行軌跡における状態量及び制御量を、2番目のターゲット計画時間内の1番目の位置点の初期状態量及び初期制御量とすることにより、2番目のターゲット計画時間内のターゲット車両の目標走行軌跡を取得してもよい。さらに、2番目のターゲット計画時間内の1番目の位置点以外のいずれか1つの位置点におけるターゲット車両の状態量及び制御量、即ち、2番目の目標走行軌跡における状態量及び制御量を、3番目のターゲット計画時間内の1番目の位置点の初期状態量及び初期制御量とすることにより、3番目のターゲット計画時間内のターゲット車両の目標走行軌跡を取得する。このように類推して、後続の目標走行軌跡を順次に生成することができる。
このように、ターゲット車両の一連の目標走行軌跡を結ぶと、始点位置から目標位置までのターゲット車両の連続軌跡を形成し、始点位置から目標位置まで走行するようにターゲット車両を誘導し、前記目標走行軌跡に従って走行するようにターゲット車両を制御することを実現することができる。
本願の実施例では、参照車線軌跡を取得するとともに、ターゲット計画時間内のターゲット車両の初期参照軌跡を取得する。ここで、初期参照軌跡には、ターゲット計画時間内の少なくとも1つの位置点におけるターゲット車両の初期状態量及び初期制御量が含まれる。幾何学的制約条件及び動力学的制約条件に従って、参照車線軌跡と、少なくとも1つの位置点におけるターゲット車両の初期状態量及び初期制御量とを使用して、ターゲット車両の軌跡コストを決定する。ここで、動力学的制約条件には、エネルギー損失、加速度制約、角速度制約のうちのいずれか1つ又は任意の組み合わせが含まれる。ターゲット車両の軌跡コストに基づいて、ターゲット車両の初期参照軌跡を目標走行軌跡に調整する。本願の実施例では、参照車線軌跡及びターゲット車両の初期参照軌跡を取得した後、幾何学的制約条件及び動力学的制約条件に従って、最適化器指標関数を設定し、参照車線軌跡と、ターゲット車両の初期状態量及び初期制御量とを使用して、ターゲット車両の軌跡コストを決定することにより、走行経路計画及び速度計画の問題を総合的に処理し、道路及び車両の幾何学的なレベルの制約だけでなく、動力学的制約条件にターゲット車両のエネルギー損失、加速度制約、及び角速度制約が含まれるため、動力学的制約での車両軌跡計画の実現可能性も考慮されている。これにより、車両走行中の複雑な非線形で動的に変化する動力学的制約にさらに適応し、自動運転の安全性及び安定性を向上させる。
さらに、本願の実施例では、幾何学的制約条件及び動力学的制約条件に従って、各位置点の軌跡コストを決定する。幾何学的制約条件及び動力学的制約条件に従って、参照車線軌跡と、ターゲット車両の初期状態量及び初期制御量とを使用して、ターゲット車両の軌跡コストを決定する上記ステップS303は、
ターゲット計画時間内の各位置点それぞれに対して、参照車線軌跡、ターゲット車両の初期状態量、及び幾何学的制約条件に基づいて、該位置点におけるターゲット車両の幾何学的コスト関数サブアイテムを決定し、ターゲット車両の初期状態量、初期制御量、及び動力学的制約条件に基づいて、該位置点におけるターゲット車両の動力学的コスト関数サブアイテムを決定するステップと、
少なくとも、ターゲット計画時間内の各位置点の幾何学的コスト関数サブアイテム及び各位置点の動力学的コスト関数サブアイテムに基づいて、ターゲット計画時間内のターゲット車両の軌跡コストを決定するステップと、を含む。
そのうち、幾何学的制約条件は、ターゲット車両に対する道路及び車両の幾何学的なレベルの制約であり、位置制約、車速制約、ヨー角制約などを含んでもよい。幾何学的制約によって、ターゲット車両が、設定された経路に従って始点から終点まで走行できることが保証され、車線維持に良く適用されている。
動力学的制約条件は、ターゲット車両に対する速度計画及び動力学的なレベルの制約であり、エネルギー損失、加速度制約、角速度制約などを含んでもよく、複雑な非線形で動的に変化する走行シナリオ(例えば、旋回、車線変更など)に良く適用でき、自動運転の安定性及び快適性を向上させることができ、さらに自動運転の安全性も大幅に向上させる。
本願の実施例では、ターゲット計画時間内のいずれの位置点に対しても、ターゲット車両の幾何学的コスト関数サブアイテム及び動力学的コスト関数サブアイテムを決定するため、ターゲット車両の軌跡コストが、ターゲット計画時間内のターゲット車両の全ての幾何学的コスト関数サブアイテム及び全ての動力学的コスト関数サブアイテムの重み付けによって得られる。
本願の実施例では、ターゲット車両の軌跡計画に対して、システムの動力学的モデルを作成し、肝心な制約及びコスト関数を設計し、最後にiLQRアルゴリズムを使用して軌跡計画問題の解を求める。
具体的な実施プロセスでは、iLQRの軌跡最適化アルゴリズムによって、ターゲット車両の軌跡を最適化する。iLQRは、LQRを反復的に使用して、軌跡の目的関数を継続的に最適化することにより、制約条件を満たす最適解又は準最適解を取得する。iLQRは、非線形システム、非線形制約、及び非線形目的関数の復雑な問題を処理するのに適し、局所的なシステムの線形化処理と、制約及び目的関数の二次化処理とによって、復雑な非線形問題を簡略化してその解を効率的に求める目的を達成する。
数学的には、iLQRは一般に離散時間有限領域の軌跡計画問題の解を求めるために用いられる。この問題は、次の数式によって記述することができる。
ここで、xkは、現在時刻から第kステップのシステム状態ベクトルであり、xstartは、計画の現在時刻のシステム状態であり、ukは、現在時刻から第kステップのシステム制御ベクトルであり、l及びlfは、それぞれ、中間コスト及び最終コストであり、g及びgfは、それぞれ、中間制約及び最終制約である。最適化ベクトルは、x=[x1,…,xN]、u=[u1,…,uN-1]と定義されており、f(xk,uk)は、離散システムの状態変化を記述する動力学的方程であり、Nは、軌跡計画の最大ステップ数であり、例えば、Nを10から20の任意の整数に設定してもよい。
説明を容易にするために、まず、本願の実施例の軌跡計画プロセスにおけるシステムパラメータを紹介する。
ターゲット車両の状態ベクトル
及び制御ベクトル
を設定すると、システムの動力学的方程は、次の等式によって記述される。

ここで、px,pyは地面座標系におけるターゲット車両の座標であり、vは速度であり、ψは方位角(yaw)であり、a及びrは、それぞれ、加速度及び角速度であり、kはターゲット計画時間内のステップ数である。ターゲット計画時間T=5秒であり、計画ステップ数N=20であると仮定すると、各タイムステップそれぞれは、dt=T/N=0.25秒に等しい。
強化学習アルゴリズムのコアは、コスト関数の設計である。iLQRアルゴリズムが制約関数を直接に処理できないため、通常の場合、制約情報をコスト関数(ソフト制約)に変換し、コスト関数の設計によって制約条件を満たす必要がある。以下、本願の実施例における各幾何学的コスト関数サブアイテム及び動力学的コスト関数サブアイテムのそれぞれを具体的に紹介する。説明すべきものとして、以下の幾何学的コスト関数サブアイテム及び動力学的コスト関数サブアイテムは、いずれも例であり、制限するためのものではない。ターゲット車両の軌跡コストは、下記の一部のコスト関数サブアイテムの重み付けであってもよいし、全部のコスト関数サブアイテムの重み付けであってもよい。
いくつかの実施例において、参照車線軌跡、ターゲット車両の初期状態量、及び幾何学的制約条件に基づいて、該位置点におけるターゲット車両の幾何学的コスト関数サブアイテムを決定するステップは、
目標車速と、ターゲット車両の現在車速とに基づいて、該位置点におけるターゲット車両の車速コスト関数サブアイテムを決定するステップと、
ターゲット車両の現在の状態量と、参照軌跡における現在時刻の状態量とに基づいて、該位置点におけるターゲット車両の参照軌跡ずれコスト関数サブアイテムを決定するステップと、
参照車線軌跡と、ターゲット車両の現在位置の座標とに基づいて、該位置点におけるターゲット車両の参照車線ずれコスト関数サブアイテムを決定するステップと、を含む。
具体的な実施プロセスにおいて、幾何学的コスト関数サブアイテムは、車速コスト関数サブアイテム、参照軌跡ずれコスト関数サブアイテム、参照車線ずれコスト関数サブアイテムを含む。
そのうち、車速コスト関数サブアイテムは、ターゲット車両の車速を制御するために用いられる。例えば、異なる経路に対応する制限速度が異なり、干渉を考慮しない場合で、ターゲット車両の車速を走行車線の最高制限速度以下に制限する必要がある。また、例えば、追従シナリオにおいて、誘導車の速度及び追従距離に基づいて、ターゲット車両の車速を制限してもよい。いくつかの実施例において、目標車速と、ターゲット車両の現在車速とに基づいて、該位置点におけるターゲット車両の車速コスト関数サブアイテムを決定するステップは、
目標車速と現在車速との差を計算するステップと、
車速コスト関数の重み、及び、目標車速と現在車速との差を使用して、位置点におけるターゲット車両の車速コスト関数サブアイテムを計算するステップと、を含む。
具体的な車速コスト関数サブアイテムは、次の数式に示す通りである。
ここで、lvは、車速コスト関数サブアイテムであり、w1は、車速コスト関数サブアイテムに対応する重みであり、vは、ターゲット車両の現在車速であり、vtargetは、目標車速であり、上位の意思決定モジュールによって提供されてもよいし、誘導車の速度及び追従距離、車線制限速度に基づいて設計されてもよい。w1の調整は、主にターゲット車両の加速、減速の激しさに影響する。
参照軌跡ずれコスト関数サブアイテムは、参照軌跡とのずれ誤差を制御するために用いられ、参照軌跡の周囲におけるアルゴリズムの探索範囲を調整することを実質としている。図4に示すように、図中の点線内の領域はアルゴリズムの探索範囲であり、一般的には、参照軌跡ずれコスト関数サブアイテムの重みが大きいほど、探索範囲が狭くなる。
いくつかの実施例において、ターゲット車両の現在の状態量と、参照軌跡における現在時刻の状態量とに基づいて、位置点におけるターゲット車両の参照軌跡ずれコスト関数サブアイテムを決定するステップは、
ターゲット車両の現在の状態量と参照軌跡における現在時刻の状態量との差を計算するステップと、
参照軌跡ずれコスト関数の重み、及び、ターゲット車両の現在の状態量と参照軌跡における現在時刻の状態量との差を使用して、位置点におけるターゲット車両の参照軌跡ずれコスト関数サブアイテムを計算するステップと、を含む。
具体的には、参照軌跡ずれコスト関数サブアイテムは、次の数式に示す通りである。
ここで、
は、参照軌跡ずれコスト関数サブアイテムであり、w2は、参照軌跡ずれコスト関数サブアイテムの重みであり、Q2は係数であり、xは、ターゲット車両の現在の状態量であり、xrefは、参照軌跡における現在時刻の状態量である。w2及びQ2の設計は、実質的に、参照軌跡の周囲におけるiLQRの探索範囲の調整である。
参照車線ずれコスト関数サブアイテムは、参照車線軌跡とのずれ誤差を制御するために用いられる。図4に示すように、図中の点P、点Zは、ターゲット車両の参照軌跡における点であり、点P′は、参照車線軌跡における点Pの参照点であり、点Z′は、参照車線軌跡における点Zの参照点であり、参照車線ずれコスト関数サブアイテムは、点Pと点P′との距離、点Zと点Z′との距離を制御するために用いられる。
いくつかの実施例において、参照車線軌跡と、ターゲット車両の現在位置の座標とに基づいて、位置点におけるターゲット車両の参照車線ずれコスト関数サブアイテムを決定するステップは、
ターゲット車両の参照位置の座標を決定するステップであって、ターゲット車両の参照位置が、参照車線軌跡における、ターゲット車両の現在位置に対応する位置である、ステップと、
参照車線ずれコスト関数の重み、並びに、ターゲット車両の現在位置の座標及び参照位置の座標を使用して、位置点におけるターゲット車両の参照車線ずれコスト関数サブアイテムを計算するステップと、を含む。
具体的には、参照車線ずれコスト関数サブアイテムは、次の数式に示す通りである。
ここで、lcenterは、参照車線ずれコスト関数サブアイテムであり、w4は、参照車線ずれコスト関数サブアイテムの重みであり、Qは係数であり、Mrefは、道路座標系(Frenet座標系)における軌跡点(px,py)の参照点、即ち、車線の中線において(px,py)から最も近い点である。行列
である。Frenet座標系において、s軸は、自然に道路参照線(例えば、道路の中心線γ)の方向に沿って延び、道路方向の変化を暗黙的に含み、l軸の座標は、道路参照線からの距離を表すことができる。
本願の実施例では、各位置点におけるターゲット車両の幾何学的コスト関数サブアイテムを決定することにより、ターゲット車両の加速、減速の激しさを調整することができ、ターゲット車両に対して滑らかな車両軌跡を計画することができ、異なる路面条件下のターゲット車両の安定かつ快適で安全な走行を実現する。
いくつかの実施例において、ターゲット車両の初期状態量、初期制御量、及び動力学的制約条件に基づいて、該位置点におけるターゲット車両の動力学的コスト関数サブアイテムを決定するステップは、
ターゲット車両の現在の制御量に基づいて、該位置点におけるターゲット車両のエネルギー損失コスト関数サブアイテムを決定するステップと、
加速度制約条件と、ターゲット車両の現在の加速度とに基づいて、該位置点におけるターゲット車両の加速度コスト関数サブアイテムを決定するステップと、
角速度制約条件と、ターゲット車両の現在の角速度とに基づいて、該位置点におけるターゲット車両の角速度コスト関数サブアイテムを決定するステップと、を含む。
具体的な実施プロセスにおいて、動力学的コスト関数サブアイテムは、エネルギー損失コスト関数サブアイテム、加速度コスト関数サブアイテム、角速度コスト関数サブアイテムを含む。
そのうち、エネルギー損失コスト関数サブアイテムは、ターゲット車両の軌跡の滑らかさを制御するために用いられ、ターゲット車両の現在の制御量は、ターゲット車両の現在の加速度及び現在の角速度を含み、ターゲット車両の現在の制御量に基づいて、位置点におけるターゲット車両のエネルギー損失コスト関数サブアイテムを決定するステップは、
エネルギー損失コスト関数の重み、ターゲット車両の現在の加速度及び現在の角速度を使用して、位置点におけるターゲット車両のエネルギー損失コスト関数サブアイテムを決定するステップを含む。
具体的には、エネルギー損失コスト関数サブアイテムは、次の数式に示す通りである。
ここで、luは、エネルギー損失コスト関数サブアイテムであり、w3は、エネルギー損失コスト関数サブアイテムの重みであり、R3は係数であり、w3及びR3の設計は、軌跡の滑らかさ及び制御信号の滑らかさに直接に影響し、軌跡の滑らかさを増大するために、一般的には、w3及びR3は大きな値に設計される。
加速度コスト関数サブアイテムは、ターゲット車両の加速度を制御するために用いられる。加速度制約と、ターゲット車両の現在の加速度とに基づいて、位置点におけるターゲット車両の加速度コスト関数サブアイテムを決定するステップは、
最大加速度及び最小加速度を決定するステップと、
最大加速度とターゲット車両の現在の加速度との差、ターゲット車両の現在の加速度と最小加速度との差、及び前記加速度制約条件に基づいて、位置点におけるターゲット車両の加速度コスト関数サブアイテムを決定するステップと、を含む。
加速度制約条件はamin<a<amaxであり、そのうち、amin、amaxは、それぞれ、最小設計加速度、最大設計加速度である。このため、加速度コスト関数サブアイテムを、次の数式に示すように設定する。
ここで、lacc1、lacc2は加速度コスト関数サブアイテムであり、q1、q2は加速度コスト関数サブアイテムの係数であり、D=[1 0]である。
角速度コスト関数サブアイテムは、ターゲット車両のヨー角速度を制御するために用いられる。角速度制約と、ターゲット車両の現在の角速度とに基づいて、位置点におけるターゲット車両の角速度コスト関数サブアイテムを決定するステップは、
道路付着係数に基づいて、最大角速度及び最小角速度を決定するステップと、
最大角速度とターゲット車両の現在の角速度との差、ターゲット車両の現在の角速度と最小角速度との差、及び前記角速度制約条件に基づいて、位置点におけるターゲット車両の角速度コスト関数サブアイテムを決定するステップと、を含む。
ヨー角速度制約はrmin<r<rmaxであり、そのうち、rmin、rmaxは、それぞれ、最小設計角速度、最大設計角速度である。このため、角速度コスト関数サブアイテムを、次の数式に示すように設定する。
ここで、lr1、lr2は角速度コスト関数サブアイテムであり、q1、q2は角速度コスト関数サブアイテムの係数であり、E=[0 1]である。そのうち、rmin、rmaxの値が軌跡計画の実現可能性に影響するため、本願の実施例では、rmin及びrmaxを以下のように設定する。
ここで、
は、設定された最大側方加速度である。道路付着係数がμであると仮定すると、
は、
と設計されてもよい。ここで、gは重力加速度定数であり、αは設計可能な係数である。
本願の実施例では、各位置点におけるターゲット車両の動力学的コスト関数サブアイテムを決定することにより、動的軌跡計画の安定性を向上させることができ、動力学的制約条件で計画される車両軌跡の実現可能性及び安全性の問題を解決し、異なる路面条件下のターゲット車両の安定かつ快適で安全な走行を実現する。
上記のプロセスにおいて、幾何学的コスト関数サブアイテム及び動力学的コスト関数サブアイテムが設定されている。本願の実施例では、ターゲット計画時間内の全ての幾何学的コスト関数サブアイテム及び全ての動力学的コスト関数サブアイテムに基づいて、ターゲット計画時間内のターゲット車両の軌跡コストを決定する。軌跡コスト関数は、各サブアイテムの重み付けであり、具体的には、次の数式を参照すればよい。
ここで、lは、軌跡コスト関数であり、等式の右辺の各項それぞれは、1つのコスト関数サブアイテムである。
好ましくは、コスト関数サブアイテムには、それに対応するコスト関数重みが含まれ、コスト関数重みは、ターゲット計画時間内の位置点に対応する時変パラメータである。
一般的には、計画距離が遠くなるにつれて、環境感知能力が弱くなり、それに対応するコスト関数の重要性が低下するため、重みw1,…,w4を時変パラメータとして設計してもよい。例えば、
であり、kは現在計画のステップ数(0≦k<N)、dtはタイムステップである。このような時変の重みは、軌跡計画の安定性を増加させて、信頼できない情報の干渉を低減するのに有利である。
さらに、計画された軌跡の終端状態の有効性を保証するために、軌跡コスト関数に最終誤差を設定する必要もある。少なくとも、ターゲット計画時間内の各位置点の幾何学的コスト関数サブアイテム及び各位置点の動力学的コスト関数サブアイテムに基づいて、ターゲット計画時間内のターゲット車両の軌跡コストを決定するステップは、
ターゲット車両の目標状態と、ターゲット計画時間内の最後の位置点におけるターゲット車両の初期状態量とに基づいて、ターゲット計画時間内のターゲット車両の最終ステップ誤差サブアイテムを決定するステップと、
ターゲット計画時間内の各位置点の幾何学的コスト関数サブアイテム、各位置点の動力学的コスト関数サブアイテム、及び最終ステップ誤差サブアイテムに基づいて、ターゲット計画時間内のターゲット車両の軌跡コストを決定するステップと、をさらに含む。
ここで、最終ステップ誤差サブアイテムは、最終誤差サブアイテムとも呼ばれ、車両軌跡の終端状態の有効性を保証するために用いられる。ターゲット計画時間内の最終ステップ誤差サブアイテムを決定することにより、計画された車両軌跡の終端状態におけるターゲット車両の速度及び方向の正確性を確保し、ターゲット車両の安全走行を保証することができる。
具体的な実施プロセスにおいて、終端状態における速度及び方向に重要なため、本願の実施例では、最終ステップ誤差サブアイテムは、以下に示す通りである。
ここで、lfは、最終ステップ誤差サブアイテムであり、w7は、最終ステップ誤差サブアイテムの重みであり、xNは、ターゲット計画時間内の第Nステップ、即ち、最後の位置点におけるターゲット車両の状態量であり、xtargetは、目標状態である。
このため、最終ステップ誤差サブアイテムを考慮すると、本願の実施例における軌跡コスト関数は、次の数式に示す通りである。
このようにして、最適化問題のモデル化が完了する。次に、強化学習アルゴリズムによって最適化問題の解を求めることができる。本願の実施例では、iLQRアルゴリズムを使用して解を求める。この場合、ターゲット車両の軌跡コストに基づいて、ターゲット車両の初期参照軌跡を目標走行軌跡に調整するステップは、
軌跡コストに基づいて、ターゲット計画時間の最後の位置点から逆方向で各位置点の最適制御率を計算するステップと、
最適制御率に基づいて、ターゲット車両の状態量及び制御量を順次に調整するステップと、
設定された反復終了条件に達するまで、ターゲット車両の現在の状態量及び現在の制御量に基づいて、ターゲット車両の軌跡コストを更新し、逆方向で最適制御率を再計算することにより、目標走行軌跡を取得するステップと、を含む。
具体的な実施プロセスにおいて、1回のiLQRの実行プロセスは、図5に示す通りである。現在時刻の参照軌跡
が与えられると、iLQRは、まず、1回の逆伝播プロセスを行い、
から、最適化目的関数J(x,u)、即ち、上記軌跡コスト関数lによって、時刻T-1から時刻0までの各ステップの最適制御率を計算する。次に、1回の順伝播プロセスを行い、初期状態
から、逆方向プロセスで求められた最適制御率を使用して、時刻Tまで前へ逐次反復することにより、最適化された軌跡
を取得することができる。
最終的な最適軌跡が取得されるまで、最適化された軌跡を新たな参照軌跡として、上記のプロセスを継続的に繰り返し、複数回のLQRの反復最適化を行う。
以下、具体的な実例によって、本願の実施例で提供される反復線形二次レギュレータ(iLQR:ilterative linear quadratic regulator)に基づく車両軌跡計画方法の実現プロセスを説明する。図6には、車両軌跡計画方法のフローの模式図が示されている。図6に示すように、本願の具体的な実施例で提供される車両軌跡計画方法は、以下のステップを含む。
ターゲット計画時間内のターゲット車両の初期参照軌跡と、参照車線軌跡とを取得する。ここで、初期参照軌跡には、ターゲット計画時間内のターゲット車両の各ステップの初期状態量及び初期制御量が含まれる。
幾何学的制約条件及び動力学的制約条件に従って、参照車線軌跡と、ターゲット車両の初期状態量及び初期制御量とを使用して、ターゲット車両の軌跡コストJ(x,u)を計算する。ここで、幾何学的制約条件には、位置制約、車速制約、ヨー角制約が含まれ、動力学的制約条件には、エネルギー損失、加速度制約、角速度制約が含まれる。
ターゲット車両の軌跡コストに基づいて、収束条件を満たすか否かを判断し、収束条件を満たす場合、目標走行軌跡を出力し、収束条件を満たさない場合、逆方向プロセスを行い、軌跡コスト、即ち、目的関数J(x,u)を使用して、時刻T-1から時刻0までの各ステップの最適制御率を計算する。
また、1回の順伝播プロセスを行い、初期状態から順方向プロセスを行い、逆方向プロセスで求められた最適制御率を使用して、時刻Tまで前へ逐次反復することにより、最適化された新たな軌跡を取得することができる。
反復回数に達したか否か、又は、目的関数J(x,u)が収束するか否かを判断し、反復回数に達したか目的関数が収束する場合、目標走行軌跡を出力し、反復回数に達していないか目的関数が収束しない場合、最適化された新たな軌跡を参照軌跡として、逆方向プロセスを繰り返して実行し、制御率を計算する。
下記は本願の装置の実施例である。装置の実施例に詳細に説明されない細部については、それに一々対応する上記の方法の実施例を参照すればよい。
図7を参照する。図7には、本願の一実施例で提供される車両軌跡計画装置の構成ブロック図が示されている。この車両軌跡計画装置は、ハードウェア、又は、ソフトウェアとハードウェアとの組み合わせによって、図1の車載端末機器の全部又は一部として実現される。該装置は、取得ユニット701と、コストユニット702と、調整ユニット703とを含む。
前記取得ユニット701は、ターゲット計画時間内のターゲット車両の初期参照軌跡を取得し、前記初期参照軌跡には、前記ターゲット計画時間内の少なくとも1つの位置点における前記ターゲット車両の初期状態量及び初期制御量が含まれ、
前記取得ユニット701は、さらに、参照車線軌跡を取得し、
前記コストユニット702は、幾何学的制約条件及び動力学的制約条件に従って、前記参照車線軌跡と、前記少なくとも1つの位置点における前記ターゲット車両の初期状態量および初期制御量とを使用して、前記ターゲット車両の軌跡コストを決定し、前記動力学的制約条件には、エネルギー損失、加速度制約、角速度制約のうちのいずれか1つ又は任意の組み合わせが含まれ、
前記調整ユニット703は、前記ターゲット車両の軌跡コストに基づいて、前記ターゲット車両の初期参照軌跡を目標走行軌跡に調整する。
いくつかの実施例において、前記コストユニット702は、
前記ターゲット計画時間内の各位置点それぞれに対して、前記参照車線軌跡、前記ターゲット車両の初期状態量、及び幾何学的制約条件に基づいて、前記位置点における前記ターゲット車両の幾何学的コスト関数サブアイテムを決定し、前記ターゲット車両の初期状態量、初期制御量、及び動力学的制約条件に基づいて、前記位置点における前記ターゲット車両の動力学的コスト関数サブアイテムを決定し、
少なくとも、前記ターゲット計画時間内の各位置点の幾何学的コスト関数サブアイテム及び各位置点の動力学的コスト関数サブアイテムに基づいて、前記ターゲット計画時間内の前記ターゲット車両の軌跡コストを決定する。
いくつかの実施例において、前記コストユニット702は、さらに、
前記ターゲット車両の目標状態と、前記ターゲット計画時間内の最後の位置点における前記ターゲット車両の初期状態量とに基づいて、前記ターゲット計画時間内の前記ターゲット車両の最終ステップ誤差サブアイテムを決定し、
前記ターゲット計画時間内の各位置点の幾何学的コスト関数サブアイテム、各位置点の動力学的コスト関数サブアイテム、及び前記最終ステップ誤差サブアイテムに基づいて、前記ターゲット計画時間内の前記ターゲット車両の軌跡コストを決定する。
いくつかの実施例において、コスト関数サブアイテムには、それに対応するコスト関数重みが含まれ、前記コスト関数重みは、ターゲット計画時間内の位置点に対応する時変パラメータである。
いくつかの実施例において、前記コストユニット702は、具体的には、
目標車速と、前記ターゲット車両の現在車速とに基づいて、前記位置点における前記ターゲット車両の車速コスト関数サブアイテムを決定し、
前記ターゲット車両の現在の状態量と、参照軌跡における現在時刻の状態量とに基づいて、前記位置点における前記ターゲット車両の参照軌跡ずれコスト関数サブアイテムを決定し、
前記参照車線軌跡と、前記ターゲット車両の現在位置の座標とに基づいて、前記位置点における前記ターゲット車両の参照車線ずれコスト関数サブアイテムを決定する。
いくつかの実施例において、前記コストユニット702は、具体的には、
前記目標車速と前記現在車速との差を計算し、
車速コスト関数の重み、及び、前記目標車速と前記現在車速との差を使用して、前記位置点における前記ターゲット車両の車速コスト関数サブアイテムを計算し、
前記ターゲット車両の現在の状態量と前記参照軌跡における現在時刻の状態量との差を計算し、
参照軌跡ずれコスト関数の重み、及び、前記ターゲット車両の現在の状態量と前記参照軌跡における現在時刻の状態量との差を使用して、前記位置点における前記ターゲット車両の参照軌跡ずれコスト関数サブアイテムを計算し、
前記ターゲット車両の参照位置の座標を決定し、前記ターゲット車両の参照位置が、前記参照車線軌跡における、前記ターゲット車両の現在位置に対応する位置であり、
参照車線ずれコスト関数の重み、並びに、前記ターゲット車両の現在位置の座標及び参照位置の座標を使用して、前記位置点における前記ターゲット車両の参照車線ずれコスト関数サブアイテムを計算する。
いくつかの実施例において、前記コストユニット702は、具体的には、
前記ターゲット車両の現在の制御量に基づいて、前記位置点における前記ターゲット車両のエネルギー損失コスト関数サブアイテムを決定し、
加速度制約と、前記ターゲット車両の現在の加速度とに基づいて、前記位置点における前記ターゲット車両の加速度コスト関数サブアイテムを決定し、
角速度制約と、前記ターゲット車両の現在の角速度とに基づいて、前記位置点における前記ターゲット車両の角速度コスト関数サブアイテムを決定する。
いくつかの実施例において、前記ターゲット車両の現在の制御量は、前記ターゲット車両の現在の加速度及び現在の角速度を含み、
前記コストユニット702は、具体的には、
エネルギー損失コスト関数の重み、前記ターゲット車両の現在の加速度及び現在の角速度を使用して、前記位置点における前記ターゲット車両のエネルギー損失コスト関数サブアイテムを計算し、
最大加速度及び最小加速度を決定し、
前記最大加速度と前記ターゲット車両の現在の加速度との差、前記ターゲット車両の現在の加速度と前記最小加速度との差、及び前記加速度制約条件に基づいて、前記位置点における前記ターゲット車両の加速度コスト関数サブアイテムを決定し、
前記道路付着係数に基づいて、最大角速度及び最小角速度を決定し、
前記最大角速度と前記ターゲット車両の現在の角速度との差、前記ターゲット車両の現在の角速度と前記最小角速度との差、及び前記角速度制約条件に基づいて、前記位置点における前記ターゲット車両の角速度コスト関数サブアイテムを決定する。
いくつかの実施例において、前記調整ユニット703は、具体的には、
軌跡コストに基づいて、前記ターゲット計画時間の最後のステップから最初のステップまで逆方向で各ステップの最適制御率を計算し、
最適制御率に基づいて、前記ターゲット計画時間の最初のステップから最後のステップまで前記ターゲット車両の状態量及び制御量を順次に調整し、
設定された反復終了条件に達するまで、前記ターゲット車両の現在の状態量及び現在の制御量に基づいて、前記ターゲット車両の軌跡コストを更新し、逆方向で最適制御率を再計算することにより、前記目標走行軌跡を取得する。
上述した方法の実施例に対応して、本願の実施例では、電子機器がさらに提供されている。この電子機器は、端末機器、例えば、図1に示された車載端末機器であってもよいし、スマートフォン、タブレットコンピュータ、ノートパソコン、又はコンピュータなどの電子機器であってもよい。該電子機器は、少なくとも、データを記憶するためのメモリと、データを処理するためのプロセッサと、を備える。そのうち、データを処理するためのプロセッサについては、処理を実行する際に、マイクロプロセッサ、CPU、グラフィック処理ユニット(GPU:Graphics Processing Unit)、DSP、又はFPGAによって実現されてもよい。メモリについては、メモリに操作命令が記憶され、この操作命令は、コンピュータ実行可能コードであってもよい。該操作命令によって、上述した本願の実施例の車両軌跡計画方法のフローの各ステップを実現する。
図8は、本願の実施例で提供される電子機器の構成の模式図である。図8に示すように、本願の実施例における該電子機器80は、プロセッサ81と、ディスプレイ82と、メモリ83と、入力機器86と、バス85と、通信機器84と、を備える。このプロセッサ81、メモリ83、入力機器86、ディスプレイ82、及び通信機器84は、バス85を介して接続される。このバス85は、このプロセッサ81、メモリ83、ディスプレイ82、通信機器84、及び入力機器86の間でデータを伝送するために用いられる。
ここで、メモリ83は、ソフトウェアプログラム及びモジュール、例えば、本願の実施例における車両軌跡計画方法に対応するプログラム命令/モジュールを記憶するために使用可能である。プロセッサ81は、メモリ83に記憶されたソフトウェアプログラム及びモジュールを実行することにより、電子機器80の各種の機能アプリケーション及びデータ処理、例えば、本願の実施例で提供される車両軌跡計画方法を実行する。メモリ83は、主にプログラム記憶領域及びデータ記憶領域を含んでもよい。そのうち、プログラム記憶領域には、オペレーティングシステム、少なくとも1つのアプリケーションのアプリケーションプログラムなどを記憶してもよい。データ記憶領域には、電子機器80の使用に応じて作成されたデータなどを記憶してもよい。また、メモリ83は、高速ランダムアクセスメモリを含んでもよいし、不揮発性メモリ、例えば、少なくとも1つの磁気ディスク記憶デバイス、フラッシュメモリデバイス、又は他の不揮発性ソリッドステート記憶デバイスを含んでもよい。
プロセッサ81は、電子機器80の制御センターであり、バス85、各種のインタフェース及び回線を使用して電子機器80全体の各部分を接続し、メモリ83に記憶されたソフトウェアプログラム及び/又はモジュールを実行又は遂行して、メモリ83に記憶されたデータを呼び出すことにより、電子機器80の各種の機能を実行してデータを処理する。いくつかの実施例において、プロセッサ81は、例えば、CPU、グラフィック処理ユニット(GPU:Graphics Processing Unit)、デジタル処理ユニットなどの1つ又は複数の処理ユニットを含んでもよい。
プロセッサ81は、通信機器84を介してネットワークに接続することもできる。電子機器が端末機器である場合、プロセッサ81は、通信機器84を介して、ゲームサーバとの間でデータを伝送することができる。電子機器がゲームサーバである場合、プロセッサ81は、通信機器84を介して、端末機器との間でデータを伝送することができる。
該入力機器86は、主に、ユーザによる入力操作を取得するために用いられる。該電子機器が異なる場合、該入力機器86も異なる可能性がある。例えば、該電子機器がコンピュータである場合、該入力機器86は、マウスやキーボードなどの入力機器であってもよく、該電子機器がスマートフォンやタブレットコンピュータなどのポータブル機器である場合、該入力機器86は、タッチスクリーンであってもよい。
本願の実施例では、コンピュータ記憶媒体がさらに提供されており、該コンピュータ記憶媒体には、コンピュータ実行可能命令が記憶され、該コンピュータ実行可能命令は、本願のいずれか1つの実施例の車両軌跡計画方法を実現させる。
いくつかの可能な実施形態において、本願で提供される車両軌跡計画方法の各態様は、プログラムコードが含まれるプログラム製品の形で実現されてもよい。プログラム製品がコンピュータ機器上で実行されると、プログラムコードは、本明細書で説明された、本願の各種の例示的な実施形態による車両軌跡計画方法のステップをコンピュータ機器に実行させるために用いられる。例えば、コンピュータ機器は、図3に示されたステップS301からS304の車両軌跡計画のフローを実行することができる。
プログラム製品は、1つ又は複数の可読媒体の任意の組み合わせを採用してもよい。可読媒体は、可読信号媒体又は可読記憶媒体であってもよい。可読記憶媒体は、例えば、電気、磁気、光、電磁気、赤外線、又は半導体のシステム、装置、又はデバイス、あるいは、上記の任意の組み合わせであってもよいが、これらに限定されない。可読記憶媒体のより具体的な例(非網羅的なリスト)は、1つ又は複数の導線がある電気接続、ポータブルディスク、ハードディスク、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、消去可能プログラマブル読み出し専用メモリ(EPROM又はフラッシュメモリ)、光ファイバー、ポータブルコンパクトディスク読み出し専用メモリ(CD-ROM)、光記憶デバイス、磁気記憶デバイス、あるいは、上記の任意の適切な組み合わせを含んでもよい。
可読信号媒体は、ベースバンドで又はキャリアの一部として伝播されるデータ信号を含んでもよく、該データ信号には、可読プログラムコードが搭載される。このような伝播されるデータ信号は、電磁気信号、光信号、又は上記の任意の適切な組み合わせを含むがこれらに限定されない様々な形態をとることができる。可読信号媒体は、可読記憶媒体以外の任意の可読媒体であってもよく、該可読媒体は、命令実行システム、装置、又はデバイスによって使用されるか、あるいは、これらと組み合わせて使用されるためのプログラムを送信、伝播、又は伝送することができる。
本願で提供されたいくつかの実施例では、理解すべきものとして、掲示された機器及び方法は、他の方式で実現されてもよい。以上に説明した機器の実施例は、模式的なものに過ぎない。例えば、ユニットの分割は、論理的な機能の分割に過ぎず、実際に実現する際に別の分割方式であってもよい。例えば、複数のユニット又はコンポーネントを組み合わせたり、他のシステムに組み入れたりしてもよいし、一部の特徴を無視したり、実行しなかったりしてもよい。また、示され又は検討される各構成部分の相互結合、又は直接結合、又は通信接続は、いくつかのインタフェースを介したものであってもよく、機器又はユニットの間接結合又は通信接続は、電気的、機械的、又は他の形式であってもよい。
上記で分離した部品として説明されたユニットは、物理的に分離したものであってもなくてもよい。ユニットとして示された部品は、物理的なユニットであってもなくてもよく、即ち、1つの場所に位置してもよいし、ネットワーク上の複数のユニットに分散してもよい。本実施例の構成の目的を実現するために、実際の必要に応じて、その中の一部又は全部のユニットを選択してもよい。
また、本願の各実施例における各機能ユニットを全て1つの処理ユニットに統合してもよいし、各ユニットそれぞれを個別に1つのユニットとしてもよいし、2つ以上のユニットを1つのユニットに統合してもよい。上述した統合されたユニットは、ハードウェアの形で実現されてもよいし、ハードウェア及びソフトウェア機能ユニットの形で実現されてもよい。
上記は本願の具体的な実施形態に過ぎないが、本願の保護範囲はこれに限定されない。本願に掲示された技術的範囲内で、本技術分野に詳しい技術者が容易に想到し得るいかなる変更又は置換えも、本願の保護範囲内に含まれるべきである。

Claims (12)

  1. 車載端末機器が実行する車両軌跡計画方法であって、
    ターゲット計画時間内のターゲット車両の初期参照軌跡を取得するステップであって、前記初期参照軌跡には、前記ターゲット計画時間内の少なくとも1つの位置点における前記ターゲット車両の初期状態量及び初期制御量が含まれる、ステップと、
    参照車線軌跡を取得するステップと、
    幾何学的制約条件及び動力学的制約条件に従って、前記参照車線軌跡と、前記少なくとも1つの位置点における前記ターゲット車両の初期状態量および初期制御量とを使用して、前記ターゲット車両の軌跡コストを決定するステップであって、前記動力学的制約条件には、エネルギー損失、加速度制約、角速度制約のうちのいずれか1つ又は任意の組み合わせが含まれる、ステップと、
    前記ターゲット車両の軌跡コストに基づいて、前記ターゲット車両の初期参照軌跡を目標走行軌跡に調整するステップと、
    を含む車両軌跡計画方法。
  2. 前記幾何学的制約条件及び動力学的制約条件に従って、前記参照車線軌跡と、前記少なくとも1つの位置点における前記ターゲット車両の初期状態量及び初期制御量とを使用して、前記ターゲット車両の軌跡コストを決定するステップは、
    前記ターゲット計画時間内の各位置点それぞれに対して、前記参照車線軌跡、前記ターゲット車両の初期状態量、及び幾何学的制約条件に基づいて、前記位置点における前記ターゲット車両の幾何学的コスト関数サブアイテムを決定し、前記ターゲット車両の初期状態量、初期制御量、及び動力学的制約条件に基づいて、前記位置点における前記ターゲット車両の動力学的コスト関数サブアイテムを決定するステップと、
    少なくとも、前記ターゲット計画時間内の各位置点の幾何学的コスト関数サブアイテム及び各位置点の動力学的コスト関数サブアイテムに基づいて、前記ターゲット計画時間内の前記ターゲット車両の軌跡コストを決定するステップと、を含む、
    請求項1に記載の車両軌跡計画方法。
  3. 少なくとも、前記ターゲット計画時間内の各位置点の幾何学的コスト関数サブアイテム及び各位置点の動力学的コスト関数サブアイテムに基づいて、前記ターゲット計画時間内の前記ターゲット車両の軌跡コストを決定するステップは、
    前記ターゲット車両の目標状態と、前記ターゲット計画時間内の最後の位置点における前記ターゲット車両の初期状態量とに基づいて、前記ターゲット計画時間内の前記ターゲット車両の最終ステップ誤差サブアイテムを決定するステップと、
    前記ターゲット計画時間内の各位置点の幾何学的コスト関数サブアイテム、各位置点の動力学的コスト関数サブアイテム、及び前記最終ステップ誤差サブアイテムに基づいて、前記ターゲット計画時間内の前記ターゲット車両の軌跡コストを決定するステップと、を含む、
    請求項2に記載の車両軌跡計画方法。
  4. 前記参照車線軌跡、前記ターゲット車両の初期状態量、及び幾何学的制約条件に基づいて、前記位置点における前記ターゲット車両の幾何学的コスト関数サブアイテムを決定するステップは、
    目標車速と、前記ターゲット車両の現在車速とに基づいて、前記位置点における前記ターゲット車両の車速コスト関数サブアイテムを決定するステップと、
    前記ターゲット車両の現在の状態量と、参照軌跡における現在時刻の状態量とに基づいて、前記位置点における前記ターゲット車両の参照軌跡ずれコスト関数サブアイテムを決定するステップと、
    前記参照車線軌跡と、前記ターゲット車両の現在位置の座標とに基づいて、前記位置点における前記ターゲット車両の参照車線ずれコスト関数サブアイテムを決定するステップと、を含む、
    請求項2に記載の車両軌跡計画方法。
  5. 前記目標車速と、前記ターゲット車両の現在車速とに基づいて、前記位置点における前記ターゲット車両の車速コスト関数サブアイテムを決定するステップは、
    前記目標車速と前記現在車速との差を計算するステップと、
    車速コスト関数の重み、及び、前記目標車速と前記現在車速との差を使用して、前記位置点における前記ターゲット車両の車速コスト関数サブアイテムを計算するステップと、を含み、
    前記ターゲット車両の現在の状態量と、参照軌跡における現在時刻の状態量とに基づいて、前記位置点における前記ターゲット車両の参照軌跡ずれコスト関数サブアイテムを決定するステップは、
    前記ターゲット車両の現在の状態量と前記参照軌跡における現在時刻の状態量との差を計算するステップと、
    参照軌跡ずれコスト関数の重み、及び、前記ターゲット車両の現在の状態量と前記参照軌跡における現在時刻の状態量との差を使用して、前記位置点における前記ターゲット車両の参照軌跡ずれコスト関数サブアイテムを計算するステップと、を含み、
    前記参照車線軌跡と、前記ターゲット車両の現在位置の座標とに基づいて、前記位置点における前記ターゲット車両の参照車線ずれコスト関数サブアイテムを決定するステップは、
    前記ターゲット車両の参照位置の座標を決定するステップであって、前記ターゲット車両の参照位置が、前記参照車線軌跡における、前記ターゲット車両の現在位置に対応する位置である、ステップと、
    参照車線ずれコスト関数の重み、並びに、前記ターゲット車両の現在位置の座標及び参照位置の座標を使用して、前記位置点における前記ターゲット車両の参照車線ずれコスト関数サブアイテムを計算するステップと、を含む、
    請求項4に記載の車両軌跡計画方法。
  6. 前記ターゲット車両の初期状態量、初期制御量、及び動力学的制約条件に基づいて、前記位置点における前記ターゲット車両の動力学的コスト関数サブアイテムを決定するステップは、
    前記ターゲット車両の現在の制御量に基づいて、前記位置点における前記ターゲット車両のエネルギー損失コスト関数サブアイテムを決定するステップと、
    加速度制約条件と、前記ターゲット車両の現在の加速度とに基づいて、前記位置点における前記ターゲット車両の加速度コスト関数サブアイテムを決定するステップと、
    角速度制約条件と、前記ターゲット車両の現在の角速度とに基づいて、前記位置点における前記ターゲット車両の角速度コスト関数サブアイテムを決定するステップと、を含む、
    請求項2に記載の車両軌跡計画方法。
  7. 前記ターゲット車両の現在の制御量は、前記ターゲット車両の現在の加速度及び現在の角速度を含み、
    前記ターゲット車両の現在の制御量に基づいて、前記位置点における前記ターゲット車両のエネルギー損失コスト関数サブアイテムを決定するステップは、
    エネルギー損失コスト関数の重み、前記ターゲット車両の現在の加速度及び現在の角速度を使用して、前記位置点における前記ターゲット車両のエネルギー損失コスト関数サブアイテムを計算するステップを含み、
    前記加速度制約条件と、前記ターゲット車両の現在の加速度とに基づいて、前記位置点における前記ターゲット車両の加速度コスト関数サブアイテムを決定するステップは、
    最大加速度及び最小加速度を決定するステップと、
    前記最大加速度と前記ターゲット車両の現在の加速度との差、前記ターゲット車両の現在の加速度と前記最小加速度との差、及び前記加速度制約条件に基づいて、前記位置点における前記ターゲット車両の加速度コスト関数サブアイテムを決定するステップと、を含み、
    前記角速度制約条件と、前記ターゲット車両の現在の角速度とに基づいて、前記位置点における前記ターゲット車両の角速度コスト関数サブアイテムを決定するステップは、
    道路付着係数に基づいて、最大角速度及び最小角速度を決定するステップと、
    前記最大角速度と前記ターゲット車両の現在の角速度との差、前記ターゲット車両の現在の角速度と前記最小角速度との差、及び前記角速度制約条件に基づいて、前記位置点における前記ターゲット車両の角速度コスト関数サブアイテムを決定するステップと、を含む、
    請求項6に記載の車両軌跡計画方法。
  8. コスト関数サブアイテムには、それに対応するコスト関数重みが含まれ、前記コスト関数重みは、ターゲット計画時間内の各位置点に対応する時変パラメータである、
    請求項2乃至7のいずれか1項に記載の車両軌跡計画方法。
  9. 前記ターゲット車両の軌跡コストに基づいて、前記ターゲット車両の初期参照軌跡を目標走行軌跡に調整するステップは、
    軌跡コストに基づいて、前記ターゲット計画時間の最後の位置点から逆方向で各位置点の最適制御率を計算するステップと、
    最適制御率に基づいて、前記ターゲット車両の状態量及び制御量を順次に調整するステップと、
    設定された反復終了条件に達するまで、前記ターゲット車両の現在の状態量及び現在の制御量に基づいて、前記ターゲット車両の軌跡コストを更新し、逆方向で最適制御率を再計算することにより、前記目標走行軌跡を取得するステップと、を含む、
    請求項1に記載の車両軌跡計画方法。
  10. 取得ユニットと、コストユニットと、調整ユニットとを含む車両軌跡計画装置であって、
    前記取得ユニットは、ターゲット計画時間内のターゲット車両の初期参照軌跡を取得し、前記初期参照軌跡には、前記ターゲット計画時間内の少なくとも1つの位置点における前記ターゲット車両の初期状態量及び初期制御量が含まれ、
    前記取得ユニットは、さらに、参照車線軌跡を取得し、
    前記コストユニットは、幾何学的制約条件及び動力学的制約条件に従って、前記参照車線軌跡と、前記少なくとも1つの位置点における前記ターゲット車両の初期状態量および初期制御量とを使用して、前記ターゲット車両の軌跡コストを決定し、前記動力学的制約条件には、エネルギー損失、加速度制約、角速度制約のうちのいずれか1つ又は任意の組み合わせが含まれ、
    前記調整ユニットは、前記ターゲット車両の軌跡コストに基づいて、前記ターゲット車両の初期参照軌跡を目標走行軌跡に調整する、
    車両軌跡計画装置。
  11. メモリとプロセッサとを備える電子機器であって、前記メモリには、前記プロセッサで実行可能なコンピュータプログラムが記憶され、前記コンピュータプログラムが前記プロセッサによって実行されると、前記プロセッサに請求項1乃至9のいずれか1項に記載の車両軌跡計画方法を実現させる電子機器。
  12. コンピュータ命令を含むコンピュータプログラムであって、該コンピュータ命令がコンピュータ可読記憶媒体に記憶され、コンピュータ機器のプロセッサがコンピュータ可読記憶媒体から該コンピュータ命令を読み取り、プロセッサが該コンピュータ命令を実行すると、該コンピュータ機器に請求項1乃至9のいずれか1項に記載の車両軌跡計画方法を実行させるコンピュータプログラム。
JP2023520281A 2021-01-07 2021-12-29 車両軌跡計画方法、車両軌跡計画装置、電子機器、及びコンピュータプログラム Pending JP2023546810A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN202110019580.9 2021-01-07
CN202110019580.9A CN112677995B (zh) 2021-01-07 2021-01-07 一种车辆轨迹规划方法、装置、存储介质及设备
PCT/CN2021/142314 WO2022148282A1 (zh) 2021-01-07 2021-12-29 一种车辆轨迹规划方法、装置、存储介质及设备

Publications (1)

Publication Number Publication Date
JP2023546810A true JP2023546810A (ja) 2023-11-08

Family

ID=75456313

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023520281A Pending JP2023546810A (ja) 2021-01-07 2021-12-29 車両軌跡計画方法、車両軌跡計画装置、電子機器、及びコンピュータプログラム

Country Status (5)

Country Link
US (1) US20230079202A1 (ja)
EP (1) EP4201781A1 (ja)
JP (1) JP2023546810A (ja)
CN (1) CN112677995B (ja)
WO (1) WO2022148282A1 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112677995B (zh) * 2021-01-07 2021-12-21 腾讯科技(深圳)有限公司 一种车辆轨迹规划方法、装置、存储介质及设备
US20220219727A1 (en) * 2021-01-12 2022-07-14 Motional Ad Llc Vehicle path planning
CN113370995B (zh) * 2021-07-01 2024-01-09 广州小鹏自动驾驶科技有限公司 速度曲线的处理方法、装置、电动汽车及电子设备
CN113483776A (zh) * 2021-07-01 2021-10-08 广州小鹏自动驾驶科技有限公司 路径规划方法、装置及汽车
CN113650622B (zh) * 2021-07-16 2023-06-20 东风柳州汽车有限公司 车速轨迹规划方法、装置、设备及存储介质
CN113447040B (zh) * 2021-08-27 2021-11-16 腾讯科技(深圳)有限公司 行驶轨迹确定方法、装置、设备以及存储介质
US20230242142A1 (en) * 2022-02-01 2023-08-03 Weize Zhang Systems, methods, and computer-readable media for spatio-temporal motion planning
CN115218902B (zh) * 2022-04-02 2024-02-02 广州汽车集团股份有限公司 一种轨迹规划方法、装置、设备及存储介质
CN115309170B (zh) * 2022-10-12 2023-03-24 之江实验室 一种考虑舒适性约束的轨迹规划方法、装置和系统
CN115817515B (zh) * 2023-01-18 2023-05-26 禾多科技(北京)有限公司 车辆控制方法、装置、电子设备和计算机可读介质
CN115837912B (zh) * 2023-01-29 2023-06-02 深圳安智杰科技有限公司 一种基于轨迹跟踪的指令变道方法及系统
CN117079469B (zh) * 2023-10-16 2024-01-12 山东华夏高科信息股份有限公司 一种网联混行环境下交叉口区域车辆冲突协同控制方法
CN117451072B (zh) * 2023-12-21 2024-03-26 广汽埃安新能源汽车股份有限公司 一种车辆起步阶段的轨迹规划方法及装置
CN117698730A (zh) * 2024-01-08 2024-03-15 昆明理工大学 一种防碰撞的动态智能网联车辆最优换道轨迹规划方法
CN117601867A (zh) * 2024-01-18 2024-02-27 杭州鉴智机器人科技有限公司 车辆变道方法、车辆变道装置、存储介质及车辆控制系统

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102013225057A1 (de) * 2013-12-05 2015-06-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zum steuern eines fahrzeugs, vorrichtung zum erzeugen von steuersignalen für ein fahrzeug und fahrzeug
KR101716417B1 (ko) * 2015-10-30 2017-03-15 현대위아(주) 차량의 험로주행 판단방법
DE102015221626A1 (de) * 2015-11-04 2017-05-04 Bayerische Motoren Werke Aktiengesellschaft Verfahren zur Ermittlung einer Fahrzeug-Trajektorie entlang einer Referenzkurve
IT201700073722A1 (it) * 2017-06-30 2018-12-30 Magneti Marelli Spa "Procedimento di pianificazione di percorso per il calcolo di manovre di parcheggio ottimale per veicoli stradali e sistema corrispondente"
CN107340772B (zh) * 2017-07-11 2020-05-22 北京超星未来科技有限公司 一种面向无人驾驶的拟人化参考轨迹规划方法
CN109375632B (zh) * 2018-12-17 2020-03-20 清华大学 自动驾驶车辆实时轨迹规划方法
CN109684702B (zh) * 2018-12-17 2020-04-24 清华大学 基于轨迹预测的行车风险辨识方法
CN110341711B (zh) * 2019-07-06 2021-10-22 深圳数翔科技有限公司 一种基于码头环境的行驶轨迹生成系统及方法
CN111679678B (zh) * 2020-06-30 2022-04-08 安徽海博智能科技有限责任公司 一种横纵向分离的轨迹规划方法、系统及计算机设备
CN112677995B (zh) * 2021-01-07 2021-12-21 腾讯科技(深圳)有限公司 一种车辆轨迹规划方法、装置、存储介质及设备

Also Published As

Publication number Publication date
US20230079202A1 (en) 2023-03-16
CN112677995B (zh) 2021-12-21
WO2022148282A1 (zh) 2022-07-14
EP4201781A1 (en) 2023-06-28
CN112677995A (zh) 2021-04-20

Similar Documents

Publication Publication Date Title
JP2023546810A (ja) 車両軌跡計画方法、車両軌跡計画装置、電子機器、及びコンピュータプログラム
Zhang et al. Trajectory planning and tracking for autonomous vehicle based on state lattice and model predictive control
CN113805572B (zh) 运动规划的方法与装置
US9568915B1 (en) System and method for controlling autonomous or semi-autonomous vehicle
US11467591B2 (en) Online agent using reinforcement learning to plan an open space trajectory for autonomous vehicles
CN112888612A (zh) 自动驾驶车辆规划
US20170168485A1 (en) System and Method for Controlling Autonomous Vehicles
US11409284B2 (en) Relaxation optimization model to plan an open space trajectory for autonomous vehicles
CN113253733B (zh) 一种基于学习和融合的导航避障方法、装置及系统
US20220155732A9 (en) System and Method of Efficient, Continuous, and Safe Learning Using First Principles and Constraints
CN114771570A (zh) 自动驾驶车辆的控制方法和装置
Vallon et al. Data-driven strategies for hierarchical predictive control in unknown environments
Elmi et al. Path planning using model predictive controller based on potential field for autonomous vehicles
US20230418247A1 (en) Automatic generation of control decision logic for complex engineered systems from dynamic physical model
Nan et al. Interaction-Aware Planning With Deep Inverse Reinforcement Learning for Human-Like Autonomous Driving in Merge Scenarios
Yu et al. Hierarchical framework integrating rapidly-exploring random tree with deep reinforcement learning for autonomous vehicle
Smit et al. Informed sampling-based trajectory planner for automated driving in dynamic urban environments
Weiskircher et al. Predictive trajectory guidance for (semi-) autonomous vehicles in public traffic
Sivashangaran et al. Deep reinforcement learning for autonomous ground vehicle exploration without a-priori maps
Chen et al. Framework of active obstacle avoidance for autonomous vehicle based on hybrid soft actor-critic algorithm
Wang et al. An End-to-End Deep Reinforcement Learning Model Based on Proximal Policy Optimization Algorithm for Autonomous Driving of Off-Road Vehicle
Desiderio Development of a modified A-Star Algorithm for path planning
CN117232531B (zh) 机器人导航规划方法及存储介质和终端设备
Qiu A Review of Motion Planning for Urban Autonomous Driving
Cui et al. An Integrated Lateral and Longitudinal Decision-Making Model for Autonomous Driving Based on Deep Reinforcement Learning

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230501

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240312

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240319