JP7066546B2 - 航空機を自律的に操縦する方法及びシステム - Google Patents

航空機を自律的に操縦する方法及びシステム Download PDF

Info

Publication number
JP7066546B2
JP7066546B2 JP2018119579A JP2018119579A JP7066546B2 JP 7066546 B2 JP7066546 B2 JP 7066546B2 JP 2018119579 A JP2018119579 A JP 2018119579A JP 2018119579 A JP2018119579 A JP 2018119579A JP 7066546 B2 JP7066546 B2 JP 7066546B2
Authority
JP
Japan
Prior art keywords
aircraft
data
aidl
flight
state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018119579A
Other languages
English (en)
Other versions
JP2019059461A (ja
Inventor
パブロ コスタ,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Boeing Co
Original Assignee
Boeing Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Boeing Co filed Critical Boeing Co
Publication of JP2019059461A publication Critical patent/JP2019059461A/ja
Application granted granted Critical
Publication of JP7066546B2 publication Critical patent/JP7066546B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/10Simultaneous control of position or course in three dimensions
    • G05D1/101Simultaneous control of position or course in three dimensions specially adapted for aircraft
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/0088Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots characterized by the autonomous decision making process, e.g. artificial intelligence, predefined behaviours
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G5/00Traffic control systems for aircraft, e.g. air-traffic control [ATC]
    • G08G5/003Flight plan management
    • G08G5/0034Assembly of a flight plan
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G5/00Traffic control systems for aircraft, e.g. air-traffic control [ATC]
    • G08G5/0073Surveillance aids
    • G08G5/0078Surveillance aids for monitoring traffic from the aircraft
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G5/00Traffic control systems for aircraft, e.g. air-traffic control [ATC]
    • G08G5/04Anti-collision systems
    • G08G5/045Navigation or guidance aids, e.g. determination of anti-collision manoeuvers
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B64AIRCRAFT; AVIATION; COSMONAUTICS
    • B64UUNMANNED AERIAL VEHICLES [UAV]; EQUIPMENT THEREFOR
    • B64U2101/00UAVs specially adapted for particular uses or applications
    • B64U2101/30UAVs specially adapted for particular uses or applications for imaging, photography or videography
    • B64U2101/31UAVs specially adapted for particular uses or applications for imaging, photography or videography for surveillance
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B64AIRCRAFT; AVIATION; COSMONAUTICS
    • B64UUNMANNED AERIAL VEHICLES [UAV]; EQUIPMENT THEREFOR
    • B64U2201/00UAVs characterised by their flight controls
    • B64U2201/10UAVs characterised by their flight controls autonomous, i.e. by navigating independently from ground or air stations, e.g. by using inertial navigation systems [INS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • Automation & Control Theory (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biomedical Technology (AREA)
  • Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Algebra (AREA)
  • Traffic Control Systems (AREA)
  • Navigation (AREA)
  • Feedback Control In General (AREA)
  • Mobile Radio Communication Systems (AREA)

Description

本開示は、アビオニクス分野に含まれるものであり、航空機を自律的に操縦する方法及びシステムに関する。
単独パイロット操縦(SPO)、すなわちコックピット内のパイロットが1人だけで民間航空機を飛ばす完全に自動化された民間航空機及び無人機(UAV)は、高度な搭載自動化ツールによって支援される必要がある。
通常、搭乗員の費用及び搭乗員の有用性は航空機の極めて重要なビジネスドライバーである。この分野の改善は、コストの削減及び事業収入の増加につながる。しかしながら、民間航空機、特に輸送機の自律的な操縦は、安全に実施されなければならない。
いかなる自律システムにおいても、重要な部分は訓練である。現在の訓練方法にはある程度、小型ビークルにおいて利用可能なデータから学習する無人機の飛行力学、飛行制御及び軌道計画のデータ駆動型モデリングが含まれる。
しかしながら、現在のデータ駆動型UAV訓練システムの重大な欠点はデータの利用可能性であり、監視データに基づく搭載自動化ツールの訓練の問題に対処する解決策は存在しない。特定のセンサからのデータで訓練された小型UAVの特定モデルに対する研究はあるが、現在の訓練方法はどれも一般的なものではない(すなわち、これらの方法を一般化してすべての無人機に実行することはできない)。加えて、現在のデータ駆動型訓練システムでは、訓練データに存在する不確実性の管理が考慮されていない。
したがって、既存の欠点を克服する、航空機搭載コマンド及び制御システムを訓練し操作する新たなプロセスを提供する必要がある。
本開示は、記録された監視データを活用して、搭載センサのデータに応じて最適な行動を取るように指示することによって、自律ビークル訓練から生じるすべての複雑性を除去する、自律的に作動し飛行するように訓練された航空機を自律的に操縦する方法及びシステムに言及するものである。
民間航空機の過去の監視データから航法及び誘導コマンドを推測し、搭載センサの測定値に基づいてこれらのコマンドを適用することができるシステムを開発することは、自律ビークルに対する新たな取り組みである。監視データは例えば、FAAのSystem Wide Information Management(SWIM)インフラストラクチャから、あるいはグローバルフライトトラッキングプロバイダから簡単に取得できる。監視データには、他のデータの中でもとりわけ、レーダ及び/又はADS追跡が含まれうる。
提案の方法により、記録されたフライトデータを利用する学習プロセスを使用して、実際の航空機の性能及び能力に従い、適合した航空機の自律的なコマンド送信及び制御が可能になる。訓練に必要な唯一の入力は、ADS-B又はADS-CのようなレーダデータあるいはADSデータから取得された航空機の過去の位置の時間発展的シーケンスである。搭載自動化ツールには、人間の代わりに航空機にコマンド送信するための取るべき最適行動が指示される。この行動は例えば、Lopez-Leones、Javie氏らによる「The aircraft intent description language: a key enabler for air- ground synchronization in trajectory-based operations」 2007 IEEE/AIAA 26th Digital Avionics Systems Conference、及びVilaplana、Miguel A氏らによる「Towards a formal language for the common description of aircraft intent」24th Digital Avionics Systems Conference、Vol.1、 IEEE、 2005に記載の航空機インテント記述言語(AIDL)フォーマットで表される。
本開示の一態様によれば、航空機を自律的に操縦する方法が提供され、本方法は、航空機の飛行中に実行されるリアルタイムの制御ステップを含む飛行前訓練ステップを含む。
飛行前訓練ステップは、少なくとも1つの航空機の機種、及び少なくとも1つのルートに対応する、複数の飛行の記録された監視データを読み出すことと、記録された監視データから航空機インテントを推測することと、推測された航空機インテントを使用して再構築された軌道を計算することと、特定の航空機の機種及びルートに対応する、航空機インテントと、再構築された飛行軌道とを含む訓練データセットを選択することと、航空機の状態と行動との間のマッピング関数を取得するために訓練データセットに機械学習アルゴリズムを適用することとを含む。
リアルタイムの制御ステップは、搭載センサのデータを繰り返し読み出すことと、搭載センサのデータからリアルタイムの航空機の状態を取得することと、マッピング関数を使用してリアルタイムの航空機の状態に関連する行動を決定することと、航空機上で選択された行動を実行することとを含む。
一実施形態によれば、航空機インテントはAIDLフォーマットで表わされ、行動はAIDL指示として表される航法及び誘導コマンドを含む。マッピング関数は、AIDL指示を有するテーブルマッピング用センサ値を含みうる。行動を決定するステップは、読み出した搭載センサのデータに対応するセンサ値をマッピングテーブルで検索することを含むことができ、ぴったり一致するものが見つからない場合、補間プロセスを使用して関連するAIDL指示を決定する。
一実施形態では、機械学習アルゴリズムは、目的地の空港における飛行の着陸と一致する航空機の状態に関連する累積リワード(reward)Rを最大化するポリシーπを取得する強化学習アルゴリズムである。強化学習アルゴリズムは、6つの独立したAIDL指示を予測するために6つの独立したマルコフ決定プロセスを解くことを含むことができ、行動及び状態空間は、各AIDLスレッドに対して異なっている。
本開示の別の態様によれば、航空機を自律的に操縦するためのシステムが提供され、本システムは、
少なくとも1つの航空機の機種と少なくとも1つのルートに対応する複数の飛行の記録された監視データから航空機インテントを推測し、推測された航空機インテントを使用して再構築された軌道を計算するように構成された推測及び軌道再構築モジュールと、
特定の航空機の機種とルートに対応する、航空機インテントと、飛行の再構築された軌道とを含む訓練データセットを選択するように構成されたクラスタリングモジュールと、
航空機の状態と行動との間のマッピング関数を取得するために、訓練データセットに機械学習アルゴリズムを適用するように構成された機械学習モジュールと、
搭載コマンド及び制御自動化モジュール(340)であって、航空機の飛行中に搭載センサのデータ(210)を繰り返し読み出しすることと、搭載センサのデータ(210)からリアルタイムの航空機の状態(222)を取得することと、マッピング関数(180)を使用してリアルタイムの航空機の状態(222)に関連する行動(224)を決定することと、航空機上で選択された行動を実行することを指示することとを行うように構成された搭載コマンド及び制御自動化モジュール(340)と
備える。
一実施形態では、搭載コマンド及び制御自動化モジュールは、読み出された搭載センサのデータに対応するセンサ値をマッピングテーブルで検索し、ぴったり一致するものが見つからない場合、補間を使用して関連するAIDL指示を決定することによって行動を決定するように構成される。
機械学習モジュールは、目的地の空港における飛行の着陸と一致する航空機の状態に関連する累積リワードRを最大化するポリシーπを取得するように構成された強化学習モジュールであってよい。一実施形態では、強化学習アルゴリズムは、6つの独立したAIDL指示を予測するために6つの独立したマルコフ決定プロセスを解くように構成され、行動及び状態空間は、各AIDLスレッドに対し異なる。
システムは、航空機上で選択された行動を実行するための、航空機の飛行管理システムを備えうる。
本発明のさらに別の態様によれば、航空機を自律的に操縦するためのコンピュータプログラム製品であって、プロセッサによって実行されたときにプロセッサに方法のステップを実施させる、記憶された指示のセットを含む少なくとも1つのコンピュータ可読記憶媒体を含むコンピュータプログラム製品が提供される。
本方法は、民間航空機とUAVの自律的ビークル航法技術において使用することができ、学習データセットを変更するだけで、航空機の機種とは関係なくいかなる民間航空機にも適用することが可能であるため、特に有益である。訓練データセットは、多様なソース、例えばADS-Bプロバイダ、連邦航空局又は世界中の同等の団体、及び航空会社(例:QAR-クイックアクセスレコーダから)から取得されうる。
上述の特徴、機能、及び利点は、様々な実施形態において単独で実現することが可能であり、或いは、さらに別の実施形態において組み合わせることが可能である。これらの実施形態は、以下の説明及び図面を参照することによってさらに詳細に理解することができる。
本発明をより良く理解する助けとなり、前記発明の一実施形態に明らかに関連し、該実施形態の非限定的な実施例として提示される一連の図面を以下に簡潔に記述する。
飛行前訓練ステップを示す概略図である。 飛行中に機上で実行されるリアルタイムの制御ステップを示す図である。 航空機を自律的に操縦する方法の一実施形態が記載されたブロック図である。
本開示は、自律的に操縦するための誘導コマンドを、現在の搭載センサの測定値に基づく出力として生成する方法に言及する。搭載コマンド及び制御自動化システムは、記録された過去の監視データを使用して予め訓練される。
本発明は、AIDL(航空機インテント記述言語)フォーマットによって規定される航空機インテントの記述に適用される航空機強化学習法(例えばRichard S. Sutton及びAndrew G Barto氏による「Reinforcement Learning: An Introduction」 MIT Press、Cambridge, MA)を使用して、不確実性下で機械学習プロセスを実行する。
航空機を自律的に操縦する方法は、飛行前訓練ステップと、決定されたルートを網羅する、航空機の飛行中に実行されるリアルタイムの制御ステップとを含む。図1は、例えば複数のADS-Bデータ及び/又はレーダ追跡データを含有するデータベースにアクセスすることによって、複数の飛行の記録された監視データ110が最初に読み出される、飛行前訓練ステップ100を示す全体図である。各飛行に対して、監視データ110は、少なくとも時間(t)にわたる航空機の位置(経度λ、緯度φ、高度h)の変化を含む。
次に、AIDLフォーマットで表されることが好ましい、推測された航空機インテント130を取得するために、記録された監視データ110に推測ステップ120が適用される。軌道計算ステップ140において、推測された航空機インテント130を使用して再構築された軌道150が計算される。対象の航空機の機種及びルートに対応する、航空機インテント130と、再構築された軌道150とを含む訓練データセット160に機械学習アルゴリズム170が適用される(記録された監視データ110は、特定の航空機に適切でない異なるルート及び航空機の機種からのデータを含みうる)。機械学習アルゴリズム170の結果は、後に詳細に説明する、航空機の状態を行動と関連付けるマッピング関数180である。
図2に、飛行中に機上で実行されるリアルタイムの制御ステップ200を示す。訓練ステップ100は、この前に終了している必要がある。搭載コマンド及び制御自動化プロセス220において、航空機内に設置されたセンサから、搭載センサのデータ210(例えば位置211、高度212、速度213、方位214、燃料の量215、時間216又は他のセンサ情報217)が繰り返しキャプチャされる。読み出された搭載センサのデータ210を使用して、搭載コマンド及び制御プロセス220はリアルタイムの航空機の状態222を取得し、飛行前訓練ステップ100において前に決定されたマッピング関数180を適用して、リアルタイムの航空機の状態222に関連する行動224を決定する。マッピング関数180は、広い意味で、所与の航空機の状態222に対する行動224の決定を可能にするマッピングプロセス、関係又は相互関係として理解されるべきである。一実施形態では、マッピングプロセスは、検索ごとに6つのAIDL指示(AIDLスレッドごとに1つ)を返す、センサ値(例えば位置、高度、速度、機首方位、燃料、時間及びその他)によって検索可能なマッピングテーブルのルックアップを含む。マッピングテーブルのすべての列は状態-行動ベクトルであり、状態222はセンサ値であり、行動224は状態に関連するAIDL指示である。マッピングテーブルは必ずしも、直ちに実行するためのセンサデータ210とAIDL指示との間のすべての可能なマッピングを含むわけではなく、この場合、補間(いずれかの周知の補間法)が必要となる。搭載コマンド及び制御プロセス220の出力は、航空機の飛行管理システム(FMS)240によって実行されている行動224に対応する航法及び誘導コマンド230のセットを含む。一実施形態では、航法及び誘導コマンド230はAIDL指示を含む。
航空機300を自律的に操縦するためのシステムの一実施形態を表すブロック図を図3に示す。図によると、推測及び軌道再構築モジュール310は、例えばRADAR、ADS(ADS-C/ADS-B)、QAR等の一または複数のソースから航空ドメインの監視データ110を入力として受信する。
記録された監視データ110には、推測及び軌道再構築法が適用される。種々の周知の推測及び軌道再構築法、例えば特許文献US8977484-B1、US9366538-B2及びEP3109805-A1に開示されているものを適用することができる。
推測アルゴリズムは、航空機の動きが質点モデルとして表されうるという前提に基づいており、質点モデルによって、監視データ110に登録された実際の軌道を最も良く表す航空機インテント130を計算することが可能になる。推測アルゴリズムは、記録された監視データ110を使用し、データを運航日の計画ルートについての大気条件を表す気象予報とリンクさせることで、航空機インテント130を生成することを可能にする。
本方法はまた、記録された監視データ110を解析することと、航空機の機種を決定し、その航空機の機種に関連する航空機の性能データを計算することも含む。例えば、レーダ航跡又は他のレーダ/ADSデータを使用して、各航空機のコールサイン又は機体番号を識別することができ、これを記録と比較して航空機の機種を決定することができる。
レーダ追跡(経時的な緯度、経度及び高度)に含まれる通常の位置データよりも広い情報を含むADS-Bメッセージを考慮したとしても、対気速度及び対地速度についての正確な情報の利用可能性はほとんど無効であり、他の関連する動的状態変数を計算するのに極めて重要な状態変数である航空機の質量は入手可能ではない。
しかしながら、記録された監視データ110から生成された推測された航空機インテント130を利用することで、状態ベクトルの追加回数(粒度の増加)、及び元の監視ベースの軌道表現には含まれない状態変数(状態ベクトルの集積)を追加する航空機の質量推測及び軌道再構築プロセスを開始することが可能である。
したがって、所与の飛行の記録された飛行データに適用された推測及び軌道再構築段階の結果には、その飛行に対応する元の未処理監視データ110と一致する航空機インテント130インスタンスと、再構築された軌道150が含まれる。
機械学習アルゴリズム170(特に、強化学習アルゴリズム)を実行する強化学習モジュール330への入力として、両方のデータセット(130、150)が使用される。強化学習を適用する前に、クラスタリングモジュール320は、自律的な制御方法が適用されている航空機の特定の航空機モデルとルートに属する訓練データセット160を選択するために、航空機の機種及びルート(飛行計画上の出発~目的地)によって分類される再構築された軌道150と航空機インテントデータ130とに、クラスタリングプロセスを適用する。
次に、訓練データセット160に強化学習法が適用される。上記状況では、搭載コマンド及び制御自動化モジュール340は、s∈S(Sはすべての可能な状態のセットである)の状態にある航空機をモデル化することができ、航空機制御システム(例えばFMS240)によって実行される行動a∈A(Aはすべての可能な行動のセットである)を決定するように構成される。強化学習の間、搭載コマンド及び制御自動化モジュール340は、スカラー値であり、且つ観測される状態sの関数と推定されるリワードRも取得する。強化学習の目的は、所与の状態sにおける行動aを選定するポリシーπと称される、航空機の状態から行動までのマッピングを見つけて、予期される累計リワードを最大化することである。
このため、強化学習段階において、搭載コマンド及び制御自動化モジュール340は、可能な戦略空間を調査し、なされた決定についての結果のフィードバックを受信する。この情報から、受信した累計リワードRを最大化するときに、最適ポリシーが推定されなければならない。
以下のように、強化学習パラメータにAIDLフォーマットの構成要素がマッピングされうる。
I.行動:航空機のFMS240によって、航空機の動きに影響を与えるコマンドが実行されたか。AIDLアルファベットは、行動指示子を考慮したときに増加する35の可能な基本行動を含む。
II.状態:搭載センサの測定値によって定義されているか。一般に、複数の変数により航空機の状態を定義することができ、これらの多くは高い相関性がある。
λ 経度 引力の中心の経度
φ 緯度 引力の中心の測地緯度
d 距離 合計水平距離
Hp 高度 ジオポテンシャル気圧高度
Vcas 速度 較正対気速度
M 速度 マッハ数
t 時間 合計経過時間
χTAS 方位 空力的ヨー角度
m 質量 航空機の質量
III.リワード:一般に、最大リワードは、目的地の空港における飛行の良好な着陸と一致する状態に関連するようになる。強化学習法は、リワードの逆伝播について処理する。
航空機の状態を決定する変数のセットは、航空機上の幾つかの異なるセンサの測定結果(例えば、位置はGPS及びIRS(慣性基準システム)の両方から取得される)であってよく、これにより状態誤差が削減される。その誤差は、推測された航空機インテントがシステムに投入するものに比べて小さく、この理由から、一実施形態では、問題をモデル化するためのフレームワークとしておそらくマルコフ決定プロセス(MDP)が選択される。
MDPは、4つのエレメントタプル(S、A、R、T)として定義され、Sは状態のセットであり、Aは行動のセットであり、Rは各状態/行動のペアを実値でマッピングするリワード関数であり、Tは行動aを実行した後に状態sからs´へ遷移する確率を表すマルコフ状態遷移関数T(s´|s、a)である。その目的は、状態及び行動の過去の履歴に基づいて、状態からどの行動を選択するかを決定するポリシーπ(s)を見つけることである。最適ポリシーは、期待効用を最大化するものであり、ポリシーの効用は、ダイナミックプログラミング(DP)を使用して評価することができる。
動きの等式から成る問題は、6つのアクティブな指示(すなわち行動)によって閉じられるべき6自由度を含み、各問題は、特定の自由度を閉じる代数方程式としてそれ自体の効果拘束を加える。AIDLの定義に基づいて、グループに行動が割り当てられ、グループごとに1つの指示のみが並行してアクティブでありうる。それと同時に、推測法はパターン認識に基づいており、パターン認識は指示及び行動のサブセットを使用する航空機インテントにつながるため、基本的インテントは観測された航空機の監視データと一致するようにパラメータ化される。
したがって、6つの独立した指示が予測されていることから、問題は6つの独立したMDPに分解され、MDPでは各スレッドに対する行動および状態空間が異なり、いずれの場合にも、元の空間及び行動空間のサブセットよりも削減されている。経度スレッド1&2の付加的後処理が実行され、同じグループの2つの指示が同時にアクティブである(コックピット上では実行可能とはならない)場合に、予測された指示は1つも適用されない。このため、強化学習の観点から、AIDLスレッドは完全に解除されると仮定することができる。
システムダイナミクス及びリワード関数は、状態空間にわたってはっきりしない。モデルフリーの強化学習では、遷移及びリワードモデルの陽的表現を形成する必要がない。搭載コマンド及び制御自動化モジュール340は、限られた経験から、訓練データ160上でいまだアクセスされたことがない状態に一般化する必要がある。局所近似法における前提は、互いに似ている状態は同様の状態-行動値を持ちやすいということである。
6つのスレッドの各スレッドに対し、最尤推定法を使用してデータから取得された限定数の状態/行動値がメモリに保存されることになる。例えば、状態/行動値はN列を有するテーブル上に保存され、テーブルの最初のN-1列は、搭載センサによってキャプチャされた値であり、最後に実行されるAIDL指示であってよい。テーブルは、6つの独立したMDP(直接マッピング)を解いた結果、取得される。ほとんどの変数は連続しているので、普通は補間を使用する必要がある。次に、システムを訓練するのに、実験に基づいて最適なバケットサイズを調整することができるようにするために、簡単に再構成可能なバケットを使用してすべての連続した状態変数が離散化される。幾つかの航空機の状態に対するバケットサイズの分かりやすい例:
バケットサイズ 範囲
λ 0.1度 クラスタリングに使用されるものによって変わる
φ 0.1度 クラスタリングに使用されるものによって変わる
d 5マイル クラスタリングにおいて選択された町のペアによって変わる
Hp 500フィート -500-53000
Vcas 5kt 0-500
Q学習アルゴリズム(強化学習法)が次に実行され、隣接する状態に基づいて状態-行動値の関数(AIDL指示へのセンサ値がマッピングされたテーブル)が推定される。あるいは、SARSA(状態-行動-リワード-状態-行動)等の他の技法をQ学習の代わりに用いることができる。MDPを解くことによって、訓練ステップ100が完了し、マッピング関数180が取得される。
訓練ステップ100が完了すると、飛行段階の間のリアルタイムの制御ステップ200が開始される。搭載コマンド及び制御自動化モジュール340は、搭載センサのデータ210に基づいて、各MDPの解答から最適な行動を選択することができる(6つのAIDL指示)。本方法のある重要な能力は、搭載コマンド及び制御自動化システムがセンサデータの変化にリアルタイムで反応することである。訓練段階の結果は、システムメモリに記憶され、これによりあらゆる状況において最適な行動にアクセスすることが極めて速くなる。
搭載コマンド及び制御自動化モジュール340の出力は、AIDL指示を含む航法及び誘導コマンド230のセットである。飛行中、搭載コマンド及び制御自動化モジュール340は、AIDL工程において6つの最適な行動を組み合わせて、その工程を実行するだけで作動することが可能である。

Claims (15)

  1. 航空機を自律的に操縦する方法であって、
    飛行前訓練ステップ(100)であって、
    少なくとも1つの航空機の機種と、少なくとも1つのルートとに対応する、複数の飛行の記録された監視データ(110)を読み出すことと、
    前記記録された監視データ(110)から航空機インテント(130)を推測すること(120)と、
    推測された前記航空機インテント(130)を使用して、再構築された軌道(150)を計算すること(140)と、
    特定の航空機の機種及びルートに対応する、航空機インテント(130)と、飛行の再構築された軌道(150)とを含む訓練データセット(160)を選択することと、
    航空機の状態と行動との間のマッピング関数(180)を取得するために、前記訓練データセット(160)に機械学習アルゴリズム(170)を適用することと
    を含む飛行前訓練ステップ(100)と、
    航空機の飛行中に実行されるリアルタイムの制御ステップ(200)であって、
    搭載センサのデータ(210)を繰り返し読み出すことと、
    前記搭載センサのデータ(210)からリアルタイムの航空機の状態(222)を取得することと、
    前記マッピング関数(180)を使用して、前記リアルタイムの航空機の状態(222)に関連する行動(224)を決定することと、
    前記航空機上で、選択された前記行動(224)を実行することと
    を含むリアルタイムの制御ステップ(200)と
    を含む方法。
  2. 前記航空機インテント(130)はAIDLフォーマットで表される、請求項1に記載の方法。
  3. 前記行動(224)は、AIDL指示として表される航法及び誘導コマンド(230)を含む、請求項2に記載の方法。
  4. 前記マッピング関数(180)は、AIDL指示を有するテーブルマッピング用センサ値を含む、請求項3に記載の方法。
  5. 前記行動(224)を決定するステップは、読み出された前記搭載センサのデータ(210)に対応するセンサ値を前記マッピングテーブルで検索し、ぴったり一致するものが見つからない場合、補間プロセスを使用して関連するAIDL指示を決定することを含む、請求項4に記載の方法。
  6. 前記記録された監視データ(110)は、ADS-Bデータ、レーダ追跡データ、飛行クイックアクセスレコーダデータのうちの少なくとも1つを含む、請求項1から5のいずれか一項に記載の方法。
  7. 前記機械学習アルゴリズム(170)は、目的地の空港における前記飛行の着陸と一致する前記航空機の状態(222)に関連する累積リワードRを最大化するポリシーπを取得する強化学習アルゴリズムである、請求項1から6のいずれか一項に記載の方法。
  8. 前記強化学習アルゴリズムは、6つの独立したAIDL指示を予測するために6つの独立したマルコフ決定プロセスを解くことを含み、行動及び状態空間は、各AIDLスレッドに対して異なっている、請求項7に記載の方法。
  9. 航空機を自律的に操縦するためのシステムであって、
    推測及び軌道再構築モジュール(310)であって、
    少なくとも1つの航空機の機種と、少なくとも1つのルートとに対応する、複数の飛行の記録された監視データ(110)から航空機インテント(130)を推測し、
    推測された前記航空機インテント(130)を使用して、再構築された軌道(150)を計算する(140)
    ように構成された推測及び軌道再構築モジュール(310)と、
    特定の航空機の機種とルートとに対応する、航空機インテント(130)と、飛行の再構築された軌道(150)とを含む訓練データセット(160)を選択するように構成されたクラスタリングモジュール(320)と、
    航空機の状態と行動との間のマッピング関数(180)を取得するために、前記訓練データセット(160)に機械学習アルゴリズム(170)を適用するように構成された機械学習モジュールと、
    搭載コマンド及び制御自動化モジュール(340)であって、
    航空機の飛行中に搭載センサのデータ(210)を繰り返し読み出し、
    前記搭載センサのデータ(210)からリアルタイムの航空機の状態(222)を取得し、
    前記マッピング関数(180)を使用して、前記リアルタイムの航空機の状態(222)に関連する行動(224)を決定し、
    前記航空機上で、選択された前記行動(224)を実行することを指示する
    ように構成された搭載コマンド及び制御自動化モジュール(340)と
    を備えるシステム。
  10. 前記航空機インテント(130)はAIDLフォーマットで表され、前記行動(224)はAIDL指示として表される航法及び誘導コマンド(230)を含む、請求項9に記載のシステム。
  11. 前記マッピング関数(180)は、AIDL指示を有するテーブルマッピング用センサ値を含み、前記搭載コマンド及び制御自動化モジュール(340)は、読み出された前記搭載センサのデータ(210)に対応するセンサ値を前記マッピングテーブルで検索し、ぴったり一致するものが見つからない場合、補間を使用して関連するAIDL指示を決定することによって、行動(224)を決定するように構成される、請求項10に記載のシステム。
  12. 前記機械学習モジュールは、目的地の空港における前記飛行の着陸と一致する前記航空機の状態(222)に関連する累積リワードRを最大化するポリシーπを取得するように構成された強化学習モジュール(330)である、請求項9から11のいずれか一項に記載のシステム。
  13. 前記強化学習モジュール(330)は、6つの独立したAIDL指示を予測するために6つの独立したマルコフ決定プロセスを解くように構成され、行動及び状態空間は、各AIDLスレッドに対して異なっている、請求項12に記載のシステム。
  14. 前記航空機上で選択された前記行動(224)を実行するための航空機の飛行管理システム(240)を備える、請求項9から13のいずれか一項に記載のシステム。
  15. 航空機を自律的に操縦するためのコンピュータプログラム製品であって、プロセッサによって実行されたときに前記プロセッサに請求項1から8のいずれか一項に記載の方法を実施させる、記憶された指示のセットを含む少なくとも1つのコンピュータ可読記憶媒体を備える、コンピュータプログラム製品。
JP2018119579A 2017-06-29 2018-06-25 航空機を自律的に操縦する方法及びシステム Active JP7066546B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP17382412.9 2017-06-29
EP17382412.9A EP3422130B8 (en) 2017-06-29 2017-06-29 Method and system for autonomously operating an aircraft

Publications (2)

Publication Number Publication Date
JP2019059461A JP2019059461A (ja) 2019-04-18
JP7066546B2 true JP7066546B2 (ja) 2022-05-13

Family

ID=59298423

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018119579A Active JP7066546B2 (ja) 2017-06-29 2018-06-25 航空機を自律的に操縦する方法及びシステム

Country Status (7)

Country Link
US (1) US10983533B2 (ja)
EP (1) EP3422130B8 (ja)
JP (1) JP7066546B2 (ja)
CN (1) CN109213188B (ja)
BR (1) BR102018012639A2 (ja)
CA (1) CA3003363C (ja)
ES (1) ES2943122T3 (ja)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11691755B2 (en) * 2018-04-16 2023-07-04 Wing Aviation Llc Multi-UAV management
US10990096B2 (en) * 2018-04-27 2021-04-27 Honda Motor Co., Ltd. Reinforcement learning on autonomous vehicles
US11107001B1 (en) * 2018-09-26 2021-08-31 Rockwell Collins, Inc. Systems and methods for practical autonomy decision controller
PL3887854T3 (pl) * 2018-11-27 2023-03-20 Leonardo S.P.A. Układ kontroli ruchu przestrzeni suborbitalnej
US11074480B2 (en) * 2019-01-31 2021-07-27 StradVision, Inc. Learning method and learning device for supporting reinforcement learning by using human driving data as training data to thereby perform personalized path planning
CN110083058B (zh) * 2019-03-19 2022-02-15 四川函钛科技有限公司 基于时序qar参数的重着陆分类方法
US11410558B2 (en) * 2019-05-21 2022-08-09 International Business Machines Corporation Traffic control with reinforcement learning
CN110807264B (zh) * 2019-11-07 2023-09-01 四川航天神坤科技有限公司 三维系统中雷达目标的实时监测预警方法及装置
CN111123963B (zh) * 2019-12-19 2021-06-08 南京航空航天大学 基于强化学习的未知环境自主导航系统及方法
CN111026147B (zh) * 2019-12-25 2021-01-08 北京航空航天大学 基于深度强化学习的零超调量无人机位置控制方法及装置
CN111160755B (zh) * 2019-12-26 2023-08-18 西北工业大学 一种基于dqn的飞机大修车间实时调度方法
US20220308598A1 (en) * 2020-04-30 2022-09-29 Rakuten Group, Inc. Learning device, information processing device, and learned control model
WO2021220467A1 (ja) * 2020-04-30 2021-11-04 楽天株式会社 学習装置、情報処理装置、及び学習済の制御モデル
FR3111466A1 (fr) * 2020-06-12 2021-12-17 Thales Système et méthode pour la détermination améliorée de paramètres de trajectoire d’aéronefs
CN112367109B (zh) * 2020-09-28 2022-02-01 西北工业大学 空地网络中由数字孪生驱动的联邦学习的激励方法
US12094349B2 (en) 2020-10-21 2024-09-17 The Boeing Company Optimizing flights of a fleet of aircraft using a reinforcement learning model
US20220292994A1 (en) * 2021-03-12 2022-09-15 The Boeing Company Artificial intelligence powered emergency pilot assistance system
CN113110546B (zh) * 2021-04-20 2022-09-23 南京大学 一种基于离线强化学习的无人机自主飞行控制方法
CN113189989B (zh) * 2021-04-21 2022-07-01 东风柳州汽车有限公司 车辆意图预测方法、装置、设备及存储介质
CN114036631B (zh) * 2021-10-22 2024-09-20 南京航空航天大学 一种基于强化学习的航天器自主交会对接制导策略生成方法
US11803197B2 (en) * 2021-11-15 2023-10-31 Beta Air, Llc Systems and methods for controlling a flight boundary of an aircraft
CN114089762B (zh) * 2021-11-22 2024-06-21 江苏科技大学 一种基于强化学习的水空两栖无人航行器路径规划方法
CN114141062B (zh) * 2021-11-30 2022-11-01 中国电子科技集团公司第二十八研究所 一种基于深度强化学习的航空器间隔管理决策方法
FR3130956A1 (fr) * 2021-12-17 2023-06-23 Thales Procédé d’aide au pilotage d’un aéronef, dispositif électronique d’aide au pilotage et système d’assistance associés
CN114638442B (zh) * 2022-05-19 2022-09-02 珠海翔翼航空技术有限公司 面向个体差异的飞行训练方案生成系统、方法及设备
CN115857556B (zh) * 2023-01-30 2023-07-14 中国人民解放军96901部队 一种基于强化学习的无人飞行器协同探测规划方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011114536A (ja) 2009-11-26 2011-06-09 Alpine Electronics Inc 車両周辺画像提供装置
JP2012158322A (ja) 2011-01-28 2012-08-23 Boeing Co:The 航空機の飛行経路を予測するためのデータの供給
US8326780B2 (en) 2008-10-14 2012-12-04 Honda Motor Co., Ltd. Smoothed sarsa: reinforcement learning for robot delivery tasks
JP2014238827A (ja) 2013-05-09 2014-12-18 ザ・ボーイング・カンパニーTheBoeing Company 航空機の意図の記述提供
US20160070264A1 (en) 2014-09-05 2016-03-10 SZ DJI Technology Co., Ltd Velocity control for an unmanned aerial vehicle
EP3109805A1 (en) 2015-06-22 2016-12-28 The Boeing Company A computer-implemented method and system for estimating impact of new operational conditions in a baseline air traffic scenario
WO2017048464A1 (en) 2015-09-18 2017-03-23 Amazon Technologies, Inc. Active airborne noise abatement
JP2017065297A (ja) 2015-09-28 2017-04-06 双葉電子工業株式会社 飛行制御装置、飛行制御方法、飛行体
JP2019505900A (ja) 2015-12-23 2019-02-28 スイス リインシュランス カンパニー リミテッド 飛行軌道予測システム及び飛行軌道基盤自動化遅延リスク移転システム及びその対応する方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150017609A1 (en) * 2013-07-09 2015-01-15 General Electric Company Method and apparatus for generating or updating an aviation simulation scenario
US8977484B1 (en) 2013-08-22 2015-03-10 The Boeing Company Using aircraft trajectory data to infer aircraft intent
EP2843364B1 (en) 2013-08-30 2019-10-23 The Boeing Company Method and system for estimating aircraft course

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8326780B2 (en) 2008-10-14 2012-12-04 Honda Motor Co., Ltd. Smoothed sarsa: reinforcement learning for robot delivery tasks
JP2011114536A (ja) 2009-11-26 2011-06-09 Alpine Electronics Inc 車両周辺画像提供装置
JP2012158322A (ja) 2011-01-28 2012-08-23 Boeing Co:The 航空機の飛行経路を予測するためのデータの供給
JP2014238827A (ja) 2013-05-09 2014-12-18 ザ・ボーイング・カンパニーTheBoeing Company 航空機の意図の記述提供
US20160070264A1 (en) 2014-09-05 2016-03-10 SZ DJI Technology Co., Ltd Velocity control for an unmanned aerial vehicle
EP3109805A1 (en) 2015-06-22 2016-12-28 The Boeing Company A computer-implemented method and system for estimating impact of new operational conditions in a baseline air traffic scenario
WO2017048464A1 (en) 2015-09-18 2017-03-23 Amazon Technologies, Inc. Active airborne noise abatement
JP2017065297A (ja) 2015-09-28 2017-04-06 双葉電子工業株式会社 飛行制御装置、飛行制御方法、飛行体
JP2019505900A (ja) 2015-12-23 2019-02-28 スイス リインシュランス カンパニー リミテッド 飛行軌道予測システム及び飛行軌道基盤自動化遅延リスク移転システム及びその対応する方法

Also Published As

Publication number Publication date
EP3422130B1 (en) 2023-02-15
BR102018012639A2 (pt) 2019-01-15
US10983533B2 (en) 2021-04-20
ES2943122T3 (es) 2023-06-09
CA3003363C (fr) 2023-08-01
CN109213188A (zh) 2019-01-15
EP3422130B8 (en) 2023-03-22
CA3003363A1 (fr) 2018-12-29
CN109213188B (zh) 2024-06-14
EP3422130A1 (en) 2019-01-02
JP2019059461A (ja) 2019-04-18
US20190005828A1 (en) 2019-01-03

Similar Documents

Publication Publication Date Title
JP7066546B2 (ja) 航空機を自律的に操縦する方法及びシステム
Choi et al. Unmanned aerial vehicles using machine learning for autonomous flight; state-of-the-art
Alligier et al. Machine learning and mass estimation methods for ground-based aircraft climb prediction
Radmanesh et al. Dynamic optimal UAV trajectory planning in the national airspace system via mixed integer linear programming
Paielli et al. Conflict probability estimation for free flight
CN102915652B (zh) 飞行器交通分离系统及方法
CN105844969B (zh) 根据气象条件来改进飞行器的飞行轨迹的方法
Németh et al. Optimal control of overtaking maneuver for intelligent vehicles
Hernández et al. Data-driven aircraft trajectory predictions using ensemble meta-estimators
Zhao et al. Multiple-aircraft-conflict resolution under uncertainties
CN116881707A (zh) 自动驾驶模型、训练方法、装置和车辆
Başpınar et al. Optimization-based autonomous air traffic control for airspace capacity improvement
Gunetti et al. Autonomous mission management for UAVs using soar intelligent agents
US10062291B1 (en) Systems and methods for providing improved flight guidance
Liu et al. An Improved Four‐Rotor UAV Autonomous Navigation Multisensor Fusion Depth Learning
Geiger Unmanned aerial vehicle trajectory planning with direct methods
Jung et al. Enabling operational autonomy for unmanned aerial vehicles with scalability
Jacob et al. Autonomous drones for medical assistance using reinforcement learning
Chen et al. Combined of Lyapunov-stable and active disturbance rejection control for the path following of a small unmanned aerial vehicle
Palamas et al. A multi-task learning framework for drone state identification and trajectory prediction
Wells et al. Application of interacting multiple model for future state prediction of small unmanned aerial systems
Wells et al. Implementation of multiple model: Simulation and experimentation for future state prediction on different classes of small unmanned aerial systems
Feng et al. Modelling and implementation of unmanned aircraft collision avoidance
Prabakar et al. Task offloading and trajectory control techniques in unmanned aerial vehicles with internet of things–An exhaustive review
AlMahamid et al. VizNav: A Modular Off-Policy Deep Reinforcement Learning Framework for Vision-Based Autonomous UAV Navigation in 3D Dynamic Environments

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210617

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220310

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220405

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220427

R150 Certificate of patent or registration of utility model

Ref document number: 7066546

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150