JP2022089806A - 車両の動作プロファイルのモデリング - Google Patents

車両の動作プロファイルのモデリング Download PDF

Info

Publication number
JP2022089806A
JP2022089806A JP2021197183A JP2021197183A JP2022089806A JP 2022089806 A JP2022089806 A JP 2022089806A JP 2021197183 A JP2021197183 A JP 2021197183A JP 2021197183 A JP2021197183 A JP 2021197183A JP 2022089806 A JP2022089806 A JP 2022089806A
Authority
JP
Japan
Prior art keywords
model
function
data
artificial
vehicle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021197183A
Other languages
English (en)
Inventor
シーク マーティン
Schiegg Martin
ビラル ザファール ムハンマド
Bilal Zafar Muhammad
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Robert Bosch GmbH
Original Assignee
Robert Bosch GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Robert Bosch GmbH filed Critical Robert Bosch GmbH
Publication of JP2022089806A publication Critical patent/JP2022089806A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • G06F30/15Vehicle, aircraft or watercraft design
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/008Artificial life, i.e. computing arrangements simulating life based on physical entities controlled by simulated intelligence so as to replicate intelligent life forms, e.g. based on robots replicating pets or humans in their appearance or behaviour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/12Timing analysis or timing optimisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Geometry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Robotics (AREA)
  • Automation & Control Theory (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Probability & Statistics with Applications (AREA)
  • Traffic Control Systems (AREA)
  • Control Of Driving Devices And Active Controlling Of Vehicle (AREA)
  • Feedback Control In General (AREA)

Abstract

【課題】自動走行システムにおけるデータ駆動アルゴリズムの開発及び適用は、自動走行システムの正確なシミュレーションにとって益々重要になっている。自動走行システムをシミュレーションする際に、対象とする自動車システムの性能の一側面を特徴付ける複数の人工的なデータポイントを生成することが有利であることが証明可能である。このようにして、例えば、種々の将来のシナリオをシミュレーションし、統計的に評価することができる。【解決手段】本発明は、機械学習のための生成モデルをトレーニングするためのコンピュータ実装された方法、機械学習のための生成モデルを使用して、人工的なデータ列を生成するためのコンピュータ実装された方法及び関連する装置に関する。本発明はさらに、関連するコンピュータプログラム要素及びコンピュータ可読媒体に関する。【選択図】図3A

Description

本発明は、機械学習のための生成モデルをトレーニングするためのコンピュータ実装された方法、機械学習のための生成モデルを使用して人工的なデータサンプルを生成するためのコンピュータ実装された方法、及び、関連する装置に関する。本発明はさらに、関連するコンピュータプログラム要素及びコンピュータ可読媒体に関する。
従来技術
自動走行システムにおけるデータ駆動アルゴリズムの開発及び適用は、自動走行システムの正確なシミュレーションにとって益々重要になっている。自動走行システムをシミュレーションする際に、対象とする自動車システムの性能の一側面を特徴付ける複数の人工的なデータポイントを生成することが有利であることが証明可能である。このようにして、例えば、種々の将来のシナリオをシミュレーションし、統計的に評価することができる。
このテーマ領域内には、例えば、先に取得された車両軌跡データに基づく車両軌跡予測データの生成が含まれる。敵対的生成ネットワーク(Generative Adversarial Network-GAN)は、通常、生成モデルを提供するために使用される。しかし、このようなアプローチをさらに改善することができる。
発明の概要
第1の態様によれば、生成器モデル及び識別器モデルの敵対的トレーニングを含む、車両又はロボットの動作プロファイルをモデリングする機械学習のための生成モデルをトレーニングするためのコンピュータ実装された方法が提供される。この方法は、
・データ空間から複数のデータ列を取得することを含み、ここで、各データ列は、車両又はロボットの少なくとも1つの動作プロファイルを記述し、
・機械学習のための生成モデルのトレーニング時の少なくとも1つの生成フェーズの間に、分布からサンプリングすることによって複数の人工的なデータ列を生成することを含み、
・機械学習のための生成モデルのトレーニング時の少なくとも1つの識別フェーズの間に、識別器モデルに、(i)取得された複数のデータ列からのデータ列、又は、(ii)複数の人工的なデータ列からの人工的なデータ列を入力することを含み、
・機械学習のための生成モデルのトレーニング時の少なくとも1つの識別フェーズの間に、識別器モデルへの入力を、データ空間からのデータ列として、又は、少なくとも、識別器モデルの第1の関数及び第2の関数を使用した人工的なデータ列として、分類することを含み、ここで、第1の関数の複数の入力は、人工的なデータ列の複数の連続的なサンプルを含み、第2の関数の少なくとも1つの入力は、人工的なデータ列の複数の異なるステップから得られた人工的なデータ列の少なくとも2つのデータサンプルを含み、
・トレーニングされた生成器モデルを含む、機械学習のためのトレーニングされたモデルを生成するために、機械学習のための生成モデルの生成器モデル及び識別器モデルを反復的にトレーニングすることを含む。
1つの効果は、この方法に従ってトレーニングされている機械学習のためのモデルによって生成された人工的なデータが、真の車両アプリケーションシナリオの特有の特徴に関する真の分布と一致すること又はこれと近似することである。この結果、人工的なデータサンプルを生成するために識別器を使用してトレーニングされている生成器を使用する場合、シミュレーションの質が改善される。
上述のアプローチに従って生成されたモデルを、有利には、車両の実行中の動作時にも使用することができる。エンジン制御ユニットは、例えば、燃費又は排気特性を、車両走行の記録された速度プロファイルに基づいて、又は、ナビゲーションシステムによって計算された車両の将来の経路に基づいて、又は、車両の現在の位置を考慮した、最も可能性の高い道のりに基づいて、予測することができる。将来の車両の動作モードを予測するようにモデルがトレーニングされている場合、このモデルを使用して車両を制御するエンジン制御ユニットよりも、所定の経路に対する排気又は燃費により正確に近似することができ、これによって、例えば、車両は、自身の排気を平均的に減少させることができる。
このモデルの結果に基づいて、車両又はロボットの制御戦略を適合させることができる。電動車両又は電動ロボットの場合には、ある経路が、許容し得ないレベルよりもバッテリを消耗させると予測される場合、他の経路が提案されるものとしてよく、運転者アラームが起動されるものとしてよく、及び/又は、低電力モード(例えば、車両又はロボットの速度の制限)が開始されるものとしてよい。
このモデルを、車両ルート探索ソフトウェアへの入力を、燃料性能又は排気性能に関して、評価するように構成することができる。より効率的な燃料性能又はより低い排気特性を有する経路を、出力インタフェース上において、より高い優先度により、運転者に提示することができる。
このモデルを同様に、予想経路に基づくバッテリの消耗の予測又は充電時間の予測を改善するために、電気車両又はハイブリッド車両の制御ユニットにおいて使用することができる。
第1の態様に従ってトレーニングされているモデルを使用して、1つ又は複数の、予測された経路上の走行によって引き起こされ得る車両構成部分の摩耗を推定することができる。
さらに、機械学習のためのモデル(例えば、cGAN又はGAN)のトレーニングに使用されるプロセッサ又はシステムの内部動作の本態様は有利である。特に、第2のモジュールの実用的効果は、トレーニング中にGAN生成器又はcGAN生成器に追加の勾配情報を提供することである。これは、実際のデータ列又は人工的なデータ列(任意選択的に速度-加速度ヒストグラム)から結果として生じる分布から得られる値の列などのドメイン特有の特徴に焦点を当てることによって、識別器のタスクを容易にし、これによって、同様にトレーニングを誘導し、トレーニングの安定性、速度及び精度の向上を生じさせ得る。
第2の態様によれば、機械学習のための生成モデルを使用して、車両又はロボットの人工的な動作プロファイルを表す、人工的なデータサンプルを生成するためのコンピュータ実装された方法が提供される。この方法は、
・第1の態様の方法に従って取得された複数のモデルパラメータに従って、機械学習のための生成モデルを構成することと、
・疑似ランダムベクトルを提供するために構成されている分布からサンプリングすることによって、複数のサンプルを取得することと、
・データ空間内においてさらなる複数の人工的なデータサンプルを取得するために、この分布の複数のサンプルを復号化することと、
・車両又はロボットの人工的な動作プロファイルを表す、さらなる複数の人工的なデータサンプルを出力することと、
を含む。
第3の態様によれば、車両の動作プロファイルをモデリングする機械学習のためのさらなるモデルをトレーニングするためのコンピュータ実装された方法が提供され、この方法は、
・第2の態様のコンピュータ実装された方法に従って生成された車両の人工的な動作プロファイルを表す、さらなる複数の人工的なデータ列を取得することと、
・車両の人工的な動作プロファイルを表す、さらなる複数の人工的なデータ列を、機械学習のためのさらなるモデルに入力することと、
・機械学習のためのさらなるモデルを反復的にトレーニングすることと、
・車両の動作プロファイルをモデリングする機械学習のためのさらなるモデルのさらなる複数のモデルパラメータを出力することと、
を含む。
第4の態様によれば、メモリに格納されている生成器モデル及び識別器モデルの敵対的トレーニングを含む、車両又はロボットの動作プロファイルをモデリングする機械学習のための生成モデルをトレーニングするための装置が提供される。この装置は、データ空間から複数のデータ列を取得するように構成されている入力インタフェースを含み、ここでは、各データ列は、車両の少なくとも1つの動作プロファイルを記述する。この装置はさらに、機械学習のための生成モデルのトレーニング時の少なくとも1つの生成フェーズの間に、分布からサンプリングすることによって少なくとも1つの人工的なデータ列を生成するように構成されているプロセッサを含む。
プロセッサは、機械学習のための生成モデルのトレーニング時の少なくとも1つの識別フェーズの間に、識別器モデルに、(i)取得された複数のデータ列からのデータ列、又は、(ii)少なくとも1つの人工的なデータ列からの人工的なデータ列を入力するように構成されている。
プロセッサは、機械学習のための生成モデルのトレーニング時の少なくとも1つの識別フェーズの間に、識別器モデルへの入力を、データ空間からのデータ列として、又は、少なくとも、識別器モデルの第1の関数及び第2の関数を使用した人工的なデータ列として、分類するように構成されている。
第1の関数の複数の入力は、人工的なデータ列の複数の連続的なサンプルを含み、第2の関数の少なくとも1つの入力は、人工的なデータ列の複数の異なるステップから得られた人工的なデータ列の少なくとも2つのデータサンプルを含む。
プロセッサは、トレーニングされた生成器モデルを含む、機械学習のためのトレーニングされたモデルを生成するために、機械学習のための生成モデルの生成器モデル及び識別器モデルを反復的にトレーニングするように構成されている。上記装置は、機械学習のためのトレーニングされたモデルを出力するように構成されている出力インタフェースをさらに含む。
第5の態様によれば、1つ又は複数のコンピュータプログラム要素が提供され、このコンピュータプログラム要素は、少なくとも、
(i)機械学習のための使用の下における、第1の態様の方法又はその実施形態に従った機械学習のための生成モデルをトレーニングするためのコンピュータ実行可能な命令、及び/又は、
(ii)第3の態様に従った人工的なデータ列の生成のためのコンピュータ実行可能な命令、及び/又は、
(iii)第1の態様又はその実施形態に従ってトレーニングされる機械学習のための生成モデルを提供するためのモデルパラメータを含むコンピュータ実行可能な命令
を含む。
第6の態様によれば、第5の態様のコンピュータプログラム要素のうちの1つ又は複数を含むコンピュータ可読媒体が提供される。
第7の態様によれば、車両が提供され、この車両は、車両を動作させるために駆動力を提供するように構成されている原動機と、複数のセンサと、少なくとも原動機をセンサからのフィードバックに基づいて制御するように構成されている車両エレクトロニクスユニットとを含む。車両エレクトロニクスユニットは、トレーニングされたモデルを第2の態様に従ってインスタンス化し、実施するように構成されているプロセッサを含む。トレーニングされたモデルは、センサからの入力信号を受信し、この入力信号をトレーニングされたモデルに適用するように構成されている。プロセッサは、トレーニングされたモデルを用いて、1つ又は複数の応答信号を計算するように構成されている。プロセッサは、トレーニングされたモデルを介して取得された応答信号への応答として、1つ又は複数の原動機の構成又は車両の他の出力アクチュエータの構成を適合させるように構成されている。
本特許明細書において、車両は、要素(乗客又は有効荷重など)を運搬する又は輸送するためのあらゆる手段であるものとしてよい。車両の例としては、内燃機関、ハイブリッドエンジン、ガスエンジン、電動パワートレイン又は水素ハイブリッドエンジンを有している自動車、トラック、配送車又はバスが挙げられる。車両は、自律型又は半自律型の乗用車、バス又はトラックであるものとしてよい。車両は、電動自転車、電動スクータ、工場ロボット、フォークリフト又は電動車椅子であるものとしてよい。
本特許明細書において、車両の動作プロファイルは、例えば、道路を走行する車両の一連の速度、エンジン温度、エンジン回転数、ペダル位置、舵角又はギアチェンジ機能を記述する複数のサンプリングされたデータ列の1つ又は複数である。
一例においては、トレーニングされたモデルは、この適用においては車両の一種とみなされる倉庫ロボットなどの半自律型又は自律型のロボットにも適用され得る。
一例においては、識別器モデルの第2の関数への入力は、真のデータ列又は人工的なデータ列から結果として生じる分布からサンプリングされた、一連の速度-加速度対を含む。他の例においては、動作プロファイルは、単位時間あたりの整数の車両停止回数、所定の速度までの車両加速の持続時間、所定の速度までの車両減速の持続時間、ゼロ速度までの車両減速の持続時間、経路湾曲に対する車両速度、経路傾斜に対する車両速度、総走行持続時間に対する車両速度、単位時間あたりの整数のギアチェンジ回数、予め定められた速度を達成するためのギアチェンジ機能、ゼロ速度を達成するためのギアチェンジ機能、経路湾曲に対するギアチェンジ機能、経路傾斜に対するギアチェンジ機能、総走行持続時間に対するギアチェンジ機能であるものとしてよい。
その結果、一例においては、生成モデルの分布に、エキスパートによって規定される分布による影響を与えるサンプルの追加情報を提供するために、識別器の第2の関数を評価することができる。
経路/速度データサンプル上において条件付き敵対的生成ネットワークをトレーニングするためのアプローチを示す図である。 機械学習のためのトレーニングされた生成ネットワークを使用して経路/速度データサンプルを生成するためのアプローチを示す図である。 図1Bの条件付き敵対的生成ネットワークの識別器をより詳細に示す図である。 第1の態様に従った車両の動作プロファイルをモデリングする機械学習のための生成モデルをトレーニングするためのコンピュータ実装された方法を示す図である。 第2の態様に従った機械学習のための生成モデルを使用して、車両の人工的な動作プロファイルを表す人工的なデータサンプルを生成するためのコンピュータ実装された方法を示す図である。 機械学習のためのシステムの例示的な構造を示す図である。 データ生成器の例示的な構造を示す図である。 機械学習のためのシステムの識別器の例示的な構造を示す図である。 機械学習のためのシステムの識別器の詳細な実施形態を示す図である。 第3の態様に従った装置を示す図である。 第7の態様に従った車両を概略的に示す図であり、車両には制御デバイスが設置されており、制御デバイスは、第1の態様に従ってトレーニングされているモデルを適用するように構成されている。
詳細な説明
ここでは、生成モデルの改善が提示されている。生成モデルは、この生成モデルをトレーニングするために以前に使用されたデータサンプルのセットを表すデータサンプルを生成することができるニューラルネットワークアーキテクチャである。一例においては、生成モデルは、敵対的生成ネットワーク(GAN)又は条件付き敵対的生成ネットワーク(cGAN)の生成器であるものとしてよい。
人工的な速度曲線を生成するための生成モデルは(例えば)サンプルを生成することができ、このサンプルは、実際のように見えるが、生成された軌跡が、場合によっては真のデータの統計と一致しないことがある。例えば、速度軌跡が生成される場合、経路に沿った信号機の存在、特定の交差点における他の運転者の行動、時間帯、運転者の気分などの外的要因は、従来の速度曲線生成が考慮しない影響を生じさせる。このような外部の影響は、生成された速度軌跡の統計に影響を与えるアプリケーション特有の歪みを形成する。
一例として、速度-加速度ヒストグラムを表す分布からのサンプルの取得が、生成ネットワークによって生成された車両速度軌跡の忠実度を評価するためにエキスパートによって使用されるものとしてよい。現実の世界のシナリオを表す車両走行に関しては、これが、速度-加速度対の所与の分布に従うことが予想される。現実の世界の走行に関しては、これが、速度軌跡において表されている部分走行の数(ここでは、部分走行は、例えば、継続前の期間の間の、ゼロ速度における車両停滞時間によって識別可能である)又はゼロ速度において費やされた時間などの、いくつかの他の特徴の特定の分布を表すことも予想される。
本特許明細書の態様によれば、敵対的生成ネットワーク(GAN)又は条件付き敵対的生成ネットワーク(cGAN)の識別器を、識別過程から結果として生じる統計の質を改善する追加機能によって改善することが提案される。特に、識別関数に対するアプリケーション特有の識別器統計において、少なくとも1つの追加機能ブロックを提供することが提案される。換言すると、GAN又はcGANのデータベースの生成器を、ドメイン特有の専門知識により強化することができる。
換言すると、エキスパート特徴の分布と一致する又はエキスパート特徴に極めて類似するデータサンプルの軌跡(例えば、速度軌跡)を生成する、変更されたアーキテクチャを有するGAN又はcGANが提案される。
さらに、より正確な出力データを生成するために、又は、生成モデルによって生成されたデータの精度を評価するための評価指標として、正確な統計を適用する関数を有している識別器の提供をトレーニング手順中に適用することができる。
図1Aは、経路/速度データサンプル上における条件付き敵対的生成ネットワークのトレーニングの例を示す図である。しかし、ここで説明されている技術は、あらゆる条件付け、例えば経路に基づく条件付けを伴わない敵対的生成ネットワーク(GAN)にも適用される。
トレーニングフェーズにおいて、サンプルc{1:Ti}とx{1:Ti}とが、真のデータ分布から取得される。このケースにおいては、環境変数c{1:Ti}は、真の経路を記述する行列であり、時間列x{1:Ti}は、この経路に沿った速度観測のベクトルである。Tiは、シーケンスの長さである。
経路サンプル14aと、この経路サンプル14aに付随する速度サンプル14bとを含む真のデータサンプル14の対が、ランダムに真のデータ分布から選択されて、識別器12に提供され、この結果、真の時間列データのサンプルが形成される。(cGANとは異なり)GANのトレーニングの例においては、ここで、データサンプルの対の代わりに、1つのデータサンプルだけが必要とされる。
経路サンプル14aは、例示的な経路において規定された一連の環境ポイントである。速度サンプル14bは、各経路サンプル14aに対応している。速度サンプル14bは、経路サンプル14aに沿ったポイントにおける車両の速度を規定する一連の速度ポイントである。
先行する反復からの生成モデル10aは、ガウス分布又は均一分布などの予め定められた分布のランダムサンプルを伴って提供される。この分布からのサンプリングの際に、ベクトル又はベクトルのシーケンスを検出することができる。生成モデル10aは、さらに、一例においては時間列である条件付きの経路サンプルを伴って提供される。
生成モデル10aは、1つ又は複数の出力、このケースにおいては1つ又は複数の生成された速度15を生成するように構成されている。生成モデル10aを条件付けするために使用される、生成された速度15及び経路サンプル16bは、人工的な時間列データ17bのサンプルを形成する。
識別器モデル12は、この入力におけるサンプルが、実験的に観察されたデータ(現実の世界のデータ)17aを表しているのか、又は、生成モデル10aからの人工的な時間列データ(偽のデータ)17bを表しているのかを識別するようにトレーニングされる。典型的には、トレーニングプロセスは、生成モデル10aと識別器12とを相対させて統合し、これによって、識別器モデル12の打破時に生成モデル10aが改善される(換言すると、識別器モデル12が、実験的に観察されたデータ17aを人工的なデータ17bとして識別する可能性及びその逆の可能性が高くなる)。
換言すると、cGANのトレーニングプロセスは、生成モデル10aに対する損失関数の最適化と識別器モデル12に対する損失関数の最適化とを含む。具体的には、このトレーニングプロセスは、識別器モデル12の損失関数の最小化及び生成モデル10aのエラーの損失関数の最小化を含む(これにより、人工的なデータに対する識別器の損失の最大化が生じる)ミニマックスプロセスである。その結果、人工的な時間列曲線を生成することができる最終的な生成モデル10bが生じる。
図1Bは、機械学習のための、トレーニングされた生成ネットワークを使用して経路/速度データサンプルを生成するためのアプローチを示している。所与の経路は、例えば、勾配、速度制限、交通密度プロファイル、路面、信号機の数又は気象データを表す一連の情報によって表されるものとしてよい。
経路データベース19aから経路20が抽出され、cGANのトレーニングされた生成モデル10bを条件付けするために使用される。さらに、予め定められた分布から、cGANからのサンプルが抽出される。経路20及び予め定められた分布のサンプリングに基づいて、トレーニングされた生成モデル10bは、さらなる使用のために、特定の時間22における速度の人工的なデータ列などの、人工的なデータの1つ又は複数の要素を提供する。一例においては、このさらなる使用は、生成されたデータの、システムシミュレーションソフトウェア及び解析ソフトウェア23への入力であり得る。
本特許明細書において、次に列挙する記号は、次の意味を有する。
Figure 2022089806000002
本開示における具体的な例を説明するための、上に挙げた名称の規定は、技術的な概念全体に対する限定ではない。特に、多変量時間列が、xを伴い、Rにおいて生成されるものとしてよく、ここでは、Dは、生成されるべき変数の数である。記号「x」、「c」、「z」が現れる図中の箇所において、それらは、「x1:T」、「c1:T」、「z1:T」の略語を示す。
下付き文字Tは、上に挙げた列にインデックスを付けするために使用されており、ここに示された例は、時間列により示されているが、この技術は、これに限定されるものではない。この列は、例えば、距離ステップ又は変速機設定を基準とする。
列x1:Tは、一変量又は多変量であるものとしてよい。一例においては、この列は、時間列又は距離に基づく列である。
複数の列における各要素x1:Ti、c1:Tiは、異なる長さを有するものとしてよい。図1Aの例においては、cGANターゲットに実際のデータ
Figure 2022089806000003
が与えられ、これは、
Figure 2022089806000004
からサンプルを抽出することを学習する。生成器モデル(ネットワーク)10a g(z1:T,c1:T)は、暗黙的に誘導された分布
Figure 2022089806000005
からサンプリングするように構成されている。実際の分布と誘導された分布との間の不一致
Figure 2022089806000006
を敵対的トレーニングによって最小限に抑制するために最小化が実行される。一例においては、この不一致を、Jensen-Shannonダイバージェンス、ワッサースタイン距離又はMaximum Mean Discrepancy(MMD)によって低減させることができる。所与の生成器モデルg及び識別器モデル(クリティック)fの場合、これは、ミニマックス目的
Figure 2022089806000007
に対応する。

Figure 2022089806000008
は、ここで生成器が最小化しようと試みるダイバージェンスの推定に関連している。
一例においては、GAN設定におけるワッサースタイン距離
Figure 2022089806000009
の適用であり、即ち、2つの分布の間の環境情報/経路情報への条件付けは行われない。
Figure 2022089806000010
ここでは、
Figure 2022089806000011
は、1-リプシッツ関数から成る。従って、ミニマックス目的は、次のようになる。
Figure 2022089806000012
条件付きGAN(cGAN)は、経路情報及び車両動作プロファイル
の共通の分布
Figure 2022089806000013
の近似によって、異なる分布
Figure 2022089806000014
を備える。
Figure 2022089806000015
によって、生成器モデル(ネットワーク)10aは、
Figure 2022089806000016
からサンプリングするようにトレーニングされ得る。実際の分布と誘導された分布との間の不一致
Figure 2022089806000017
は、敵対的トレーニングによって最小化され得る。ダイバージェンス尺度としてワッサースタイン距離が設定される場合には、cGAN目的は、次のようになる。
Figure 2022089806000018
図2は、図1Bの条件付き敵対的生成ネットワーク(cGAN)の生成器及び識別器をより詳細に示している。同一の特徴には、同一の参照符号が付けられている。行24は、簡略化された図であり、行25は、cGANの例示的なモデルアーキテクチャ(ネットワークアーキテクチャ)の詳細な図である。一例においては、生成モデル10bは、リカレント・ニューラル・ネットワーク(LSTM10c)によって実行される。特定の例は、長・短期記憶ユニットを使用して生成モデル10bを実行するが、他の変形形態を使用することが可能である。LSTMへの入力は、経路16bから抽出される。
図2においては、2つのセットの環境条件タイムシーケンスが、経路16bから特徴として抽出される。第1の環境条件タイムシーケンスは、経路に沿った勾配を規定する。第2の環境条件タイムシーケンスは、経路に沿った速度制限を規定する。当業者は、LSTM10cへの入力として、多かれ少なかれ環境時間列を使用することができることを理解するであろう。各時間ステップにおけるノイズサンプル16a(z)がPから抽出され、LSTM10cに入力される。LSTM10cを含む生成モデルは、これらの入力から、対応する人工的な速度時間列を生成する。
識別器12には、経路に沿った勾配を規定する第1の環境条件タイムシーケンスと、経路に沿った速度制限を規定する第2の環境条件タイムシーケンスと、生成された人工的な速度時間列とが適用される。図示の例においては、識別器12aは、長・短期記憶などのリカレント・ニューラル・ネットワークでもある。
さらに、図2に示されているcGANを改良することができる。特に、現実の速度時間列の統計的分布が、例えば、信号機、気象条件、運転者の気分、速度カメラの位置又は時刻の影響によって引き起こされ得る、現実の運転条件によって歪められる場合がある。
第1の態様によれば、生成器モデル及び識別器モデルの敵対的トレーニングを含む、車両又はロボットの動作プロファイルをモデリングする機械学習のための生成モデルをトレーニングするためのコンピュータ実装された方法30が提供される。この方法は、
・データ空間から複数のデータ列を取得すること32を含み、ここで、各データ列は、車両又はロボットの少なくとも1つの動作プロファイルを記述し、
・機械学習のための生成モデルのトレーニング時の少なくとも1つの生成フェーズの間に、分布からサンプリングすることによって複数の人工的なデータ列を生成すること33を含み、
・機械学習のための生成モデルのトレーニング時の少なくとも1つの識別フェーズの間に、識別器モデルに、(i)取得された複数のデータ列からのデータ列、又は、(ii)複数の人工的なデータ列からの人工的なデータ列を入力すること34を含み、
・機械学習のための生成モデルのトレーニング時の少なくとも1つの識別フェーズの間に、識別器モデルへの入力を、データ空間からのデータ列として、又は、少なくとも、識別器モデルの第1の関数及び第2の関数を使用した人工的なデータ列として、分類すること35を含み、ここで、第1の関数10の複数の入力は、人工的なデータ列の複数の連続的なサンプルを含み、第2の関数26の少なくとも1つの入力は、人工的なデータ列の複数の異なるステップから得られた人工的なデータ列の少なくとも2つのデータサンプルを含み、
・トレーニングされた生成器モデルを含む、機械学習のためのトレーニングされたモデルを生成するために、機械学習のための生成モデルの生成器モデル及び識別器モデルを反復的にトレーニングすること36を含む。
図3Aは、第1の態様に従った車両の動作プロファイルをモデリングする機械学習のための生成モデルをトレーニングするためのコンピュータ実装された方法を示す図である。
一実施形態によれば、複数の人工的なデータ列を提供するために、分布は、少なくとも1つの生成フェーズにおいてサンプリングされる。
図4Aは、トレーニングフェーズにおける、生成モデルをトレーニングするための機械学習のためのシステム45の例示的な構造を示している。
機械学習のためのシステム45は、敵対的生成ネットワークGANの一例である。経路及びこれに関連する速度プロファイルなどの例示的なデータが、真のデータサンプル14を含むデータベースから取得される。次いで、生成器47が、速度プロファイル及び/又は経路プロファイルなどの例示的な出力データ列を生成するために、機械学習のためのシステム45内においてトレーニングされる。速度プロファイルは、ランダムな入力変数16aの関数として決定される。複数の車両経路から抽出される速度などの、データ空間Xにおける複数のサンプリングされたデータ列が、データ空間Xにおける複数のサンプリングされたデータ列を形成するが、他の多くの変数が、単独で又は組み合わせて使用可能である。
複数の人工的なデータ列のセットを取得するために、ガウス分布などの分布がサンプリングされる。分布のパラメータは、例えば、出力される分布の特徴が、意図した人工的なデータ、例えば、複数の速度プロファイル又は変速機設定を表すように選択される。
この分布からサンプリングされた、各時間ステップにおけるノイズz1:Tが生成器47に入力され、生成器47には、任意選択的に、条件付きGANにおいて他の変数を提供することができる。生成器47は、真のデータサンプル14と区別することができない人工的なデータ列を生成することを目的とする。生成器47の反復的な最適化は、Xと
Figure 2022089806000019
との比較及び損失関数の計算によって、反復ごとに実行されるものとしてよい。生成器47のパラメータは、勾配法などのアプローチによって設定されるものとしてよい。
その結果、生成器47が、人工的なデータ列を生成するためにトレーニングされる。生成器47は、例えば、図1Aに示される生成モデル10a、10bとして使用可能である。
その結果、第1の態様の方法の、データ空間における複数のデータ列Xを取得するステップ32と、予め定められた分布における複数のサンプルに基づいた少なくとも1つの人工的なデータ列
Figure 2022089806000020
を生成するステップ33とを、図4Aに示されている機械学習のためのシステム45に従って実施することができる。
一例においては、識別器モデルに、(i)複数のサンプリングされたデータ列からのデータ列、又は、(ii)少なくとも1つの人工的なデータ列からの人工的なデータ列を入力するステップ34が、1つ又は複数の人工的なデータ列を、例えば、生成器47の出力から選択することによって、又は、真の入力サンプル14などの真の入力データからデータ列を選択することによって、実施される。
GAN識別器12、12aは、いくつかの潜在的な特徴(必ずしも解釈可能ではない)を抽出することによって動作し、これらの特徴を用いて、入力されたサンプルが真か、人工的であるか(生成器10a、47によって生成された)を判断する。生成器12aは、例えば、スコアとしての実数frnn(x1:T)を生成する。
スコアの正の値は、例えば、識別器12、12aが、このサンプルを真と判断していることを意味する。スコアの負の値は、例えば、識別器が、このサンプルを人工的(偽)であると判断していることを意味する。特徴抽出は、ニューラルネットワークによって実行され得る。
選択的に、スコアは、バイナリ値であるものとしてよく、この場合には、例えば、「1」は、「真」のサンプルを示し、「0」は、「偽」のサンプルを示す。
本明細書は、機械学習のためのモデルの識別フェーズにおいて、識別器モデルへの入力を真又は人工的(偽)のいずれかに分類すること35を目的とした、新たな識別器概念を提案する。
基本的な考え方は、GAN識別器に別個の関数モジュールfexp26を追加することである。この別個のモジュールは、エキスパート特徴などの追加情報を抽出し、これらを識別器スコアの構成要素として使用するように構成されている。これは、真のデータ列に近づく確率密度関数を有する人工的なデータ列を提供するために、識別器12、12aが生成器47をトレーニングすることを意味している。
図5は、第1の態様に従った機械学習のためのシステムの識別器12の例示的な構造を示している。識別器は、第1の関数12aと第2の関数26とを含む。第1の関数の複数の入力は、真のデータ列x1:T又は人工的なデータ列
Figure 2022089806000021
の複数の連続的なサンプルを含む。
Figure 2022089806000022
又はx1:Tの入力列が、概略的な目的において選択可能として図5に示されている。真のデータ列x1:T又は人工的なデータ列
Figure 2022089806000023
の間における選択を可能にする各データ操作関数が適用可能である。各人工的なデータ列
Figure 2022089806000024
又は真のデータ列x1:Tの入力されたサンプルが、直列シーケンス又はコントロールされた数のサンプルとして、又は、サンプルの並列ベクトルとして提供され得ることが仮定される。識別器12の第1の関数12aの入力時に、人工的なデータ列
Figure 2022089806000025
又はx1:Tの置換、混合又は畳み込みは、これらの連続した次元において行われない。換言すると、第1の関数12aの入力は、人工的なデータ列
Figure 2022089806000026
又はx1:Tの時間的な写しである。第2の関数26の少なくとも1つの入力は、人工的なデータ列の異なる位置から取られた、人工的なデータ列の少なくとも2つのサンプルを含む。
一例においては、識別器12の第2の関数26への入力は、生成器10の出力から取得され、ここでは、生成器10の出力の第1のサンプルと、隣接する、生成器10の出力の第2のサンプルとが結合される。
一例においては、識別器12の第2の関数26への入力は、生成器10の出力のみから取得される。一例においては、第2の関数26への入力は、時間にわたった環境条件c1:T(例えば、勾配又は速度制限)のサンプルを含まない。
一例においては、人工的なデータ列
Figure 2022089806000027
又はx1:Tの第1の部分集合は、人工的なデータ列
Figure 2022089806000028
又はx1:Tの第2の部分集合に対するオフセットにおいて第2の関数26へ入力される。一例においては、第1のサンプルの集合と第2のサンプルの集合との間のオフセットの値は、人工的なデータ列
Figure 2022089806000029
又は真のデータ列x1:Tの1つの要素、2つのサンプル、3つのサンプル又は4つのサンプルである。一例においては、人工的なデータ列
Figure 2022089806000030
又は真のデータ列x1:Tの第1の部分集合及び第2の部分集合が、その間のサンプルシフトを伴って第2の関数26に入力される。
一例においては、識別器の第1の関数12aは、自身の入力側において、少なくとも1つの人工的なデータ列
Figure 2022089806000031
と、任意選択的に一連の測定された環境条件とを取得する。識別器の第1の関数12aは、例えば、生成器10aからの人工的なデータ列と、一連の環境条件との組合せを取得することができる。
一例においては、識別器の第1の関数12aは、自身の入力側において、速度を表す人工的なデータ列
Figure 2022089806000032
又はx1:T少なくとも勾配及び/又は速度制限を表す一連の環境条件とを取得する。時間にわたった複数の連続的な環境条件は、速度を表す人工的なデータ列
Figure 2022089806000033
又はx1:Tの複数の連続的なサンプルにインデックス付けされる。
一例においては、データ列の要素及び人工的なデータ列の要素は、それぞれ時間列を表す(時間的に配列される)。他の例においては、データ列の要素及び人工的なデータ列の要素は、それぞれ距離に基づく列を表す(地図上の固定位置の基準点に関連して並べられる)。
一例においては、第2の関数は、自身の入力側において、環境条件を取得しない。
一例においては、第2の関数は、人工的なデータ列
Figure 2022089806000034
又はx1:Tに、エキスパート関数を適用する。
一実施形態によれば、第1の関数の入力は、識別器モデルへの入力の時間的にインデックス付けされた関数であり、第2の関数の入力は、識別器モデルへの入力の微分可能な関数である。
一実施形態によれば、第1の態様は、識別器ニューラルネットワークを用いて第1の関数の出力と第2の関数の出力とを結合することをさらに含む。
第1の関数は、リカレント・ニューラル・ネットワーク、任意選択的に長・短期記憶ネットワークである。
第2の関数は、少なくとも1つの人工的なデータ列の射影によって、さらに、射影された少なくとも1つの人工的なデータ列と、複数のデータ列のうちの少なくとも1つのデータ列との組合せに基づいた、識別器モデルの第2の関数の結果の取得によって得られる。
識別器ニューラルネットワークは、識別器モデルの第1の関数と第2の関数との線形結合を計算する。
一例においては、複数のデータ列に含まれるデータ列は、時間列又は距離列のいずれかである。複数の人工的なデータ列のうちの人工的なデータ列は、人工的な時間データ列又は人工的な距離データ列のいずれかである。
一例として、真のデータ列又は人工的なデータ列から結果として生じる分布からサンプリングされた一連の値を、追加情報又はエキスパート特徴として使用することができる。
一例として、真のデータ列又は人工的なデータ列(任意選択的に速度-加速度ヒストグラム)から結果として生じる分布からサンプリングされた一連の速度-加速度対を、追加情報又はエキスパート特徴として使用することができる。
速度-加速度ヒストグラムを表す分布から抽出されるサンプルによってエキスパート特徴が提供されるケースにおいては、識別器の第2の関数26は、次の形態を有する。即ち、データ列は、xを、時間ステップtにおける対象車両の速度として表す要素を含む。
Figure 2022089806000035
が時間ステップtにおける車両の加速度を表す、さらなるデータ列
Figure 2022089806000036
が、計算又は入力されるものとしてよい。識別器の第2の関数26は、次のように記述され得る。
Figure 2022089806000037
ここでは、
Figure 2022089806000038
は、エキスパート特徴を、少なくとも時間ステップの際に抽出し、一例においては、各時間ステップの際に抽出する。この例においては、時間ステップは、データ列の連続する要素間のステップによって表される。一例においては、射影関数26cは、エキスパート特徴の少なくとも1つのサンプルの射影
Figure 2022089806000039
を行い、識別を可能にする。
一例においては、識別器12の第2の関数26の入力は、生成器10の出力から取得され、ここでは、生成器10の出力のサンプルと、それに続く、生成器10の出力の第2のサンプルとが結合され、
Figure 2022089806000040
に従って射影される。
一例においては、識別器12の第2の関数26への各入力は、生成器10の出力から取得され、ここでは、生成器10の出力の各サンプルが、生成器10の出力の各第2のサンプルと結合される。
一例においては、識別器12の第2の関数26への各入力は、生成器10の出力から取得され、ここでは、生成器10の出力の各サンプルは、生成器出力の畳み込みである。
一例においては、識別器12の第2の関数26への少なくとも1つの入力は、人工的なデータ列
Figure 2022089806000041
又は真のデータ列x1:Tから取得される。一例においては、識別器12の第2の関数26への少なくとも1つの入力は、データ空間Xから取得されるデータ列から取得される。一例においては、識別器12の第2の関数26への入力は、人工的なデータ列
Figure 2022089806000042
と、データ空間Xから取得されるデータ列との混合物として取得される。
一例においては、識別器の第2の関数26は、自身の入力のうちの少なくとも1つの入力にエキスパート関数(e(.))を適用する。生成器10の出力に基づいて、エキスパート関数(e(.))は、例えば、単位時間あたりの整数の車両停止回数、所定の速度までの車両加速の持続時間、所定の速度までの車両減速の持続時間、ゼロ速度までの車両減速の持続時間、経路湾曲に対する車両速度、経路傾斜に対する車両速度、総走行持続時間に対する車両速度、単位時間あたりの整数のギアチェンジ回数、予め定められた速度を達成するためのギアチェンジ機能、ゼロ速度を達成するためのギアチェンジ機能、経路湾曲に対するギアチェンジ機能、経路傾斜に対するギアチェンジ機能、総走行持続時間に対するギアチェンジ機能の1つ又は複数を評価することができる。
上述した例の効果は、モデル全体をトレーニングする際に、識別器12(換言すると、分類器)が、偽の速度-加速度対の分布と真の速度-加速度対の分布とを区別することを学習することである。暗黙的に、識別器は、所与の入力に対して、両者のうちのどちらがより可能性があるかを見出すために、真のサンプル及び偽のサンプルのデータ密度を構築する。
一実施形態においては、識別器モデルの第2の関数は、車両速度を表す少なくとも1つのデータ列と、人工的な車両速度を表す少なくとも1つの人工的なデータ列とに基づいて、真のデータ列又は人工的なデータ列から結果として生じる分布からサンプリングするように構成されている。
一実施形態においては、識別器モデルの第2の関数は、車両速度を表す少なくとも1つの人工的なデータ列に基づいて、ゼロ速度において費やされた時間を評価するように構成されている。
一実施形態においては、複数のデータ列は、経路を走行する車両の一連の速度、エンジン温度、エンジン回転数、ペダル位置、舵角又はギアチェンジ機能の少なくとも1つを含む車両の複数の動作プロファイルを記述し、識別器モデルの第2の関数への入力は、真のデータ列又は人工的なデータ列から結果として生じる分布からサンプリングされた一連の値からサンプリングされる複数の速度-加速度対を含む。
一実施形態においては、複数のデータ列は、自律型又は半自律型のロボットのアクチュエータの一連の変位、一連の速度又は一連の位置のうちの少なくとも1つを含む、自律型又は半自律型のロボットの複数の動作プロファイルを記述する。
一実施形態によれば、第2の関数は、少なくとも1つの人工的なデータ列の射影によって、さらに、射影された少なくとも1つの人工的なデータ列と、複数のデータ列のうちの少なくとも1つのデータ列との組合せに基づいた、識別器モデルの第2の関数の結果の取得によって得られる。
一実施形態によれば、識別器モデルの第2の関数は、複数の人工的なデータ列のサンプルのうちの1つ又は複数のサンプルを射影することによって、識別器スコアに寄与するように構成されている。
一実施形態においては、D=1である。このケースにおいては、fprojの出力を、単一の時間ステップにおけるエキスパート特徴に対する識別出力とみなすことができる。例えば、D=1の場合、単一の時間ステップにおける速度-加速度対の識別出力が取得される。一実施形態においては、Dは、(複数の時間ステップにわたったエキスパート特徴の混合を可能にするために)より充実した表現のために、1より大きいものとしてよい。
一例においては、fproj射影関数は、多層パーセプトロンの一連の密な層として実装され得る。
一例においては、fproj射影関数は、入力を第2の関数のビンに射影するために手作業により作成されるものとしてよい。一例においては、fproj射影関数は、入力を第2の関数のエキスパート特徴のビンに射影するために手作業により作成されるものとしてよい。一例においては、fproj射影関数は、真のデータ列又は人工的なデータ列、例えば、速度-加速度ヒストグラムから結果として生じる分布からサンプリングされる一連の値を表す分布のビンに入力を射影するために手作業により作成されるものとしてよい。
多くの車両経路は、ゼロに等しい速度と共に開始される。従って、一例においては、第1の時間ステップの速度は、ゼロであると仮定され、加速度は、後続の総ての時間ステップにおいて計算されるものとしてよい。
この射影関数fprojの出力は、任意選択的に平均値形成ユニット26bにおいて平均化されるものとしてよく、これによって、識別器12の第2のエキスパート関数26(エキスパートユニット)の最終的な識別fexp(x1:T)を取得することができる。
図6は、cGANにおいて使用される、機械学習のためのシステムの識別器12の詳細な実施形態の例を示している。図6の部分28に示されている生成器10cが基準として設けられている。識別器12は、図6の部分29に示されている。識別器12は、少なくとも第1の関数12aと第2の関数26とを含む。
一例においては、識別器12は、cGANに代えてGANに適用される。このケースにおいては、図6に示されている環境変数(c,c,c)は不要である。このケースは、図6には図示されていない。
従って、生成器10aは、人工的なデータ列から、例えば一連の速度から複数のサンプルを生成する。識別器12の第1の関数12aが、時間に対して参照されている。第2の関数26が一連の速度から加速度を計算する特定のケースにおいては、図6に示されているように、隣接する時間ステップの対から加速度が計算され、第2の関数26への入力が予め定められた順序により抽出される。加速度
Figure 2022089806000043
は、恣意的な値に設定されるものとしてよく、例えば、
Figure 2022089806000044
である。
第2の関数が加速度をベースにしていない他のケースにおいては、識別器の第2の関数26は、時間構造に関連しないものとしてよい。図示の例においては、第2の関数26は、速度から加速度を計算し、fexp(x1:T)を計算する。当業者は、第2の関数26によって、多くの他の関数が、データ列又は人工的なデータ列の時間構造に関連して又は関連せずに計算され得ることを理解するであろう。第2の関数26の目的は、識別装置に特定の車両特性又はロボット特性に関するエキスパート情報が与えられることが保証されることによって、複数の人工的なデータ列がより現実的になることを可能にすることである。
一実施形態によれば、機械学習のためのトレーニングされた生成モデルは、識別器モデルにおいて第2の関数を用いずに生成される複数の人工的なデータ列の統計的な分布に比較して、複数のデータ列の統計的な分布により類似した統計的な分布を有する複数の人工的なデータ列を生成するために構成されている。
第1の関数12aの出力と第2の関数26の出力とが、結合ブロック27において統合される。これは、任意選択的に、射影Φ(.)及びΨ(.)の適用後に行われる。任意選択的に、射影Φ(.)及びΨ(.)を多層パーセプトロンMLPによって実行することができる。任意選択的に、結合ブロック27は、シグモイド関数又は線形結合又は他の形態のニューラルネットワークであるものとしてよい。
一実施形態によれば、識別器モデルの出力は、
Figure 2022089806000045
によって規定され、ここでは、frnn(x1:T)は、第1の関数であり、fexp(x1:T)は、第2の関数であり、Φ(.)及びΨ(.)は、任意選択的に多層パーセプトロンとして実行される射影である。
上述の例は、速度-加速度ヒストグラムを表す分布からサンプリングするように構成されている識別器12における第2の関数26の使用を考察している。
第2の例は、排気シミュレーション又は負荷収集分析のための車両速度生成に関連して論述される。
第2の例においては、車両の速度は、放出又は種々の車両構成要素における負荷の変更を目的として生成される。このようにして生成されたデータを用いて、乗用車が走行中に使用可能なモデルをトレーニングすることができる。実際には、燃費、排気特性、エネルギ需要、又は、ポンプ若しくはブレーキなどの車両部品における摩耗をリアルタイムで特徴付けるために、このようなモデルがトレーニングされることとなる。
この例においては、目標変数は、速度の時間列である。この例においては、識別器12の第2の関数26は、分布からサンプリングされる一連の値であり、この分布は、総走行時間に対する、ゼロ速度において費やされた時間の真のデータ列又は人工的なデータ列から結果として生じる。ゼロ速度において費やされた複数のエピソードを含む車両走行は、開始から終了までの間、実質的に一定の速度のままである車両走行に比較して、より高い放出を示す又はより多くの部品摩耗を引き起こすので、これは有利である。
識別器12の第2の関数26の例示的な実行は、このケースにおいては、次のようになる。
Figure 2022089806000046
この和の中の項は、ゼロ速度を1にマッピングし、ゼロでない各速度をほぼゼロにマッピングする(負ではない速度しか生じないことを前提条件とする)。温度は、基準値1を取るが、ステップ関数のより急峻な近似を得るために増加させることができる。このようなケースにおいては、温度は、シグモイド関数に特有の用語であり、車両のエンジン温度に関係していない。関数ρ(.)は、入力(ゼロ速度において費やされる時間及び総走行時間)を、識別のために、特徴空間にマッピングする。一例においては、ρ(.)は、多層パーセプトロンであるものとしてよい。
従って、異なる適用に対応するために、識別器の第2の関数26の構成の2つの詳細な例が提示されている。しかし、当業者は、適用分野に関連する統計的スキューの多くの事例に対処するために、識別器の第2の関数26が構成され得ることを理解するであろう。
一実施形態によれば、識別器モデルの第2の関数は、分布からサンプリングされた一連の値をサンプリングするために構成されている。この分布は、真のデータ列又は人工的なデータ列、例えば、それに基づいて速度-加速度ヒストグラムを提供するために車両速度を表す少なくとも1つの人工的なデータ列から結果として生じる。
一実施形態によれば、識別器モデルの第2の関数は、車両速度を表す少なくとも1つの人工的なデータ列に基づいて、ゼロ速度において費やされる時間を評価するように構成されている。
一実施形態によれば、複数のデータ列は、経路を走行する車両の一連の速度、エンジン温度、エンジン回転数、ペダル位置、舵角又はギアチェンジ機能の少なくとも1つを含む車両の複数の動作プロファイルを記述し、識別器モデルの第2の関数への入力は、速度-加速度関数を表す分布を有している真のデータ列又は人工的なデータ列から結果として生じる一連の値からサンプリングされている。
図6の例は、適用を車両速度軌跡とみなしており、第2の関数26(エキスパート特徴)は、速度-加速度ヒストグラムを表す分布を有している真のデータ又は人工的なデータから結果として生じる一連の値からサンプリングされるべきであるが、この設定を、他の環境変数cなどの多くの特徴に拡張することができる。
一例においては、識別器12の第2の関数26は(存在する場合には)、fexp(x1:T)を微分可能に符号化すべきである。
識別器にさらなるエキスパート特徴を追加する、識別器のさらなる関数が、同様に、第2の関数26に追加されるものとしてよい。例えば、識別器12は、第3の関数、第4の関数、第5の関数及び第6の関数を含むものとしてよく、このケースにおいては、関数r(.)を実行する結合ブロック27は、任意の第3の関数、第4の関数、第5の関数及び第6の関数を結合するために変更されなければならない。識別器12の第2の関数26は(存在する場合には)、fexp(x1:T)を微分可能に符号化すべきである。
一例においては、識別器12の第2の関数26への入力は、微分可能である。
一実施形態によれば、識別器モデルの第2の関数への入力は、次のもののうちの1つ又は複数を規定する。即ち、(i)単位時間あたりの整数の車両停止回数、(ii)所定の速度までの車両加速の持続時間、(iii)所定の速度までの車両減速の持続時間、(iv)ゼロ速度までの車両減速の持続時間、(v)経路湾曲に対する車両速度、(vi)経路傾斜に対する車両速度、(vii)総走行持続時間に対する車両速度、(viii)単位時間あたりの整数のギアチェンジ回数、(ix)予め定められた速度を達成するためのギアチェンジ機能、(x)ゼロ速度を達成するためのギアチェンジ機能、(xi)経路湾曲に対するギアチェンジ機能、(xii)経路傾斜に対するギアチェンジ機能、(xiii)総走行持続時間に対するギアチェンジ機能、のうちの1つ又は複数を規定する。
第2の関数26の変形を、最適化反復の評価指標として使用することができる。GAN(cGAN)をトレーニングするためのエキスパート特徴の使用に加えて、第2の関数26を用いることが可能であり、これによって、機械学習のためのモデルの生成された出力の質を評価することができる。このような評価ステップに、微分不可能なエキスパート特徴又は微分不可能な関数、例えばランダムフォレスト分類器を使用することもできる。
このようにして、これらの特徴は、トレーニングされたモデルの停止基準としても機能する。停止基準を、モデルの質を評価するために使用することができるが、トレーニングプロセスをガイドすることもでき、停止基準が所望の閾値を下回った場合にトレーニング手順の早期停止を可能にする。エキスパート特徴に基づく停止基準がない場合には、GANの損失関数が変動することが多いため、そのような手順は不可能である。
一実施形態によれば、生成器モデルの反復的なトレーニングの停止のステップは、停止基準を使用して提供され、ここでは、停止基準は、生成器モデルの反復によって、識別器モデルの第2の関数を使用して生成された少なくとも1つの人工的なデータ列を評価することによって取得され、ここでは、第2の関数は、停止基準を出力する。
トレーニングプロセスの停止のために、識別器12の第2の関数26を使用する第1の例として、排気シミュレーション又は負荷収集分析(部品摩耗)のための車両速度生成のケースが考察される。
車両の速度は、排気又は種々の車両構成部分における負荷をモデリングするために生成される。目標変数は、速度の時間列である。識別器12の第2の関数26は、対象の車両又はシナリオに対する速度-加速度ヒストグラムを表す分布からサンプリングするように構成されている。評価指標は、真の時間列サンプル及び人工的な時間列サンプルのセットを得ることによって得られる。速度軌跡のクラス(真対人工的)を予測するために、分類モデル(ランダムフォレストなど)がトレーニングされる。
良好にトレーニングされたモデルにおいては、2つの選択肢の間の分類の精度は、ほぼランダム、即ち、50%であるべきである。
識別器のトレーニング及び生成器のトレーニングの進行中のこの精度の追跡は、生成器10の性能の良好なインジケータも提供する。
識別器12の第2の関数26を評価指標として用いる他の例においては、同様に、排気シミュレーション又は負荷収集分析(部品摩耗)のための車両速度生成のケースが考察される。
トレーニングプロセスの停止のために識別器12の第2の関数26が使用される第1の例として、排気シミュレーション又は負荷収集分析(部品摩耗)のための車両速度生成のケースが考察される。
排気又は種々の車両構成部分における負荷をモデリングするために、車両の速度が生成される。目標変数は、速度の時間列である。識別器12の第2の関数26は、対象の車両又はシナリオに対する、ゼロ速度において費やされる時間を取得するように構成されている。
評価指標は、速度の真のデータ列及び人工的なデータ列に対する、ゼロ速度において費やされる時間の平均偏差及び標準偏差である。良好にトレーニングされたモデルにおいては、これらの指標は、速度の真のデータ列と人工的なデータ列とに対して同等であるべきである。平均偏差及び標準偏差に加えて、他の指標(又は測定値)を、確率分布の比較のために使用することができる(例えば、KLダイバージェンス)。
第1の態様の方法に従ってトレーニングされる、機械学習のためのモデルが、GAN又はcGANであることは、必須ではない。生成器を有している、敵対的機械学習のための各モデルを適用することができる。第2の関数26を含む識別器を含む敵対的オートエンコーダが提供され得る。従って、一実施形態においては、第1の態様に従った機械学習のための生成モデルは、GAN、条件付きGAN又は敵対的オートエンコーダのうちの1つである。
第2の態様によれば、機械学習のための生成モデルを使用して、車両又はロボットの人工的な動作プロファイルを表す、人工的なデータサンプルを生成するためのコンピュータ実装された方法が提供される。この方法は、
・第1の態様の方法に従って取得された複数のモデルパラメータに従って、機械学習のための生成モデルを構成することと、
・疑似ランダムベクトルを提供するために構成されている分布からサンプリングすることによって、複数のサンプルを取得することと、
・データ空間内においてさらなる複数の人工的なデータサンプルを取得するために、この分布の複数のサンプルを復号化することと、
・車両又はロボットの人工的な動作プロファイルを表す、さらなる複数の人工的なデータサンプルを出力することと、
を含む。
図3Bは、第2の態様に従って、機械学習のための生成モデルを使用して、車両の人工的な動作プロファイルを表す人工的なデータサンプルを生成するためのコンピュータ実装された方法を示している。
図4Bは、人工的なデータ列を生成する間に使用可能な、データ生成器49の例示的な構造を示している。
サンプル生成器48は、予め定められた確率分布からノイズ(z1:T)をサンプリングする。確率密度を、例えば、密度推定器を使用して求めることができる。これは、例えば、密度推定器が図4Aにおいてトレーニングされたように、1つ又は複数の時間ステップにおける求められたノイズ(z1:T)の関数として求められることによって行われる。トレーニングされた(以下において説明されるように、エキスパート入力を実行する第2の関数26を有する識別器に対して敵対的にトレーニングされた)生成器47は、ランダムに、サンプルを、1つ又は複数の時間ステップにおける求められたノイズ(z1:T)から抽出する。生成器47は、トレーニング中に取得された生成器47のパラメータと、1つ又は複数の時間ステップにおける求められたノイズ(z1:T)のサンプルとに基づいて、人工的なデータ列
Figure 2022089806000047
を生成する。
生成器47は、例えば、第1の態様に従って前もってトレーニングされている。これは、識別器における第2の関数26の敵対的トレーニングへの適用を含む。第2の関数26は、特定の技術要件に基づいて、一例においては、速度-加速度ヒストグラムに基づいて、識別器がテストする分布に影響を与える。従って、第2の態様に従って生成された人工的なデータ列は、現実の世界のデータをより忠実に再現する。
一例によれば、第2の態様に従って生成されたプロファイルは、排気をシミュレートするために、また、排気基準の準拠のための確率論的評価のために、使用される。
一例によれば、生成された速度プロファイルは、ソフトウェアアプリケーションを最適化するために使用される。
一例によれば、生成された速度プロファイルは、車両の排気をシミュレーションするために使用される。一例においては、生成された速度プロファイル及び/又はシミュレートされた車両排気は、車両構成部分(内燃機関など)又は車両全体のソフトウェア表現(デジタルツインとも称される)に適用されるものとしてよい。ソフトウェア表現は、入力された速度プロファイルに従って、車両又は車両の構成部分の種々の部分を最適化するように構成されるものとしてよい。内燃機関又はギアボックス部品のサイズ、レイアウト及び構成部分構成を、本当の使用ケースの改善された精度を有する、生成された速度プロファイルに基づいて、車両又は車両の構成部分のソフトウェア表現を使用して変更することができる。従って、第1の態様に従ってトレーニングされた、機械学習のためのモデルの適用によって、結果として、車両又はロボットに含まれる技術的な構成部分の具体的なコンセプト変更が生じる。
一例によれば、所与の経路が実際の運転行動に関連しているか否かを判断するために、潜在的な速度プロファイルを評価するために、第2の関数26を含む識別器12が適用可能である。
一例によれば、第2の態様に従ったデータ生成方法は、車両の耐用年数の間に、ポンプなどの車両の個々の構成部分の負荷(摩耗)を判断するために使用される。
一例によれば、第2の態様に従ったデータ生成方法は、車両の走行時に適用可能である。エンジン制御ユニットは、第2の態様に従って速度プロファイルを生成することができる。選択的に、エンジン制御ユニットは、メモリから、予め生成されている、第2の態様に従って計算された速度プロファイルを取得することができる。エンジン制御ユニットは、生成された速度プロファイルに関連してエンジン命令を制御することができる。
一例によれば、第2の態様のデータ生成方法は、速度プロファイル又は加速度プロファイルを取得することができる。速度プロファイル又は加速度プロファイルは、電動車両のバッテリの空き容量、ハイブリッド車両の走行管理、回生制動システムの回生管理を規定する軌跡を生成するために、又は、電動自転車のバッテリ管理を改善するために使用されるものとしてよい。
第3の態様によれば、車両の動作プロファイルをモデリングする機械学習のためのさらなるモデルをトレーニングするためのコンピュータ実装された方法が提供され、この方法は、
・第2の態様のコンピュータ実装された方法に従って生成された車両の人工的な動作プロファイルを表す、さらなる複数の人工的なデータ列を取得することと、
・車両の人工的な動作プロファイルを表す、さらなる複数の人工的なデータ列を、機械学習のためのさらなるモデルに入力することと、
・機械学習のためのさらなるモデルを反復的にトレーニングすることと、
・車両の動作プロファイルをモデリングする機械学習のためのさらなるモデルのさらなる複数のモデルパラメータを出力することと、
を含む。
第2の態様に従った人工的なサンプルを生成するためのコンピュータ実装された方法によって生成されたデータは、第1の態様の方法に従ってGAN又はcGANをトレーニングする際に、識別器12の少なくとも第2の関数26の効果に起因して、より現実的である。従って、第2の態様の方法に従って生成された人工的なデータが、第3の態様において、機械学習のためのさらなるモデルをトレーニングするために使用される。
第3の態様に従ってトレーニングされた、機械学習のためのさらなるモデルが、GAN又はcGANであることは、必須ではない。トレーニング用にデータを必要とする機械学習のための各モデルが、第2の態様の方法に従って生成された人工的なデータを使用することができる。1つの効果は、より正確に、機械学習のためのさらなるモデルがトレーニングされることである。なぜなら、自身のトレーニングに使用される人工的なデータが、敵対的モデルに従って生成されるからである。この敵対的モデルは、識別器にエキスパートデータを適用する第2の関数26を有する識別器12を有している。
第4の態様によれば、メモリに格納されている生成器モデル及び識別器モデルの敵対的トレーニングを含む、車両又はロボットの動作プロファイルをモデリングする機械学習のための生成モデルをトレーニングするための装置が提供される。この装置は、データ空間から複数のデータ列を取得するように構成されている入力インタフェースを含み、ここで、各データ列は、車両の少なくとも1つの動作プロファイルを記述する。この装置はさらに、機械学習のための生成モデルのトレーニング時の少なくとも1つの生成フェーズの間に、分布からサンプリングすることによって少なくとも1つの人工的なデータ列を生成するように構成されているプロセッサを含む。
プロセッサは、機械学習のための生成モデルのトレーニング時の少なくとも1つの識別フェーズの間に、識別器モデルに、(i)取得された複数のデータ列からのデータ列、又は、(ii)少なくとも1つの人工的なデータ列からの人工的なデータ列を入力するように構成されている。
機械学習のための生成モデルのトレーニング時の少なくとも1つの識別フェーズの間に、プロセッサは、識別器モデルへの入力を、データ空間からのデータ列として、又は、少なくとも、識別器モデルの第1の関数及び第2の関数を使用した人工的なデータ列として、分類するように構成されている。
第1の関数の複数の入力は、人工的なデータ列の複数の連続的なサンプルを含み、第2の関数の少なくとも1つの入力は、人工的なデータ列の複数の異なるステップから得られた人工的なデータ列の少なくとも2つのデータサンプルを含む。
プロセッサは、トレーニングされた生成器モデルを含む、機械学習のためのトレーニングされたモデルを生成するために、機械学習のための生成モデルの生成器モデル及び識別器モデルを反復的にトレーニングするように構成されている。この装置は、機械学習のためのトレーニングされたモデルを出力するように構成されている出力インタフェースをさらに含む。
一例においては、装置50は、パーソナルコンピュータ、サーバ、クラウドに基づくサーバ、又は、組込型コンピュータである。物理プロセッサ上において処理が行われることは、必須ではない。例えば、同一のプロセッサ上の複数のプロセッサコア上において、又は、複数の異なるプロセッサにわたって、処理タスクの分割が行われる。プロセッサは、Hadoop(登録商標)クラスタであるものとしてよく、又は、商用クラウド処理サービス上に提供されるものとしてよい。一部の処理は、非従来的な処理ハードウェア上において、例えば、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、1つ又は複数のグラフィカルプロセッサ、機械学習のための特定用途向けプロセッサなどの上において実行されるものとしてよい。
装置50のメモリ58は、プロセッサ54によって実行された場合に、第1の態様、第2の態様又は第3の態様に従ったコンピュータ実装された方法により記述される機能をプロセッサ54に実行させるためのコンピュータプログラムを格納している。
一例によれば、入力インタフェース52及び/又は出力インタフェースは、USBインタフェース、イーサネットインタフェース、WLANインタフェース又は装置50からのデータサンプルの入力及び出力を可能にすることができる他の適当なハードウェアのうちの1つである。
一例においては、装置50は、入力インタフェース52から入力データとして入力コメントを受け取るように構成されている揮発性メモリシステム58及び/又は不揮発性メモリシステム58をさらに含む。
一例においては、装置50は、車両に含まれる自動車組込型コンピュータであり、このケースにおいては、自動車組込型コンピュータは、車両内に設けられているセンサ及びアクチュエータと接続されるものとしてよい。装置50の入力インタフェース52は、例えば、速度データ、燃費データ、バッテリデータ、位置データなどを提供するエンジンコントロールユニットECUの1つ又は複数と接続されるものとしてよい。装置50の出力インタフェース56は、例えば、複数のブレーキアクチュエータ、スロットルアクチュエータ、燃料混合アクチュエータ又は燃料空気混合アクチュエータ、ターボチャージャ制御デバイス、バッテリ管理システム、車両照明又はエンタテイメントシステムなどの1つ又は複数と接続されるものとしてよい。
第5の態様によれば、1つ又は複数のコンピュータプログラム要素が提供され、このコンピュータプログラム要素は、少なくとも、
(i)機械学習のための使用の下における、第1の態様の方法又はその実施形態に従った機械学習のための生成モデルをトレーニングするためのコンピュータ実行可能な命令、及び/又は、
(ii)第3の態様に従った人工的なデータ列の生成のためのコンピュータ実行可能な命令、及び/又は、
(iii)第1の態様又はその実施形態に従ってトレーニングされる機械学習のための生成モデルを提供するためのモデルパラメータを含むコンピュータ実行可能な命令
を含む。
第5の態様のコンピュータプログラム要素は、例えば、コンピュータメモリに格納可能な機械可読命令を含むものとしてよい。
第6の態様によれば、第5の態様のコンピュータプログラム要素のうちの1つ又は複数を含むコンピュータ可読媒体が提供される。
図8は、第7の態様に従った車両を概略的に示しており、車両には制御デバイスが設置されており、この制御デバイスは、第1の態様に従ってトレーニングされているモデルを適用するように構成されている。
第7の態様によれば、車両60が提供され、この車両60は、車両60を動作させるために駆動力を提供するように構成されている原動機61と、複数のセンサ62a、62bと、少なくとも原動機61をセンサ62a、62bからのフィードバックに基づいて制御するように構成されている車両エレクトロニクスユニット63とを含む。車両エレクトロニクスユニット63は、第2の態様に従って、少なくとも1つの動作プロファイルに応答するトレーニングされたモデルをインスタンス化し、実施するように構成されているプロセッサを含む。
トレーニングされたモデルは、センサ62a、62bからの入力信号を受信し、入力信号をトレーニングされたモデルに適用するように構成されている。プロセッサは、トレーニングされたモデルを用いて、1つ又は複数の応答信号を計算するように構成されている。プロセッサは、トレーニングされたモデルを介して取得された応答信号への応答として、1つ又は複数の原動機61又は車両60の他の出力アクチュエータの構成を適合させるように構成されている。
一実施形態によれば、原動機61は、燃料システム及び排気システムと結合されている内燃機関、又は、バッテリと結合されている電気モータ若しくはハイブリッドパワートレインであるものとしてよい。
車両の動作プロファイルは、有利には、車両の複数のセンサ62a、62bによって検出可能な、又は、車両の複数のセンサ62a、62bから導出可能な次の変数のうちの1つ、いくつか又は総てを含み得る。即ち、車両のアクセルペダル位置、車両のブレーキペダル位置、車両の変速機のクラッチの位置、変速機の歯車、車両の速度、車両の走行抵抗、内燃機関の牽引力、車両の電動駆動機の牽引力、内燃機関の構成部分の回転数、内燃機関の単位時間あたりの吸気量、内燃機関の吸気マニホールド内の圧力、高圧EGR(排気再循環)の量、低圧EGRの量、吸気弁の閉弁のタイミング、排気弁の開弁のタイミング、内燃機関の圧縮変更システムの位置、噴射部の噴射タイミング、高圧燃料蓄圧器(コモンレール)内の圧力、内燃機関の冷却液温度又は内燃機関の吸気系内の温度、のうちの1つ、いくつか又は総てを含み得る。
モデルに適用可能なさらなるパラメータ、又は、トレーニング中に考慮され得るパラメータには、車両の質量、車両の変速比、車両の駆動システムの最大駆動力、駆動システムの最大トルク、変速機のタイプ、燃料のタイプ、ハイブリッド化の仕様、エンジンのタイプ指定、車両のタイプ指定、走行経路の特徴、例えば、GPS記録、環境温度、勾配パラメータ、環境圧力が含まれる。
トレーニングされたモデルは、例えば、走行中に使用可能であり、これによって、潜在的な将来の排気をシミュレーションするために、検出された速度プロファイルを使用することができ、これによって、車両エレクトロニクスユニット63は、車両の排気が規定された所定の制限を絶対に超過しないことを保証するために、原動機61に制御命令が提供されることを保証するために、原動機61のアクチュエータを設定することができる。他の例においては、トレーニングされたモデルは、ポンプ又はブレーキディスクなどの構成部分における摩耗の負荷シナリオを動作中に予測するために、走行中に使用可能である。
図面に示され、上述の説明に記載された例は、本開示のコンセプトの理解に役立てる目的のものである。従って、本開示の保護範囲の限定を意図するものではない。本開示は、図示された例の変更及び修正を説明するものである。有利な例のみが提示されており、本開示の保護範囲内における総ての変更、修正及びさらなる適用が保護されるべきである。

Claims (15)

  1. 生成器モデル及び識別器モデルの敵対的トレーニングを含む、車両又はロボットの動作プロファイルをモデリングする機械学習のための生成モデルをトレーニングするためのコンピュータ実装された方法(30)であって、前記方法は、
    ・データ空間から複数のデータ列を取得すること(32)を含み、ここで、各データ列は、車両又はロボットの少なくとも1つの動作プロファイルを記述し、
    ・機械学習のための前記生成モデルのトレーニング時の少なくとも1つの生成フェーズの間に、分布からサンプリングすることによって複数の人工的なデータ列を生成すること(33)を含み、
    ・機械学習のための前記生成モデルのトレーニング時の少なくとも1つの識別フェーズの間に、前記識別器モデルに、(i)取得された前記複数のデータ列からのデータ列、又は、(ii)前記複数の人工的なデータ列からの人工的なデータ列を入力すること(34)を含み、
    ・機械学習のための前記生成モデルのトレーニング時の少なくとも1つの識別フェーズの間に、前記識別器モデルへの入力を、前記データ空間からのデータ列として、又は、少なくとも、前記識別器モデルの第1の関数及び第2の関数を使用した人工的なデータ列として、分類すること(35)を含み、ここで、前記第1の関数(10)の複数の入力は、前記人工的なデータ列の複数の連続的なサンプルを含み、前記第2の関数(26)の少なくとも1つの入力は、前記人工的なデータ列の複数の異なるステップから得られた前記人工的なデータ列の少なくとも2つのデータサンプルを含み、
    ・トレーニングされた生成器モデルを含む、機械学習のためのトレーニングされたモデルを生成するために、機械学習のための前記生成モデルの前記生成器モデル及び前記識別器モデルを反復的にトレーニングすること(36)を含む、
    コンピュータ実装された方法(30)。
  2. 前記第1の関数の前記入力は、前記識別器モデルへの前記入力の時間的に積分された関数であり、前記第2の関数の前記入力は、前記識別器モデルへの前記入力の微分可能な関数である、
    請求項1に記載のコンピュータ実装された方法(30)。
  3. ・ニューラル識別器ネットワークを用いて前記第1の関数の前記出力と前記第2の関数の前記出力とを結合することをさらに含み、
    前記第1の関数は、リカレント・ニューラル・ネットワーク、任意選択的に長・短期記憶ネットワークであり、及び/又は、
    前記第2の関数は、前記人工的なデータ列のうちの少なくとも1つの人工的なデータ列の射影によって、さらに、射影された前記少なくとも1つの人工的なデータ列と、前記複数のデータ列のうちの少なくとも1つのデータ列との組合せに基づいた、前記識別器モデルの前記第2の関数の結果の取得によって得られ、
    前記ニューラル識別器ネットワークは、任意選択的に、前記識別器モデルの前記第1の関数と前記第2の関数との線形結合を計算する、
    請求項1又は2に記載のコンピュータ実装された方法(30)。
  4. 前記複数のデータ列に含まれる前記データ列は、時間列又は距離列のいずれかであり、前記複数の人工的なデータ列のうちの前記人工的なデータ列は、人工的な時間データ列又は人工的な距離データ列のいずれかである、
    請求項1乃至3のいずれか一項に記載のコンピュータ実装された方法(30)。
  5. 前記複数の人工的なデータ列を提供するために、前記少なくとも1つの生成フェーズにおいて潜在空間をサンプリングする、
    請求項1乃至4のいずれか一項に記載のコンピュータ実装された方法(30)。
  6. ・少なくとも1つの停止基準を使用して、前記生成器モデルの前記反復的なトレーニングを停止させることをさらに含み、前記少なくとも1つの停止基準を、前記生成器モデルの反復によって、前記識別器モデルの前記第2の関数を使用して生成された少なくとも1つの人工的なデータ列を評価することによって取得し、前記第2の関数は、前記停止基準を出力する、
    請求項1乃至5のいずれか一項に記載のコンピュータ実装された方法(30)。
  7. 前記識別器モデルの前記第2の関数を、車両速度を表す少なくとも1つのデータ列と人工的な車両速度を表す少なくとも1つの人工的なデータ列とに基づく真のデータ列又は人工的なデータ列から結果として生じる分布からサンプリングされた値の列上において評価する、又は、
    前記識別器モデルの前記第2の関数は、車両速度を表す少なくとも1つの人工的なデータ列に基づいて、ゼロ速度において費やされた時間を評価するように構成されている、又は、
    前記複数のデータ列は、経路を走行する車両の一連の速度、エンジン温度、エンジン回転数、ペダル位置、舵角又はギアチェンジ機能のうちの少なくとも1つを含む、車両の複数の動作プロファイルを記述し、前記識別器モデルの前記第2の関数への前記入力は、速度-加速度ヒストグラムからサンプリングされる複数の速度-加速度対を含む、又は、
    前記複数のデータ列は、自律型又は半自律型のロボットのアクチュエータの一連の変位、一連の速度又は一連の位置のうちの少なくとも1つを含む、前記自律型又は半自律型のロボットの複数の動作プロファイルを記述する、
    請求項1乃至6のいずれか一項に記載のコンピュータ実装された方法(30)。
  8. 前記識別器モデルの前記出力は、
    Figure 2022089806000048
    によって規定され、ここで、frnn(x1:T)は、第1の関数であり、fexp(x1:T)は、第2の関数であり、Φ(.)及びΨ(.)は、任意選択的に多層パーセプトロンとして実行される射影である、
    請求項1乃至7のいずれか一項に記載のコンピュータ実装された方法(30)。
  9. 前記識別器モデルの前記第2の関数に入力される前記データ列は、単位時間あたりの整数の車両停止回数、所定の速度までの車両加速の持続時間、所定の速度までの車両減速の持続時間、ゼロ速度までの車両減速の持続時間、経路湾曲に対する車両速度、経路傾斜に対する車両速度、総走行持続時間に対する車両速度、単位時間あたりの整数のギアチェンジ回数、予め定められた速度を達成するためのギアチェンジ機能、ゼロ速度を達成するためのギアチェンジ機能、経路湾曲に対するギアチェンジ機能、経路傾斜に対するギアチェンジ機能、総走行持続時間に対するギアチェンジ機能、ロボットのアクチュエータの位置のうちの1つ又は複数を規定する、
    請求項1乃至8のいずれか一項に記載のコンピュータ実装された方法(30)。
  10. 機械学習のためのトレーニングされた前記生成モデルは、前記識別器モデルにおいて前記第2の関数を用いずに生成される複数の人工的なデータ列の統計的な分布に比較して、前記複数のデータ列の統計的な分布により類似した統計的な分布を有する複数の人工的なデータ列を生成するために構成されている、
    請求項1乃至9のいずれか一項に記載のコンピュータ実装された方法(30)。
  11. 機械学習のための生成モデルを使用して、車両又はロボットの人工的な動作プロファイルを表す、人工的なデータサンプルを生成するためのコンピュータ実装された方法(30)であって、
    ・請求項1乃至10のいずれか一項に記載の方法に従って取得された複数のモデルパラメータに従って、機械学習のための生成モデルを構成することと、
    ・疑似ランダムベクトルを提供するために構成されている分布からサンプリングすることによって、複数のサンプルを取得することと、
    ・データ空間内においてさらなる複数の人工的なデータサンプルを取得するために、前記分布の前記複数のサンプルを復号化することと、
    ・車両又はロボットの前記人工的な動作プロファイルを表す、前記さらなる複数の人工的なデータサンプルを出力することと、
    を含む、コンピュータ実装された方法(30)。
  12. メモリに格納されている生成器モデル及び識別器モデルの敵対的トレーニングを含む、車両又はロボットの動作プロファイルをモデリングする機械学習のための生成モデルをトレーニングするための装置(50)であって、前記装置は、
    ・データ空間から複数のデータ列を取得するように構成されている入力インタフェース(52)を含み、ここで、各データ列は、車両又はロボットの少なくとも1つの動作プロファイルを記述し、
    ・機械学習のための前記生成モデルのトレーニング時の少なくとも1つの生成フェーズの間に、分布からサンプリングすることによって少なくとも1つの人工的なデータ列を生成するように構成されているプロセッサ(54)を含み、ここで、
    前記プロセッサは、機械学習のための前記生成モデルのトレーニング時の少なくとも1つの識別フェーズの間に、前記識別器モデルに、(i)取得された前記複数のデータ列からのデータ列、又は、(ii)前記少なくとも1つの人工的なデータ列からの人工的なデータ列を入力するように構成されており、
    前記プロセッサは、機械学習のための前記生成モデルのトレーニング時の前記少なくとも1つの識別フェーズの間に、前記識別器モデルへの前記入力を、前記データ空間からのデータ列として、又は、少なくとも、前記識別器モデルの第1の関数及び第2の関数を使用した人工的なデータ列として、分類するように構成されており、前記第1の関数の複数の入力は、前記人工的なデータ列の複数の連続的なサンプルを含み、前記第2の関数の少なくとも1つの入力は、前記人工的なデータ列の複数の異なるステップから得られた前記人工的なデータ列の少なくとも2つのデータサンプルを含み、
    前記プロセッサは、トレーニングされた生成器モデルを含む、機械学習のためのトレーニングされたモデルを生成するために、機械学習のための前記生成モデルの前記生成器モデル及び前記識別器モデルを反復的にトレーニングするように構成されており、
    前記装置は、
    ・機械学習のための前記トレーニングされたモデルを出力するように構成されている出力インタフェース(56)をさらに含む、
    装置(50)。
  13. 1つ又は複数のコンピュータプログラム要素であって、前記コンピュータプログラム要素は、少なくとも、
    (i)機械学習の使用の下における、請求項1乃至10のいずれか一項に記載の方法に従った機械学習のための生成モデルをトレーニングするためのコンピュータ実行可能な命令、及び/又は、
    (ii)請求項11に記載の人工的なデータ列の生成のためのコンピュータ実行可能な命令、及び/又は、
    (iii)請求項1乃至10のいずれか一項に従ってトレーニングされる機械学習のための生成モデルを提供するためのモデルパラメータを含むコンピュータ実行可能な命令
    を含む、1つ又は複数のコンピュータプログラム要素。
  14. 請求項13に記載のコンピュータプログラム要素のうちの1つ又は複数を含むコンピュータ可読媒体。
  15. 車両の動作プロファイルをモデリングする機械学習のためのさらなるモデルをトレーニングするためのコンピュータ実装された方法(40)であって、
    ・請求項11に記載のコンピュータ実装された方法に従って生成された車両の人工的な動作プロファイルを表す、さらなる複数の人工的なデータ列を取得すること(41)と、
    ・車両の前記人工的な動作プロファイルを表す、前記さらなる複数の人工的なデータ列を、機械学習のためのさらなるモデルに入力すること(42)と、
    ・機械学習のための前記さらなるモデルを反復的にトレーニングすること(43)と、
    ・車両の動作プロファイルをモデリングする機械学習のための前記さらなるモデルのさらなる複数のモデルパラメータを出力すること(44)と、
    を含む、コンピュータ実装された方法(40)。
JP2021197183A 2020-12-04 2021-12-03 車両の動作プロファイルのモデリング Pending JP2022089806A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102020215350.7A DE102020215350A1 (de) 2020-12-04 2020-12-04 Modellieren von betriebsprofilen eines fahrzeugs
DE102020215350.7 2020-12-04

Publications (1)

Publication Number Publication Date
JP2022089806A true JP2022089806A (ja) 2022-06-16

Family

ID=81655225

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021197183A Pending JP2022089806A (ja) 2020-12-04 2021-12-03 車両の動作プロファイルのモデリング

Country Status (5)

Country Link
US (1) US20220180249A1 (ja)
JP (1) JP2022089806A (ja)
KR (1) KR20220079478A (ja)
CN (1) CN114595508A (ja)
DE (1) DE102020215350A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7468726B1 (ja) 2023-02-16 2024-04-16 いすゞ自動車株式会社 データ生成装置及びデータ生成方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102019205520A1 (de) * 2019-04-16 2020-10-22 Robert Bosch Gmbh Verfahren zum Ermitteln von Fahrverläufen
EP3923210A1 (en) * 2020-06-01 2021-12-15 Replica Analytics Generation of synthetic data

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7468726B1 (ja) 2023-02-16 2024-04-16 いすゞ自動車株式会社 データ生成装置及びデータ生成方法

Also Published As

Publication number Publication date
US20220180249A1 (en) 2022-06-09
CN114595508A (zh) 2022-06-07
KR20220079478A (ko) 2022-06-13
DE102020215350A1 (de) 2022-06-09

Similar Documents

Publication Publication Date Title
JP2022089806A (ja) 車両の動作プロファイルのモデリング
Thibault et al. A unified approach for electric vehicles range maximization via eco-routing, eco-driving, and energy consumption prediction
CN107169567B (zh) 一种用于车辆自动驾驶的决策网络模型的生成方法及装置
US10632985B2 (en) Hybrid vehicle and method of predicting driving pattern in the same
Pourabdollah et al. Calibration and evaluation of car following models using real-world driving data
JP7053147B2 (ja) 自動車特に自動車の装置のエネルギー効率を分析するためのシステムおよび方法
Zeng et al. A parallel hybrid electric vehicle energy management strategy using stochastic model predictive control with road grade preview
CN106536315B (zh) 用于评价和/或优化车辆的运行特性的系统
JP2022504691A (ja) 接続および自動化された車両の予測最適制御を可能にするためのv2xデータ拡張に基づくニューラルネットワークを使用する車両速度予測器
US20190375421A1 (en) Systems and methods for prediction windows for optimal powertrain control
JP2017522212A (ja) 車両のエネルギー効率を分析するためのシステムおよび方法
Kuutti et al. End-to-end reinforcement learning for autonomous longitudinal control using advantage actor critic with temporal context
CN114556248A (zh) 用于确定传感器配置的方法
Song et al. Estimating the maximum road friction coefficient with uncertainty using deep learning
CN112406875B (zh) 一种车辆能耗的分析方法和装置
Ozkan et al. Modeling driver behavior in car-following interactions with automated and human-driven vehicles and energy efficiency evaluation
Norouzi et al. Integrating machine learning and model predictive control for automotive applications: A review and future directions
Koenig et al. Bridging the gap between open loop tests and statistical validation for highly automated driving
Donateo et al. Development of an energy management strategy for plug-in series hybrid electric vehicle based on the prediction of the future driving cycles by ICT technologies and optimized maps
George et al. Driving Range Estimation of Electric Vehicles using Deep Learning
Trinko et al. Application of pre-computed acceleration event control to improve fuel economy in hybrid electric vehicles
CN116861370B (zh) 用于井下防爆胶轮车的运动数据处理方法
Kan et al. A deep learning engine power model for estimating the fuel consumption of heavy-duty trucks
Lin et al. Safety verification of a data-driven adaptive cruise controller
Lian et al. Multiagent Deep Reinforcement Learning for Automated Truck Platooning Control