JP6564905B2 - 複合動的システムの最適化制御を提供するための方法およびシステム - Google Patents

複合動的システムの最適化制御を提供するための方法およびシステム Download PDF

Info

Publication number
JP6564905B2
JP6564905B2 JP2018092884A JP2018092884A JP6564905B2 JP 6564905 B2 JP6564905 B2 JP 6564905B2 JP 2018092884 A JP2018092884 A JP 2018092884A JP 2018092884 A JP2018092884 A JP 2018092884A JP 6564905 B2 JP6564905 B2 JP 6564905B2
Authority
JP
Japan
Prior art keywords
control
machine learning
vector
dynamic system
heuristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018092884A
Other languages
English (en)
Other versions
JP2018195307A (ja
Inventor
ハルトマン ディルク
ハルトマン ディルク
オープスト ビルギット
オープスト ビルギット
オロフ ヨハネス ヴァンナーベルク エリック
オロフ ヨハネス ヴァンナーベルク エリック
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Publication of JP2018195307A publication Critical patent/JP2018195307A/ja
Application granted granted Critical
Publication of JP6564905B2 publication Critical patent/JP6564905B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W50/06Improving the dynamic response of the control system, e.g. improving the speed of regulation or avoiding hunting or overshoot
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/048Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators using a predictor
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0221Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving a learning process
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/33Director till display
    • G05B2219/33037Learn parameters of network offline, not while controlling system
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/33Director till display
    • G05B2219/33041Structure optimization and learning of artificial neural network by genetic algorithm

Landscapes

  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Mechanical Engineering (AREA)
  • Transportation (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Feedback Control In General (AREA)

Description

本発明は、機械学習型の、シナリオに基づく制御ヒューリスティックスを用いて、車両などの複合動的システムの最適化制御を提供するための方法およびシステムに関する。
プラントまたは車両などのシステムは益々複雑化している。その結果、システムを制御する制御素子もさらに複雑化している。これは、対応する制御システムのプログラミングとコンフィギュレーションの要求の増加につながる。さらに、計算要求もより厳しくなり、システム制御実行の所要計算時間も実際に増加する。
したがって、本発明の目的は、非常に高効率であり、複合動的システムの制御を実行するための計算リソースがより少ない、複合動的システムを制御するための方法を提供することである。
この目的は、請求項1に記載の特徴を備えた、複合動的システムの最適化制御を実行するための方法によって、本発明の第1の態様に従って達成される。
本発明は、方法の第1の態様に従って、機械学習型の、シナリオに基づく制御ヒューリスティックスを用いた複合動的システムの最適化制御を実行するための方法を提供し、方法は、
前記動的システムの時間におけるシステム状態ベクトルを予測するためのシミュレーションモデルを、現在のシナリオパラメータベクトルと制御ベクトルに基づいて提供するステップと、
モデル予測制御MPCアルゴリズムを用いて、前記シミュレーションモデルを用いた動的システムのシミュレーション中に毎回、異なるシナリオパラメータベクトルおよび初期システム状態ベクトルに関する制御ベクトルを提供するステップと、
シナリオパラメータベクトルと初期システム状態ベクトルの各シミュレートされた組み合わせに関して、モデル予測制御MPCアルゴリズムにより結果の最適制御値を計算し、結果の最適制御値を保存するステップと、
機械学習アルゴリズムを用いて、保存された結果の最適制御値に関する対応するシナリオパラメータベクトルと初期システム状態ベクトルとの関係を近似する機械学習制御ヒューリスティックスを生成するステップと、
生成された機械学習制御ヒューリスティックスを用いて、前記シミュレーションモデルによってモデル化される複合動的システムを制御するステップと、
を含む。
本発明の第1の態様による方法の可能な一実施形態において、機械学習アルゴリズムはディフュージョンマップを用いる。
本発明の第1の態様による方法の別の可能な実施形態において、機械学習アルゴリズムは、動的システムを近似するための閉観測量を備えたディフュージョンマップを用いる。
本発明の第1の態様による方法の別の可能な実施形態において、機械学習アルゴリズムはサポートベクトルマシンを用いる。
本発明の第1の態様による方法のさらなる可能な実施形態において、生成された機械学習制御ヒューリスティックスはコントローラに転送され、コントローラは動的システムを、転送された機械学習制御ヒューリスティックスに従ってオンラインで制御する。
本発明の第1の態様による方法のもう1つの可能な実施形態において、機械学習制御ヒューリスティックスは、前記シミュレーションモデルによってモデル化される複合動的システムを制御するための近似ルールを含む。
本発明は、さらなる態様により、請求項7の特徴を備えた制御ヒューリスティック生成プラットフォームを提供する。
本発明は、第2の態様により、モデル記憶装置に記憶されたシミュレーションモデルfによってモデル化される動的システムを制御するために用いられ、動的システムの時間におけるシステム状態ベクトルを、現在のシナリオパラメータベクトルと制御ベクトルに基づいて予測するように適合された機械学習制御ヒューリスティックスを提供するための制御ヒューリスティック生成プラットフォームを提供し、前記制御ヒューリスティックス生成システムは、
モデル予測制御MPCアルゴリズムを用いて、前記シミュレーションモデルfを用いた前記動的システムのシミュレーション中に毎回、異なるシナリオパラメータベクトルおよび初期システム状態ベクトルに関して制御ベクトルを提供し、シナリオパラメータベクトルと初期システム状態ベクトルの各シミュレートされた組み合わせに関して、モデル予測制御MPCアルゴリズムにより、結果の最適制御値を計算し、結果の最適制御値をメモリに保存するように適合された第1の計算部と、
機械学習アルゴリズムを用いて、保存された結果の最適制御値に関する対応するシナリオパラメータベクトルと初期システム状態ベクトルとの関係を近似する機械学習制御ヒューリスティックスを生成するように適合された第2の計算部を含み、
生成された機械学習制御ヒューリスティックスは、前記制御ヒューリスティック生成プラットフォームのインターフェースを介して前記動的システムのコントローラに転送可能である。
本発明の第2の態様による制御ヒューリスティック生成プラットフォームの可能な実施形態において、制御ヒューリスティック生成プラットフォームは、クラウドプラットフォームとして実装される。
本発明の第2の態様による制御ヒューリスティック生成プラットフォームのさらなる可能な実施形態において、機械学習制御ヒューリスティックスは、前記シミュレーションモデルfによってモデル化される複合動的システムを制御するための近似ルールを備える。
本発明の第2の態様による制御ヒューリスティック生成プラットフォームのさらなる可能な実施形態において、動的システムは、転送された機械学習制御ヒューリスティックスに従ってコントローラによってオンラインで制御される車両を備える。
以下、本発明の第1の態様による複合動的システムの最適化制御を実行する方法と、本発明の第2の態様による制御ヒューリスティック生成プラットフォームの可能な実施形態を、添付図面を参照してより詳細に説明する。
本発明の一態様による制御ヒューリスティック生成プラットフォームの可能な代表的実施形態の模式図である。 動的システムを制御するためにコントローラによって用いられる機械学習制御ヒューリスティックスを提供する制御ヒューリスティック生成プラットフォームの可能な代表的実施形態を示すさらなる模式図である。 本発明の一態様による複合動的システムの最適化制御を実行するための方法の可能な代表的実施形態のフローチャートである。 本発明の一態様による複雑なシステムの最適化制御を実行するための方法の可能な代表的実施形態を示す図である。 本発明の一態様による複雑なシステムの最適化制御を実行するための方法の可能な代表的実施形態を示す図である。 本発明の一態様による複雑なシステムの最適化制御を実行するための方法の可能な代表的実施形態を示す図である。 本発明の一態様による複雑なシステムの最適化制御を実行するための方法の可能な代表的実施形態を示す図である。 本発明のシステムの可能なユースケースを示すモデル予測制御結果の図である。 図5のユースケースに関する可能なシステムの応答を示す図である。
図1の代表的実施形態に見られるように、本発明の一態様による制御ヒューリスティック生成プラットフォーム1は、異なるコンポーネントを備え得る。図1に示された制御ヒューリスティック生成プラットフォーム1は、機械学習制御ヒューリスティックスを提供するために用いられ得る。これらの制御ヒューリスティックスは、動的システムsysをオンラインで制御するために用いられ、動的システムsysはシミュレーションモデルfによってモデル化されて、制御ヒューリスティック生成プラットフォーム1のモデル記憶装置2に記憶される。モデル記憶装置2に記憶されたシミュレーションモデルfは、動的システムsysの時間におけるシステム状態ベクトルxを、現在のシナリオパラメータベクトルpと制御ベクトルuに基づいて予測するように適合される。シミュレーションモデルfは、動的システムsysのエンジニアリングモデルであり得る。動的システムは例えば、道路を走行中の車両であり得る。制御ヒューリスティック生成プラットフォーム1は、モデル予測制御MPCアルゴリズムを用いて、シミュレーションモデルfを用いた動的システムのシミュレーション中に毎回、異なるシナリオパラメータベクトルpおよび初期システム状態ベクトルxに関して制御ベクトルuを提供するように適合された第1の計算部3を備えている。制御ヒューリスティック生成プラットフォーム1の第1の計算部3は、シナリオパラメータベクトルpを記憶するデータベース4へのアクセスを有する。さらに、制御ヒューリスティック生成プラットフォーム1の計算部3は、システムsysの初期システム状態ベクトルxが記憶されているさらなるデータベース5へのアクセスを有する。計算部3は、シナリオパラメータベクトルpと初期システム状態ベクトルxの各シミュレートされた組み合わせに関して、結果の最適制御値uを、MPCアルゴリズムを用いて計算するように適合される。次に、結果の最適制御値uは、計算された最適制御値を記憶するメモリ6に、計算部3によって保存される。
制御ヒューリスティック生成プラットフォーム1はさらに、結果の最適制御値に関する対応するシナリオパラメータベクトルpと初期システム状態ベクトルxとの関係を、機械学習アルゴリズムMLAを用いて近似する機械学習制御ヒューリスティックスを生成するように適合された第2の計算部7を備える。生成された機械学習制御ヒューリスティックスuは、可能な実施形態において制御ヒューリスティック生成プラットフォーム1のインターフェースを介して動的システムsysのコントローラ9に転送され得る。図1に示すように、生成された機械学習制御ヒューリスティックスuは、完成後に、手段8を介して、シミュレーションモデルfによってモデル化される動的システムsysをオンラインで制御するコントローラ9に転送される。機械学習制御ヒューリスティックスuは、ケーブルによって電子的に、またはUSBスティック等の物理的メモリによって、などの異なる手段で搬送されてもよい。可能な実装において、制御ヒューリスティック生成プラットフォーム1は、リモートプラットフォームとして、例えばクラウドプラットフォームとして実装され得る。クラウドプラットフォームとしての実装は、オフラインのヒューリスティック生成フェーズにおいて、ほぼ無限の計算リソースを用いることを可能にする。
図2は、本発明によるシステムを例示するためのさらなる図を示す。図2の例示された実施形態において、リモートプラットフォーム1は、動的システムsysのエンジニアリングモデルまたはシミュレーションモデルfを記憶するための記憶装置2を備えている。プラットフォーム1は、例示された実施形態において、用いられるシミュレーションモデルfの複雑さまたは次数を自動的に低減するためのモデル次数低減部2aを備えている。データベース4は、例えば履歴データ、以前の製品生成または製品要求等の、見込まれるユースケースまたはシナリオパラメータベクトルの群を記憶する。計算部3は、モデル予測制御MPCを用いてシミュレーションを実行して、制御ベクトルuを提供する。したがって、計算部3は、見込まれるシナリオの群に関するモデル予測制御MPCを提供する。モデル予測制御MPCアルゴリズムは、シミュレーションモデルfを用いた動的システムsysのシミュレーション中に毎回、データベース5から読み出された異なるシナリオパラメータベクトルpおよび初期システム状態ベクトルxに関して制御ベクトルuを提供するために用いられる。シナリオパラメータベクトルpと初期システム状態ベクトルxのシミュレーションの組み合わせ毎に、結果の最適制御値uが、MPCアルゴリズムを用いて計算される。結果の最適制御値uは、プラットフォーム1のメモリ6に記憶される。プラットフォーム1の第2の計算部7は、保存された結果の最適制御値uに関する対応するシナリオパラメータベクトルpと初期システム状態ベクトルxとの間の関係を近似する機械学習制御ヒューリスティックスuを、機械学習アルゴリズムMLAを用いて生成する。制御値は、記憶された制御挙動に基づく機械学習によって、および/または例えばニューラルネットワークによる制御曲線によって学習される。生成された機械学習制御ヒューリスティックスuは次に、図2に示すようにコントローラ9の内部メモリ9Aに転送され得る。制御ヒューリスティック生成プラットフォーム1は、モデル予測制御MPCアルゴリズムを用いて、シミュレーションモデルf、一組のパラメータシナリオに基づいて、機械学習を用いてオフラインの前処理を実行する。このように、制御ヒューリスティック生成プラットフォーム1は、オフライン段階で、すなわち、システムsysの動作の前に前処理を提供する。
制御ヒューリスティックスuがコントローラ9の内部メモリ9Aに転送された後で、システムsysの動作中にオンライン制御段階が開始される。システムsysは、図2に示すように1つまたはいくつかのプロセス10Aを含む。システムのプロセスは、図2に同様に示されるようなプロセスの現在の状態での予測される負荷9Bに基づいて制御ヒューリスティックスuを用いて制御され得る。付加的なユースケースまたはシナリオが、図2に示されるようにプラットフォーム1のデータベース4に記憶されてもよい。これらの付加的なユースケースまたはシナリオは、オフライン段階中にパラメータおよび状態値を保存することによって収集され得る。シミュレーションモデルfの更新が、劣化によるパラメータの変化等の付加的なセンサ情報に基づいて実行されることも可能である。現在の負荷(いくつかのシナリオパラメータの現在の値)10Bが、図2に示すように、動的システムsysのプロセス10Aに供給される。
動作に従って学習されたシナリオの、データベースへのフィードバックがある。フィードバックは経時的に制御を大きく改良する。
このデータに基づいて、
A)シミュレーションモデルの入力パラメータが校正されることができて、より良いシミュレーションモデルにつながる、例えば、モータ特性に磨耗が如何に影響するかを学習する、予測よりも圧力が少ないタイヤを検出する、異なる空気力学につながる、ボックス付きルーフトップを検出する等を行い、
B)可能ならば、どの負荷に基づいてシステム、例えば機械が作動されるかを判断する。車の場合、それは地図から軌跡を読み取ることによってなされ得る。船、工場またはポンプの場合、これは一層複雑になり得る。例えば、ポンプに関しては、異なる粘度を有するどの種類の油がパイプライン内で圧送されるかが判断され得る。例えば、異なる粘度は異なる負荷を意味し得る。
動的システムは、状態ベクトル(x)を有するシステムであり、状態ベクトルは、特定の状態の関数に従って時間tとともに発展し、f(x)=dx/dtとなる。さらに、関数は、ベクトルpのいくつかのパラメータを受け入れ得る(dx/dt=f(x,p))。制御可能な動的システムにおいて、付加的な制御ベクトル(u)は、動的システムの発展に影響し得る、コントローラ9によって直接変更され得るシステムの部分を表す(dx/dt=f(x,u,p))。動的システムsysの一例は、坂道を走行している車両であり、その場合状態ベクトルxの状態ベクトルエントリーは、車両の高さ、傾斜、位置、速度、加速度ならびにその車両のモータの角速度等の量であり得る。出力ベクトルエントリーは、車両のダッシュボード上の速度および消費の読み取り値を含み得る。これらから、状態ベクトルxが直接または間接的に推測され得る。制御ベクトルuの制御ベクトルエントリーは例えば、どれ程のガスが供給されたか、およびブレーキペダルがどこまで踏み込まれたかを示し得る。パラメータベクトルpのパラメータベクトルエントリーは例えば、車両の質量、空気抗力および転がり抵抗プロファイルならびにモータトルクプロファイルを含み得る。さらなるパラメータベクトルエントリーは、位置を伴う高さの表での値または高さ曲線を記述する何らかの関数の係数等の、道路の高さプロファイルを記述し得る。
モデル予測制御(MPC)は、制御可能な動的システムsysを制御するための最適な方式を計算するためのアルゴリズムである。モデル予測制御(MPC)は、発展関数、時間t=0での推定状態ベクトルxと、パラメータベクトルp、おそらく何らかの制約d(x,u,p)ならびに可能な限り低いコスト関数C(t,x,u,p)を入力として取り込み、最適化アルゴリズムを用いて、t=0からt=Tまでの最適な制御uを見出し、それは、予測ホライズンと呼ばれる、この時間間隔中に積分されたコスト関数Cの最小値そのものまたはほぼ最小値のいずれかをもたらし、同時に、可能ならば制約も満たしている。Tは予測ホライズン長さと呼ばれる。この計算された最適な制御uは時間ステップΔTにわたり実行され、その場合0<ΔT<Tであり、その後、最適な制御uは、時間t=ΔTでの状態ベクトルxの新たな推定値を用いて、t=ΔTからt=T+ΔTまでの時間にわたり再び見出される。これは次に、ΔTから2ΔTまでの次の時間間隔にわたり、また、望むだけ反復されることができる。
図3は、本発明の一態様による、複合動的システムsysの最適化制御を実行するための方法の可能な代表的実施形態のフローチャートを示す。
第1のステップS1で、動的システムの時間におけるシステム状態ベクトルxを、シナリオパラメータベクトルpおよび制御ベクトルuに基づいて予測するためのシミュレーションモデルfが提供される。
さらなるステップS2で、モデル予測制御MPCアルゴリズムを用いて、シミュレーションモデルfを用いた動的システムのシミュレーション中に毎回、異なるシナリオパラメータベクトルpおよび初期システム状態ベクトルxに関して制御ベクトルuを提供する。
さらなるステップS3で、シナリオパラメータベクトルpと初期システム状態ベクトルxの各シミュレートされた組み合わせに関して、結果の最適制御値uがMPCアルゴリズムによって計算され、メモリに保存される。
さらなるステップS4で、機械学習アルゴリズムMLAを用いて、保存された結果の最適制御値uに関する対応するシナリオパラメータベクトルpと初期システム状態ベクトルxとの関係を近似する機械学習制御ヒューリスティックスuが生成される。機械学習アルゴリズムMLAは、例えばディフュージョンマップを用いてよい。1つの可能な実施形態において、機械学習アルゴリズムMLAは動的システムsysを近似するための閉観測量を有するディフュージョンマップを用いる。
さらなるステップS5で、生成された機械学習ヒューリスティックスuは、シミュレーションモデルfによってモデル化される複合動的システムをオンラインで制御するために用いられる。
制御可能な動的システムsysは、システムのダイナミクスのためのシミュレーションモデルfによって以下のように表され得る:
ここで、tは時間、xは状態変数ベクトル、uは制御変数ベクトル、pはパラメータベクトルである。
図4Aから図4Dは、本発明による方法のステップを示す。
図4Aは、一次元状態x(t)とコントロールu(t)のためのMPC最適化を示す。xおよびuに関する既知のデータ(実線)と、システムのダイナミクス
に基づき、コスト関数C(図示せず)は予測ホライズンtε[t、t+Thor]に関して最小化される。結果のuおよび対応する予測状態x(破線)に対する最適制御値はその後、次のΔTに、tまで用いられることができ、tの時点で、この手順は、間隔tε[t、t+Thor]に関して反復される。
図4Bに例示されるように、高次元MPCデータは次に、ディフュージョンマップを用いることで低次元マニホールドにパラメータ化されて、ディフュージョンマップ座標ΨおよびΨをもたらす。ディフュージョンマップは、高次元に埋め込まれた低次元マニホールドをパラメータ化するためのデータ解析ツールである。ディフュージョンマップによるマッピングは、特定のカーネルまたはメトリックに従って測定された最近傍間の距離に基づく。ディフュージョンマップの基となる概念は、下層のマニホールド内でサンプリングされたポイントに関して、高次元空間内の最近接ポイント同士の距離が、そのマニホールドにおける、またはマニホールドに沿った距離とほぼ等しくなるということである。これは、ポイント間の一種のディフュージョン演算子に用いることができ、それは、無限データの制約内で、連続したラプラース−ベルトラミ演算子を近似するためになされ得る。この演算子の固有ベクトルまたは固有関数が、下層のマニホールドの有用なパラメータ化を提供するため、離散したポイントに関して同じことを行い、パラメータ化を得ることが可能である。固有ベクトル値は、最も重要な方向、またはマニホールド内の距離に対して最も貢献度が高い方向における座標として解釈され得る。固有ベクトルとして、それらはデータ上の関数の空間の直角ベースをも形成する。これは、幾何学的ハーモニクスを介した補間および拡張関数のべースをも形成できる。
図4Cに示すように、ディフュージョンマップの座標は、拡張されて、ディフュージョンマップによって近似された低次元マニホールド上またはその付近のサンプリングされないポイントに補間され得る。
さらに、図4Dに示されるように、出力されたヒューリスティックスは以前にサンプリングされていないポイントに補間されることができ、次に、例えば認証または制御用に用いられ得る。
システムのダイナミクスを組み込むもう1つの可能性は、各データポイントを、時間遅延埋め込みによって拡張すること、すなわち、時系列全体を1つのデータポイントとして組み込むことである。こうして、距離メトリックは、単一の時点というよりは軌跡全体間の差異を比較する。
1つの可能な実施形態において、複合動的システムは、路上を走行中の車両を含む。1つの適用例において、そのようなシステムは、現在の速度(状態x)に基づいた予め設けられた高さプロファイル(シナリオp)に関してエネルギー最適化された車両の加速度と制動を含む。
例えば、制御ヒューリスティックは、図5に示すように、マップルート(グーグル(Google:登録商標)マップまたはその他のマップサービスおよびナビゲーションシステムによって提供される)の高さプロファイルによって訓練され得る。モデル予測制御(MPC)アルゴリズムは、この高さプロファイルに関して最適化制御戦略または最適化制御値を供給できる。図5は、速度V、加速度A、温度Tおよびモータ制動力Fならびに距離dにわたる瞬時(コスト/時間)値cを示す。
図6に、MPCから、高さ200および中心3000分だけ離れた標準偏差1000のガウス分布の2つの連続した坂への最適制御値を有するシステム応答が図示されている。
制御ヒューリスティック生成プラットフォーム1は、シナリオパラメータベクトルを記憶するためのデータベース4を備える。シナリオパラメータベクトルは、システムの外部因子を記述するパラメータのベクトルである。これらの外部因子は、システムの発展により変化しない。これらのパラメータは、そのシステムのプロセス要求、物理定数、特性、または特定の設定の特性を含み得る。
さらに、プラットフォーム1は、システムの初期システム状態ベクトルへのアクセスを有する。システム状態ベクトルxは、動的システムsysの状態を記述し、動的システムsysの将来に影響し、経時的に発展する変数のベクトルである。発展は、システム状態ベクトルx、シナリオパラメータベクトルpおよびdx/dt=f(x,u,p)による制御変数のベクトルuに依存する数理モデルfによって記述される。モデル予測制御MPCは、シミュレーションモデルfを用いた動的システムsysのシミュレーション中に毎回、異なるシナリオパラメータベクトルpおよび初期システム状態ベクトルxに関して制御ベクトルuを提供するために用いられる。シナリオパラメータベクトルpと初期システム状態ベクトルxの各シミュレートされた組み合わせに関して、図1に示すように、結果の最適制御値uが計算されてメモリ6に保存される。機械学習アルゴリズムMLAを用いて、保存された結果の最適制御値uに関する対応するシナリオパラメータベクトルpと初期システム状態ベクトルxとの関係を近似する機械学習制御ヒューリスティックスuを生成する。機械学習ヒューリスティックは、機械学習アルゴリズムMLAによって生成されるヒューリスティック(経験則または近似ルール)である。機械学習ヒューリスティックスは、したがって、制御のための近似ルールを含む。機械学習制御ヒューリスティックスuは、入力システムベクトルxおよびシナリオパラメータベクトルpから、モデル予測制御MPCアルゴリズムによって生成された最適な制御ベクトルuへの入力/出力関係の近似ルールを指す。したがって、そのような機械学習制御ヒューリスティックスuは、入力状態ベクトルxとシナリオパラメータベクトルpを取り込んで制御ベクトルuを出力する数学関数である。制御ヒューリスティックスは、計算された最適制御値を提供する。結果の最適制御値uは保存され、次に、関係(ヒューリスティック)が補間され得る。
別の可能な実施形態において、線形回帰または最近傍補間が、変数に近似ルールをもたらすために用いられ得る。
システムsys自体は、生成された機械学習制御ヒューリスティックスuのみを用いて、コントローラ9による操作中に制御され得る。したがって、コントローラ9自体の計算要求は低い。さらに、制御は従来型モデル予測制御MPCと比較してロバストである。複合プロセッサまたはシステムsysであっても、単純な制御ヒューリスティックスuで表されることができ、その結果、制御方法の効率が向上する。
1 制御ヒューリスティック生成プラットフォーム
2 モデル記憶装置
2a モデル次数低減部
3 計算部
4 データベース
5 データベース
6 メモリ
7 計算部
8 手段
9 コントローラ
9A 内部メモリ
9B 予測される負荷
10A プロセス
10B 現在の負荷
f シミュレーションモデル
p シナリオパラメータベクトル
u 制御ベクトル
制御ヒューリスティックス
sys 動的システム

Claims (11)

  1. 機械学習型の、シナリオに基づく制御ヒューリスティックスを用いて複合動的システム(sys)の最適化制御を実行するための方法であって、
    前記方法が、
    a)現在のシナリオパラメータベクトル(p)と制御ベクトル(u)に基づいて、前記動的システム(sys)のシステム状態ベクトル(x)を時間的に予測するためのシミュレーションモデル(f)を提供するステップ(S1)と、
    b)モデル予測制御MPCアルゴリズムを用いて、前記シミュレーションモデル(f)を用いた前記動的システム(sys)のシミュレーション中に毎回、異なるシナリオパラメータベクトル(p0,p1,p2,・・・)および初期システム状態ベクトル(x00,x01,x02,・・・)に関する制御ベクトル(u)を提供するステップ(S2)と、
    c)シナリオパラメータベクトル(p)と初期システム状態ベクトル(x)の各シミュレートされた組み合わせに関して、MPCアルゴリズムによって、結果の最適制御値(u(p,x))を計算し、結果の最適制御値を保存するステップ(S3)と、
    d)機械学習アルゴリズムを用いて、保存された結果の最適制御値(u(p,x))に関する対応するシナリオパラメータベクトル(p)と初期システム状態ベクトル(x)との関係を近似する機械学習制御ヒューリスティックス(u(p,x))を生成するステップ(S4)と、
    e)生成された機械学習制御ヒューリスティックスを用いて、前記シミュレーションモデル(f)によってモデル化される複合動的システム(sys)を制御するステップ(S5)と、
    を含む方法。
  2. 前記機械学習アルゴリズムがディフュージョンマップを用いる、請求項1に記載の方法。
  3. 前記機械学習アルゴリズムが、前記動的システムを近似するための閉観測量を有するディフュージョンマップを用いる、請求項1または2に記載の方法。
  4. 前記機械学習アルゴリズムがサポートベクトルマシンを用いる、請求項1に記載の方法。
  5. 前記生成された機械学習制御ヒューリスティックスはコントローラに転送され、コントローラは転送された機械学習制御ヒューリスティックスに従って前記動的システムをオンラインで制御する、請求項1から4のいずれか1項に記載の方法。
  6. 前記機械学習制御ヒューリスティックスは、前記シミュレーションモデルによってモデル化される前記複合動的システムを制御するための近似ルールを含む、請求項1から5のいずれか1項に記載の方法。
  7. モデル記憶装置(2)に記憶されたシミュレーションモデル(f)によってモデル化される動的システム(sys)を制御するために用いられ、現在のシナリオパラメータベクトル(p)と制御ベクトル(u)に基づいて前記動的システム(sys)のシステム状態ベクトル(x)を時間的に予測するように適合された機械学習制御ヒューリスティックスを提供するための制御ヒューリスティック生成プラットフォーム(1)であって、
    前記制御ヒューリスティック生成プラットフォーム(1)が、
    モデル予測制御MPCアルゴリズムを用いて、前記シミュレーションモデル(f)を用いた前記動的システム(sys)のシミュレーション中に毎回、異なるシナリオパラメータベクトルおよび初期システム状態ベクトルに関して制御ベクトル(u)を提供するとともに、シナリオパラメータベクトル(p)と初期システム状態ベクトル(x)の各シミュレートされた組み合わせに関して、MPCアルゴリズムにより、結果の最適制御値(u(p,x))を計算し、結果の最適制御値をメモリ(6)に保存するように適合された第1の計算部(3)と、
    機械学習アルゴリズムを用いて、保存された結果の最適制御値(u(p,x))に関する対応するシナリオパラメータベクトル(p)と初期システム状態ベクトル(x)との関係を近似する機械学習制御ヒューリスティックス(u(p,x))を生成するように適合された第2の計算部(7)を含み、
    生成された機械学習制御ヒューリスティックスは、前記制御ヒューリスティック生成プラットフォーム(1)のインターフェースを介して前記動的システムのコントローラ(9)に転送可能である、制御ヒューリスティック生成プラットフォーム。
  8. オンライン操作中に観察され保存される初期システム状態(x)とシナリオパラメータベクトル(p)は付加的に前記第1の計算部(3)に供給されて、コントローラ(9)に転送可能である、更新された機械学習制御ヒューリスティックスを構築する、請求項7に記載の制御ヒューリスティック生成プラットフォーム。
  9. クラウドプラットフォームとして実装される、請求項7または8に記載の制御ヒューリスティック生成プラットフォーム。
  10. 前記機械学習制御ヒューリスティックスは、前記シミュレーションモデル(f)によってモデル化される前記複合動的システム(sys)を制御するための近似ルールを備える、請求項7、8または9に記載の制御ヒューリスティック生成プラットフォーム。
  11. 前記動的システム(sys)が、前記コントローラ(9)によって、転送された機械学習制御ヒューリスティックスに従ってオンラインで制御される車両を備えている、請求項7から10のいずれか1項に記載の制御ヒューリスティック生成プラットフォーム。
JP2018092884A 2017-05-15 2018-05-14 複合動的システムの最適化制御を提供するための方法およびシステム Active JP6564905B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP17171020.5 2017-05-15
EP17171020.5A EP3404497B1 (en) 2017-05-15 2017-05-15 A method and system for providing an optimized control of a complex dynamical system

Publications (2)

Publication Number Publication Date
JP2018195307A JP2018195307A (ja) 2018-12-06
JP6564905B2 true JP6564905B2 (ja) 2019-08-21

Family

ID=58709347

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018092884A Active JP6564905B2 (ja) 2017-05-15 2018-05-14 複合動的システムの最適化制御を提供するための方法およびシステム

Country Status (4)

Country Link
US (1) US10953891B2 (ja)
EP (1) EP3404497B1 (ja)
JP (1) JP6564905B2 (ja)
CN (1) CN108873692B (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110032075B (zh) * 2019-05-28 2022-04-05 哈尔滨工程大学 一种动力定位船饱和补偿控制系统设计方法
JP7441115B2 (ja) 2020-05-26 2024-02-29 Toyo Tire株式会社 タイヤ設計支援方法、システム及びプログラム
US20230221686A1 (en) * 2020-07-29 2023-07-13 Siemens Industry Software Nv Controlling a technical system by data-based control model
CN112116140B (zh) * 2020-09-10 2022-09-20 同济大学 一种基于孪生模型的建筑能耗预测方法
CN113627087B (zh) * 2021-08-23 2023-11-03 中机中联工程有限公司 基于物流仿真与机器学习的生产系统参数自适应优化方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6445963B1 (en) 1999-10-04 2002-09-03 Fisher Rosemount Systems, Inc. Integrated advanced control blocks in process control systems
US6912515B2 (en) * 2001-06-04 2005-06-28 Xerox Corporation Method and system for algorithm synthesis in problem solving
US7272454B2 (en) 2003-06-05 2007-09-18 Fisher-Rosemount Systems, Inc. Multiple-input/multiple-output control blocks with non-linear predictive capabilities
JP2005339241A (ja) * 2004-05-27 2005-12-08 Nissan Motor Co Ltd モデル予測制御装置および車両用推奨操作量生成装置
US7117046B2 (en) 2004-08-27 2006-10-03 Alstom Technology Ltd. Cascaded control of an average value of a process parameter to a desired value
US7840287B2 (en) 2006-04-13 2010-11-23 Fisher-Rosemount Systems, Inc. Robust process model identification in model based control techniques
US8554343B2 (en) * 2010-12-08 2013-10-08 Mitsubishi Electric Research Laboratories, Inc. Method for solving control problems
GB201305067D0 (en) 2013-03-19 2013-05-01 Massive Analytic Ltd Apparatus for controlling a land vehicle which is self-driving or partially self-driving
US9298988B2 (en) * 2013-11-08 2016-03-29 Analog Devices Global Support vector machine based object detection system and associated method
WO2016010601A2 (en) * 2014-04-23 2016-01-21 The Florida State University Research Foundation, Inc. Adaptive nonlinear model predictive control using a neural network and input sampling
US9983554B2 (en) 2014-11-25 2018-05-29 Mitsubishi Electric Research Laboratories, Inc. Model predictive control with uncertainties
GB2520637A (en) * 2014-12-04 2015-05-27 Daimler Ag Controller for controlling an internal combustion engine of a vehicle, in particular a commercial vehicle
CN104967149B (zh) 2015-06-29 2017-08-25 山东电力研究院 一种微电网风光储模型预测控制方法
WO2017006372A1 (en) 2015-07-08 2017-01-12 Nec Corporation A Method of Optimal Scheduling and Real-time Control for an xManagement System

Also Published As

Publication number Publication date
CN108873692A (zh) 2018-11-23
CN108873692B (zh) 2021-07-13
US20190031204A1 (en) 2019-01-31
US10953891B2 (en) 2021-03-23
EP3404497A1 (en) 2018-11-21
JP2018195307A (ja) 2018-12-06
EP3404497B1 (en) 2021-11-10

Similar Documents

Publication Publication Date Title
JP6564905B2 (ja) 複合動的システムの最適化制御を提供するための方法およびシステム
US11254315B2 (en) Friction adaptive vehicle control
JP5523624B2 (ja) 制御装置及び制御のための出力変数を計算する方法
CN115668072A (zh) 随机预测控制的非线性优化方法
US10112607B2 (en) Driving support device that performs driving support in accordance with characteristics and skills of driver
US20220187793A1 (en) Stochastic Model-Predictive Control of Uncertain System
RU2539669C2 (ru) Система автоматического поддержания скорости движения с выпуклой функцией стоимости
CN110027547B (zh) 车辆横向控制方法和装置
CN117581166A (zh) 基于借助高斯假设密度滤波器的不确定性传播的随机非线性预测控制器及方法
CN114212081B (zh) 车辆横向控制方法、装置、计算机设备和可读存储介质
CN118103266A (zh) 用于交通工具中的功率或扭矩分配的自适应实时优化的方法
CN115042816B (zh) 路径跟踪方法、装置、设备、介质及程序
CN115520188A (zh) 节能型车辆速度规划方法、系统、电子设备、存储介质
Chen et al. RHONN-modeling-based predictive safety assessment and torque vectoring for holistic stabilization of electrified vehicles
JP2005263100A (ja) 車両制御装置
CN116981609A (zh) 用于车辆动力学的自适应控制的系统和方法
CN116501061A (zh) 一种基于分层优化的模型预测控制路径跟踪方法
CN113534669B (zh) 基于数据驱动的无人车控制方法、装置和计算机设备
CN117321511A (zh) 用于高维物理系统的建模、预测和控制的鲁棒自适应动态模式分解
CN112406889B (zh) 基于运动学的车辆预测控制方法及处理器
JP7176501B2 (ja) ギア段決定装置、方法およびシミュレーション装置
CN113859236A (zh) 一种跟车控制系统、车辆、方法、装置、设备及存储介质
CN118322885B (zh) 一种电动汽车推力分配控制方法及装置
CN117087669B (zh) 车辆速度跟踪控制方法、装置、车辆及存储介质
CN112406890A (zh) 基于动力学的车辆预测控制方法及处理器

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190612

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190702

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190729

R150 Certificate of patent or registration of utility model

Ref document number: 6564905

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250