JP2019505889A - コスト関数設計システム、コスト関数設計方法、およびコスト関数設計プログラム - Google Patents

コスト関数設計システム、コスト関数設計方法、およびコスト関数設計プログラム Download PDF

Info

Publication number
JP2019505889A
JP2019505889A JP2018530181A JP2018530181A JP2019505889A JP 2019505889 A JP2019505889 A JP 2019505889A JP 2018530181 A JP2018530181 A JP 2018530181A JP 2018530181 A JP2018530181 A JP 2018530181A JP 2019505889 A JP2019505889 A JP 2019505889A
Authority
JP
Japan
Prior art keywords
cost function
model
learning
function design
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018530181A
Other languages
English (en)
Other versions
JP6702421B2 (ja
Inventor
ウィマー ウィー
ウィマー ウィー
義男 亀田
義男 亀田
江藤 力
力 江藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JP2019505889A publication Critical patent/JP2019505889A/ja
Application granted granted Critical
Publication of JP6702421B2 publication Critical patent/JP6702421B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/048Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators using a predictor

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Feedback Control In General (AREA)

Abstract

学習部81は、制御対象である装置の動作及び環境から取得したデータに基づいて、ユーザが関心をもつ数量を表す数量モデルを学習する。コスト関数設計部82は、装置を最適に制御するための解の導出に使用されるコスト関数を、少なくとも前記数量モデルを項として含むように設計する。

Description

本発明は、装置を最適に制御するためのコスト関数を設計するコスト関数設計システム、コスト関数設計方法、およびコスト関数設計プログラムに関する。
業界にとって関心のある多くのシステムは、動的かつ非線形であり、効果的かつ適応性のある制御形態を必要としている。
このようなシステムを扱うために提案された通常の制御技術、例えば、非特許文献1に開示されているモデル予測制御に基づく制御技術は、一般に線形であり、主に装置そのものの適応モデルを考慮することにより適応的である。
すなわち、標準的な適応制御方法は、例えば、バッチまたはオンラインデータに適用されるシステム同定技術を用いることによって、装置の動作を記述するモデルの更新を直接的に考慮する。
しかし、多くのアプリケーションにおいて、モデルの変更が、ユーザが最適化したい数量に直接関係しないことがある。
さらに、関心のある変数の最適化に使用されるコスト関数は、典型的には、手作業で構築され、第一原理の専門的な経験または知識を必要とする。
同様に、装置やそのコンポーネントが劣化する状況に対処することは難しく、その結果、装置やそのモデルだけでなく、関連するコスト関数の各項についても不整合を生じる可能性がある。
上述する問題を解決するための研究がなされている。具体的には、特許文献1には、非線形の適応制御装置が記載されている。特許文献1の記載によれば、過去の制御入力に応じて過去のシステム状態を記憶するオンラインのニューラルネットワークモデルが作成される。
米国特許第6185470号明細書
J. M. Maciejowski, "Predictive Control with Constraints", Prentice Hall, 2001.
ニューラルネットワークモデルにおける将来の出力状態の関数であるコスト関数または性能指数が、制御出力を計算するために使用される。
しかし、使用されるコスト関数は表現が限定されており、前述のアプローチは、特定の変数を最適化し、プロセスを解釈するという観点から、エンドユーザによる制御をほとんど提供しない。
実際、ニューラルネットワークの内部に保持された情報は判読不可能であり、その使用方法を解釈することは困難であることが知られている。
また、コスト関数は、装置の適応モデルに大きく依存する。しかし、関心のある問題において、最適化を所望する数量が、装置モデル自体の変化とは無関係に、その挙動を変える可能性がある。
したがって、手動で構築する必要がなく、かつ、操作可能な装置における変化や劣化に対処するのに役立つデータから学習された正確なコスト関数の項を、より豊かな表現で提供できる方法およびシステムが必要とされている。
また、このような方法およびシステムが、装置の稼働中に処理を解釈したり、経験を個人的なものにしたりする能力をユーザにより多く提供できることが非常に望まれている。
本発明の主題は、上述する一つまたは複数の問題を解決する、または、少なくともその効果を低減するために、上記の特徴を実現することにある。すなわち、本発明は、装置の制御を容易にすることができる最適なコスト関数を設計できるコスト関数設計システム、コスト関数設計方法、およびコスト関数設計プログラムを提供することを目的とする。
本発明のコスト関数設計システムは、制御対象である装置の動作及び環境から取得したデータに基づいて、ユーザが関心をもつ数量を表す数量モデルを学習する学習部と、装置を最適に制御するための解の導出に使用されるコスト関数を、少なくとも数量モデルを項として含むように設計するコスト関数設計部とを備えたことを特徴とする。
本発明のコスト関数設計方法は、制御対象である装置の動作及び環境から取得したデータに基づいて、ユーザが関心をもつ数量を表す数量モデルを学習し、装置を最適に制御するための解の導出に使用されるコスト関数を、少なくとも数量モデルを項として含むように設計することを特徴とする。
本発明のコスト関数設計プログラムは、コンピュータに、制御対象である装置の動作及び環境から取得したデータに基づいて、ユーザが関心をもつ数量を表す数量モデルを学習する学習処理、および、装置を最適に制御するための解の導出に使用されるコスト関数を、少なくとも数量モデルを項として含むように設計するコスト関数設計処理を実行させることを特徴とする。
本発明によれば、装置の制御を容易にすることができる最適なコスト関数を設計できる。
本発明によるコスト関数設計システムの一実施形態の構成例を示す説明図である。 コマンドモジュールによって表示されるインタフェースの例を示す説明図である。 モデルの詳細を表示するインタフェースの例を示す説明図である。 実施形態におけるコスト関数設計システムの動作例を示すフローチャートである。 実施形態における学習器モジュールの動作例を示すフローチャートである。 本発明によるコスト関数設計システムがオンライン処理で実行される例を示す説明図を示す。 本発明のコスト関数設計システムの概要を示すブロック図である。
以下、図面を参照して、本発明の実施形態を説明する。本開示の主題の好ましい実施形態および代替の実施形態、並びに他の態様は、具体的な実施形態の詳細な説明および添付の図面を参照することで、理解され得る。
データから学習されたコスト関数のモデルを提供する方法およびシステムの実施形態に関する以下の説明は、単なる例示に過ぎず、開示された用途に限定することを意図するものではない。
図1は、本発明によるコスト関数設計システムの実施形態の構成例を示す説明図である。本実施形態のコスト関数設計システム100は、コマンドモジュール101と、コントローラ102と、装置103とを備えている。本実施形態のコスト関数設計システム100は、動的プロセス及び必要に応じて非線形プロセスの適応制御を行う。ここで、非線形プロセスは、非線形方程式によって記述または制御される装置の挙動または処理プロセスを示す。本実施形態では、コントローラ102は、装置103を制御する。
装置103は、出力信号107をコントローラ102に送信する。出力信号107は、装置103のセンサ(図示せず)によって取得される。装置103は、外乱108を出力信号107として取得できる。出力信号107は、装置103を稼働させるために使用される、入力された制御信号109の処理または計算を行う。
コントローラ102は、予測器104と、最適化器105と、学習器モジュール106とを含む。予測器104は、装置モデルを使用して、予測された出力110または将来の応答信号を生成する。装置モデルは、装置の挙動(例えば、動き)を記述するモデルである。 例えば、装置が車両である場合、装置モデルは、その動作、すなわち、その動きと依存との関係を記述する式を含んでいてもよい。
予測された出力110または将来の応答信号は、コスト関数111に含まれていてもよく、または使用されてもよい。コスト関数111は、ユーザによって選択され、学習器モジュール106によって構築される性能評価尺度に関連する。
なお、予測された出力110は、ある予測範囲に基づいて生成される。予測された出力110は、学習器モジュール106によって反復的に収集され、学習器モジュール106は、予測器104から収集されたデータに対してバッチ処理またはオンライン処理を実行する。
最適化器105は、制約に従ってコスト関数111を解く。最適化器105は、線形計画法または二次計画法などの最適化方法を使用することによってコスト関数111を解いてもよい。学習器モジュール106の機能については後述される。
コマンドモジュール101は、ユーザ、外部センサまたは入力装置(図示せず)から判定入力または基準信号112を受信する。次に、コマンドモジュール101は、判定信号および基準信号114を学習器モジュール106に出力する。具体的には、コマンドモジュール101は、学習器モジュール106が使用可能な形式に判定信号および基準信号114を変換する。本実施形態では、判定信号は、コスト関数111の更新処理が自動的に行われるか手動で行われるかを示す信号である。基準信号は、最適化において使用されるパラメータの一部である。
また、コマンドモジュール101は、学習器モジュール106から、学習モデルのリスト113およびコスト関数111のリストを受け取り、表示する。学習モデルのリスト113がコスト関数111の項として使用されるため、以下の説明では、学習モデルのリスト113をコスト関数の項と記すこともある。コスト関数の項は、装置の操作に関与する入力の関数や、他の変数の関数である。
次に、コマンドモジュール101は、学習されたコスト関数の項のリストおよび分析結果をユーザに表示する。具体的には、コマンドモジュール101は、ユーザからコスト関数から除外するかコスト関数に含めるかを示すモデル選択指示を受け付ける。コマンドモジュール101は、また、装置の操作における最適化の決定に必要なユーザ入力を要求する。そして、コマンドモジュール101は、モデル選択指示を学習器モジュール106に送信する。
また、ユーザは、コスト関数111を手動で更新するか、または、自動で更新するかを選択できる。これにより、装置103を使用する際のユーザ体験のカスタマイズや個人化について改善できる。コマンドモジュール101は、その使用性を向上させるために、視覚化するための技術を含んだり、組み合わせたりしてもよい。コマンドモジュール101が表示するインタフェースの例は、後述される。
学習器モジュール106は、装置103を最適に制御するための解の導出に使用されるコスト関数111を設計する。具体的には、学習器モジュール106は、入出力データに基づいて、ユーザが関心を持つ数量を表すモデルを学習する。以下の説明では、学習器モジュール106によって学習されたモデルを、数量モデルと記す。以下、学習されたモデルの内容を説明する。学習器モジュール106は、少なくとも数量モデルを項として含むようにコスト関数111を設計する。
コスト関数モデルは、ユーザが最適化を所望するが、必ずしも装置103での制御の中心になる変数または主な変数ではない可能性がある数量を表す。
例えば、コスト関数モデルは、ユーザが最小化を所望するが、装置の操作中に制御される主な変数ではない可能性がある燃料消費量に関連させることができる。
学習器モジュール106は、装置103の応答および制御入力とともに、装置103およびその環境で収集されたデータが供給される。具体的には、学習器モジュール106は、コマンドモジュール101からの判定信号および基準信号114と、最適化器105からの制御動作を示す、入力される制御信号109と、予測器104からの予測された出力110と、装置103からの出力信号107とを入力とする。
学習器モジュール106は、各繰り返しにおいて、最適化器105によって使用されるコスト関数111を出力する。学習器モジュール106は、また、学習モデルのリスト113、すなわち、数量モデルのリストをコマンドモジュール101に出力する。
また、学習器モジュール106は、選択指示によりコスト関数に含まれるように指示されたモデルを学習する。
具体的には、学習器モジュール106は、モデル推定方法などの機械学習技術を使用して、入力信号および/または他の出力の関数としてモデル(数量モデル)を構築する。次に、学習器モジュール106は、新しく構築されたモデル、任意の事前定義された項および他の既存のコスト関数の項をコスト関数111の項として組み合わせることによって、コスト関数を設計または更新する。
判定信号が自動的操作であることを示す場合、学習器モジュール106は、コマンドモジュール101を介して、ユーザの指示に従って、コスト関数の項を学習済みの項に追加、削除または置換するようにコスト関数111を更新する。一方、判定信号が手動操作であることを示す場合、学習器モジュール106は、新しく学習された項を自動的に追加するようにコスト関数111を設計または更新してもよい。学習器モジュール106は、学習された項の精度が所定の閾値に達した場合に、学習された項を追加するようににコスト関数111を更新してもよい。
また、コスト関数111は、上述したモデルまたは項のすべてを含む必要はない。コスト関数111は、モデルまたは項のいくつかを含むだけでよい。
学習器モジュール106は、項またはモデルを追加することによって、コスト関数111を生成してもよい。コスト関数111を線形または二次形式で表すことにより、最適化器105の処理を合理化することが可能である。学習器モジュール106は、結合された項またはモデルに対して所定の変換および重み付けをしてもよい。
本発明の実施形態では、学習器モジュール106から学習モデルのリスト113を受け取ると、コマンドモジュール101は、コスト関数設計システム100の深い専門知識や処理を必要とすることなしに、装置103の最適化に影響を及ぼしたり制御したりする簡単な方法をユーザに提供する。
一般的には、最適化される数量モデルは、第一原理、すなわち、数量のいくつかの理論的モデルに基づいて構築される必要がある。しかし、本実施形態では、コスト関数の一部として使用される数量モデルは、機械学習の技術を使用して自動的に取得される。したがって、数量の性質について全く知らなくても装置103を最適化することが可能である。
図2は、コマンドモジュール101が表示するインタフェースの例を示す説明図である。コマンドモジュール101は、最適化器105で使用されている現在のコスト関数111をインタフェース510の上部(領域511参照)に表示し、項の間の相対的な重要性を示している。図2に示す例では、各指標の係数(α、β)は、項の間の相対的な重要性を示す。
コマンドモジュール101は、データが収集されている異なる数量(領域512参照)を表示する。このリストはモジュールの出力であるが、入力の手段としても機能する。コマンドモジュール101は、個々の評価尺度を出力として表示してもよい(領域512M1−512M3参照)。例えば、(対応するボタンをクリックする入力方法を介して)評価尺度がユーザによって選択された場合、コマンドモジュール101は、評価尺度が装置103の他の変数にどのように依存するか表示してもよい。この情報は、評価尺度における学習を選択するか否かについてユーザを誘導するために使用されてもよい。ここでのユーザの決定入力は、学習器モジュール106に送信される。
コマンドモジュール101は、すべての評価尺度による学習を示す内容を表示してもよい(領域512A参照)。 この場合、コマンドモジュール101は、可能であれば装置103の変数に関してすべての評価尺度のモデルを見つけてもよい。
コマンドモジュール101は、学習された性能指標のリストを表示する(領域513、513I1−513I2参照)。指標のリストはユーザによって選択され、学習器モジュール106から送信される。コマンドモジュール101は、関心のあるユーザが確認できるように、指標ごとにモデルの詳細を表示してもよい。
さらに、コマンドモジュール101は、新しいサンプルの収集期間(領域514参照)、既存のモデルを更新するか否か(領域515参照)、および、自動または手動で更新するか否か(領域516参照)を表示する。コマンドモジュール101は、追加情報(領域517参照)を表示してもよい。
ここで、自律走行の場合に対応させて、図2に示す各項目を説明する。自律走行において、コスト関数111における“指標”は、車から目標までの距離および/または加速ペナルティの変化を示す。“指標インジケータ ML”の項は、燃料消費量、水平方向に対する振動など、学習された客観的な項を示す。“評価尺度”は、データが収集され得る、またはデータは収集されているが、まだモデルは学習されていない(例えば、振動などの)数量を示す。モデルが学習されると、それはリストに現れる。
図3は、選択された指標を利用可能なモデルの詳細を表示するインタフェースの例を示す説明図である。図3は、図2において“指標2”が選択された場合を示す。さらに、図3は、学習されたモデルについて所望の評価尺度ごとに技術的な詳細を表示した“エキスパートモード”を示す。
コマンドモジュール101は、コスト関数111の一部として学習されたモデルを使用してシミュレートされた(または、履歴的な)効果を分析結果として表示する。指標の適切な重みを選択する場合、この出力によってユーザを誘導できる。
図3に示す例では、縦軸に性能指標が設定され、横軸に移動時間が設定される。また、βを0から100に変更すると、コマンドモジュール101は、選択された指標についてモデル1およびモデル2の推移を表示する。さらに、コマンドモジュール101は、ユーザによって選択された各指標について得られたモデルの詳細(新規および既存)を表示する。モデルの詳細は、学習器モジュール106から受け取る。図3に示す例では、モデル1およびモデル2の詳細が表示される。
モデルの詳細(精度、考慮される過学習、現実的な特徴への依存など)に基づいて、ユーザ(エキスパート)は、性能指標を表すために使用されるモデルと、他の項との相対的な重みを選択できる。コマンドモジュール101は、ユーザからのモデルの選択を受け入れてもよく、コスト関数111の処理のためにこの決定を学習器モジュール106に送信してもよい。図3に示す例では、モデル2が好ましいモデルとして選択され、70が重み係数βとして選択される。
ユーザは、そのインタフェースから、学習された項の重みを選択でき、特徴や評価尺度の精度(例えば、平均二乗誤差)に基づいてどのモデルを使用するか選択できる。
なお、本実施形態のコスト関数設計システム100は、装置103を備えているが、装置103は、本発明のコスト関数設計システム100に含まれなくてもよい。この場合、コントローラ102は、制御信号109を他のデバイス(図示せず)に送信し、そのデバイスから出力信号107を受信してもよい。
コマンドモジュール101と、コントローラ102とは、プログラム(コスト関数設計プログラム)に従って動作するコンピュータのCPUによって実現される。例えば、プログラムは、コスト関数設計システム100内の記憶装置(図示せず)に記憶され、CPUは、そのプログラムを読み込み、プログラムに従って、コマンドモジュール101およびコントローラ102として動作してもよい。また、本発明のコスト関数設計システムにおける各機能は、SaaS(Software as a Service)形式で提供されてもよい。
コマンドモジュール101と、コントローラ102とは、それぞれ専用のハードウェアで実現されてもよい。また、コマンドモジュール101と、コントローラ102とは、それぞれ、汎用または専用の回路によって実現されてもよい。ここで、汎用または専用の回路は、単一のチップで構成されていてもよいし、バスを介して接続される複数のチップで構成されていてもよい。また、各装置の各構成要素の一部または全部が複数の情報処理装置または回路によって実現される場合には、複数の装置または回路等は、集中配置されていてもよいし、分散配置されていてもよい。機器や回路等は、クライアントサーバシステム、クラウドコンピューティングシステムなど、各々が通信ネットワークを介して接続される形態として実現されてもよい。
次に、本実施形態のコスト関数設計システムの一例を説明する。図4は、本実施形態におけるコスト関数設計システムの動作例を示すフローチャートである。
まず、ステップS201において、コマンドモジュール101は、追跡に使用される目標値とユーザの嗜好に関する情報とを含む基準信号112を受信する。ステップS202において、コマンドモジュール101は、判定信号および基準信号114を学習器モジュール106に送信する。判定信号および基準信号114は、ユーザによって選択された装置103の制御に関連するオプションを含んでいてもよい。そのオプションは、特定の学習モデルの使用、コスト関数モデル間の相対的な重要性の調整(例えば、パラメータの調整など)、使用する学習のタイプ(バッチ、オンラインなど)、もしくは、処理の自動化など、問題の選択および決定に関する情報を含む。
一方、ステップS203において、予測器104は、装置モデルを用いて予測された出力110を計算し、処理のために学習器モジュール106に送信する。ステップS204において、学習器モジュール106は、一旦データを受信すると、データから学習された項を用いてコスト関数111を構築し、これを最適化器105に送信する。
ステップS205において、最適化器105は、コスト関数111を解いて、所望の制御信号109を計算する。次に、最適化器105は、駆動させるために制御信号109を装置103に送信し、学習するために制御信号109を学習器モジュール106に送信し、理論的な出力を計算するために制御信号109を予測器104に送信する。
次に、ステップS206において、制御信号109が装置103に適用され、装置103がコントローラ102、具体的には学習器モジュール106に、出力信号107をフィードバックする。ステップS207において、学習器モジュール106は、新しい項の可用性に関する情報をコマンドモジュール101に送信する。その後、制御手順が必要であれば、ステップS201からステップS207までの処理が繰り返される。
次に、本実施形態の学習器モジュール106の例を説明する。図5は、本実施形態における学習器モジュール106の動作例を示すフローチャートである。
ステップS301において、学習器モジュール106は、各繰り返し処理において利用可能なデータ量を考慮する。具体的には、学習器モジュール106は、データ量が閾値に近いか否かを判断する。データ量が閾値に近くない場合(ステップS301におけるNo)、ステップS305の処理に進む。データ量が閾値に近い場合(ステップS301におけるYes)、ステップS302の処理に進む。なお、”閾値の近く”は、閾値とデータ量との差が所定範囲内であることを示す。
さらに、バッチまたはオンライン学習を行うかどうかの選択により、学習器モジュール106は、次に適用する方法を考慮して単にデータ記憶すると決定し、直接ステップS305の処理に進んでもよい。具体的には、学習器モジュール106は、バッチでの学習が選択されたときに、単にデータを記憶すると決定してもよい。
ステップS302において、学習器モジュール106は、機械学習の技術、例えばモデル推定法を用いて、コスト関数の項のモデルの構築を開始する。構築された項は、制御入力の関数であり、必要に応じて、出力信号107、外乱108、制御信号109および予測された出力110などの他の装置の出力関数である。
コスト関数の項のモデルの構築の開始は、バッチ学習とオンライン学習の選択に依存する。これは、バッチ式またはオンライン式において、利用可能なデータに機械学習アルゴリズムを適用してコスト関数モデルを構築することを意味する。具体的には、バッチ学習では、学習器モジュール106は、データ量またはサンプル数がある閾値を超えるとアルゴリズムを適用する。オンライン学習では、学習器モジュール106は、新しいサンプルを取得するとすぐにアルゴリズムを適用する。
ステップS303において、学習器モジュール106は、一旦コスト関数項のモデルを学習すると、学習された式を追加したり、既存の項を調整したりすることによってコスト関数111を更新する。学習器モジュール106は、コマンドモジュール101から得られた判定信号に基づいてコスト関数111を更新しないと選択してもよい。
ステップS304において、学習器モジュール106は、コスト関数111を設計する。既存の項と学習されたモデルの組み合わせを考慮し、利用可能な場合は更新されたバージョンの項を使用することによって、コスト関数の設計が完了する。さらに、学習器モジュール106は、収集されたデータから計算された誤差量を用いてコスト関数項の最適な組み合わせを自動的に構築または選択してもよい。次に、学習器モジュール106は、再設計されたコスト関数111を最適化器105に送信する。
ステップS305において、学習器モジュール106は、次の適用のためのデータを記憶する。
以上説明したように、本実施形態では、学習器モジュール106が、装置103の動作及び環境から取得したデータに基づいて、ユーザが関心を持っている数量の数量モデルを学習し、少なくとも数量モデル(コスト関数項)を項として含むように、装置103を最適に制御するための解の導出に使用されるコスト関数111を設計する。したがって、装置の制御を容易にすることができる最適なコスト関数を設計できる。
本実施形態では、予測された出力110または将来の応答信号は、オンライン処理で生成され得る。
図6は、本発明によるコスト関数設計システムをオンライン処理で実行する場合の例を示す説明図である。この場合、装置103は、学習器モジュール106だけでなく、学習するために出力信号107を予測器104にフィードバックする。したがって、本実施形態のコスト関数設計システムを、特許文献1に記載されているような既存の適応制御システムに用いることができる。
学習器モジュール106は、コスト関数項のモデルを構築するために、バッチまたはオンラインによる機械学習の技術を使用してもよい。また、学習器モジュール106は、ローカルコンピューティングを使用してもよい。すなわち、学習器モジュール106は、データを格納し、ローカルで計算を実行してもよく、インターネットベースでクラウドコンピューティングを使用してもよい。
学習器モジュール106を使用することにより、コスト関数の項を手動で考慮する必要がなくなるため、特に自動化された場合に、装置またはその構成要素の劣化に起因し得る不一致に対処できる。
さらに、装置の操作はユーザごとに異なる可能性があるが、2つのモジュール(すなわち、コマンドモジュール101および学習器モジュール106)を組み合わせることで、装置を操作する嗜好を個人的なものにしたりカスタマイズしたりすることが可能になる。これは、学習されたコスト関数モデルを(手動または自動で)使用するか否かをユーザが選択できるためであり、また、ユーザが、使用したモデルの数量を直接選択できるためである。
さらに、ユーザは、予め定義されたコスト関数の項と学習されたコスト関数の項との間の相対的重要性を規定または制御できる。上記の全ては、学習器モジュール106と密接に相互作用するコマンドモジュール101におけるインタフェースを使用して達成することができ、装置103を個人的なものに制御できる。コマンドモジュール101および学習器モジュール106は、ユーザからの初期決定入力に基づいて、自動的に相互に作用するようにすることもできる。
(例1)
好ましい実施形態の例として、装置103は、例えば、縦方向加速度および横方向加速度を含む少なくとも1つのアクチュエータ入力(制御信号109に対応する)を有する車両を表す。装置103は、また、道路や天候などの様々な外乱108の影響を受ける。装置の動作は、第一原理に基づく式を用いて記述できる。予測器104は、その式を用いて、車両に関する予測値(予測された出力110に対応する)を生成できる。この例では、関心の対象となる重要な変数は燃料消費量であり、これは、加速度、速度などのような数量に依存する。
コスト関数設計システム100は、コマンドモジュール101を介して、道路標識およびGPS信号などの基準信号を受信する。コスト関数設計システム100は、また、一旦燃料消費モデルが構築されると、自動的に又は手動で最適化するか否かに関する判定信号を受け取る。燃料消費モデルは、上述した実施形態の数量モデルに相当する。
一方、学習器モジュール106は、予測器104によって計算された速度値などの予測された出力110とともに、判定信号および基準信号114、最適化部105から入力された加速度信号(制御信号109に対応する)および、燃料消費モデルを構成する速度、燃費量、振動、温度など、装置103からの出力信号107を使用する。これらは、コスト関数111の一部として使用され得る。なお、燃料消費の項は、すでに存在し得る標的追跡の項や、加速の滑らかさを示す項などの典型的な性能評価尺度とともに使用され得る。
学習器モジュール106を使用することで、顧客は、サービスを受けるためにカスタマーセンタに出向くことなく、コスト関数設計システム100のコスト関数111における燃料消費モデルを更新できる。
車両の製造業者は、学習器モジュール106から収集されたデータや分析結果を使用することで、ユーザへのサービスを改善できる。また、ユーザは、期待される性能が低下した場合や異常が発生した場合に、コマンドモジュール101を介して、燃料消費量の項の使用をいつでも無効または有効にすることができる。
前述の処理は、例えば、装置の動作モデルを変更することにより、車両の動作に多大な影響を与えることなく自動的に実行でき、燃料を最適化できる。
(例2)
他の好ましい実施形態の例として、例2は、例1に類似するものである。関心のある変数は、車両の運転手又は乗客の快適さに関連する。例2では、最適化対象の数量は、例えば、振動であり、加速入力(制御信号109に対応する)の最適な選択により制御または抑制され得る。
この場合、学習器モジュール106およびコマンドモジュール101を使用することで、ユーザは、自身の好みにあうように振動の効果を個人的なものにすることができる。快適さに関連する設定は、非常に主観的であり、ユーザに大きく依存する。本発明の例2では、高いカスタマイズを可能にし、ユーザの要求または期待に合うように快適性を最適化するための制御ループを提供する。
次に、本発明の概要を説明する。図7は、本発明のコスト関数設計システムの概要を示すブロック図である。本発明のコスト関数設計システムは、制御対象である装置(例えば、装置103)の動作及び環境から取得したデータに基づいて、ユーザが関心をもつ数量を表す数量モデル(例えば、コスト関数項モデル)を学習する学習部81(例えば、学習器モジュール106)と、装置を最適に制御するための解の導出に使用されるコスト関数(例えば、コスト関数111)を、少なくとも前記数量モデルを項として含むように設計するコスト関数設計部82(例えば、学習器モジュール106)とを備えている。
そのような構成により、装置の制御を容易にすることができる最適なコスト関数を設計できる。
また、コスト関数設計システムは、設計されたコスト関数を最適化する最適化器(例えば、最適化器105)を備えていてもよい。そして、最適化器は、最適化の結果に基づく制御信号を装置に出力してもよい。そのような構成により、装置を動的に最適制御することが可能になる。
また、コスト関数設計システムは、設計されたコスト関数と学習されたモデルとを受信する指令部(例えば、コマンドモジュール101)を備えていてもよい。そして、指令部は、受信したコスト関数および学習モデルを表示し、そのコスト関数から除外するかコスト関数に含むかを示すモデル選択指示をユーザから受け付け、そのモデル選択指示を学習部に送信してもよい。そして、学習部81は、選択指示により、コスト関数に含むように指示されたモデルを学習し、コスト関数設計部82は、学習されたモデルを含むようにコスト関数を設計してもよい。そのような構成により、ユーザの意図を反映した最適制御が可能となる。また、そのような構成により、高い解釈可能性を有するため、装置の制御が容易になる最適なコスト関数を設計できる。
また、学習部81は、コスト関数の項として、新たに学習されたモデル、予め定義された項および既存の数量モデルを組み合わせるようにコスト関数を設計または更新してもよい。
また、コスト関数設計システムは、装置の挙動を表す装置モデルを用いて、その装置の予測結果を生成する予測器(例えば、予測器104)を備えていてもよい。そして、学習部81は、予測結果を用いてコスト関数を学習してもよい。そのような構成によれば、制御対象以外の変数を用いてモデルを学習できる。
好ましい実施形態および代替の実施形態に関する上記説明は、開示する発明の概念の範囲または適用可能性を限定または制限することを意図するものではない。当業者であれば、特許請求の範囲に記載された本開示の精神および範囲から逸脱することなく、そのような検討および添付の図面および特許請求の範囲から様々な変更、修正および変形が可能であることが容易に認識される。
101 コマンドモジュール
102 コントローラ
103 装置
104 予測器
105 最適化器
106 学習器モジュール
107 出力信号
108 外乱
109 制御信号
110 予測された出力
111 コスト関数
112 判定信号または基準信号
113 学習モデルのリスト
114 判定信号および基準信号

Claims (9)

  1. 制御対象である装置の動作及び環境から取得したデータに基づいて、ユーザが関心をもつ数量を表す数量モデルを学習する学習部と、
    前記装置を最適に制御するための解の導出に使用されるコスト関数を、少なくとも前記数量モデルを項として含むように設計するコスト関数設計部とを備えた
    ことを特徴とするコスト関数設計システム。
  2. 設計されたコスト関数を最適化する最適化器を備え、
    前記最適化器は、最適化の結果に基づく制御信号を装置に出力する
    請求項1記載のコスト関数設計システム。
  3. 設計されたコスト関数と学習されたモデルとを受信する指令部を備え、
    前記指令部は、受信したコスト関数および学習モデルを表示し、当該コスト関数から除外するかコスト関数に含むかを示すモデル選択指示をユーザから受け付け、前記モデル選択指示を学習部に送信し、
    学習部は、前記選択指示により、コスト関数に含むように指示されたモデルを学習し、
    コスト関数設計部は、学習されたモデルを含むようにコスト関数を設計する
    請求項1または請求項2記載のコスト関数設計システム。
  4. 学習部は、コスト関数の項として、新たに学習されたモデル、予め定義された項および既存の数量モデルを組み合わせるようにコスト関数を設計または更新する
    請求項1から請求項3のうちのいずれか1項に記載のコスト関数設計システム。
  5. 装置の挙動を表す装置モデルを用いて、当該装置の予測結果を生成する予測器を備え、
    学習部は、前記予測結果を用いてコスト関数を学習する
    請求項1から請求項4のうちのいずれか1項に記載のコスト関数設計システム。
  6. 制御対象である装置の動作及び環境から取得したデータに基づいて、ユーザが関心をもつ数量を表す数量モデルを学習し、
    前記装置を最適に制御するための解の導出に使用されるコスト関数を、少なくとも前記数量モデルを項として含むように設計する
    ことを特徴とするコスト関数設計方法。
  7. 設計されたコスト関数を最適化し、
    最適化の結果に基づく制御信号を装置に出力する
    請求項6記載のコスト関数設計方法。
  8. コンピュータに、
    制御対象である装置の動作及び環境から取得したデータに基づいて、ユーザが関心をもつ数量を表す数量モデルを学習する学習処理、および、
    前記装置を最適に制御するための解の導出に使用されるコスト関数を、少なくとも前記数量モデルを項として含むように設計するコスト関数設計処理
    を実行させるためのコスト関数設計プログラム。
  9. コンピュータに、
    設計されたコスト関数を最適化する最適化処理を実行させ、
    前記最適化処理で、最適化の結果に基づく制御信号を装置に出力させる
    請求項8記載のコスト関数設計プログラム。
JP2018530181A 2015-12-25 2015-12-25 コスト関数設計システム、コスト関数設計方法、およびコスト関数設計プログラム Active JP6702421B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2015/006474 WO2017109820A1 (en) 2015-12-25 2015-12-25 Cost function design system, cost function design method, and cost function design program

Publications (2)

Publication Number Publication Date
JP2019505889A true JP2019505889A (ja) 2019-02-28
JP6702421B2 JP6702421B2 (ja) 2020-06-03

Family

ID=55229776

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018530181A Active JP6702421B2 (ja) 2015-12-25 2015-12-25 コスト関数設計システム、コスト関数設計方法、およびコスト関数設計プログラム

Country Status (3)

Country Link
US (1) US20180373208A1 (ja)
JP (1) JP6702421B2 (ja)
WO (1) WO2017109820A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102884484B (zh) * 2009-12-31 2016-06-01 Abb研究有限公司 用于电厂的过程优化方法和系统
JP7036128B2 (ja) * 2018-01-16 2022-03-15 日本電気株式会社 制御装置、制御方法およびプログラム
US11526899B2 (en) 2019-10-11 2022-12-13 Kinaxis Inc. Systems and methods for dynamic demand sensing
US20210110298A1 (en) * 2019-10-15 2021-04-15 Kinaxis Inc. Interactive machine learning
US11886514B2 (en) 2019-10-11 2024-01-30 Kinaxis Inc. Machine learning segmentation methods and systems
US11385605B2 (en) * 2019-11-12 2022-07-12 Johnson Controls Tyco IP Holdings LLP Building control system with features for operating under intermittent connectivity to a cloud computation system
JP7467395B2 (ja) * 2021-07-29 2024-04-15 横河電機株式会社 情報処理装置、表示制御方法および表示制御プログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004152264A (ja) * 2002-09-11 2004-05-27 Fisher Rosemount Syst Inc 統合型モデル予測制御機能ブロックおよびオプチマイザ機能ブロックのための設定および閲覧用表示画面
US20050049728A1 (en) * 2003-08-28 2005-03-03 Pado Lawrence E. Neural network predictive control cost function designer
JP2011242981A (ja) * 2010-05-18 2011-12-01 Yamatake Corp 関数生成装置、及び関数生成方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6185470B1 (en) 1997-11-07 2001-02-06 Mcdonnell Douglas Corporation Neural network predictive control method and system
JP2005339241A (ja) * 2004-05-27 2005-12-08 Nissan Motor Co Ltd モデル予測制御装置および車両用推奨操作量生成装置
US7698249B2 (en) * 2007-01-22 2010-04-13 International Business Machines Corporation System and method for predicting hardware and/or software metrics in a computer system using models

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004152264A (ja) * 2002-09-11 2004-05-27 Fisher Rosemount Syst Inc 統合型モデル予測制御機能ブロックおよびオプチマイザ機能ブロックのための設定および閲覧用表示画面
US20050049728A1 (en) * 2003-08-28 2005-03-03 Pado Lawrence E. Neural network predictive control cost function designer
JP2011242981A (ja) * 2010-05-18 2011-12-01 Yamatake Corp 関数生成装置、及び関数生成方法

Also Published As

Publication number Publication date
US20180373208A1 (en) 2018-12-27
JP6702421B2 (ja) 2020-06-03
WO2017109820A1 (en) 2017-06-29

Similar Documents

Publication Publication Date Title
JP6702421B2 (ja) コスト関数設計システム、コスト関数設計方法、およびコスト関数設計プログラム
KR102191444B1 (ko) 우선순위화된 경험 메모리를 사용한 신경 네트워크의 트레이닝
KR102012676B1 (ko) 콘텐츠 추천 방법, 장치 및 시스템
US11573541B2 (en) Future state estimation device and future state estimation method
JP6721121B2 (ja) 制御カスタマイズシステム、制御カスタマイズ方法および制御カスタマイズプログラム
US11501215B2 (en) Hierarchical clustered reinforcement machine learning
US20190073587A1 (en) Learning device, information processing device, learning method, and computer program product
Sleet et al. On the computation of value correspondences for dynamic games
JP2019520642A (ja) 制御目的関数統合システム、制御目的関数統合方法、および、制御目的関数統合プログラム
JP6594780B2 (ja) 意思決定支援装置を備えるシステム及び意思決定支援方法
EP3772024A1 (en) Management device, management method, and management program
WO2019142728A1 (ja) 制御装置、制御方法およびプログラム記録媒体
Hosokawa et al. A reward allocation method for reinforcement learning in stabilizing control tasks
JP7336425B2 (ja) モデル学習装置、制御装置、モデル学習方法、および、コンピュータプログラム
Richards et al. Analytical performance prediction for robust constrained model predictive control
US11042786B2 (en) Learning processing device, data analysis device, analytical procedure selection method, and recording medium
JP7396478B2 (ja) モデル訓練プログラム、モデル訓練方法および情報処理装置
Tyulin et al. Intelligent systems for optimal production control of unique products
WO2021201189A1 (ja) 装置、方法、およびプログラム
WO2024050824A1 (en) Oversubscription reinforcement learner
CN108476084A (zh) Q学习中调整状态空间边界的方法和装置
US20230351201A1 (en) System and method for multi-objective reinforcement learning with gradient modulation
US7957943B2 (en) Method and system for modeling effects visually
Trejo-Banos et al. Experimental design for inference over the a. thaliana circadian clock network
KR20220085337A (ko) 클래스 간 밸런스가 보완된 기계 학습 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180608

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190820

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191016

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200204

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200407

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200420

R150 Certificate of patent or registration of utility model

Ref document number: 6702421

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150