JP6601577B2 - 制御目的関数統合システム、制御目的関数統合方法、および、制御目的関数統合プログラム - Google Patents

制御目的関数統合システム、制御目的関数統合方法、および、制御目的関数統合プログラム Download PDF

Info

Publication number
JP6601577B2
JP6601577B2 JP2018562278A JP2018562278A JP6601577B2 JP 6601577 B2 JP6601577 B2 JP 6601577B2 JP 2018562278 A JP2018562278 A JP 2018562278A JP 2018562278 A JP2018562278 A JP 2018562278A JP 6601577 B2 JP6601577 B2 JP 6601577B2
Authority
JP
Japan
Prior art keywords
objective function
expert
control
predicted
terms
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018562278A
Other languages
English (en)
Other versions
JP2019520642A (ja
Inventor
ウィマー ウィー
義男 亀田
力 江藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JP2019520642A publication Critical patent/JP2019520642A/ja
Application granted granted Critical
Publication of JP6601577B2 publication Critical patent/JP6601577B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • G05B13/028Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using expert systems only
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0205Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric not using a model or a simulator of the controlled system
    • G05B13/024Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric not using a model or a simulator of the controlled system in which a parameter or coefficient is automatically adjusted to optimise the performance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Automation & Control Theory (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Feedback Control In General (AREA)

Description

本発明は、明示的な性能指標の最適化と専門家の意思決定及び制御とを統合する制御目的関数統合システム、制御目的関数統合方法、および、制御目的関数統合プログラムに関する。
制御システムの主なタスクは、装置の操作者またはユーザに関連するコントローラ性能のある性質における最適化である。
コントローラ性能のこれらの性質は、異なるコスト関数や目的関数の項によって表される。この項は、非特許文献1の記載、例えば、第一の原理または装置の動特性に基づく数式を使用することによって手動で構築される。また、この項は、データを使用して自動的に構築される、すなわち、予測モデルを得るために収集された装置データを機械学習の手法を適用することにより構築される。AIまたは機械学習システムを使用して制御の決定に影響を及ぼす助言および補正因子を導出する同様の装置制御システムが、特許文献1に記載されている。
最適化のための所望の性能指標を捕捉する数学的原理および機械学習に基づいて異なる目的関数の項を構築できるにもかかわらず、実際には、ほとんどの性能指標または基準は、非常に複雑である。
さらに、多くの場合、様々な状況で専門家の行動を捕捉する場合、性能指標は、特定できない又は明示的に定義できない報酬または目的関数の項を有するため、その項は、装置を制御するための最適化において直接的な使用を妨げる。
非特許文献2で提案されているような機械学習モデルは、与えられた状況下における専門家の振る舞いを模倣するために使用されている。
そのようなエキスパートモデルは、専門家のデータから訓練される。すなわち、そのようなモデルは、装置が専門家によって制御または操作された際における装置の出力および対応する制御入力から訓練される。
これらのモデルを使用して、各時点で専門家が使用すると予測される制御入力を生成できる。
特開2014−174993号公報
J. M. Maciejowski, "Predictive Control with Constraints", Prentice Hall, 2001. P. Abbeel and A. Y. Ng, "Apprenticeship Learning via Inverse Reinforcement Learning", 2004. L. Ljung, "System Identification - Theory for the User, 2nd edition", PTR Prentice Hall, Upper Saddle River, N.J., 1999
エキスパートモデルが本質的にいくつかの明示的な性能基準と矛盾している可能性があるため、慣習的なアプローチでは、明示的な性能基準またはエキスパートモデルのいずれか一方のみが使用され、両方は使用されない。例えば、特許文献1に記載されたシステムは、各シナリオの利得および損失をそれぞれ計算する。
しかし、基準とする制御動作の一つの原因のみに依存することは、ある制限に関連付けられる。
例えば、エキスパートモデルのみを使用しても、そのようなモデルによって関連付けられた制御動作が生成された理由を十分に把握できない場合がある。
実際、エキスパートモデルは、人間の操作者またはユーザから入力または動作を生成するので、一般に解釈は困難である。
さらに、ユーザまたは操作者が対処を所望するような奥深くまたは複雑な性能指標を含んでいなかったり、考慮されていなかったりする可能性がある。
一方、明示的な性能基準のみを使用すると、専門家の動作を十分には捕捉できず、人間の操作者にとって自然ではない制御動作が生じる可能性がある。
本発明の主題は、上述する一つまたは複数の問題を解決する、または、少なくともその効果を低減するために、上記の特徴を実現することにある。
すなわち、本発明は、直接的な性能の最適化と専門家の動作及び制御とのバランスをとることができる制御目的関数統合システム、制御目的関数統合方法、および、制御目的関数統合プログラムを提供することを目的とする。
本発明の制御目的関数統合システムは、制御対象である装置又は同一又は類似の特性を有する装置を専門家が操作したときに収集されたデータを用いて学習された機械学習モデルであるエキスパートモデルに基づいて、予測された専門家の制御動作を生成するエキスパートモデル化部と、エキスパートモデル化部で予測された専門家の制御動作を含むメトリックまたは誤差測度を目的関数の項として構築する変換器と、変換器および目的関数の項として機械学習モデルを出力する学習器から異なる目的関数の項を収集し、最適化器で使用する集約されたコスト関数を構築するための、最適な重みの集合または目的関数の項の組合せを計算する結合器とを備えたことを特徴とする。
本発明の制御目的関数統合方法は、制御対象である装置又は同一又は類似の特性を有する装置を専門家が操作したときに収集されたデータを用いて学習された機械学習モデルであるエキスパートモデルに基づいて、予測された専門家の制御動作を生成し、エキスパートモデルに基づいて予測された専門家の制御動作を含むメトリックまたは誤差測度を目的関数の項として構築し、機械学習モデルを目的関数の項として出力する学習器から異なる目的関数の項を収集し、最適化器で使用する集約されたコスト関数を構築するための、最適な重みの集合または目的関数の項の組合せを計算することを特徴とする。
本発明の制御目的関数統合プログラムは、コンピュータに、制御対象である装置又は同一又は類似の特性を有する装置を専門家が操作したときに収集されたデータを用いて学習された機械学習モデルであるエキスパートモデルに基づいて、予測された専門家の制御動作を生成する処理、エキスパートモデルに基づいて予測された専門家の制御動作を含むメトリックまたは誤差測度を目的関数の項として構築する処理、および、機械学習モデルを目的関数の項として出力する学習器から異なる目的関数の項を収集し、最適化器で使用する集約されたコスト関数を構築するための、最適な重みの集合または目的関数の項の組合せを計算する処理を実行させることを特徴とする。
本発明によれば、明示的な性能指標の最適化と予測された専門家の入力との最適な組み合わせに基づく制御入力を計算することができる。
本発明による制御目的関数統合システムの一実施形態の構成例を示す説明図である。 実施形態における制御目的関数統合システムの動作例を示すフローチャートである。 本発明の制御目的関数統合システムの概要を示すブロック図である。
以下、図面を参照して、本発明の実施形態を説明する。本発明は、明示的な性能指標の最適化を専門家の意思決定及び制御と統合するための方法およびシステムに関する。本開示の主題の好ましい実施形態および代替の実施形態、並びに他の態様は、具体的な実施形態の詳細な説明および添付の図面を参照することで、理解され得る。
明示的な性能基準に基づくエキスパートモデルおよびコスト関数の項からの予測入力を統合する制御目標を構築するための方法およびシステムについて、本開示の実施形態に関する以下の議論は、事実上単なる例示であり、開示またはその適用または使用を限定するものではない。
図1は、本発明による制御目的関数統合システムの一実施形態の構成例を示す説明図である。
本実施形態の制御目的関数統合システム100は、コントローラ101と、装置102とを備えている。コントローラ101は、エキスパートモデル化部103と、学習器104と、装置モデル化部105と、変換器106と、結合器107と、最適化器108とを含む。
装置102は、装置の出力110をコントローラ101に送信する。装置の出力110は、装置102が備えるセンサ(図示せず)によって獲得される。装置102は、外乱109を装置の出力110として取得してもよい。
エキスパートモデル化部103は、装置の出力110を使用することにより、エキスパートモデルに基づいて、予測される専門家の制御動作または予測入力112を生成する。エキスパートモデルは、専門家のデータから構築される機械学習されたモデルであり、隠れマルコフモデルやマルコフ決定プロセスなどの予測モデルのクラスに属するものであってもよい。
エキスパートモデルは、制御対象である装置102を専門家が操作したときに収集されるデータを使用することにより学習される。エキスパートモデルは、同様のまたは類似する(同種の)特性の装置を専門家が操作したときに収集されるデータを使用することにより学習されてもよい。例えば、装置102が車両である場合、エキスパートモデルは、専門家の運転に関連する報酬または性能指標を暗黙的に記述するエキスパートドライバーモデルであってもよい。さらに、装置102(車両)は、同じ特性を有する他の装置(車両)から無線通信を介した更新(データストリームまたは学習された項)を受信してもよい。
エキスパートモデルは、例えば、非特許文献2に記載されている(マルコフ決定プロセスによる)逆強化学習や、(他の予測モデルを用いた)ベイズ法などの機械学習技術を使用して予め構築されていてもよい。エキスパートモデルの出力、すなわち、予測入力112は、変換器106によって使用される。
変換器106は、エキスパートモデル化部103で予測された専門家の制御動作(予測入力112)を含むメトリックまたは誤差測度を目的関数の項114として構築する。すなわち、変換器106は、予測入力112を含む誤差測度またはメトリックを構築する。この誤差測度は、変換器106の出力である目的関数の項114である。変換器106は、収集および処理のために、目的関数の項114を結合器107に送信する。
より詳しくは、変換器106は、ナレッジデータベースからの条件文を使用するエキスパートシステムや、機械学習技術を使用して、目的関数の項114を生成する。例えば、現在および予想される装置の状況に基づいて、変換器106は、エキスパートモデル化部103によって予測された専門家の入力とユーザが希望する最適な入力との間の偏差を測定するためのメトリックもしくは誤差測度、または、最適な目的関数を選択する。
また、特に注意要する可能性のある異なるユニットまたは特性を有する可能性があるため、変換器106は、各入力に対して適切なメトリックまたは誤差測定を選択する。
具体的な例として、制御入力が縦加速度およびハンドル角である自動運転または運転支援システムを考える。各時刻において、変換器106は、車両の物理条件およびその周囲に関連するデータ、例えば、速度、車線幅、交通状況などを受信する。変換器106は、これらの情報を処理し、ナレッジデータベースを使用して、制御入力に対する適切なメトリックまたは誤差測度、例えばユークリッドメトリックまたはフーバー損失関数を選択する。
すなわち、目的関数の項114は、快適さなどの専門家による制御入力(予測された専門家の制御動作)の結果として得られた評価を表す項であり、人間の感受性に関する性能指標とみなすことができる。例えば、目的関数の項114は、ロールの大きさ(装置からの出力)が小さいときに高い性能指標を返す数式によって表される。装置102の希望される状態は、制御目的関数統合システムの外部から変換器106に入力される。
装置モデル化部105は、装置の動特性を記述する装置モデルに基づいて予測出力111を生成する。予測出力111は、最適化器108からの現在または初期の制御入力117に依存する。装置モデルは、システム同定の分野の技術を用いて予め構築されていてもよい。このような方法は、例えば、非特許文献3に記載されている。
装置モデル化部105は、予測出力11を学習器104に供給する。予測出力111は、学習器104によって装置の出力110と共に学習データとして使用される。
学習器104は、収集されたデータ(具体的には、制御入力117、予測出力11および装置の出力110)に適用される機械学習技術を用いることにより、目的関数の項113として、制御可能な変数ごとの機械学習モデルを出力する。具体的には、学習器104は、既存の機械学習技術に基づく方法により、目的関数の項113を構築する。特に、高度なベイズの技術や解釈可能な機械学習モデルが使用される。
学習器104は、装置モデルで算出された予測出力111を用いて学習された目的関数の項113として、エネルギー効率等の性能指標を学習する。すなわち、目的関数の項113は、装置102および装置モデル化部105の出力データから構築される本質的に機械的な項であるといえる。例えば、目的関数の項113は、エンジン回転数(制御入力)に応じてエネルギー効率を算出する式で表される。
結合器107は、目的関数の項113および目的関数の項114を受信する。言い換えると、目的関数の項113および目的関数の項114は、結合器107によって収集される。結合器107は、多目的最適化のアプローチを使用して、目的関数の項(具体的には、目的関数の項113および目的関数の項114)とのバランスをとるための適切な重みを決定する。
結合器107は、計算された重み付け組合せに基づいて、目的関数を含むコスト関数115を構築する。その際、結合器107は、コスト関数115を構築するために基準信号116を受信してもよい。基準信号116は、ユーザの嗜好に関する情報として使用される目標値を含む。例えば、結合器107が自動運転に関するコスト関数115を構築する場合、基準信号116は、道路標識やGPS信号であってもよい。基準信号116は、また、(GPSを介した)所望の位置、速度、燃料消費量、および、移動時間であってもよい。結合器107は、コスト関数115を最適化器108に送信する。
このようにして、結合器107は、異なるクラスの目的関数の項を収集する。具体的には、結合器107は、異なる原理を使用して生成された二つの異なるタイプの目的関数の項を収集する。一つは、本質的に技術的であるか、または装置102によって収集されたデータから学習により得ることができる機械的原理(例えば、燃料消費)に従う量または尺度を表すクラスの項(目的関数の項113)である。他のクラスは、観察された専門家の行動を使用して学習されたエキスパートモデルから得られる、予測される専門家の入力を用いた、人間の技能、感受性または嗜好に関連する性能指標として働く項(目的関数の項114)からなる。結合器107は、最適化器108で使用するための集約されたコスト関数115を構築するために、重みの最適な組み合わせ、または、項の組合せを計算する。
例えば、目的関数の項113が式1であり、目的関数の項114が式2で表される場合、結合器107は、各式の重みA1およびA2(例えば、A1=0.4、A2=0.6)を算出し、各式に重みを掛けることにより、コスト関数L=A1×式1+A2×式2を決定してもよい。
最適化器108は、線形、二次または非線形プログラミング方法を用いてコスト関数115を最適化する。具体的には、最適化器108は、コスト関数115を使用して、装置102を作動させるために使用される最適な制御入力117を計算する。
エキスパートモデル化部103と、学習器104と、装置モデル化部105と、変換器106と、結合器107と、最適化器108とは、プログラム(制御目的関数統合プログラム)に従って動作するコンピュータのCPUによって実現される。例えば、プログラムは、制御目的関数統合システム100内の記憶装置(図示せず)に記憶され、CPUは、そのプログラムを読み込み、プログラムに従って、エキスパートモデル化部103、学習器104、装置モデル化部105、変換器106、結合器107および最適化器108として動作してもよい。また、本発明の制御目的関数統合システムにおける各機能は、SaaS(Software as a Service)形式で提供されてもよい。
エキスパートモデル化部103と、学習器104と、装置モデル化部105と、変換器106と、結合器107と、最適化器108とは、それぞれ専用のハードウェアで実現されてもよい。また、エキスパートモデル化部103と、学習器104と、装置モデル化部105と、変換器106と、結合器107と、最適化器108とは、それぞれ、汎用または専用の回路によって実現されてもよい。ここで、汎用または専用の回路は、単一のチップで構成されていてもよいし、バスを介して接続される複数のチップで構成されていてもよい。また、各装置の各構成要素の一部または全部が複数の情報処理装置または回路によって実現される場合には、複数の装置または回路等は、集中配置されていてもよいし、分散配置されていてもよい。機器や回路等は、クライアントサーバシステム、クラウドコンピューティングシステムなど、各々が通信ネットワークを介して接続される形態として実現されてもよい。
次に、本実施形態の制御目的関数統合システムの一例を説明する。図2は、本実施形態における制御目的関数統合システムの動作例を示すフローチャートである。ここでは、制御される変数が縦加速度およびハンドル角である半自動または完全自動運転のシナリオを想定する。
まず、ステップS201において、コントローラ101によって、基準信号116が入力または取得され、結合器107によって具体的に記憶される。ステップS202において、現在または初期の制御入力117に基づいて、学習器104およびエキスパートモデル化部103による処理のため、コントローラ101によって装置の出力110が取得される。
ステップS203において、エキスパートモデル化部103は、与えられた装置の出力110に対する予測入力112を計算する。ステップS204において、学習器104および変換器106は、目的関数の項113および目的関数の項114を同時に構築し、そのような項を結合器107に送信する。
一実施形態において、変換器106は、異なる誤差測度の衝突またはデータ内の異常値の存在に応じて、ユークリッド距離(またはその二乗)、または フーバー損失関数などのロバスト誤差測度から選択するために使用され得るナレッジデータベースを用いる。そのようなルールに使用される基準は、前に計算された入力における目的関数の項の値に基づくことができ、最適化においてどの項が優位であるかを示すことができる。
さらに、異なる制御ユニットに通常必要とされる正規化または標準化とは別に、変換器106は、例えば、車両速度、道路曲率および車線幅などの運転状況の特性に応じて、より適切なステアリングメトリックを採用できる。
変換器106は、また、機械学習アルゴリズムを使用して、センサデータまたはユーザ入力に応じて、加速度またはステアリングホイールのどの指標がユーザにとってより適切で快適であるかを検出および学習してもよい。
ステップS205において、結合器107は、目的関数の項を収集し、多目的最適化技術を使用して、目的関数の項113および目的関数の項114の最適な組合せまたは重みを計算して、結合されたコスト関数115を構築する。
自動運転の例では、結合器107は、適切な解を選択できる多数のパレート最適解を得るために、燃料効率およびターゲットまでの距離を考慮したパレートベースの多目的最適化アプローチを使用することができる。特に、パレート最適解の集合を使用して、関連する特徴または優位な解を決定できる。
最後に、ステップS206において、最適化器108は、装置102において作動させるための最適な制御入力117を計算し、装置モデル化部105で予測された出力の再計算を行う。
以上のように、本実施形態では、エキスパートモデル化部103が、エキスパートモデルに基づいて、予測された専門家の制御動作を生成し、変換器106が、エキスパートモデル化部103で予測された専門家の制御動作を含むメトリックまたは誤差測度を目的関数の項114として構築する。そして、結合器107が、変換器106および学習器104から異なる目的関数の項を収集し、最適化器108で使用する集約されたコスト関数115を構築するための、最適な重みの集合または目的関数の項の組合せを計算する。よって、明示的な性能指標の最適化と予測された専門家の入力との最適な組み合わせに基づく制御入力を計算することができる。
さらに、目的関数の項と専門家の予測を含む指標との間の相対的な重要性を決定する適切な重みを見つけることも重要である。本実施形態では、結合器107が、(パレートベースの)多目的最適化アプローチを採用する。よって、最適な重みを見つけることが可能になる。
次に、本発明の概要を説明する。図3は、本発明の制御目的関数統合システムの概要を示すブロック図である。本発明の制御目的関数統合システム80は、制御対象である装置(例えば、装置102)又は同一又は類似の特性を有する装置を専門家が操作したときに収集されたデータを用いて学習された機械学習モデルであるエキスパートモデルに基づいて、予測された専門家の制御動作を生成するエキスパートモデル化部81(例えば、エキスパートモデル化部103)と、エキスパートモデル化部81で予測された専門家の制御動作(例えば、予測入力112)を含むメトリックまたは誤差測度を目的関数の項(例えば、目的関数の項114)として構築する変換器82(例えば、変換器106)と、変換器82および目的関数の項として機械学習モデルを出力する学習器(例えば、学習器104)から異なる目的関数の項(例えば、目的関数の項113および目的関数の項114)を収集し、最適化器(例えば、最適化器108)で使用する集約されたコスト関数(例えば、コスト関数150)を構築するための、最適な重みの集合または目的関数の項の組合せを計算する結合器83(例えば、結合器107)とを備えている。
そのような構成により、明示的な性能指標の最適化と予測された専門家の入力との最適な組み合わせに基づく制御入力を計算することができる。
また、変換器82は、現在および予想される装置の状況に基づいて、エキスパートモデル化部81によって予測された専門家の入力とユーザが希望する最適な入力との間の偏差を測定するためのメトリックまたは誤差測度を選択してもよい。
また、結合器83は、異なる原理を使用して生成された二つの異なる目的関数の項のクラス(例えば、目的関数の項113および目的関数の項114)を収集してもよい。
具体的には、目的関数の項の一つのクラスが、本質的に機械的な量または尺度を表し、目的関数の項の他のクラスが、人間の技能、感受性または嗜好に関連する性能指標として働いてもよい。
また、結合器83は、パレートベースの多目的最適化アプローチを用いてもよい。
好ましい実施形態および代替の実施形態に関する上記説明は、開示する発明の概念の範囲または適用可能性を限定または制限することを意図するものではない。当業者であれば、特許請求の範囲に記載された本開示の精神および範囲から逸脱することなく、そのような検討および添付の図面および特許請求の範囲から様々な変更、修正および変形が可能であることが容易に認識される。
100 制御目的関数統合システム
101 コントローラ
102 装置
103 エキスパートモデル化部
104 学習器
105 装置モデル化部
106 変換器
107 結合器
108 最適化器

Claims (9)

  1. 制御対象である装置又は同一又は類似の特性を有する装置を専門家が操作したときに収集されたデータを用いて学習された機械学習モデルであるエキスパートモデルに基づいて、予測された専門家の制御動作を生成するエキスパートモデル化部と、
    前記エキスパートモデル化部で予測された専門家の制御動作を含むメトリックまたは誤差測度を目的関数の項として構築する変換器と、
    前記変換器および前記目的関数の項として機械学習モデルを出力する学習器から異なる目的関数の項を収集し、最適化器で使用する集約されたコスト関数を構築するための、最適な重みの集合または目的関数の項の組合せを計算する結合器とを備えた
    ことを特徴とする制御目的関数統合システム。
  2. 変換器は、現在および予想される装置の状況に基づいて、エキスパートモデル化部によって予測された専門家の入力とユーザが希望する最適な入力との間の偏差を測定するためのメトリックまたは誤差測度を選択する
    請求項1記載の制御目的関数統合システム。
  3. 結合器は、異なる原理を使用して生成された二つの異なる目的関数の項のクラスを収集する
    請求項1または請求項2記載の制御目的関数統合システム。
  4. 目的関数の項の一つのクラスは、本質的に機械的な量または尺度を表し、目的関数の項の他のクラスは、人間の技能、感受性または嗜好に関連する性能指標として働く
    請求項3記載の制御目的関数統合システム。
  5. 結合器は、パレートベースの多目的最適化アプローチを用いる
    請求項1から請求項4のうちのいずれか1項に記載の制御目的関数統合システム。
  6. 制御対象である装置又は同一又は類似の特性を有する装置を専門家が操作したときに収集されたデータを用いて学習された機械学習モデルであるエキスパートモデルに基づいて、予測された専門家の制御動作を生成し、
    前記エキスパートモデルに基づいて予測された専門家の制御動作を含むメトリックまたは誤差測度を目的関数の項として構築し、
    機械学習モデルを目的関数の項として出力する学習器から異なる目的関数の項を収集し、最適化器で使用する集約されたコスト関数を構築するための、最適な重みの集合または目的関数の項の組合せを計算する
    ことを特徴とする制御目的関数統合方法。
  7. 現在および予想される装置の状況に基づいて、予測された専門家の入力とユーザが希望する最適な入力との間の偏差を測定するためのメトリックまたは誤差測度を選択する
    請求項6記載の制御目的関数統合方法。
  8. コンピュータに、
    制御対象である装置又は同一又は類似の特性を有する装置を専門家が操作したときに収集されたデータを用いて学習された機械学習モデルであるエキスパートモデルに基づいて、予測された専門家の制御動作を生成する処理、
    エキスパートモデルに基づいて予測された専門家の制御動作を含むメトリックまたは誤差測度を目的関数の項として構築する処理、および、
    機械学習モデルを目的関数の項として出力する学習器から異なる目的関数の項を収集し、最適化器で使用する集約されたコスト関数を構築するための、最適な重みの集合または目的関数の項の組合せを計算する処理
    を実行させるための制御目的関数統合プログラム。
  9. コンピュータに、
    現在および予想される装置の状況に基づいて、予測された専門家の入力とユーザが希望する最適な入力との間の偏差を測定するためのメトリックまたは誤差測度を選択する処理を実行させる
    請求項8記載の制御目的関数統合プログラム。
JP2018562278A 2016-06-10 2016-06-10 制御目的関数統合システム、制御目的関数統合方法、および、制御目的関数統合プログラム Active JP6601577B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2016/002811 WO2017212508A1 (en) 2016-06-10 2016-06-10 Control objective integration system, control objective integration method and control objective integration program

Publications (2)

Publication Number Publication Date
JP2019520642A JP2019520642A (ja) 2019-07-18
JP6601577B2 true JP6601577B2 (ja) 2019-11-06

Family

ID=60577681

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018562278A Active JP6601577B2 (ja) 2016-06-10 2016-06-10 制御目的関数統合システム、制御目的関数統合方法、および、制御目的関数統合プログラム

Country Status (3)

Country Link
US (1) US11435705B2 (ja)
JP (1) JP6601577B2 (ja)
WO (1) WO2017212508A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020137019A1 (ja) * 2018-12-27 2020-07-02 日本電気株式会社 方策作成装置、制御装置、方策作成方法、及び、方策作成プログラムが格納された非一時的なコンピュータ可読媒体
WO2021100077A1 (ja) * 2019-11-18 2021-05-27 日本電気株式会社 最適化装置、最適化方法、記録媒体
JP7451182B2 (ja) * 2020-01-15 2024-03-18 日野自動車株式会社 制御装置
CN112363465B (zh) * 2020-10-21 2022-04-01 北京工业大数据创新中心有限公司 一种专家规则集训练方法、训练器和工业设备预警系统
US20230227061A1 (en) * 2022-01-14 2023-07-20 Aurora Operations, Inc. Systems and Methods for Pareto Domination-Based Learning

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH083750B2 (ja) 1987-12-15 1996-01-17 株式会社東芝 エキスパートシステムの検証装置
JPH07113842B2 (ja) 1989-02-22 1995-12-06 横河電機株式会社 温室栽培制御支援装置
JPH0836560A (ja) 1994-07-25 1996-02-06 Hitachi Ltd 多目的最適化方法
US6021369A (en) * 1996-06-27 2000-02-01 Yamaha Hatsudoki Kabushiki Kaisha Integrated controlling system
US6823675B2 (en) * 2002-11-13 2004-11-30 General Electric Company Adaptive model-based control systems and methods for controlling a gas turbine
US20080167820A1 (en) * 2007-01-04 2008-07-10 Kentaro Oguchi System for predicting driver behavior
US8036999B2 (en) * 2007-02-14 2011-10-11 Isagacity Method for analyzing and classifying process data that operates a knowledge base in an open-book mode before defining any clusters
GB2495265A (en) * 2011-07-07 2013-04-10 Toyota Motor Europe Nv Sa Artificial memory system for predicting behaviours in order to assist in the control of a system, e.g. stability control in a vehicle
US20130073113A1 (en) * 2011-09-16 2013-03-21 Ford Global Technologies, Llc Vehicle and method for estimating a range for the vehicle
US9477214B2 (en) 2013-03-07 2016-10-25 General Electric Company Plant control systems and methods
US10025301B2 (en) * 2014-08-29 2018-07-17 General Electric Company Method and system of adaptive model-based control for multiple-input multiple-output plants
US11767169B2 (en) * 2020-10-29 2023-09-26 Target Brands, Inc. Warehousing systems and methods

Also Published As

Publication number Publication date
WO2017212508A1 (en) 2017-12-14
US11435705B2 (en) 2022-09-06
US20190196419A1 (en) 2019-06-27
JP2019520642A (ja) 2019-07-18

Similar Documents

Publication Publication Date Title
JP6601577B2 (ja) 制御目的関数統合システム、制御目的関数統合方法、および、制御目的関数統合プログラム
US20180229723A1 (en) Feedback-Based Control Model Generation For An Autonomous Vehicle
US20170308052A1 (en) Cell controller for optimizing motion of production system including industrial machines
US11868866B2 (en) Controlling agents using amortized Q learning
US11257309B2 (en) Systems and methods to test an autonomous vehicle
CN107292344B (zh) 一种基于环境交互的机器人实时控制方法
CN109196432A (zh) 用于自动驾驶车辆的速度控制参数估计方法
CN108684203A (zh) 使用基于学习的模型预测控制来确定自动驾驶车辆的道路摩擦的方法和系统
CN108834425A (zh) 用于控制自动驾驶车辆重新进入自动驾驶模式的经度级联控制器预设
US20190219972A1 (en) System and method for context-driven predictive simulation selection and use
CN117141520B (zh) 一种实时轨迹规划方法、装置和设备
CN110308658A (zh) 一种pid参数整定方法、装置、系统及可读存储介质
CN114386599B (zh) 训练轨迹预测模型和轨迹规划的方法和装置
CN116759355A (zh) 一种晶圆传送控制方法及系统
Patil et al. Robust state and unknown input estimator and its application to robot localization
CN114529010A (zh) 一种机器人自主学习方法、装置、设备及存储介质
JP6608731B2 (ja) 対価設定装置及び対価設定方法
CN115151920A (zh) 驾驶评估方法、装置及非暂态计算机可读存储介质
JP2018147103A (ja) モデル学習装置、制御量算出装置、及びプログラム
US20240160548A1 (en) Information processing system, information processing method, and program
US11477243B2 (en) Off-policy control policy evaluation
RU2458390C1 (ru) Модифицированный интеллектуальный контроллер
Kent et al. Localization Uncertainty-driven Adaptive Framework for Controlling Ground Vehicle Robots
Bali et al. Power-efficient Strategies for Sensing in Autonomous Mobile Robots, a critical requirement of I4. 0 standard
Ejaz et al. Trust-aware safe control for autonomous navigation: Estimation of system-to-human trust for trust-adaptive control barrier functions

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181127

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181127

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190910

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190923

R150 Certificate of patent or registration of utility model

Ref document number: 6601577

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150