JPWO2020202316A1 - モデル予測制御装置、モデル予測制御プログラム、モデル予測制御システムおよびモデル予測制御方法 - Google Patents

モデル予測制御装置、モデル予測制御プログラム、モデル予測制御システムおよびモデル予測制御方法 Download PDF

Info

Publication number
JPWO2020202316A1
JPWO2020202316A1 JP2021511696A JP2021511696A JPWO2020202316A1 JP WO2020202316 A1 JPWO2020202316 A1 JP WO2020202316A1 JP 2021511696 A JP2021511696 A JP 2021511696A JP 2021511696 A JP2021511696 A JP 2021511696A JP WO2020202316 A1 JPWO2020202316 A1 JP WO2020202316A1
Authority
JP
Japan
Prior art keywords
time series
state
state quantity
model
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021511696A
Other languages
English (en)
Other versions
JP6929488B2 (ja
Inventor
秀一 瀬川
秀一 瀬川
敦 攝津
敦 攝津
正勝 外山
正勝 外山
裕喜 小中
裕喜 小中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Application granted granted Critical
Publication of JP6929488B2 publication Critical patent/JP6929488B2/ja
Publication of JPWO2020202316A1 publication Critical patent/JPWO2020202316A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0221Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving a learning process
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/048Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators using a predictor
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W60/00Drive control systems specially adapted for autonomous road vehicles
    • B60W60/001Planning or execution of driving tasks
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/32Operator till task planning
    • G05B2219/32335Use of ann, neural network
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/33Director till display
    • G05B2219/33027Artificial neural network controller

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Remote Sensing (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Mechanical Engineering (AREA)
  • Transportation (AREA)
  • Human Computer Interaction (AREA)
  • Feedback Control In General (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)

Abstract

操作パス生成部(210)が、状態センサ(101)から出力される計測状態量に基づいて、アクチュエータ(111)に対する操作量時系列を生成する。予測モデル部(220)が、前記計測状態量と前記操作量時系列とを入力にして予測モデルを演算することによって、状態量予測時系列を生成する。ニューラルネットワーク部(230)が、環境センサ(102)から出力される計測環境量と、前記状態量予測時系列と、を入力にしてニューラルネットワークを演算することによって、前記状態量予測時系列を補正する。状態量評価部(240)が、前記補正後の状態量時系列に対する評価結果を生成する。操作パス生成部が、前記評価結果が適正基準を満たす場合に前記操作量時系列の先頭の操作量を前記アクチュエータに出力する。

Description

本発明は、モデル予測制御に関するものである。
予測モデルを用いて制御対象を制御するモデル予測制御が知られている。
例えば、モデル予測制御は、車両の自動運転制御に利用することができる。
特許文献1には、外部環境に合わせて自動的にモデルを変更するモデル予測制御システムが開示されている。
このシステムでは、天候別に用意されたモデルから予測時の天候に対応するモデルが選択され、選択されたモデルが外気温に基づいて補正され、補正後のモデルを用いてモデル予測制御が行われる。
特開2000−99107号公報
特許文献1に開示されたシステムでは、想定外の外部環境に対応することができない。
例えば、晴れ用モデル、曇り用モデル、雨用モデルおよび雪用モデルが用意されていても、台風のような特別な天候に対して適切なモデルを選択することができない。また、予測時の天候に適したモデルを選択することができても、予測時の外気温が想定範囲外の温度である場合、モデルを適切に補正することができない。
その結果、モデル予測制御の精度が低下してしまう。
本発明は、想定外の環境においてもモデル予測制御の精度を維持できるようにすることを目的とする。
本発明のモデル予測制御装置は、
制御対象の状態を計測する状態センサから出力される計測状態量に基づいて、前記制御対象の状態を変化させるためにアクチュエータに対する操作量時系列を生成する操作量時系列生成部と、
前記計測状態量と前記操作量時系列とを入力にして予測モデルを演算することによって、前記制御対象の予測の状態量時系列である状態量予測時系列を生成する予測モデル部と、
前記制御対象の動作環境を計測する環境センサから出力される計測環境量と、前記状態量予測時系列と、を入力にしてニューラルネットワークを演算することによって、前記状態量予測時系列を補正するニューラルネットワーク部と、
補正後の状態量予測時系列を入力にして評価関数を演算することによって、前記補正後の状態量時系列に対する評価結果を生成する状態量評価部と、
前記評価結果が適正基準を満たす場合に前記操作量時系列の先頭の操作量を前記アクチュエータに出力する操作量決定部とを備える。
本発明によれば、予測モデルによって得られる状態量予測時系列と環境センサから出力される計測環境量とを入力にしてニューラルネットワークを演算することによって、状態量予測時系列が補正される。そのため、想定外の環境においても状態量予測時系列を補正することができる。したがって、想定外の環境においてもモデル予測制御の精度を維持することが可能である。
実施の形態1におけるモデル予測制御システム100の構成図。 実施の形態1におけるモデル予測制御装置200の構成図。 実施の形態1におけるモデル予測制御の説明図。 実施の形態1におけるモデル予測制御の説明図。 実施の形態1におけるモデル予測制御方法のフローチャート。 実施の形態1におけるニューラルネットワーク231を示す図。 ニューラルネットワーク231を使用しないモデル予測制御システム190の構成図。 車両の自動運転制御に使用されるモデル予測制御システム190の構成図。 モデル予測制御システム190による車両の自動運転制御を示す図。 車両の自動運転制御の説明図。 実施の形態2におけるモデル予測制御システム100の構成図。 実施の形態2におけるモデル予測制御装置200の構成図。 実施の形態2における履歴部280の構成図。 実施の形態2における学習方法の概要図。 実施の形態2における学習方法のクローチャート。 実施の形態3におけるモデル予測制御システム300の構成図。 実施の形態3におけるモデル予測制御装置400の構成図。 実施の形態3におけるモデル予測制御方法のフローチャート。 実施の形態3におけるニューラルネットワーク411を示す図。 実施の形態におけるモデル予測制御装置200のハードウェア構成図。 実施の形態におけるモデル予測制御装置400のハードウェア構成図。
実施の形態および図面において、同じ要素または対応する要素には同じ符号を付している。説明した要素と同じ符号が付された要素の説明は適宜に省略または簡略化する。図中の矢印はデータの流れ又は処理の流れを主に示している。
実施の形態1.
ニューラルネットワークを使用するモデル予測制御システム100について、図1から図10に基づいて説明する。
モデル予測制御システム100は、モデル予測制御(MPC)によって制御対象を制御するためのシステムである。モデル予測制御について後述する。
例えば、モデル予測制御システム100は、車両の自動運転を実現するために利用することができる。
***構成の説明***
図1に基づいて、モデル予測制御システム100の構成を説明する。
モデル予測制御システム100は、状態センサ群と環境センサ群とアクチュエータ群とモデル予測制御装置200とを備える。
状態センサ群は、1つ以上の状態センサ101である。
状態センサ101は、制御対象の状態を計測するためのセンサである。
例えば、制御対象は車両であり、状態センサ101は、速度センサまたは位置センサである。速度センサは車両の速度を計測する。位置センサは車両を測位する。
環境センサ群は、1つ以上の環境センサ102である。
環境センサ102は、制御対象の動作環境を計測するためのセンサである。
例えば、制御対象は車両であり、環境センサ102は、車重センサまたは姿勢センサである。車重センサは、車両の重量(乗員および荷物の重量を含む)を計測する。姿勢センサは車両の姿勢(傾き)を計測する。車両の姿勢は路面の傾斜に相当する。
アクチュエータ群は、1つ以上のアクチュエータ111である。
アクチュエータ111は、制御対象の状態を変化させる。
例えば、制御対象は車両であり、アクチュエータ111はステアリング、モータまたはブレーキである。
モデル予測制御装置200は、モデル予測制御(MPC)によって制御対象を制御するための装置である。モデル予測制御について後述する。
例えば、モデル予測制御装置200は、車両に対する自動運転制御を行う。
モデル予測制御装置200は、ニューラルネットワーク部230を備えることを特徴とする。
図2に基づいて、モデル予測制御装置200の構成を説明する。
モデル予測制御装置200は、プロセッサ201とメモリ202と補助記憶装置203と入出力インタフェース204と通信装置205といったハードウェアを備えるコンピュータである。これらのハードウェアは、信号線を介して互いに接続されている。
プロセッサ201は、演算処理を行うICであり、他のハードウェアを制御する。例えば、プロセッサ201は、CPU、DSPまたはGPUである。
ICは、Integrated Circuitの略称である。
CPUは、Central Processing Unitの略称である。
DSPは、Digital Signal Processorの略称である。
GPUは、Graphics Processing Unitの略称である。
メモリ202は揮発性の記憶装置である。メモリ202は、主記憶装置またはメインメモリとも呼ばれる。例えば、メモリ202はRAMである。メモリ202に記憶されたデータは必要に応じて補助記憶装置203に保存される。
RAMは、Random Access Memoryの略称である。
補助記憶装置203は不揮発性の記憶装置である。例えば、補助記憶装置203は、ROM、HDDまたはフラッシュメモリである。補助記憶装置203に記憶されたデータは必要に応じてメモリ202にロードされる。
ROMは、Read Only Memoryの略称である。
HDDは、Hard Disk Driveの略称である。
入出力インタフェース204は、入力装置および出力装置が接続されるポートである。例えば、入出力インタフェース204には、状態センサ群と環境センサ群とアクチュエータ群とが接続される。
USBは、Universal Serial Busの略称である。
通信装置205はレシーバ及びトランスミッタである。例えば、通信装置205は通信チップまたはNICである。
NICは、Network Interface Cardの略称である。
モデル予測制御装置200は、操作パス生成部210と予測モデル部220とニューラルネットワーク部230と状態量評価部240といった要素を備える。これらの要素はソフトウェアで実現される。
操作パス生成部210は、操作量時系列生成部211と操作量決定部212とを備える。
補助記憶装置203には、操作パス生成部210と予測モデル部220とニューラルネットワーク部230と状態量評価部240としてコンピュータを機能させるためのモデル予測制御装プログラムが記憶されている。モデル予測制御プログラムは、メモリ202にロードされて、プロセッサ201によって実行される。
補助記憶装置203には、さらに、OSが記憶されている。OSの少なくとも一部は、メモリ202にロードされて、プロセッサ201によって実行される。
プロセッサ201は、OSを実行しながら、モデル予測制御プログラムを実行する。
OSは、Operating Systemの略称である。
モデル予測制御プログラムの入出力データは記憶部290に記憶される。
メモリ202は記憶部290として機能する。但し、補助記憶装置203、プロセッサ201内のレジスタおよびプロセッサ201内のキャッシュメモリなどの記憶装置が、メモリ202の代わりに、又は、メモリ202と共に、記憶部290として機能してもよい。
モデル予測制御装置200は、プロセッサ201を代替する複数のプロセッサを備えてもよい。複数のプロセッサは、プロセッサ201の役割を分担する。
モデル予測制御プログラムは、光ディスクまたはフラッシュメモリ等の不揮発性の記録媒体にコンピュータ読み取り可能に記録(格納)することができる。
図3および図4に基づいて、モデル予測制御(MPC)について説明する。モデル予測制御は従来技術である。
まず、図3に基づいて、モデル予測制御を説明する。
モデル予測制御とは、制御対象の予測推定を用いて最適な制御入力を算出する制御手法の一つである。
モデル予測制御では、予測モデルと最適化器が使用される。予測モデルは、制御対象を模倣するためのモデルである。最適化器は、予測モデルの動作を評価して最適な制御入力を算出する。
操作パス生成部210と状態量評価部240との組が最適化器に相当する。
次に、図4に基づいて、モデル予測制御を説明する。操作量uは図3の制御入力u(t)に相当する。
モデル予測制御では、操作量の候補の時系列uiに基づいて予測状態量の時系列xiが生成され、予測状態量の良し悪しが評価関数によって判定される。この処理は、評価が高い予測状態量が得られるまで繰り返される。そして、評価が高い予測状態量に対応する操作量u1が出力される。
***動作の説明***
モデル予測制御システム100の動作はモデル予測制御方法に相当する。また、モデル予測制御装置200によるモデル予測制御方法の手順はモデル予測制御プログラムの手順に相当する。
図5に基づいて、モデル予測制御方法を説明する。
説明を分かりやすくするため、状態センサ群が1つの状態センサ101であり、環境センサ群が1つの環境センサ102であり、アクチュエータ群が1つのアクチュエータ111であるものとして説明を行う。
状態センサ101は、定期的に、制御対象の状態を計測し、計測状態量を出力する。計測状態量は、制御対象の状態を計測することによって得られた状態量である。状態量は、制御対象の状態を表す。
環境センサ102は、定期的に、制御対象の動作環境を計測し、計測環境量を出力する。計測環境量は、制御対象の動作環境を計測することによって得られた環境量である。環境量は、制御対象の動作環境を表す。
ステップS110からステップS160は、繰り返し実行される。
ステップS110において、操作量時系列生成部211は、状態センサ101から出力される計測状態量を受け付ける。
操作量時系列生成部211は、受け付けた計測状態量に基づいて、操作量時系列を生成する。
そして、操作量時系列生成部211は、計測状態量と操作量時系列とを出力する。
操作量時系列は、時刻順に並んだ複数の操作量であり、従来のモデル予測制御における操作量の候補の時系列uiに相当する(図4参照)。
操作量時系列を生成する方法は、従来のモデル予測制御において操作量の候補の時系列uiを生成する方法と同じである。
ステップS120において、予測モデル部220は、操作量時系列生成部211から出力される計測状態量と操作量時系列とを受け付ける。
予測モデル部220は、計測状態量と操作量時系列とを入力にして予測モデルを演算する。これにより、状態量予測時系列が生成される。
そして、予測モデル部220は、状態量予測時系列を出力する。
状態量予測時系列は、予測モデルによって予測された状態量時系列である。
状態量時系列は、時刻順に並んだ複数の状態量であり、従来のモデル予測制御における予測状態量の時系列xiに相当する(図4参照)。
状態量予測時系列を生成する方法は、従来のモデル予測制御において予測状態量の時系列xiを生成する方法と同じである。
ステップS130において、ニューラルネットワーク部230は、環境センサ102から出力される計測環境量と、予測モデル部220から出力される状態量予測時系列とを受け付ける。
ニューラルネットワーク部230は、計測環境量と状態量予測時系列とを入力にしてニューラルネットワーク231を演算する。これにより、状態量予測時系列が補正される。
そして、ニューラルネットワーク部230は、補正後の状態量予測時系列を出力する。
ニューラルネットワーク231について後述する。
ステップS140において、状態量評価部240は、ニューラルネットワーク部230から出力される補正後の状態量予測時系列を受け付ける。
ニューラルネットワーク部230は、補正後の状態量予測時系列を入力にして評価関数を演算する。これにより、状態量評価結果が生成される。
そして、状態量評価部240は、状態量評価結果を出力する。
状態量評価結果は、補正後の状態量予測時系列に対する評価結果であり、従来のモデル予測制御における予測状態量の時系列xiに対する評価結果に相当する(図4参照)。
状態量評価結果を生成する方法は、従来のモデル予測制御において予測状態量の時系列xiに対する評価結果を生成する方法と同じである。
ステップS150において、操作量決定部212は、状態量評価部240から出力される状態量評価結果を受け付ける。
そして、操作量決定部212は、状態量評価結果が適正基準を満たすか判定する。適正基準は、予め決められた基準である。判定方法は、従来のモデル予測制御における方法と同じである。
状態量評価結果が適正基準を満たす場合、ステップS110で生成された操作量時系列は、最適な操作量時系列、すなわち、最適解である。
ステップS110で生成された操作量時系列が最適解である場合、処理はステップS160に進む。
ステップS110で生成された操作量時系列が最適解でない場合、処理はステップS110に進む。そして、ステップS110において別の操作量時系列が生成される。
ステップS160において、操作量決定部212は、ステップS110で生成された操作量時系列(最適解)の先頭の操作量をアクチュエータ111に出力する。先頭の操作量を「第1操作量」と称する。
アクチュエータ111は、操作量決定部212から出力される第1操作量を受け付ける。そして、アクチュエータ111は、受け付けた第1操作量に従って動作する。その結果、制御対象の状態が変化する。
図6に基づいて、ニューラルネットワーク231について説明する
ニューラルネットワーク231は、モデル予測制御システム100用のニューラルネットワークである。
ニューラルネットワークの構成を説明する
ニューラルネットワークは、入力層と隠れ層と出力層とを有する。
それぞれの層は、1つ以上のノードを有する。円はノードを表している。
層間のノードはエッジで結ばれている。破線はエッジを表している。
それぞれのエッジには、重みが設定されている。
前の層のノードの値とエッジに設定されている重みとに基づいて、後の層のノードの値が決定する。
ニューラルネットワーク231では、状態量予測時系列(x1,・・・,xk)と、計測環境量(y0)が、入力層に対する入力となる。そして、補正後の状態量予測時系列(x’1,・・・,x’k)が、出力層からの出力となる。
***実施の形態1の効果***
図7から図10に基づいて、ニューラルネットワーク231を使用しないモデル予測制御装置191の課題について説明する。
図7に、ニューラルネットワーク231を使用しないモデル予測制御システム190の構成を示す。
モデル予測制御システム190は、環境センサ群を備えない。
また、モデル予測制御装置191は、ニューラルネットワーク部230に相当する機能を備えない。
そのため、モデル予測制御装置191は、計測環境量に基づいて、状態量予測時系列を補正することができない。
しかし、状態センサ群およびアクチュエータ群は外部環境にさらされる。そのため、状態センサ群によって計測された状態量およびアクチュエータ群によって変化した状態量が、状態量予測時系列と一致するとは限らない。
図8に、車両の自動運転制御に利用されるモデル予測制御システム190の構成を示す。
モデル予測制御システム190は、車速センサと位置センサといった状態センサを備える。また、モデル予測制御システム190は、ステアリングとモータとブレーキといったアクチュエータを備える。
モデル予測制御装置191は、車両の速度と車両の位置とに基づいて、ステアリング量、モータ出力およびブレーキ出力を決定する。
このモデル予測制御システム190を一般化すると、モデル予測制御システム190は、状態量に基づいて操作量を出力するシステムと考えることができる。
図9に、モデル予測制御システム190による車両の自動運転制御の様子を示す。
モデル予測制御装置191は、状態量x(車速、車両位置)を変動させるために操作量uを出力する。これにより、車両の走行経路が制御される。
図10に基づいて、車両の自動運転制御について説明する。
車両には、車重に基づく重力、路面からの応力および推進機による推進力などが生じる。
車両の加速量Δは、式(1)で表すことができる。
「M」は車重を表す。「θ」は車両の傾きを表す。「F」は推進機の操作量を表す。「g」は重力加速度を表す。
「Xgain」はゲイン補正量を表す。「Xsens」は計測状態量を表す。「Xofs」はオフセット補正量を表す。
Figure 2020202316
但し、各状態センサの校正を実施したうえで、他の誤差まで加味した補正を行う必要がある。また、計測状態量に非線形特性がある場合には別途考慮する必要がある。
さらに、ゲイン補正量Xgainおよびオフセット補正量Xofsは、動作環境に依存する。
そのため、動作環境を考慮しなければ、車両に対する自動運転制御の精度が悪くなる可能性がある。
一方、実施の形態1におけるモデル予測制御装置200は、ニューラルネットワーク231を使用することにより、動作環境を考慮した制御を実現する。その結果、高い精度で各種制御を行うことが可能となる。
例えば、車両の状態センサに対する正確なキャリブレーションを実施しなくても、精度が高い自動運転制御を実現することが可能となる。
実施の形態2.
ニューラルネットワーク231の重みパラメータを学習する形態について、主に実施の形態1と異なる点を図11から図15に基づいて説明する。
***構成の説明***
図11に基づいて、モデル予測制御システム100の構成を説明する。
モデル予測制御システム100の構成は、モデル予測制御装置200の構成を除いて、実施の形態1における構成と同じである(図1参照)。
図12に基づいて、モデル予測制御装置200の構成を説明する。
モデル予測制御装置200は、さらに、学習部250を備える。学習部250は、モデル演算部251と重みパラメータ学習部252とを備える。学習部250は、ソフトウェアによって実現される。
モデル予測制御プログラムは、さらに、学習部250としてコンピュータを機能させる。
モデル予測制御装置200は、さらに、履歴部280を備える。履歴部280は、メモリ202などの記憶装置によって実現される。
図13に基づいて、履歴部280の構成を説明する。
履歴部280には、状態量履歴281と環境量履歴282と操作量履歴283と状態量学習履歴284といったデータが記憶される。
状態量履歴281は、計測状態量の履歴、つまり、過去の計測状態量の集合である。過去の計測状態量を「過去状態量」と称する。過去状態量の時系列を「状態量過去時系列」と称する。
環境量履歴282は、計測環境量の履歴、つまり、過去の計測環境量の集合である。過去の計測環境量を「過去環境量」と称する。
操作量履歴283は、操作量の履歴、つまり、過去の操作量の集合である。過去の操作量を「過去操作量」と称する。過去操作量の時系列を「操作量過去時系列」と称する。
状態量学習履歴284は、状態量学習時系列の履歴、つまり、過去の状態量学習時系列の集合である。
状態量学習時系列は、ニューラルネットワーク231で使用される重みパラメータの学習用に生成される状態量学習時系列である。
***動作の説明***
図14に基づいて、学習部250による学習方法の概要を説明する。
「予測」は、状態量学習時系列を生成する処理を意味する。
状態量学習時系列は、状態量予測時系列に相当する。つまり、状態量学習時系列は、状態量予測時系列の生成に用いられる予測モデルと同じ予測モデルを演算することによって生成される。
「予測」では、操作量過去時系列および過去状態量が使用される。
操作量過去時系列は、過去操作量の時系列である。
操作量過去時系列の操作量u0として、第1時刻(t=1)の操作量u0が使用される。
操作量過去時系列の操作量u1として、第2時刻(t=2)の操作量u0が使用される。
操作量過去時系列の操作量u0として、第3時刻(t=3)の操作量u0が使用される。
過去状態量として、第1時刻(t=1)の状態量x0が使用される。
「学習」は、ニューラルネットワーク231で使用される重みパラメータの学習する処理を意味する。
「学習」では、状態量学習時系列および状態量過去時系列が使用される。
状態量過去時系列の状態量x1として、第2時刻(t=2)の状態量x0が使用される。
状態量過去時系列の状態量x2として、第3時刻(t=3)の状態量x0が使用される。
図15に基づいて、学習部250による学習方法を説明する。
学習方法は、繰り返し実施される。例えば、学習方法は、定期的に、または、アクチュエータ111へ操作量が出力される毎に実施される。
学習方法において、履歴部280は、以下のように動作する。
状態センサ101から計測状態量が出力される毎に、履歴部280は、出力された計測状態量が保存する。
環境センサ102から計測環境量が出力される毎に、履歴部280は、出力された計測環境量を保存する。
操作量決定部212からアクチュエータ111へ操作量が出力される毎に、履歴部280は、出力された操作量を保存する。
ステップS210において、モデル演算部251は、履歴部280から、過去状態量と操作量過去時系列とを取得する。
そして、モデル演算部251は、過去状態量と操作量過去時系列とを入力にして、予測モデルを演算する。モデル演算部251によって演算される予測モデルは、予測モデル部220によって演算される予測モデルと同じである。
これにより、状態量予測時系列に相当する状態量時系列が生成される。生成される状態量時系列を「状態量学習時系列」と称する。
モデル演算部251は、状態量学習時系列を履歴部280に保存する。
ステップS220において、重みパラメータ学習部252は、履歴部280から、過去環境量と状態量過去時系列と状態量学習時系列とを取得する。
そして、重みパラメータ学習部252は、状態量学習時系列と過去環境量と状態量過去時系列とを用いて、ニューラルネットワーク231の重みパラメータに対する機械学習を行う。
具体的には、重みパラメータ学習部252は、状態量学習時系列と過去環境量とを入力にしてニューラルネットワーク231を実行することによって得られる補正後の状態量学習時系列が状態量過去時系列と一致するように、ニューラルネットワーク231の重みパラメータを算出する。
ステップS230において、重みパラメータ学習部252は、機械学習で得られた重みパラメータ(学習結果)を評価する。
学習結果の評価は、以下のように行われる。
ステップS210において、モデル演算部251は、学習対象期間の複数の過去状態量と学習対象期間の複数の操作量過去時系列とを用いて、学習対象期間の複数の状態量学習時系列を生成する。
ステップS220において、重みパラメータ学習部252は、第一期間の複数の状態量学習時系列と第一期間の複数の過去環境量と第一期間の複数の状態量過去時系列とを用いて、ニューラルネットワーク231の重みパラメータに対する機械学習を行う。第一期間は、学習対象期間の一部である。例えば、第一期間は、学習対象期間の前半である。
ステップS230において、重みパラメータ学習部252は、機械学習で得られた重みパラメータをニューラルネットワーク231に仮設定する。次に、重みパラメータ学習部252は、第二期間の複数の状態量学習時系列と第二期間の複数の過去環境量とを入力にして、ニューラルネットワーク231を演算する。これにより、第二期間の複数の状態量補正時系列が得られる。第二期間は、学習対象期間の一部である。例えば、第二期間は、学習対象期間の後半である。状態量補正時系列は、補正後の状態量学習時系列である。そして、重みパラメータ学習部252は、第二期間の複数の状態量補正時系列と第二期間の複数の状態量過去時系列との誤差量に基づいて、学習結果を評価する。学習結果に対する評価は、ディープラーニングにおける一般的な指標を用いて行われる。
適切な学習結果が得られたという評価結果が得られた場合、処理はステップS240に進む。
適切な学習結果が得られなかったという評価結果が得られた場合、ステップS220で得られた重みパラメータが破棄され、学習方法の処理は終了する。この場合、ニューラルネットワーク231の重みパラメータは更新されない。
ステップS240において、重みパラメータ学習部252は、ステップS220で得られた重みパラメータをニューラルネットワーク231に設定する。これにより、ニューラルネットワーク231の重みパラメータが更新される。
ステップS240の後、ニューラルネットワーク部230は、更新後のニューラルネットワーク231を演算することによって、状態量予測時系列の補正を行う。
***実施の形態2の効果***
ニューラルネットワーク231の重みパラメータを学習することができる。そのため、ニューラルネットワーク231による補正の精度が向上する。その結果、モデル予測制御の精度が向上する。
実施の形態3.
二次計画法を用いて操作量を算出するモデル予測制御システム300について、図16から図19に基づいて説明する。
モデル予測制御システム300は、モデル予測制御(MPC)によって制御対象を制御するためのシステムである。モデル予測制御については実施の形態1で説明した通りである。
例えば、モデル予測制御システム300は、車両の自動運転を実現するために利用することができる。
***構成の説明***
図16に基づいて、モデル予測制御システム300の構成を説明する。
モデル予測制御システム300は、状態センサ群と環境センサ群とアクチュエータ群とモデル予測制御装置400とを備える。
状態センサ群は、1つ以上の状態センサ301である。
状態センサ301は、制御対象の状態を計測するためのセンサである。
例えば、制御対象は車両であり、状態センサ301は、速度センサまたは位置センサである。速度センサは車両の速度を計測する。位置センサは車両を測位する。
環境センサ群は、1つ以上の環境センサ302である。
環境センサ302は、制御対象の動作環境を計測するためのセンサである。
例えば、制御対象は車両であり、環境センサ302は、車重センサまたは姿勢センサである。車重センサは、車両の重量(乗員および荷物の重量を含む)を計測する。姿勢センサは車両の姿勢(傾き)を計測する。車両の姿勢は路面の傾斜に相当する。
アクチュエータ群は、1つ以上のアクチュエータ311である。
アクチュエータ311は、制御対象の状態を変化させる。
例えば、制御対象は車両であり、アクチュエータ311はステアリング、モータまたはブレーキである。
モデル予測制御装置400は、モデル予測制御(MPC)によって制御対象を制御するための装置である。
例えば、モデル予測制御装置400は、車両に対する自動運転制御を行う。
モデル予測制御装置400は、ニューラルネットワーク部410を備えることを特徴とする。
図17に基づいて、モデル予測制御装置400の構成を説明する。
モデル予測制御装置400は、プロセッサ401とメモリ402と補助記憶装置403と入出力インタフェース404と通信装置405といったハードウェアを備えるコンピュータである。これらのハードウェアは、信号線を介して互いに接続されている。
プロセッサ401は、演算処理を行うICであり、他のハードウェアを制御する。例えば、プロセッサ401はCPU、DSPまたはGPUである。
メモリ402は揮発性の記憶装置である。メモリ402は、主記憶装置またはメインメモリとも呼ばれる。例えば、メモリ402はRAMである。メモリ402に記憶されたデータは必要に応じて補助記憶装置403に保存される。
補助記憶装置403は不揮発性の記憶装置である。例えば、補助記憶装置403は、ROM、HDDまたはフラッシュメモリである。補助記憶装置403に記憶されたデータは必要に応じてメモリ402にロードされる。
入出力インタフェース404は、入力装置および出力装置が接続されるポートである。例えば、入出力インタフェース404には、状態センサ群と環境センサ群とアクチュエータ群とが接続される。
通信装置405はレシーバ及びトランスミッタである。例えば、通信装置405は通信チップまたはNICである。
モデル予測制御装置400は、ニューラルネットワーク部410と評価式生成部420とソルバ部430といった要素を備える。これらの要素はソフトウェアで実現される。
補助記憶装置403には、ニューラルネットワーク部410と評価式生成部420とソルバ部430としてコンピュータを機能させるためのモデル予測制御プログラムが記憶されている。モデル予測制御プログラムは、メモリ402にロードされて、プロセッサ401によって実行される。
補助記憶装置403には、さらに、OSが記憶されている。OSの少なくとも一部は、メモリ402にロードされて、プロセッサ401によって実行される。
プロセッサ401は、OSを実行しながら、モデル予測制御プログラムを実行する。
モデル予測制御プログラムの入出力データは記憶部490に記憶される。
メモリ402は記憶部490として機能する。但し、補助記憶装置403、プロセッサ401内のレジスタおよびプロセッサ401内のキャッシュメモリなどの記憶装置が、メモリ402の代わりに、又は、メモリ402と共に、記憶部490として機能してもよい。
モデル予測制御装置400は、プロセッサ401を代替する複数のプロセッサを備えてもよい。複数のプロセッサは、プロセッサ401の役割を分担する。
モデル予測制御プログラムは、光ディスクまたはフラッシュメモリ等の不揮発性の記録媒体にコンピュータ読み取り可能に記録(格納)することができる。
***動作の説明***
モデル予測制御システム100の動作はモデル予測制御方法に相当する。また、モデル予測制御装置200によるモデル予測制御方法の手順はモデル予測制御プログラムの手順に相当する。
図18に基づいて、モデル予測制御方法を説明する。
説明を分かりやすくするため、状態センサ群が1つの状態センサ101であり、環境センサ群が1つの環境センサ102であり、アクチュエータ群が1つのアクチュエータ111であるものとして説明を行う。
状態センサ301は、定期的に、制御対象の状態を計測し、計測状態量を出力する。計測状態量は、制御対象の状態を計測することによって得られた状態量である。状態量は、制御対象の状態を表す。
環境センサ302は、定期的に、制御対象の動作環境を計測し、計測環境量を出力する。計測環境量は、制御対象の動作環境を計測することによって得られた環境量である。環境量は、制御対象の動作環境を表す。
ステップS310からステップS330は、繰り返し実行される。
ステップS310において、ニューラルネットワーク部410は、状態センサ301から出力される計測状態量を受け付ける。
さらに、ニューラルネットワーク部410は、環境センサ302から出力される計測環境量を受け付ける。
ニューラルネットワーク部410は、計測状態量と計測環境量とを入力にしてニューラルネットワーク411を演算する。これにより、制御対象の状態の変化を予測するための予測モデルに設定されるモデルパラメータが算出される。
そして、ニューラルネットワーク部410は、算出したモデルパラメータを出力する。
予測モデルは、式(2)で表すことができる。
k+1 = Ax + Bu ・・・(2)
「x」は、制御対象のn番目の状態量である。
「u」は、アクチュエータ311に対するn番目の操作量である。
「A」は、モデルパラメータの一つであるマトリクスである。
「B」は、モデルパラメータの一つであるベクトルである。
図19に基づいて、ニューラルネットワーク411を説明する。
ニューラルネットワーク411は、モデル予測制御システム300用のニューラルネットワークである。
ニューラルネットワークの構成は、実施の形態1で説明した通りである。
ニューラルネットワーク411では、計測状態量x0と計測環境量y0が入力層に対する入力となる。そして、モデルパラメータ(A,B)が出力層からの出力となる。
(A00,・・・,Aij,・・・,Ann)は、マトリクスAを構成する。
(B,・・・,B,・・・,B)は、ベクトルBを構成する。
図18に戻り、ステップS320から説明を続ける。
ステップS320において、評価式生成部420は、算出されたモデルパラメータが設定された予測モデルに基づいて、二次計画法における評価式を生成する。生成される評価式は、アクチュエータ311に対する操作量時系列を評価するための式である。
そして、評価式生成部420は、二次計画法における評価式を出力する。
二次計画法における評価式について説明する。
予測モデルに対する評価関数は、式(3)で表すことができる。
「E」は、評価関数によって得られる評価値である。
「xTk」は、状態量の目標値である。
「x」は、マトリクスAとベクトルBとが設定された予測モデルを演算することによって算出される状態量である。
Figure 2020202316
評価関数の評価値Eを最適化する問題は、評価式の評価値Eを最適化することに相当する。評価式は、式(4)で表すことができる。
(u,・・・,u)は、操作量時系列である。
「Q」は、マトリクスである。
「R」は、ベクトルである。
Figure 2020202316
評価式生成部420は、マトリクスAとベクトルBとが設定された予測モデルに基づいて、評価式のマトリクスQと評価式のベクトルRとを算出する。
そして、評価式生成部420は、マトリクスQとベクトルRとを評価式に設定する。マトリクスQとベクトルRとのが設定された評価式が二次計画法における評価式である。
ステップS330において、ソルバ部430は、二次計画法における評価式を解くことによって、アクチュエータ311に与える操作量を算出する。
具体的には、ソルバ部430は、最適化ソルバ(二次計画ソルバ)を実行することによって、二次計画法における評価式を解く。
そして、ソルバ部430は、算出した操作量をアクチュエータ311に与える。
***実施の形態3の効果***
二次計画法を用いて操作量を算出するモデル予測制御システム300においても、実施の形態1と同じ効果を奏することができる。つまり、想定外の環境においても、モデル予測制御の精度を維持することが可能となる。
***実施の形態の補足***
図20に基づいて、モデル予測制御装置200のハードウェア構成を説明する。
モデル予測制御装置200は処理回路209を備える。
処理回路209は、操作パス生成部210と予測モデル部220とニューラルネットワーク部230と状態量評価部240と学習部250とを実現するハードウェアである。
処理回路209は、専用のハードウェアであってもよいし、メモリ202に格納されるプログラムを実行するプロセッサ201であってもよい。
処理回路209が専用のハードウェアである場合、処理回路209は、例えば、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ASIC、FPGAまたはこれらの組み合わせである。
ASICは、Application Specific Integrated Circuitの略称である。
FPGAは、Field Programmable Gate Arrayの略称である。
モデル予測制御装置200は、処理回路209を代替する複数の処理回路を備えてもよい。複数の処理回路は、処理回路209の役割を分担する。
モデル予測制御装置200において、一部の機能が専用のハードウェアで実現されて、残りの機能がソフトウェアまたはファームウェアで実現されてもよい。
このように、処理回路209はハードウェア、ソフトウェア、ファームウェアまたはこれらの組み合わせで実現することができる。
図21に基づいて、モデル予測制御装置400のハードウェア構成を説明する。
モデル予測制御装置400は処理回路409を備える。
処理回路409は、ニューラルネットワーク部410と評価式生成部420とソルバ部430とを実現するハードウェアである。
処理回路409は、専用のハードウェアであってもよいし、メモリ402に格納されるプログラムを実行するプロセッサ401であってもよい。
処理回路409が専用のハードウェアである場合、処理回路409は、例えば、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ASIC、FPGAまたはこれらの組み合わせである。
モデル予測制御装置400は、処理回路409を代替する複数の処理回路を備えてもよい。複数の処理回路は、処理回路409の役割を分担する。
モデル予測制御装置400において、一部の機能が専用のハードウェアで実現されて、残りの機能がソフトウェアまたはファームウェアで実現されてもよい。
このように、処理回路409はハードウェア、ソフトウェア、ファームウェアまたはこれらの組み合わせで実現することができる。
実施の形態は、好ましい形態の例示であり、本発明の技術的範囲を制限することを意図するものではない。実施の形態は、部分的に実施してもよいし、他の形態と組み合わせて実施してもよい。フローチャート等を用いて説明した手順は、適宜に変更してもよい。
モデル予測制御装置(200、400)は、複数の装置で構成されてもよい。例えば、クラウドに設けられたサーバ装置が学習部250を備え、クラウドにおいて学習方法の処理が実行されてもよい。
モデル予測制御装置(200、400)の要素である「部」は、「処理」または「工程」と読み替えてもよい。
100 モデル予測制御システム、101 状態センサ、102 環境センサ、111 アクチュエータ、190 モデル予測制御システム、191 モデル予測制御装置、200 モデル予測制御装置、201 プロセッサ、202 メモリ、203 補助記憶装置、204 入出力インタフェース、209 処理回路、210 操作パス生成部、211 操作量時系列生成部、212 操作量決定部、220 予測モデル部、230 ニューラルネットワーク部、231 ニューラルネットワーク、240 状態量評価部、250 学習部、251 モデル演算部、252 重みパラメータ学習部、280 履歴部、281 状態量履歴、282 環境量履歴、283 操作量履歴、284 状態量学習履歴、290 記憶部、300 モデル予測制御システム、301 状態センサ、302 環境センサ、311 アクチュエータ、400 モデル予測制御装置、401 プロセッサ、402 メモリ、403 補助記憶装置、404 入出力インタフェース、409 処理回路、410 ニューラルネットワーク部、411 ニューラルネットワーク、420 評価式生成部、430 ソルバ部、490 記憶部。

Claims (14)

  1. 制御対象の状態を計測する状態センサから出力される計測状態量に基づいて、前記制御対象の状態を変化させるためにアクチュエータに対する操作量時系列を生成する操作量時系列生成部と、
    前記計測状態量と前記操作量時系列とを入力にして予測モデルを演算することによって、前記制御対象の予測の状態量時系列である状態量予測時系列を生成する予測モデル部と、
    前記制御対象の動作環境を計測する環境センサから出力される計測環境量と、前記状態量予測時系列と、を入力にしてニューラルネットワークを演算することによって、前記状態量予測時系列を補正するニューラルネットワーク部と、
    補正後の状態量予測時系列を入力にして評価関数を演算することによって、前記補正後の状態量時系列に対する評価結果を生成する状態量評価部と、
    前記評価結果が適正基準を満たす場合に前記操作量時系列の先頭の操作量を前記アクチュエータに出力する操作量決定部と、
    を備えるモデル予測制御装置。
  2. 前記モデル予測制御装置は、
    前記状態センサから出力された計測状態量である過去状態量と前記アクチュエータに入力された操作量の時系列である操作量過去時系列とを入力にして前記予測モデルを演算することによって、学習用の状態量時系列である状態量学習時系列を生成するモデル演算部と、
    前記状態量学習時系列と、前記環境センサから出力された計測環境量である過去環境量と、前記状態センサから出力された計測状態量の時系列である状態量過去時系列とを用いて、前記ニューラルネットワークの重みパラメータに対する機械学習を行う重みパラメータ学習部とを備え、
    前記ニューラルネットワーク部は、前記機械学習によって得られた重みパラメータが設定されたニューラルネットワークを演算する
    請求項1に記載のモデル予測制御装置。
  3. 前記制御対象が車両であり、
    前記車両の自動運転制御のために用いられる
    請求項1または請求項2に記載のモデル予測制御装置。
  4. 制御対象の状態を計測する状態センサから出力される計測状態量に基づいて、前記制御対象の状態を変化させるためにアクチュエータに対する操作量時系列を生成する操作量時系列生成処理と、
    前記計測状態量と前記操作量時系列とを入力にして予測モデルを演算することによって、前記制御対象の予測の状態量時系列である状態量予測時系列を生成する予測モデル処理と、
    前記制御対象の動作環境を計測する環境センサから出力される計測環境量と、前記状態量予測時系列と、を入力にしてニューラルネットワークを演算することによって、前記状態量予測時系列を補正するニューラルネットワーク処理と、
    補正後の状態量予測時系列を入力にして評価関数を演算することによって、前記補正後の状態量時系列に対する評価結果を生成する状態量評価処理と、
    前記評価結果が適正基準を満たす場合に前記操作量時系列の先頭の操作量を前記アクチュエータに出力する操作量決定処理と、
    をコンピュータに実行させるためのモデル予測制御プログラム。
  5. 制御対象の状態を計測する状態センサと、
    前記制御対象の動作環境を計測する環境センサと、
    前記制御対象の状態を変化させるためのアクチュエータと、
    前記状態センサから出力される計測状態量に基づいて、前記アクチュエータに対する操作量時系列を生成する操作量時系列生成部と、
    前記計測状態量と前記操作量時系列とを入力にして予測モデルを演算することによって、前記制御対象の予測の状態量時系列である状態量予測時系列を生成する予測モデル部と、
    前記環境センサから出力される計測環境量と、前記状態量予測時系列と、を入力にしてニューラルネットワークを演算することによって、前記状態量予測時系列を補正するニューラルネットワーク部と、
    補正後の状態量予測時系列を入力にして評価関数を演算することによって、前記補正後の状態量時系列に対する評価結果を生成する状態量評価部と、
    前記評価結果が適正基準を満たす場合に前記操作量時系列の先頭の操作量を前記アクチュエータに出力する操作量決定部と、
    を備えるモデル予測制御システム。
  6. 前記モデル予測制御システムは、
    前記状態センサから出力された計測状態量である過去状態量と前記アクチュエータに入力された操作量の時系列である操作量過去時系列とを入力にして前記予測モデルを演算することによって、学習用の状態量時系列である状態量学習時系列を生成するモデル演算部と、
    前記状態量学習時系列と、前記環境センサから出力された計測環境量である過去環境量と、前記状態センサから出力された計測状態量の時系列である状態量過去時系列とを用いて、前記ニューラルネットワークの重みパラメータに対する機械学習を行う重みパラメータ学習部とを備え、
    前記ニューラルネットワーク部は、前記機械学習によって得られた重みパラメータが設定されたニューラルネットワークを演算する
    請求項5に記載のモデル予測制御システム。
  7. 前記制御対象が車両であり、
    前記車両の自動運転制御のために用いられる
    請求項5または請求項6に記載のモデル予測制御システム。
  8. 状態センサが、制御対象の状態を計測し、
    環境センサが、前記制御対象の動作環境を計測し、
    操作量時系列生成部が、前記状態センサから出力される計測状態量に基づいて、前記制御対象の状態を変化させるためのアクチュエータに対する操作量時系列を生成し、
    予測モデル部が、前記計測状態量と前記操作量時系列とを入力にして予測モデルを演算することによって、前記制御対象の予測の状態量時系列である状態量予測時系列を生成し、
    ニューラルネットワーク部が、前記環境センサから出力される計測環境量と、前記状態量予測時系列と、を入力にしてニューラルネットワークを演算することによって、前記状態量予測時系列を補正し、
    状態量評価部が、補正後の状態量予測時系列を入力にして評価関数を演算することによって、前記補正後の状態量時系列に対する評価結果を生成し、
    操作量決定部が、前記評価結果が適正基準を満たす場合に前記操作量時系列の先頭の操作量を前記アクチュエータに出力する
    モデル予測制御方法。
  9. 制御対象の状態を変化させるためのアクチュエータに操作量を与えるモデル予測制御装置であって、
    前記制御対象の状態を計測する状態センサから出力される計測状態量と、前記制御対象の動作環境を計測する環境センサから出力される計測環境量と、を入力にしてニューラルネットワークを演算することによって、前記制御対象の状態の変化を予測するための予測モデルに設定されるモデルパラメータを算出するニューラルネットワーク部と、
    算出されたモデルパラメータが設定された予測モデルに基づいて、前記アクチュエータに対する操作量時系列を評価するための式として、二次計画法における評価式を生成する評価式生成部と、
    二次計画法における前記評価式を解くことによって、前記アクチュエータに与える操作量を算出するソルバ部と、
    を備えるモデル予測制御装置。
  10. 前記制御対象が車両であり、
    前記車両の自動運転制御のために用いられる
    請求項9に記載のモデル予測制御装置。
  11. 制御対象の状態を変化させるためのアクチュエータに操作量を与えるためのモデル予測制御プログラムであって、
    前記制御対象の状態を計測する状態センサから出力される計測状態量と、前記制御対象の動作環境を計測する環境センサから出力される計測環境量と、を入力にしてニューラルネットワークを演算することによって、前記制御対象の状態の変化を予測するための予測モデルに設定されるモデルパラメータを算出するニューラルネットワーク処理と、
    算出されたモデルパラメータが設定された予測モデルに基づいて、前記アクチュエータに対する操作量時系列を評価するための式として、二次計画法における評価式を生成する評価式生成処理と、
    二次計画法における前記評価式を解くことによって、前記アクチュエータに与える操作量を算出するソルバ処理と、
    をコンピュータに実行させるためのモデル予測制御プログラム。
  12. 制御対象の状態を計測する状態センサと、
    前記制御対象の動作環境を計測する環境センサと、
    前記制御対象の状態を変化させるためのアクチュエータと、
    前記制御対象の状態を計測する状態センサから出力される計測状態量と、前記制御対象の動作環境を計測する環境センサから出力される計測環境量と、を入力にしてニューラルネットワークを演算することによって、前記制御対象の状態の変化を予測するための予測モデルに設定されるモデルパラメータを算出するニューラルネットワーク部と、
    算出されたモデルパラメータが設定された予測モデルに基づいて、前記アクチュエータに対する操作量時系列を評価するための式として、二次計画法における評価式を生成する評価式生成部と、
    二次計画法における前記評価式を解くことによって、前記アクチュエータに与える操作量を算出するソルバ部と、
    を備えるモデル予測制御システム。
  13. 前記制御対象が車両であり、
    前記車両の自動運転制御のために用いられる
    請求項12に記載のモデル予測制御システム。
  14. 制御対象の状態を変化させるためのアクチュエータに操作量を与えるモデル予測制御方法であって、
    状態センサが、前記制御対象の状態を計測し、
    環境センサが、前記制御対象の動作環境を計測し、
    ニューラルネットワーク部が、前記制御対象の状態を計測する状態センサから出力される計測状態量と、前記制御対象の動作環境を計測する環境センサから出力される計測環境量と、を入力にしてニューラルネットワークを演算することによって、前記制御対象の状態の変化を予測するための予測モデルに設定されるモデルパラメータを算出し、
    評価式生成部が、算出されたモデルパラメータが設定された予測モデルに基づいて、前記アクチュエータに対する操作量時系列を評価するための式として、二次計画法における評価式を生成し、
    ソルバ部が、二次計画法における前記評価式を解くことによって、前記アクチュエータに与える操作量を算出する
    モデル予測制御方法。
JP2021511696A 2019-03-29 2019-03-29 モデル予測制御装置、モデル予測制御プログラム、モデル予測制御システムおよびモデル予測制御方法 Active JP6929488B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2019/014180 WO2020202316A1 (ja) 2019-03-29 2019-03-29 モデル予測制御装置、モデル予測制御プログラム、モデル予測制御システムおよびモデル予測制御方法

Publications (2)

Publication Number Publication Date
JP6929488B2 JP6929488B2 (ja) 2021-09-01
JPWO2020202316A1 true JPWO2020202316A1 (ja) 2021-09-13

Family

ID=72666365

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021511696A Active JP6929488B2 (ja) 2019-03-29 2019-03-29 モデル予測制御装置、モデル予測制御プログラム、モデル予測制御システムおよびモデル予測制御方法

Country Status (5)

Country Link
US (1) US20210365033A1 (ja)
JP (1) JP6929488B2 (ja)
CN (1) CN113614652A (ja)
DE (1) DE112019006928T5 (ja)
WO (1) WO2020202316A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11922314B1 (en) * 2018-11-30 2024-03-05 Ansys, Inc. Systems and methods for building dynamic reduced order physical models
DE112019006928T5 (de) * 2019-03-29 2021-12-02 Mitsubishi Electric Corporation Modellprädiktive regelungsvorrichtung, modellprädiktives regelungsprogramm, modellprädiktives regelungssystem und modellprädiktives regelungsverfahren
TW202125343A (zh) * 2019-12-30 2021-07-01 瑞昱半導體股份有限公司 時間序列預測方法及相關的時間序列預測電路
WO2024062626A1 (ja) * 2022-09-22 2024-03-28 富美男 大庭 演算装置、集積回路、機械学習装置、判別装置、制御方法、及び、制御装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08211903A (ja) * 1995-02-06 1996-08-20 Meidensha Corp モデル予測制御におけるオートチューニング装置
JPH09504129A (ja) * 1993-10-07 1997-04-22 ハネウエル・インコーポレーテッド モデル予測制御用のニューラルネットベースの外乱予測子
JP2002157003A (ja) * 2000-11-17 2002-05-31 Fuji Electric Co Ltd 多変数モデル予測制御装置、方法、及びその記憶媒体
JP2005044337A (ja) * 2003-06-05 2005-02-17 Fisher Rosemount Syst Inc 非線形予測機能を備える多重入力/多重出力制御ブロック
JP2007198170A (ja) * 2006-01-24 2007-08-09 Isuzu Motors Ltd 燃料噴射量学習制御方法
CN104238366A (zh) * 2014-09-29 2014-12-24 中国科学院自动化研究所 基于神经元网络的压电陶瓷执行器的预测控制方法及装置
WO2016170786A1 (ja) * 2015-04-21 2016-10-27 パナソニックIpマネジメント株式会社 情報処理システム、情報処理方法、およびプログラム
US20170139423A1 (en) * 2015-11-12 2017-05-18 King Fahd University Of Petroleum And Minerals Control system and method for multi-vehicle systems
CN107561942A (zh) * 2017-09-12 2018-01-09 重庆邮电大学 基于模型补偿的智能车辆轨迹跟踪模型预测控制方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000099107A (ja) * 1998-09-25 2000-04-07 Hitachi Ltd モデル予測制御システム
JP3743247B2 (ja) * 2000-02-22 2006-02-08 富士電機システムズ株式会社 ニューラルネットワークによる予測装置
JP2006302078A (ja) * 2005-04-22 2006-11-02 Yamatake Corp 制御対象モデル生成装置および生成方法
JP4644522B2 (ja) * 2005-05-06 2011-03-02 国立大学法人 千葉大学 小型無人ヘリコプタの自律飛行制御装置及び自律飛行制御方法
JP2007276052A (ja) * 2006-04-06 2007-10-25 Sony Corp 制御システム、記録システム、情報処理装置および方法、プログラム、並びに記録媒体
US8880962B2 (en) * 2012-04-24 2014-11-04 International Business Machines Corporation Maintenance planning and failure prediction from data observed within a time window
CN106143533A (zh) * 2015-04-21 2016-11-23 深圳市神拓机电股份有限公司 一种工矿用车辆安全监控的方法、系统和装置
US10410113B2 (en) * 2016-01-14 2019-09-10 Preferred Networks, Inc. Time series data adaptation and sensor fusion systems, methods, and apparatus
WO2019216975A1 (en) * 2018-05-07 2019-11-14 Strong Force Iot Portfolio 2016, Llc Methods and systems for data collection, learning, and streaming of machine signals for analytics and maintenance using the industrial internet of things
US20180218262A1 (en) * 2017-01-31 2018-08-02 Panasonic Intellectual Property Corporation Of America Control device and control method
US10580228B2 (en) * 2017-07-07 2020-03-03 The Boeing Company Fault detection system and method for vehicle system prognosis
CN109389863B (zh) * 2017-08-02 2021-08-13 华为技术有限公司 提示方法及相关设备
US11681929B2 (en) * 2018-10-02 2023-06-20 Honeywell International Inc. Methods and systems for predicting a remaining useful life of a component using an accelerated failure time model
DE112019006928T5 (de) * 2019-03-29 2021-12-02 Mitsubishi Electric Corporation Modellprädiktive regelungsvorrichtung, modellprädiktives regelungsprogramm, modellprädiktives regelungssystem und modellprädiktives regelungsverfahren
EP4264518A1 (en) * 2020-12-18 2023-10-25 Strong Force VCN Portfolio 2019, LLC Robot fleet management and additive manufacturing for value chain networks

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09504129A (ja) * 1993-10-07 1997-04-22 ハネウエル・インコーポレーテッド モデル予測制御用のニューラルネットベースの外乱予測子
JPH08211903A (ja) * 1995-02-06 1996-08-20 Meidensha Corp モデル予測制御におけるオートチューニング装置
JP2002157003A (ja) * 2000-11-17 2002-05-31 Fuji Electric Co Ltd 多変数モデル予測制御装置、方法、及びその記憶媒体
JP2005044337A (ja) * 2003-06-05 2005-02-17 Fisher Rosemount Syst Inc 非線形予測機能を備える多重入力/多重出力制御ブロック
JP2007198170A (ja) * 2006-01-24 2007-08-09 Isuzu Motors Ltd 燃料噴射量学習制御方法
CN104238366A (zh) * 2014-09-29 2014-12-24 中国科学院自动化研究所 基于神经元网络的压电陶瓷执行器的预测控制方法及装置
WO2016170786A1 (ja) * 2015-04-21 2016-10-27 パナソニックIpマネジメント株式会社 情報処理システム、情報処理方法、およびプログラム
US20170139423A1 (en) * 2015-11-12 2017-05-18 King Fahd University Of Petroleum And Minerals Control system and method for multi-vehicle systems
CN107561942A (zh) * 2017-09-12 2018-01-09 重庆邮电大学 基于模型补偿的智能车辆轨迹跟踪模型预测控制方法

Also Published As

Publication number Publication date
WO2020202316A1 (ja) 2020-10-08
DE112019006928T5 (de) 2021-12-02
US20210365033A1 (en) 2021-11-25
CN113614652A (zh) 2021-11-05
JP6929488B2 (ja) 2021-09-01

Similar Documents

Publication Publication Date Title
JP6929488B2 (ja) モデル予測制御装置、モデル予測制御プログラム、モデル予測制御システムおよびモデル予測制御方法
US10408638B2 (en) System and method for controlling a vehicle under sensor uncertainty
CN107110650B (zh) 在能观测性方面受约束的导航状态的估计方法
CN105180935B (zh) 一种适用于gnss微弱信号的组合导航数据融合方法
JP2020535539A (ja) システムを制御する予測コントローラ、車両及び方法
KR101242678B1 (ko) 제어 파라미터를 적응적으로 변화시키는 pid 제어 방법 및 이를 이용한 pid 제어 장치
US20230333518A1 (en) Adjustment system, adjustment method, and adjustment program
JP2020123269A (ja) 演算装置
CN117171873A (zh) 车辆空气动力学优化方法、装置和车辆
WO2020054345A1 (ja) 電子制御装置、ニューラルネットワーク更新システム
US9709967B2 (en) Method and device for creating a data-based function model
EP2778640B1 (en) Outside air temperature measurement device and method
WO2023281943A1 (ja) タイヤ管理装置、プログラム及びタイヤ管理方法
CN116300465A (zh) 一种自平衡车控制方法、系统、存储介质及电子设备
JP4529964B2 (ja) シミュレーション装置、シミュレーション方法及びシミュレーションプログラム
KR102427366B1 (ko) 심층 신경망을 이용한 차선 추정 방법 및 장치
JP7031625B2 (ja) グラフ構造推定装置、slam装置、グラフ構造推定方法、コンピュータプログラム、および記憶媒体
CN114076964A (zh) 用于借助于卡尔曼滤波器确定至少一个系统状态的方法
CN115004194A (zh) 使用不同时间常数的利用矩估计的学习
KR20230148833A (ko) 칼만 필터를 사용하여 적어도 하나의 시스템 상태를 결정하는 방법
US20230229966A1 (en) Deep learning based arrival time prediction system
US20220058176A1 (en) Method for assessing validation points for a simulation model
WO2023286866A1 (ja) 演算装置、演算方法及びプログラム
JP7409037B2 (ja) 推定装置、推定方法、推定プログラム
CN117360532A (zh) 估计车辆质量的方法及装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210408

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20210408

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210713

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210810

R150 Certificate of patent or registration of utility model

Ref document number: 6929488

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150