JP6933585B2 - Information processing device, information processing method, computer program, control device - Google Patents

Information processing device, information processing method, computer program, control device Download PDF

Info

Publication number
JP6933585B2
JP6933585B2 JP2018003459A JP2018003459A JP6933585B2 JP 6933585 B2 JP6933585 B2 JP 6933585B2 JP 2018003459 A JP2018003459 A JP 2018003459A JP 2018003459 A JP2018003459 A JP 2018003459A JP 6933585 B2 JP6933585 B2 JP 6933585B2
Authority
JP
Japan
Prior art keywords
operation amount
time
initial condition
state
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018003459A
Other languages
Japanese (ja)
Other versions
JP2019125021A (en
Inventor
竜大 森安
竜大 森安
松栄 上田
松栄 上田
真 永岡
真 永岡
池田 太郎
太郎 池田
神保 智彦
智彦 神保
俊洋 中村
俊洋 中村
松永 彰生
彰生 松永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Toyota Central R&D Labs Inc
Original Assignee
Toyota Motor Corp
Toyota Central R&D Labs Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp, Toyota Central R&D Labs Inc filed Critical Toyota Motor Corp
Priority to JP2018003459A priority Critical patent/JP6933585B2/en
Publication of JP2019125021A publication Critical patent/JP2019125021A/en
Application granted granted Critical
Publication of JP6933585B2 publication Critical patent/JP6933585B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、情報処理装置に関する。 The present invention relates to an information processing device.

各分野において、モデル予測制御(MPC:Model Predictive Control)を利用した制御手法が利用されている。モデル予測制御とは、なんらかの制御パラメータについて、各時刻において未来の応答を予測しながら最適化を行う(最適解を見つける)制御手法である。例えば、特許文献1には、モデル予測制御を利用した内燃機関の制御に関し、内燃機関の制御要素(例えば、ターボチャージャ、排気再循環)のモデルを用いた反復計算によって、有限区間内で制御要素の動作を最適化することが記載されている。例えば、特許文献2には、モデル予測制御を利用して、車両制御を行うためのテーブルや、車両の制御変数を算出する近似式を作成することが記載されている。 In each field, a control method using model predictive control (MPC) is used. Model prediction control is a control method that optimizes some control parameters while predicting future responses at each time (finding the optimum solution). For example, in Patent Document 1, regarding the control of an internal combustion engine using model predictive control, the control element is performed within a finite section by iterative calculation using a model of the control element of the internal combustion engine (for example, turbocharger, exhaust gas recirculation). It is described to optimize the operation of. For example, Patent Document 2 describes that a table for performing vehicle control and an approximate expression for calculating control variables of a vehicle are created by using model prediction control.

特開2011−253536号公報Japanese Unexamined Patent Publication No. 2011-253536 特許第5870632号公報Japanese Patent No. 5870632

特許文献1では、各時刻においてリアルタイムに、最適解を見つけるための反復計算を行っている。この反復計算には膨大な量の演算が必要であるため、処理負荷が高く、処理に時間を要し、リアルタイム処理が不可能な場合も生じるという課題があった。特許文献2では、予め反復計算によって得られたテーブルあるいは近似式を作成しているため、リアルタイムな反復計算を必要としない。しかし、例えば内燃機関の制御のように、制御パラメータの最適解を導出するために、多くの要素(例えば、数十個)が関連する初期条件を持つ複雑なシステムを対象とする場合、極めて多次元のテーブルあるいは近似式が必要となる。このように多くの要素を含む初期条件について、網羅的な試行によって多次元のテーブルあるいは近似式を作成することは、組み合わせ数の爆発的増加のため困難であるが、特許文献2では、このような課題について何ら記載されていない。 In Patent Document 1, iterative calculation for finding the optimum solution is performed in real time at each time. Since this iterative calculation requires a huge amount of operations, there is a problem that the processing load is high, the processing takes time, and real-time processing may not be possible. In Patent Document 2, since a table or an approximate expression obtained by iterative calculation is created in advance, real-time iterative calculation is not required. However, when targeting a complex system with initial conditions in which many elements (for example, dozens) are related in order to derive the optimum solution of control parameters, for example, control of an internal combustion engine, it is extremely common. A table of dimensions or an approximate expression is required. It is difficult to create a multidimensional table or an approximate expression by exhaustive trials for the initial conditions including such many elements due to the explosive increase in the number of combinations. There is no mention of any issues.

本発明は、上述した課題を解決するためになされたものであり、モデル予測制御を利用し制御において、処理負荷の低減と処理時間の短縮とを図るとともに、初期条件生成の効率化を図ることを目的とする。 The present invention has been made to solve the above-mentioned problems, and in the control using model prediction control, the processing load is reduced, the processing time is shortened, and the efficiency of initial condition generation is improved. The purpose is.

本発明は、上述の課題の少なくとも一部を解決するためになされたものであり、以下の形態として実現することが可能である。情報処理装置であって、アクチュエータの操作量の変化に応じた、制御対象部の状態の変化をモデル化したモデル式を予め記憶するモデル式記憶部と、前記アクチュエータの操作量の時系列信号と、前記制御対象部の状態の時系列信号と、を少なくとも含む初期条件を記憶する初期条件記憶部と、前記初期条件記憶部内の各時刻における前記初期条件に対して、当該初期条件における前記アクチュエータの最適な操作量である最適操作量を対応付けて記憶する最適操作量記憶部と、予め作成された前記アクチュエータの操作量の時系列信号を、前記モデル式記憶部内の前記モデル式に適用することで、前記制御対象部の状態の予測値の時系列信号を生成し、前記初期条件として前記初期条件記憶部に記憶させる初期条件生成部と、前記初期条件記憶部内の前記初期条件と、前記モデル式記憶部内の前記モデル式を用いて推定された前記状態と、を用いた目的関数について、入力する前記操作量を変化させつつ評価を繰り返すことによって前記最適操作量を求め、前記最適操作量記憶部に記憶させる予測処理部と、前記最適操作量記憶部内の前記初期条件と前記最適操作量との関係を表す近似式を求める学習処理部と、を備える、情報処理装置。そのほか、本発明は、以下の形態としても実現可能である。 The present invention has been made to solve at least a part of the above-mentioned problems, and can be realized as the following forms. An information processing device, a model type storage unit that stores in advance a model formula that models a change in the state of a controlled object unit in response to a change in the operation amount of the actuator, and a time-series signal of the operation amount of the actuator. An initial condition storage unit that stores an initial condition including at least a time-series signal of the state of the control target unit, and an actuator of the actuator in the initial condition with respect to the initial condition at each time in the initial condition storage unit. Applying the optimum operation amount storage unit that stores the optimum operation amount, which is the optimum operation amount, and the time-series signal of the operation amount of the actuator created in advance to the model formula in the model formula storage unit. An initial condition generation unit that generates a time-series signal of a predicted value of the state of the control target unit and stores it in the initial condition storage unit as the initial condition, the initial condition in the initial condition storage unit, and the model. The optimum operation amount is obtained by repeating the evaluation while changing the input operation amount for the state estimated using the model expression in the expression storage unit and the objective function using, and the optimum operation amount storage. An information processing apparatus including a prediction processing unit to be stored in a unit and a learning processing unit for obtaining an approximate expression representing the relationship between the initial conditions in the optimum operation amount storage unit and the optimum operation amount. In addition, the present invention can also be realized in the following forms.

(1)本発明の一形態によれば、情報処理装置が提供される。この情報処理装置は、モデル式記憶部と、初期条件記憶部と、最適操作量記憶部と、初期条件生成部と、予測処理部と、学習処理部とを備える。モデル式記憶部は、内燃機関のアクチュエータの操作量の変化に応じた、内燃機関の制御対象部の状態の変化をモデル化したモデル式を予め記憶する。初期条件記憶部は、前記アクチュエータの操作量の時系列信号と、前記制御対象部の状態の時系列信号と、を少なくとも含む初期条件を記憶する。最適操作量記憶部は、前記初期条件記憶部内の各時刻における前記初期条件に対して、当該初期条件における前記アクチュエータの最適な操作量である最適操作量を対応付けて記憶する。初期条件生成部は、予め作成された前記アクチュエータの操作量の時系列信号を、前記モデル式記憶部内の前記モデル式に適用することで、前記制御対象部の状態の予測値の時系列信号を生成し、前記初期条件として前記初期条件記憶部に記憶させる。予測処理部は、前記初期条件記憶部内の前記初期条件と、前記モデル式記憶部内の前記モデル式を用いて推定された前記状態と、を用いた目的関数について、入力する前記操作量を変化させつつ評価を繰り返すことによって前記最適操作量を求め、前記最適操作量記憶部に記憶させる。学習処理部は、前記最適操作量記憶部内の前記初期条件と前記最適操作量との関係を表す近似式を求める。 (1) According to one embodiment of the present invention, an information processing device is provided. This information processing device includes a model type storage unit, an initial condition storage unit, an optimum manipulated variable storage unit, an initial condition generation unit, a prediction processing unit, and a learning processing unit. The model type storage unit stores in advance a model type that models a change in the state of the controlled object unit of the internal combustion engine according to a change in the operating amount of the actuator of the internal combustion engine. The initial condition storage unit stores at least an initial condition including a time-series signal of the operation amount of the actuator and a time-series signal of the state of the controlled target unit. The optimum operation amount storage unit stores the optimum operation amount, which is the optimum operation amount of the actuator under the initial condition, in association with the initial condition at each time in the initial condition storage unit. The initial condition generation unit applies the time-series signal of the operation amount of the actuator created in advance to the model formula in the model formula storage unit, thereby generating the time-series signal of the predicted value of the state of the control target unit. It is generated and stored in the initial condition storage unit as the initial condition. The prediction processing unit changes the amount of operation to be input with respect to the objective function using the initial condition in the initial condition storage unit and the state estimated using the model formula in the model formula storage unit. While repeating the evaluation, the optimum operation amount is obtained and stored in the optimum operation amount storage unit. The learning processing unit obtains an approximate expression representing the relationship between the initial condition and the optimum manipulated variable in the optimal manipulated variable storage unit.

この構成によれば、予測制御部は、モデル予測制御を利用して予め、各初期条件に応じた内燃機関のアクチュエータの最適操作量を求めて、最適操作量記憶部に記憶させておく。そして、学習処理部は予め、最適操作量記憶部内の初期条件と最適操作量との関係を表す近似式を求めておくことができる。このため、本構成によれば、実際の内燃機関の制御では、リアルタイムな反復計算を必要とせず、学習処理部によって求められた近似式を利用することで、初期条件内の各要素に対応する各実際値(または推定値)に応じた内燃機関のアクチュエータの最適操作量を素早く求めることができ、処理負荷の低減と処理時間の短縮とを図ることができる。また、初期条件生成部は、初期条件を生成する際に、内燃機関のアクチュエータの操作量の変化に応じた、内燃機関の制御対象部の状態の変化をモデル化したモデル式を使用する。このため、初期条件を生成する際に、各要素を網羅的に組み合わせた試行を行う場合と比較して、演算量を減らすことができ、初期条件生成の効率化を図ることができる。 According to this configuration, the prediction control unit obtains the optimum operation amount of the actuator of the internal combustion engine according to each initial condition in advance by using the model prediction control, and stores it in the optimum operation amount storage unit. Then, the learning processing unit can obtain in advance an approximate expression expressing the relationship between the initial condition in the optimum manipulated variable storage unit and the optimum manipulated variable. Therefore, according to this configuration, the actual control of the internal combustion engine does not require real-time iterative calculation, and corresponds to each element in the initial condition by using the approximate expression obtained by the learning processing unit. The optimum operating amount of the actuator of the internal combustion engine can be quickly obtained according to each actual value (or estimated value), and the processing load can be reduced and the processing time can be shortened. Further, the initial condition generation unit uses a model formula that models a change in the state of the controlled object unit of the internal combustion engine according to a change in the operating amount of the actuator of the internal combustion engine when generating the initial condition. Therefore, when generating the initial condition, the amount of calculation can be reduced and the efficiency of initial condition generation can be improved as compared with the case where the trial in which each element is comprehensively combined is performed.

(2)上記形態の情報処理装置において、前記学習処理部は、前記初期条件と前記最適操作量とを教師データとしたニューラルネットワークの教師あり学習によって前記近似式を求めてもよい。ニューラルネットワークは複雑な関数近似を行う事ができるため、数多くの要素を初期条件として含み得る内燃機関の制御に適している。この構成によれば、学習処理部は、このようなニューラルネットワークを用いて近似式を求めるため、近似式の精度を向上させることができる。 (2) In the information processing apparatus of the above embodiment, the learning processing unit may obtain the approximate expression by supervised learning of a neural network using the initial conditions and the optimum operation amount as teacher data. Since neural networks can perform complex function approximations, they are suitable for controlling internal combustion engines that can include many elements as initial conditions. According to this configuration, the learning processing unit obtains an approximate expression using such a neural network, so that the accuracy of the approximate expression can be improved.

(3)上記形態の情報処理装置では、さらに、実験計画法を用いて、前記アクチュエータの操作量の前記時系列信号を生成する実験計画処理部を備えてもよい。この構成によれば、実験計画処理部は、実験計画法を用いてアクチュエータの操作量の時系列信号を生成するため、組み合わせとして物理的に無理のない時系列信号を生成できる。 (3) The information processing apparatus of the above-described embodiment may further include an experiment planning processing unit that generates the time-series signal of the operation amount of the actuator by using the design of experiments method. According to this configuration, the experimental design processing unit generates a time-series signal of the actuator operation amount by using the design of experiments method, so that it is possible to generate a physically reasonable time-series signal as a combination.

(4)上記形態の情報処理装置において、前記初期条件には、さらに、前記内燃機関に対する外乱と、前記制御対象部の出力と、前記制御対象部の出力の目標値と、のうちの少なくとも一部が含まれ、前記初期条件に前記外乱が含まれる場合、前記モデル式では、前記操作量及び前記外乱の変化に応じた前記状態の変化がモデル化され、前記初期条件に前記出力が含まれる場合、前記モデル式では、前記操作量の変化に応じた前記状態及び前記出力の変化がモデル化されていてもよい。この構成によれば、初期条件として、内燃機関に対する外乱、制御対象部の出力、制御対象部の出力の目標値等の様々な要素を考慮することができる。 (4) In the information processing apparatus of the above embodiment, the initial condition further includes at least one of a disturbance to the internal combustion engine, an output of the controlled object unit, and a target value of the output of the controlled object unit. When the unit is included and the initial condition includes the disturbance, the model formula models the change in the state according to the operation amount and the change in the disturbance, and the initial condition includes the output. In the case, in the model formula, the state and the change in the output according to the change in the operation amount may be modeled. According to this configuration, various factors such as disturbance to the internal combustion engine, output of the control target unit, target value of output of the control target unit, and the like can be considered as initial conditions.

(5)上記形態の情報処理装置において、前記モデル式として、線形状態方程式及び非線形状態方程式を使用してもよい。この構成によれば、モデル式として、線形状態方程式及び非線形状態方程式を利用できる。 (5) In the information processing apparatus of the above-described embodiment, a linear equation of state and a non-linear equation of state may be used as the model equation. According to this configuration, linear equations of state and nonlinear equations of state can be used as model equations.

(6)上記形態の情報処理装置において、前記モデル式として、NARXモデルを用いて構成された非線形方程式を使用してもよい。この構成によれば、モデル式として、NARXモデルを用いて構成された非線形方程式を利用するため、精度の高い予測結果を得ることができる。 (6) In the information processing apparatus of the above-described embodiment, a non-linear equation constructed by using the NARX model may be used as the model formula. According to this configuration, since the nonlinear equation constructed by using the NARX model is used as the model formula, a highly accurate prediction result can be obtained.

(7)上記形態の情報処理装置において、前記実験計画法として、ステップ関数やランプ関数の組み合わせで表現される信号を生成する第1の方法と、周波数が時間に依存して変化するチャープ信号で表現される信号を生成する第2の方法と、のいずれかを使用してもよい。この構成によれば、実験計画法として、ステップ関数やランプ関数の組み合わせで表現される信号を生成する第1の方法(例えば、APRBS法)と、周波数が時間に依存して変化するチャープ信号で表現される信号を生成する第2の方法(例えば、Sinusoidal Excitation法)と、のいずれかを利用できる。 (7) In the information processing apparatus of the above embodiment, as the design of experiments, a first method for generating a signal represented by a combination of a step function and a ramp function and a chirp signal whose frequency changes depending on time are used. Either of the second method of generating the represented signal and the second method may be used. According to this configuration, as an experimental planning method, a first method (for example, the APRBS method) for generating a signal represented by a combination of a step function and a ramp function, and a chirp signal whose frequency changes depending on time are used. Either a second method of generating the represented signal (eg, the Sinusoidal Function method) can be used.

(8)本発明の一形態によれば、内燃機関のアクチュエータの操作量の変化に応じた、内燃機関の制御対象部の状態の変化をモデル化したモデル式を利用した情報処理方法が提供される。この情報処理方法では、予め作成された前記アクチュエータの操作量の時系列信号を、前記モデル式に適用することで、前記制御対象部の状態の予測値の時系列信号を生成する工程と、前記アクチュエータの操作量の時系列信号と、生成された前記制御対象部の状態の時系列信号と、を初期条件として記憶させる工程と、前記初期条件と、前記モデル式を用いて推定された前記状態と、を用いた目的関数について、入力する前記操作量を変化させつつ評価を繰り返すことによって、当該初期条件における前記アクチュエータの最適な操作量である最適操作量を求める工程と、前記初期条件に対して、求めた前記最適操作量を対応付けて記憶させる工程と、前記初期条件と前記最適操作量との関係を表す近似式を求める工程と、を備える。この方法によれば、モデル予測制御を利用した内燃機関の制御において、処理負荷の低減と処理時間の短縮とを図るとともに、初期条件生成の効率化を図ることができる。 (8) According to one embodiment of the present invention, there is provided an information processing method using a model formula that models a change in the state of a controlled object portion of an internal combustion engine in response to a change in the operating amount of an actuator of the internal combustion engine. NS. In this information processing method, a step of generating a time-series signal of a predicted value of a state of the controlled object portion by applying a time-series signal of an operation amount of the actuator created in advance to the model formula, and the above-mentioned A step of storing the time-series signal of the operation amount of the actuator and the generated time-series signal of the state of the controlled object portion as initial conditions, the initial conditions, and the state estimated using the model formula. By repeating the evaluation while changing the input operation amount for the objective function using A step of associating and storing the obtained optimum operation amount and a step of obtaining an approximate expression representing the relationship between the initial condition and the optimum operation amount are provided. According to this method, in the control of the internal combustion engine using the model prediction control, it is possible to reduce the processing load and the processing time, and to improve the efficiency of initial condition generation.

(9)本発明の一形態によれば、内燃機関のアクチュエータの操作量の変化に応じた、内燃機関の制御対象部の状態の変化をモデル化したモデル式を利用したコンピュータプログラムが提供される。このコンピュータプログラムでは、予め作成された前記アクチュエータの操作量の時系列信号を、前記モデル式に適用することで、前記制御対象部の状態の予測値の時系列信号を生成する機能と、前記アクチュエータの操作量の時系列信号と、生成された前記制御対象部の状態の時系列信号と、を初期条件として記憶させる機能と、前記初期条件と、前記モデル式を用いて推定された前記状態と、を用いた目的関数について、入力する前記操作量を変化させつつ評価を繰り返すことによって、当該初期条件における前記アクチュエータの最適な操作量である最適操作量を求める機能と、前記初期条件に対して、求めた前記最適操作量を対応付けて記憶させる機能と、前記初期条件と前記最適操作量との関係を表す近似式を求める機能と、を備える。このコンピュータプログラムによれば、モデル予測制御を利用した内燃機関の制御において、処理負荷の低減と処理時間の短縮とを図るとともに、初期条件生成の効率化を図ることができる。 (9) According to one embodiment of the present invention, a computer program using a model formula that models a change in the state of a controlled object portion of an internal combustion engine according to a change in the operating amount of an actuator of the internal combustion engine is provided. .. In this computer program, a function of generating a time-series signal of a predicted value of the state of the controlled object portion by applying a time-series signal of the operation amount of the actuator created in advance to the model formula, and the actuator. A function of storing the time-series signal of the manipulated variable and the generated time-series signal of the state of the controlled target portion as initial conditions, the initial conditions, and the states estimated using the model formula. With respect to the objective function using, the function of obtaining the optimum manipulated variable, which is the optimum manipulated variable of the actuator under the initial condition, by repeating the evaluation while changing the input manipulated variable, and the initial condition. It also has a function of associating and storing the obtained optimum operation amount, and a function of obtaining an approximate expression expressing the relationship between the initial condition and the optimum operation amount. According to this computer program, in the control of the internal combustion engine using the model prediction control, it is possible to reduce the processing load and the processing time, and to improve the efficiency of initial condition generation.

(10)本発明の一形態によれば、アクチュエータと、制御対象部とを備える内燃機関の制御装置が提供される。この内燃機関の制御装置では、前記アクチュエータの操作量の時系列信号と、前記制御対象部の状態の時系列信号と、を少なくとも含む初期条件について、前記初期条件と各時刻における前記初期条件に対して求められた前記アクチュエータの最適な操作量である最適操作量との関係を表す近似式を記憶する記憶部と、実際の前記アクチュエータの操作量と、前記制御対象部の状態とを取得する情報取得部と、取得された前記操作量及び前記状態と、前記記憶部内の前記近似式とを用いて、実際の前記操作量と前記状態とに対応した前記最適操作量を求め、前記最適操作量に従って前記アクチュエータを動作させる制御部と、を備える。この構成によれば、制御部は、情報取得部によって取得された操作量及び状態(各実際値または推定値)と、記憶部内の近似式とを用いて、各実際値に応じた内燃機関のアクチュエータの最適操作量を素早く求めることができ、処理負荷の低減と処理時間の短縮とを図ることができる。 (10) According to one embodiment of the present invention, there is provided a control device for an internal combustion engine including an actuator and a controlled object portion. In the control device of the internal combustion engine, with respect to the initial condition including at least the time-series signal of the operation amount of the actuator and the time-series signal of the state of the controlled target portion, with respect to the initial condition and the initial condition at each time. Information for acquiring a storage unit that stores an approximate expression representing a relationship with the optimum operation amount, which is the optimum operation amount of the actuator, an actual operation amount of the actuator, and a state of the control target unit. Using the acquisition unit, the acquired operation amount and the state, and the approximate expression in the storage unit, the optimum operation amount corresponding to the actual operation amount and the state is obtained, and the optimum operation amount is obtained. A control unit for operating the actuator according to the above is provided. According to this configuration, the control unit uses the manipulated variable and the state (each actual value or estimated value) acquired by the information acquisition unit and the approximate expression in the storage unit to control the internal combustion engine according to each actual value. The optimum operating amount of the actuator can be quickly obtained, and the processing load can be reduced and the processing time can be shortened.

なお、本発明は、種々の態様で実現することが可能であり、例えば、モデル予測制御を利用した内燃機関の制御のための近似式を求める情報処理装置、情報処理方法、情報処理システム、コンピュータプログラム、モデル予測制御を利用した内燃機関の制御装置、制御方法、制御システム、コンピュータプログラム、内燃機関の制御装置の作成装置、作成方法、作成システム、コンピュータプログラム、これら各コンピュータプログラムを配布するためのサーバ装置、そのコンピュータプログラムを記憶した一時的でない記憶媒体等の形態で実現することができる。 The present invention can be realized in various aspects. For example, an information processing device, an information processing method, an information processing system, and a computer for obtaining an approximate expression for controlling an internal combustion engine using model prediction control. To distribute programs, internal combustion engine control devices using model predictive control, control methods, control systems, computer programs, internal combustion engine control device creation devices, creation methods, creation systems, computer programs, and each of these computer programs. It can be realized in the form of a server device, a non-temporary storage medium that stores the computer program, and the like.

本発明の一実施形態としての情報処理装置のブロック図である。It is a block diagram of the information processing apparatus as one Embodiment of this invention. 予測学習処理について説明する図である。It is a figure explaining the predictive learning process. 予測学習処理における処理の手順を示すフローチャートである。It is a flowchart which shows the process procedure in the predictive learning process. 予測学習処理における処理の手順を示すフローチャートである。It is a flowchart which shows the process procedure in the predictive learning process. 予測学習処理の各ステップについて説明する図である。It is a figure explaining each step of the predictive learning process. 本発明の一実施形態としての内燃機関の制御装置のブロック図である。It is a block diagram of the control device of the internal combustion engine as one Embodiment of this invention. 内燃機関制御における処理の手順を示すフローチャートである。It is a flowchart which shows the process procedure in the internal combustion engine control. 内燃機関制御による動作の一例を示す。An example of operation by internal combustion engine control is shown. 内燃機関制御に要した演算時間の一例を示す。An example of the calculation time required for internal combustion engine control is shown.

<情報処理装置>
図1は、本発明の一実施形態としての情報処理装置1のブロック図である。情報処理装置1は、モデル予測制御(MPC:Model Predictive Control)を利用して、内燃機関の制御に使用するための近似式を求める装置である。本実施形態では、内燃機関の制御に使用する要素として、以下のa1〜a5の5つを例示する。要素a1〜a5はモデル予測制御の初期条件として使用されるため、要素a1〜a5を総称して「初期条件」とも呼ぶ。本実施形態の情報処理装置1は、要素a1〜a5からなる初期条件と、その初期条件に対応する内燃機関のアクチュエータの最適な操作量(最適操作量)と、の関係を表す近似式を求める装置である。情報処理装置1によって求められた近似式は、内燃機関の制御装置に搭載されて内燃機関の制御に使用される。詳細は後述する。
(a1)内燃機関のアクチュエータの操作量u
(a2)内燃機関に対する外乱w
(a3)内燃機関の制御対象部の状態x
(a4)内燃機関の制御対象部の出力y
(a5)内燃機関の制御対象部の出力の目標値r
<Information processing device>
FIG. 1 is a block diagram of an information processing device 1 as an embodiment of the present invention. The information processing device 1 is a device that uses Model Predictive Control (MPC) to obtain an approximate expression for use in controlling an internal combustion engine. In this embodiment, the following five elements a1 to a5 are exemplified as elements used for controlling an internal combustion engine. Since the elements a1 to a5 are used as initial conditions for model prediction control, the elements a1 to a5 are also collectively referred to as "initial conditions". The information processing apparatus 1 of the present embodiment obtains an approximate expression expressing the relationship between the initial condition composed of the elements a1 to a5 and the optimum operation amount (optimum operation amount) of the actuator of the internal combustion engine corresponding to the initial condition. It is a device. The approximate expression obtained by the information processing device 1 is mounted on the control device of the internal combustion engine and used for controlling the internal combustion engine. Details will be described later.
(A1) Operation amount of actuator of internal combustion engine u
(A2) Disturbance w with respect to the internal combustion engine
(A3) State x of the controlled object portion of the internal combustion engine
(A4) Output y of the controlled object portion of the internal combustion engine
(A5) Target value r of the output of the controlled object portion of the internal combustion engine

(a1)操作量uは、内燃機関において操作することが可能な1つまたは複数のアクチュエータの動作状況を表す物理量である。例えば、スロットル開度、排気再循環(EGR:Exhaust Gas Recirculation)システムにおけるEGRバルブ開度等が操作量uに相当する。(a2)外乱wは、内燃機関の出力に影響を及ぼす1つまたは複数の物理量であり、操作量uは除く。例えば、エンジン回転数、外気温度、外気圧力等が外乱wに相当する。(a3)状態xは、内燃機関に含まれる1つまたは複数の制御対象部の状態を表す物理量である。例えば、EGRシステムにおける排気温度や排気流量等が状態xに相当する。 (A1) The operating quantity u is a physical quantity representing the operating status of one or a plurality of actuators that can be operated in the internal combustion engine. For example, the throttle opening degree, the EGR valve opening degree in the exhaust gas recirculation (EGR) system, and the like correspond to the operation amount u. (A2) The disturbance w is one or more physical quantities that affect the output of the internal combustion engine, and the manipulated quantity u is excluded. For example, the engine speed, the outside air temperature, the outside air pressure, and the like correspond to the disturbance w. (A3) The state x is a physical quantity representing the state of one or more controlled target units included in the internal combustion engine. For example, the exhaust temperature, the exhaust flow rate, and the like in the EGR system correspond to the state x.

(a4)出力yは、内燃機関に含まれる1つまたは複数の制御対象部の出力を表す物理量である。例えば、EGRシステムにおけるEGR率、過給機における過給圧等が出力yに相当する。(a5)目標値rは、内燃機関に含まれる1つまたは複数の制御対象部の出力(すなわち要素a4)の目標値である。なお、上述した5つの各要素a1〜a5は、それぞれ、複数の項目を含み得る。例えば、外乱wとしてエンジン回転数と外気温度と外気圧力との3項目を含んでもよい。また、上述した5つの各要素a1〜a5において挙げた項目はあくまで例示であり、種々の項目を採用できる。 (A4) The output y is a physical quantity representing the output of one or more controlled target units included in the internal combustion engine. For example, the EGR rate in the EGR system, the supercharging pressure in the turbocharger, and the like correspond to the output y. (A5) The target value r is a target value of the output (that is, element a4) of one or more controlled target units included in the internal combustion engine. It should be noted that each of the above-mentioned five elements a1 to a5 may include a plurality of items. For example, the disturbance w may include three items of engine speed, outside air temperature, and outside air pressure. Further, the items listed in the above-mentioned five elements a1 to a5 are merely examples, and various items can be adopted.

情報処理装置1は、記憶部100と、情報処理部200と、図示しないROM、RAM及び通信部を備え、各部は図示しないバスにより相互に接続されている。記憶部100は、ハードディスク、フラッシュメモリ、メモリカードなどで構成される。記憶部100には、モデル式記憶部110と、初期条件記憶部120と、最適操作量記憶部130と、近似式記憶部140とが含まれている。 The information processing device 1 includes a storage unit 100, an information processing unit 200, a ROM, a RAM, and a communication unit (not shown), and each unit is connected to each other by a bus (not shown). The storage unit 100 is composed of a hard disk, a flash memory, a memory card, and the like. The storage unit 100 includes a model type storage unit 110, an initial condition storage unit 120, an optimum manipulated variable storage unit 130, and an approximate type storage unit 140.

モデル式記憶部110には、内燃機関のアクチュエータの操作量u、及び、内燃機関に対する外乱wの変化に応じた、内燃機関の制御対象部の状態x、及び、出力yの変化をモデル化したモデル式が予め記憶されている。モデル式は、予めの実験により求められ、操作量u、外乱w、状態x、出力yの現在及び過去の情報が含まれる。どの程度過去の情報が含まれるかはモデル式中の時間サンプル数に依存する。モデル式としては、例えば、線形状態方程式、非線形状態方程式、NARX(Nonlinear Auto-Regressive eXogenous)モデルを用いて構成された非線形方程式を使用できる。 The model storage unit 110 models changes in the state x of the controlled object unit of the internal combustion engine and the output y in response to changes in the operating amount u of the actuator of the internal combustion engine and the disturbance w with respect to the internal combustion engine. The model formula is stored in advance. The model formula is obtained by an experiment in advance, and includes current and past information of the manipulated variable u, the disturbance w, the state x, and the output y. How much past information is included depends on the number of time samples in the model formula. As the model equation, for example, a linear state equation, a non-linear state equation, and a non-linear equation constructed by using a NARX (Nonlinear Auto-Regressive eXogenous) model can be used.

線形状態方程式を使用した連続時間システムのモデル式は、操作量u、外乱w、状態x、出力yの各変数に対して、例えば次のように表せる。なお、tは時間、A,B,C,D,E,Fは適当な大きさの定数行列である。
・状態方程式:dx/dt=Ax+Bu+Ew ・・・(1)
・出力方程式:y=Cx+Du+Fw ・・・(2)
The model equation of the continuous time system using the linear equation of state can be expressed as follows for each variable of the manipulated variable u, the disturbance w, the state x, and the output y. Note that t is time, and A, B, C, D, E, and F are constant matrices of appropriate size.
-Equation of state: dx / dt = Ax + Bu + Ew ... (1)
・ Output equation: y = Cx + Du + Fw ・ ・ ・ (2)

線形状態方程式を使用した離散時間システムのモデル式は、上述の各変数と、離散時間kとを用いて、例えば次のように表せる。
・状態方程式:x[k+1]=Ax[k]+Bu[k]+Ew[k] ・・・(3)
・出力方程式:y[k]=Cx[k]+Du[k]+Fw[k] ・・・(4)
The model equation of the discrete-time system using the linear equation of state can be expressed as follows, for example, by using each of the above variables and the discrete-time k.
-Equation of state: x [k + 1] = Ax [k] + Bu [k] + Ew [k] ... (3)
-Output equation: y [k] = Cx [k] + Du [k] + Fw [k] ... (4)

非線形状態方程式を使用した連続時間システムのモデル式は、上述の各変数を用いて、例えば次のように表せる。なお、f,gはそれぞれx,yと同次元の出力を与える非線形ベクトル関数である。このため、非線形状態方程式では、線形状態方程式を包含していると言える。
・状態方程式:dx/dt=f(x,u,w) ・・・(5)
・出力方程式:y=g(x,u,w) ・・・(6)
The model formula of the continuous time system using the nonlinear state equation can be expressed as follows, for example, using each of the above variables. Note that f and g are nonlinear vector functions that give outputs of the same dimensions as x and y, respectively. Therefore, it can be said that the nonlinear equation of state includes the linear equation of state.
-Equation of state: dx / dt = f (x, u, w) ... (5)
・ Output equation: y = g (x, u, w) ・ ・ ・ (6)

非線形状態方程式を使用した離散時間システムのモデル式は、上述の各変数と、離散時間kとを用いて、例えば次のように表せる。
・状態方程式:x[k+1]=f(x[k],u[k],w[k]) ・・・(7)
・出力方程式:y[k]=g(x[k],u[k],w[k]) ・・・(8)
The model equation of the discrete-time system using the non-linear state equation can be expressed as follows, for example, by using each of the above variables and the discrete-time k.
-Equation of state: x [k + 1] = f (x [k], u [k], w [k]) ... (7)
-Output equation: y [k] = g (x [k], u [k], w [k]) ... (8)

NARXモデルを用いて構成された非線形方程式のモデル式は、上述の各変数と、離散時間kとを用いて、例えば次のように表せる。なお、gはyと同次元の出力を与える非線形ベクトル関数であり、明示的に過去の時間を複数サンプルする点が上述の式8と異なる。
・y[k+1]=g(y[k],y[k−1],・・・,y[k+1−ny],u[k],u[k−1],・・・,u[k+1−nu]) ・・・(9)
The model equation of the nonlinear equation constructed by using the NARX model can be expressed as follows, for example, by using each of the above variables and the discrete time k. Note that g is a nonlinear vector function that gives an output of the same dimension as y, and is different from the above equation 8 in that a plurality of past times are explicitly sampled.
Y [k + 1] = g (y [k], y [k-1], ..., y [k + 1- ny ], u [k], u [k-1], ..., u [ k + 1-n u ]) ・ ・ ・ (9)

このようにすれば、モデル式として、線形状態方程式、非線形状態方程式、及びNARXモデルを利用できる。 In this way, linear state equations, non-linear state equations, and NARX models can be used as model equations.

図2は、予測学習処理について説明する図である。図2(A)は、初期条件記憶部120に記憶されている初期条件の一例を示す。図2(B)は、予測学習処理の各反復サイクルにおける、各要素の変化の一例を示す。図1の初期条件記憶部120には、操作量記憶部121と、外乱記憶部122と、状態記憶部123と、出力記憶部124と、目標値記憶部125とが含まれている。 FIG. 2 is a diagram for explaining the predictive learning process. FIG. 2A shows an example of the initial conditions stored in the initial condition storage unit 120. FIG. 2B shows an example of changes in each element in each iterative cycle of the predictive learning process. The initial condition storage unit 120 of FIG. 1 includes an operation amount storage unit 121, a disturbance storage unit 122, a state storage unit 123, an output storage unit 124, and a target value storage unit 125.

操作量記憶部121には、後述する予測学習処理のステップS110によって、内燃機関のアクチュエータの操作量uの複数時刻分の物理量の変化(換言すれば、継時的な物理量の変化)を表す時系列信号が記憶される。図2(A)では、操作量u1及び操作量u2として、操作量uに属する2つの項目の時系列信号を例示している。同様に、外乱記憶部122には、後述する予測学習処理のステップS110によって、内燃機関に対する外乱wの複数時刻分の物理量の変化を表す時系列信号が記憶される。図2(A)では、外乱w1として、外乱wに属する1つの項目の時系列信号を例示している。 When the operation quantity storage unit 121 represents a change in the physical quantity (in other words, a change in the physical quantity over time) of the operation amount u of the actuator of the internal combustion engine for a plurality of times by the step S110 of the prediction learning process described later. The series signal is stored. In FIG. 2A, time-series signals of two items belonging to the manipulated variable u are illustrated as the manipulated variable u1 and the manipulated variable u2. Similarly, the disturbance storage unit 122 stores a time-series signal representing a change in the physical quantity of the disturbance w for a plurality of times with respect to the internal combustion engine by step S110 of the prediction learning process described later. In FIG. 2A, a time-series signal of one item belonging to the disturbance w is illustrated as the disturbance w1.

状態記憶部123には、後述する予測学習処理のステップS130によって、内燃機関の制御対象部の状態xの複数時刻分の物理量の変化を表す時系列信号が記憶される。図2(A)では、状態x1として、状態xに属する1つの項目の時系列信号を例示している。同様に、出力記憶部124には、後述する予測学習処理のステップS130によって、内燃機関の制御対象部の出力yの複数時刻分の物理量の変化を表す時系列信号が記憶される。図2(A)では、出力y1として、出力yに属する1つの項目の時系列信号を例示している。 The state storage unit 123 stores a time-series signal representing a change in the physical quantity of the state x of the controlled target unit of the internal combustion engine for a plurality of times by step S130 of the prediction learning process described later. In FIG. 2A, a time-series signal of one item belonging to the state x is illustrated as the state x1. Similarly, the output storage unit 124 stores a time-series signal representing a change in the physical quantity of the output y of the control target unit of the internal combustion engine for a plurality of times by step S130 of the prediction learning process described later. In FIG. 2A, a time-series signal of one item belonging to the output y is illustrated as the output y1.

目標値記憶部125には、後述する予測学習処理のステップS110によって、内燃機関の制御対象部の出力の目標値rの複数時刻分の物理量の変化を表す時系列信号が記憶される。なお、図2(A)では、目標値rの時系列信号の例示は省略している。 In the target value storage unit 125, a time-series signal representing a change in the physical quantity of the target value r of the output of the control target unit of the internal combustion engine for a plurality of times is stored in step S110 of the prediction learning process described later. In FIG. 2A, the example of the time series signal of the target value r is omitted.

最適操作量記憶部130には、後述する予測学習処理のステップS200によって、初期条件記憶部120内の各時刻における初期条件(操作量u、外乱w、状態x、出力y、目標値r)に対して、当該初期条件における内燃機関のアクチュエータの最適な操作量(最適操作量)が対応付けて記憶される。近似式記憶部140には、後述する予測学習処理のステップS300によって、最適操作量記憶部130内の初期条件と最適操作量とから得られた近似式が記憶される。 The optimum manipulated variable storage unit 130 is set to the initial conditions (manipulated quantity u, disturbance w, state x, output y, target value r) at each time in the initial condition storage unit 120 by step S200 of the predictive learning process described later. On the other hand, the optimum operating amount (optimal operating amount) of the actuator of the internal combustion engine under the initial conditions is stored in association with each other. The approximate expression storage unit 140 stores the approximate expression obtained from the initial conditions and the optimum operation amount in the optimum operation amount storage unit 130 by step S300 of the prediction learning process described later.

情報処理部200は、ROMに格納されているコンピュータプログラムをRAMに展開して実行することにより、情報処理装置1の各部を制御する。そのほか情報処理部200は、実験計画処理部210、初期条件生成部220、予測処理部230、学習処理部240として機能し、協働して後述する予測学習処理を実行する。実験計画処理部210は、実験計画法を用いて、初期条件のうち、操作量u、外乱w、目標値rの時系列信号を生成し、初期条件記憶部120に記憶させる。初期条件生成部220は、初期条件のうち、状態x、出力yの時系列信号を生成し、初期条件記憶部120に記憶させる。 The information processing unit 200 controls each unit of the information processing device 1 by expanding and executing a computer program stored in the ROM in the RAM. In addition, the information processing unit 200 functions as an experiment planning processing unit 210, an initial condition generation unit 220, a prediction processing unit 230, and a learning processing unit 240, and cooperates to execute the prediction learning process described later. The experiment planning processing unit 210 uses the design of experiments method to generate time-series signals of the manipulated variable u, the disturbance w, and the target value r among the initial conditions, and stores them in the initial condition storage unit 120. The initial condition generation unit 220 generates a time-series signal of the state x and the output y among the initial conditions, and stores it in the initial condition storage unit 120.

予測処理部230は、初期条件記憶部120内の初期条件を用いてモデル予測制御によって、各時刻における初期条件(操作量u、外乱w、状態x、出力y、目標値r)に対応する最適操作量を求め、最適操作量記憶部130に記憶させる。学習処理部240は、最適操作量記憶部130内の初期条件と最適操作量とを教師データとしたニューラルネットワーク(NN:Neural Network)の教師あり学習によって近似式を求め、近似式記憶部140に記憶させる。 The prediction processing unit 230 optimally corresponds to the initial conditions (operation amount u, disturbance w, state x, output y, target value r) at each time by model prediction control using the initial conditions in the initial condition storage unit 120. The operation amount is obtained and stored in the optimum operation amount storage unit 130. The learning processing unit 240 obtains an approximate expression by supervised learning of a neural network (NN: Neural Network) using the initial condition and the optimum operation amount in the optimum manipulated variable storage unit 130 as supervised learning, and the approximate formula storage unit 140 obtains an approximate expression. Remember.

図3及び図4は、予測学習処理における処理の手順を示すフローチャートである。予測学習処理は、初期条件(操作量u、外乱w、状態x、出力y、目標値r)を生成すると共に、生成された初期条件と内燃機関のアクチュエータの最適な操作量(最適操作量)との関係を表す近似式を求める処理である。予測学習処理は、情報処理装置1において任意のタイミングで実行される。 3 and 4 are flowcharts showing the processing procedure in the predictive learning process. The predictive learning process generates initial conditions (operation amount u, disturbance w, state x, output y, target value r), and at the same time, the generated initial conditions and the optimum operation amount (optimum operation amount) of the actuator of the internal combustion engine. This is a process for finding an approximate expression that expresses the relationship with. The predictive learning process is executed at an arbitrary timing in the information processing device 1.

図5は、予測学習処理の各ステップについて説明する図である。図5では、初期条件記憶部120に時系列信号として記憶されている初期条件の各要素について模式的に表している。縦軸には初期条件の各要素の名称を表し、横軸には時系列信号における各時刻を表している。通常、表の中には該当時刻における該当要素の物理量が表示されるが、図5では説明の便宜上、物理量の表示を省略して、説明のための文言を記載している。さらに、図3〜図5では説明の便宜上、初期条件の各要素が含み得る複数の項目について区別しない。例えば、操作量uが2つの項目、操作量u1及び操作量u2を含む場合、操作量u1及び操作量u2に対する処理は、以降説明する「操作量u」に対する処理と同じ処理を適用すればよい。 FIG. 5 is a diagram illustrating each step of the predictive learning process. In FIG. 5, each element of the initial condition stored as a time-series signal in the initial condition storage unit 120 is schematically shown. The vertical axis represents the name of each element of the initial condition, and the horizontal axis represents each time in the time series signal. Normally, the physical quantity of the corresponding element at the corresponding time is displayed in the table, but in FIG. 5, for convenience of explanation, the display of the physical quantity is omitted and the wording for explanation is described. Further, in FIGS. 3 to 5, for convenience of explanation, a plurality of items that can be included in each element of the initial condition are not distinguished. For example, when the operation amount u includes two items, the operation amount u1 and the operation amount u2, the processing for the operation amount u1 and the operation amount u2 may be the same as the processing for the “operation amount u” described below. ..

ステップS100では、多様な初期条件(操作量u、外乱w、状態x、出力y、目標値r)の生成を実行する。具体的には、ステップS110において実験計画処理部210は、実験計画法を用いて、操作量u、外乱w、目標値rの時系列信号を生成し、操作量記憶部121、外乱記憶部122、目標値記憶部125にそれぞれ記憶させる。実験計画処理部210は、実験計画法として例えば、以下の方法b1、b2のいずれかを用いることができる。 In step S100, various initial conditions (operation amount u, disturbance w, state x, output y, target value r) are generated. Specifically, in step S110, the experimental design processing unit 210 uses the design of experiments method to generate time-series signals of the manipulated variable u, the disturbance w, and the target value r, and the manipulated variable storage unit 121 and the disturbance storage unit 122. , Each is stored in the target value storage unit 125. The experiment planning processing unit 210 can use any of the following methods b1 and b2 as the experiment planning method, for example.

(b1)ステップ関数やランプ関数の組み合わせで表現される信号を生成する第1の方法:第1の方法としては、例えば、APRBS(Amplitude modulated Pseudo Random Binary Sequences)法を利用できる。APRBS法では、信号のレベルを連続的に扱い、多様な組合せを効率的に生成するラテン超方格計画やD最適計画などを用いて、疑似ランダム的に連続信号の組み合わせを生成する。APRBS法では、信号の1区間の長さや、区間の移り変わり時の信号変化速度なども計画の対象に含めることができるため、信号の値の組合せに加えて、信号変化速度の組合せについても多様性を確保できる。すなわち、APRBS法では、過渡変化を含めた実験計画が可能である。 (B1) First method for generating a signal represented by a combination of a step function and a ramp function: As the first method, for example, an APRBS (Amplitude modulated Pseudo Random Binary Sequences) method can be used. In the APRBS method, signal levels are continuously handled, and continuous signal combinations are generated in a pseudo-random manner using a Latin super-square design or a D-optimal design that efficiently generates various combinations. In the APRBS method, the length of one section of the signal and the signal change speed at the time of section change can be included in the planning target, so in addition to the combination of signal values, the combination of signal change speeds is also diverse. Can be secured. That is, in the APRBS method, it is possible to plan an experiment including transient changes.

(b2)周波数が時間に依存して変化するチャープ信号で表現される信号を生成する第2の方法:第2の方法としては、例えば、Sinusoidal Excitation法を利用できる。Sinusoidal Excitation法では、時間に依存して周波数が変化する正弦波信号を用いて連続信号の組み合わせを生成する。APRBS法により生成された信号よりも、信号レベルの時間変化率が多様である。 (B2) Second method of generating a signal represented by a chirp signal whose frequency changes with time: As a second method, for example, a Sinemodal Excitation method can be used. In the Sinusoidal Excitation method, a combination of continuous signals is generated using a sinusoidal signal whose frequency changes with time. The rate of change in signal level over time is more diverse than the signal generated by the APRBS method.

ステップS120において、初期条件生成部220の予測計算部221は、モデル式記憶部110に記憶されているモデル式と、操作量記憶部121に記憶されている操作量uの時系列信号と、外乱記憶部122に記憶されている外乱wの時系列信号と、をそれぞれ読み出す。ステップS130において、初期条件生成部220の予測計算部221は、読み出した操作量uと外乱wの時系列信号をモデル式に適用(印加)することで、状態xと出力yとの予測値の時系列信号を生成し、状態記憶部123と出力記憶部124とにそれぞれ記憶させる。 In step S120, the prediction calculation unit 221 of the initial condition generation unit 220 includes the model formula stored in the model formula storage unit 110, the time series signal of the operation amount u stored in the operation amount storage unit 121, and the disturbance. The time-series signal of the disturbance w stored in the storage unit 122 is read out. In step S130, the prediction calculation unit 221 of the initial condition generation unit 220 applies (applies) the time-series signals of the read manipulated variable u and the disturbance w to the model formula to obtain the predicted values of the state x and the output y. A time-series signal is generated and stored in the state storage unit 123 and the output storage unit 124, respectively.

このように、予測学習処理のステップS100では、モデル式を用いることで、物理的に発生する可能性の少ない初期条件の生成を回避すると共に、多様な初期条件を効率よく生成することができる。上述の通り、初期条件は、操作量u、外乱w、状態x、出力y、目標値rの5つの要素から構成されるが、それら5要素の組み合わせを生成する単純な方法は、5要素のすべてに上下限を設定し、上下限の範囲内で5要素を網羅的に組み合わせることである。しかし、網羅的な組み合わせにより生成された初期条件には、物理的に発生する可能性が極めて低い初期条件が含まれる。これは、状態xや出力yの挙動は、操作量uや外乱wに依存する物理的な因果関係に支配されていることに起因する。この点、予測学習処理のステップS100では、この因果関係を再現したモデル式を、ステップS200以降のモデル予測制御だけでなく、初期条件の生成の段階から使用することによって、組み合わせとして物理的に無理のない状態x及び出力yの時系列信号を生成できる。これにより、実際に起こり得る初期条件のみを効率的に生成することが可能となり、例えば内燃機関の制御のように、制御パラメータの最適解を導出するために、多くの要素(例えば、数十個)が関連する初期条件を持つ複雑なシステムにおいても、組み合わせ数の爆発的増加を招くことなく、初期条件を生成することが可能となる。 As described above, in step S100 of the predictive learning process, by using the model formula, it is possible to avoid the generation of the initial conditions that are unlikely to occur physically and to efficiently generate various initial conditions. As described above, the initial condition is composed of five elements of manipulated variable u, disturbance w, state x, output y, and target value r, but a simple method of generating a combination of these five elements is five elements. The upper and lower limits are set for all, and the five elements are comprehensively combined within the range of the upper and lower limits. However, the initial conditions generated by the exhaustive combination include initial conditions that are extremely unlikely to occur physically. This is because the behavior of the state x and the output y is governed by the physical causal relationship depending on the manipulated variable u and the disturbance w. In this regard, in step S100 of the prediction learning process, it is physically impossible as a combination by using the model formula that reproduces this causal relationship not only from the model prediction control after step S200 but also from the stage of generating the initial condition. It is possible to generate a time-series signal with no state x and output y. This makes it possible to efficiently generate only the initial conditions that can actually occur, and many elements (for example, dozens of elements) are used to derive the optimum solution of the control parameters, for example, in the control of an internal combustion engine. Even in a complex system with an initial condition related to), it is possible to generate an initial condition without causing an explosive increase in the number of combinations.

ステップS200では、ステップS100で生成された多様な初期条件に対応する最適操作量を求める。具体的には、ステップS210において、予測処理部230の予測計算部231は、モデル式記憶部110に記憶されているモデル式を読み出す。 In step S200, the optimum operation amount corresponding to various initial conditions generated in step S100 is obtained. Specifically, in step S210, the prediction calculation unit 231 of the prediction processing unit 230 reads out the model formula stored in the model formula storage unit 110.

ステップS220において、予測処理部230の予測計算部231は、初期条件記憶部120に記憶されている初期条件の時系列信号中の1時刻を起点とし、モデル予測制御による将来予測のために必要な時刻分の情報を読み出す。例えば、図5(A)において、時刻t0を起点とした場合、予測計算部231は、予測のために必要となる現在及び過去の時刻分の情報、具体的には、現在時刻t0の初期条件(外乱w、状態x、出力y、目標値r)と、過去時刻t−1の初期条件(操作量u)とを読み出す。ここで、操作量uのみ過去時刻t−1の初期条件を読み出すのは、現在時刻t0の操作量uが、後のステップにおける予測対象となるためである。なお、予測計算部231は、外乱w等についても、現在の初期条件に加えて、過去の数時刻分における初期条件の読み出しを行ってもよい。どれだけ過去に遡って情報の読み出しを行うかは、予測計算部231が使用するモデル式に依存する。 In step S220, the prediction calculation unit 231 of the prediction processing unit 230 is required for future prediction by model prediction control, starting from one time in the time series signal of the initial condition stored in the initial condition storage unit 120. Read the time information. For example, in FIG. 5A, when the time t0 is the starting point, the prediction calculation unit 231 provides information on the current and past times required for prediction, specifically, the initial condition of the current time t0. (Disturbance w, state x, output y, target value r) and the initial condition (operation amount u) of the past time t-1 are read out. Here, the reason why the initial condition of the past time t-1 is read only for the manipulated variable u is that the manipulated variable u at the current time t0 is the prediction target in the later step. The prediction calculation unit 231 may also read out the initial conditions in the past several hours in addition to the current initial conditions for the disturbance w and the like. How far back the information is read out depends on the model formula used by the prediction calculation unit 231.

ステップS230では、ステップS220で読み出した初期条件に対応する最適操作量を求める。具体的には、ステップS231において、予測処理部230の予測計算部231は、現在時刻から所定の将来時刻までの有限区間内における操作量u、外乱w、目標値rの時系列を決定する。この有限区間は、モデル予測制御における「予測ホライズン」に相当する。例えば、図5(B)に示すように予測計算部231は、現在時刻t0から所定の将来時刻t5までの有限区間内における操作量u、外乱w、目標値rを決定する。図5(B)の例では、予測計算部231は、操作量uには予め定められたデフォルト値(図5:D)を設定し、外乱w及び目標値rの将来時刻t1〜t5には、ステップS220で読み出した現在時刻t0の物理量(図5:現在)を設定している。なお、操作量uのデフォルト値の決定に際して、予測計算部231は、ステップS220で読み出された過去時刻t−1の操作量uを考慮してもよい。 In step S230, the optimum operation amount corresponding to the initial condition read in step S220 is obtained. Specifically, in step S231, the prediction calculation unit 231 of the prediction processing unit 230 determines a time series of the manipulated variable u, the disturbance w, and the target value r within a finite section from the current time to a predetermined future time. This finite interval corresponds to the "predictive horizon" in model predictive control. For example, as shown in FIG. 5B, the prediction calculation unit 231 determines the manipulated variable u, the disturbance w, and the target value r in a finite interval from the current time t0 to the predetermined future time t5. In the example of FIG. 5B, the prediction calculation unit 231 sets a predetermined default value (FIG. 5: D) for the manipulated variable u, and sets the future time t1 to t5 of the disturbance w and the target value r. , The physical quantity of the current time t0 read in step S220 (FIG. 5: present) is set. In determining the default value of the manipulated variable u, the prediction calculation unit 231 may consider the manipulated variable u of the past time t-1 read in step S220.

ステップS232において、予測処理部230の予測計算部231は、モデル式を用いて、将来の有限区間内での状態x、出力yを予測する。具体的には、予測計算部231は、現在時刻の条件をステップS220で読み出した初期条件(操作量u、外乱w、状態x、出力y、目標値r)とし、ステップS210で読み出したモデル式に対して、ステップS231で決定された有限区間内の操作量u、外乱wの時系列信号を適用(印加)することで、有限区間内の状態xと出力yとの予測値の時系列信号を生成する。例えば、図5(C)に示すように予測計算部231は、所定の将来時刻t1からt5までの有限区間内における状態x、出力yを予測する(図5:予測)。 In step S232, the prediction calculation unit 231 of the prediction processing unit 230 predicts the state x and the output y in the future finite section by using the model formula. Specifically, the prediction calculation unit 231 sets the condition of the current time as the initial condition (operation amount u, disturbance w, state x, output y, target value r) read out in step S220, and sets the model formula read out in step S210. On the other hand, by applying (applying) the time-series signals of the manipulated variable u and the disturbance w in the finite section determined in step S231, the time-series signals of the predicted values of the state x and the output y in the finite section are applied. To generate. For example, as shown in FIG. 5C, the prediction calculation unit 231 predicts the state x and the output y within a finite interval from a predetermined future time t1 to t5 (FIG. 5: prediction).

ステップS233において、予測処理部230の評価部232は、ステップS231で決定された有限区間内の操作量u、外乱w、目標値rの時系列信号と、ステップS232で予測された有限区間内の状態x、出力yの時系列信号とを目的関数に入力して、目的関数を評価する。この目的関数は、制御性能を定量的に評価するための所定の式であり、記憶部100内に記憶されている。目的関数としては、例えば、有限区間内における出力(出力y)と目標(目標値r)の差の二乗和を利用できる。 In step S233, the evaluation unit 232 of the prediction processing unit 230 includes the time-series signals of the manipulated variable u, the disturbance w, and the target value r in the finite section determined in step S231, and the evaluation unit 232 in the finite section predicted in step S232. The time series signal of the state x and the output y is input to the objective function, and the objective function is evaluated. This objective function is a predetermined formula for quantitatively evaluating the control performance, and is stored in the storage unit 100. As the objective function, for example, the sum of squares of the difference between the output (output y) and the target (target value r) within a finite interval can be used.

ステップS234において、予測処理部230の反復処理部233は、目的関数の値が収束したか否かを判定する。収束した場合(ステップS234:YES)、反復処理部233は、処理をステップS236へ遷移させる。 In step S234, the iterative processing unit 233 of the prediction processing unit 230 determines whether or not the values of the objective functions have converged. When it converges (step S234: YES), the iterative processing unit 233 shifts the processing to step S236.

一方、収束していない場合(ステップS234:NO)、反復処理部233は、目的関数値をより良くするように有限区間内における操作量uの時系列信号を修正し、処理をステップS232へ遷移させ、予測と評価を繰り返す。例えば、図5(D)に示すように反復処理部233は、現在時刻t0から所定の将来時刻t5までの有限区間内における操作量uを修正し、その後、予測計算部231は、図5(E)に示すように、修正した操作量uに基づく状態x、出力yを予測し、評価部232は、これらを用いた目的関数を評価する。例えば、図2(B)に示すように、有限区間(予測ホライズンHP)内の操作量u1及び操作量u2が反復サイクルC1、C2、C3と修正されていくにつれて、対応する有限区間(予測ホライズンHP)内の状態x1及び出力y1についても、サイクルC1、C2、C3に示すように変化していく。目的関数の値が収束した3回目のサイクルC3では、出力y1の時系列信号は、目標値rの時系列信号にほぼ一致していることがわかる。なお、反復処理部233は、勾配法、シューティング法、C/GMRES法といった既知の手法を利用してもよい。 On the other hand, when it has not converged (step S234: NO), the iterative processing unit 233 modifies the time-series signal of the manipulated variable u in the finite interval so as to improve the objective function value, and shifts the processing to step S232. Let them repeat the prediction and evaluation. For example, as shown in FIG. 5 (D), the iterative processing unit 233 corrects the manipulated variable u in the finite interval from the current time t0 to the predetermined future time t5, and then the prediction calculation unit 231 corrects the manipulated variable u in FIG. 5 (D). As shown in E), the state x and the output y based on the modified manipulated variable u are predicted, and the evaluation unit 232 evaluates the objective function using these. For example, as shown in FIG. 2B, as the manipulated variable u1 and manipulated variable u2 in the finite interval (predicted horizon HP) are modified to repeat cycles C1, C2, C3, the corresponding finite interval (predicted horizon). The state x1 and the output y1 in HP) also change as shown in cycles C1, C2, and C3. In the third cycle C3 in which the values of the objective functions have converged, it can be seen that the time-series signal of the output y1 substantially matches the time-series signal of the target value r. The iterative processing unit 233 may use known methods such as a gradient method, a shooting method, and a C / GMRES method.

ステップS236において、予測処理部230の反復処理部233は、有限区間内における操作量uの時系列信号から、起点とした1時刻分の操作量uを「最適操作量」として取り出す。そして、反復処理部233は、この最適操作量と、ステップS220で読み出した初期条件(操作量u、外乱w、状態x、出力y、目標値r)とを対応付けて、最適操作量記憶部130に記憶させる。例えば、図5(F)に示すように、反復処理部233は、現在時刻t0の操作量uを最適操作量とし、ステップS220で読み出した初期条件(過去時刻t−1の操作量u、現在時刻t0の外乱w、状態x、出力y、目標値r)とを対応付けて、最適操作量記憶部130に記憶させる。 In step S236, the iterative processing unit 233 of the prediction processing unit 230 extracts the operation amount u for one hour as the starting point as the “optimal operation amount” from the time series signal of the operation amount u in the finite interval. Then, the iterative processing unit 233 associates this optimum operation amount with the initial conditions (operation amount u, disturbance w, state x, output y, target value r) read in step S220, and the optimum operation amount storage unit. Store in 130. For example, as shown in FIG. 5 (F), the iterative processing unit 233 sets the operation amount u at the current time t0 as the optimum operation amount, and sets the initial condition read in step S220 (the operation amount u at the past time t-1, the present). The disturbance w at time t0, the state x, the output y, and the target value r) are associated with each other and stored in the optimum manipulated variable storage unit 130.

ステップS240において、予測処理部230の反復処理部233は、初期条件記憶部120に記憶された初期条件の時系列について、全ての時刻分の処理を終了したか否かを判定する。全ての時刻分の処理を終了していない場合(ステップS240:NO)、ステップS250において反復処理部233は、起点とする時刻を1時刻進め、ステップS220以降の処理を繰り返す。全ての時刻分の処理を終了した場合(ステップS240:YES)、反復処理部233は、処理をステップS300へ遷移させる。 In step S240, the iterative processing unit 233 of the prediction processing unit 230 determines whether or not the processing for all the times has been completed for the time series of the initial conditions stored in the initial condition storage unit 120. When the processing for all the times is not completed (step S240: NO), the iterative processing unit 233 advances the time starting from the starting point by one hour in step S250, and repeats the processing after step S220. When the processing for all the times is completed (step S240: YES), the iterative processing unit 233 shifts the processing to step S300.

このように、予測学習処理のステップS200では、ステップS100で生成された多様な初期条件に対してモデル予測制御を実行し、各時刻の初期条件に対応する最適操作量を求める。上述の通り、予測処理部230は、初期条件を読み出す起点となる時刻を1時刻分ずつ移動させつつ、各時刻の初期条件に対して最適操作量を求める、という処理を時系列信号の全時刻分に対して行う。このため、予測処理部230は、多様な初期条件に対する最適操作量を求めて、最適操作量記憶部130に記憶させておくことができる。 As described above, in step S200 of the prediction learning process, model prediction control is executed for various initial conditions generated in step S100, and the optimum operation amount corresponding to the initial conditions at each time is obtained. As described above, the prediction processing unit 230 performs the process of obtaining the optimum operation amount for the initial condition of each time while moving the time that is the starting point for reading the initial condition by one hour at a time for all the time of the time series signal. Do for minutes. Therefore, the prediction processing unit 230 can obtain the optimum operation amount for various initial conditions and store it in the optimum operation amount storage unit 130.

ステップS300では、最適操作量記憶部130に記憶されている初期条件と最適操作量との関係を表す近似式を機械学習によって求める。具体的には、ステップS310において、学習処理部240のNN計算部241は、最適操作量記憶部130に記憶されている初期条件と最適操作量とのセットをすべて読みだす。ステップS320において、学習処理部240のNN計算部241は、ニューラルネットワーク(NN)中のパラメータを初期化する。 In step S300, an approximate expression expressing the relationship between the initial condition stored in the optimum manipulated variable storage unit 130 and the optimum manipulated variable is obtained by machine learning. Specifically, in step S310, the NN calculation unit 241 of the learning processing unit 240 reads out all the sets of the initial conditions and the optimum operation amount stored in the optimum operation amount storage unit 130. In step S320, the NN calculation unit 241 of the learning processing unit 240 initializes the parameters in the neural network (NN).

ステップS330において、学習処理部240のNN計算部241は、初期条件と最適操作量とを教師データとしたNNの教師あり学習によって近似式を求める。具体的には、NN計算部241は、ステップS310で読み出した初期条件をNNに与え(印加し)て、NNの出力を求める。ステップS340において、学習処理部240の評価部242は、NNの出力と、ステップS310で読み出した初期条件及び最適操作量とを目的関数に入力して、目的関数を評価することで、NNによる最適操作量の近似精度(誤差)を評価する。この目的関数としては、例えば、NNの出力と、読み出した最適操作量の差の二乗和を利用できる。 In step S330, the NN calculation unit 241 of the learning processing unit 240 obtains an approximate expression by supervised learning of NN using the initial condition and the optimum operation amount as teacher data. Specifically, the NN calculation unit 241 gives (applies) the initial conditions read in step S310 to the NN, and obtains the output of the NN. In step S340, the evaluation unit 242 of the learning processing unit 240 inputs the output of the NN, the initial condition and the optimum operation amount read in step S310 into the objective function, and evaluates the objective function to optimize the NN. Evaluate the approximation accuracy (error) of the manipulated variable. As this objective function, for example, the sum of squares of the difference between the output of NN and the read optimum manipulated variable can be used.

ステップS350において、学習処理部240の反復処理部243は、目的関数の値が収束したか否かを判定する。収束した場合(ステップS350:YES)、反復処理部243は、処理をステップS370へ遷移させる。一方、収束していない場合(ステップS350:NO)、反復処理部243は、目的関数値をより良くするようにNNのパラメータを修正し、処理をステップS330へ遷移させ、NN出力と評価を繰り返す。なお、反復処理部243は、バックプロパゲーションといった既知の手法を利用してもよい。 In step S350, the iterative processing unit 243 of the learning processing unit 240 determines whether or not the values of the objective functions have converged. When it converges (step S350: YES), the iterative processing unit 243 shifts the processing to step S370. On the other hand, when it has not converged (step S350: NO), the iterative processing unit 243 modifies the NN parameter so as to improve the objective function value, shifts the processing to step S330, and repeats the NN output and the evaluation. .. The iterative processing unit 243 may use a known method such as backpropagation.

ステップS370において、学習処理部240の反復処理部243は、最新のNNと、NNのパラメータとを、学習済みNNとして近似式記憶部140に記憶させ、処理を終了する。 In step S370, the iterative processing unit 243 of the learning processing unit 240 stores the latest NN and the parameters of the NN in the approximate expression storage unit 140 as learned NNs, and ends the processing.

このように、予測学習処理のステップS300では、最適操作量記憶部130に記憶されている初期条件と最適操作量との関係を表す近似式を機械学習によって求める。ステップS200で生成された初期条件と最適操作量との関係は、初期条件が決まれば最適操作量が決まる、という形の非線形関数として表現できる。ステップS300では、この関係から予め近似式を作成しておく。この近似式を利用すれば、実際の内燃機関の制御において、各時刻においてリアルタイムに、最適解を見つけるための反復計算(モデル予測制御)を行うことなく、最適操作量を高速に求めることが可能となる。ここで、初期条件と最適操作量との関係は一般的に極めて非線形性が高く、さらに、初期条件には数多くの要素が関連することから、多入力多出力の高次元な関係となるため、一般的な線形式やn次多項式では良好な近似精度が期待できない。この点、予測学習処理のステップS300では、多入力多出力、かつ、強い非線形性を効率的に近似可能な手法として、NNによる機械学習を使用している。NNを用いて初期条件と最適操作量との関係を学習する場合、バックプロパゲーションによりNN中のパラメータが目的関数値に及ぼす影響を計算でき、その情報を元に勾配法に基づく反復計算によって非線形関係を良好に再現する学習が可能となる。このように、十分に精度よく学習されたNNは、リアルタイムなモデル予測制御と同等の制御性能(予測性能)を、低演算負荷で実現することができる。 As described above, in step S300 of the predictive learning process, an approximate expression expressing the relationship between the initial condition stored in the optimum manipulated variable storage unit 130 and the optimal manipulated variable is obtained by machine learning. The relationship between the initial condition generated in step S200 and the optimum manipulated variable can be expressed as a non-linear function in which the optimum manipulated variable is determined once the initial condition is determined. In step S300, an approximate expression is created in advance from this relationship. By using this approximate expression, in the actual control of the internal combustion engine, it is possible to obtain the optimum operation amount at high speed in real time at each time without performing iterative calculation (model prediction control) for finding the optimum solution. It becomes. Here, the relationship between the initial condition and the optimum manipulated variable is generally extremely non-linear, and since many elements are related to the initial condition, it is a high-dimensional relationship with multiple inputs and multiple outputs. Good approximation accuracy cannot be expected with general line formats and nth-order polynomials. In this regard, in step S300 of the predictive learning process, machine learning by NN is used as a method capable of efficiently approximating strong non-linearity with multiple inputs and multiple outputs. When learning the relationship between the initial condition and the optimum manipulated value using NN, the effect of the parameters in the NN on the objective function value can be calculated by backpropagation, and based on that information, iterative calculation based on the gradient method is non-linear. Learning that reproduces the relationship well becomes possible. In this way, the NN learned with sufficient accuracy can realize the control performance (prediction performance) equivalent to the real-time model prediction control with a low calculation load.

以上説明した通り、情報処理装置1によれば、予測処理部230は、モデル予測制御を利用して予め、各初期条件(操作量u、外乱w、状態x、出力y、目標値r)に応じた内燃機関のアクチュエータの最適操作量を求めて、最適操作量記憶部130に記憶させておく(図3:ステップS200)。そして、学習処理部240は予め、最適操作量記憶部130内の初期条件と最適操作量との関係を表す近似式(学習済みNNとパラメータ)を求めておくことができる(図4:ステップS300)。このため、本構成の情報処理装置1によれば、実際の内燃機関の制御では、リアルタイムな反復計算を必要とせず、学習処理部240によって求められた近似式(学習済みNNとパラメータ)を利用することで、初期条件内の各要素に対応する各実際値(または推定値)に応じた、内燃機関のアクチュエータの最適操作量を素早く求めることができ、処理負荷の低減と処理時間の短縮とを図ることができる。また、初期条件生成部220は、初期条件を生成する際に、内燃機関のアクチュエータの操作量u(及び外乱w)の変化に応じた、内燃機関の制御対象部の状態x(及び出力y)の変化をモデル化したモデル式を使用する。このため、初期条件を生成する際に、各要素を網羅的に組み合わせた試行を行う場合と比較して、演算量を減らすことができ、初期条件生成の効率化を図ることができる。 As described above, according to the information processing apparatus 1, the prediction processing unit 230 uses the model prediction control to set each initial condition (operation amount u, disturbance w, state x, output y, target value r) in advance. The optimum operating amount of the actuator of the internal combustion engine corresponding to the response is obtained and stored in the optimum operating amount storage unit 130 (FIG. 3: step S200). Then, the learning processing unit 240 can obtain in advance an approximate expression (learned NN and parameters) expressing the relationship between the initial condition and the optimum operation amount in the optimum operation amount storage unit 130 (FIG. 4: Step S300). ). Therefore, according to the information processing device 1 of the present configuration, the actual control of the internal combustion engine does not require real-time iterative calculation, and uses the approximate expression (learned NN and parameters) obtained by the learning processing unit 240. By doing so, the optimum operating amount of the actuator of the internal combustion engine can be quickly obtained according to each actual value (or estimated value) corresponding to each element in the initial condition, and the processing load can be reduced and the processing time can be shortened. Can be planned. Further, when the initial condition generation unit 220 generates the initial condition, the state x (and output y) of the controlled target unit of the internal combustion engine according to the change in the operation amount u (and the disturbance w) of the actuator of the internal combustion engine. Use a model formula that models the change in. Therefore, when generating the initial condition, the amount of calculation can be reduced and the efficiency of initial condition generation can be improved as compared with the case where the trial in which each element is comprehensively combined is performed.

<内燃機関の制御装置>
図6は、本発明の一実施形態としての内燃機関の制御装置3のブロック図である。制御装置3は、情報処理装置1により作成された近似式を利用して、内燃機関を制御する装置である。内燃機関としては、例えば、ディーゼルエンジン、ガソリンエンジン等が挙げられる。制御装置3は、ドライバインターフェース(IF)310と、ECU(Electronic Control Unit)320と、ハードウェアシステム330とを備え、各部は図示しない車載ネットワークにより相互に接続されている。ドライバインターフェース310は、内燃機関の運転者による操作信号を取得するためのインタフェースであり、例えば、アクセル、ブレーキ等である。
<Control device for internal combustion engine>
FIG. 6 is a block diagram of a control device 3 for an internal combustion engine as an embodiment of the present invention. The control device 3 is a device that controls an internal combustion engine by using an approximate expression created by the information processing device 1. Examples of the internal combustion engine include a diesel engine and a gasoline engine. The control device 3 includes a driver interface (IF) 310, an ECU (Electronic Control Unit) 320, and a hardware system 330, and each part is connected to each other by an in-vehicle network (not shown). The driver interface 310 is an interface for acquiring an operation signal by the driver of the internal combustion engine, and is, for example, an accelerator, a brake, or the like.

ECU320は、内燃機関の運転を制御するマイクロコントローラ(マイコン)である。そのほかECU320は、目標値決定部321、制御部322、情報取得部323として機能し、協働して後述する内燃機関制御を実行する。目標値決定部321は、運転者による操作信号に応じた内燃機関の制御対象部の出力の目標値rを決定する。 The ECU 320 is a microcontroller (microcomputer) that controls the operation of the internal combustion engine. In addition, the ECU 320 functions as a target value determination unit 321, a control unit 322, and an information acquisition unit 323, and cooperates to execute internal combustion engine control described later. The target value determining unit 321 determines the target value r of the output of the controlled target unit of the internal combustion engine according to the operation signal by the driver.

制御部322は、情報処理装置1によって求められた近似式(学習済みNNとパラメータ)を利用して、アクチュエータ331の最適操作量を求め、アクチュエータ331を動作させる。なお、近似式は、例えば、制御装置3を搭載した車両の製造時に予め制御部322内の図示しない記憶部に記憶されてもよい。また、制御部322は、図示しない通信ネットワークを介して情報処理装置1と通信を行い、定期的に近似式を取得して制御部322内の記憶部に記憶させてもよい。 The control unit 322 obtains the optimum operation amount of the actuator 331 by using the approximate expression (learned NN and parameters) obtained by the information processing device 1, and operates the actuator 331. The approximate expression may be stored in advance in a storage unit (not shown) in the control unit 322 at the time of manufacturing the vehicle equipped with the control device 3, for example. Further, the control unit 322 may communicate with the information processing device 1 via a communication network (not shown), periodically acquire an approximate expression, and store it in a storage unit in the control unit 322.

情報取得部323は、センサ333によって取得された検出値に基づいて、初期条件に対応した各要素(操作量u、外乱w、状態x、出力y)の各実際値を取得する。なお、情報取得部323は、センサ333によって取得された実際値から、制御対象のモデルに基づくオブザーバやカルマンフィルタなどを用いて、操作量u、外乱w、状態x、出力yの各推定値を求めてもよい。内燃機関の制御では、最適操作量を求めるために多くの要素(例えば、数十個)を必要とする。このため、情報取得部323は、一部の要素についてセンサ333により取得された実際値を用い、他の要素について推定した推定値を使用してもよい。なお、初期条件に対応した目標値rは、目標値決定部321によって別途設定される。 The information acquisition unit 323 acquires each actual value of each element (operation amount u, disturbance w, state x, output y) corresponding to the initial condition based on the detection value acquired by the sensor 333. The information acquisition unit 323 obtains each estimated value of the manipulated variable u, the disturbance w, the state x, and the output y from the actual value acquired by the sensor 333 by using an observer or a Kalman filter based on the model to be controlled. You may. In the control of an internal combustion engine, many elements (for example, several tens) are required to obtain the optimum manipulated variable. Therefore, the information acquisition unit 323 may use the actual value acquired by the sensor 333 for some elements and the estimated value estimated for the other elements. The target value r corresponding to the initial condition is separately set by the target value determining unit 321.

ハードウェアシステム330は、内燃機関に搭載されているハードウェアである。アクチュエータ331は、内燃機関において操作することが可能な1つまたは複数のアクチュエータであり、スロットルや、EGRシステムにおけるEGRバルブ等である。制御対象部332は、内燃機関に含まれる1つまたは複数の制御対象部であり、EGRシステムや、過給機等である。センサ333は、アクチュエータ331の動作状況(操作量u)、制御対象部332の状態x、制御対象部332の出力y、内燃機関に対する外乱wの各々を検出するためのセンサである。 The hardware system 330 is hardware mounted on an internal combustion engine. The actuator 331 is one or more actuators that can be operated in an internal combustion engine, such as a throttle, an EGR valve in an EGR system, and the like. The control target unit 332 is one or a plurality of control target units included in the internal combustion engine, such as an EGR system and a supercharger. The sensor 333 is a sensor for detecting each of the operating status (operation amount u) of the actuator 331, the state x of the controlled object unit 332, the output y of the controlled object unit 332, and the disturbance w with respect to the internal combustion engine.

図7は、内燃機関制御における処理の手順を示すフローチャートである。内燃機関制御は、情報処理装置1により作成された近似式を利用して求めた最適操作量を用いて、内燃機関(具体的にはアクチュエータ331)を制御する処理である。図7に示す内燃機関制御は、例えば制御装置3を搭載した車両の始動時に開始され、所定の制御周期ごとに繰り返し実行される。 FIG. 7 is a flowchart showing a processing procedure in internal combustion engine control. The internal combustion engine control is a process of controlling the internal combustion engine (specifically, the actuator 331) by using the optimum operation amount obtained by using the approximate expression created by the information processing apparatus 1. The internal combustion engine control shown in FIG. 7 is started, for example, when the vehicle equipped with the control device 3 is started, and is repeatedly executed at predetermined control cycles.

ステップS410において、ドライバインターフェース310は、アクセル開度やブレーキ開度から内燃機関の運転者による操作信号を取得し、目標値決定部321へと送信する。ステップS420において、ECU320の目標値決定部321は、取得した操作信号(運転者による操作信号)と、情報取得部323から取得した現在の操作量u、外乱w、状態x、出力yとを用いて、制御部322の出力yに対する目標値rを決定し、制御部322へ送信する。 In step S410, the driver interface 310 acquires an operation signal from the driver of the internal combustion engine from the accelerator opening and the brake opening, and transmits the operation signal to the target value determining unit 321. In step S420, the target value determination unit 321 of the ECU 320 uses the acquired operation signal (operation signal by the driver) and the current operation amount u, disturbance w, state x, and output y acquired from the information acquisition unit 323. The target value r with respect to the output y of the control unit 322 is determined and transmitted to the control unit 322.

ステップS430において、ECU320の制御部322は、取得した目標値rと、情報取得部323から取得した現在の操作量u、外乱w、状態x、出力yとを近似式(学習済みNNとパラメータ)に適用する。これにより制御部322は、目標値決定部321より指定された目標値rを達成するための、内燃機関のアクチュエータ331の最適な操作量(最適操作量)を決定できる。ステップS440において、ECU320の制御部322は、決定した最適操作量でアクチュエータ331を動作させる。 In step S430, the control unit 322 of the ECU 320 approximates the acquired target value r and the current manipulated variable u, disturbance w, state x, and output y acquired from the information acquisition unit 323 (learned NN and parameter). Apply to. As a result, the control unit 322 can determine the optimum operation amount (optimum operation amount) of the actuator 331 of the internal combustion engine for achieving the target value r specified by the target value determination unit 321. In step S440, the control unit 322 of the ECU 320 operates the actuator 331 with the determined optimum operation amount.

ステップS450において、アクチュエータ331の動作の結果として、制御対象部332の状態x及び出力yが変化する。ステップS460において、センサ333は、アクチュエータ331の動作状況(操作量u)、制御対象部332の状態x、制御対象部332の出力y、内燃機関に対する外乱wについて、最新の情報を検出し、検出信号を情報取得部323へと送信する。ステップS470において、ECU320の情報取得部323は、取得した最新の情報に基づく操作量u、外乱w、状態x、出力yの各実際値または各推定値を求める。 In step S450, the state x and the output y of the control target unit 332 change as a result of the operation of the actuator 331. In step S460, the sensor 333 detects and detects the latest information regarding the operating status (operation amount u) of the actuator 331, the state x of the control target unit 332, the output y of the control target unit 332, and the disturbance w with respect to the internal combustion engine. The signal is transmitted to the information acquisition unit 323. In step S470, the information acquisition unit 323 of the ECU 320 obtains each actual value or each estimated value of the operation amount u, the disturbance w, the state x, and the output y based on the acquired latest information.

図8は、内燃機関制御による動作の一例を示す。図8では、操作量uとして操作量u1〜u3の3項目、外乱wとして外乱w1〜w4の4項目、状態xとして状態x1〜x7の7項目、出力yとして出力y1〜y2の2項目、目標値rとして目標値r1〜r2の2項目を使用して、内燃機関制御を実行した場合の具体例を示す。図8(A)には、操作量u及び外乱wの時系列信号を図示し、図(B)には、出力y及び目標値rの時系列信号を図示している。図示の便宜上、状態xの時系列信号は省略している。図8(B)に示すように、最適操作量を求めるために多くの要素を必要とする多入力多出力の複雑なケースであっても、出力yの実際値は、設定された目標値rに適切に追従していることがわかる。 FIG. 8 shows an example of operation by internal combustion engine control. In FIG. 8, the operation amount u is 3 items of operation amounts u1 to u3, the disturbance w is 4 items of disturbance w1 to w4, the state x is 7 items of states x1 to x7, and the output y is 2 items of outputs y1 to y2. A specific example is shown in the case where the internal combustion engine control is executed by using the two items of the target values r1 to r2 as the target value r. FIG. 8A illustrates the time-series signals of the manipulated variable u and the disturbance w, and FIG. 8B illustrates the time-series signals of the output y and the target value r. For convenience of illustration, the time series signal of the state x is omitted. As shown in FIG. 8B, the actual value of the output y is the set target value r even in a complicated case of multiple inputs and multiple outputs that requires many elements to obtain the optimum manipulated variable. It can be seen that it follows properly.

図9は、内燃機関制御に要した演算時間の一例を示す。図9の横軸には時間を、縦軸には制御装置3のECU320による演算に要した時間(ms)を示している。図9に示す通り、ECU320の1回あたりの演算時間は0.03ms〜0.06msであり、最大でも0.2ms以内であることがわかる。例えば、モデル予測制御の高速解法として知られているC/GMRES法を用いて、リアルタイムに内燃機関の制御を行った場合の従来例では、演算時間は約60msであった(仲田勇人ほか,“ディーゼルエンジン吸排気システムへのC/GMRESモデル予測制御の応用")。この従来例と比較すると、本実施形態の内燃機関制御では、演算速度を約1000倍以上も高速化できる。 FIG. 9 shows an example of the calculation time required for controlling the internal combustion engine. The horizontal axis of FIG. 9 shows the time, and the vertical axis shows the time (ms) required for the calculation by the ECU 320 of the control device 3. As shown in FIG. 9, it can be seen that the calculation time per operation of the ECU 320 is 0.03 ms to 0.06 ms, and is within 0.2 ms at the maximum. For example, in the conventional example in which the internal combustion engine is controlled in real time by using the C / GMRES method known as a high-speed solution of model predictive control, the calculation time is about 60 ms (Hayato Nakata et al., “ Application of C / GMRES model predictive control to diesel engine intake / exhaust systems "). Compared with this conventional example, in the internal combustion engine control of the present embodiment, the calculation speed can be increased by about 1000 times or more.

以上説明した通り、内燃機関の制御装置3によれば、ECU320の制御部322は、情報取得部323によって取得された操作量u、外乱w、状態x、出力yの各実際値または推定値と、制御部322の記憶部内の近似式とを用いて、各実際値または推定値に応じた内燃機関のアクチュエータ331の最適操作量を素早く求めることができ、処理負荷の低減と処理時間の短縮とを図ることができる。 As described above, according to the control device 3 of the internal combustion engine, the control unit 322 of the ECU 320 includes the actual values or estimated values of the operation amount u, the disturbance w, the state x, and the output y acquired by the information acquisition unit 323. , The optimum operation amount of the actuator 331 of the internal combustion engine according to each actual value or estimated value can be quickly obtained by using the approximate expression in the storage unit of the control unit 322, and the processing load can be reduced and the processing time can be shortened. Can be planned.

<本実施形態の変形例>
本発明は上記の実施形態に限られるものではなく、その要旨を逸脱しない範囲において種々の態様において実施することが可能であり、例えば次のような変形も可能である。
<Modified example of this embodiment>
The present invention is not limited to the above-described embodiment, and can be implemented in various aspects without departing from the gist thereof. For example, the following modifications are also possible.

[変形例1]
上記実施形態では、情報処理装置の構成の一例を示した。しかし、情報処理装置の構成は種々の変形が可能である。例えば、情報処理装置は、ネットワーク上に配置された複数の情報処理装置が協働することによって構成されてもよい。この場合、例えば、実験計画処理部、初期条件生成部、予測処理部、学習処理部のうちの少なくとも一部が異なる情報処理装置によって実現されてよい。
[Modification 1]
In the above embodiment, an example of the configuration of the information processing device is shown. However, the configuration of the information processing device can be modified in various ways. For example, the information processing device may be configured by the cooperation of a plurality of information processing devices arranged on the network. In this case, for example, at least a part of the experiment planning processing unit, the initial condition generation unit, the prediction processing unit, and the learning processing unit may be realized by different information processing devices.

[変形例2]
上記実施形態では、モデル予測制御において初期条件として考慮すべき要素の一例を挙げた。しかし、モデル予測制御において、初期条件として考慮する要素a1〜a5のうちの少なくとも一部は、省略してもよく、さらなる他の要素を考慮してもよい。具体的には、要素a2の外乱w、要素a4の出力y、要素a5の目標値rのうちの少なくとも一部は省略してよい。例えば外乱wを省略する場合、モデル式における外乱wのパラメータは省略できる。また、予測学習処理(図3)のステップS100における外乱wの初期条件生成、ステップS200における初期条件としての外乱wの考慮は省略できる。また、内燃機関制御(図7)のステップS420、S430、S470における外乱wの考慮も省略してよい。出力y及び目標値rについても同様に、省略する場合は、モデル式と、予測学習処理と、内燃機関制御の各々について、省略された要素に対する考慮は省略してよい。
[Modification 2]
In the above embodiment, an example of an element to be considered as an initial condition in model prediction control is given. However, in the model prediction control, at least a part of the elements a1 to a5 to be considered as the initial condition may be omitted, or further other elements may be considered. Specifically, at least a part of the disturbance w of the element a2, the output y of the element a4, and the target value r of the element a5 may be omitted. For example, when the disturbance w is omitted, the parameter of the disturbance w in the model formula can be omitted. Further, the generation of the initial condition of the disturbance w in step S100 of the prediction learning process (FIG. 3) and the consideration of the disturbance w as the initial condition in step S200 can be omitted. Further, consideration of the disturbance w in steps S420, S430, and S470 of the internal combustion engine control (FIG. 7) may be omitted. Similarly, when the output y and the target value r are omitted, consideration for the omitted elements may be omitted for each of the model formula, the predictive learning process, and the internal combustion engine control.

[変形例3]
上記実施形態では、予測学習処理の一例を示した(図3、図4)。しかし、予測学習処理は種々の変形が可能である。例えば、ステップS100において、実験計画法を用いずに操作量uなどの時系列信号を生成してもよい。例えば、ステップS300において、サポートベクターマシン(SVM:Support Vector Machine)等のNN以外の手段を用いることで近似式を求めてもよい。例えば、ステップS100、S200、S300は一連の処理として実行されず、個別に実行されてよい。
[Modification 3]
In the above embodiment, an example of the predictive learning process is shown (FIGS. 3 and 4). However, the predictive learning process can be modified in various ways. For example, in step S100, a time-series signal such as the manipulated variable u may be generated without using the design of experiments. For example, in step S300, an approximate expression may be obtained by using a means other than NN such as a support vector machine (SVM). For example, steps S100, S200, and S300 are not executed as a series of processes, but may be executed individually.

例えば、予測学習処理では、上述した一部のステップを省略してもよく、さらなる他のステップを追加で実行してもよい。具体的には、例えば、ステップS100において、初期条件のうちの少なくとも一部の時系列信号を第1の方法(実験計画法)で生成し、残りの時系列信号を第2の方法で生成してもよい。例えば、モデル式記憶部に複数のモデル式を予め記憶させておき、ステップS130やステップS232において、初期条件のうちの少なくとも一部の特性や実際値に応じて、適用するモデル式を変更してもよい。例えば、ステップS300の終了後に、生成した近似式を内燃機関の制御装置へと配信してもよい。 For example, in the predictive learning process, some of the above-mentioned steps may be omitted, or other steps may be additionally executed. Specifically, for example, in step S100, at least a part of the initial conditions is generated by the first method (design of experiments), and the remaining time series signals are generated by the second method. You may. For example, a plurality of model formulas are stored in advance in the model formula storage unit, and in steps S130 and S232, the model formulas to be applied are changed according to at least some characteristics and actual values of the initial conditions. May be good. For example, after the end of step S300, the generated approximate expression may be delivered to the control device of the internal combustion engine.

[変形例4]
上記実施形態では、内燃機関の制御装置の構成の一例を示した。しかし、内燃機関の制御装置の構成は種々の変形が可能である。例えば、制御装置は、モデル予測制御を利用して、内燃機関の制御に使用するための近似式を求める上述した情報処理装置の機能をさらに備えていてもよい。
[Modification example 4]
In the above embodiment, an example of the configuration of the control device of the internal combustion engine is shown. However, the configuration of the control device of the internal combustion engine can be modified in various ways. For example, the control device may further include the function of the above-mentioned information processing device for obtaining an approximate expression for use in controlling an internal combustion engine by utilizing model prediction control.

[変形例5]
上記実施形態では、内燃機関制御の一例を示した(図7)。しかし、予測学習処理は種々の変形が可能である。例えば、上述した一部のステップを省略してもよく、さらなる他のステップを追加で実行してもよい。具体的には、例えば、ステップS470の終了後に、取得した操作量u、外乱w、状態x、出力yの実際値を情報処理装置へと送信して、近似式の精度向上に役立ててもよい。
[Modification 5]
In the above embodiment, an example of internal combustion engine control is shown (FIG. 7). However, the predictive learning process can be modified in various ways. For example, some of the steps described above may be omitted, or additional steps may be performed. Specifically, for example, after the end of step S470, the acquired actual values of the manipulated variable u, the disturbance w, the state x, and the output y may be transmitted to the information processing apparatus to help improve the accuracy of the approximate expression. ..

以上、実施形態、変形例に基づき本態様について説明してきたが、上記した態様の実施の形態は、本態様の理解を容易にするためのものであり、本態様を限定するものではない。本態様は、その趣旨並びに特許請求の範囲を逸脱することなく、変更、改良され得ると共に、本態様にはその等価物が含まれる。また、その技術的特徴が本明細書中に必須なものとして説明されていなければ、適宜、削除することができる。 Although the present embodiment has been described above based on the embodiments and modifications, the embodiments of the above-described embodiments are for facilitating the understanding of the present embodiment, and do not limit the present embodiment. This aspect may be modified or improved without departing from its spirit and claims, and this aspect includes its equivalents. In addition, if the technical feature is not described as essential in the present specification, it may be deleted as appropriate.

1…情報処理装置
3…内燃機関の制御装置
100…記憶部
110…モデル式記憶部
120…初期条件記憶部
121…操作量記憶部
122…外乱記憶部
123…状態記憶部
124…出力記憶部
125…目標値記憶部
130…最適操作量記憶部
140…近似式記憶部
200…情報処理部
210…実験計画処理部
220…初期条件生成部
221…予測計算部
230…予測処理部
231…予測計算部
232…評価部
233…反復処理部
240…学習処理部
241…NN計算部
242…評価部
243…反復処理部
310…ドライバインターフェース
321…目標値決定部
322…制御部
323…情報取得部
330…ハードウェアシステム
331…アクチュエータ
332…制御対象部
333…センサ
1 ... Information processing device 3 ... Internal engine control device 100 ... Storage unit 110 ... Model storage unit 120 ... Initial condition storage unit 121 ... Operation amount storage unit 122 ... Disturbance storage unit 123 ... State storage unit 124 ... Output storage unit 125 ... Target value storage unit 130 ... Optimal operation amount storage unit 140 ... Approximate type storage unit 200 ... Information processing unit 210 ... Experiment plan processing unit 220 ... Initial condition generation unit 221 ... Prediction calculation unit 230 ... Prediction processing unit 231 ... Prediction calculation unit 232 ... Evaluation unit 233 ... Iterative processing unit 240 ... Learning processing unit 241 ... NN calculation unit 242 ... Evaluation unit 243 ... Iterative processing unit 310 ... Driver interface 321 ... Target value determination unit 322 ... Control unit 323 ... Information acquisition unit 330 ... Hard Wear system 331 ... Actuator 332 ... Control target part 333 ... Sensor

Claims (10)

情報処理装置であって、
アクチュエータの操作量の変化に応じた制御対象部の状態の変化をモデル化したモデル式を予め記憶するモデル式記憶部と、
前記アクチュエータの操作量の時系列信号と、前記制御対象部の状態の時系列信号と、を少なくとも含む初期条件を記憶する初期条件記憶部と、
前記初期条件記憶部内の各時刻における前記初期条件に対して、当該初期条件における前記アクチュエータの最適な操作量である最適操作量を対応付けて記憶する最適操作量記憶部と、
予め作成された前記アクチュエータの操作量の時系列信号を、前記モデル式記憶部内の前記モデル式に適用することで、前記制御対象部の状態の予測値の時系列信号を生成し、前記初期条件として前記初期条件記憶部に記憶させる初期条件生成部と、
前記初期条件記憶部内の前記初期条件と、前記モデル式記憶部内の前記モデル式を用いて推定された前記状態と、を用いた目的関数について、入力する前記操作量を変化させつつ評価を繰り返すことによって前記最適操作量を求め、前記最適操作量記憶部に記憶させる予測処理部と、
前記最適操作量記憶部内の前記初期条件と前記最適操作量との関係を表す近似式を求める学習処理部と、
を備える、情報処理装置。
It is an information processing device
According to the change of the actuator manipulated variable, the model formula storage unit for previously storing a model formula that models the change in the state of the controlled portions,
An initial condition storage unit that stores an initial condition including at least a time-series signal of the operation amount of the actuator and a time-series signal of the state of the control target unit.
An optimum operation amount storage unit that stores the optimum operation amount, which is the optimum operation amount of the actuator in the initial condition, in association with the initial condition at each time in the initial condition storage unit.
By applying the time-series signal of the operation amount of the actuator created in advance to the model formula in the model formula storage unit, a time-series signal of the predicted value of the state of the control target unit is generated, and the initial condition. The initial condition generation unit to be stored in the initial condition storage unit and
Repeating the evaluation of the objective function using the initial condition in the initial condition storage unit and the state estimated using the model formula in the model formula storage unit while changing the input operation amount. A prediction processing unit that obtains the optimum operation amount and stores it in the optimum operation amount storage unit,
A learning processing unit that obtains an approximate expression representing the relationship between the initial condition and the optimum operation amount in the optimum operation amount storage unit, and
Information processing device.
請求項1に記載の情報処理装置であって、
前記学習処理部は、前記初期条件と前記最適操作量とを教師データとしたニューラルネットワークの教師あり学習によって前記近似式を求める、情報処理装置。
The information processing device according to claim 1.
The learning processing unit is an information processing device that obtains the approximate expression by supervised learning of a neural network using the initial conditions and the optimum operation amount as teacher data.
請求項1または請求項2に記載の情報処理装置であって、さらに、
実験計画法を用いて、前記アクチュエータの操作量の前記時系列信号を生成する実験計画処理部を備える、情報処理装置。
The information processing apparatus according to claim 1 or 2, further comprising.
An information processing device including an experiment planning processing unit that generates the time-series signal of the operation amount of the actuator by using the design of experiments method.
請求項1から請求項3のいずれか一項に記載の情報処理装置であって、
前記初期条件には、さらに、
前記制御対象部の出力に影響を及ぼす物理量である外乱と、
前記制御対象部の出力と、
前記制御対象部の出力の目標値と、
のうちの少なくとも一部が含まれ、
前記初期条件に前記外乱が含まれる場合、前記モデル式では、前記操作量及び前記外乱の変化に応じた前記状態の変化がモデル化され、
前記初期条件に前記出力が含まれる場合、前記モデル式では、前記操作量の変化に応じた前記状態及び前記出力の変化がモデル化されている、情報処理装置。
The information processing apparatus according to any one of claims 1 to 3.
In addition to the initial conditions,
Disturbance, which is a physical quantity that affects the output of the controlled object,
The output of the control target unit and
The target value of the output of the control target unit and
Includes at least some of
When the disturbance is included in the initial conditions, the model formula models the change in the state according to the manipulated variable and the change in the disturbance.
An information processing apparatus in which, when the output is included in the initial conditions, the state and the change in the output are modeled in the model formula according to the change in the manipulated variable.
請求項1から請求項4のいずれか一項に記載の情報処理装置であって、
前記モデル式として、線形状態方程式及び非線形状態方程式を使用する、情報処理装置。
The information processing apparatus according to any one of claims 1 to 4.
An information processing device that uses a linear equation of state and a non-linear equation of state as the model equation.
請求項1から請求項5のいずれか一項に記載の情報処理装置であって、
前記モデル式として、NARXモデルを用いて構成された非線形方程式を使用する、情報処理装置。
The information processing apparatus according to any one of claims 1 to 5.
An information processing device that uses a nonlinear equation constructed using a NARX model as the model formula.
請求項3または請求項3に従属する請求項4から請求項6のいずれか一項に記載の情報処理装置であって、
前記実験計画法として、ステップ関数やランプ関数の組み合わせで表現される信号を生成する第1の方法と、周波数が時間に依存して変化するチャープ信号で表現される信号を生成する第2の方法と、のいずれかを使用する、情報処理装置。
The information processing apparatus according to any one of claims 4 to 6, which is dependent on claim 3 or claim 3.
As the design of experiments, a first method of generating a signal represented by a combination of a step function and a ramp function, and a second method of generating a signal represented by a chirp signal whose frequency changes with time. An information processing device that uses either and.
アクチュエータの操作量の変化に応じた制御対象部の状態の変化をモデル化したモデル式を利用した情報処理方法であって、
予め作成された前記アクチュエータの操作量の時系列信号を、前記モデル式に適用することで、前記制御対象部の状態の予測値の時系列信号を生成する工程と、
前記アクチュエータの操作量の時系列信号と、生成された前記制御対象部の状態の時系列信号と、を初期条件として記憶させる工程と、
前記初期条件と、前記モデル式を用いて推定された前記状態と、を用いた目的関数について、入力する前記操作量を変化させつつ評価を繰り返すことによって、当該初期条件における前記アクチュエータの最適な操作量である最適操作量を求める工程と、
前記初期条件に対して、求めた前記最適操作量を対応付けて記憶させる工程と、
前記初期条件と前記最適操作量との関係を表す近似式を求める工程と、
を備える、情報処理方法。
According to the change of the actuator manipulated variable, an information processing method of the change of state of the control object unit utilizing modeled model equation,
A step of generating a time-series signal of a predicted value of the state of the controlled object portion by applying a time-series signal of the operation amount of the actuator created in advance to the model formula.
A step of storing the time-series signal of the operation amount of the actuator and the generated time-series signal of the state of the controlled object portion as initial conditions.
By repeating the evaluation of the objective function using the initial condition and the state estimated by using the model formula while changing the input manipulated variable, the optimum operation of the actuator under the initial condition is performed. The process of finding the optimum amount of operation, which is the amount,
A step of associating the obtained optimum operation amount with the initial condition and storing it.
A step of obtaining an approximate expression expressing the relationship between the initial conditions and the optimum manipulated variable, and
Information processing method.
アクチュエータの操作量の変化に応じた制御対象部の状態の変化をモデル化したモデル式を利用したコンピュータプログラムであって、
予め作成された前記アクチュエータの操作量の時系列信号を、前記モデル式に適用することで、前記制御対象部の状態の予測値の時系列信号を生成する機能と、
前記アクチュエータの操作量の時系列信号と、生成された前記制御対象部の状態の時系列信号と、を初期条件として記憶させる機能と、
前記初期条件と、前記モデル式を用いて推定された前記状態と、を用いた目的関数について、入力する前記操作量を変化させつつ評価を繰り返すことによって、当該初期条件における前記アクチュエータの最適な操作量である最適操作量を求める機能と、
前記初期条件に対して、求めた前記最適操作量を対応付けて記憶させる機能と、
前記初期条件と前記最適操作量との関係を表す近似式を求める機能と、
を備える、コンピュータプログラム。
According to the change of the actuator manipulated variable, a computer program using a model model expression changes in the state of the control object unit,
By applying a time-series signal of the operation amount of the actuator created in advance to the model formula, a function of generating a time-series signal of a predicted value of the state of the control target unit is provided.
A function of storing the time-series signal of the operation amount of the actuator and the generated time-series signal of the state of the controlled object portion as initial conditions.
By repeating the evaluation of the objective function using the initial condition and the state estimated by using the model formula while changing the input manipulated variable, the optimum operation of the actuator under the initial condition is performed. The function to find the optimum operation amount, which is the amount, and
A function of associating the obtained optimum operation amount with the initial condition and storing it.
A function to obtain an approximate expression expressing the relationship between the initial condition and the optimum manipulated variable, and
A computer program that includes.
アクチュエータと、制御対象部とを備え機関の制御装置であって、
前記アクチュエータの操作量の時系列信号と、予め作成された前記アクチュエータの操作量の時系列信号を、前記制御対象部の状態の変化をモデル化したモデル式に対して適用することで生成された前記制御対象部の状態の予測値の時系列信号と、を少なくとも含む初期条件について、前記初期条件と各時刻における前記初期条件に対して前記モデル式を用いて求められた前記アクチュエータの最適な操作量である最適操作量との関係を表す近似式を記憶する記憶部と、
実際の前記アクチュエータの操作量と、前記制御対象部の状態とを取得する情報取得部と、
取得された前記操作量及び前記状態と、前記記憶部内の前記近似式とを用いて、実際の前記操作量と前記状態とに対応した前記最適操作量を求め、前記最適操作量に従って前記アクチュエータを動作させる制御部と、
を備える制御装置。
An actuator, a control apparatus for engine Ru and a controlled portion,
It was generated by applying the time-series signal of the operation amount of the actuator and the time-series signal of the operation amount of the actuator created in advance to the model formula modeling the change of the state of the control target unit. Optimal operation of the actuator obtained by using the model formula for the initial condition and the initial condition at each time with respect to the initial condition including at least the time-series signal of the predicted value of the state of the controlled object portion. A storage unit that stores an approximate expression that expresses the relationship with the optimum manipulated variable, which is a quantity,
An information acquisition unit that acquires the actual operation amount of the actuator and the state of the control target unit,
Using the acquired operation amount and state and the approximate expression in the storage unit, the optimum operation amount corresponding to the actual operation amount and the state is obtained, and the actuator is set according to the optimum operation amount. The control unit to operate and
Comprising a control device.
JP2018003459A 2018-01-12 2018-01-12 Information processing device, information processing method, computer program, control device Active JP6933585B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018003459A JP6933585B2 (en) 2018-01-12 2018-01-12 Information processing device, information processing method, computer program, control device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018003459A JP6933585B2 (en) 2018-01-12 2018-01-12 Information processing device, information processing method, computer program, control device

Publications (2)

Publication Number Publication Date
JP2019125021A JP2019125021A (en) 2019-07-25
JP6933585B2 true JP6933585B2 (en) 2021-09-08

Family

ID=67398722

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018003459A Active JP6933585B2 (en) 2018-01-12 2018-01-12 Information processing device, information processing method, computer program, control device

Country Status (1)

Country Link
JP (1) JP6933585B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7444731B2 (en) * 2020-08-14 2024-03-06 株式会社トランストロン Engine test methods, programs, and equipment
JP7444732B2 (en) 2020-08-14 2024-03-06 株式会社トランストロン Engine model construction methods, programs, and devices

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2605505B2 (en) * 1991-07-04 1997-04-30 株式会社日立製作所 Process operation support rule acquisition system, process operation support system, process operation control system, and process operation support rule acquisition method
JPH05147589A (en) * 1991-11-28 1993-06-15 Mitsubishi Heavy Ind Ltd Robust flight control device
JPH08309140A (en) * 1995-05-18 1996-11-26 Toshiba Corp Controller for gas adsorption process
JPH10184431A (en) * 1996-12-27 1998-07-14 Yamaha Motor Co Ltd Engine control system
JP2000132535A (en) * 1998-10-23 2000-05-12 Mitsubishi Electric Corp Estimation method for optimum combination of parameters, recording medium recording program of the estimation method and device
JP2006072747A (en) * 2004-09-02 2006-03-16 Fujitsu Ten Ltd Model prediction controller
CN101652669B (en) * 2007-03-30 2013-06-19 皇家飞利浦电子股份有限公司 Method for determining a status and/or condition of a lLED/OLED device and diagnotic device
US9122260B2 (en) * 2008-03-03 2015-09-01 Alstom Technology Ltd Integrated controls design optimization
WO2009155516A2 (en) * 2008-06-20 2009-12-23 Medrelief Inc. Systems, apparatuses, and methods for providing non-transcranial electrotherapy
JP2010152767A (en) * 2008-12-26 2010-07-08 Toshiba Corp Prediction control method and prediction control system
JP5210920B2 (en) * 2009-02-25 2013-06-12 株式会社日立製作所 Plant operation control device
JP5870632B2 (en) * 2011-11-08 2016-03-01 富士通株式会社 Information processing device
AT512251B1 (en) * 2013-02-28 2014-08-15 Avl List Gmbh Method of designing a nonlinear controller for non-linear processes
JP6493904B2 (en) * 2014-07-23 2019-04-03 株式会社チノー Parameter selection method, parameter selection program, and parameter selection device

Also Published As

Publication number Publication date
JP2019125021A (en) 2019-07-25

Similar Documents

Publication Publication Date Title
CN105814499B (en) Dynamic model authentication method and system for monitoring and controlling dynamic machines with variable structure or variable operating conditions
KR101961421B1 (en) Method, controller, and computer program product for controlling a target system by separately training a first and a second recurrent neural network models, which are initially trained using oparational data of source systems
JP5290199B2 (en) How to simulate engine operation
KR102206324B1 (en) Methods for ascertaining a model of a starting variable of a technical system
Janakiraman et al. An ELM based predictive control method for HCCI engines
Guardiola et al. A computationally efficient Kalman filter based estimator for updating look-up tables applied to NOx estimation in diesel engines
Asprion et al. Optimal control of diesel engines: Numerical methods, applications, and experimental validation
Çapraz et al. Fuel consumption models applied to automobiles using real-time data: A comparison of statistical models
JP6933585B2 (en) Information processing device, information processing method, computer program, control device
Martínez-Morales et al. Modeling of internal combustion engine emissions by LOLIMOT algorithm
Kruse et al. Modern statistical modeling and evolutionary optimization methods for the broad use in ECU calibration
White et al. Gain-scheduling control of port-fuel-injection processes
JP2022089806A (en) Modeling operation profiles of vehicle
Wong et al. Efficient point-by-point engine calibration using machine learning and sequential design of experiment strategies
JP2022530504A (en) Engine control system
Koch et al. Automated function development for emission control with deep reinforcement learning
de Nola et al. A Model-Based Computer Aided Calibration Methodology Enhancing Accuracy, Time and Experimental Effort Savings Through Regression Techniques and Neural Networks
JP7010343B1 (en) Machine learning device
Malikopoulos Real-time, self-learning identification and stochastic optimal control of advanced powertrain systems
Papadimitriou et al. Neural network based fast-running engine models for control-oriented applications
Lee et al. Modelling and H∞ control of diesel engine boost pressure using a linear parameter varying technique
Azad et al. An optimal learning-based controller derived from Hamiltonian function combined with a cellular searching strategy for automotive coldstart emissions
Janakiraman et al. Nonlinear model predictive control of a gasoline HCCI engine using extreme learning machines
Dinca et al. Fault detection and identification in dynamic systems with noisy data and parameter/modeling uncertainties
Kolewe et al. Gaussian mixture regression and local linear network model for data‐driven estimation of air mass

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200221

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210114

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210209

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210319

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210803

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210819

R150 Certificate of patent or registration of utility model

Ref document number: 6933585

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150