JP2021111265A - Control device - Google Patents

Control device Download PDF

Info

Publication number
JP2021111265A
JP2021111265A JP2020004428A JP2020004428A JP2021111265A JP 2021111265 A JP2021111265 A JP 2021111265A JP 2020004428 A JP2020004428 A JP 2020004428A JP 2020004428 A JP2020004428 A JP 2020004428A JP 2021111265 A JP2021111265 A JP 2021111265A
Authority
JP
Japan
Prior art keywords
target value
control
control unit
value
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020004428A
Other languages
Japanese (ja)
Other versions
JP7451182B2 (en
Inventor
洋紀 成田
Hironori Narita
洋紀 成田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hino Motors Ltd
Original Assignee
Hino Motors Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hino Motors Ltd filed Critical Hino Motors Ltd
Priority to JP2020004428A priority Critical patent/JP7451182B2/en
Publication of JP2021111265A publication Critical patent/JP2021111265A/en
Application granted granted Critical
Publication of JP7451182B2 publication Critical patent/JP7451182B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Feedback Control In General (AREA)

Abstract

To optimize an output to be controlled more suitably.SOLUTION: A control device 1 comprises: a first control unit 10 which derives and outputs a control target value based on an input value related to derivation of the control target value; and a second control unit 20 which has a prediction model 21 for deriving a corrected target value which is a correction value of the control target value based on the control target value output by the first control unit 10 and the input value and which outputs the corrected target value.SELECTED DRAWING: Figure 1

Description

本発明は、制御装置に関する。 The present invention relates to a control device.

制御対象の出力を最適化するための手法として、モデル予測制御が知られている(例えば特許文献1参照)。モデル予測制御では、コントローラの内部の予測モデル(制御対象モデル)に基づいて、制御対象の出力が目標値(最適値)に追従するように、制御対象に与える入力値が決定される。具体的には、モデル予測制御では、予測モデルが、制御対象の出力の目標値と現在の制御対象の出力値とに基づき、現在から未来の予測区間において目標値との追従誤差の面積が最小化するように、各時間における制御対象に与える入力値(入力値の時系列)を探索し、時系列の一番目の要素を、実際に制御対象に与える入力値として制御対象に適用する。このような処理が繰り返し実行されて、各時刻において未来の応答を予測しながら制御対象に与える入力値が逐次最適化されることにより、制御対象の出力を適切に目標値に追従させることができる。 Model predictive control is known as a method for optimizing the output of a controlled object (see, for example, Patent Document 1). In model prediction control, the input value given to the control target is determined based on the prediction model (control target model) inside the controller so that the output of the control target follows the target value (optimum value). Specifically, in model prediction control, the prediction model has the smallest area of tracking error with the target value in the current to future prediction interval based on the target value of the output of the controlled object and the output value of the current controlled object. The input value (time series of input values) given to the control target at each time is searched, and the first element of the time series is applied to the control target as the input value actually given to the control target. By repeatedly executing such processing and sequentially optimizing the input value given to the control target while predicting the future response at each time, the output of the control target can be appropriately followed by the target value. ..

特表2019−522290号公報Special Table 2019-522290

ここで、上述したモデル予測制御では、制御対象の出力を目標値に追従させるために、現在から未来の予測区間の入力値の時系列を探索する処理を繰り返し行う必要があるため、制御対象の出力を最適化するために時間を要してしまう。実際には、限られた時間で制御対象の出力を最適化する必要があるため、環境によっては、モデル予測制御のみでは制御対象の出力の最適化を行うことができないおそれがある。 Here, in the model prediction control described above, in order to make the output of the control target follow the target value, it is necessary to repeatedly search the time series of the input values of the prediction interval from the present to the future. It takes time to optimize the output. Actually, since it is necessary to optimize the output of the controlled object in a limited time, there is a possibility that the output of the controlled object cannot be optimized only by the model prediction control depending on the environment.

本発明は上記実情に鑑みてなされたものであり、より好適に制御対象の出力を最適化することを目的とする。 The present invention has been made in view of the above circumstances, and an object of the present invention is to more preferably optimize the output of the controlled object.

本発明の一態様に係る制御装置は、制御目標値の導出に係る入力値に基づき、制御目標値を導出し出力する第1制御部と、第1制御部によって出力された制御目標値と入力値とに基づき制御目標値の修正値である修正目標値を導出する予測モデルを有し、修正目標値を出力する第2制御部と、を備える。 The control device according to one aspect of the present invention has a first control unit that derives and outputs a control target value based on an input value related to the derivation of the control target value, and a control target value and an input output by the first control unit. It has a prediction model for deriving a correction target value which is a correction value of the control target value based on the value, and includes a second control unit for outputting the correction target value.

本発明の一態様に係る制御装置では、第1制御部によって導出された制御目標値が、第2制御部の予測モデルによって修正され、修正目標値が出力される。例えば、予測モデルのみによって制御に係る目標値を導出しようとした場合(制御対象の出力を最適化する場合)においては、繰り返し処理に時間を要してしまい、限られた時間内に制御対象の出力を最適化することができないおそれがある。一方で、例えば比較的短時間で制御対象の出力を最適化するモデル(学習モデル等)のみによって制御に係る目標値を導出しようとした場合においては、高精度なモデルを開発するために多大な労力を要してしまうと考えられる。この点、本発明の一態様に係る制御装置では、初期の目標値が第1制御部によってある程度大まかに設定された場合であっても、予測モデルによる修正によって、目標値設定を効率的に行うことができる。このことで、限られた時間で制御対象の出力を最適化することができ、制御対象の出力を好適に最適化することができる。 In the control device according to one aspect of the present invention, the control target value derived by the first control unit is modified by the prediction model of the second control unit, and the modified target value is output. For example, when trying to derive the target value related to control only by the prediction model (when optimizing the output of the controlled object), it takes time for the iterative process, and the controlled object is controlled within a limited time. The output may not be optimized. On the other hand, for example, when trying to derive the target value related to control only by a model (learning model, etc.) that optimizes the output of the controlled object in a relatively short time, it is a great deal to develop a highly accurate model. It will take a lot of effort. In this respect, in the control device according to one aspect of the present invention, even when the initial target value is roughly set to some extent by the first control unit, the target value is efficiently set by the correction by the prediction model. be able to. As a result, the output of the controlled object can be optimized in a limited time, and the output of the controlled object can be suitably optimized.

第1制御部は、第2制御部によって出力された修正目標値を学習する学習モデルを有し、修正目標値の学習結果を考慮して、入力値に基づき制御目標値を導出し出力してもよい。このように、修正目標値が学習されることにより、次回に同様のシチュエーションが現れた場合における、第1制御部による制御目標値の導出精度を向上させることができる。すなわち、予測モデルによる修正及び学習モデルによる修正した情報の学習が実行されることによって、その後の目標値設定を効率的に行うことができる。このことで、限られた時間で制御対象の出力を最適化することができ、制御対象の出力を好適に最適化することができる。 The first control unit has a learning model for learning the correction target value output by the second control unit, and derives and outputs the control target value based on the input value in consideration of the learning result of the correction target value. May be good. By learning the correction target value in this way, it is possible to improve the accuracy of deriving the control target value by the first control unit when a similar situation appears next time. That is, by executing the correction by the prediction model and the learning of the corrected information by the learning model, the subsequent target value setting can be efficiently performed. As a result, the output of the controlled object can be optimized in a limited time, and the output of the controlled object can be suitably optimized.

学習モデルは、修正目標値と該修正目標値に対応する入力値とを併せて学習してもよい。これにより、次回に同様のシチュエーションが現れた場合における、第1制御部による制御目標値の導出精度をより好適に向上させることができる。 The learning model may learn the correction target value and the input value corresponding to the correction target value together. As a result, it is possible to more preferably improve the accuracy of deriving the control target value by the first control unit when a similar situation appears next time.

本発明によれば、より好適に制御対象の出力を最適化することができる。 According to the present invention, the output to be controlled can be optimized more preferably.

本実施形態に係る制御装置の機能ブロックを示す図である。It is a figure which shows the functional block of the control device which concerns on this embodiment. 修正目標値の学習を説明する図である。It is a figure explaining the learning of the correction target value. 修正目標値の学習を説明する図である。It is a figure explaining the learning of the correction target value. 制御装置が行う処理を示すフローチャートである。It is a flowchart which shows the process performed by a control device.

以下、添付図面を参照しながら本発明の実施形態を詳細に説明する。図面の説明において、同一又は同等の要素には同一符号を用い、重複する説明を省略する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings. In the description of the drawings, the same reference numerals are used for the same or equivalent elements, and duplicate description is omitted.

図1は、本実施形態に係る制御装置1の機能ブロックを示す図である。図1に示される制御装置1は、例えば車両(不図示)における各種制御対象100を制御する装置である。制御装置1は、例えば制御対象100の現時刻からある有限区間に渡る未来の振る舞いを予測し、予測した結果を利用して、制御対象100の挙動が最適化するように、制御対象100に与える制御入力(後述する修正目標値)を決定する。 FIG. 1 is a diagram showing a functional block of the control device 1 according to the present embodiment. The control device 1 shown in FIG. 1 is, for example, a device that controls various control targets 100 in a vehicle (not shown). For example, the control device 1 predicts the future behavior of the control target 100 over a certain finite interval from the current time, and uses the predicted result to give the control target 100 so that the behavior of the control target 100 is optimized. Determine the control input (correction target value described later).

制御装置1は、例えばエンジン制御に適用される。制御対象100は、例えばEGR(ExhaustGas Recirculation)バルブ及びVNT(Variable Nozzle Turbo)ノズルである。この場合、制御装置1は、例えばエンジン排出NOx、煙と加速性(過給圧の上昇率)を最適化するように、制御対象100であるEGRバルブの開度及びVNTノズルの位置を調整する制御入力(後述する修正目標値)を制御対象100に入力する。制御装置1は、第1制御部10と、第2制御部20とを備えている。 The control device 1 is applied to, for example, engine control. The control target 100 is, for example, an EGR (Exhaust Gas Recirculation) valve and a VNT (Variable Nozzle Turbo) nozzle. In this case, the control device 1 adjusts the opening degree of the EGR valve and the position of the VNT nozzle, which are the control target 100, so as to optimize, for example, engine exhaust NOx, smoke and acceleration (increasing rate of boost pressure). The control input (correction target value described later) is input to the control target 100. The control device 1 includes a first control unit 10 and a second control unit 20.

第1制御部10は、制御目標値の導出に係る入力値に基づき、制御目標値を導出し出力する。例えばエンジン制御を行う場合、上記入力値は、エンジン回転数、ドライバ要求トルク(又はアクセル開度、燃料噴射量)、インテークマニフォールド圧力、及び吸入空気量等である。また、上記制御目標値は、EGRバルブの開度及びVNTノズルの位置である。 The first control unit 10 derives and outputs the control target value based on the input value related to the derivation of the control target value. For example, when engine control is performed, the input values are engine speed, driver required torque (or accelerator opening degree, fuel injection amount), intake manifold pressure, intake air amount, and the like. The control target values are the opening degree of the EGR valve and the position of the VNT nozzle.

第1制御部10は、自身が出力した制御目標値と上記入力値とに基づき第2制御部20によって出力された修正目標値を学習する学習モデル11を有している。学習モデル11は、修正目標値と該修正目標値に対応する入力値とを併せて学習する。学習モデル11は、例えばAI技術を利用して学習を行う。第1制御部10は、学習モデル11における修正目標値の学習結果を考慮して、入力値に基づき制御目標値を導出し出力する。このように、第2制御部20によって出力された修正目標値を学習する学習モデル11を利用して制御目標値が出力されることにより、次回に同様のシチュエーションが現れた場合(同様の入力値が制御装置1に入力された場合)における、第1制御部10による制御目標値の導出精度を向上させることができる。学習モデル11の学習が進むことにより、制御目標値の導出精度が向上する。 The first control unit 10 has a learning model 11 that learns the correction target value output by the second control unit 20 based on the control target value output by itself and the input value. The learning model 11 learns the correction target value and the input value corresponding to the correction target value together. The learning model 11 performs learning using, for example, AI technology. The first control unit 10 derives and outputs a control target value based on the input value in consideration of the learning result of the modified target value in the learning model 11. In this way, when the control target value is output using the learning model 11 that learns the modified target value output by the second control unit 20, the same situation appears next time (similar input value). Is input to the control device 1), the accuracy of deriving the control target value by the first control unit 10 can be improved. As the learning of the learning model 11 progresses, the accuracy of deriving the control target value is improved.

学習モデル11を利用することによる効果について、図2及び図3を参照して説明する。図2及び図3は、修正目標値の学習を説明する図である。図2は、十分に学習が行われていない場合の制御目標値(破線)及び修正目標値(一点鎖線)を示している。図3は、ある程度学習が行われた場合の制御目標値(破線)及び修正目標値(一点鎖線)を示している。図2に示されるように、十分に学習が行われていない状態においては、特に初期の段階(時間が経過していない段階)において、制御目標値と修正目標値との乖離が大きい。一方で、ある程度学習が行われた後において、同様のシチュエーションが現れた場合には、図3に示されるように、制御目標値が前回学習された修正目標値に近づくように導出されるため、制御目標値と修正目標値との乖離が小さくなっている。このように、学習モデル11によって修正目標値が学習されることにより、学習済みのシチュエーションと同様のシチュエーションが現れた場合に、より早く、最適な制御目標値を導出することができる。 The effect of using the learning model 11 will be described with reference to FIGS. 2 and 3. 2 and 3 are diagrams for explaining the learning of the correction target value. FIG. 2 shows a control target value (broken line) and a modified target value (dashed line) when learning is not sufficiently performed. FIG. 3 shows a control target value (broken line) and a modified target value (dashed line) when learning is performed to some extent. As shown in FIG. 2, in a state where sufficient learning is not performed, the discrepancy between the control target value and the correction target value is large, especially in the initial stage (the stage where time has not passed). On the other hand, if a similar situation appears after some learning has been performed, the control target value is derived so as to approach the previously learned correction target value, as shown in FIG. The discrepancy between the control target value and the correction target value is small. By learning the modified target value by the learning model 11 in this way, when a situation similar to the learned situation appears, the optimum control target value can be derived more quickly.

第2制御部20は、第1制御部10によって出力された制御目標値と上記入力値とに基づき、制御目標値の修正値である修正目標値を導出する予測モデル21を有している。第2制御部20は、予測モデル21を用いて導出した修正目標値を出力する。予測モデル21は、現時点での入力値を用いて将来の制御対象100の挙動のシミュレーションを行い、シミュレーション結果を評価して、該評価が良くなるように、制御目標値を修正しながらシミュレーションを有限回数繰り返し、最終的な修正目標値を導出するモデルである。制御装置1では、タイムリーな制御を行う必要があるため、シミュレーションは有限回数しか行えない。有限回数のシミュレーションによって精度の高い修正目標値を導出するためには、第1制御部10から第2制御部20に入力される制御目標値の精度をある程度高くすることが重要となる。この点、上述したように、第1制御部10が、学習モデル11によって修正目標値を都度学習することにより、第1制御部10から第2制御部20に入力される制御目標値の精度を高めることができ、ひいては、第2制御部20から制御対象100に入力される修正目標値の精度を高めることができる。 The second control unit 20 has a prediction model 21 that derives a correction target value, which is a correction value of the control target value, based on the control target value output by the first control unit 10 and the input value. The second control unit 20 outputs the correction target value derived using the prediction model 21. The prediction model 21 simulates the behavior of the future controlled object 100 using the input value at the present time, evaluates the simulation result, and finitely modifies the control target value so that the evaluation is improved. It is a model that repeats the number of times and derives the final correction target value. Since the control device 1 needs to perform timely control, the simulation can be performed only a finite number of times. In order to derive a highly accurate correction target value by a finite number of simulations, it is important to increase the accuracy of the control target value input from the first control unit 10 to the second control unit 20 to some extent. In this regard, as described above, the first control unit 10 learns the correction target value each time by the learning model 11 to obtain the accuracy of the control target value input from the first control unit 10 to the second control unit 20. By extension, the accuracy of the correction target value input from the second control unit 20 to the control target 100 can be improved.

なお、制御装置1は、エンジン制御以外にも適用され、例えば自動運転制御に適用される。自動運転制御に適用される場合、制御対象100は例えばステアリング、アクセル、ブレーキである。第1制御部10及び第2制御部20に入力される入力値は、例えば運行ルート情報(ナビゲーション等から取得される情報)、現在値、道路の基本情報(制限速度、道路幅、車線数等)、障害物の情報(同一車線の前後を走る車両の位置及び相対速度、対向車線の車両の位置及び相対速度、自転車の位置及び相対速度、歩行者の位置及び相対速度等)である。そして、制御目標値及び修正目標値は、車速及び進行方向等の決定に係る、ステアリング、アクセル、ブレーキ等の制御値である。 The control device 1 is applied to other than engine control, and is applied to, for example, automatic driving control. When applied to automatic driving control, the controlled object 100 is, for example, steering, accelerator, and brake. The input values input to the first control unit 10 and the second control unit 20 are, for example, operation route information (information acquired from navigation, etc.), current value, basic road information (speed limit, road width, number of lanes, etc.). ), Obstacle information (position and relative speed of vehicles running in front of and behind the same lane, position and relative speed of vehicles in the oncoming lane, position and relative speed of bicycles, position and relative speed of pedestrians, etc.). The control target value and the correction target value are control values of steering, accelerator, brake, etc. related to determination of vehicle speed, traveling direction, and the like.

次に、図4を参照して、制御装置1が行う処理について説明する。図4は、制御装置1が行う処理を示すフローチャートである。ここでは、制御装置1をエンジン制御に適用する例(制御対象100がEGR(Exhaust Gas Recirculation)バルブ及びVNT(Variable NozzleTurbo)ノズルである例)を説明する。 Next, the process performed by the control device 1 will be described with reference to FIG. FIG. 4 is a flowchart showing the processing performed by the control device 1. Here, an example in which the control device 1 is applied to engine control (an example in which the control target 100 is an EGR (Exhaust Gas Recirculation) valve and a VNT (Variable Nozzle Turbo) nozzle) will be described.

図4に示されるように、制御装置1は、最初に入力値を取得する(ステップS1)。具体的には、制御装置1は、入力値として、例えば、エンジン回転数、ドライバ要求トルク(又はアクセル開度、燃料噴射量)、インテークマニフォールド圧力、及び吸入空気量等を取得する。 As shown in FIG. 4, the control device 1 first acquires the input value (step S1). Specifically, the control device 1 acquires, for example, engine speed, driver required torque (or accelerator opening degree, fuel injection amount), intake manifold pressure, intake air amount, and the like as input values.

つづいて、制御装置1の第1制御部10は、入力値に基づき制御目標値を導出し出力する(ステップS2)。制御装置1は、制御目標値として、例えば、EGRバルブの開度及びVNTノズルの位置を出力する。 Subsequently, the first control unit 10 of the control device 1 derives and outputs a control target value based on the input value (step S2). The control device 1 outputs, for example, the opening degree of the EGR valve and the position of the VNT nozzle as control target values.

つづいて、制御装置1の第2制御部20は、予測モデル21を用いて、制御目標値と入力値とに基づき制御目標値の修正値である修正目標値を導出し出力する(ステップS3)。修正目標値は、制御対象100であるEGRバルブ及びVNTノズルに入力されると共に、第1制御部10の学習モデル11に入力される。 Subsequently, the second control unit 20 of the control device 1 derives and outputs a correction target value which is a correction value of the control target value based on the control target value and the input value by using the prediction model 21 (step S3). .. The correction target value is input to the EGR valve and the VNT nozzle which are the control target 100, and is also input to the learning model 11 of the first control unit 10.

つづいて、第1制御部10の学習モデル11は、入力された修正目標値と該修正目標値に対応する入力値とを併せて学習する(ステップS4)。これにより、同様のシチュエーションが現れた場合(同様の入力値が入力された場合)において、より適切に制御目標値を導出することができる。最後に、制御を終了するか否かが判定され(ステップS5)、制御を終了しない場合にはステップS1の処理から再度実行され、制御を終了する場合には処理が終了する。 Subsequently, the learning model 11 of the first control unit 10 learns the input correction target value and the input value corresponding to the correction target value together (step S4). As a result, when a similar situation appears (when a similar input value is input), the control target value can be derived more appropriately. Finally, it is determined whether or not to end the control (step S5). If the control is not terminated, the process is re-executed from the process of step S1, and if the control is terminated, the process is terminated.

次に、本実施形態に係る制御装置1の作用効果について説明する。 Next, the operation and effect of the control device 1 according to the present embodiment will be described.

本実施形態に係る制御装置1は、制御目標値の導出に係る入力値に基づき、制御目標値を導出し出力する第1制御部10と、第1制御部10によって出力された制御目標値と入力値とに基づき制御目標値の修正値である修正目標値を導出する予測モデル21を有し、修正目標値を出力する第2制御部20と、を備える。 The control device 1 according to the present embodiment has a first control unit 10 that derives and outputs a control target value based on an input value related to the derivation of the control target value, and a control target value output by the first control unit 10. It has a prediction model 21 for deriving a correction target value which is a correction value of the control target value based on an input value, and includes a second control unit 20 for outputting the correction target value.

このような制御装置1では、第1制御部10によって導出された制御目標値が、第2制御部20の予測モデル21によって修正され、修正目標値が出力される。例えば、予測モデル21のみによって制御に係る目標値を導出しようとした場合(制御対象の出力を最適化する場合)においては、繰り返し処理に時間を要してしまい、限られた時間内に制御対象100の出力を最適化することができないおそれがある。一方で、例えば比較的短時間で制御対象100の出力を最適化するモデル(学習モデル11等)のみによって制御に係る目標値を導出しようとした場合においては、高精度なモデルを開発するために多大な労力を要してしまうと考えられる。この点、本実施形態に係る制御装置1では、初期の目標値が第1制御部10によってある程度大まかに設定された場合であっても、予測モデル21による修正によって、目標値設定を効率的に行うことができる。このことで、限られた時間で制御対象100の出力を最適化することができ、制御対象100の出力を好適に最適化することができる。以上のように、本実施形態に係る制御装置1によれば、モデル予測制御とAIを利用した制御の両方の欠点を補い、効率的に最適な制御を行うことができる。 In such a control device 1, the control target value derived by the first control unit 10 is corrected by the prediction model 21 of the second control unit 20, and the corrected target value is output. For example, when trying to derive the target value related to control only by the prediction model 21 (when optimizing the output of the controlled object), it takes time for the iterative process, and the controlled object is controlled within a limited time. There is a risk that the output of 100 cannot be optimized. On the other hand, for example, when trying to derive a target value related to control only by a model (learning model 11 or the like) that optimizes the output of the controlled object 100 in a relatively short time, in order to develop a highly accurate model. It is thought that a great deal of effort will be required. In this respect, in the control device 1 according to the present embodiment, even when the initial target value is roughly set by the first control unit 10, the target value can be set efficiently by the modification by the prediction model 21. It can be carried out. As a result, the output of the control target 100 can be optimized in a limited time, and the output of the control target 100 can be preferably optimized. As described above, according to the control device 1 according to the present embodiment, it is possible to compensate for the drawbacks of both the model prediction control and the control using AI, and efficiently perform the optimum control.

第1制御部10は、第2制御部20によって出力された修正目標値を学習する学習モデル11を有し、修正目標値の学習結果を考慮して、入力値に基づき制御目標値を導出し出力してもよい。このように、修正目標値が学習されることにより、次回に同様のシチュエーションが現れた場合における、第1制御部10による制御目標値の導出精度を向上させることができる。すなわち、予測モデル21による修正及び学習モデル11による修正した情報の学習が実行されることによって、その後の目標値設定を効率的に行うことができる。このことで、限られた時間で制御対象100の出力を最適化することができ、制御対象100の出力を好適に最適化することができる。 The first control unit 10 has a learning model 11 for learning the correction target value output by the second control unit 20, and derives a control target value based on the input value in consideration of the learning result of the correction target value. You may output it. By learning the correction target value in this way, it is possible to improve the accuracy of deriving the control target value by the first control unit 10 when a similar situation appears next time. That is, by executing the correction by the prediction model 21 and the learning of the corrected information by the learning model 11, the subsequent target value setting can be efficiently performed. As a result, the output of the control target 100 can be optimized in a limited time, and the output of the control target 100 can be suitably optimized.

学習モデル11は、修正目標値と該修正目標値に対応する入力値とを併せて学習してもよい。これにより、次回に同様のシチュエーションが現れた場合における、第1制御部10による制御目標値の導出精度をより好適に向上させることができる。 The learning model 11 may learn the correction target value and the input value corresponding to the correction target value together. As a result, the accuracy of deriving the control target value by the first control unit 10 when a similar situation appears next time can be more preferably improved.

1…制御装置、10…第1制御部、11…学習モデル、20…第2制御部、21…予測モデル、100…制御対象。 1 ... Control device, 10 ... First control unit, 11 ... Learning model, 20 ... Second control unit, 21 ... Prediction model, 100 ... Control target.

Claims (3)

制御目標値の導出に係る入力値に基づき、前記制御目標値を導出し出力する第1制御部と、
前記第1制御部によって出力された前記制御目標値と前記入力値とに基づき前記制御目標値の修正値である修正目標値を導出する予測モデルを有し、前記修正目標値を出力する第2制御部と、を備える、制御装置。
A first control unit that derives and outputs the control target value based on the input value related to the derivation of the control target value, and
A second unit having a prediction model for deriving a correction target value which is a correction value of the control target value based on the control target value output by the first control unit and the input value, and outputting the correction target value. A control device including a control unit.
前記第1制御部は、前記第2制御部によって出力された前記修正目標値を学習する学習モデルを有し、前記修正目標値の学習結果を考慮して、前記入力値に基づき前記制御目標値を導出し出力する、請求項1記載の制御装置。 The first control unit has a learning model for learning the correction target value output by the second control unit, and in consideration of the learning result of the correction target value, the control target value is based on the input value. The control device according to claim 1, wherein the control device is derived and output. 前記学習モデルは、前記修正目標値と該修正目標値に対応する入力値とを併せて学習する、請求項2記載の制御装置。 The control device according to claim 2, wherein the learning model learns the correction target value and the input value corresponding to the correction target value together.
JP2020004428A 2020-01-15 2020-01-15 Control device Active JP7451182B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020004428A JP7451182B2 (en) 2020-01-15 2020-01-15 Control device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020004428A JP7451182B2 (en) 2020-01-15 2020-01-15 Control device

Publications (2)

Publication Number Publication Date
JP2021111265A true JP2021111265A (en) 2021-08-02
JP7451182B2 JP7451182B2 (en) 2024-03-18

Family

ID=77060035

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020004428A Active JP7451182B2 (en) 2020-01-15 2020-01-15 Control device

Country Status (1)

Country Link
JP (1) JP7451182B2 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07244502A (en) * 1994-03-04 1995-09-19 Toshiba Corp Controller
JP2017102617A (en) * 2015-11-30 2017-06-08 オムロン株式会社 Correction device, control method of correction device, information processing program, and record medium
JP2019520642A (en) * 2016-06-10 2019-07-18 日本電気株式会社 Control objective function integration system, control objective function integration method, and control objective function integration program

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07244502A (en) * 1994-03-04 1995-09-19 Toshiba Corp Controller
JP2017102617A (en) * 2015-11-30 2017-06-08 オムロン株式会社 Correction device, control method of correction device, information processing program, and record medium
JP2019520642A (en) * 2016-06-10 2019-07-18 日本電気株式会社 Control objective function integration system, control objective function integration method, and control objective function integration program

Also Published As

Publication number Publication date
JP7451182B2 (en) 2024-03-18

Similar Documents

Publication Publication Date Title
Son et al. Safety-critical control for non-affine nonlinear systems with application on autonomous vehicle
Sakhdari et al. Adaptive tube-based nonlinear MPC for economic autonomous cruise control of plug-in hybrid electric vehicles
Brunner et al. Repetitive learning model predictive control: An autonomous racing example
US20060259287A1 (en) Vehicle chassis and power train set up tool for track trajectory and speed optimization
JP2008505378A (en) Vehicle control apparatus having a neural network
CN105700538A (en) A track following method based on a neural network and a PID algorithm
JPH1027008A (en) Method and device for controlling model base
KR102458608B1 (en) Model reference adptive control algorithm to address the vehicle actuation dynamics
CN113581182B (en) Automatic driving vehicle lane change track planning method and system based on reinforcement learning
Ure et al. Enhancing situational awareness and performance of adaptive cruise control through model predictive control and deep reinforcement learning
Cheng et al. Behavioral classification of drivers for driving efficiency related ADAS using artificial neural network
Zhao et al. “InfoRich” eco-driving control strategy for connected and automated vehicles
Girard et al. Intelligent cruise control applications: Real-time embedded hybrid control software
Hu et al. Lane-level navigation based eco-approach
Shen et al. Energy-efficient reactive and predictive connected cruise control
Zhu et al. Reinforcement learning based throttle and brake control for autonomous vehicle following
JP7451182B2 (en) Control device
JP2007120405A (en) Engine control device
Ozkan et al. Fuel-economical distributed model predictive control for heavy-duty truck platoon
EP3452710B1 (en) A method for determining a position of at least one actuator
US11365696B2 (en) Vehicle controller, method, and computer program for controlling vehicle
CN114228826B (en) Intelligent automobile driver emergency take-over behavior identification method and device
Mizutani et al. Vehicle speed control by a robotic driver considering time delay and parametric variations
JP6280776B2 (en) Control device for internal combustion engine
JP2016020642A (en) Internal combustion engine control unit

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221207

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20231018

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231121

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240117

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240305

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240306

R150 Certificate of patent or registration of utility model

Ref document number: 7451182

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150