JP2002245434A - Device and program for searching optimal solution by evolutionary method and controller of control object by evolutionary method - Google Patents

Device and program for searching optimal solution by evolutionary method and controller of control object by evolutionary method

Info

Publication number
JP2002245434A
JP2002245434A JP2001042904A JP2001042904A JP2002245434A JP 2002245434 A JP2002245434 A JP 2002245434A JP 2001042904 A JP2001042904 A JP 2001042904A JP 2001042904 A JP2001042904 A JP 2001042904A JP 2002245434 A JP2002245434 A JP 2002245434A
Authority
JP
Japan
Prior art keywords
individual
evaluation value
information
control
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001042904A
Other languages
Japanese (ja)
Inventor
Takaaki Mizutani
卓明 水谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Motor Co Ltd
Original Assignee
Yamaha Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Motor Co Ltd filed Critical Yamaha Motor Co Ltd
Priority to JP2001042904A priority Critical patent/JP2002245434A/en
Publication of JP2002245434A publication Critical patent/JP2002245434A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To provide a controller of a control object by an evolutionary method suitable to obtain an effective solution with a small number of the alternation of generations. SOLUTION: The fuel consumption characteristic and response characteristic of an engine 10 are optimized for a user by a GA(Generic Algorithm). The GA virtually generates a population composed of the sets of a plurality of individuals, and configures individual information regarded as the genetic information of the individual for each individual. Here, a control coefficient for constructing a control module is allocated to each individual information. In the same generation, the population is made to evolve by performing a genetic operation that performs an information operation simulating a genetic operation on the individual information, and an individual selection operation that performs individual existence or selection on the basis of the evaluation value of an individual by at least once each to progress a generation by several times. In the process of generation progress, the degree of response is predicted on the basis of individual information for each individual, and the genetic operation is applied to the individual information until the predicted degree of response satisfies a prescribed condition.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、自然進化の過程を
模倣して構築した進化的手法による装置およびプログラ
ムに係り、特に、少ない世代交代数で有効な解を得るの
に好適な進化的手法による最適解探索装置、進化的手法
による制御対象の制御装置および進化的手法による最適
解探索プログラムに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an apparatus and a program based on an evolutionary method constructed by imitating the process of natural evolution, and more particularly to an evolutionary method suitable for obtaining an effective solution with a small number of generation alternations. The present invention relates to an optimal solution search device based on an ERP, a control device for a controlled object by an evolutionary method, and an optimal solution search program by an Evolutionary method.

【0002】[0002]

【従来の技術】従来から、車両や家電製品等の製品の特
性を制御する場合、制御対象となる製品の特性は、開発
・設計段階で、その製品を使用すると思われる使用者を
想定し、その仮想使用者の好みや使用状況を加味し、で
きるだけ幅広い使用者に適応するように決められる。し
かし、上記製品を使用する使用者は、個々に特有の個性
を持っており、その好みも千差万別であるため、前記し
たように、その製品を使用すると思われる使用者の好み
等を想定して製品の開発・設計を行ったとしても、すべ
ての使用者が満足する特性を提供ことはほぼ不可能に近
い。この問題を解決するために、ニューラルネットワー
クや遺伝的アルゴリズム(以下、単にGAという。)を
用いて、購入後に使用者の好みや使用状況を推定し、使
用者が満足しうる特性に制御特性を変更していく制御方
法が試みられている。これには、例えば、特開2000-201
03号公報に開示されたものが知られている。
2. Description of the Related Art Conventionally, when controlling the characteristics of a product such as a vehicle or a home appliance, the characteristics of the product to be controlled are assumed at a development / design stage by assuming a user who will use the product. Taking into account the preferences and usage conditions of the virtual user, the virtual user is determined to adapt to as wide a range of users as possible. However, the users who use the above products have their own unique personalities, and their preferences vary widely, so as described above, the preferences of the users who are likely to use the products, etc. Even if products are developed and designed on the assumption, it is almost impossible to provide characteristics that are satisfied by all users. In order to solve this problem, the user's preference and use situation are estimated after purchase using a neural network or a genetic algorithm (hereinafter simply referred to as GA), and the control characteristics are adjusted to characteristics that can satisfy the user. A changing control method is being attempted. This includes, for example,
The one disclosed in Japanese Patent Publication No. 03 is known.

【0003】GAは、自然進化の過程を模倣し、適者生
存を原理として、探索空間のなかで探索点を表す個体を
最適解に向けて進化させることにより、効率的な探索を
行う確率的探索アルゴリズムである。具体的には、複数
の個体の集合からなる個体群を仮想的に生成するととも
に、各個体ごとにその個体の遺伝情報に見立てて個体情
報を構成する。そして、同一世代において、遺伝子操作
を模倣した情報操作を個体情報に対して行う遺伝的操
作、および個体の評価値に基づいて個体の生存または淘
汰を行う個体選択操作をそれぞれ少なくとも1回行って
世代を進行させる。適用する対象によって多少異なる
が、ある程度有効な解を得るには、一般に数百から数千
回の世代交代を繰り返す必要がある。
[0003] GA is a stochastic search that performs an efficient search by imitating the process of natural evolution and evolving an individual representing a search point in a search space toward an optimal solution based on the principle of survival of the fittest. Algorithm. More specifically, an individual group consisting of a set of a plurality of individuals is virtually generated, and individual information is configured for each individual in terms of genetic information of the individual. Then, in the same generation, a genetic operation in which an information operation imitating a genetic operation is performed on individual information and an individual selection operation in which an individual survives or is eliminated based on an evaluation value of an individual are performed at least once, respectively. To progress. Although it varies somewhat depending on the application target, in order to obtain a somewhat effective solution, it is generally necessary to repeat several hundred to several thousand generation changes.

【0004】[0004]

【発明が解決しようとする課題】しかしながら、例え
ば、車両用エンジンの制御特性を使用者向けに最適化す
るためにGAを適用し、使用者がその乗り心地を評価値
として与えるようにした場合、一回の世代交代を行うに
は、使用者による評価を必ず経なければならないため、
使用者は、満足しうる特性になるまでに数百から数千回
もの評価を与えなければならず、多大な時間を要する上
に大変煩わしい。
However, for example, when GA is applied to optimize the control characteristics of a vehicle engine for a user, and the user gives the ride comfort as an evaluation value, In order to perform one generation change, the evaluation by the user must be performed without fail.
The user has to give hundreds to thousands of evaluations to obtain satisfactory characteristics, which takes a lot of time and is very troublesome.

【0005】したがって、できるだけ少ない世代交代数
で有効な解が得られることが望まれる。このことはもち
ろん、車両用エンジンの制御特性を最適化する場合に限
らず、GAが有する一般的な課題とも言える。そこで、
本発明は、このような従来の技術の有する未解決の課題
に着目してなされたものであって、少ない世代交代数で
有効な解を得るのに好適な進化的手法による最適解探索
装置、進化的手法による制御対象の制御装置および進化
的手法による最適解探索プログラムを提供することを目
的としている。
Therefore, it is desired that an effective solution can be obtained with as few generational alternations as possible. Of course, this can be said to be not only a case where the control characteristics of the vehicle engine are optimized, but also a general problem that the GA has. Therefore,
The present invention has been made in view of such unresolved problems of the conventional technology, an optimal solution search device by an evolutionary method suitable for obtaining an effective solution with a small number of generation alternations, An object of the present invention is to provide a control device for a controlled object by an evolutionary method and an optimal solution search program by an evolutionary method.

【0006】[0006]

【課題を解決するための手段】上記目的を達成するため
に、本発明に係る請求項1記載の進化的手法による最適
解探索装置は、複数の個体の集合からなる個体群を仮想
的に生成するとともに、前記各個体ごとにその個体の遺
伝情報に見立てて個体情報を構成し、同一世代におい
て、遺伝子操作を模倣した情報操作を前記個体情報に対
して行う遺伝的操作、および評価関数により得られる前
記個体の評価値に基づいて前記個体の生存または淘汰を
行う個体選択操作をそれぞれ少なくとも1回行って世代
を進行させることにより、前記評価関数の最適解を探索
する装置であって、前記評価値を予測し、予測した予測
値に基づいて前記遺伝的操作を行うようになっている。
In order to achieve the above object, an optimal solution search device according to the present invention according to the first aspect of the present invention virtually generates an individual group consisting of a set of a plurality of individuals. At the same time, individual information is configured for each individual based on the genetic information of the individual, and in the same generation, an information operation simulating the genetic operation is performed on the individual information by a genetic operation and an evaluation function. An apparatus for searching for an optimal solution of the evaluation function by performing an individual selection operation of performing survival or selection of the individual based on the evaluation value of the individual at least once, and causing the generation to proceed, A value is predicted, and the genetic operation is performed based on the predicted value.

【0007】このような構成であれば、同一世代におい
て、遺伝的操作および個体選択操作がそれぞれ少なくと
も1回行われることにより世代が進行する。世代進行の
過程では、評価値が予測され、予測された予測値に基づ
いて遺伝的操作が行われる。一つの形態として例えば、
同一世代において、予測およびそれに基づく遺伝的操作
が1または複数回行われ、その後に個体選択操作が行わ
れることにより世代が進行する。
With such a configuration, the generation proceeds by performing the genetic operation and the individual selecting operation at least once each in the same generation. In the process of generation progress, an evaluation value is predicted, and a genetic operation is performed based on the predicted value. For example, as one form,
In the same generation, a prediction and a genetic operation based on the prediction are performed one or more times, and thereafter, an individual selection operation is performed, whereby the generation proceeds.

【0008】ここで、予測およびそれに基づく遺伝的操
作は、同一世代において少なくとも一回行う遺伝的操作
および個体選択操作とは別に行うようにしてもよいし、
同一世代において少なくとも一回行う遺伝的操作として
行うようにしてもよい。別に行う場合は、同一世代にお
いて必ず行わなくてもよく、例えば、所定世代ごとに行
うようにしてもよい。以下、請求項6記載の進化的手法
による制御対象の制御装置、および請求項15記載の進
化的手法による最適解探索プログラムにおいて同じであ
る。
[0008] Here, the prediction and the genetic operation based on the prediction may be performed separately from the genetic operation and the individual selection operation performed at least once in the same generation,
The genetic operation may be performed at least once in the same generation. When the process is performed separately, the process need not always be performed in the same generation. For example, the process may be performed every predetermined generation. Hereinafter, the same applies to the control device of the control target by the evolutionary method according to claim 6 and the optimal solution search program by the evolutionary method according to claim 15.

【0009】また、評価値の予測は、個体情報に基づい
て行うようにしてもよいが、それとは無関係の情報に基
づいて行うようにしてもよい。以下、請求項15記載の
進化的手法による最適解探索プログラムにおいて同じで
ある。また、請求項1記載の発明は、GAとして実現す
ることもできるし、その他、GP(Genetic Progress)
やES(evolutional Stratage)として実現することが
できる。以下、請求項6記載の進化的手法による制御対
象の制御装置、および請求項15記載の進化的手法によ
る最適解探索プログラムにおいて同じである。
The estimation of the evaluation value may be performed based on the individual information, or may be performed based on information unrelated thereto. Hereinafter, the same applies to the optimal solution search program by the evolutionary method according to claim 15. Further, the invention of claim 1 can be realized as a GA, and in addition, a GP (Genetic Progress)
And ES (evolutional Stratage). Hereinafter, the same applies to the control device of the control target by the evolutionary method according to claim 6 and the optimal solution search program by the evolutionary method according to claim 15.

【0010】さらに、本発明に係る請求項2記載の進化
的手法による最適解探索装置は、請求項1記載の進化的
手法による最適解探索装置において、前記予測値が所定
条件を満たすまで、前記遺伝的操作および前記予測を繰
り返し行うようになっている。このような構成であれ
ば、予測値が所定条件を満たすまで、遺伝的操作および
予測が繰り返し行われる。
Further, according to a second aspect of the present invention, there is provided an optimal solution searching apparatus based on the evolutionary method according to the first aspect, wherein the prediction value satisfies a predetermined condition until the predicted value satisfies a predetermined condition. The genetic operation and the prediction are repeatedly performed. With such a configuration, the genetic operation and the prediction are repeatedly performed until the predicted value satisfies the predetermined condition.

【0011】さらに、本発明に係る請求項3記載の進化
的手法による最適解探索装置は、請求項1および2のい
ずれかに記載の進化的手法による最適解探索装置におい
て、前記評価値は、第1評価値と第2評価値とからな
り、前記個体情報に基づいて前記第2評価値を予測する
予測手段を備え、前記予測手段で予測した予測値が所定
条件を満たすまで、前記遺伝的操作および前記予測を繰
り返し行うようになっている。
Further, according to a third aspect of the present invention, there is provided an optimal solution searching apparatus using an evolutionary method according to any one of the first and second aspects. A prediction unit configured to predict the second evaluation value based on the individual information, the prediction unit comprising a first evaluation value and a second evaluation value; The operation and the prediction are repeatedly performed.

【0012】このような構成であれば、予測手段によ
り、個体情報に基づいて第2評価値が予測され、予測さ
れた予測値が所定条件を満たすまで、遺伝的操作および
予測が繰り返し行われる。さらに、本発明に係る請求項
4記載の進化的手法による最適解探索装置は、請求項3
記載の進化的手法による最適解探索装置において、前記
予測値に基づいて、前記個体情報のうち前記第2評価値
に影響を及ぼす情報に対して前記遺伝的操作を行うよう
になっている。
With such a configuration, the second evaluation value is predicted by the prediction means based on the individual information, and the genetic operation and the prediction are repeatedly performed until the predicted value satisfies a predetermined condition. Furthermore, the optimal solution search device using the evolutionary method according to claim 4 of the present invention is the third embodiment.
In the optimal solution search device according to the described evolutionary method, the genetic operation is performed on information affecting the second evaluation value among the individual information based on the predicted value.

【0013】このような構成であれば、予測値に基づい
て、個体情報のうち第2評価値に影響を及ぼす情報に対
して遺伝的操作が行われる。さらに、本発明に係る請求
項5記載の進化的手法による最適解探索装置は、請求項
3および4のいずれかに記載の進化的手法による最適解
探索装置において、前記予測手段は、学習により前記評
価値を予測するとともに、前記予測値と前記評価値との
差分に基づいて学習を行うようになっている。
With such a configuration, a genetic operation is performed on information affecting the second evaluation value in the individual information based on the predicted value. Furthermore, the optimal solution search device by the evolutionary method according to claim 5 according to the present invention is the optimal solution search device by the evolutionary method according to any one of claims 3 and 4, wherein the predicting means is configured to perform the learning by learning. The evaluation value is predicted, and learning is performed based on the difference between the predicted value and the evaluation value.

【0014】このような構成であれば、予測手段によ
り、学習により評価値が予測され、予測値と評価値との
差分に基づいて学習が行われる。一方、上記目的を達成
するために、本発明に係る請求項6記載の進化的手法に
よる制御対象の制御装置は、複数の個体の集合からなる
個体群を仮想的に生成するとともに、前記各個体ごとに
その個体の遺伝情報に見立てて個体情報を構成し、当該
個体情報には、制御対象の特性を制御する制御系の制御
特性に影響を及ぼす制御係数を割り当て、さらに、遺伝
子操作を模倣した情報操作を前記個体情報に対して行う
個体情報操作手段と、前記個体の評価値を算出する評価
値算出手段と、前記評価値算出手段で算出した評価値に
基づいて前記個体の生存または淘汰を行う個体選択手段
とを備え、同一世代において、前記個体情報操作手段に
よる遺伝的操作および前記個体選択手段による個体選択
操作をそれぞれ少なくとも1回行って世代を進行させ、
これにより進化を遂げた個体の個体情報を前記制御係数
として用いることにより、前記制御系の制御特性を最適
化していく装置であって、前記個体情報に基づいて前記
評価値を予測する予測手段を備え、前記予測手段で予測
した予測値に基づいて前記遺伝的操作を行うようになっ
ている。
With such a configuration, the estimation means predicts the evaluation value by learning, and the learning is performed based on the difference between the predicted value and the evaluation value. On the other hand, in order to achieve the above object, the control device of the control object by the evolutionary method according to claim 6 according to the present invention virtually generates an individual group consisting of a set of a plurality of individuals, For each individual, the individual information is configured based on the genetic information of the individual, and the individual information is assigned a control coefficient that influences the control characteristics of a control system that controls the characteristics of the control target, and further imitates genetic manipulation. Individual information operation means for performing information operations on the individual information; evaluation value calculation means for calculating an evaluation value of the individual; and survival or selection of the individual based on the evaluation value calculated by the evaluation value calculation means. Individual selecting means for performing the genetic operation by the individual information operating means and the individual selecting operation by the individual selecting means at least once in the same generation to advance the generation. ,
An apparatus for optimizing the control characteristics of the control system by using the individual information of the individual that has evolved as the control coefficient, and a prediction unit that predicts the evaluation value based on the individual information. The genetic operation is performed based on the predicted value predicted by the prediction means.

【0015】このような構成であれば、個体情報操作手
段により、遺伝子操作を模倣した情報操作が個体情報に
対して行われ、評価値算出手段により、評価値が算出さ
れ、個体選択手段により、算出された評価値に基づいて
個体の生存または淘汰が行われる。そして、この個体情
報操作手段による遺伝的操作および個体選択手段による
個体選択操作が、同一世代においてそれぞれ少なくとも
1回行われることにより世代が進行する。世代進行の過
程では、予測手段により、評価値が予測され、予測され
た予測値に基づいて遺伝的操作が行われる。一つの形態
として例えば、同一世代において、予測およびそれに基
づく遺伝的操作が1または複数回行われ、その後に個体
選択操作が行われることにより世代が進行する。こうし
て最終的に個体が進化を遂げると、その個体の個体情報
が制御係数として用いられる。
With such a configuration, the individual information operating means performs an information operation imitating the genetic operation on the individual information, the evaluation value is calculated by the evaluation value calculating means, and the individual value selecting means is used by the individual selecting means. Survival or selection of the individual is performed based on the calculated evaluation value. The generation proceeds by performing the genetic operation by the individual information operation means and the individual selection operation by the individual selection means at least once in the same generation. In the process of generation progression, an evaluation value is predicted by the prediction means, and a genetic operation is performed based on the predicted value. As one form, for example, in the same generation, a prediction and a genetic operation based on the prediction are performed one or more times, and then an individual selection operation is performed, so that the generation proceeds. When the individual finally evolves in this way, the individual information of the individual is used as a control coefficient.

【0016】さらに、本発明に係る請求項7記載の進化
的手法による制御対象の制御装置は、請求項6記載の進
化的手法による制御対象の制御装置において、前記評価
値は、第1評価値と第2評価値とからなり、前記予測手
段は、前記個体情報に基づいて前記第2評価値を予測す
るようになっており、前記予測手段で予測した予測値が
所定条件を満たすまで、前記遺伝的操作および前記予測
を繰り返し行うようになっている。
Further, according to a seventh aspect of the present invention, there is provided a control apparatus for controlling an object by an evolutionary method, wherein the evaluation value is a first evaluation value. And the second evaluation value, wherein the prediction means is configured to predict the second evaluation value based on the individual information, and until the prediction value predicted by the prediction means satisfies a predetermined condition. The genetic operation and the prediction are repeatedly performed.

【0017】このような構成であれば、予測手段によ
り、個人情報に基づいて第2評価値が予測され、予測さ
れた予測値が所定条件を満たすまで、遺伝的操作および
予測が繰り返し行われる。さらに、本発明に係る請求項
8記載の進化的手法による制御対象の制御装置は、請求
項7記載の進化的手法による制御対象の制御装置におい
て、前記予測値に基づいて、前記個体情報のうち前記第
2評価値に影響を及ぼす情報に対して前記遺伝的操作を
行うようになっている。
With such a configuration, the second evaluation value is predicted by the prediction means based on the personal information, and the genetic operation and the prediction are repeatedly performed until the predicted value satisfies a predetermined condition. Furthermore, the control device of the controlled object by the evolutionary method according to claim 8 according to the present invention is the control device of the controlled object by the evolutionary method according to claim 7, wherein the control unit controls the individual information based on the predicted value. The genetic operation is performed on information affecting the second evaluation value.

【0018】このような構成であれば、予測値に基づい
て、個体情報のうち第2評価値に影響を及ぼす情報に対
して遺伝的操作が行われる。さらに、本発明に係る請求
項9記載の進化的手法による制御対象の制御装置は、請
求項7および8のいずれかに記載の進化的手法による制
御対象の制御装置において、前記制御対象は、エンジン
であり、前記第1評価値は、前記エンジンの燃費であ
り、前記第2評価値は、前記エンジンの回転数変化率お
よびスロットル開度変化率により定まるレスポンス度で
ある。
With such a configuration, a genetic operation is performed on information affecting the second evaluation value in the individual information based on the predicted value. Further, according to a ninth aspect of the present invention, there is provided the control device for an object to be controlled by an evolutionary method, wherein the control object is an engine. Wherein the first evaluation value is a fuel efficiency of the engine, and the second evaluation value is a responsiveness determined by a rotation rate change rate and a throttle opening change rate of the engine.

【0019】このような構成であれば、予測手段によ
り、個体情報に基づいてレスポンス度が算出され、評価
値算出手段により、燃費およびレスポンス度が算出され
る。さらに、本発明に係る請求項10記載の進化的手法
による制御対象の制御装置は、請求項9記載の進化的手
法による制御対象の制御装置において、前記予測手段
は、前記個体情報を前記制御係数として用いて前記エン
ジンを運転したときに得られる、前記エンジンの燃料噴
射量および前記エンジンの過渡状態において前記燃料噴
射量を補正する過渡補正量に基づいて、前記第2評価値
を予測するようになっている。
With such a configuration, the predicting means calculates the response based on the individual information, and the evaluation value calculating means calculates the fuel efficiency and the response. Further, according to a tenth aspect of the present invention, in the control apparatus for controlling a controlled object by the evolutionary method according to the ninth aspect, in the control apparatus for a controlled object by the evolutionary method according to the ninth aspect, the predicting means includes: The second evaluation value is predicted based on a fuel injection amount of the engine and a transient correction amount for correcting the fuel injection amount in a transient state of the engine, which is obtained when the engine is operated using Has become.

【0020】このような構成であれば、予測手段によ
り、個体情報を制御係数として用いてエンジンを運転し
たときに得られる燃料噴射量および過渡補正量に基づい
て、レスポンス度が第2評価値として予測される。さら
に、本発明に係る請求項11記載の進化的手法による制
御対象の制御装置は、請求項6ないし10のいずれかに
記載の進化的手法による制御対象の制御装置において、
前記制御対象は、エンジンであり、前記個体情報には、
前記制御係数として、前記エンジンの燃料噴射量、前記
エンジンの過渡状態において前記燃料噴射量を補正する
過渡補正量、前記燃料噴射量の補正値または前記過渡補
正量の補正値を割り当てるようになっている。
With such a configuration, the response is set as the second evaluation value by the prediction means based on the fuel injection amount and the transient correction amount obtained when the engine is operated using the individual information as the control coefficient. is expected. Furthermore, the control device of the control target by the evolutionary method according to claim 11 according to the present invention is the control device of the control target by the evolutionary method according to any one of claims 6 to 10,
The control target is an engine, and the individual information includes
As the control coefficient, a fuel injection amount of the engine, a transient correction amount for correcting the fuel injection amount in a transient state of the engine, a correction value of the fuel injection amount, or a correction value of the transient correction amount is assigned. I have.

【0021】このような構成であれば、評価値を向上す
る方向に個体群が進化していくにつれて、高い評価値を
得ることが期待できる、燃料噴射量、過渡補正量、燃料
噴射量の補正値または過渡補正量の補正値が決定され
る。さらに、本発明に係る請求項12記載の進化的手法
による制御対象の制御装置は、請求項6ないし10のい
ずれかに記載の進化的手法による制御対象の制御装置に
おいて、前記制御対象は、エンジンであり、前記エンジ
ンの燃料噴射量、前記エンジンの過渡状態において前記
燃料噴射量を補正する過渡補正量、前記燃料噴射量の補
正値または前記過渡補正量の補正値をニューラルネット
ワークにより生成するようになっており、前記個体情報
には、前記制御係数として、前記ニューラルネットワー
クにおけるシナプスの結合係数を割り当てるようになっ
ている。
With this configuration, as the population evolves in a direction to improve the evaluation value, it is expected that a higher evaluation value can be obtained. The value or the correction value of the transient correction amount is determined. Furthermore, the control device of the controlled object by the evolutionary method according to claim 12 of the present invention is the control device of the controlled object by the evolutionary method according to any one of claims 6 to 10, wherein the controlled object is an engine. The fuel injection amount of the engine, a transient correction amount for correcting the fuel injection amount in a transient state of the engine, a correction value of the fuel injection amount, or a correction value of the transient correction amount is generated by a neural network. The individual information is assigned a synapse coupling coefficient in the neural network as the control coefficient.

【0022】このような構成であれば、ニューラルネッ
トワークにより、燃料噴射量、過渡補正量、燃料噴射量
の補正値または過渡補正量の補正値が生成されるが、評
価値を向上する方向に個体群が進化していくにつれて、
高い評価値を得ることが期待できる、ニューラルネット
ワークにおけるシナプスの結合係数が決定される。さら
に、本発明に係る請求項13記載の進化的手法による制
御対象の制御装置は、請求項7および8のいずれかに記
載の進化的手法による制御対象の制御装置において、前
記制御対象は、電気モータであり、前記第1評価値は、
前記電気モータの電力消費であり、前記第2評価値は、
前記電気モータの回転変化率である。
With this configuration, the fuel injection amount, the transient correction amount, the correction value of the fuel injection amount, or the correction value of the transient correction amount are generated by the neural network. As the group evolves,
A synapse coupling coefficient in the neural network that can be expected to obtain a high evaluation value is determined. Further, according to a thirteenth aspect of the present invention, there is provided a control device for a controlled object by an evolutionary method, wherein the controlled object is an electric control device, A motor, wherein the first evaluation value is:
Power consumption of the electric motor, the second evaluation value is:
It is a rotation change rate of the electric motor.

【0023】このような構成であれば、予測手段によ
り、個体情報に基づいて回転変化率が算出され、評価値
算出手段により、電力消費および回転変化率が算出され
る。さらに、本発明に係る請求項14記載の進化的手法
による制御対象の制御装置は、請求項6ないし13のい
ずれかに記載の進化的手法による制御対象の制御装置に
おいて、前記予測手段は、学習により前記評価値を予測
するとともに、前記予測値と前記評価値との差分に基づ
いて学習を行うようになっている。
With such a configuration, the prediction means calculates the rotation change rate based on the individual information, and the evaluation value calculation means calculates the power consumption and the rotation change rate. Further, the control device of the controlled object by the evolutionary method according to claim 14 of the present invention is the control device of the controlled object by the evolutionary method according to any one of claims 6 to 13, wherein the predicting means includes a learning device. And the learning is performed based on the difference between the predicted value and the evaluation value.

【0024】このような構成であれば、予測手段によ
り、学習により評価値が予測され、予測値と評価値との
差分に基づいて学習が行われる。一方、上記目的を達成
するために、本発明に係る請求項15記載の進化的手法
による最適解探索プログラムは、複数の個体の集合から
なる個体群を仮想的に生成するとともに、前記各個体ご
とにその個体の遺伝情報に見立てて個体情報を構成し、
同一世代において、遺伝子操作を模倣した情報操作を前
記個体情報に対して行う遺伝的操作、および評価関数に
より得られる前記個体の評価値に基づいて前記個体の生
存または淘汰を行う個体選択操作をそれぞれ少なくとも
1回行って世代を進行させることにより、前記評価関数
の最適解を探索するコンピュータ実行可能なプログラム
であって、前記評価値を予測し、予測した予測値に基づ
いて前記遺伝的操作を行うようになっている。
With such a configuration, the prediction means predicts the evaluation value by learning, and the learning is performed based on the difference between the predicted value and the evaluation value. On the other hand, in order to achieve the above object, an optimal solution search program by an evolutionary method according to claim 15 of the present invention virtually generates an individual group consisting of a set of a plurality of individuals, To compose individual information based on the genetic information of the individual,
In the same generation, a genetic operation that performs an information operation imitating a genetic operation on the individual information, and an individual selection operation that performs survival or selection of the individual based on an evaluation value of the individual obtained by an evaluation function, respectively. A computer-executable program for searching for an optimal solution of the evaluation function by performing the generation at least once, and predicting the evaluation value, and performing the genetic operation based on the predicted value. It has become.

【0025】このような構成であれば、プログラムに従
ってコンピュータが実行したときは、請求項1記載の進
化的手法による最適解探索装置と同等の作用が得られ
る。
With such a configuration, when the computer executes the program in accordance with the program, an operation equivalent to that of the optimal solution search device according to the first aspect of the invention is obtained.

【0026】[0026]

【発明の実施の形態】以下、本発明の実施の形態を図面
を参照しながら説明する。図1ないし図12は、本発明
に係る進化的手法による最適解探索装置、進化的手法に
よる制御対象の制御装置および進化的手法による最適解
探索プログラムの実施の形態を示す図である。
Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 to FIG. 12 are diagrams showing an embodiment of an optimum solution search device by an evolutionary method, a control device of a control target by an evolutionary method, and an optimum solution search program by an evolutionary method according to the present invention.

【0027】まず、本発明の基本概念を図1を参照しな
がら説明する。図1は、本発明の基本概念を示す図であ
る。本発明の基本構成は、図1に示すように、最適化対
象1と、最適化対象1の操作結果に基づいて最適化対象
1の評価値を算出する評価部2と、最適化対象1の評価
値を予測する予測部3と、評価部2で算出した評価値、
予測部3で予測した予測値および最適化対象1の操作結
果に基づいて進化型最適化アルゴリズムにより最適化対
象1の操作量を決定し出力する進化機構4とで構成され
ている。
First, the basic concept of the present invention will be described with reference to FIG. FIG. 1 is a diagram showing the basic concept of the present invention. As shown in FIG. 1, the basic configuration of the present invention includes an optimization target 1, an evaluation unit 2 that calculates an evaluation value of the optimization target 1 based on an operation result of the optimization target 1, A prediction unit 3 for predicting an evaluation value, an evaluation value calculated by the evaluation unit 2,
An evolution mechanism 4 for determining and outputting the operation amount of the optimization target 1 by an evolutionary optimization algorithm based on the prediction value predicted by the prediction unit 3 and the operation result of the optimization target 1.

【0028】予測部3は、学習機構を備え、評価部2で
算出した評価値および進化機構4で算出した操作量に基
づいて学習機構を学習させ、学習機構により、最適化対
象1の評価値を予測するようになっている。進化機構4
は、評価部2で算出した評価値、予測部3で予測した予
測値および最適化対象1の操作結果に基づいて、GAに
より、最適化対象1の操作特性が最適となるような操作
量を決定し、決定した操作量を最適化対象1に出力する
ようになっている。GAによる進化シミュレーションで
は、同一世代において、予測部3からの予測値が所定条
件を満たすまで、個体情報に対する遺伝的操作および予
測部3による予測を繰り返し行う。
The predicting section 3 has a learning mechanism, and makes the learning mechanism learn based on the evaluation value calculated by the evaluation section 2 and the operation amount calculated by the evolution mechanism 4, and the learning mechanism evaluates the evaluation value of the optimization target 1. Is to predict. Evolution mechanism 4
Is based on the evaluation value calculated by the evaluation unit 2, the prediction value predicted by the prediction unit 3, and the operation result of the optimization target 1, and the operation amount that optimizes the operation characteristic of the optimization target 1 is determined by GA. The determined operation amount is output to the optimization target 1. In the evolution simulation by GA, the genetic operation on the individual information and the prediction by the prediction unit 3 are repeatedly performed until the predicted value from the prediction unit 3 satisfies a predetermined condition in the same generation.

【0029】次に、本発明の基本構成を図2を参照しな
がら説明する。図2は、本発明の基本構成を示すブロッ
ク図である。本発明の基本構成は、図2に示すように、
制御対象50と、制御対象50の制御結果に基づいて制
御対象50の制御量を制御する制御装置60とで構成さ
れている。
Next, the basic configuration of the present invention will be described with reference to FIG. FIG. 2 is a block diagram showing a basic configuration of the present invention. The basic configuration of the present invention is as shown in FIG.
The control device 50 includes a control target 50 and a control device 60 that controls a control amount of the control target 50 based on a control result of the control target 50.

【0030】制御装置60は、反射層500、学習層6
00および進化適応層700の3つの制御層からなり、
制御対象50から制御結果を入力し、入力した制御結果
に基づいて反射層500で基本制御量を決定し、学習層
600および進化適応層700で基本制御量に対する補
正率を決定し、これら基本制御量および補正率から最終
的な制御量を決定する。以下、反射層500、学習層6
00および進化適応層700の構成を詳細に説明する。
The control device 60 includes a reflection layer 500, a learning layer 6
00 and an evolutionary adaptation layer 700,
A control result is input from the control target 50, a basic control amount is determined by the reflection layer 500 based on the input control result, and a correction rate for the basic control amount is determined by the learning layer 600 and the evolution adaptive layer 700. The final control amount is determined from the amount and the correction rate. Hereinafter, the reflection layer 500 and the learning layer 6
00 and the configuration of the evolution adaptive layer 700 will be described in detail.

【0031】反射層500は、数式、マップ、ニューラ
ルネットワーク、ファジールール、サブサンプションア
ーキテクチャ等の形式で、基本制御量と制御結果との関
係を定義付ける基礎制御部510を備え、基礎制御部5
10は、制御対象50から制御結果を入力し、入力した
制御結果に基づいて基本制御量を決定して出力する。な
お、サブサンプションアーキテクチャとは、並列的な処
理を行う行動型人工知能として公知である。
The reflection layer 500 includes a basic control unit 510 for defining a relationship between a basic control amount and a control result in the form of a mathematical expression, a map, a neural network, a fuzzy rule, a subsumption architecture, and the like.
The control unit 10 receives a control result from the control target 50, determines a basic control amount based on the input control result, and outputs the basic control amount. The subsumption architecture is known as behavioral artificial intelligence that performs parallel processing.

【0032】進化適応層700は、使用者との入出力を
行うインターフェース部710と、GAによる進化シミ
ュレーションを行って制御対象50の制御特性を最適化
する進化適応部720と、GAにおける個体の評価値を
算出する評価部730と、GAにおける個体の評価値を
予測する予測部740とで構成されている。進化適応部
720は、制御結果に基づいて、反射層500からの基
本制御量を使用者の希望に沿った値に補正するための進
化補正率を出力する制御モジュールを少なくとも一つ有
し、GAにより制御モジュールを最適化するように構成
されている。GAでは、複数の個体の集合からなる個体
群を仮想的に生成するとともに、各個体ごとにその個体
の遺伝情報に見立てて個体情報を構成する。ここで、各
個体情報には、制御モジュールを構築するための制御係
数を割り当てる。そして、同一世代において、遺伝子操
作を模倣した情報操作を個体情報に対して行う遺伝的操
作、および個体の評価値に基づいて個体の生存または淘
汰を行う個体選択操作をそれぞれ少なくとも1回行って
世代を所定回進行させることにより、個体群を進化させ
る。所定回数の世代交代が終了したときは、個体群のな
かから評価値が最も高い個体を抽出し、抽出した個体の
個体情報を制御係数として用い制御モジュールを構築す
る。以下、評価値が最も高い個体の個体情報を用いて構
築した制御モジュールのことを「最適制御モジュール」
という。なお、制御モジュールとは、制御系のあるまと
まった制御を行う一単位をいう。
The evolution adaptation layer 700 includes an interface unit 710 for input / output with the user, an evolution adaptation unit 720 for optimizing the control characteristics of the control target 50 by performing an evolution simulation using a GA, and an individual evaluation in the GA. The evaluation unit 730 includes an evaluation unit 730 that calculates a value, and a prediction unit 740 that estimates an evaluation value of an individual in GA. The evolution adaptation unit 720 has at least one control module that outputs an evolution correction rate for correcting the basic control amount from the reflective layer 500 to a value according to the user's desire based on the control result. To optimize the control module. In the GA, an individual group consisting of a set of a plurality of individuals is virtually generated, and individual information is configured for each individual in terms of genetic information of the individual. Here, a control coefficient for constructing a control module is assigned to each individual information. Then, in the same generation, a genetic operation in which an information operation imitating a genetic operation is performed on individual information and an individual selection operation in which an individual survives or is eliminated based on an evaluation value of an individual are performed at least once, respectively. Is advanced a predetermined number of times to evolve the population. When the predetermined number of generations has been changed, an individual having the highest evaluation value is extracted from the individual group, and a control module is constructed using individual information of the extracted individual as a control coefficient. Hereinafter, the control module constructed using the individual information of the individual with the highest evaluation value is referred to as the “optimal control module”.
That. Note that the control module is a unit that performs a certain control of a control system.

【0033】また、進化適応部720は、最適制御モジ
ュールを構築した後、進化適応部720の制御モジュー
ルをその最適制御モジュールに固定し、反射層500か
らの基本制御量を補正する進化補正率による制御を行う
一方、学習層600にその最適制御モジュールに関する
情報を学習させる。また、最適制御モジュールに関する
情報を学習層600に学習させた後は、その出力を
「1」に戻し、その後は、使用者の指示に応じて作動す
る。すなわち、進化適応部720の制御モジュールによ
る制御が行われるのは、進化シミュレーション中および
学習中のみである。
After constructing the optimal control module, the evolution adaptation unit 720 fixes the control module of the evolution adaptation unit 720 to the optimal control module, and adjusts the basic control amount from the reflection layer 500 by the evolution correction rate. While performing the control, the learning layer 600 is made to learn information on the optimal control module. After the learning layer 600 learns the information on the optimal control module, the output is returned to “1”, and thereafter, the operation is performed according to the user's instruction. That is, the control by the control module of the evolution adaptation unit 720 is performed only during the evolution simulation and during the learning.

【0034】学習層600は、学習用と実行用とに切換
可能な2つのニューラルネットワークを有する学習部6
10を備え、学習部610は、一方のニューラルネット
ワーク(実行用)で制御を実行している間、他方のニュ
ーラルネットワーク(学習用)で進化適応層700から
最適制御モジュールに関する入力と出力との関係を学習
する。学習用ニューラルネットワークでの学習が終了す
ると、制御を実行しているニューラルネットワークと学
習後のニューラルネットワークとを切り換え、学習後の
ニューラルネットワークで学習結果から得られる制御モ
ジュールによる制御を開始し、制御を実行していたニュ
ーラルネットワークが学習用として機能し始める。な
お、学習層600におけるニューラルネットワークは、
初期状態では「1」を出力するように設定されており、
したがって、初期状態では、反射層500と進化適応層
700とによる制御が行われる。
The learning layer 600 includes a learning section 6 having two neural networks that can be switched between learning and execution.
The learning unit 610 is configured to control the relationship between the input and the output of the optimal control module from the evolution adaptive layer 700 while performing the control using one neural network (for execution) and the other neural network (for learning). To learn. When the learning by the learning neural network is completed, the neural network performing the control and the neural network after the learning are switched, and the control by the control module obtained from the learning result in the neural network after the learning is started. The running neural network begins to function for learning. Note that the neural network in the learning layer 600 is
In the initial state, it is set to output "1",
Therefore, in the initial state, control by the reflective layer 500 and the evolution adaptive layer 700 is performed.

【0035】実行用ニューラルネットワークは、制御対
象50から制御結果を入力し、入力した制御結果に基づ
いて反射層500からの基本制御量を補正するための学
習補正率を出力するようになっている。この構成は、学
習用ニューラルネットワークについても同様である。そ
して、制御装置60は、学習層600からの学習補正率
と進化適応層700からの進化補正率とを加算し、反射
層500からの基本制御量にその加算結果を乗算するこ
とにより制御量を算出する。この制御量を制御対象50
に出力する。
The execution neural network receives a control result from the control target 50 and outputs a learning correction rate for correcting the basic control amount from the reflection layer 500 based on the input control result. . This configuration is the same for the learning neural network. Then, the control device 60 adds the learning correction rate from the learning layer 600 and the evolution correction rate from the evolution adaptation layer 700, and multiplies the basic control amount from the reflection layer 500 by the addition result to obtain the control amount. calculate. This control amount is set as the control target 50
Output to

【0036】以下、本発明のより具体的な実施の形態を
説明する。本実施の形態は、本発明に係る進化的手法に
よる最適解探索装置、進化的手法による制御対象の制御
装置および進化的手法による最適解探索プログラムを、
図3に示すように、エンジン10の燃費特性およびレス
ポンス特性をGAにより使用者向けに最適化する場合に
ついて適用したものである。
Hereinafter, more specific embodiments of the present invention will be described. In the present embodiment, an optimal solution search device by an evolutionary method, a control device of an object to be controlled by an evolutionary method, and an optimal solution search program by an evolutionary method according to the present invention,
As shown in FIG. 3, the present invention is applied to a case where the fuel economy characteristics and response characteristics of the engine 10 are optimized for the user by GA.

【0037】まず、本発明を適用するエンジン制御シス
テムの構成を図3を参照しながら説明する。図3は、本
発明を適用するエンジン制御システムの構成を示すブロ
ック図である。エンジン制御システムは、図3に示すよ
うに、エンジン10と、エンジン10の作動状態を検出
してエンジン10の作動状態に関する各種の情報(以
下、外界情報と総称する。)を出力する各種センサ20
と、各種センサ20からの外界情報に基づいてエンジン
10の燃料噴射量を制御する制御装置30とで構成され
ている。
First, the configuration of an engine control system to which the present invention is applied will be described with reference to FIG. FIG. 3 is a block diagram showing a configuration of an engine control system to which the present invention is applied. As shown in FIG. 3, the engine control system detects the operating state of the engine 10 and various sensors 20 that output various kinds of information on the operating state of the engine 10 (hereinafter collectively referred to as external information).
And a control device 30 that controls the fuel injection amount of the engine 10 based on the external information from the various sensors 20.

【0038】各種センサ20は、エンジン10の作動状
態および車両の走行状態を検出し、その検出結果に基づ
いて、エンジン10の回転数、スロットル開度、スロッ
トル開度の変化率、距離パルスおよび燃料噴射量を外界
情報として出力するようになっている。制御装置30
は、反射層100、学習層200および進化適応層30
0の3つの制御層からなり、各種センサ20から外界情
報を入力し、入力した外界情報に基づいて反射層100
で燃料の基本噴射量を決定し、学習層200および進化
適応層300で基本噴射量に対する補正量を決定し、こ
れら基本噴射量および補正量から最終的な燃料噴射量を
決定する。以下、反射層100、学習層200および進
化適応層300の構成を詳細に説明する。
The various sensors 20 detect the operating state of the engine 10 and the running state of the vehicle, and based on the detection results, the rotation speed of the engine 10, the throttle opening, the rate of change of the throttle opening, the distance pulse, and the fuel. The injection amount is output as external information. Control device 30
Are the reflection layer 100, the learning layer 200, and the evolution adaptive layer 30
0, and inputs external information from various sensors 20. The reflection layer 100 is formed based on the input external information.
Determines the basic injection amount of the fuel, the learning layer 200 and the evolution adaptation layer 300 determine the correction amount for the basic injection amount, and determines the final fuel injection amount from the basic injection amount and the correction amount. Hereinafter, the configurations of the reflection layer 100, the learning layer 200, and the evolution adaptive layer 300 will be described in detail.

【0039】反射層100は、数式、マップ、ニューラ
ルネットワーク、ファジールール、サブサンプションア
ーキテクチャ等の形式で、基本噴射量および過渡補正率
と外界情報との関係を定義付ける基礎制御部110を備
え、基礎制御部110は、各種センサ20から外界情報
を入力し、入力した外界情報に基づいて基本噴射量およ
び過渡補正率を決定して出力する。
The reflection layer 100 includes a basic control unit 110 for defining the relationship between the basic injection amount and the transient correction rate and the external information in the form of a mathematical expression, a map, a neural network, a fuzzy rule, a subsumption architecture, and the like. The control unit 110 inputs the external world information from the various sensors 20 and determines and outputs the basic injection amount and the transient correction rate based on the input external world information.

【0040】進化適応層300は、使用者との入出力を
行うインターフェース部310と、GAによる進化シミ
ュレーションを行ってエンジン10の制御特性を最適化
する進化適応部320と、GAにおける個体の評価値を
算出する評価部330と、GAにおける個体の評価値を
予測する予測部340とで構成されている。進化適応部
320は、外界情報に基づいて、反射層100からの基
本噴射量および過渡補正率を使用者の希望に沿った値に
補正するための補正率(以下、この補正率うち基本噴射
量を補正するものを進化補正率といい、過渡補正率を補
正するものを進化過渡補正率という。)を出力する制御
モジュールを少なくとも一つ有し、GAにより制御モジ
ュールを最適化するように構成されている。
The evolution adaptation layer 300 includes an interface unit 310 for performing input / output with the user, an evolution adaptation unit 320 for optimizing the control characteristics of the engine 10 by performing an evolution simulation using a GA, and an individual evaluation value for the GA. And an estimating unit 340 that estimates an individual's evaluation value in GA. The evolution adaptation unit 320 corrects the basic injection amount and the transient correction rate from the reflective layer 100 to values according to the user's desire based on the external world information (hereinafter, the basic injection amount of the correction rate). , And at least one control module that outputs a transient correction rate is referred to as an evolutionary correction rate, and the GA is configured to optimize the control module by GA. ing.

【0041】また、進化適応部320は、最適制御モジ
ュールを構築した後、進化適応部320の制御モジュー
ルをその最適制御モジュールに固定し、反射層100か
らの基本噴射量を補正する進化補正率による制御および
反射層100からの過渡補正率を補正する進化過渡補正
率による制御を行う一方、学習層200にその最適制御
モジュールに関する情報を学習させる。また、最適制御
モジュールに関する情報を学習層200に学習させた後
は、その出力を「1」に戻し、その後は、使用者の指示
に応じて作動する。すなわち、進化適応部320の制御
モジュールによる制御が行われるのは、進化シミュレー
ション中および学習中のみである。
After constructing the optimal control module, the evolution adaptation unit 320 fixes the control module of the evolution adaptation unit 320 to the optimal control module, and adjusts the basic injection amount from the reflection layer 100 based on the evolution correction rate. While the control and the control based on the evolutionary transient correction rate for correcting the transient correction rate from the reflection layer 100 are performed, the learning layer 200 is made to learn information on the optimal control module. After the learning layer 200 learns the information on the optimal control module, the output is returned to “1”, and thereafter, the operation is performed according to the user's instruction. That is, the control by the control module of the evolution adaptation unit 320 is performed only during the evolution simulation and during the learning.

【0042】学習層200は、学習用と実行用とに切換
可能な2つのニューラルネットワークを有する学習部2
10を備え、学習部210は、一方のニューラルネット
ワーク(実行用)で制御を実行している間、他方のニュ
ーラルネットワーク(学習用)で進化適応層300から
最適制御モジュールに関する入力と出力との関係を学習
する。学習用ニューラルネットワークでの学習が終了す
ると、制御を実行しているニューラルネットワークと学
習後のニューラルネットワークとを切り換え、学習後の
ニューラルネットワークで学習結果から得られる制御モ
ジュールによる制御を開始し、制御を実行していたニュ
ーラルネットワークが学習用として機能し始める。な
お、学習層200におけるニューラルネットワークは、
初期状態では「1」を出力するように設定されており、
したがって、初期状態では、反射層100と進化適応層
300とによる制御が行われる。
The learning layer 200 includes a learning unit 2 having two neural networks that can be switched between learning and execution.
10, the learning unit 210 controls the relationship between the input and the output of the optimal control module from the evolution adaptive layer 300 in the other neural network (for learning) while performing the control in one neural network (for learning). To learn. When the learning by the learning neural network is completed, the neural network performing the control and the neural network after the learning are switched, and the control by the control module obtained from the learning result in the neural network after the learning is started. The running neural network begins to function for learning. The neural network in the learning layer 200 is
In the initial state, it is set to output "1",
Therefore, in the initial state, control by the reflective layer 100 and the evolution adaptive layer 300 is performed.

【0043】実行用ニューラルネットワークは、特に図
示しないが、さらに、2つのニューラルネットワークを
含んで構成されている。一方のニューラルネットワーク
は、スロットル開度およびエンジン回転数を外界情報と
して各種センサ20から入力し、その入力情報に基づい
て反射層100からの基本噴射量を補正するための補正
率(以下、この補正率を学習補正率という。)を出力す
るようになっており、他方のニューラルネットワーク
は、スロットル開度の変化率およびエンジン回転数を外
界情報として各種センサ20から入力し、その入力情報
に基づいて反射層100からの過渡補正率を補正するた
めの補正率(以下、この補正率を学習過渡補正率とい
う。)を出力するようになっている。この構成は、学習
用ニューラルネットワークについても同様である。
Although not shown, the execution neural network further includes two neural networks. On the other hand, the neural network inputs a throttle opening and an engine speed as various kinds of external information from various sensors 20 and corrects a basic injection amount from the reflective layer 100 based on the input information. The other neural network inputs the rate of change of the throttle opening and the engine speed from the various sensors 20 as external information, and based on the input information. A correction rate for correcting the transient correction rate from the reflective layer 100 (hereinafter, this correction rate is referred to as a learning transient correction rate) is output. This configuration is the same for the learning neural network.

【0044】そして、制御装置30は、学習層200か
らの学習補正率と進化適応層300からの進化補正率と
を加算し、反射層100からの基本噴射量にその加算結
果を乗算し、これを第1の乗算結果とする一方、学習層
200からの学習過渡補正率と進化適応層300からの
進化過渡補正率とを加算し、反射層100からの過渡補
正率にその加算結果を乗算し、これを第2の乗算結果と
し、第1の乗算結果に第2の乗算結果を乗算することに
より燃料噴射量を算出する。この燃料噴射量をエンジン
10に出力する。
Then, the control device 30 adds the learning correction rate from the learning layer 200 and the evolution correction rate from the evolution adaptive layer 300, and multiplies the basic injection amount from the reflection layer 100 by the addition result. Is the first multiplication result, the learning transient correction rate from the learning layer 200 and the evolutionary transient correction rate from the evolution adaptive layer 300 are added, and the transient correction rate from the reflection layer 100 is multiplied by the addition result. This is used as the second multiplication result, and the fuel injection amount is calculated by multiplying the first multiplication result by the second multiplication result. This fuel injection amount is output to the engine 10.

【0045】次に、進化適応層300の構成を図4を参
照しながら詳細に説明する。図4は、進化適応層300
の構成を示すブロック図である。進化適応層300は、
図4に示すように、インターフェース部310と、進化
適応部320と、評価部330と、予測部340とで構
成されている。インターフェース部310は、GAによ
る進化シミュレーション中の個体の評価値を表示する表
示部312と、使用者による評価を入力する入力部31
4とで構成されており、GAによる進化シミュレーショ
ン中では、各世代ごとに各個体の評価値(後段で詳述す
るが、燃費およびレスポンス度)が表示部312に表示
され、使用者は、乗り心地等の車両の体感をもとに各個
体の評価値を入力部314に入力する。
Next, the configuration of the evolution adaptive layer 300 will be described in detail with reference to FIG. FIG. 4 shows the evolution adaptation layer 300.
FIG. 3 is a block diagram showing the configuration of FIG. The evolution adaptation layer 300
As shown in FIG. 4, the configuration includes an interface unit 310, an evolution adaptation unit 320, an evaluation unit 330, and a prediction unit 340. The interface unit 310 includes a display unit 312 for displaying an evaluation value of the individual during the evolution simulation by the GA, and an input unit 31 for inputting the evaluation by the user.
During the evolutionary simulation by GA, the evaluation value of each individual (fuel consumption and response level, which will be described in detail later) is displayed on the display unit 312 for each generation, and the user can ride the vehicle. The evaluation value of each individual is input to the input unit 314 based on the experience of the vehicle such as comfort.

【0046】評価部330は、燃料噴射量および距離パ
ルスに基づいてエンジン10の燃費を算出する燃費算出
部332と、外界情報であるスロットル開度およびエン
ジン回転数に基づいてレスポンス度を算出するレスポン
ス度算出部334とで構成されている。燃費算出部33
2は、燃料噴射量および距離パルスを外界情報として入
力し、所定距離走行するごとに入力される距離パルスの
入力間隔で噴出量を総和して燃費として算出し、算出し
た燃費を、GAにおける個体の第1評価値として進化適
応部320に出力するようになっている。レスポンス度
算出部334は、スロットル開度およびエンジン回転数
を外界情報として入力し、スロットル開度の変化率およ
びエンジン回転数の変化率を算出し、エンジン回転数の
変化率をスロットル開度の変化率で除算することにより
レスポンス度を算出し、算出したレスポンス度を、GA
における個体の第2評価値として進化適応部320およ
び予測部340に出力するようになっている。
The evaluation unit 330 calculates a fuel consumption of the engine 10 based on the fuel injection amount and the distance pulse, and a response calculation calculates a response based on the throttle opening and the engine speed, which are external information. And a degree calculation unit 334. Fuel efficiency calculation unit 33
2 is to input the fuel injection amount and the distance pulse as external information, calculate the fuel consumption by summing the injection amount at the input interval of the distance pulse input every time the vehicle travels a predetermined distance, and calculate the calculated fuel efficiency as the individual Is output to the evolution adaptation unit 320 as the first evaluation value of The response degree calculation unit 334 inputs the throttle opening and the engine speed as external information, calculates the throttle opening change rate and the engine speed change rate, and calculates the engine speed change rate as the throttle opening change. The responsivity is calculated by dividing by the ratio, and the calculated responsivity is referred to as GA
Is output to the evolution adaptation unit 320 and the prediction unit 340 as the second evaluation value of the individual at.

【0047】予測部340は、CMAC(Cerebellar M
odel Arithmetic Computer)342を有し、反射層10
0からの基本噴射量に学習層200および進化適応層3
00からの補正率を乗算した値(以下、補正後の基本噴
射量という。)、並びに反射層100からの過渡補正率
に学習層200および進化適応層300からの補正率を
乗算した値(以下、補正後の過渡補正率という。)に基
づいて、GAにおける個体の評価値のうち第2評価値を
予測するようになっている。第2評価値であるレスポン
ス度は、補正後の基本噴射量に補正後の過渡補正率を乗
算し、その乗算結果にCMAC342の出力を加算する
ことにより算出する。また、CMAC342は、レスポ
ンス度の実測値と予測値との誤差により学習を行うよう
になっている。
The prediction unit 340 is a CMAC (Cerebellar M
odel Arithmetic Computer) 342 and the reflective layer 10
The learning layer 200 and the evolution adaptive layer 3 are added to the basic injection amount from 0.
A value obtained by multiplying the correction rate from 00 (hereinafter, referred to as a corrected basic injection amount), and a value obtained by multiplying the transient correction rate from the reflective layer 100 by the correction rate from the learning layer 200 and the evolution adaptive layer 300 (hereinafter, referred to as the correction rate). , The corrected transient correction rate), the second evaluation value among the individual evaluation values in the GA is predicted. The responsivity, which is the second evaluation value, is calculated by multiplying the corrected basic injection amount by the corrected transient correction rate and adding the output of the CMAC 342 to the multiplication result. Further, the CMAC 342 learns based on an error between the measured value and the predicted value of the response level.

【0048】具体的に、レスポンス度の予測値は、下式
(1)により、レスポンス度の予測初期値とCMAC3
42の出力とを加算することにより算出できる。下式
(1)において、Exp_respは、レスポンス度の予測値で
あり、Ini_respは、レスポンス度の予測初期値であり、
CMAC_outは、CMAC342の出力である。
Specifically, the predicted value of the responsivity is obtained by calculating the initial value of the responsivity and CMAC3 by the following equation (1).
It can be calculated by adding the outputs of the C.I. In the following equation (1), Exp_resp is a predicted value of the responsivity, Ini_resp is a predicted initial value of the responsivity,
CMAC_out is the output of CMAC 342.

【0049】[0049]

【数1】 (Equation 1)

【0050】レスポンス度の予測初期値は、過渡時の燃
料噴射量に基づいた値とし、過渡時の燃料噴射量が補正
後の基本噴射量に補正後の過渡補正率を乗算したもので
あるから、下式(2)により、補正後の基本噴射量に補
正後の過渡補正率を乗算することにより算出することが
できる。下式(2)において、Statistic_fは、基本噴
射量の統計的モデル値であり、Statistic_aは、過渡補
正率の統計的モデル値である。
The initial value of the predicted response is based on the transient fuel injection amount, and the transient fuel injection amount is obtained by multiplying the corrected basic injection amount by the corrected transient correction rate. The following equation (2) can be used to calculate by multiplying the corrected basic injection amount by the corrected transient correction rate. In the following equation (2), Statistic_f is a statistical model value of the basic injection amount, and Statistic_a is a statistical model value of the transient correction rate.

【0051】[0051]

【数2】 (Equation 2)

【0052】基本噴射量の統計的モデル値および過渡補
正率の統計的モデル値は、それぞれ、レスポンス度維持
のための基準個体において使用された図5の斜線領域に
含まれるN点に対し、統計的モデルを用いて算出した値
である。図5は、基準個体において使用された領域を示
す図である。斜線領域を集合U(i)とし、そこに含まれ
る点をi'(∈U(i))とする。U(i)の各点における
補正後の基本噴射量をf(i')、補正後の過渡補正率を
a(i')とし、レスポンス度維持のための基準個体にお
ける同じ点の値をそれぞれfb(i')、ab(i')とする
と、基本噴射量の統計的モデル値および過渡補正率の統
計的モデル値は、それぞれ下式(3),(4)を満たす
F(i'),A(i')であり、最終的に下式(5),(6)
により算出できる。
The statistical model value of the basic injection amount and the statistical model value of the transient correction rate are statistically calculated with respect to the N points included in the hatched area in FIG. 5 used in the reference individual for maintaining the response. It is a value calculated using a statistical model. FIG. 5 is a diagram showing an area used in the reference individual. The shaded area is set as a set U (i), and the points included therein are set as i ′ (∈U (i)). The corrected basic injection amount at each point of U (i) is f (i '), the corrected transient correction rate is a (i'), and the value of the same point in the reference individual for maintaining the response is Assuming that f b (i ′) and a b (i ′), the statistical model value of the basic injection amount and the statistical model value of the transient correction rate are F (i) satisfying the following equations (3) and (4), respectively. '), A (i'), and finally the following equations (5) and (6)
Can be calculated by

【0053】[0053]

【数3】 (Equation 3)

【0054】[0054]

【数4】 (Equation 4)

【0055】[0055]

【数5】 (Equation 5)

【0056】[0056]

【数6】 (Equation 6)

【0057】進化適応部320は、制御モジュール32
2を有し、制御モジュール322は、さらに、2つのニ
ューラルネットワークを含んで構成されている。一方の
ニューラルネットワーク322aは、スロットル開度お
よびエンジン回転数を外界情報として各種センサ20か
ら入力し、その入力情報に基づいて進化補正率を出力す
るようになっており、他方のニューラルネットワーク3
22bは、スロットル開度の変化率およびエンジン回転
数を外界情報として各種センサ20から入力し、その入
力情報に基づいて進化過渡補正率を出力するようになっ
ている。
The evolution adaptation unit 320 is provided for the control module 32
2, and the control module 322 further includes two neural networks. One neural network 322a inputs a throttle opening and an engine speed as external information from various sensors 20 and outputs an evolutionary correction rate based on the input information.
Reference numeral 22b inputs the change rate of the throttle opening and the engine speed as external information from various sensors 20, and outputs an evolutionary transient correction rate based on the input information.

【0058】GAにおける個体の個体情報には、ニュー
ラルネットワーク322a,322bにおけるシナプス
の結合係数を割り当てる。具体的には、図6に示すよう
に割り当てられている。図6は、ニューラルネットワー
ク322a,322bの構成および個体情報のデータ構
造を示す図である。ニューラルネットワーク322a
は、スロットル開度を入力する入力層fi1と、エンジン
回転数を入力する入力層fi2と、入力層fi1,fi2から
の出力を入力する中間層fh1,fh2と、中間層fh1,f
h2の出力を入力して進化補正率を出力する出力層fo1
の5つのパーセプトロンから構成されている。そして、
入力層fi1と中間層fh1とは結合係数kf1のシナプスに
より、入力層fi2と中間層fh1は結合係数kf2のシナプ
スにより、中間層fh1と出力層fo1とは結合係数kf3
シナプスにより、入力層fi1と中間層fh2とは結合係数
f4のシナプスにより、入力層fi2と中間層fh2とは結
合係数kf5のシナプスにより、中間層fh2と出力層fo2
とは結合係数kf6のシナプスによりそれぞれ結合されて
いる。
The synapse coupling coefficients in the neural networks 322a and 322b are assigned to the individual information of the individual in the GA. Specifically, they are assigned as shown in FIG. FIG. 6 is a diagram showing a configuration of the neural networks 322a and 322b and a data structure of individual information. Neural network 322a
Is an input layer f i1 for inputting the throttle opening, an input layer f i2 for inputting the engine speed, intermediate layers f h1 and f h2 for inputting the outputs from the input layers f i1 and f i2 , and an intermediate layer f h1 and f h2. f h1 , f
It comprises five perceptrons with an output layer f o1 that inputs the output of h2 and outputs the evolution correction rate. And
The input layer f i1 and the intermediate layer f h1 are connected by the synapse of the coupling coefficient k f1 , and the input layer f i2 and the intermediate layer f h1 are connected by the synapse of the coupling coefficient k f2 , and the intermediate layer f h1 and the output layer f o1 are connected by the coupling coefficient. By the synapse of k f3 , the input layer f i1 and the intermediate layer f h2 are connected by the synapse of the coupling coefficient k f4 , and the input layer f i2 and the intermediate layer f h2 are output by the synapse of the coupling coefficient k f5 and the output of the intermediate layer f h2. Layer f o2
Are connected by synapses having a coupling coefficient k f6 .

【0059】ニューラルネットワーク322bは、スロ
ットル開度の変化率を入力する入力層ai1と、エンジン
回転数を入力する入力層ai2と、入力層ai1,ai2から
の出力を入力する中間層ah1,ah2と、中間層ah1,a
h2の出力を入力して進化過渡補正率を出力する出力層a
o1との5つのパーセプトロンから構成されている。そし
て、入力層ai1と中間層ah1とは結合係数ka1のシナプ
スにより、入力層ai2と中間層ah1は結合係数ka2のシ
ナプスにより、中間層ah1と出力層ao1とは結合係数k
a3のシナプスにより、入力層ai1と中間層ah2とは結合
係数ka4のシナプスにより、入力層ai2と中間層ah2
は結合係数ka5のシナプスにより、中間層ah2と出力層
o2とは結合係数ka6のシナプスによりそれぞれ結合さ
れている。
The neural network 322b includes an input layer a i1 for inputting the rate of change of the throttle opening, an input layer a i2 for inputting the engine speed, and an intermediate layer for inputting the outputs from the input layers a i1 and a i2. a h1 , a h2 and the middle layer a h1 , a
Output layer a that receives the output of h2 and outputs the evolutionary transient correction rate
o1 and five perceptrons. By synaptic input layer a i1 and coupling the intermediate layer a h1 coefficient k a1, the synaptic input layer a i2 and the intermediate layer a h1 is the coupling coefficient k a2, the intermediate layer a h1 and the output layer a o1 is Coupling coefficient k
Due to the synapse of a3 , the input layer a i1 and the intermediate layer a h2 are formed by the synapse of the coupling coefficient k a4 , and the input layer a i2 and the intermediate layer a h2 are formed by the synapse of the coupling coefficient ka 5 , and the intermediate layer a h2 and the output layer are formed. a o2 is connected to each other by a synapse having a connection coefficient k a6 .

【0060】そして、GAにおける個体の個体情報は、
シナプスの結合係数kf1〜kf6を上位側に、シナプスの
結合係数ka1〜ka6を下位側にそれぞれ連続して割り当
てることにより構成されている。例えば、一つの結合係
数が8ビットのデータで構成されていれば、個体情報
は、全体で96ビットのデータとなる。また、進化シミ
ュレーションを開始する際に生成する初期の個体情報
は、各個体ごとに乱数により決定する。その際、レスポ
ンス度をある程度保証するために、乱数の発生範囲を所
定範囲に制限するのが好ましい。すなわち、レスポンス
度が明らかに悪くなるような範囲には、乱数を発生させ
ないようにする。
The individual information of the individual in the GA is
The synapse coupling coefficients k f1 to k f6 are sequentially assigned to the upper side, and the synapse coupling coefficients k a1 to k a6 are successively assigned to the lower side. For example, if one coupling coefficient is composed of 8-bit data, the individual information becomes 96-bit data as a whole. The initial individual information generated at the start of the evolution simulation is determined by a random number for each individual. At this time, it is preferable to limit the random number generation range to a predetermined range in order to guarantee a certain degree of response. That is, random numbers are not generated in a range where the response level is clearly deteriorated.

【0061】次に、進化適応部320で実行される処理
を図7を参照しながら詳細に説明する。図7は、進化適
応部320で実行される処理を示すフローチャートであ
る。GAは、各個体にランダムな初期値を与えて探索空
間内に配置し、世代ごとに交叉、突然変異と呼ばれる遺
伝的操作を適用し、個体の評価値に応じて個体の増殖お
よび選択を行うことにより、次世代の個体の集合を得
る。このような世代交代を繰り返すことにより、漸近的
に最適解に近づくことを目的とする。以下、遺伝的操作
である交叉、突然変異、選択について説明する。
Next, the processing executed by the evolution adaptation unit 320 will be described in detail with reference to FIG. FIG. 7 is a flowchart illustrating a process executed by the evolution adaptation unit 320. The GA assigns random initial values to each individual and arranges them in a search space, applies genetic operations called crossover and mutation for each generation, and performs growth and selection of individuals according to the evaluation value of the individual Thereby, a set of individuals of the next generation is obtained. An object is to asymptotically approach an optimal solution by repeating such generation alternation. Hereinafter, crossover, mutation, and selection, which are genetic operations, will be described.

【0062】交叉とは、少なくとも2つの個体を親と
し、親となる個体の個体情報の一部を入れ替えることに
より、子孫となる個体を1以上生成する操作である。あ
る個体の個体情報のよい部分と別の個体の個体情報のよ
い部分を合体させることにより、より評価値の高い個体
を得ることが期待できる。例えば、2つの個体を親とし
て子孫となる2つの個体を生成する場合、一方の親とな
る個体の個体情報を「000110」、他方の親となる個体の
個体情報を「110111」とし、3番目の位置で交叉させる
ことにより、「000111」の個体情報をもつ個体と、「11
0110」の個体情報をもつ個体とを子孫となる個体として
得る。
[0062] Crossover is an operation of generating at least one descendant individual by replacing at least two individuals as parents and replacing part of the individual information of the parent individual. By combining the good part of the individual information of a certain individual with the good part of the individual information of another individual, it is expected that an individual with a higher evaluation value will be obtained. For example, in a case where two individuals as descendants are generated using two individuals as parents, the individual information of one parent individual is “000110”, and the individual information of the other parent individual is “110111”. By crossing at the position of “11,
The individual having the individual information of “0110” is obtained as an individual to be a descendant.

【0063】突然変異とは、所定の確率で個体の個体情
報のうち特定部分を変更する操作であり、個体群内での
多様性を増加させる。具体的には、個体情報の特定のビ
ットを反転させる操作であり、例えば、ある個体の個体
情報を「000111」とし、その3番目の位置で突然変異を
起こすことにより、「001111」の個体情報をもつ個体を
得る。
Mutation is an operation of changing a specific part of individual information of an individual with a predetermined probability, and increases diversity within an individual group. Specifically, this is an operation of inverting a specific bit of the individual information. For example, by setting the individual information of a certain individual to “000111” and causing a mutation at the third position, the individual information of “001111” is obtained. Obtain an individual with

【0064】選択とは、個体の評価値に応じて個体群の
なかのよりよい個体を次世代に残すための操作である。
ルーレット選択と呼ばれる選択方法では、各個体は評価
値に比例した確率で選択される。例えば、ある世代にお
いて、「000000」、「111011」、「110111」、「01011
1」の個体情報をもつ個体の評価値がそれぞれ「8」、
「4」、「2」、「2」であったとする。それぞれの個
体が選択される確率は、「8/16」、「4/16」、
「2/16」、「2/16」となる。したがって、平均
的には、次世代において、「000000」の個体情報をもつ
個体は2つに増え、「111011」の個体情報をもつ個体は
一つのままで、「110111」の個体情報をもつ個体または
「010111」の個体情報をもつ個体はいずれかが残るよう
な個体群が得られる。もっとも、本実施の形態において
は、個体の選択を使用者の選択により行う。
The selection is an operation for leaving a better individual from the population to the next generation according to the evaluation value of the individual.
In a selection method called roulette selection, each individual is selected with a probability proportional to the evaluation value. For example, in a certain generation, “000000”, “111011”, “110111”, “01011”
The evaluation value of the individual having the individual information of “1” is “8”,
It is assumed that they are "4", "2", and "2". The probability that each individual will be selected is “8/16”, “4/16”,
"2/16" and "2/16". Therefore, on average, in the next generation, the number of individuals having the individual information of “000000” increases to two, the number of individuals having the individual information of “111011” remains one, and the individual having the individual information of “110111” remains. Alternatively, an individual group having any of the individuals having the individual information “010111” is obtained. However, in this embodiment, the individual is selected by the user.

【0065】以上のことをふまえて、進化適応部320
で実行される処理を説明する。なお、図7のフローチャ
ートに示す処理は、例えば、ROMにあらかじめ格納さ
れているプログラムを読み出し、読み出したプログラム
に従ってCPUが実行する。まず、ステップS100に
移行して、進化シミュレーションを開始する指示である
進化開始指示を入力部314から入力したか否かを判定
し、進化開始指示を入力したと判定したとき(Yes)は、
ステップS102に移行するが、そうでないと判定した
とき(No)は、進化開始指示を入力するまでステップS1
00で待機する。
Based on the above, the evolution adaptation unit 320
The processing executed by will be described. The process shown in the flowchart of FIG. 7 is executed, for example, by reading a program stored in the ROM in advance and executing the program according to the read program. First, the process proceeds to step S100 to determine whether or not an evolution start instruction, which is an instruction to start an evolution simulation, has been input from the input unit 314. If it is determined that the evolution start instruction has been input (Yes),
The process proceeds to step S102, but if it is determined that this is not the case (No), step S1 is performed until an evolution start instruction is input.
Wait at 00.

【0066】ステップS102では、所定数(例えば、
9個)の個体の集合からなる個体群を仮想的に生成する
とともに各個体ごとに個体情報を構成する。ここで、各
個体情報には、ニューラルネットワーク322a,32
2bにおけるシナプスの結合係数を割り当て、各個体の
個体情報を乱数により決定する。このとき、個体情報の
すべての値が「0」となる個体を一つ生成することで、
進化の過程で進化前のレスポンス性能を下回らないよう
にすることができる。なお、各個体の個体情報は、RA
M等の記憶装置上に格納され管理される。
In step S102, a predetermined number (for example,
An individual group consisting of a set of (9) individuals is virtually generated, and individual information is configured for each individual. Here, the individual information includes the neural networks 322a and 322a.
The synapse coupling coefficient in 2b is assigned, and individual information of each individual is determined by a random number. At this time, by generating one individual in which all values of the individual information are “0”,
In the process of evolution, the response performance before evolution can be maintained. The individual information of each individual is RA
It is stored and managed on a storage device such as M.

【0067】次いで、ステップS104に移行して、個
体群のうち先頭の個体の個体情報を読み出し、ステップ
S106に移行して、読み出した個体情報に基づいてニ
ューラルネットワーク322a,322bの結合状態を
決定して制御モジュール322を構築し、構築した制御
モジュール322によりエンジン10の制御を開始す
る。このとき、進化適応層300からの出力は、スロッ
トル開度、スロットル開度の変化率およびエンジン回転
数をニューラルネットワーク322a,322bに入力
し、さらにその出力を下式(7)により線形変換するこ
とにより算出する。また、スロットル開度、スロットル
開度の変化率およびエンジン回転数の入力情報は、それ
ぞれを正規化したものを用いる。下式(7)において、
Yは進化補正率または進化過渡補正率であり、xはニュ
ーラルネットワーク322a,322bの出力であり、
Gは所定のゲインである。
Then, the process proceeds to step S104 to read the individual information of the first individual in the individual group, and proceeds to step S106 to determine the connection state of the neural networks 322a and 322b based on the read individual information. Then, the control module 322 is constructed, and control of the engine 10 is started by the constructed control module 322. At this time, the output from the evolution adaptation layer 300 is obtained by inputting the throttle opening, the change rate of the throttle opening and the engine speed to the neural networks 322a and 322b, and further linearly converting the output by the following equation (7). It is calculated by: The input information of the throttle opening, the change rate of the throttle opening, and the engine speed is normalized. In the following equation (7),
Y is the evolutionary correction rate or evolutionary transient correction rate, x is the output of neural networks 322a, 322b,
G is a predetermined gain.

【0068】[0068]

【数7】 (Equation 7)

【0069】このように、ニューラルネットワーク32
2a,322bの出力xを線形変換して用いることによ
り、進化適応層300から出力される進化補正率または
進化過渡補正率の値が極端に大きくなることがなく、全
体として進化シミュレーションが少しずつ進行するよう
になり、エンジン10の挙動が評価や進化シミュレーシ
ョンのために極端に変動することがなくなる。
As described above, the neural network 32
By linearly transforming and using the output x of 2a and 322b, the value of the evolutionary correction rate or the evolutionary transient correction rate output from the evolutionary adaptation layer 300 does not become extremely large, and the evolutionary simulation proceeds little by little as a whole. Therefore, the behavior of the engine 10 does not extremely fluctuate due to evaluation or evolution simulation.

【0070】次いで、ステップS108に移行して、レ
スポンス度の予測値を予測部340から取得し、ステッ
プS110に移行して、取得した予測値が所定条件を満
たしているか否かを判定する。所定条件を満たしている
か否かは、下式(8)により、レスポンス度の予測値の
基準値に対する誤差を算出し、誤差が許容範囲を下回っ
ているか否かを判定することにより行う。下式(8)に
おいて、Errorは、予測値の基準値に対する誤差であ
り、Exp_respは、レスポンス度の予測値であり、Base_r
espは、基準値である。
Next, the process proceeds to step S108 to acquire the predicted value of the response degree from the prediction unit 340, and proceeds to step S110 to determine whether the obtained predicted value satisfies a predetermined condition. Whether or not the predetermined condition is satisfied is calculated by calculating the error of the predicted value of the response degree with respect to the reference value by the following equation (8), and determining whether or not the error is below the allowable range. In the following equation (8), Error is the error of the predicted value with respect to the reference value, Exp_resp is the predicted value of the responsivity, and Base_r
esp is a reference value.

【0071】[0071]

【数8】 (Equation 8)

【0072】判定の結果、レスポンス度の予測値が所定
条件を満たしていない、すなわち、算出した誤差が許容
範囲を下回っていないと判定したとき(No)は、ステップ
S112に移行して、現在制御モジュール322の構築
に用いている個体情報に対して遺伝的操作を行う。ここ
での遺伝的操作としては、図8に示すように、例えば、
現在制御モジュール322の構築に用いている個体情報
のうちニューラルネットワーク322bにおけるシナプ
スの結合係数を割り当てた部分(評価値のうち第2評価
値にのみ影響を及ぼす情報)を対象とし、乱数による組
み換えや乱数による再生成を行う。図8は、遺伝的操作
の対象部分および遺伝的操作を示す図である。もちろ
ん、個体情報に対して遺伝的操作を行った後は、制御モ
ジュール322を新たな個体情報に基づいて再構築す
る。そして、ステップS108に移行して、レスポンス
度の予測値が上記所定条件を満たすまで、ステップS1
08,S110,S112を繰り返し経て、個体情報に
対して遺伝的操作を行う。
As a result of the determination, if it is determined that the predicted value of the response degree does not satisfy the predetermined condition, that is, if the calculated error is not less than the allowable range (No), the process shifts to step S112 to execute the current control. A genetic operation is performed on the individual information used to construct the module 322. As the genetic operation here, for example, as shown in FIG.
Of the individual information currently used for the construction of the control module 322, a portion to which a synapse coupling coefficient in the neural network 322b is assigned (information that affects only the second evaluation value among the evaluation values) is targeted. Regenerate using random numbers. FIG. 8 is a diagram showing a target portion of the genetic operation and the genetic operation. Of course, after performing the genetic operation on the individual information, the control module 322 is reconfigured based on the new individual information. Then, the process proceeds to step S108, and until the predicted value of the response degree satisfies the predetermined condition, the process proceeds to step S1.
After repeating steps 08, S110, and S112, a genetic operation is performed on the individual information.

【0073】一方、ステップS110で、レスポンス度
の予測値が所定条件を満たしていると判定したとき(Ye
s)は、ステップS114に移行して、燃費およびレスポ
ンス度を評価部330から取得する。ここで、個体情報
に基づいて制御モジュール322を構築し、構築した制
御モジュール322によりエンジン10の制御を開始
し、その結果得られた燃費およびレスポンス度は、その
個体に対する評価値とする。この評価値が高いほど、す
なわち、第1評価値である燃費については、小さければ
小さいほど、第2評価値であるレスポンス度について
は、高ければ高いほど、GAによる進化シミュレーショ
ンにおいて優秀な個体であると位置付けることができ
る。
On the other hand, when it is determined in step S110 that the predicted value of the response degree satisfies the predetermined condition (Ye
In step s), the process shifts to step S114 to acquire the fuel efficiency and the response degree from the evaluation unit 330. Here, the control module 322 is constructed based on the individual information, and control of the engine 10 is started by the constructed control module 322. The fuel efficiency and the response obtained as a result are evaluation values for the individual. The higher the evaluation value, that is, the smaller the mileage as the first evaluation value and the higher the responsivity as the second evaluation value, the better the individual in the evolutionary simulation by GA. Can be positioned.

【0074】次いで、ステップS116に移行して、レ
スポンス度の実測値と予測値との誤差によりCMAC3
42に対して学習を行い、ステップS118に移行し
て、個体群のすべての個体についてステップS106か
らS116までの処理が終了したか否かを判定し、すべ
ての個体について処理が終了したと判定したとき(Yes)
は、ステップS120に移行する。
Next, the flow shifts to step S116, where CMAC3 is calculated based on the error between the measured value and the predicted value of the response.
Learning is performed on 42, and the process proceeds to step S118, where it is determined whether the processing from steps S106 to S116 is completed for all individuals in the individual group, and it is determined that the processing is completed for all individuals. Time (Yes)
Shifts to step S120.

【0075】ステップS120では、各個体ごとにその
評価値である燃費およびレスポンス度を図9に示す表現
方法を用いて表示部312に表示する。図9(a)〜
(c)は、個体の評価の表現方法の一例を示す図であ
る。各図において四角形の横幅はレスポンス度の大きさ
を、色(濃淡)は燃費を示し、また、四角形の縦幅は、
速度を3段に分割して示している。レスポンス度は、横
幅の大きさに比例して大きくなり、燃費は、色の濃さに
比例して良くなり、また、速度は、上段が高速、中段が
中速、そして、下段が低速を表している。各個体の評価
は、個体群のすべての個体に対して行われ、図10に示
すように同時に一画面に表示される。図10は、個体の
評価の表現方法の一例を示す図である。
In step S120, the fuel efficiency and the response level, which are the evaluation values for each individual, are displayed on the display unit 312 using the expression method shown in FIG. FIG. 9 (a)-
(C) is a figure which shows an example of the expression method of evaluation of an individual. In each figure, the width of the rectangle indicates the magnitude of the response, the color (shade) indicates the fuel efficiency, and the height of the rectangle is
The speed is shown divided into three stages. The responsivity increases in proportion to the width, the fuel efficiency improves in proportion to the color depth, and the upper speed indicates high speed, the middle speed indicates middle speed, and the lower speed indicates low speed. ing. The evaluation of each individual is performed for all individuals in the individual group, and is simultaneously displayed on one screen as shown in FIG. FIG. 10 is a diagram illustrating an example of a method of expressing individual evaluation.

【0076】次いで、ステップS122に移行して、使
用者による評価を入力部314から入力する。個体群の
すべての個体に対する評価の表示が終了すると、制御は
一度評価モードに入る。評価モードでは、使用者が表示
部312に表示された評価を見て試走してみたい特性の
個体を選択すると、使用者により選択された個体の個体
情報に基づいて制御モジュール322を構築して一時的
に固定し、その制御モジュール322による制御を行
う。これにより、使用者は、表示部312に表示された
各個体の特性を、実際に走行した乗り心地等から判定
し、各個体の評価値を乗り心地から評価する。そして、
ステップS124に移行して、使用者は、表示部312
に視覚表現された個体の評価と、実際に走行した時の乗
り心地とに基づく各個体の評価を終了した段階で、制御
を淘汰モードに切り換え、個体群における個体の生存ま
たは淘汰を行う。個体の生存または淘汰は、例えば、入
力部314で淘汰モードに切り換え、図10に示すよう
な表示画面を参照しながら、個体群のなかから使用者の
好みの特性を持つ個体を幾つか選択し、選択した個体を
残し、それ以外の個体を消去することにより行う。
Next, the process proceeds to step S 122, where the user's evaluation is input from the input unit 314. When the display of evaluations for all individuals in the population is completed, the control enters the evaluation mode once. In the evaluation mode, when the user selects an individual having characteristics that he / she wants to test-run by looking at the evaluation displayed on the display unit 312, the control module 322 is constructed based on the individual information of the individual selected by the user, and temporarily. It is fixed and the control by the control module 322 is performed. Thus, the user determines the characteristics of each individual displayed on the display unit 312 based on the actual riding comfort, and evaluates the evaluation value of each individual from the riding comfort. And
The process proceeds to step S124, and the user
When the evaluation of each individual based on the evaluation of the individual visually expressed and the evaluation of the individual comfort based on the actual running is completed, the control is switched to the selection mode, and the survival or selection of the individual in the population is performed. For the survival or selection of the individual, for example, the selection mode is switched to the input unit 314, and several individuals having the user's favorite characteristics are selected from the population while referring to a display screen as shown in FIG. This is performed by leaving the selected individual and erasing the other individuals.

【0077】次いで、ステップS126に移行して、G
Aにおける個体の交叉を行う交叉処理を実行する。具体
的に、ステップS126では、使用者により選択された
個体群のなかから乱数を用いて2個の親個体を選択し、
これらに交叉を施して2個の子個体を生成する。この処
理を5回行うことにより、再び、9個の子個体からなる
個体群を生成する(10番目の子個体は破棄する)。交
叉処理には、例えば、上記の1点交叉処理のほかに、2
点交叉処理または正規分布交叉処理等を採用することが
できる。正規分布交叉処理とは、実数値表現の個体情報
について、両親個体を結ぶ軸に対して回転対称な正規分
布にしたがって子個体を生成する処理である。正規分布
の標準偏差は、両親個体を結ぶ主軸方向の成分について
は両親個体間の距離に比例させ、その他の軸の成分につ
いては両親個体を結ぶ直線と個体群のなかからサンプル
した第3の親個体との距離に比例させる。この交叉方法
は、親個体の特質が子個体に引き継がれやすいという利
点がある。
Next, the flow shifts to step S126, where G
A crossover process for crossing individuals in A is executed. Specifically, in step S126, two parent individuals are selected from the population selected by the user using random numbers,
These are crossed to generate two offspring individuals. By performing this process five times, an individual group including nine child individuals is generated again (the tenth child individual is discarded). In the crossover process, for example, in addition to the above-mentioned one-point crossover process, 2
Point crossover processing or normal distribution crossover processing can be employed. The normal distribution crossover process is a process of generating child individuals according to a normal distribution that is rotationally symmetric with respect to an axis connecting the parent individuals, with respect to the individual information in the real-valued expression. The standard deviation of the normal distribution is such that the component in the main axis direction connecting the parents is proportional to the distance between the parents, and the components of the other axes are the third parent sampled from the straight line connecting the parents and the population. Make it proportional to the distance to the individual. This crossover method has the advantage that the characteristics of the parent individual are easily inherited by the child individuals.

【0078】次いで、ステップS128に移行して、G
Aにおける個体の突然変異を行う突然変異処理を実行
し、ステップS130に移行して、入力部314からの
入力により使用者が満足する特性が得られたか否かを判
定し、使用者が満足する特性が得られないと判定したと
き(No)は、ステップS132に移行して、世代交代数が
所定回数以上であるか否かを判定し、所定回数以上であ
ると判定したとき(Yes)は、ステップS134に移行す
る。
Next, the flow shifts to step S128, where G
A mutation process for mutating the individual in A is executed, and the process proceeds to step S130, where it is determined whether or not characteristics that satisfy the user are obtained by the input from the input unit 314, and the user is satisfied. When it is determined that the characteristic cannot be obtained (No), the process proceeds to step S132, and it is determined whether or not the number of generation alternations is equal to or more than a predetermined number. Then, control goes to a step S134.

【0079】ステップS134では、個体群のなかから
評価値が最も高い個体を抽出し、抽出した個体の個体情
報に基づいて最適制御モジュールを構築し、制御モジュ
ール322を最適制御モジュールに固定し、ステップS
136に移行して、制御モジュール322の入出力関係
を学習層200に学習させ、ステップS138に移行し
て、制御モジュール322の出力を「1」に設定し、一
連の処理を終了して元の処理に復帰させる。
In step S134, an individual having the highest evaluation value is extracted from the individual group, an optimal control module is constructed based on the extracted individual information, and the control module 322 is fixed to the optimal control module. S
The process proceeds to 136, where the learning layer 200 learns the input / output relationship of the control module 322. The process proceeds to step S138, where the output of the control module 322 is set to “1”. Return to processing.

【0080】一方、ステップS132で、世代交代数が
所定回数未満であると判定したとき(Yes)は、ステップ
S104に移行する。一方、ステップS130で、使用
者が満足する特性が得られたと判定したとき(Yes)は、
ステップS134に移行する。一方、ステップS118
で、個体群のすべての個体についてステップS106か
らS116までの処理が終了していないと判定したとき
(No)は、ステップS140に移行して、個体群のうち次
の個体の個体情報を読み出し、ステップS106に移行
する。
On the other hand, if it is determined in step S132 that the number of generation alternations is less than the predetermined number (Yes), the process proceeds to step S104. On the other hand, when it is determined in step S130 that the characteristics satisfying the user have been obtained (Yes),
The process moves to step S134. On the other hand, step S118
When it is determined that the processing from steps S106 to S116 has not been completed for all individuals in the population
(No) The process shifts to step S140 to read the individual information of the next individual in the individual group, and shifts to step S106.

【0081】次に、上記実施の形態の動作を図面を参照
しながら説明する。エンジン10の制御特性を使用者向
けに最適化するには、使用者は、まず、進化開始指示を
入力部314に入力する。進化適応部320では、使用
者から進化開始指示を入力すると、ステップS100,
S102を経て、9個の個体の集合からなる個体群が生
成されるとともに各個体ごとに個体情報が構成される。
Next, the operation of the above embodiment will be described with reference to the drawings. In order to optimize the control characteristics of the engine 10 for the user, the user first inputs an evolution start instruction to the input unit 314. In the evolution adaptation unit 320, when an evolution start instruction is input from the user, step S100,
Through S102, an individual group including a set of nine individuals is generated, and individual information is configured for each individual.

【0082】個体群が生成されると、第1世代目の進化
シミュレーションが開始される。第1世代目の進化シミ
ュレーションでは、まず、ステップS106を経て、個
体群のうち先頭の個体の個体情報が読み出され、読み出
された個体情報に基づいて制御モジュール322が構築
され、構築された制御モジュール322によりエンジン
10の制御が開始され、しばらくの間その制御モジュー
ル322による制御が行われる。その間、ステップS1
08,S110,S112を経て、レスポンス度の予測
値が予測部340から取得され、取得された予測値が所
定条件を満たすまで、制御モジュール322の構築に用
いている個体情報に対して遺伝的操作が行われる。この
遺伝的操作では、現在制御モジュール322の構築に用
いている個体情報のうちニューラルネットワーク322
bにおけるシナプスの結合係数を割り当てた部分に対し
てのみ、乱数による組み換えや乱数による再生成が行わ
れる。
When the population is generated, the first generation evolution simulation is started. In the first generation evolution simulation, first, after step S106, the individual information of the first individual in the individual group is read, and the control module 322 is constructed and constructed based on the read individual information. The control of the engine 10 is started by the control module 322, and the control by the control module 322 is performed for a while. Meanwhile, step S1
Through steps 08, S110, and S112, a predicted value of the response degree is obtained from the prediction unit 340, and the individual information used for constructing the control module 322 is genetically manipulated until the obtained predicted value satisfies a predetermined condition. Is performed. In this genetic operation, the neural network 322 of the individual information currently used to construct the control module 322 is used.
Recombination by random numbers and regeneration by random numbers are performed only on the portion of b where the synapse coupling coefficient is assigned.

【0083】次いで、レスポンス度の予測値が所定条件
を満たすと、ステップS114,S116を経て、燃費
およびレスポンス度が評価部330から取得され、レス
ポンス度の実測値と予測値との誤差によりCMAC34
2に対して学習が行われる。これと同じ要領で、ステッ
プS106からS116までの処理が個体群のすべての
個体について終了すると、ステップS120を経て、各
個体ごとにその評価値である燃費およびレスポンス度が
表示部312に表示される。ここで、使用者は、表示部
312に表示された各個体の評価を参照しながら、個体
群のなかから自己の好みの特性を持つ個体を幾つか選択
する。使用者により個体の選択が行われると、ステップ
S124を経て、個体群のうち選択された個体が残さ
れ、それ以外の個体が消去されることにより個体の生存
または淘汰が行われる。
Next, when the predicted value of the responsivity satisfies the predetermined condition, the fuel consumption and the responsivity are obtained from the evaluation unit 330 through steps S114 and S116, and the CMAC 34 is calculated based on the error between the measured value and the predicted value of the responsivity.
The learning is performed on 2. In the same manner as described above, when the processing from step S106 to S116 is completed for all the individuals in the individual group, the fuel economy and the response level, which are the evaluation values, are displayed on the display unit 312 for each individual via step S120. . Here, the user selects several individuals having his / her favorite characteristics from the individual group while referring to the evaluation of each individual displayed on the display unit 312. When the user selects an individual, through step S124, the individual selected from the individual group is left, and the other individuals are deleted, whereby the individual survives or is eliminated.

【0084】次いで、ステップS126,S128を経
て、交叉処理および突然変異処理が行われる。ここまで
の処理を経て、第1世代目の進化シミュレーションが終
了する。その後は、これと同じ要領で、使用者が満足す
る特性が得られるかまたは世代交代数が所定回数以上と
なるまで、進化シミュレーションが繰り返し行われる。
Next, crossover processing and mutation processing are performed through steps S126 and S128. After the processing up to this point, the first generation evolution simulation ends. After that, the evolution simulation is repeatedly performed in the same manner until a characteristic satisfying the user is obtained or the number of generation alternations is equal to or more than a predetermined number.

【0085】次いで、進化シミュレーションが完了する
と、ステップS134を経て、個体群のなかから評価値
が最も高い個体が抽出され、抽出された個体の個体情報
に基づいて最適制御モジュールが構築され、制御モジュ
ール322が最適制御モジュールに固定される。次い
で、ステップS136を経て、制御モジュール322の
入出力関係が学習層200に学習させられる。この学習
では、まず、最適制御モジュールにより得られる実際の
エンジン回転数等の入力情報に対する進化補正率および
進化過渡補正率による制御を行う。進化適応層300が
進化補正率および進化過渡補正率による制御を実行し始
めると、学習層200の学習用ニューラルネットワーク
は、制御モジュール322の入出関係を、学習層200
の実行用として機能しているニューラルネットワークの
入出関係と合わせて学習する。この間、進化適応層30
0の出力は、それ以前の評価関数を最大とした個体によ
り行われ、制御則が時間的に変化することはない。前記
した学習では、進化適応層300と学習層200の実行
用ニューラルネットワークとの入出力を、あるステップ
幅で平均化し、これを入出力データとして教師データ集
合の更新に用いる。例えば、1秒間の平均エンジン回転
数が5000[rpm]、平均スロットル開度が20、
平均吸気温度が28[℃]、平均大気圧が1013[h
Pa]であった場合、これらと、その時の進化適応層3
00および学習層200における実行用ニューラルネッ
トワークの出力を加算したものを入出力データとして用
いる(図11参照)。この入出力データを、以前の教師
データに加えて新しい教師データ集合を得る。このと
き、教師データ集合における新しいデータとのユークリ
ッド距離が一定値以内の古い教師データは消去する。こ
の様子を図12に示す。また、教師データ集合の初期値
は、すべての入力データに対して出力を「1」にしてお
く。学習層200では、更新された教師データ集合に基
づいて、学習用ニューラルネットワークにおけるシナプ
スの結合係数の学習を行う。結合係数の学習は、学習中
の学習用ニューラルネットワークの出力と反射層100
からの基本噴射量および過渡補正率とから得られる仮想
制御出力と、実際の制御出力との間の誤差がしきい値以
下になるまで行われ、この学習が終わると、学習用のニ
ューラルネットワークは実行用になり、もとの制御用の
ニューラルネットワークが学習用となる。この後、学習
層200は、新しく得られた実行用のニューラルネット
ワークにより学習補正率および学習過渡補正率を決定し
て実際に出力し、同時に、ステップS138を経て、制
御モジュール322の出力は「1」になり、学習層20
0と反射層100とによる制御が行われる。また、学習
層200の実行用のニューラルネットワークの初期値
は、出力が常に「1」になるように設定しておく。こう
することで、初期状態においては、反射層100と進化
適応層300のみで制御を行うようにできる。
Next, when the evolution simulation is completed, through step S134, an individual having the highest evaluation value is extracted from the population, and an optimal control module is constructed based on the extracted individual information of the individual. 322 is fixed to the optimal control module. Next, through step S136, the input / output relationship of the control module 322 is learned by the learning layer 200. In this learning, first, control is performed by using an evolutionary correction rate and an evolutionary transient correction rate for input information such as the actual engine speed obtained by the optimal control module. When the evolution adaptive layer 300 starts executing the control based on the evolution correction rate and the evolution transient correction rate, the learning neural network of the learning layer 200 changes the input / output relationship of the control module 322 to the learning layer 200.
Learning with the input / output relationship of the neural network functioning for the execution of During this time, the evolution adaptation layer 30
The output of 0 is performed by the individual whose evaluation function before that is maximized, and the control law does not change with time. In the learning described above, inputs and outputs between the evolution adaptive layer 300 and the neural network for execution of the learning layer 200 are averaged with a certain step width, and the average is used as input / output data for updating the teacher data set. For example, the average engine speed per second is 5000 [rpm], the average throttle opening is 20,
The average intake air temperature is 28 [° C] and the average atmospheric pressure is 1013 [h
Pa], these and the evolutionary adaptation layer 3 at that time
00 and the output of the neural network for execution in the learning layer 200 are used as input / output data (see FIG. 11). This input / output data is added to the previous teacher data to obtain a new teacher data set. At this time, old teacher data whose Euclidean distance with new data in the teacher data set is within a certain value is deleted. This is shown in FIG. The initial value of the teacher data set is set to “1” for all input data. The learning layer 200 learns synaptic coupling coefficients in the learning neural network based on the updated teacher data set. The learning of the coupling coefficient is based on the output of the learning neural network during learning and the reflection layer 100.
Is performed until the error between the virtual control output obtained from the basic injection amount and the transient correction rate and the actual control output becomes equal to or smaller than the threshold, and when this learning is completed, the neural network for learning is This is for execution, and the original neural network for control is for learning. Thereafter, the learning layer 200 determines the learning correction rate and the learning transient correction rate using the newly obtained execution neural network and actually outputs them. At the same time, after step S138, the output of the control module 322 becomes “1”. And the learning layer 20
0 and the reflection layer 100 are controlled. The initial value of the neural network for execution of the learning layer 200 is set so that the output is always “1”. By doing so, in the initial state, control can be performed only by the reflective layer 100 and the evolution adaptive layer 300.

【0086】このようにして、本実施の形態では、進化
適応部320は、GAによる進化シミュレーションにお
いて、各個体ごとに、その個体情報に基づいてレスポン
ス度を予測し、予測したレスポンス度が所定条件を満た
すまでその個体情報に対して遺伝的操作を行うようにし
た。これにより、予測およびそれに基づく遺伝的操作の
繰り返しにより一つの世代で個体群の進化が促進する可
能性がさらに高くなるので、少ない世代交代数で有効な
解を得ることがさらに期待できる。したがって、制御特
性の最適化を比較的短時間で実現することができる。
As described above, in the present embodiment, the evolution adaptation unit 320 predicts the responsivity for each individual based on the individual information in the evolution simulation by the GA, and sets the predicted responsivity to a predetermined condition. Genetic operations were performed on the individual information until the condition was satisfied. This further increases the possibility that the evolution of the population will be promoted in one generation by repeating the prediction and the genetic operation based on the prediction, so that it is further expected that an effective solution can be obtained with a small number of generation alternations. Therefore, optimization of control characteristics can be realized in a relatively short time.

【0087】さらに、本実施の形態では、レスポンス度
の予測値に基づいて、個体情報のうちニューラルネット
ワーク322bにおけるシナプスの結合係数に対して遺
伝的操作を行うようになっている。これにより、レスポ
ンス度の向上に特化して進化が促進することが期待でき
る。
Further, in this embodiment, a genetic operation is performed on the synapse coupling coefficient in the neural network 322b in the individual information based on the predicted value of the response level. Thus, it can be expected that the evolution will be promoted specializing in the improvement of the response level.

【0088】さらに、本実施の形態では、第1評価値
は、エンジン10の燃費であり、第2評価値は、レスポ
ンス度である。これにより、燃費およびレスポンス度を
向上する方向に個体群が進化していくので、エンジン1
0の制御特性のうち燃費特性およびレスポンス特性が最
適化される。特に、レスポンス特性については、予測お
よびそれに基づく遺伝的操作の繰り返しにより一つの世
代で個体群の進化が促進する可能性がさらに高くなるの
で、少ない世代交代数で有効なレスポンス特性を得るこ
とが期待できる。
Further, in the present embodiment, the first evaluation value is the fuel efficiency of the engine 10, and the second evaluation value is the degree of response. As a result, the population evolves in a direction to improve the fuel efficiency and the response level.
Among the control characteristics of 0, the fuel consumption characteristics and the response characteristics are optimized. In particular, with regard to response characteristics, it is expected that repetition of prediction and genetic operations based on them will further increase the possibility of promoting population evolution in one generation, so it is expected that effective response characteristics will be obtained with a small number of generation alternations it can.

【0089】さらに、本実施の形態では、エンジン10
の燃料噴射量の補正率または過渡補正率の補正率をニュ
ーラルネットワーク322a,322bにより生成する
ようになっており、個体情報には、ニューラルネットワ
ーク322a,322bにおけるシナプスの結合係数を
割り当てるようになっている。これにより、高い評価値
を得ることが期待できる、ニューラルネットワーク32
2a,322bにおけるシナプスの結合係数を決定する
ことができる。
Further, in this embodiment, the engine 10
The correction rate of the fuel injection amount or the correction rate of the transient correction rate is generated by the neural networks 322a and 322b, and the synapse coupling coefficient in the neural networks 322a and 322b is assigned to the individual information. I have. As a result, it is expected that a high evaluation value can be obtained.
The coupling coefficient of the synapse at 2a and 322b can be determined.

【0090】上記実施の形態において、エンジン10
は、請求項6ないし10、12または14記載の制御対
象に対応し、予測部340は、請求項3、5ないし7、
10または14記載の予測手段に対応し、ニューラルネ
ットワーク322a,322bにおけるシナプスの結合
係数は、請求項6、10または12記載の制御係数に対
応している。また、ステップS112は、請求項6記載
の個体情報操作手段に対応し、評価部330は、請求項
6記載の評価値算出手段に対応し、ステップS122,
S124は、請求項6記載の個体選択手段に対応してい
る。
In the above embodiment, the engine 10
Corresponds to the control target according to any one of claims 6 to 10, 12 and 14, and the prediction unit 340 performs the control according to claims 3, 5 to 7,
The synapse coupling coefficient in the neural networks 322a and 322b corresponds to the control coefficient according to claim 6, 10 or 12. Step S112 corresponds to the individual information operation means described in claim 6, and the evaluation section 330 corresponds to the evaluation value calculation means described in claim 6.
Step S124 corresponds to the individual selecting means described in claim 6.

【0091】なお、上記実施の形態においては、制御装
置30の制御対象として車両用エンジン10を適用して
いるが、制御装置30の制御対象は本実施の形態に限定
されることなく任意のものでよく、例えば、車体のサス
ペンションやシートのダンパー特性の制御または、電気
モータやエンジンを補助動力とする自転車或いは車イス
における補助動力のアシスト特性、またはパーソナルロ
ボットの動作特性(きびきびした動作やのんびりした動
作)の制御に適用してもよい。
In the above embodiment, the vehicle engine 10 is applied as a control target of the control device 30. However, the control target of the control device 30 is not limited to the present embodiment, but is arbitrary. For example, control of suspension characteristics of a vehicle body or damper characteristics of a seat, assist characteristics of an auxiliary power in a bicycle or a wheelchair using an electric motor or an engine as an auxiliary power, or operation characteristics of a personal robot (a crisp operation or a leisurely operation) Operation) may be applied.

【0092】また、本実施の形態においては、制御出力
として燃料噴射量を取り扱っているが、制御対象として
エンジン10を適用する場合、制御出力としては、その
他に、例えば、噴射時間、点火時期、吸気バルブタイミ
ング、電子スロットル開度、バルブリフト量、排気バル
ブタイミング、または吸排気制御用バルブタイミング等
が考えられる。ここで、吸気制御用バルブとは、タンブ
ルおよびスワールの制御を行うために吸気管に設けられ
るバルブであり、また、排気制御バルブとは、排気脈動
を制御するために排気管に設けられるバルブである。
Further, in the present embodiment, the fuel injection amount is treated as the control output. However, when the engine 10 is applied as a control target, the control output may include, for example, injection time, ignition timing, The intake valve timing, the electronic throttle opening, the valve lift, the exhaust valve timing, the intake / exhaust control valve timing, and the like can be considered. Here, the intake control valve is a valve provided on the intake pipe for controlling tumble and swirl, and the exhaust control valve is a valve provided on the exhaust pipe for controlling exhaust pulsation. is there.

【0093】また、本実施の形態においては、学習層2
00を階層型ニューラルネットワークで構成している
が、学習層200の制御系の構成は本実施例に限定され
ることなく、例えば、CMACを用いてもよい。CMA
Cを用いる利点としては、階層型ニューラルネットワー
クに比べて、追加学習の能力が優れていること、学習が
高速である等が挙げられる。
In the present embodiment, the learning layer 2
Although 00 is configured as a hierarchical neural network, the configuration of the control system of the learning layer 200 is not limited to this embodiment, and for example, CMAC may be used. CMA
Advantages of using C include superior additional learning ability and high-speed learning as compared with the hierarchical neural network.

【0094】また、上記実施の形態においては、各個体
の個体情報には、ニューラルネットワーク322a,3
22bにおけるシナプスの結合係数を割り当てるように
構成したが、これに限らず、図13に示すようなバリエ
ーションが考えられる。図13は、個体情報の他のデー
タ構造を示す図である。図13(a)では、燃料制御モ
ジュールを構築するための係数を個体情報に割り当てて
いる。図13(b)では、電子スロットルモジュールお
よび燃料制御モジュールを構築するためのそれぞれの係
数を個体情報に割り当てている。図13(c)では、電
子スロットルモジュール、燃料制御モジュールおよびC
VT(Continuously Variable Transmission)モジュー
ルを構築するためのそれぞれの係数を個体情報に割り当
てている。
In the above embodiment, the individual information of each individual includes the neural networks 322a and 322a.
Although the configuration is such that the synapse coupling coefficient in 22b is assigned, the present invention is not limited to this, and a variation as shown in FIG. 13 can be considered. FIG. 13 is a diagram illustrating another data structure of the individual information. In FIG. 13A, a coefficient for constructing a fuel control module is assigned to individual information. In FIG. 13B, respective coefficients for constructing the electronic throttle module and the fuel control module are assigned to individual information. In FIG. 13C, the electronic throttle module, the fuel control module and the C
Each coefficient for constructing a VT (Continuously Variable Transmission) module is assigned to individual information.

【0095】また、上記実施の形態においては、予測部
340は、CMAC342を学習機構として用いたが、
これに限らず、ニューラルネットワークを学習機構とし
て用いてもよい。また、上記実施の形態においては、個
体の選択を、使用者による評価に基づいて行うように構
成したが、これに限らず、あらかじめ定めた基準に基づ
いて進化適応部320が自動的に行うように構成しても
よい。
In the above embodiment, the prediction unit 340 uses the CMAC 342 as a learning mechanism.
Instead, a neural network may be used as the learning mechanism. Further, in the above embodiment, the individual is selected based on the evaluation by the user. However, the present invention is not limited to this, and the evolution adaptation unit 320 automatically performs the selection based on a predetermined criterion. May be configured.

【0096】また、上記実施の形態においては、エンジ
ン10の燃料噴射量の補正率または過渡補正率の補正率
をニューラルネットワーク322a,322bにより生
成するようになっており、個体情報には、ニューラルネ
ットワーク322a,322bにおけるシナプスの結合
係数を割り当てるように構成したが、これに限らず、個
体情報には、エンジン10の燃料噴射量の補正率または
過渡補正率の補正率を直接割り当てるように構成しても
よい。
Further, in the above embodiment, the correction rate of the fuel injection amount of the engine 10 or the correction rate of the transient correction rate is generated by the neural networks 322a and 322b. The configuration is such that the synapse coupling coefficient in 322a and 322b is assigned. However, the present invention is not limited to this. The individual information is directly assigned with the correction rate of the fuel injection amount of the engine 10 or the correction rate of the transient correction rate. Is also good.

【0097】これにより、高い評価値を得ることが期待
できる、エンジン10の燃料噴射量の補正率または過渡
補正率の補正率を決定することができる。また、上記実
施の形態においては、エンジン10の燃料噴射量の補正
率または過渡補正率の補正率をニューラルネットワーク
322a,322bにより生成するように構成したが、
これに限らず、エンジン10の燃料噴射量、過渡補正
量、燃料噴射量の補正量または過渡補正量の補正量をニ
ューラルネットワーク322a,322bにより生成す
るように構成してもよい。このことは、ニューラルネッ
トワーク322a,322bにより生成せずに直接算出
する構成についても同じである。
As a result, it is possible to determine the correction rate of the fuel injection amount of the engine 10 or the correction rate of the transient correction rate at which a high evaluation value can be expected. In the above embodiment, the correction rate of the fuel injection amount of the engine 10 or the correction rate of the transient correction rate is generated by the neural networks 322a and 322b.
The present invention is not limited to this, and the neural network 322a, 322b may be configured to generate the fuel injection amount, the transient correction amount, the correction amount of the fuel injection amount, or the correction amount of the transient correction amount of the engine 10. This is the same for the configuration in which the calculation is performed directly without being generated by the neural networks 322a and 322b.

【0098】また、上記実施の形態においては、エンジ
ン10の燃費特性およびレスポンス特性を使用者向けに
最適化するのにGAを用いたが、これに限らず、GPや
ES等の進化的アルゴリズムを用いることもできる。ま
た、上記実施の形態においては、インターフェース部3
10を設け、ユーザによる評価に基づいてエンジン10
の制御特性を最適化するように構成したが、これに限ら
ず、所定の評価基準に基づいてエンジン10の制御特性
を評価し、その評価に基づいてエンジン10の制御特性
を自律的に最適化するように構成してもよい。すなわ
ち、本発明を実施する上では、個体の評価は対話型評価
であっても自律型評価であっても構わない。
In the above embodiment, the GA is used to optimize the fuel efficiency and response characteristics of the engine 10 for the user. However, the present invention is not limited to this, and evolutionary algorithms such as GP and ES may be used. It can also be used. In the above embodiment, the interface unit 3
10 based on the evaluation by the user.
However, the control characteristics of the engine 10 are evaluated based on a predetermined evaluation criterion, and the control characteristics of the engine 10 are autonomously optimized based on the evaluation. May be configured. That is, in implementing the present invention, the individual evaluation may be an interactive evaluation or an autonomous evaluation.

【0099】また、上記実施の形態において、図7のフ
ローチャートに示す処理を実行するにあたっては、RO
Mにあらかじめ格納されているプログラムを実行する場
合について説明したが、これに限らず、これらの手順を
示したプログラムが記録された記録媒体から、そのプロ
グラムをRAMに読み込んで実行するようにしてもよ
い。
In the above embodiment, when executing the processing shown in the flowchart of FIG.
The case where a program stored in advance in M is executed has been described. However, the present invention is not limited to this. For example, the program may be read from a recording medium on which a program indicating these procedures is recorded and executed by being read into the RAM. Good.

【0100】ここで、記録媒体とは、RAM、ROM等
の半導体記録媒体、FD、HD等の磁気記録型記録媒
体、CD、CDV、LD、DVD等の光学的読取方式記
録媒体、MO等の磁気記録型/光学的読取方式記録媒体
であって、電子的、磁気的、光学的等の読み取り方法の
いかんにかかわらず、コンピュータで読み取り可能な記
録媒体であれば、あらゆる記録媒体を含むものである。
Here, the recording medium is a semiconductor recording medium such as a RAM or a ROM, a magnetic recording type recording medium such as an FD or HD, an optical reading type recording medium such as a CD, CDV, LD, or DVD; It is a magnetic recording type / optical reading type recording medium, and includes any recording medium that can be read by a computer irrespective of an electronic, magnetic, optical or other reading method.

【0101】[0101]

【発明の効果】以上説明したように、本発明に係る請求
項1ないし5記載の進化的手法による最適解探索装置に
よれば、予測およびそれに基づく遺伝的操作により一つ
の世代で個体群の進化が促進する可能性があるので、従
来に比して、少ない世代交代数で有効な解を得ることが
期待できるという効果が得られる。
As described above, according to the optimal solution searching apparatus by the evolutionary method according to the first to fifth aspects of the present invention, the evolution of the population in one generation by the prediction and the genetic operation based on the prediction. Therefore, there is an effect that it is possible to expect to obtain an effective solution with a smaller number of generation alternations than in the past.

【0102】さらに、本発明に係る請求項2記載の進化
的手法による最適解探索装置によれば、予測およびそれ
に基づく遺伝的操作の繰り返しにより一つの世代で個体
群の進化が促進する可能性がさらに高くなるので、少な
い世代交代数で有効な解を得ることがさらに期待できる
という効果も得られる。一方、本発明に係る請求項6な
いし14記載の進化的手法による制御対象の制御装置に
よれば、予測およびそれに基づく遺伝的操作により一つ
の世代で個体群の進化が促進する可能性があるので、従
来に比して、少ない世代交代数で有効な解を得ることが
期待できる。したがって、制御特性の最適化を比較的短
時間で実現することができるという効果が得られる。
Further, according to the optimal solution search device by the evolutionary method according to the second aspect of the present invention, there is a possibility that the evolution of the population in one generation is promoted by repeating the prediction and the genetic operation based thereon. Since the cost is higher, it is possible to obtain an effect that a more effective solution can be expected with a smaller number of generation alternations. On the other hand, according to the control device of the controlled object by the evolutionary method according to claims 6 to 14 of the present invention, the evolution of the population in one generation may be promoted by the prediction and the genetic operation based on the prediction. It can be expected that an effective solution can be obtained with a smaller number of generation alterations than in the past. Therefore, an effect is obtained that the control characteristics can be optimized in a relatively short time.

【0103】さらに、本発明に係る請求項7記載の進化
的手法による制御対象の制御装置によれば、予測および
それに基づく遺伝的操作の繰り返しにより一つの世代で
個体群の進化が促進する可能性がさらに高くなるので、
少ない世代交代数で有効な解を得ることがさらに期待で
きる。したがって、制御特性の最適化をさらに短時間で
実現することができるという効果も得られる。
Further, according to the control device for the controlled object by the evolutionary method according to the seventh aspect of the present invention, there is a possibility that the evolution of the population in one generation is promoted by repeating the prediction and the genetic operation based thereon. Is even higher,
It is further expected that a valid solution can be obtained with a small number of generation alternations. Therefore, an effect is obtained that the control characteristics can be optimized in a shorter time.

【0104】さらに、本発明に係る請求項8記載の進化
的手法による制御対象の制御装置によれば、第2評価値
の向上に特化して進化が促進することが期待できるとい
う効果も得られる。さらに、本発明に係る請求項9記載
の進化的手法による制御対象の制御装置によれば、燃費
およびレスポンス度を向上する方向に個体群が進化して
いくので、エンジンの制御特性のうち燃費特性およびレ
スポンス特性が最適化される。特に、レスポンス特性に
ついては、予測およびそれに基づく遺伝的操作の繰り返
しにより一つの世代で個体群の進化が促進する可能性が
さらに高くなるので、少ない世代交代数で有効なレスポ
ンス特性を得ることが期待できるという効果も得られ
る。
Further, according to the control device of the controlled object by the evolutionary method according to the eighth aspect of the present invention, an effect is obtained that the evolution can be expected to be accelerated specializing in the improvement of the second evaluation value. . Furthermore, according to the control device for the control object by the evolutionary method according to the ninth aspect of the present invention, since the population evolves in a direction to improve the fuel efficiency and the response, the fuel efficiency characteristic among the engine control characteristics is improved. And the response characteristics are optimized. In particular, with regard to response characteristics, it is expected that repetition of prediction and genetic operations based on them will further increase the possibility of promoting population evolution in one generation, so it is expected that effective response characteristics will be obtained with a small number of generation alternations The effect that can be obtained is also obtained.

【0105】さらに、本発明に係る請求項11記載の進
化的手法による制御対象の制御装置によれば、高い評価
値を得ることが期待できる、燃料噴射量、過渡補正量、
燃料噴射量の補正値または過渡補正量の補正値を決定す
ることができるという効果も得られる。さらに、本発明
に係る請求項12記載の進化的手法による制御対象の制
御装置によれば、高い評価値を得ることが期待できる、
ニューラルネットワークにおけるシナプスの結合係数を
決定することができるという効果も得られる。
Further, according to the control device for the control object by the evolutionary method according to the eleventh aspect of the present invention, it is expected that a high evaluation value can be obtained.
The effect that the correction value of the fuel injection amount or the correction value of the transient correction amount can be determined is also obtained. Further, according to the control device of the control object by the evolutionary method according to claim 12 of the present invention, it is expected that a high evaluation value is obtained.
There is also obtained an effect that the coupling coefficient of the synapse in the neural network can be determined.

【0106】さらに、本発明に係る請求項13記載の進
化的手法による制御対象の制御装置によれば、電力消費
および回転変化率を向上する方向に個体群が進化してい
くので、電気モータの制御特性のうち電力消費特性およ
び回転変化特性が最適化される。特に、回転変化特性に
ついては、予測およびそれに基づく遺伝的操作の繰り返
しにより一つの世代で個体群の進化が促進する可能性が
さらに高くなるので、少ない世代交代数で有効な回転変
化特性を得ることが期待できるという効果も得られる。
Further, according to the control device for the control object by the evolutionary method according to the thirteenth aspect of the present invention, the population evolves in a direction to improve the power consumption and the rate of change in rotation. The power consumption characteristics and the rotation change characteristics among the control characteristics are optimized. In particular, as for the rotation change characteristics, it is more likely that the evolution of the population will be promoted in one generation by repeating the prediction and the genetic operation based on it, so it is necessary to obtain an effective rotation change characteristic with a small number of generation alternations Can be expected.

【0107】一方、本発明に係る請求項15記載の進化
的手法による最適解探索プログラムによれば、請求項1
記載の進化的手法による最適解探索装置と同等の効果が
得られる。
On the other hand, according to the optimal solution search program by the evolutionary method according to claim 15 of the present invention, claim 1
An effect equivalent to that of the optimal solution search device by the described evolutionary method is obtained.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の基本概念を示す図である。FIG. 1 is a diagram showing a basic concept of the present invention.

【図2】本発明の基本構成を示すブロック図である。FIG. 2 is a block diagram showing a basic configuration of the present invention.

【図3】本発明を適用するエンジン制御システムの構成
を示すブロック図である。
FIG. 3 is a block diagram showing a configuration of an engine control system to which the present invention is applied.

【図4】進化適応層300の構成を示すブロック図であ
る。
FIG. 4 is a block diagram showing a configuration of an evolution adaptive layer 300.

【図5】基準個体において使用された領域を示す図であ
る。
FIG. 5 is a diagram showing regions used in a reference individual.

【図6】ニューラルネットワーク322a,322bの
構成および個体情報のデータ構造を示す図である。
FIG. 6 is a diagram showing a configuration of neural networks 322a and 322b and a data structure of individual information.

【図7】進化適応部320で実行される処理を示すフロ
ーチャートである。
FIG. 7 is a flowchart showing processing executed by an evolution adaptation unit 320.

【図8】遺伝的操作の対象部分および遺伝的操作を示す
図である。
FIG. 8 is a diagram showing a target portion of the genetic operation and the genetic operation.

【図9】個体の評価の表現方法の一例を示す図である。FIG. 9 is a diagram showing an example of a method of expressing individual evaluation.

【図10】個体の評価の表現方法の一例を示す図であ
る。
FIG. 10 is a diagram showing an example of a method of expressing individual evaluation.

【図11】教師データ集合が新しい教師データを獲得す
る状態を概念的に示す図である。
FIG. 11 is a diagram conceptually showing a state in which a teacher data set acquires new teacher data.

【図12】教師データ集合の更新を概念的に示す図であ
る。
FIG. 12 is a diagram conceptually showing updating of a teacher data set.

【図13】個体情報の他のデータ構造を示す図である。FIG. 13 is a diagram showing another data structure of individual information.

【符号の説明】[Explanation of symbols]

10 エンジン 20 各種センサ 30 制御装置 100 反射層 110 基礎制御部 200 学習層 210 学習部 300 進化適応層 310 インターフェース部 312 表示部 314 入力部 320 進化適応部 322 制御モジュール 322a,322b ニューラルネットワーク 330 評価部 332 燃費算出部 334 レスポンス度算出部 340 予測部 342 CMAC Reference Signs List 10 engine 20 various sensors 30 control device 100 reflection layer 110 basic control unit 200 learning layer 210 learning unit 300 evolution adaptation layer 310 interface unit 312 display unit 314 input unit 320 evolution adaptation unit 322 control module 322a, 322b neural network 330 evaluation unit 332 Fuel consumption calculation unit 334 Response degree calculation unit 340 Prediction unit 342 CMAC

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G05B 13/02 G05B 13/02 L Z Fターム(参考) 3G084 BA13 DA02 DA07 EB17 EC04 FA10 FA13 FA30 FA33 3G301 JA02 LB01 LB11 MA11 NA09 ND25 ND30 ND42 ND43 PA11Z PA12Z PB03A PE01Z 5H004 GA18 GB12 KC50 KD33 KD43 KD67 ──────────────────────────────────────────────────続 き Continued on the front page (51) Int.Cl. 7 Identification symbol FI theme coat ゛ (Reference) G05B 13/02 G05B 13/02 LZ F-term (Reference) 3G084 BA13 DA02 DA07 EB17 EC04 FA10 FA13 FA30 FA33 3G301 JA02 LB01 LB11 MA11 NA09 ND25 ND30 ND42 ND43 PA11Z PA12Z PB03A PE01Z 5H004 GA18 GB12 KC50 KD33 KD43 KD67

Claims (15)

【特許請求の範囲】[Claims] 【請求項1】 複数の個体の集合からなる個体群を仮想
的に生成するとともに、前記各個体ごとにその個体の遺
伝情報に見立てて個体情報を構成し、同一世代におい
て、遺伝子操作を模倣した情報操作を前記個体情報に対
して行う遺伝的操作、及び評価関数により得られる前記
個体の評価値に基づいて前記個体の生存又は淘汰を行う
個体選択操作をそれぞれ少なくとも1回行って世代を進
行させることにより、前記評価関数の最適解を探索する
装置であって、 前記評価値を予測し、予測した予測値に基づいて前記遺
伝的操作を行うようになっていることを特徴とする進化
的手法による最適解探索装置。
1. A group of a plurality of individuals is virtually generated, and individual information is configured for each of the individuals based on the genetic information of the individual, and genetic manipulation is imitated in the same generation. A genetic operation for performing information operation on the individual information, and an individual selection operation for performing survival or selection of the individual based on an evaluation value of the individual obtained by an evaluation function are respectively performed at least once, and the generation proceeds. An apparatus for searching for an optimal solution of the evaluation function, wherein the apparatus estimates the evaluation value and performs the genetic operation based on the predicted value. Optimal solution search device.
【請求項2】 請求項1において、 前記予測値が所定条件を満たすまで、前記遺伝的操作及
び前記予測を繰り返し行うようになっていることを特徴
とする進化的手法による最適解探索装置。
2. The optimal solution search device according to claim 1, wherein the genetic operation and the prediction are repeatedly performed until the predicted value satisfies a predetermined condition.
【請求項3】 請求項1及び2のいずれかにおいて、 前記評価値は、第1評価値と第2評価値とからなり、 前記個体情報に基づいて前記第2評価値を予測する予測
手段を備え、 前記予測手段で予測した予測値が所定条件を満たすま
で、前記遺伝的操作及び前記予測を繰り返し行うように
なっていることを特徴とする進化的手法による最適解探
索装置。
3. The predicting unit according to claim 1, wherein the evaluation value includes a first evaluation value and a second evaluation value, and a prediction unit that predicts the second evaluation value based on the individual information. An optimal solution search device based on an evolutionary method, wherein the genetic operation and the prediction are repeatedly performed until a predicted value predicted by the prediction unit satisfies a predetermined condition.
【請求項4】 請求項3において、 前記予測値に基づいて、前記個体情報のうち前記第2評
価値に影響を及ぼす情報に対して前記遺伝的操作を行う
ようになっていることを特徴とする進化的手法による最
適解探索装置。
4. The method according to claim 3, wherein the genetic operation is performed on information that affects the second evaluation value among the individual information, based on the predicted value. Solution search device based on evolving evolutionary method.
【請求項5】 請求項3及び4のいずれかにおいて、 前記予測手段は、学習により前記評価値を予測するとと
もに、前記予測値と前記評価値との差分に基づいて学習
を行うようになっていることを特徴とする進化的手法に
よる最適解探索装置。
5. The method according to claim 3, wherein the prediction unit predicts the evaluation value by learning, and performs learning based on a difference between the prediction value and the evaluation value. An optimal solution search device using an evolutionary method characterized by the following.
【請求項6】 複数の個体の集合からなる個体群を仮想
的に生成するとともに、前記各個体ごとにその個体の遺
伝情報に見立てて個体情報を構成し、当該個体情報に
は、制御対象の特性を制御する制御系の制御特性に影響
を及ぼす制御係数を割り当て、さらに、遺伝子操作を模
倣した情報操作を前記個体情報に対して行う個体情報操
作手段と、前記個体の評価値を算出する評価値算出手段
と、前記評価値算出手段で算出した評価値に基づいて前
記個体の生存又は淘汰を行う個体選択手段とを備え、同
一世代において、前記個体情報操作手段による遺伝的操
作及び前記個体選択手段による個体選択操作をそれぞれ
少なくとも1回行って世代を進行させ、これにより進化
を遂げた個体の個体情報を前記制御係数として用いるこ
とにより、前記制御系の制御特性を最適化していく装置
であって、 前記個体情報に基づいて前記評価値を予測する予測手段
を備え、 前記予測手段で予測した予測値に基づいて前記遺伝的操
作を行うようになっていることを特徴とする進化的手法
による制御対象の制御装置。
6. An individual group consisting of a set of a plurality of individuals is virtually generated, and individual information is configured for each individual based on genetic information of the individual, and the individual information includes a control target Assigning a control coefficient that influences a control characteristic of a control system that controls the characteristic, furthermore, an individual information operating means for performing an information operation imitating a genetic operation on the individual information, and an evaluation for calculating an evaluation value of the individual Value calculation means, and individual selection means for performing survival or selection of the individual based on the evaluation value calculated by the evaluation value calculation means, and in the same generation, the genetic operation by the individual information operation means and the individual selection. Means for performing the individual selection operation at least once by each means to advance the generation, and using the individual information of the individual evolved thereby as the control coefficient, A device for optimizing the control characteristics of the device, comprising a prediction unit for predicting the evaluation value based on the individual information, and performing the genetic operation based on the prediction value predicted by the prediction unit. A control device for an object to be controlled by an evolutionary method characterized in that:
【請求項7】 請求項6において、 前記評価値は、第1評価値と第2評価値とからなり、 前記予測手段は、前記個体情報に基づいて前記第2評価
値を予測するようになっており、 前記予測手段で予測した予測値が所定条件を満たすま
で、前記遺伝的操作及び前記予測を繰り返し行うように
なっていることを特徴とする進化的手法による制御対象
の制御装置。
7. The evaluation value according to claim 6, wherein the evaluation value includes a first evaluation value and a second evaluation value, and the prediction unit predicts the second evaluation value based on the individual information. A control apparatus for controlling a control target by an evolutionary method, wherein the genetic operation and the prediction are repeatedly performed until a predicted value predicted by the prediction unit satisfies a predetermined condition.
【請求項8】 請求項7において、 前記予測値に基づいて、前記個体情報のうち前記第2評
価値に影響を及ぼす情報に対して前記遺伝的操作を行う
ようになっていることを特徴とする進化的手法による制
御対象の制御装置。
8. The method according to claim 7, wherein the genetic operation is performed on information that affects the second evaluation value in the individual information based on the predicted value. A control device for a controlled object by an evolutionary method.
【請求項9】 請求項7及び8のいずれかにおいて、 前記制御対象は、エンジンであり、 前記第1評価値は、前記エンジンの燃費であり、前記第
2評価値は、前記エンジンの回転数変化率及びスロット
ル開度変化率により定まるレスポンス度であることを特
徴とする進化的手法による制御対象の制御装置。
9. The engine according to claim 7, wherein the control target is an engine, the first evaluation value is a fuel efficiency of the engine, and the second evaluation value is a rotation speed of the engine. A control device according to an evolutionary method, characterized in that the response is determined by a change rate and a throttle opening change rate.
【請求項10】 請求項9において、 前記予測手段は、前記個体情報を前記制御係数として用
いて前記エンジンを運転したときに得られる、前記エン
ジンの燃料噴射量及び前記エンジンの過渡状態において
前記燃料噴射量を補正する過渡補正量に基づいて、前記
第2評価値を予測するようになっていることを特徴とす
る進化的手法による制御対象の制御装置。
10. The fuel injection amount of the engine and the fuel in the transient state of the engine obtained when the engine is operated by using the individual information as the control coefficient. A control device according to an evolutionary method, wherein the second evaluation value is predicted based on a transient correction amount for correcting an injection amount.
【請求項11】 請求項6乃至10のいずれかにおい
て、 前記制御対象は、エンジンであり、 前記個体情報には、前記制御係数として、前記エンジン
の燃料噴射量、前記エンジンの過渡状態において前記燃
料噴射量を補正する過渡補正量、前記燃料噴射量の補正
値又は前記過渡補正量の補正値を割り当てるようになっ
ていることを特徴とする進化的手法による制御対象の制
御装置。
11. The engine according to claim 6, wherein the control target is an engine, and the individual information includes the control element as the control coefficient, a fuel injection amount of the engine, and the fuel in a transient state of the engine. A control device according to an evolutionary method, wherein a transient correction amount for correcting an injection amount, a correction value for the fuel injection amount, or a correction value for the transient correction amount is assigned.
【請求項12】 請求項6乃至10のいずれかにおい
て、 前記制御対象は、エンジンであり、 前記エンジンの燃料噴射量、前記エンジンの過渡状態に
おいて前記燃料噴射量を補正する過渡補正量、前記燃料
噴射量の補正値又は前記過渡補正量の補正値をニューラ
ルネットワークにより生成するようになっており、 前記個体情報には、前記制御係数として、前記ニューラ
ルネットワークにおけるシナプスの結合係数を割り当て
るようになっていることを特徴とする進化的手法による
制御対象の制御装置。
12. The engine according to claim 6, wherein the control target is an engine, a fuel injection amount of the engine, a transient correction amount for correcting the fuel injection amount in a transient state of the engine, and the fuel. The correction value of the injection amount or the correction value of the transient correction amount is generated by a neural network, and the individual information is assigned a coupling coefficient of a synapse in the neural network as the control coefficient. A control device for an object to be controlled by an evolutionary method characterized in that:
【請求項13】 請求項7及び8のいずれかにおいて、 前記制御対象は、電気モータであり、 前記第1評価値は、前記電気モータの電力消費であり、
前記第2評価値は、前記電気モータの回転変化率である
ことを特徴とする進化的手法による制御対象の制御装
置。
13. The electric motor according to claim 7, wherein the control target is an electric motor, the first evaluation value is power consumption of the electric motor,
The control device according to an evolutionary method, wherein the second evaluation value is a rotation change rate of the electric motor.
【請求項14】 請求項6乃至13のいずれかにおい
て、 前記予測手段は、学習により前記評価値を予測するとと
もに、前記予測値と前記評価値との差分に基づいて学習
を行うようになっていることを特徴とする進化的手法に
よる制御対象の制御装置。
14. The method according to claim 6, wherein the prediction unit predicts the evaluation value by learning and performs learning based on a difference between the predicted value and the evaluation value. A control device for an object to be controlled by an evolutionary method characterized in that:
【請求項15】 複数の個体の集合からなる個体群を仮
想的に生成するとともに、前記各個体ごとにその個体の
遺伝情報に見立てて個体情報を構成し、同一世代におい
て、遺伝子操作を模倣した情報操作を前記個体情報に対
して行う遺伝的操作、及び評価関数により得られる前記
個体の評価値に基づいて前記個体の生存又は淘汰を行う
個体選択操作をそれぞれ少なくとも1回行って世代を進
行させることにより、前記評価関数の最適解を探索する
コンピュータ実行可能なプログラムであって、 前記評価値を予測し、予測した予測値に基づいて前記遺
伝的操作を行うようになっていることを特徴とする進化
的手法による最適解探索プログラム。
15. An individual group consisting of a set of a plurality of individuals is virtually generated, and individual information is configured for each of the individuals based on the genetic information of the individual, and genetic manipulation is imitated in the same generation. A genetic operation for performing information operation on the individual information, and an individual selection operation for performing survival or selection of the individual based on an evaluation value of the individual obtained by an evaluation function are respectively performed at least once, and the generation proceeds. A computer-executable program for searching for an optimal solution of the evaluation function, wherein the genetic value is predicted based on the predicted value and the genetic operation is performed based on the predicted value. Optimal solution search program by evolving evolutionary method.
JP2001042904A 2001-02-20 2001-02-20 Device and program for searching optimal solution by evolutionary method and controller of control object by evolutionary method Pending JP2002245434A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001042904A JP2002245434A (en) 2001-02-20 2001-02-20 Device and program for searching optimal solution by evolutionary method and controller of control object by evolutionary method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001042904A JP2002245434A (en) 2001-02-20 2001-02-20 Device and program for searching optimal solution by evolutionary method and controller of control object by evolutionary method

Publications (1)

Publication Number Publication Date
JP2002245434A true JP2002245434A (en) 2002-08-30

Family

ID=18905147

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001042904A Pending JP2002245434A (en) 2001-02-20 2001-02-20 Device and program for searching optimal solution by evolutionary method and controller of control object by evolutionary method

Country Status (1)

Country Link
JP (1) JP2002245434A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010523886A (en) * 2007-04-09 2010-07-15 華 趙 ENGINE CONTROL METHOD AND CONTROL DEVICE
US7778947B2 (en) 2006-08-03 2010-08-17 Matsushita Electric Works, Ltd. Anomaly monitoring device using two competitive neural networks
EP3798933A1 (en) 2019-09-17 2021-03-31 Fujitsu Limited Information processing apparatus, information processing program, and information processing method
KR20210072948A (en) * 2019-12-10 2021-06-18 주식회사 현대케피코 Engine performance prediction by calculating loss and discharge coefficients of intake manifold

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7778947B2 (en) 2006-08-03 2010-08-17 Matsushita Electric Works, Ltd. Anomaly monitoring device using two competitive neural networks
JP2010523886A (en) * 2007-04-09 2010-07-15 華 趙 ENGINE CONTROL METHOD AND CONTROL DEVICE
EP3798933A1 (en) 2019-09-17 2021-03-31 Fujitsu Limited Information processing apparatus, information processing program, and information processing method
KR20210072948A (en) * 2019-12-10 2021-06-18 주식회사 현대케피코 Engine performance prediction by calculating loss and discharge coefficients of intake manifold
KR102291014B1 (en) * 2019-12-10 2021-08-18 주식회사 현대케피코 Engine performance prediction by calculating loss and discharge coefficients of intake manifold

Similar Documents

Publication Publication Date Title
US7062333B2 (en) Optimal solution search device, device for controlling controlled object by optimizing algorithm, and optimal solution search program
JP3825845B2 (en) Evolutionary control method
US20210382445A1 (en) Control sequence generation system and methods
KR101899101B1 (en) Apparatus and Method for Generating Prediction Model based on Artificial Neural Networks
Stanley et al. Efficient reinforcement learning through evolving neural network topologies
Leng et al. Design for self-organizing fuzzy neural networks based on genetic algorithms
US6721647B1 (en) Method for evaluation of a genetic algorithm
JP2000250604A (en) Cooperation method of optimization for characteristic optimization method
JP2001236337A (en) Predicting device using neural network
US20070179917A1 (en) Intelligent design optimization method and system
CN113537580B (en) Public transportation passenger flow prediction method and system based on self-adaptive graph learning
Saadatmand-Tarzjan et al. A novel constructive-optimizer neural network for the traveling salesman problem
CN114511021A (en) Extreme learning machine classification algorithm based on improved crow search algorithm
JP2002245434A (en) Device and program for searching optimal solution by evolutionary method and controller of control object by evolutionary method
Chidambaran et al. Multi-criteria evolution of neural network topologies: Balancing experience and performance in autonomous systems
JP2002251598A (en) Optimal solution searching device, controlled object controlling device, and optimal solution searching program
JP2000339005A (en) Method and device for controlling optimization of controlled target
Zhao et al. Adaptive Swarm Intelligent Offloading Based on Digital Twin-assisted Prediction in VEC
CN110705756A (en) Electric power energy consumption optimization control method based on input convex neural network
JP2000250603A (en) Integrated characteristic optimization method
Grosan et al. Hybrid intelligent systems
CN112528556B (en) Micro-electro-mechanical system design optimization method based on integrated model assisted social learning particle swarm algorithm
Kochenderfer Adaptive modelling and planning for learning intelligent behaviour
JP2000250602A (en) Integrated characteristic optimizing device
JPH10154003A (en) Evolutional control system