WO2002069257A1

WO2002069257A1 - Dispositif de recherche de solution optimale, dispositif pour commander un objet commande par algorithme d'optimisation, et programme de recherche de solution optimale

Info

Publication number: WO2002069257A1
Application number: PCT/JP2002/000932
Authority: WO
Inventors: Takaaki Mizutani
Original assignee: Yamaha Hatsudoki Kabushiki Kaisha
Priority date: 2001-02-23
Filing date: 2002-02-05
Publication date: 2002-09-06
Also published as: JP2002251597A; US7062333B2; EP1372107A4; US20040078095A1; EP1372107A1

Description

明細書最適解探索装置、最適化アルゴリズムによる制御対象の制御装置および最適解探索プログラム技術分野

本発明は、.評価関数の最適解を最適化アルゴリズムにより探索する装置およびプログラムに係り、特に、使用者の希望に沿った最適解を探索することができ、しかも最適化に要する時間を短縮することができる最適解探索装置、最適化アルゴリズムによる制御対象の制御装置および最適解探索プログラムに関する。背景技術

従来から、車両や家電製品等の製品の特性を制御する場合、制御対象となる製品の特性は、開発 ·設計段階で、その製品を使用すると思われる使用者を想定し、その仮想使用者の好みや使用状況を加味し、できるだけ幅広い使用者に適応するように決められる。しかし、上記製品を使用する使用者は、個々に特有の個性を持っており、その好みも千差万別であるため、前記したように、その製品を使用すると思われる使用者の好み等を想定して製品の開発 ·設計を行ったとしても、すべての使用者が満足する特性を提供ことはほぼ不可能に近い。この問題を解決するために、 G A等の最適化アルゴリズムを用いて、購入後に使用者の好みや使用状況を推定し、使用者が満足しうる特性に制御特性を変更していく制御方法が試みられている。

最適化アルゴリズムにより制御特性を最適化する場合には、その制御結果を数値化し所定の評価基準に基づいて自律的に評価しながら制御特性を最適化していく自律型評価手法と、その制御結果を使用者に対して表示し使用者との対話により評価しながら制御特性を最適化していく対話型評価手法とのいずれかが採用される。

自律型評価手法は、所定の評価基準に基づいて自律的に行うため、比較的短時間で制御特性を最適化することができるが、使用者の好みが最適値となるような評価基準が使用者によって変化する場合には適していない。これに対し、対話型評価手法は、使用者の好みが最適値となるような評価基準が使用者によって変化する場合に適したものではあるが、使用者による評価を短期間にさほど多く得ることができないので、例えば車両の制御特性のすべてをこの手法で最適化しょうとすれば、最適化が完了するまでに比較的長時間要するという問題がある。

そこで、本発明は、このような従来の技術の有する未解決の課題に着目してなされたものであって、使用者の希望に沿った最適解を探索することができ、しかも最適化に要する時間を短縮することができる最適解探索装置、最適化アルゴリズムによる制御対象の制御装置および最適解探索プログラムを提供することを目的としている。発明の開示

上記目的を達成するために、本発明に係る請求の範囲第 1項記載の最適解探索装置は、評価関数の出力を繰り返し評価しながら前記評価関数の最適解を最適化アルゴリズムにより探索する装置であって、前記評価関数の出力に対する評価を使用者との対話に基づいて行う対話型評価と、前記評価関数の出力に対する評価を所定の評価基準に基づいて行う自律型評価との組み合わせにより、前記最適化アルゴリズムによる探索を行うようになっている。

このような構成であれば、対話型評価と自律型評価との組合せにより評価関数の出力が繰り返し評価されながら、評価関数の最適解が最適化アルゴリズムにより探索される。

ここで、請求の範囲第 1記載の発明は、例えば、制御対象の制御特性を最適化する場合に適用することもできるが、これに限らず、最適化ァルゴリズムがこれまで適用されてきた各種の問題にも適用することができる。以下、請求の範囲第 1 2項記載の最適解探索プログラムにおいて同じである。

また、請求の範囲第 1記載の発明は、最適化ァルゴリズムとして、 G A、 G P (Genetic Progress) または E S (evolutional Stratage) のような進化型最適化アルゴリズムを採用することもできるし、その他、近傍計算型最適化アルゴリズムや強化学習による最適化アルゴリズムを採用することもできる。以下、請求の範囲第 3項記載の最適化アルゴリズムによる制御対象の制御装置、および請求の範囲第 1' 2項記載の最適解探索プログラムにおいて同じである。

さらに、本発明に係る請求の範囲第 2項記載の最適解探索装置は、請求の範囲第 1項記載の最適解探索装置において、前記評価関数の出力を記憶するための記憶手段と、前記評価関数の出力を評価値として算出して前記記憶手段に記憶する評価値算出手段と、前記使用者による評価を入力する評価入力手段とを備え、前記対話型評価は、前記評価入力手段の入力内容に基づいて行い、前記自律型評価は、前記記憶手段の評価値に基づいて行うようになっている。

このような構成であれば、評価値算出手段により、評価関数の出力が評価値として算出され、算出された評価値が記憶手段に記憶される。ここで、使用者は、評価値に対する評価を評価入力手段に入力すると、入力された入力内容に基づいて対話型評価が行われる。一方、記憶手段の評価値に基づいて自律型評価が行われる。そして、これら対話型評価と自律型評価との組合せにより評価関数の出力が繰り返し評価されながら、評価関数の最適解が最適化アルゴリズムにより探索される。

ここで、記憶手段は、評価値をあらゆる手段でかつあらゆる時期に記憶するものであり、評価値をあらかじめ記憶してあるものであってもよいし、評価値をあらかじめ記憶することなく、本装置の動作時に外部からの入力等によって評価値を記憶するようになっていてもよい。以下、請求の範囲第 4項記載の最適化ァルゴリズムによる制御対象の制御装置において同じである。

一方、上記目的を達成するために、本発明に係る請求の範囲第 3項記載の最適化ァルゴリズムによる制御対象の制御装置は、制御対象の特性を制御する制御系の制御特性に影響を及ぼす制御係数を入力として前記制御特性を出力する評価関数を用いて、前記評価関数の出力を繰り返し評価しながら前記評価関数の最適解を最適化アルゴリズムにより探索することにより、前記制御系の制御特性を最適化する装置であって、前記評価関数の出力に対する評価を使用者との対話に基づいて行う対話型評価と、前記評価関数の出力に対する評価を所定の評価基準に基づいて行う自律型評価との組み合わせにより、前記最適化アルゴリズムによる探索を行うようになっている。

このような構成であれば、対話型評価と自律型評価との組合せにより評価関数の出力が繰り返し評価されながら、評価関数の最適解が最適化アルゴリズムにより探索される。そして、探索が完了すると、最適解として探索された制御係数に基づいて制御系が動作し、これにより制御系の制御特性が最適化される。

さらに、本発明に係る請求の範囲第 4項記載の最適化アルゴリズムによる制御対象の制御装置は、請求の範囲第 3項記載の最適化アルゴリズムによる制御対象の制御装置において、前記評価関数の出力を記憶するための記憶手段と、前記評価関数の出力を評価値として算出して前記記憶手段に記憶する評価値算出手段と、前記使用者による評価を入力する評価入力手段とを備え、前記対話型評価は、前記評価入力手段の入力内容に基づいて行い、前記自律型評価は、前記記憶手段の評価値に基づいて行うようになつている。

さらに、本発明に係る請求の範囲第 5項記載の最適化アルゴリズムによる制御対象の制御装置は、請求の範囲第 3および第 4項のいずれかに記載の最適化アルゴリズムによる制御対象の制御装置において、前記制御対象の第 1の特性を制御する第 1制御系と、前記制御対象の第 2の特性を制御する第 2制御系とを備え、前記第 1制御系については、前記第 1制御系の制御特性に影響を及ぼす制御係数を入力として前記制御特性を出力する第 1評価関数を用いて、前記第 1評価関数の出力を前記対話型評価により繰り返し評価しながら、前記第 1評価関数の最適解を前記最適化アルゴリズムにより探索するようになっており、前記第 2制御系については、前記第 2制御系の制御特性に影響を及ぼす制御係数を入力として前記制御特性を出力する第 2評価関数および前記第 1評価関数を用いて、前記第 1制御系の最適化で最適解として探索した解から求まる前記第 1評価関数の出力を基準として所定範囲内に前記第 1評価関数の出力が属するように、前記第 2評価関数の出力を前記自律型評価により繰り返し評価しながら、前記第 2評価関数の最適解を前記最適化ァルゴリズムにより探索するようになつている。

このような構成であれば、第 1制御系については、第 1評価関数の出力が対話型評価により繰り返し評価されながら、第 1評価関数の最適解が最適化アルゴリズムにより探索される。そして、第 2制御系については、第 1制御系の最適化で最適解として探索された解から求まる第 1評価関数の出力を基準として所定範囲内に第 1評価関数の出力が属するように、第 2評価関数の出力が自律型評価により繰り返し評価されながら、第 2評価関数の最適解が最適化アルゴリズムにより探索される。

さらに、本発明に係る請求の範囲第 6項記載の最適化アルゴリズムによる制御対象の制御装置は、請求の範囲第 3および第 4項のいずれかに記載の最適化ァルゴリズムによる制御対象の制御装置において、前記制御対象の第 1の特性を制御する第 1制御系と、前記制御対象の第 2の特性を制御する第 2制御系とを備え、前記第 1制御系については、前記第 1制御系の制御特性に影響を及ぼす制御係数を入力として前記制御特性を出力する第 1評価関数を用いて、前記第 1評価関数の出力を前記自律型評価により繰り返し評価しながら、前記第 1評価関数の最適解を前記最適化アルゴリズムにより探索するようになっており、前記第 2制御系については、前記第 2制御系の制御特性に影響を及ぼす制御係数を入力として前記制御特性を出力する第 2評価関数および前記第 1評価関数を用いて、前記第 1制御系の最適化で最適解として探索した解から求まる前記第 1評価関数の出力を基準として所定範囲内に前記第 1評価関数の出力が属するように、前記第 2評価関数の出力を前記対話型評価により繰り返し評価しながら、前記第 2評価関数の最適解を前記最適化ァルゴリズムにより探索するようになつている。

このような構成であれば、第 1制御系については、第 1評価関数の出力が自律型評価により繰り返し評価されながら、第 1評価関数の最適解が最適化アルゴリズムにより探索される。そして、第 2制御系については、第 1制御系の最適化で最適解として探索された解から求まる第 1評価関数の出力を基準として所定範囲内に第 1評価関数の出力が属するように、第 2評価関数の出力が対話型評価により繰り返し評価されながら、第 2評価関数の最適解が最適化アルゴリズムにより探索される。

さらに、本発明に係る請求の範囲第 7項記載の最適化アルゴリズムによる制御対象の制御装置は、請求の範囲第 5および第 6項のいずれかに記載の最適化ァルゴリズムによる制御対象の制御装置において、前記制御対象は、エンジンであり、前記第 1評価関数および前記第 2評価関数の出力のうち前記対話型評価の対象となるものは、前記ェンジンの回転数変化率およびス口ットル開度変化率により定まるレスポンス度であり、前記第 1評価関数および前記第 2評価関数の出力のうち前記自律型評価の対象となるものは、前記エンジンの燃費である。

このような構成であれば、第 1評価関数および第 2評価関数のうち対話型評価の対象となるものについては、対話型評価を繰り返し経てレスボンス特性が最適化される。一方、第 1評価関数および第 2評価関数のうち自律型評価の対象となるものについては、自律型評価を繰り返し経てェンジンの燃費特性が最適化される。

さらに、本発明に係る請求の範囲第 8項記載の最適化ァルゴリズムによる制御対象の制御装置は、請求の範囲第 5ないし第 7項のいずれかに記載の最適化アルゴリズムによる制御対象の制御装置において、前記最適化ァルゴリズムは、複数の個体の集合からなる個体群を仮想的に生成するとともに、前記各個体ごとにその個体の遺伝情報に見立てて個体情報を構成し、当該個体情報には前記制御係数を割り当て、さらに、遺伝子操作を模倣した情報操作を前記個体情報に対して行う個体情報操作手段と、前記個体の評価値を算出する評価値算出手段と、前記評価値算出手段で算出した評価値に基づいて前記個体の生存または淘汰を行う個体選択手段とを備え、同一世代において、前記個体情報操作手段による遺伝的操作および前記個体選択手段による個体選択操作をそれぞれ少なくとも 1回行って世代を進行させる進化型最適化アルゴリズムである。

このような構成であれば、個体情報操作手段により、遺伝子操作を模倣した情報操作が個体情報に対して行われ、評価値算出手段により、評価値が算出され、個体選択手段により、算出された評価値に基づいて個体の生存または淘汰が行われる。そして、この個体情報操作手段による遺伝的操作および個体選択手段による個体選択操作が、同一世代においてそれぞれ少なくとも 1回行われることにより世代が進行する。

さらに、本発明に係る請求の範囲第 9項記載の最適化アルゴリズムによる制御対象の制御装置は、請求の範囲第 8項記載の最適化ァルゴリズムによる制御対象の制御装置において、前記制御対象は、エンジンであり、前記個体情報には、前記制御係数として、前記エンジンの燃料噴射量、前記エンジンの過渡状態において前記燃料噴射量を補正する過渡補正量、前記燃料噴射量の補正値または前記過渡補正量の補正値を割り当てるようになっている。

このような構成であれば、評価値を向上する方向に個体群が進化していくにつれて、高い評価値を得ることが期待できる、燃料噴射量、過渡補正量、燃料噴射量の補正値または過渡補正量の補正値が決定される。

さらに、本発明に係る請求の範囲第 1 0項記載の最適化アルゴリズムによる制御対象の制御装置は、請求の範囲第 8項記載の最適化ァルゴリズムによる制御対象の制御装置において、前記制御対象は、エンジンであり、前記エンジンの燃料噴射量、前記エンジンの過渡状態において前記燃料噴射量を補正する過渡補正量、前記燃料噴射量の補正値または前記過渡補正量の補正値をニューラルネットワークにより生成するようになっており、前記個体情報には、前記制御係数として、前記ニューラルネツトワークにおけるシナプスの結合係数を割り当てるようになつている。

このような構成であれば、ニューラルネットワークにより、燃料噴射量、過渡補正量、燃料噴射量の補正値または過渡補正量の補正値が生成されるが、評価値を向上する方向に個体群が進化していくにつれて、高い評価値を得ることが期待できる、ニューラルネヅトワークにおけるシナプスの結合係数が決定される。

さらに、本発明に係る請求の範囲第 1 1項記載の最適化アルゴリズムによる制御対象の制御装置は、請求の範囲第 5および第 6項のいずれかに記載の最適化アルゴリズムによる制御対象の制御装置において、前記制御対象は、電気モー夕であり、前記第 1評価関数および前記第 2評価関数め出力のうち前記対話型評価の対象となるものは、前記電気モー夕の回転変化率であり、前記第 1評価関数および前記第 2評価関数の出力のうち前記自律型評価の対象となるものは、前記電気モー夕の電力消費である。

このような構成であれば、第 1評価関数および第 2評価関数のうち対話型評価の対象となるものについては、対話型評価を繰り返し経て電気モー夕の回転変化特性が最適化される。一方、第 1評価関数および第 2評価閧数のうち自律型評価の対象となるものについては、自律型評価を繰り返し経て電気モ一夕の電力消費特性が最適化される。

一方、上記目的を達成するために、本発明に係る請求の範囲第 1 2項記載の最適解探索プログラムは、評価関数の出力を繰り返し評価しながら前記評価関数の最適解を最適化アルゴリズムにより探索するコンピュータ実行可能なプログラムであって、前記評価関数の出力に対する評価を使用者との対話に基づいて行う対話型評価と、前記評価関数の出力に対する評価を所定の評価基準に基づいて行う自律型評価との組み合わせにより、前記最適化アルゴリズムによる探索を行う処理をコンピュータに実行させるためのプログラムである。

このような構成であれば、プログラムに従ってコンピュータが実行したときは、請求の範囲第 1記載の最適解探索装置と同等の作用が得られる。図面の簡単な説明

図 1は、本発明の基本概念を示す図である。図 2は、本発明の基本構成を示すプロック図である。図 3は、本発明を適用するエンジン制御システムの構成を示すブロック図である。図 4は、対話型最適化部 3 1 0の構成を示すプロック図である。図 5は、個体情報のデ一夕構造を示す図である。図 6は、進化適応部 3 3 0で実行される処理を示すフローチャートである c 図 7は、自律型最適化部 3 5 0の構成を示すブロック図である。図 8は、ニューラルネヅトワーク 3 6 2 a， 3 6 2 bの構成および個体情報のデー夕構造を示す図である。

図 9は、進化適応部 3 6 0で実行される処理を示すフローチャートである。図 1 0は、エンジン 1 0および電子スロヅトル 1 2の制御特性を最適化する順序を示す図である。図 1 1は、教師デ一夕集合が新しい教師デ一夕を獲得する状態を概念的に示す図である。図 1 2は、教師データ集合の更新を概念的に示す図である。発明を実施するための最良の形態

以下、本発明の実施の形態を図面を参照しながら説明する。図 1ないし図 1 2は、本発明に係る最適解探索装置、最適化アルゴリズムによる制御対象の制御装置および最適解探索プログラムの実施の形態を示す図である。

まず、本発明の基本概念を図 1を参照しながら説明する。図 1は、本発明の基本概念を示す図である。

本発明の基本構成は、図 1に示すように、最適化対象 1と、最適化対象 1の評価を対話型評価により行いながら進化型最適化アルゴリズムにより最適化対象 1の第 1操作量を決定し出力する対話型最適化部 2と、最適化対象 1の評価を自律型評価により行いながら進化型最適化ァルゴリズムにより最適化対象 1の第 2操作量を決定し出力する自律型最適化部 3 とで構成されている。

対話型最適化部 2は、最適化対象 1の操作結果に基づいて、 G Aにより、最適化対象 1の操作特性が最適となるような第 1操作量を決定し、決定した第 1操作量を最適化対象 1に出力するようになっている。

自律型最適化部 3は、最適化対象 1の操作結果に基づいて、 G Aにより、最適化対象 1の操作特性が最適となるような第 2操作量を決定し、決定した第 2操作量を最適化対象 1に出力するようになっている。

次に、本発明の基本構成を図 2を参照しながら説明する。図 2は、本発明の基本構成を示すブロック図である。

本発明の基本構成は、図 2に示すように、制御対象 5 0と、制御対象 5 0の制御結果に基づいて制御対象 5 0の制御量を制御する制御装置 6 0 とで構成されている。

制御装置 6 0は、反射層 5 0 0、学習層 6 0 0および進化適応層 7 0 0 の 3つの制御層からなり、制御対象 5 0から制御結果を入力し、入力した制御結果に基づいて反射層 5 0 0で基本制御量を決定し、学習層 6 0 0および進化適応層 7 0 0で基本制御量に対する補正率を決定し、これら基本制御量および補正率から最終的な制御量を決定する。以下、反射層 5 0 0、学習層 6 0 0および進化適応層 7 0 0の構成を詳細に説明する。

反射層 5 0 0は、数式、マヅプ、ニューラルネットワーク、フアジ一ル —ル、サブサンプシヨンアーキテクチャ等の形式で、基本制御量と制御結果との関係を定義付ける基礎制御部 5 1 0を備え、基礎制御部 5 1 0は、制御対象 5 0から制御結果を入力し、入力した制御結果に基づいて基本制御量を決定して出力する。なお、サブサンプシヨンアーキテクチャとは、並列的な処理を行う行動型人工知能として公知である。

進化適応層 7 0 0は、対話型評価を繰り返し行いながら進化型最適化ァルゴリズムにより制御対象 5 0の制御特性を最適化する対話型最適化部 7 1 0と、自律型評価を繰り返し行いながら進化型最適化アルゴリズムにより制御対象 5 0の制御特性を最適化する自律型最適化部 7 5 0とで構成されている。

対話型最適化部 7 1 0は、制御結果に基づいて制御対象 5 0の制御量を出力する制御モジュールを少なくとも一つ有し、制御対象 5 0の制御特性に対する評価をュ一ザとの対話に基づいて行う対話型評価を繰り返し行いながら、 G Aにより制御モジュールを最適化するように構成されている _c G Aでは、複数の個体の集合からなる個体群を仮想的に生成するとともに、各個体ごとにその個体の遺伝情報に見立てて個体情報を構成する。ここで、各個体情報には、制御モジュールを構築するための制御係数を割り当てる c そして、同一世代において、遺伝子操作を模倣した情報操作を個体情報に対して行う遺伝的操作、および個体の評価値に基づいて個体の生存または淘汰を行う個体選択操作をそれぞれ少なくとも 1回行って世代を所定回進行させることにより、個体群を進化させる。所定回数の世代交代が終了したときは、個体群のなかから評価値が最も高い個体を抽出し、抽出した個体の個体情報を制御係数として用い制御モジュールを構築する。以下、評価値が最も高い個体の個体情報を用いて構築した制御モジュールのことを「最適制御モジュール」という。なお、制御モジュールとは、制御系のあるまとまった制御を行う一単位をいう。

自律型最適化部 7 5 0は、制御結果に基づいて、反射層 5 0 0からの基本制御量を使用者の希望に沿った値に補正するための進化補正率を出力する制御モジュールを少なくとも一つ有し、 G Aにより制御モジュールを最適化するように構成されている。また、最適制御モジュールを構築した後、自律型最適化部 7 5 0の制御モジュールをその最適制御モジュールに固定し、反射層 5 0 0からの基本制御量を補正する進化補正率による制御を行う一方、学習層 6 0 0にその最適制御モジュールに関する情報を学習させる。また、最適制御モジュールに関する情報を学習層 6 0 0に学習させた後は、その出力を「1」に戻し、その後は、使用者の指示に応じて作動する。すなわち、自律型最適化部 7 5 0の制御モジュールによる制御が行われるのは、進化シミュレ一シヨン中および学習中のみである。

学習層 6 0 0は、学習用と実行用とに切換可能な 2つのニューラルネットワークを有する学習部 6 1 0を備え、学習部 6 1 0は、一方の二ユーラルネヅトワーク（実行用）で制御を実行している間、他方のニュ一ラルネットヮ一ク（学習用）で進化適応層 7 0 0から最適制御モジュールに関する入力と出力との関係を学習する。学習用ニューラルネットワークでの学習が終了すると、制御を実行しているニューラルネッ卜ワークと学習後のニューラルネヅトワークとを切り換え、学習後のニューラルネヅトワークで学習結果から得られる制御モジュールによる制御を開始し、制御を実行していたニューラルネヅトワークが学習用として機能し始める。なお、学習層 6 0 0におけるニューラルネヅトヮ一クは、初期状態では「 1」を出力するように設定されており、したがって、初期状態では、反射層 5 0 0 と進化適応層 7 0 0とによる制御が行われる。

実行用ニューラルネットワークは、制御対象 5 0から制御結果を入力し、入力した制御結果に基づいて反射層 5 0 0からの基本制御量を補正するための学習補正率を出力するようになっている。この構成は、学習用ニュ —ラルネヅトワークについても同様である。そして、制御装置 6 0は、学習層 6 0 0からの学習補正率と進化適応層 7 0 0からの進化補正率とを加算し、反射層 5 0 0からの基本制御量にその加算結果を乗算することにより制御量を算出する。この制御量を制御対象 5 0に出力する。

以下、本発明のより具体的な実施の形態を説明する。

本実施の形態は、本発明に係る最適解探索装置、最適化アルゴリズムによる制御対象の制御装置および最適解探索プログラムを、図 3に示すように、対話型評価と自律型評価との組み合わせによる評価を繰り返し行いながら、 G Aにより、エンジン 1 0の燃費特性およびレスポンス特性を使用者向けに最適化する場合について適用したものである。

まず、本発明を適用するエンジン制御システムの構成を図 3を参照しながら説明する。図 3は、本発明を適用するエンジン制御システムの構成を示すプロック図である。

エンジン制御システムは、図 3に示すように、エンジン 1 0と、シリンダへの吸気量を調整する電子スロットル 1 2と、エンジン 1 0および電子スロットル 1 2の作動状態を検出してエンジン 1 0の作動状態に関する各種の情報（以下、外界情報と総称する。）を出力する各種センサ 2 0と、各種センサ 2 0からの外界情報に基づいてエンジン 1 0の燃料噴射量を制御する制御装置 3 0とで構成されている。

各種センサ 2 0は、エンジン 1 0および電子スロヅトル 1 2の作動状態並びに車両の走行状態を検出し、その検出結果に基づいて、エンジン 1 0 の回転数、スロットル開度、スロットル開度の変化率、距離パルスおよび燃料噴射量を外界情報として出力するようになっている。

制御装置 3 0は、反射層 1 0 0、学習層 2 0 0および進化適応層 3 0 0 の 3つの制御層からなり、各種センサ 2 0から外界情報を入力し、入力した外界情報に基づいて反射層 1 0 0で燃料の基本噴射量を決定し、学習層 2 0 0および進化適応層 3 0 0で基本噴射量に対する補正量を決定し、これら基本噴射量および補正量から最終的な燃料噴射量を決定する。以下、反射層 1 0 0、学習層 2 0 0および進化適応層 3 0 0の構成を詳細に説明する。

反射層 1 0 0は、数式、マップ、ニューラルネットワーク、ファジールール、サブサンプシヨンアーキテクチャ等の形式で、基本噴射量および過渡補正率と外界情報との関係を定義付ける基礎制御部 1 1 0を備え、基礎制御部 1 1 0は、各種センサ 2 0から外界情報を入力し、入力した外界情報に基づいて基本噴射量および過渡補正率を決定して出力する。

進化適応層 3 0 0は、対話型評価を繰り返し行いながら G Aにより電子スロットル 1 2の制御特性（レスポンス特性）を最適化する対話型最適化部 3 1 0と、自律型評価を繰り返し行いながら G Aによりエンジン 1 0の制御特性（燃費特性）を最適化する自律型最適化部 3 5 0とで構成されている。

対話型最適化部 3 1 0は、外界情報に基づいて電子スロットル 1 2のバルブ開度を出力する制御モジュールを少なくとも一つ有し、レスポンス度に対する評価をユーザとの対話に基づいて行う対話型評価を繰り返し行いながら、 G Aにより制御モジュールを最適化するように構成されている。自律型最適化部 3 5 0は、外界情報に基づいて、反射層 1 0 0からの基本噴射量および過渡補正率を使用者の希望に沿った値に補正するための補正率（以下、この補正率うち基本噴射量を補正するものを進化補正率といい、過渡補正率を補正するものを進化過渡補正率という。）を出力する制御モジュールを少なくとも一つ有し、 G Aにより制御モジュールを最適化するように構成されている。また、最適制御モジュールを構築した後、自律型最適化部 3 5 0の制御モジュールをその最適制御モジュールに固定し、反射層 1 0 0からの基本噴射量を補正する進化補正率による制御および反射層 1 0 0からの過渡補正率を補正する進化過渡補正率による制御を行う一方、学習層 2 0 0にその最適制御モジュールに関する情報を学習させる。また、最適制御モジュールに関する情報を学習層 2 0 0に学習させた後は、その出力を「1」に戻し、その後は、使用者の指示に応じて作動する。すなわち、自律型最適化部 3 5 0の制御モジュールによる制御が行われるのは、進化シミュレーション中および学習中のみである。学習層 2 0 0は、学習用と実行用とに切換可能な 2つのニューラルネットワークを有する学習部 2 1 0を備え、学習部 2 1 0は、一方の二ユーラルネヅトワーク（実行用）で制御を実行している間、他方のニューラルネットワーク（学習用）で進化適応層 3 0 0から最適制御モジュールに関する入力と出力との関係を学習する。学習用ニューラルネットワークでの学習が終了すると、.制御を実行しているニュ一ラルネヅトワークと学習後のニューラルネヅトワークとを切り換え、学習後のニューラルネヅ卜ワークで学習結果から得られる制御モジュ一ルによる制御を開始し、制御を実行していたニューラルネヅトワークが学習用として機能し始める。なお、学習層 2 0 0におけるニューラルネヅトワークは、初期状態では「 1」を出力するように設定されており、したがって、初期状態では、反射層 1 0 0 と進化適応層 3 0 0とによる制御が行われる。

実行用ニューラルネットワークは、特に図示しないが、さらに、 2つのニューラルネットヮ一クを含んで構成されている。一方のニューラルネヅトワークは、スロットル開度およびエンジン回転数を外界情報として各種センサ 2 0から入力し、その入力情報に基づいて反射層 1 0 0からの基本噴射量を補正するための補正率（以下、この補正率を学習補正率という。）を出力するようになっており、他方のニューラルネットワークは、スロットル開度の変化率およびエンジン回転数を外界情報として各種センサ 2 0から入力し、その入力情報に基づいて反射層 1 0 0からの過渡補正率を補正するための補正率（以下、この補正率を学習過渡補正率という。）を出力するようになっている。この構成は、学習用ニューラルネヅトワークについても同様である。

そして、制御装置 3 0は、学習層 2 0 0からの学習補正率と進化適応層 3 0 0からの進化補正率とを加算し、反射層 1 0 0からの基本噴射量にその加算結果を乗算し、これを第 1の乗算結果とする一方、学習層 2 0 0からの学習過渡補正率と進化適応層 3 0 0からの進化過渡補正率とを加算し、反射層 1 0 0からの過渡補正率にその加算結果を乗算し、これを第 2 の乗算結果とし、第 1の乗算結果に第 2の乗算結果を乗算することにより燃料噴射量を算出する。この燃料噴射量をエンジン 1 0に出力する。次に、対話型最適化部 3 1 0の構成を図 4を参照しながら詳細に説明する。図 4は、対話型最適化部 3 1 0の構成を示すブロック図である。対話型最適化部 3 1 0は、図 4に示すように、使用者との入出力を行うインタ一フェース部 3 2 0と、 G Aによる進化シミュレーシヨンを行ってエンジン 1 0の制御特性を最適化する進化適応部 3 3 0と、 G Aにおける個体の評価値を算出する評価部 3 4 0とで構成されている。

ィン夕一フェース部 3 2 0は、 G Aによる進化シミュレーション中の個体の評価値を表示する表示部 3 2 2と、使用者による評価を入力する入力部 3 2 4どで構成されており、 G Aによる進化シミュレーシヨン中では、各世代ごとに各個体の評価値（後段で詳述するが、レスポンス度）が表示部 3 1 2に表示され、使用者は、乗り心地等の車両の体感をもとに各個体の評価を入力部 3 1 4に入力する。

評価部 3 4 0は、外界情報に基づいてレスポンス度を算出するレスボンス度算出部 3 4 2で構成されている。レスポンス度算出部 3 4 2は、スロットル開度およびエンジン回転数を外界情報として入力し、スロットル開度の変化率およびエンジン回転数の変化率を算出し、エンジン回転数の変化率をスロットル開度の変化率で除算することによりレスポンス度を算出し、算出したレスポンス度を、 G Aにおける個体の評価値として進化適応部 3 3 0に出力するようになっている。

進化適応部 3 3 .0は、制御モジュール 3 3 2を有している。制御モジュール 3 3 2は、例えば、スロヅトル開度とパルプ開度との静特性を示す 2 つの制御係数 S P _{1 3} S P₂、およびスロットル閧度とバルブ開度との動特性を示す 2つの制御係数 D R ( 1次遅れ要素）， A G (不完全微分要素）に基づいて、スロヅトル閧度とバルブ開度との関係を規定し、スロヅトル開度を外界情報として入力し、入力したスロットル開度に基づいてバルブ開度を決定して電子スロットル 1 2に出力するようになっている。

G Aにおける個体の個体情報には、静特性を示す制御係数 S P _{1 3} S P ₂、および動特性を示す 2つの制御係数 D R , A Gを割り当てる。具体的には、図 5に示すように割り当てられている。図 5は、個体情報のデ一夕構造を示す図である。

G Aにおける個体の個体情報は、静特性を示す制御係数 S P ₁₃ S P ₂を上位側に、動特性を示す 2つの制御係数 D R， A Gを下位側にそれぞれ割り当てることにより構成されている。例えば、一つの制御係数が 1 6ビヅトのデ一夕で構成されていれば、個体情報は、全体で 6 4ビットのデータとなる。また、進化シミュレーションを開始する際に生成する初期の個体情報は、各個体ごとに乱数により決定する。その際、レスポンス度をある程度保証するために、乱数の発生範囲を所定範囲に制限するのが好ましい。すなわち、レスポンス度が明らかに悪くなるような範囲には、乱数を発生させないようにする。

次に、進化適応部 3 3 0で実行される処理を図 6を参照しながら詳細に説明する。図 6は、進化適応部 3 3 0で実行される処理を示すフローチヤ —トである。 G Aは、各個体にランダムな初期値を与えて探索空間内に配置し、世代ごとに交叉、突然変異と呼ばれる遺伝的操作を適用し、個体の評価値に応じて個体の増殖および選択を行うことにより、次世代の個体の集合を得るこのような世代交代を繰り返すことにより、漸近的に最適解に近づくことを目的とする。以下、遺伝的操作である交叉、突然変異、選択について説明する。

交叉とは、少なくとも 2つの個体を親とし、親となる個体の個体情報の一部を入れ替えることにより、子孫となる個体を 1以上生成する操作である。ある個体の個体情報のよい部分と別の個体の個体情報のよい部分を合体させることにより、より評価値の髙ぃ個体を得ることが期待できる。例えば、 2つの個体を親として子孫となる 2つの個体を生成する場合、一方の親となる個体の個体情報を「000110」、他方の親となる個体の個体情報を「110111」とし、 3番目の位置で交叉させることにより、「000111」の個体情報をもつ個体と、「110110」の個体情報をもつ個体とを子孫となる個体.として得る。

突然変異とは、所定の確率で個体の個体情報のうち特定部分を変更する操作であり、個体群内での多様性を増加させる。具体的には、個体情報の特定のビットを反転させる操作であり、例えば、ある個体の個体情報を「000111」とし、その 3番目の位置で突然変異を起こすことにより、「001111」の個体情報をもつ個体を得る。

選択とは、個体の評価値に応じて個体群のなかのよりよい個体を次世代に残すための操作である。ル一レツト選択と呼ばれる選択方法では、各個体は評価値に比例した確率で選択される。例えば、ある世代において、「000000」、「111011」、「110111」、「010111」の個体情報をもつ個体の評価値がそれぞれ「8」、「4」、「2」、「2」であったとする。それそれの個体が選択される確率は、「8 / 1 6」、「4 / 1 6」、「2 1 6」、「2 / 1 6」となる。したがって、平均的には、次世代において、「000000」の個体情報をもつ個体は 2つに増え、「111011」の個体情報をもつ個体は一つのままで、「110111」の個体情報をもつ個体または「010111」の個体情報をもつ個体はいずれかが残るような個体群が得られる。もっとも、進化適応部 3 3 0においては、個体の選択を使用者の選択により行う。

以上のことをふまえて、進化適応部 3 3 0で実行される処理を説明する _c なお、図 6のフローチャートに示す処理は、例えば、 R O Mにあらかじめ格納されているプログラムを読み出し、読み出したプログラムに従って C P Uが実行する。

まず、ステップ S 1 0 0に移行して、進化シミュレーションを開始する指示である進化開始指示を入力部 3 2 2から入力したか否かを判定し、進化開始指示を入力したと判定したとき（Yes)は、ステップ S 1 0 2に移行するが、そうでないと判定したとき（No)は、進化開始指示を入力するまでステップ S 1 0 0で待機する。

ステップ S 1 0 2では、所定数（例えば、 9個）の個体の集合からなる個体群を仮想的に生成するとともに各個体ごとに個体情報を構成する。ここで、各個体情報には、静特性を示す制御係数 S P !, S P ₂および動特性を示す 2つの制御係数 D R， A Gを割り当て、各個体の個体情報を乱数により決定する。このとき、個体情報のすべての値が「0」となる個体を一つ生成することで、進化の過程で進化前のレスポンス性能を下回らないようにすることができる。なお、各個体の個体情報は、 R A M等の記憶装置上に格納され管理される。

次いで、ステップ S 1 0 4に移行して、個体群のうち先頭の個体の個体情報を読み出し、ステップ S 1 0 6に移行して、読み出した個体情報に基づいて制御モジュール 3 3 2を構築し、構築した制御モジュール 3 3 2により電子スロットル 1 2の制御を開始する。

次いで、ステップ S 1 0 8に移行して、レスポンス度を評価部 3 4 0から取得する。ここで、個体情報に基づいて制御モジュール 3 3 2を構築し、構築した制御モジュール 3 3 2により電子スロヅトル 1 2の制御を開始し、その結果得られたレスポンス度は、その個体に対する評価値とする。この評価値が高いほど、すなわち、 G Aによる進化シミュレーションにおいて優秀な個体であると位置付けることができる。

次いで、ステップ S 1 1 0に移行して、個体群のすべての個体についてステップ S 1 0 6から S 1 0 8までの処理が終了したか否かを判定し、すベての個体について処理が終了したと判定したとき（Yes)は、ステップ S 1 1 2に移行する。

ステップ S 1 1 2では、各個体ごとにその評価値であるレスポンス度を表示部 3 2 4に表示し、ステップ S 1 1 4に移行して、使用者による評価を入力部 3 2 2から入力する。個体群のすべての個体に対する評価の表示が終了すると、制御は一度評価モードに入る。評価モードでは、使用者が表示部 3 2 4に表示された評価を見て試走してみたい特性の個体を選択すると、使用者により選択された個体の個体情報に基づいて制御モジュ一ル 3 3 2を構築して一時的に固定し、その制御モジュール 3 3 2による制御を行う。これにより、使用者は、表示部 3 2 4に表示された各個体の特性を、実際に走行した乗り心地等から判定し、各個体の評価値を乗り心地から評価する。そして、ステップ S 1 1 6に移行して、使用者は、表示部 3 2 4に表現された個体の評価と、実際に走行した時の乗り心地とに基づく各個体の評価を終了した段階で、制御を淘汰モードに切り換え、個体群における個体の生存または淘汰を行う。個体の生存または淘汰は、例えば、入力部 3 2 2で淘汰モードに切り換え、表示画面を参照しながら、個体群のなかから使用者の好みの特性を持つ個体を幾つか選択し、選択した個体を残し、それ以外の個体を消去することにより行う。

次いで、ステップ S 1 1 8に移行して、 G Aにおける個体の交叉を行う交叉処理を実行する。具体的に、ステップ S 1 1 8では、使用者により選択された個体群のなかから乱数を用いて 2個の親個体を選択し、これらに交叉を施して 2個の子個体を生成する。この処理を 5回行うことにより、再び、 9個の子個体からなる個体群を生成する（ 1 0番目の子個体は破棄する）。交叉処理には、例えば、上記の 1点交叉処理のほかに、 2点交叉処理または正規分布交叉処理等を採用することができる。正規分布交叉処理とは、実数値表現の個体情報について、両親個体を結ぶ軸に対して回転対称な正規分布にしたがって子個体を生成する処理である。正規分布の標準偏差は、両親個体を結ぶ主軸方向の成分については両親個体間の距離に比例させ、その他の軸の成分については両親個体を結ぶ直線と個体群のなかからサンプルした第 3の親個体との距離に比例させる。この交叉方法は、親個体の特質が子個体に引き継がれやすいという利点がある。

次いで、ステップ S 1 2 0に移行して、 G Aにおける個体の突然変異を行う突然変異処理を実行し、ステップ S 1 2 2に移行して、入力部 3 2 2 からの入力により使用者が満足する特性が得られたか否かを判定し、使用者が満足する特性が得られないと判定したとき（No)は、ステップ S 1 2 4 に移行して、世代交代数が所定回数以上であるか否かを判定し、所定回数以上であると判定したとき（Yes)は、ステップ S 1 2 6に移行する。

ステヅプ S 1 2 6では、進化シミュレーションを開始すべき進化開始要求を自律型最適化部 3 5 0に出力し、ステップ S 1 2 8に移行して、個体群のなかから評価値が最も高い個体を抽出し、抽出した個体の評価値であるレスポンス度を基準として所定範囲を、レスポンス度の制限範囲として自律型最適化部 3 5 0に出力し、一連の処理を終了して元の処理に復帰させる。一方、ステップ S 1 2 4で、世代交代数が所定回数未満であると判定したとき（Yes )は、ステヅプ S 1 0 4に移行する。

一方、ステップ S 1 2 2で、使用者が満足する特性が得られたと判定したとき（Yes )は、ステップ S 1 2 6に移行する。

一方、ステヅプ S 1 1 0で、個体群のすべての個体についてステップ S 1 0 6から S 1 0 8までの処理が終了していないと判定したとき（No )は、ステップ S 1 3 0に移行して、個体群のうち次の個体の個体情報を読み出し、ステップ S 1 0 6に移行する。

次に、自律型最適化部 3 5 0の構成を図 7を参照しながら詳細に説明する。図 7は、自律型最適化部 3 5 0の構成を示すブロック図である。自律型最適化部 3 5 0は、図 7に示すように、 G Aによる進化シミュレーシヨンを行ってエンジン 1 0の制御特性を最適化する進化適応部 3 6 0と、 G Aにおける個体の評価値を算出する評価部 3 7 0とで構成されている。

評価部 3 7 0は、燃料噴射量および距離パルスに基づいてエンジン 1 0 の燃費を算出する燃費算出部 3 7 2と、スロットル開度およびエンジン回転数に基づいてレスポンス度を算出するレスポンス度算出部 3 7 4とで構成されている。

燃費算出部 3 7 2は、料噴射量および距離パルスを外界情報として入力し、所定距離走行するごとに入力される距離パルスの入力間隔で噴出量を総和して燃費として算出し、算出した燃費を、 G Aにおける個体の第 1 評価値として進化適応部 3 6 0に出力するようになっている。レスポンス度算出部 3 7 4は、スロットル開度およびエンジン回転数を外界情報として入力し、スロットル開度の変化率およびエンジン回転数の変化率を算出し、エンジン回転数の変化率をスロットル開度の変化率で除算することによりレスポンス度を算出し、算出したレスポンス度を、 G Aにおける個体の第 2評価値として進化適応部 3 6 0に出力するようになっている。進化適応部 3 6 0は、制御モジュール 3 6 2を有し、制御モジュール 3 6 2は、さらに、 2つのニューラルネヅトワークを含んで構成されている。一方のニューラルネヅトワーク 3 6 2 aは、スロヅトル開度およびェンジン回転数を外界情報として各種センサ 2 0から入力し、その入力情報に基づいて進化補正率を出力するようになっており、他方のニューラルネットワーク 3 6 2 bは、スロヅトル開度の変化率およびエンジン回転数を外界情報として各種センサ 2 0から入力し、その入力情報に基づいて進化過渡補正率を出力するようになっている。

G Aにおける個体の個体情報には、ニューラルネットワーク 3 6 2 a， 3 6 2 bにおけるシナプスの結合係数を割り当てる。具体的には、図 8に示すように割り当てられている。図 8は、ニューラルネヅトワーク 3 6 2 a , 3 6 2 bの構成および個体情報のデータ構造を示す図である。 . ニューラルネットワーク 3 6 2 aは、スロットル開度を入力する入力層： _uと、エンジン回転数を入力する入力層 f _i2と、入力層 f u , ： f _i2からの出力を入力する中間層 f _hl, f _h2と、中間層 f _hl , f _h2の出力を入力して進化補正率を出力する出力層: f _Qlとの 5つのパーセプトロンから構成されている。そして、入力層 f uと中間層 f _hlとは結合係数 k_flのシナプスにより、入力層 f _i2と中間層 f _hlは結合係数 k_f2のシナプスにより、中間層 f _hlと出力層: ί ₀₁とは結合係数 k_i3のシナプスにより、入力層 f uと中間層 f _h2とは結合係数 k_f4のシナプスにより、入力層 f _i2と中間層 f _h2とは結合係数 k_f5 のシナプスにより、中間層 f _h2と出力層 f。₂とは結合係数 k_f6のシナプスによりそれぞれ結合されている。

ニューラルネットワーク 3 6 2 bは、スロットル開度の変化率を入力する入力層 a _uと、エンジン回転数を入力する入力層 a _i2と、入力層 a _{il 3} a _i2からの出力を入力する中間層 a_hl, a_h2と、中間層 a_hl, a_h2の出力を入力して進化過渡補正率を出力する出力層 a_clとの 5つのパーセプトロンから構成されている。そして、入力層 a _uと中間層 a_hlとは結合係数 k_alのシナブスにより、入力層 a _i2と中間層 a_hlは結合係数 k_a2のシナプスにより、中間層 a_hlと出力層 a とは結合係数 k_a3のシナプスにより、入力層 a _uと中間層 a_h2とは結合係数 k_a4のシナプスにより、入力層 a _i2と中間層 a_h2とは結合係数 k_a5のシナプスにより、中間層 a_h2と出力層 a。₂とは結合係数 k_a6 のシナプスによりそれぞれ結合されている。

そして、 G Aにおける個体の個体情報は、シナプスの結合係数 k_fl〜k _f6を上位側に、シナプスの結合係数 k _al〜 k _a6を下位側にそれぞれ連続して割り当てることにより構成されている。例えば、一つの結合係数が 8ビヅトのデ一夕で構成されていれば、個体情報は、全体で 9 6ビヅトのデ一夕となる。また、進化シミュレーションを開始する際に生成する初期の個体情報は、各個体ごとに乱数により決定する。その際、レスポンス度をある程度保証するために、乱数の発生範囲を所定範囲に制限するのが好ましいすなわち、レスポンス度が明らかに悪くなるような範囲には、乱数を発生させないようにする。

次に、進化適応部 3 6 0で実行される処理を図 9を参照しながら詳細に説明する。図 9は、進化適応部 3 .6 0で実行される処理を示すフローチヤ —トである。なお、図 9のフローチャートに示す処理は、例えば、 R O M にあらかじめ格納されているプログラムを読み出し、読み出したプログラムに従って C P Uが実行する。

まず、ステップ S 2 0 0に移行して、進化開始要求を対話型最適化部 3 1 0から入力したか否かを判定し、進化開始要求を入力したと判定したとき（Yes)は、ステップ S 2 0 2に移行するが、そうでないと判定したとき (No)は、進化開始要求を入力するまでステップ S 2 0 0で待機する。ステップ S 2 0 2では、レスポンス度の制限範囲を対話型最適化部 3 1 0から入力し、ステップ S 2 0 4に移行して、所定数（例えば、 9個）の個体の集合からなる個体群を仮想的に生成するとともに各個体ごとに個体情報を構成する。ここで、各個体情報には、ニューラルネットワーク 3 6 2 a , 3 6 2 bにおけるシナプスの結合係数を割り当て、各個体の個体情報を乱数により決定する。このとき、個体情報のすべての値が「0」となる個体を一つ生成することで、進化の過程で進化前のレスポンス性能を下回らないようにすることができる。なお、各個体の個体情報は、 R A M 等の記憶装置上に格納され管理される。

次いで、ステップ S 2 0 6に移行して、個体群のうち先頭の個体の個体情報を読み出し、ステップ S 2 0 8に移行して、読み出した個体情報に基づいてニューラルネヅトワーク 3 6 2 a， 3 6 2 bの結合状態を決定して制御モジュール 3 6 2を構築し、構築した制御モジュール 3 6 2によりェンジン 1 0の制御を開始する。このとき、自律型最適化部 3 5 0からの出力は、スロットル開度、スロットル開度の変化率およびエンジン回転数をニューラルネヅトワーク 3 6 2 a , 3 6 2 bに入力し、さらにその出力を下式（ 1 ) により線形変換することにより算出する。また、スロットル開度、スロットル開度の変化率およびエンジン回転数の入力情報は、それぞれを正規化したものを用いる。下式（ 1 ) において、 Yは進化補正率または進化過渡補正率であり、 Xはニューラルネヅトワーク 3 6 2 a , 3 6 2 bの出力であり、 Gは所定のゲインである。

Y = 2 x Gx - G ... ( 1 ) このように、ニューラルネットワーク 3 6 2 a , 3 6 2 bの出力 xを線形変換して用いることにより、自律型最適化部 3 5 0から出力される進化補正率または進化過渡補正率の値が極端に大きくなることがなく、全体として進化シミュレーションが少しずつ進行するようになり、エンジン 1 0 の挙動が評価や進化シミユレ一ションのために極端に変動することがなくなる。

次いで、ステップ S 2 1 0に移行して、燃費およびレスポンス度を評価部 3 7 0から取得する。ここで、個体情報に基づいて制御モジュール 3 6 2を構築し、構築した制御モジュール 3 6 2によりエンジン 1 0の制御を開始し、その結果得られた燃費およびレスポンス度は、その個体に対する評価値とする。この評価値が高いほど、すなわち、第 1評価値である燃費については、小さければ小さいほど、第 2評価値であるレスポンス度については、高ければ高いほど、 G Aによる進化シミュレーションにおいて優秀な個体であると位置付けることができる。

'次いで、ステップ S 2 1 2に移行して、個体群のすべての個体についてステップ S 2 0 &から S 2 1 0までの処理が終了したか否かを判定し、すベての個体について処理が終了したと判定したとき（Yes )は、ステヅプ S 2 1 4に移行する。

ステップ S 2 1 4では、各個体ごとにその第 2評価値であるレスポンス度が、ステップ S 2 0 2で入力したレスポンス度の制限範囲内に属しているか否かを判定し、レスポンス度が制限範囲内に属していないと判定したとき（No)は、ステップ S 2 1 6に移行して、その個体を淘汰し、ステップ S 2 1 8に移行する。

ステップ S 2 1 8では、個体群のすべての個体についてステヅプ S 2 0 8から S 2 1 0までの処理が終了したか否かを判定し、すべての個体について処理が終了したと判定したとき（Yes)は、ステップ S 2 2 0に移行するが、そうでないと判定したとき（No)は、ステップ S 2 1 4に移行する。ステヅプ S 2 2 0では、ステップ S 2 1 4〜 S 2 1 8の処理により、レスポンス度が制限範囲内に属している個体群が形成されるが、この処理によつて所定数（例えば、半数）以上の個体が淘汰されないときは、さらに、個体群の総数が元の数の半数以下となるように個体の生存または淘汰を行う選択処理を実行する。選択処理としては、例えば、上記のルーレツト選択処理のほかに、エリート優先選択処理または下位適応度単純淘汰処理等を採用することができる。

次いで、ステップ S 2 2 2に移行して、 G Aにおける個体の交叉を行う交叉処理を実行し、ステップ S 2 2 4に移行して、 G Aにおける個体の突然変異を行う突然変異処理を実行し、ステップ S 2 2 6に移行して、世代交代数が所定回数以上であるか否かを判定し、所定回数以上であると判定したとき（Yes )は、ステップ S 2 2 8に移行する。

ステップ S 2 2 8では、個体群のなかから評価値が最も高い個体を抽出し、抽出した個体の個体情報に基づいて最適制御モジュールを構築し、制御モジュール 3 6 2を最適制御モジュールに固定し、ステップ S 2 3 0に移行して、制御モジュール 3 6 2の入出力関係を学習層 2 0 0に学習させ、ステップ S 2 3 2に移行して、制御モジュール 3 6 2の出力を「 1」に設定し、一連の処理を終了して元の処理に復帰させる。

一方、ステヅプ S 2 2 6で、世代交代数が所定回数未満であると判定したとき（Yes )は、ステップ S 2 0 6に移行する。

一方、ステップ S 2 1 2で、個体群のすべての個体についてステップ S 2 0 8から S 2 1 0までの処理が終了していないと判定したとき（No )は、ステップ S 2 3 4に移行して、個体群のうち次の個体の個体情報を読み出し、ステップ S 2 0 8に移行する。

次に、上記実施の形態の動作を図面を参照しながら説明する。

エンジン 1 0および電子スロットル 1 2の制御特性を使用者向けに最適化するには、使用者は、まず、進化開始指示を入力部 3 2 2に入力する。対話型最適化部 3 1 0では、使用者から.進化開始指示を入力すると、ステツプ S I 0 0 , S I 0 2を経て、 9個の個体の集合からなる個体群が生成されるとともに各個体ごとに個体情報が構成される。ここで、個体情報には、静特性を示す制御係数 S P ₁₃ S P₂および動特性を示す 2つの制御係数 D R , A Gが割り当てられる。

個体群が生成されると、第 1世代目の進化シミュレーションが開始される。第 1世代目の進化シミュレーションでは、まず、ステップ S 1 0 4を経て、個体群のうち先頭の個体の個体情報が読み出され、読み出された個体情報に基づいて制御モジュール 3 3 2が構築され、構築された制御 ΐジユール 3 3 2により電子スロヅトル 1 2の制御が開始され、しばらくの間その制御モジュール 3 3 2による制御が行われる。その間、ステヅプ S 1 0 8を経て、レスポンス度が評価部 3 4 0から取得される。

これと同じ要領で、ステップ S 1 0 6から S 1 0 8までの処理が個体群のすベての個体について終了すると、ステップ S 1 1 2を経て、各個体ごとにその評価値であるレスポンス度が表示部 3 2 4に表示される。ここで、使用者は、表示部 3 2 4に表示された各個体の評価を参照しながら、個体群のなかから自己の好みの特性を持つ個体を幾つか選択する。使用者により個体の選択が行われると、ステップ S 1 1 6を経て、個体群のうち選択された個体が残され、それ以外の個体が消去されることにより個体の生存または淘汰が行われる。

次いで、ステップ S 1 1 8 , S 1 2 0を経て、交叉処理および突然変異処理が行われる。ここまでの処理を経て、第 1世代目の進化シミュレーシヨンが終了する。その後は、これと同じ要領で、使用者が満足する特性が得られるかまたは世代交代数が所定回数以上となるまで、進化シミュレ一シヨンが繰り返し行われる。その結果、図 1 0に示すように、レスポンス特性が使用者向けに最適化される。図 1 0の例では、制限範囲の中心付近に位置する点がそれである。図 1 0は、エンジン 1 0および電子スロヅトル 1 2の制御特性を最適化する順序を示す図である。

次いで、進化シミュレーションが完了すると、ステップ S 1 2 6 , S 1 2 8を経て、進化開始要求が自律型最適化部 3 5 0に出力され、個体群のなかから評価値が最も高い個体が抽出され、抽出された個体の評価値であるレスポンス度を基準として所定範囲が、レスポンス度の制限範囲として自律型最適化部 3 5 0に出力される。

自律型最適化部 3 5 0では、進化開始要求を入力すると、ステップ S 2 0 0〜S 2 0 4を経て、レスポンス度の制限範囲を入力し、 9個の個体の集合からなる個体群が生成されるとともに各個体ごとに個体情報が構成される。ここで、個体情報には、ニューラルネヅトワーク 3 6 2 a , 3 6 2 bにおけるシナプスの結合係数が割り当てられる。

個体群が生成されると、第 1世代目の進化シミュレ一シヨンが開始される。第 1世代目の進化シミュレーションでは、まず、ステップ S 2 0 6 , S 2 0 8を経て、個体群のうち先頭の個体の個体情報が読み出され、読み出された個体情報に基づいて制御モジュール 3 6 2が構築され、構築された制御モジュール 3 6 2によりエンジン 1 0の制御が開始され、しばらくの間その制御モジュール 3 6 2による制御が行われる。その間、ステップ S 2 1 0を経て、燃費およびレスポンス度が評価部 3 7 0から取得される _c これと同じ要領で、ステップ S 2 0 8から S 2 1 0までの処理が個体群のすベての個体について終了すると、ステップ S 2 1 4を経て、各個体ごとにその第 2評価値であるレスポンス度が、ステップ S 2 0 2で入力したレスポンス度の制限範囲内に属しているか否かが判定される。その結果、レスポンス度の制限範囲内に属していない個体については、ステップ S 2 1 6を絰て淘汰される。これにより、レスポンス度が制限範囲内に属している個体のみが次世代の個体を生成する親個体の候補として生存することとなる。次いで、ステップ S 2 2 0〜S 2 2 4を経て、選択処理、交叉処理および突然変異処理が行われる。ここまでの処理を経て、第 1世代目の進化シミュレ一シヨンが終了する。その後は、これと同じ要領で、世代交代数が所定回数以上となるまで、進化シミュレーションが繰り返し行われる。その結果、図 1 0に示すように、レスポンス度が制限範囲内に属するように燃費特性が自律的に最適化される。図 1 0の例では、制限範囲内であって燃費特性とレスポンス特性の最大曲線（波線）上に位置する点がそれであ次いで、進化シミュレーションが完了すると、ステップ S 2 2 8を経て、個体群のなかから評価値が最も高い個体が抽出され、抽出された個体の個体情報に基づいて最適制御モジュールが構築され、制御モジュール 3 6 2 が最適制御モジュールに固定される。

次いで、ステップ S 2 3 0を経て、制御モジュール 3 6 2の入出力関係が学習層 2 0 0に学習させられる。この学習では、まず、最適制御モジュールにより得られる実際のエンジン回転数等の入力情報に対する進化補正率および進化過渡補正率による制御を行う。自律型最適化部 3 5 0が進化補正率および進化過渡補正率による制御を実行し始めると、学習層 2 0 0の学習用ニューラルネヅトワークは、制御モジュール 3 6 2の入出関係を、学習層 2 0 0の実行用として機能しているニューラルネヅトワークの入出関係と合わせて学習する。この間、自律型最適化部 3 5 0の出力は、それ以前の評価関数を最大とした個体により行われ、制御則が時間的に変化することはない。前記した学習では、自律型最適化部 3 5 0と学習層 2 0 0の実行用ニューラルネットワークとの入出力を、あるステップ幅で平均化し、これを入出力デ一夕として教師デ一夕集合の更新に用いる。例えば、 1秒間の平均エンジン回転数が 5 0 0 0 [ r p m]、平均スロットル開度が 2 0、平均吸気温度が 2 8 [V]、平均大気圧が 1 0 1 3 [ h P a ] であった場合、これらと、その時の自律型最適化部 3 5 0および学習層 2 0 0における実行用ニューラルネットワークの出力を加算したものを入出力デ一夕として用いる（図 1 1参照）。この入出力デ一夕を、以前の教師デ一夕に加えて新しい教師デ一夕集合を得る。このとき、教師データ集合における新しいデータとのュ一クリツド距離が一定値以内の古い教師データは消去する。この様子を図 1 2に示す。また、教師データ集合の初期値は、すべての入力デ一夕に対して出力を「 1」にしておく。学習層 2 0 0では、更新された教師デ一夕集合に基づいて、学習用ニューラルネヅトワークにおけるシナプスの結合係数の学習を行う。結合係数の学習は、学習中の学習用ニューラルネットワークの出力と反射層 1 0 0からの基本噴射量および過渡補正率とから得られる仮想制御出力と、実際の制御出力との間の誤差がしきい値以下になるまで行われ、この学習が終わると、学習用のニューラルネットワークは実行用になり、もとの制御用のニューラルネットワークが学習用となる。この後、学習層 2 0 0は、新しく得られた実行用のニューラルネットワークにより学習補正率および学習過渡補正率を決定して実際に出力し、同時に、ステヅプ S 2 3 2を経て、制御モジュール 3 6 2の出力は「 1」になり、学習層 2 0 0と反射層 1 0 0とによる制御が行われる。また、学習層 2 0 0の実行用のニュ一ラルネヅトワークの初期値は、出力が常に「1」になるように設定しておく。こうすることで、初期状態においては、反射層 1 0 0と自律型最適化部 3 5 0のみで制御を行うようにできる。

このようにして、本実施の形態では、レスポンス特性を制御する対話型最適化部 3 1 0と、燃費特性を制御する自律型最適化部 3 5 0とを備え、対話型最適化部 3 1 0については、対話型最適化部 3 1 0の制御特性に影響を及ぼす制御係数を入力としてレスポンス度を出力するレスポンス度算出部 3 4 2を用いて、レスポンス度算出部 3 4 2のレスポンス度を対話型評価により繰り返し評価しながら、レスポンス度算出部 3 4 2の最適解を G Aにより探索するようになっており、自律型最適化部 3 5 0については、自律型最適化部 3 5 0の制御特性に影響を及ぼす制御係数を入力として燃費を出力する燃費算出部 3 7 2を用いて、対話型最適化部 3 1 0の最適化で最適解として探索した解から求まるレスポンス度を基準として所定範囲内にレスポンス度が属するように、燃費算出部 3 7 2の燃費を自律型評価により繰り返し評価しながら、燃費算出部 3 7 2の最適解を G Aにより探索するようになっている。

これにより、従来に比して、使用者の希望に比較的沿ったレスポンス度となるような制御係数を探索することができ、しかも最適化に要する時間を比較的短縮することができる。特に、対話型最適化部 3 1 0について最適化が完了した後は、レスポンス度をさほど損なうことなく、自律型最適化部 3 5 0の最適化を比較的高速に行うことができる。

さらに、本実施の形態では、対話型最適化部 3 1 0の評価の対象がレスポンス度であり、自律型最適化部 3 5 0の評価の対象が燃費である。これにより、エンジン 1 0の制御特性のうちレスポンス特性を使用者向けに、燃費特性を所定の評価基準に従ってそれぞれ最適化することができる。

さらに、本実施の形態では、エンジン 1 0の燃料噴射量の補正率または過渡補正率の補正率をニュ一ラルネヅトワーク 3 6 2 a , 3 6 2 bにより生成するようになっており、個体情報には、ニューラルネヅトワーク 3 6 2 a , 3 6 2 bにおけるシナプスの結合係数を割り当てるようになつている ο

これにより、高い評価値を得ることが期待できる、ニューラルネヅトヮ —ク 3 6 2 a , 3 6 2 bにおけるシナプスの結合係数を決定することができる。上記実施の形態において、 G Aは、請求の範囲第 1、第 3ないし第 5、第 7、第 8、第 1 0若しくは第 1 2項記載の最適化アルゴリズム、または請求の範囲第 8項記載の進化型最適化アルゴリズムに対応し、ニューラルネットワーク 3 6 2 a , 3 6 2 bにおけるシナプスの結合係数は、請求の範囲第 3、第 5、第 8または第 1 0項記載の制御係数に対応している。また、 R A Mは、請求の範囲第 2または第 4項記載の記憶手段に対応し、評価部 3 4 0， 3 7 0は、請求の範囲第 2、第 4または第 8項記載の評価値算出手段に対応し、入力部 3 2 2は、請求の範囲第 2または第 4項記載の評価入力手段に対応し、エンジン 1 0および電子スロヅトル 1 2は、請求の範囲第 3ないし第 5、第 7、第 8または第 1 0項記載の制御対象に対応している。

また、上記実施の形態において、対話型最適化部 3 1 0は、請求の範囲第 5項記載の第 1制御系に対応し、自律型最適化部 3 5 0は、請求の範囲第 5項記載の第 2制御系に対応し、レスポンス度算出部 3 4 2は、請求の範囲第 5または第 7項記載の第 1評価関数に対応し、燃費算出部 3 7 2は、請求の範囲第 5または第 7項記載の第 2評価関数に対応している。また、ステップ S 1 1 8， S 1 2 0 , S 2 2 2 , S 2 2 4は、請求の範囲第 8項記載の個体情報操作手段に対応し、ステップ S 1 1 6 , S 2 1 4〜S 2 2 0は、請求の範囲第 8項記載の個体選択手段に対応している。

なお、上記実施の形態においては、対話型評価を繰り返し行いながらレスポンス特性を最適化した後に、レスポンス度の制限範囲を設定し、自律型評価を繰り返し行いながら、レスポンス度が制限範囲内に属するように燃費特性を最適化するように構成したが、これに限らず、自律型評価を繰り返し行いながら燃費特性を最適化した後に、燃費特性に制限範囲を設定し、対話型評価を繰り返し行いながら、燃費が制限範囲内に属するようにレスポンス特性を最適化するように構成してもよい。もちろん、このように順番に行うに限らず、少しずつ交互に行うようにしてもよいし、並列に行うようにしてもよい。

また、上記実施の形態においては、制御装置 3 0の制御対象として車両用エンジン 1 0を適用しているが、制御装置 3 0の制御対象は本実施の形態に限定されることなく任意のものでよく、例えば、車体のサスペンションゃシートのダンパー特性の制御または、電気モー夕やエンジンを補助動力とする自転車或いは車イスにおける補助動力のアシスト特性、またはパ一ソナルロボットの動作特性（きびきびした動作やのんびりした動作）の制御に適用してもよい。

また、本実施の形態においては、制御出力として燃料噴射量を取り扱つているが、制御対象としてエンジン 1 0を適用する場合、制御出力としては、その他に、例えば、噴射時間、点火時期、吸気バルブタイミング、電子スロットル開度、バルブリフト量、排気バルブタイミング、または吸排気制御用バルブタイミング等が考えられる。ここで、吸気制御用バルブとは、タンブルおよびスワールの制御を行うために吸気管に設けられるバルブであり、また、排気制御バルブとは、排気脈動を制御するために排気管に設けられるバルブである。

また、本実施の形態においては、学習層 2 0 0を階層型ニューラルネヅトヮ一クで構成しているが、学習層 2 0 0の制御系の構成は本実施例に限定されることなく、例えば、 C M A Cを用いてもよい。 C MA Cを用いる利点としては、階層型ニューラルネットワークに比べて、追加学習の能力が優れていること、学習が高速である等が挙げられる。

また、上記実施の形態においては、エンジン 1 0の燃料噴射量の補正率または過渡補正率の補正率をニューラルネヅトワーク 3 6 2 a , 3 6 2 b により生成するようになっており、個体情報には、ニューラルネットヮ一ク 3 6 2 a , 3 6 2 bにおけるシナプスの結合係数を割り当てるように構成したが、これに限らず、個体情報には、エンジン 10の燃料噴射量の補正率または過渡補正率の補正率を直接割り当てるように構成してもよい。これにより、高い評価値を得ることが期待できる、エンジン 10の燃料噴射量の補正率または過渡補正率の補正率を決定することができる。また、上記実施の形態においては、エンジン 10の燃料噴射量の補正率または過渡補正率の補正率をニューラルネヅトワーク 362 a, 362b により生成するように構成したが、これに限らず、エンジン 10の燃料噴射量、過渡補正量、燃料噴射量の補正量または過渡補正量の補正量をニュ一ラルネヅトワーク 362 a, 362 bにより生成するように構成してもよい。このことは、ニューラルネットワーク 362 a, 362 bにより生成せずに直接算出する構成についても同じである。

また、上記実施の形態においては、エンジン 10の燃費特性およびレスポンス特性を最適化するのに GAを用いたが、これに限らず、 GPや ES 等の進化的アルゴリズムを用いることもできる。

また、上記実施の形態において、図 6および図 9のフローチャートに示す処理を実行するにあたっては、 ROMにあらかじめ格納されているプログラムを実行する場合について説明したが、これに限らず、これらの手順を示したプログラムが記録された記録媒体から、そのプログラムを RAM に読み込んで実行するようにしてもよい。

ここで、記録媒体とは、 RAM、 ROM等の半導体記録媒体、 FD、 H D等の磁気記録型記録媒体、 CD、 CD V, LD、 DVD等の光学的読取方式記録媒体、 MO等の磁気記録型/光学的読取方式記録媒体であって、電子的、磁気的、光学的等の読み取り方法のいかんにかかわらず、コンビュ一夕で読み取り可能な記録媒体であれば、あらゆる記録媒体を含むものである。産業上の利用可能性

以上説明したように、本発明に係る請求の範囲第 1または第 2項記載の最適解探索装置によれば、従来に比して、使用者の希望に比較的沿った解を探索することができ、しかも最適化に要する時間を比較的短縮することができるという効果が得られる。

一方、本発明に係る請求の範囲第 3ないし第 1 1項記載の最適化ァルゴリズムによる制御対象の制御装置によれば、従来に比して、使用者の希望に比較的沿った解を探索することができ、しかも最適化に要する時間を比較的短縮することができるという効果が得られる。

さらに、本発明に係る請求の範囲 5項記載の最適化アルゴリズムによる制御対象の制御装置によれば、第 1制御系について最適化が完了した後は、第 1評価関数の最適な評価値として得られた評価値をさほど損なうことなく、第 2制御系の最適化を比較的高速に行うことができるという効果も得られる。

さらに、本発明に係る請求の範囲 6項記載の最適化アルゴリズムによる制御対象の制御装置によれば、第 1制御系の最適化を比較的高速に行うことができるとともに、第 1制御系について最適化が完了した後は、第 1評価関数の最適な評価値として得られた評価値をさほど損なうことなく、第 2制御系を最適化することができるという効果も得られる。

さらに、本発明に係る請求の範囲 Ί項記載の最適化ァルゴリズムによる制御対象の制御装置によれば、エンジンの制御特性のうちレスポンス特性を使用者向けに、燃費特性を所定の評価基準に従ってそれぞれ最適化することができるという効果も得られる。

さらに、本発明に係る請求の範囲 9項記載の最適化ァルゴリズムによる制御対象の制御装置によれば、高い評価値を得ることが期待できる、燃料噴射量、過渡補正量、燃料噴射量の補正値または過渡補正量の補正値を決定することができるという効果も得られる。

さらに、本発明に係る請求の範囲 1 0項記載の最適化アルゴリズムによる制御対象の制御装置によれば、高い評価値を得ることが期待できる、二ユーラルネヅトワークにおけるシナプスの結合係数を決定することができるという効果も得られる。

さらに、本発明に係る請求の範囲 1 1項記載の最適化アルゴリズムによる制御対象の制御装置によれば、電気モ一夕の制御特性のうち回転変化特性を使用者向けに、電力消費特性を所定の評価基準に従ってそれぞれ最適化することができるという効果も得られる。

一方、本発明に係る請求の範囲 1 2項記載の最適解探索プログラムによれば、請求の範囲第 1記載の最適解探索装置と同等の効果が得られる。

Claims

請求の範囲

1 . 評価関数の出力を繰り返し評価しながら前記評価関数の最適解を最適化アルゴリズムにより探索する装置であって、

前記評価関数の出力に対する評価を使用者との対話に基づいて行う対話型評価と、前記評価関数の出力に対する評価を所定の評価基準に基づいて行う自律型評価との組み合わせにより、前記最適化アルゴリズムによる探索を行うようになっていることを特徴とする最適解探索装置。

2 . 請求の範囲第 1項において、

前記評価関数の出力を記憶するための記憶手段と、前記評価関数の出力を評価値として算出して前記記憶手段に記憶する評価値算出手段と、前記使用者による評価を入力する評価入力手段とを備え、'

前記対話型評価は、前記評価入力手段の入力内容に基づいて行い、前記自律型評価は、前記記憶手段の評価値に基づいて行うようになっていることを特徴とする最適解探索装置。

3 . 制御対象の特性を制御する制御系の制御特性に影響を及ぼす制御係数を入力として前記制御特性を出力する評価関数を用いて、前記評価関数の出力を繰り返し評価しながら前記評価関数の最適解を最適化アルゴリズムにより探索することにより、前記制御系の制御特性を最適化する装置であって、

前記評価関数の出力に対する評価を使用者との対話に基づいて行う対話型評価と、前記評価関数の出力に対する評価を所定の評価基準に基づいて行う自律型評価との組み合わせにより、前記最適化アルゴリズムによる探索を行うようになっていることを特徴とする最適化アルゴリズムによる制御対象の制御装置。

4 . 請求の範囲第 3項において、

前記評価関数の出力を記憶するための記憶手段と、前記評価関数の出力を評価値として算出して前記記憶手段に記憶する評価値算出手段と、前記使用者による評価を入力する評価入力手段とを備え、

前記対話型評価は、前記評価入力手段の入力内容に基づいて行い、前記自律型評価は、前記記憶手段の評価値に基づいて行うようになっていることを特徴とする最適化アルゴリズムによる制御対象の制御装置。

5 . 請求の範囲第 3及び第 4項のいずれかにおいて、

前記制御対象の第 1の特性を制御する第 1制御系と、前記制御対象の第 2の特性を制御する第 2制御系とを備え、

前記第 1制御系については、前記第 1制御系の制御特性に影響を及ぼす制御係数を入力として前記制御特性を出力する第 1評価関数を用いて、前記第 1評価関数の出力を前記対話型評価により繰り返し評価しながら、前記第 1評価関数の最適解を前記最適化アルゴリズムにより探索するようになっており、

前記第 2制御系については、前記第 2制御系の制御特性に影響を及ぼす制御係数を入力として前記制御特性を出力する第 2評価関数及び前記第 1評価関数を用いて、前記第 1制御系の最適化で最適解として探索した解から求まる前記第 1評価関数の出力を基準として所定範囲内に前記第 1 評価関数の出力が属するように、前記第 2評価関数の出力を前記自律型評価により繰り返し評価しながら、前記第 2評価関数の最適解を前記最適化アルゴリズムにより探索するようになっていることを特徴とする最適化ァルゴリズムによる制御対象の制御装置。

6 . 請求の範囲第 3及び第 4項のいずれかにおいて、

前記第 1制御系については、前記第 1制御系の制御特性に影響を及ぼす制御係数を入力として前記制御特性を出力する第 1評価関数を用いて、前記第 1評価関数の出力を前記自律型評価により繰り返し評価しながら、前記第 1評価関数の最適解を前記最適化ァルゴリズムにより探索するようになっており、

前記第 2制御系については、前記第 2制御系の制御特性に影響を及ぼす制御係数を入力として前記制御特性を出力する第 2評価関数及び前記第 1評価関数を用いて、前記第 1制御系の最適化で最適解として探索した解から求まる前記第 1評価関数の出力を基準として所定範囲内に前記第 1 評価関数の出力が属するように、前記第 2評価関数の出力を前記対話型評価により繰り返し評価しながら、前記第 2評価関数の最適解を前記最適化アルゴリズムにより探索するようになっていることを特徴とする最適化ァルゴリズムによる制御対象の制御装置。

7 . 請求の範囲第 5及び第 6項のいずれかにおいて、

前記制御対象は、エンジンであり、

前記第 1評価関数及び前記第 2評価関数の出力のうち前記対話型評価の対象となるものは、前記エンジンの回転数変化率及びスロットル開度変化率により定まるレスポンス度であり、前記第 1評価関数及び前記第 2評価関数の出力のうち前記自律型評価の対象となるものは、前記エンジンの燃費であることを特徴とする最適化アルゴリズムによる制御対象の制御

8 . 請求の範囲第 5乃至第 7項のいずれかにおいて、

前記最適化アルゴリズムは、複数の個体の集合からなる個体群を仮想的に生成するとともに、前記各個体ごとにその個体の遺伝情報に見立てて個体情報を構成し、当該個体情報には前記制御係数を割り当て、さらに、遺伝子操作を模倣した情報操作を前記個体情報に対して行う個体情報操作手段と、前記個体の評価値を算出する評価値算出手段と、前記評価値算出手段で算出した評価値に基づいて前記個体の生存又は淘汰を行う個体選択手段とを備え、同一世代において、前記個体情報操作手段による遺伝的操作及び前記個体選択手段による個体選択操作をそれぞれ少なくとも 1 回行って世代を進行させる進化型最適化アルゴリズムであることを特徴とする最適化アルゴリズムによる制御対象の制御装置。

9 . 請求の範囲第 8項において、

前記制御対象は、エンジンであり、

前記個体情報には、前記制御係数として、前記エンジンの燃料噴射量、前記エンジンの過渡状態において前記燃料噴射量を補正する過渡補正量、前記燃料噴射量の補正値又は前記過渡補正量の補正値を割り当てるようになっていることを特徴とする最適化アルゴリズムによる制御対象の制

1 0 . 請求の範囲第 8項において、

前記制御対象は、エンジンであり、

前記ェンジンの燃料噴射量、前記ェンジンの過渡状態において前記燃料噴射量を補正する過渡補正量、前記燃料噴射量の補正値又は前記過渡補正量の補正値をニューラルネヅトワークにより生成するようになっており、前記個体情報には、前記制御係数として、前記ニューラルネットワークにおけるシナプスの結合係数を割り当てるようになつていることを特徴とする最適化ァルゴリズムによる制御対象の制御装置。

1 1 . 請求の範囲第 5及び第 6項のいずれかにおいて、

前記制御対象は、電気モー夕であり、

前記第 1評価関数及び前記第 2評価関数の出力のうち前記対話型評価の対象となるものは、前記電気モー夕の回転変化率であり、前記第 1評価関数及び前記第 2評価関数の出力のうち前記自律型評価の対象となるものは、前記電気モー夕の電力消費であることを特徴とする最適化アルゴリズムによる制御対象の制御装置。

1 2 . 評価関数の出力を繰り返し評価しながら前記評価関数の最適解を最適化アルゴリズムにより探索するコンビュ一夕実行可能なプログラムであって、 '

前記評価関数の出力に対する評価を使用者との対話に基づいて行う対話型評価と、前記評価関数の出力に対する評価を所定の評価基準に基づいて行う自律型評価との組み合わせにより、前記最適化アルゴリズムによる探索を行う処理をコンピュータに実行させるためのプログラムであることを特徴とする最適解探索プログラム。