JP2000020103A

JP2000020103A - 遺伝的アルゴリズムの評価方法

Info

Publication number: JP2000020103A
Application number: JP10187181A
Authority: JP
Inventors: Hajime Kita; 一喜多; Takaaki Shibata; 卓明芝田; Masashi Yamaguchi; 昌志山口
Original assignee: Yamaha Motor Co Ltd
Current assignee: Yamaha Motor Co Ltd
Priority date: 1998-07-02
Filing date: 1998-07-02
Publication date: 2000-01-21
Also published as: EP0969385A2; EP0969385A3; US6721647B1

Abstract

(57)【要約】【課題】評価領域に全個体のデータを持たない際の評価
を可能とし、少ない評価数で効率良い客観的な評価を実
現する。【解決手段】複数の作動状態に制御結果が現れる制御対
象において遺伝的アルゴリズムにおける個体の評価を行
う際、細分化された評価領域に評価用データを分類し、
個体の評価値を客観的に算出する。具体的には、前記評
価領域に分類された評価用データを用い、個体の評価値
をある基準値に対する係数のモデルにより置き換え、評
価値をモデル的に算出する際、各評価用データの基準値
に対する係数から最小２乗法により得られる値を個体の
評価値とする。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、遺伝的アルゴリズ
ムを用いる制御方法において個体の評価を客観的に行う
技術分野に属する。

【０００２】

【従来の技術及び発明が解決しようとする課題】従来か
ら、例えば、車両や家電製品等の製品の特性を制御する
場合、制御対象となる製品の特性は、開発、設計段階で
使用者の好みや使用状況を加味し、できるだけ広い範囲
のユーザーに適応するように決められている。しかし、
使用者は個々に特有の個性を持っており、その好みも千
差万別であるため、全てのユーザーが満足する特性を提
供することは不可能である。この問題を解決するため
に、ニューラルネットワークを用いて使用者の好みや使
用状況を推定し、遺伝的アルゴリズムを用いてユーザー
が満足し得る特性を実現する制御方法が試みられてい
る。

【０００３】自然進化の過程を模倣して構築された遺伝
的アルゴリズムでは、一般的に同一世代内の個体をユー
ザが主観的に評価し、その評価値に基づいて遺伝的操作
を行うようにしている。しかしながら、遺伝的アルゴリ
ズムを、例えばエンジンのような複数の作動状態に制御
結果が現れる制御に適用する場合、入力条件により出力
が大きく異なるため、単純に１個体に１評価値を与え個
体を客観的に比較することは困難である。この問題の対
策として、細分化された評価領域に評価用データを分類
し、それを総合評価することにより均等な条件で個体の
比較を行うことは可能であるが、従来、この評価手法で
は、全個体のデータを持たない評価領域に対しデータが
そろうまで待つか、もしくはその領域については評価に
含めないなどの操作が必要になり、個体評価の点で効率
が悪いとともに、適正な評価が困難であるという問題を
有している。

【０００４】本発明は、上記問題を解決するものであっ
て、エンジン等のような複数の作動状態に制御結果が現
れる制御に遺伝的アルゴリズムを適用し、個体の評価を
行う際に生じる上記の問題に対し、評価領域に全個体の
データを持たない際の評価を可能とし、少ない評価数で
効率良い客観的な評価を実現することができる評価方法
を提供することを目的とする。

【０００５】

【課題を解決するための手段】そのために本発明の遺伝
的アルゴリズムの評価方法は、複数の作動状態に制御結
果が現れる制御対象において遺伝的アルゴリズムにおけ
る個体の評価を行う際、細分化された評価領域に評価用
データを分類し、個体の評価値を客観的に算出すること
を特徴とする。

【０００６】

【発明の実施の形態】以下、本発明の実施の形態を図面
を参照しつつ説明する。図１は、本発明が適用される制
御方法の基本概念を示す構成図である。本発明は、エン
ジン、電動モータ、空調装置、冷蔵庫又はロボットなど
のように、複数の作動状態に制御結果が現れる制御対象
に遺伝的アルゴリズムを適用するものである。この制御
方法は、反射層、学習層、進化適応層の３つの制御層か
らなり、外部から制御すべき制御対象に関する情報（例
えば、動作状態に関する情報等）を入力し、この入力情
報に基づいて反射層で基本操作量を決定し、学習層及び
進化適応層で基本操作量に対する補正量を決定し、これ
ら基本操作量及び補正量から最終的な制御出力を出力す
る。以下、反射層、学習層及び進化適応層の機能につい
て説明する。

【０００７】反射層は、制御対象に関する情報（以下、
外界情報という）と、外界情報に対する基本操作量との
関係式を、マップ、ファジィルール、ニューラルネット
ワーク又はサブサンプションアーキテクチャ等の形式の
制御系予め備えられている層であり、外界情報が入力さ
れると、上記した制御系から外界情報に対する基本操作
量を決定し出力する。なお、サブサンプションアーキテ
クチャとは、並列的な処理を行う行動型人工知能として
公知である。

【０００８】進化適応層は、評価系と進化適応系との２
つの制御系からなる。評価系は、外界情報、ユーザの特
性（例えば、好み、技量、使用状態等）に関する情報、
使用状況の特性（例えば、使用環境の変化等）に関する
情報を入力し、これら外界情報等から制御すべき制御対
象を使用する使用者及び使用状況の特性を推定すると共
に、このユーザ及び使用状況の特性に基づいて進化適応
系における進化処理中の評価を行う。

【０００９】進化適応系は、反射層で決定された基本操
作量を使用者及び使用状況の特性に合わせるように補正
するための複数の制御モジュールを備え、この制御モジ
ュールを評価系の判断に基づいて遺伝的に進化させて、
その時点で最適な少なくとも１つの制御モジュールを獲
得する。進化適応系は、最適な制御モジュールを獲得し
た後は、制御モジュールを最適なものに固定して、反射
層から出力される基本操作量を補正する進化補正値を出
力する。

【００１０】学習層は、学習用と実行用に入れ替え可能
な２つの制御系を備え、実行用制御系で制御を実行して
いる間、学習用制御系で進化適応層の進化した最適制御
モジュールに関する入出力関係と、学習層の実行用制御
系の入出力関係とを合わせて学習する。学習用制御系で
の学習が終了すると、制御を実行している制御系と学習
後の制御系が入れ替わり、学習後の制御系で学習結果か
ら得られる制御モジュールによる制御を開始し、制御を
実行していた制御系が学習用として機能し始める。

【００１１】進化適応層は、最適な制御モジュールに関
する情報を学習層に学習させた後は、その出力をゼロに
戻し、一定時間間隔で作動して、使用者の好み及び使用
環境のの評価と、制御モジュールの進化とを行い、進化
適応層の出力を加えた時の評価が、進化適応層の出力を
加えていない時の評価より優れている場合は、再度、学
習層に最適な制御モジュールに関する情報を学習させ
る。

【００１２】なお、学習層における学習済みの制御モジ
ュールに関する情報は、ＩＣカードやフロッピィディス
ク等の外部記憶手段に保存、読み出し可能にされてお
り、使用者が必要に応じて過去の最適制御モジュールに
関する情報を外部記憶手段から読み出して、その情報に
基づいて学習層で基本補正量を出力するようにしてい
る。

【００１３】上記した各層の機能により、この制御方法
による制御出力は、制御すべき制御対象をユーザの好み
や使用環境の変化等の特性に合わせるべく刻々と変化
し、その結果、制御対象の特性は使用者及び使用状況の
特性に適応した動作に刻々と変化していく。この制御方
法により制御対象の特性がユーザ及び使用状況の特性に
適応して進化していく。

【００１４】図２は、図１の制御方法における処理の流
れを説明するための図である。初期状態では、学習層の
出力はゼロであり（ステップａ）、従って、制御対象の
使用が開始された直後は反射層からの基本操作量だけで
制御対象は制御される。制御対象の使用が開始される
と、進化適応層は、使用者及び／又は使用状況の特性を
評価し、この評価値に応じてその制御モジュールを進化
させる（ステップｂ）。進化適応層は、各制御モジュー
ルを遺伝的に進化させることにより、その時点で最も望
ましい１つの制御モジュールを獲得する（ステップ
ｃ）。

【００１５】進化適応層は、その制御モジュールをステ
ップｃで得た最も望ましい制御モジュールに固定し、そ
の制御モジュールに基づいて進化系補正値を出力して、
反射層から出力される基本操作量を補正する。学習層で
は、進化適応層が最適制御モジュールに固定された時の
進化適応層の入出力関係と学習層の実行用制御系の入出
力関係を学習用制御系で合わせて学習する。なお、初期
状態では学習層の実行用制御系の出力はゼロであるが、
学習後は反射層からの基本操作量を学習層からの基本補
正量と進化適応層からの進化補正量で補正する（ステッ
プｄ）。

【００１６】反射層からの基本操作量に学習層における
学習用制御系の出力を加えた値と、実際の制御出力（基
本操作量＋基本補正量＋進化補正量）との差がしきい値
より小さくなった時点で学習層における学習用制御系は
学習を終了し、学習用制御系と実行用制御系が入れ替わ
って、学習後の制御系が実行用として機能し、制御を実
行していた制御系が学習用として機能し（ステップ
ｅ）、反射層と学習層とによる制御が行われる（ステッ
プｆ）。

【００１７】進化適応層は、最適制御モジュールに関す
る情報を学習層に学習させた後、一定時間間隔で作動
し、学習層の制御則の経時的なずれを評価する（ステッ
プｇ）。具体的には、進化適応層の制御モジュールを遺
伝的に進化させる時の初期世代において最大適応度の改
善がみられない場合には、制御層の制御則のずれはない
ものとしてステップｆに移行して反射層と学習層とによ
る制御を継続し、最大適応度の改善がみられた場合に
は、ステップｂに移行して進化適応層で新たな最適制御
モジュールの獲得を行う。

【００１８】次に、上記した制御方法について、制御対
象として車両用エンジンを例に挙げてさらに具体的に説
明する。図３は、図１の制御方法を実行する制御装置１
０とエンジン１との関係を示す模式図である。制御装置
１０には、エンジン回転数、吸気負圧、スロットル開
度、スロットル開度変化率、大気圧、吸気温度、冷却水
温、ギヤポジション等の情報が入力され、これら入力情
報に基づいて、燃料噴射装置、吸気制御バルブ、吸気バ
ルブ、排気バルブ、排気制御バルブに制御信号が出力さ
れ、エンジン制御を行うようにしている。

【００１９】図４は、図３の制御装置の構成図である。
この制御装置１０は上述した反射層、学習層、進化適応
層の３つの制御層からなる。反射層には、エンジン回転
数、吸気負圧、スロットル開度、スロットル開度変化
率、大気圧、吸気温度、冷却水温等の信号が入力され、
これらの信号に基づいて予め決められた燃料噴射モデル
から燃料噴射量の制御操作量が決定され出力される。

【００２０】進化適応層は評価系と進化適応系とからな
る。評価系は、一定時間内の各ギヤポジションにおける
最高回転数の分布パターン（図５及び図６参照）と走行
状態指数Ｐとの関係を学習したニューラルネットワーク
（図７参照）を備えており、ギヤポジション信号とエン
ジン回転数信号を入力し、前記入力情報から前記ニュー
ラルネットワークにより走行状態指数Ｐを決定する。例
えば、スポーティな走行を好む使用者は、低速のギヤで
高い回転数までエンジンを回す傾向にあるため、その分
布パターンは図５（ａ）に示すようになり、また、マイ
ルドな走行を好む使用者は、早めに高速のギヤに変えて
いく傾向にあるため、その分布パターンは図５（ｂ）に
示すようになる。従って、図７に示したニューラルネッ
トワークで、図５（ａ）に示す分布パターンの時に走行
状態指数Ｐが大きな値となり、また、図５（ｂ）に示す
分布パターンの時に走行状態指数Ｐが小さな値となるよ
うに予め学習させておくと、前記ニューラルネットワー
クから得られる走行状態指数Ｐは、使用者の走行に対す
る好みがスポーティであればある程大きくなり、マイル
ドであればある程小さくなり、使用者の好みが反映した
ものになる。

【００２１】また、図６（ａ）に示すように、一定時間
内に１速から６速までの各ギヤを使用した場合には走行
状態指数Ｐの値が大となり、図６（ｂ）に示すように、
低速のギヤばかりを使用した場合には走行状態指数Ｐの
値がやや大となり、図６（ｃ）に示すように、高速のギ
ヤばかりを使用した場合には走行状態指数Ｐの値が小と
なるように前記ニューラルネットワークで学習しておけ
ば、通常、車両では、通常走行の場合には各ギヤを使用
し、渋滞走行時には低速ギヤばかりを使用し、また、高
速走行時には高速ギヤばかりを使用するので、ニューラ
ルネットワークで得られる走行状態指数Ｐに基づいて、
例えば、図６（ａ）の場合は通常走行であり、図６
（ｂ）の場合は渋滞路走行であり、図６（ｃ）の場合は
高速道路走行であることを推定できることになる。

【００２２】評価系は、この走行状態指数Ｐから、その
時の走行状況を推定し、かつ、使用者の好みが燃費性重
視か、加速性重視かを判断して加速度重視割合γを決定
する。加速度重視割合γは、図８に示すように、走行状
態指数Ｐにほぼ比例して設定されるが、最高回転数に達
するまでの時間が短い時には加速度重視割合γは大き
く、最高回転数に達するまでの時間が長い時には加速度
重視割合γは小さな値となる。

【００２３】進化適応系は、燃費が最良となるような燃
料噴射制御則の獲得を目指す燃費モジュール及び出力が
最高となるような燃料噴射制御則の獲得を目指すパワー
モジュールとからなる下位モジュールと、使用者の好み
に合わせて運転状態に応じた前記燃費モジュールと前記
パワーモジュールの出力比の獲得を目指すコントロール
モジュールとを備えている。前記各モジュールは、図９
に示すように、各々２入力１出力の階層型ニューラルネ
ットワークで構成され、燃費モジュール及びパワーモジ
ュールは、正規化エンジン回転数と正規化スロットル開
度を入力して進化補正量の１次出力値を出力し、コント
ロールモジュールは正規化スロットル開度と正規化スロ
ットル開度変化率を入力して下位モジュール（燃費モジ
ュール及びパワーモジュール）の出力比を出力すること
で進化補正量の最終出力値を決定する。

【００２４】前記燃費モジュール及びパワーモジュール
は、図１０に示すように運転状態や使用者の好みに関係
なく、それぞれ燃費が最良になる空燃比と、出力が最高
になる空燃比が得られるような空燃比補正量を獲得する
よう各ニューラルネットワークの結合係数を遺伝的アル
ゴリズムを用いて順番に自律的に進化させる。これに対
してコントロールモジュールは、最良燃費空燃比と最良
出力空燃比の間で、使用者の好みに合った燃費モジュー
ル及びパワーモジュールの出力比を獲得するように、そ
のニューラルネットワークの結合係数を遺伝的アルゴリ
ズムを用いて自律的に進化させる。

【００２５】次に、遺伝的アルゴリズムによるモジュー
ルの進化について説明する。図１１は燃費モジュールの
進化の例を説明するためのフロー図、図１２は図１１の
処理を説明するための図である。先ず、燃費モジュール
を構成するニューラルネットワークの結合係数を遺伝子
としてコーディングして、複数の個体ａ（ｊ）（本例で
は９個の個体）からなる第１世代を生成する（ステップ
１）。このとき、個体群に進化適応層の出力をゼロにで
きる個体を一つ含ませることにより、進化前の性能を維
持しながら個体数に制限がある場合でも進化の過程で個
体群の多様性を保つことができる。

【００２６】次に、ステップ１で生成された個体ａ
（ｊ）の中の１つ、例えば、個体ａ（１）に対して、燃
費モジュールのニューラルネットワークを用いて実際の
入力情報（エンジン回転数及びスロットル開度）に対す
るニューラルネットワークの出力ｘを決定し（ステップ
２）、さらにこの出力を下式を用いて線形変換して個体
ａ（１）に対する燃費モジュールの出力ｙｆ（１）を決
定する。ｙｆ（ｎ）＝２×Ｇｘ（ｎ）−Ｇここで、ｘ（ｎ）は燃費モジュールにおけるニューラル
ネットワークの出力、Ｇは進化適応層出力ゲイン、ｎは
個体である。このように、ニューラルネットワークの出
力ｘを線形変換して用いることにより、燃費モジュール
からの出力ｙｆが極端に大きな値になることがなく、全
体として進化がすこしづつ進むようになり、エンジンの
挙動が評価や進化のために極端に変動することがなくな
る。

【００２７】個体ａ（１）に対する燃費モジュールの出
力ｙｆ（１）を決定した後、パワーモジュールの出力ｙ
ａ及びコントロールモジュールの出力ＯＲを用いて下式
に基づいて進化適応層の出力（評価用補正値Ｙａ
（ｎ））を決定する（ステップ４）。Ｙａ（ｎ）＝ＯＲ×ｙａ＋（１−ＯＲ）×ｙｆなお、燃費モジュールの進化処理中は、パワーモジュー
ル及びコントロールモジュールの結合係数は固定されて
いる。上式に示すように、コントロールモジュールの出
力ＯＲは、燃費モジュールの出力ｙｆとパワーモジュー
ルの出力ｙａとの比率であり、従って、コントロールモ
ジュールの出力ＯＲが１の場合は、進化適応層の出力は
パワーモジュールの出力となり、また、前記出力ＯＲが
０の場合は進化適応層の出力は燃費モジュールの出力と
なる。

【００２８】次に、個体ａ（１）に対する進化適応層の
出力Ｙａ（１）を実際に進化適応層から出力し、この評
価用補正値Ｙａ（１）と学習層からの基本補正値Ｙｂと
を反射層からの基本操作量に加算し、この補正値Ｙａ
（１）＋Ｙｂにより補正された制御出力でエンジンを作
動させる（ステップ５）。個体ａ（１）を用いて実際に
制御を行いながら、進化適応層の評価系ではこの制御の
結果に関する情報をフィードバックして、個体ａ（１）
に対する評価値（ここでは燃料消費量）を決定する（ス
テップ６）。

【００２９】上記したステップ１からステップ６までの
処理は、ステップ１で生成された９個の個体ａ（１）〜
ａ（９）に対する全ての評価値の算出を１サイクルの予
備評価処理として、この予備評価処理を予め決められた
所定のサイクル行うまで繰り返し行われ（ステップ
７）、全ての個体に対して所定サイクル分の評価値を算
出た後に各個体の総合評価処理（ステップ８）に進む。
この総合評価処理では、各個体毎に、上記した評価値算
出サイクル中の総走行距離を全ての評価値の合計（ここ
では総燃料消費量）で割った総合評価値を算出し、この
総合評価値に基づいて各個体の適応度の評価を行う。

【００３０】図１３に示すように、各個体を用いた制御
を順番に所定回数行い各個体を時分割により擬似的に並
列的に作動させることにより、刻々と変化する走行状況
のもとでも各個体の評価をほぼ同じ条件で公平に行うこ
とが可能となり、オンライン評価、すなわち車両走行中
の評価が可能になる。

【００３１】上記した総合評価処理が終了した後、その
個体の属する世代が最終世代か否かを判断し（ステップ
９）、最終世代でなければ親個体の選択を行う（ステッ
プ１０）。この選択にはルーレット式選択方式を用い、
各個体の適応度に比例した確率で、確率的にいくつかの
親個体を選択する。なお、この時、厳密に世代交代を適
用しすぎると、評価の高い個体を破壊してしまう恐れが
あるため、エリート（評価の最も高い個体）を無条件に
次世代に残すエリート保存戦略も合わせて用いる。

【００３２】親個体の選択が終了すると、選択された個
体を親個体として交叉を行い、９個の子個体からなる第
２世代を生成する（ステップ１１）。個体間の交叉に
は、１点交叉、２点交叉または正規分布交叉等の公知の
手法を用いる。また、生成された９個の子個体に対して
一定の確率で、ランダムに遺伝子（結合度）の値を変更
し、遺伝子の突然変異を発生させる。なお、これら９個
の子個体には、進化適応層の出力をゼロにできる個体を
一つ含むようにする。

【００３３】上記した処理により、第２世代が生成した
後、再びステップ２からの予備評価処理を繰り返す。上
記処理は、生成する世代が予め決められた最終世代に達
するまで繰り返し行われる。これにより、各世代を構成
する子個体は評価系の評価に沿って、すなわち燃費モジ
ュールの場合には燃費が最良となるような燃料噴射制御
則を獲得するように進化していく。ステップ９で最終世
代に達したと判断された場合には、その世代の９個の子
個体の中から適応度の最も高い個体（最適個体）、すな
わちエリートを一つ選び出し（ステップ１２）、燃費モ
ジュールのニューラルネットワークの結合係数を、前記
した最適個体を構成する遺伝子で固定し（ステップ１
３）、学習層の学習用制御モジュールに対する学習処理
に移行する。

【００３４】パワーモジュール及びコントロールモジュ
ールの進化処理においても、上記した燃費モジュールと
同様の進化処理が行われるが、パワーモジュールにおけ
る各個体に対する総合評価値は、評価値算出サイクル中
の平均エンジン回転数を平均スロットル開度で割って算
出される。これにより、パワーモジュールの進化処理中
の各世代を構成する子個体は評価系の評価に沿って、す
なわち出力が最良となるような燃料噴射制御則を獲得す
るように進化していく。また、コントロールモジュール
における各個体に対する総合評価値ＣＮＴは、評価値算
出サイクル中の燃費評価値をＦＣ、レスポンス評価値を
ＲＰ、加速度重視割合をγと、基準燃費評価値をＦＣba
se、基準レスポンス評価値をＲＰbaseとすると、ＣＮＴ＝（１−γ）×Ｓcale×（ＦＣ−ＦＣbase）／Ｆ
Ｃbase＋γ×（ＲＰ−ＲＰbase）／ＲＰbase となる。ここで、Ｓcaleは燃費評価値とレスポンス評価
値とのバランスとるための係数である。また、燃費評価
値ＦＣは上記した燃費モジュールにおける総合評価値と
同様に算出され、レスポンス評価値ＲＰは、所定のしき
い値より大きいスロットル開度の変化が所定時間続いた
ら加速動作とみなして、そのときの速度変化をスロット
ル開度変化率で割り、これを所定の評価値算出サイクル
の時間内の各加速毎に算出したものの平均値とする。

【００３５】上記したように、燃費評価値とレスポンス
評価値を使用者の好みに基づいて決められた加速度重視
割合γの比率に合わせて評価することにより、コントロ
ールモジュールは、使用者の好みに合わせて運転状態に
応じた燃費モジュールとパワーモジュールの出力比を獲
得できるように進化していくことになる。

【００３６】次に学習層について説明する。学習層は、
図４に示すように、進化適応層の制御モジュールに対応
する種類の制御モジュール群を備え、各制御モジュール
群は、学習用ニューラルネットワークと実行用ニューラ
ルネットワークからなっている。この学習層における制
御モジュールは、進化適応層の対応する制御モジュール
が所定世代数進化する毎に、その学習用のニューラルネ
ットワークで、進化適応層の入力と出力との関係を、学
習層の実行用として機能しているニューラルネットワー
クの入力と出力との関係と合わせて学習する。

【００３７】上記した学習は、学習中の学習用ニューラ
ルネットワークの出力と制御出力との誤差がしきい値よ
り小さくなった時点で終了し、その後、学習用のニュー
ラルネットワークは実行用になり、もとの制御用のニュ
ーラルネットワークが学習用となる。この学習は、上記
したように進化適応層における制御モジュールの進化処
理が所定の世代数行われる毎に行われる。従って、一つ
の制御モジュールに対して進化処理が始まってから進化
が収束するまでの間は、所定の世代数進化処理が行われ
る毎に学習が行われるようになる。このように、各制御
モジュールに対して進化と学習を交互に繰り返すことに
より、図１４に示すように、学習を行わず進化処理のみ
で進化させる場合に比べて評価値の向上が早くなり進化
を早く進ませることができる。

【００３８】次に、本発明の遺伝的アルゴリズムのオン
ライン評価方法について説明する。図１５は、その１実
施形態である基本概念を示すフロー図、図１６は評価領
域を説明するための図である。

【００３９】先ず、個体ｊの評価用データを取得し、評
価用データを細分化された評価領域ｉ（図１６）へと分
類し（ステップ１）、その領域ｉにおけるｋ番目のデー
タをｆ（ｉ，ｊ，ｋ）とする。なお、本例では評価領域
は、２次元のテーブルで表され、評価用データを分類す
るようにしているが、評価条件（パラメータ）を用いて
２次元或は３次元以上の領域に細分化してもよい。

【００４０】次に、ステップ２でモデルの基準値を評価
領域ごとに算出し、その値はその領域に含まれるデータ
の平均値とする。ここで、平均値の算出に加わる個体数
を増加させ平均値の精度を向上させるため、ある評価領
域ｉにおける基準値は、その周辺領域を含めた領域に含
まれる評価用データの平均値とする。すなわち、領域ｉ
での平均値は、領域ｉの周辺領域を含む図１６に示す網
目領域ｉ′（集合：Ｕ（ｉ））についての平均値とし、
平均値は（数１）式で表される。

【００４１】

【数１】

【００４２】次に、ステップ３で、各評価領域の評価値
への寄与度を統一するため、各評価領域における平均値
・分散が等しくなるように評価用データの変換を行う。
この処理は、図１７及び図１８に示すように、各領域で
の評価データのそれぞれの平均値と分散が異なっている
ため、これらを規格化（正規化）することにより各評価
領域の評価値（後述する最小２乗法で推定）への寄与度
を均一にするためである。先ず、平均値を規格化するた
め、（数１）式を用い（数２）式に従い各データをｆ′
（ｉ，ｊ，ｋ）へ変換する（図１７参照）。

【００４３】

【数２】

【００４４】さらに、分散を規格化する。平均値を変え
ないデータ変換は、ｂを変換係数として（数３式）によ
り表される。

【００４５】

【数３】

【００４６】ここで、ｆ′（ｉ）は平均値規格化のため
のデータ変換後の領域ｉにおける平均値であり、領域ｉ
におけるデータ数をＮ（ｉ）として（数４）式で表され
る。

【００４７】

【数４】

【００４８】データ変換後の分散ｃ″は、（数５）式に
より表される。

【００４９】

【数５】

【００５０】ここで、ｆ″（ｉ）は分散を規格化のため
のデータ変換後の領域ｉにおける平均値であり、（数
６）式で表され、規格化する分散を１とすると、（数
７）式により表される。

【００５１】

【数６】

【００５２】

【数７】

【００５３】（数７）式において、データ変換前の分散
ｃ′を用いると、（数８）式により表される。ｂは変換
係数である。

【００５４】

【数８】

【００５５】以上から（数３）式を書き直すと、最終的
に評価用データは（数９）式に変換される（図１８参
照）。

【００５６】

【数９】

【００５７】次に、ステップ４で、各評価用データの基
準値に対する係数から評価値を得る。そのために、各個
体のそれぞれの評価領域における評価用データを、係数
α（ｊ）、基準値ｆ″（ｉ）を用いて（数１０）式のよ
うに基準値の係数倍としてモデル化する。

【００５８】

【数１０】

【００５９】次に、係数α（ｊ）を個体ｊに関するデー
タｆ″（ｉ，ｊ）から最小２乗法で推測する。これは
（数１１）式の残差の二乗を最小値にするα（ｊ）であ
る（図１９参照）。

【００６０】

【数１１】

【００６１】ただし、個体ｊの評価値Ｆ（ｊ）を各領域
での評価用データα（ｊ）ｆ″（ｉ）のＮ（ｉ）の重み
付け和で与えると、評価値Ｆ（ｊ）は（数１２）式で表
され、

【００６２】

【数１２】

【００６３】（数１２）式より、Ｆ（ｊ）の比較は単に
α（ｊ）の比較に等しいことから、α（ｊ）を評価値と
することができ、α（ｊ）が大きいほど評価が高いと判
定する。

【００６４】なお、上記実施形態においては、評価領域
に分類された評価用データに対し、各評価領域ごとの平
均値及び分散が等しくなるように評価用データの変換を
行うようにしているが、平均値または分散が等しくなる
ように評価用データの変換を行うようにしてもよい。

【００６５】また、上記実施形態においては、平均値の
算出に周辺領域に含まれる評価用データを用いて行うよ
うにしているが、各評価領域ごとの平均値及び／又は分
散が等しくなるような評価用データの変換は、その周辺
領域に含まれる評価用データを用いて行うようにしても
よい。以下にこれを説明する。

【００６６】領域ｉでの平均値は、領域ｉの周辺領域を
含む図１６に示す網目領域ｉ′（集合：Ｕ（ｉ））につ
いての平均値とし、平均値は（数１３）式で表される。

【００６７】

【数１３】

【００６８】先ず、平均値を規格化するため、（数１
３）式を用い（数１４）式に従い各データをｆ′（ｉ，
ｊ，ｋ）へ変換する。

【００６９】

【数１４】

【００７０】さらに、分散を規格化する。平均値を変え
ないデータ変換は、ｂを変換係数として（数１５式）に
より表される。

【００７１】

【数１５】

【００７２】ここで、ｆ′（ｉ）は平均値規格化のため
のデータ変換後の領域ｉ′における平均値であり、（数
１６）式で表される。

【００７３】

【数１６】

【００７４】データ変換後の分散ｃ″は、（数１７）式
により表される。

【００７５】

【数１７】

【００７６】ここで、ｆ″（ｉ）は分散を規格化のため
のデータ変換後の領域ｉ′における平均値であり、（数
１８）式で表され、規格化する分散を１とすると、（数
１９）式により表される。

【００７７】

【数１８】

【００７８】

【数１９】

【００７９】（数１９）式において、データ変換前の分
散ｃ′を用いると、（数２０）式により表される。

【００８０】

【数２０】

【００８１】以上から（数１５）式を書き直すと、最終
的に評価用データは（数２１）式に変換される。

【００８２】

【数２１】

【００８３】次に、各個体のそれぞれの評価領域におけ
る評価用データを、係数α（ｊ）、基準値ｆ″（ｉ）を
用いて（数２２）式のように基準値の係数倍としてモデ
ル化する。

【００８４】

【数２２】

【００８５】次に、係数α（ｊ）を個体ｊに関するデー
タｆ″（ｉ，ｊ）から最小２乗法で推測する。これは
（数２３）式の残差の二乗を最小値にするα（ｊ）であ
る。

【００８６】

【数２３】

【００８７】ただし、個体ｊの評価値Ｆ（ｊ）を各領域
での評価用データα（ｊ）ｆ″（ｉ）のＮ（ｉ）の重み
付け和で与えると、評価値Ｆ（ｊ）は（数２４）式で表
され、

【００８８】

【数２４】

【００８９】（数２４）式より、Ｆ（ｊ）の比較は単に
α（ｊ）の比較に等しいことから、α（ｊ）を評価値と
することができ、α（ｊ）が大きいほど評価が高いと判
定する。

【００９０】次に、本発明をエンジンの評価方法に適用
した例について説明する。エンジン特性のオンライン評
価をするにあたり、レスポンス（応答）性能、燃費性能
及び出力に関する個体は、それぞれ独立した制御モジュ
ールであり、異なる制御モジュール間での比較は行われ
ない。すなわち、図２０に示すように、それぞれの制御
モジュールの評価は、走行状態を判定し、過渡時である
ならばレスポンス性能を評価し、定常時であるならば、
燃費性能及び出力の評価を行う。

【００９１】図２１（Ａ）は、レスポンス性能の場合
で、評価領域は加速開始エンジン回転数と平均スロット
ル開度変化率により作成し、評価値はレスポンス度とす
る。局所的なレスポンス度は、スロットル開度変化率が
正の値である期間中の、エンジン回転数変化率を平均ス
ロットル開度変化率で割った値であり、単位時間あたり
のスロットル開度変化量に対し、エンジン回転数の変化
量が大きいほどレスポンス度は大きな値となる。スロッ
トル開度に対するエンジン回転数の追随性、つまりレス
ポンス性能は、加速中の空燃比に大きく影響される。加
速開始時のエンジン回転数が同じであるならば、加速中
の空燃比はスロットルの操作方法により決定される。こ
のことから、スロットルの操作方法に依存するスロット
ル開度変化率と、加速開始エンジン回転数、すなわちス
ロットルの操作方法に依存した走行パターンにより評価
領域を細分化するようにしている。

【００９２】図２１（Ｂ）は、燃費性能及び出力の場合
で、評価領域はいずれもエンジントルクとエンジン回転
数により作成し、局所的な評価値はそれぞれ燃料消費
量、スロットル開度とする。エンジントルク及びエンジ
ン回転数が同じ条件のもとで、単位時間当たりの燃料消
費量が少ないほど燃費性能が良く、また、スロットル開
度が小さいほど出力性能は良い。

【００９３】なお、上記例においては、過渡時であるな
らばレスポンス性能を、定常時であるならば、燃費性能
及び出力の評価を行うようにしているが、他の評価項目
でもよく、要するに過渡時における動特性と、定常時に
おける静特性とを評価する。

【００９４】

【発明の効果】以上の説明から明らかなように、請求項
１記載の発明によれば、個体の評価条件を細分化し評価
用データを分類することにより、取得条件が同様な評価
用データを同一条件で比較可能になり、制御結果が異な
る作動域に現れる特性を持つ個体の評価精度を向上させ
ることができ、請求項２、５記載の発明によれば、モデ
ルを用いて評価値を算出することにより、全個体のデー
タを持たない評価領域に含まれるデータについても評価
対象とすることが可能となり、少ないデータ数での進化
が可能となり、請求項３、４記載の発明によれば、モデ
ルの基準値の算出の際、周辺領域を含めた平均、分散を
求めることにより、基準値の算出に関わる個体数を増加
させることが可能となり、基準値の精度を高めることが
でき、請求項６、７記載の発明によれば、各評価領域へ
の寄与度を統一することにより、評価領域に対して使用
者の特性に応じた重み付けが可能となり、その領域を積
極的に進化させることができ、請求項８〜１６記載の発
明によれば、本評価方法をエンジンなどに適用すること
により、ユーザの好み、技量および状態、使用環境、運
転状況等により、精度の高い客観的評価を実現すること
ができる。

【図面の簡単な説明】

【図１】本発明が適用される制御方法の基本概念を示す
構成図である。

【図２】図１の制御方法における処理の流れを説明する
ための図である。

【図３】制御対象を車両用エンジンとした場合、図１の
制御方法を実行する制御装置とエンジンとの関係を示す
模式図である。

【図４】図３の制御装置の構成図である。

【図５】図４の評価系の処理を説明するための図であ
る。

【図６】図４の評価系の処理を説明するための図であ
る。

【図７】図４の評価系の処理を説明するための図であ
る。

【図８】図４の評価系の処理を説明するための図であ
る。

【図９】図４の進化適応系の処理を説明するための図で
ある。

【図１０】図４の進化適応系の処理を説明するための図
である。

【図１１】図４の進化適応系の処理のうち遺伝的アルゴ
リズムによるモジュールの進化例を示すフロー図であ
る。

【図１２】図１１の処理を説明するための図である。

【図１３】図１１の処理を説明するための図である。

【図１４】図１１の処理を説明するための図である。

【図１５】本発明の遺伝的アルゴリズムの評価方法の１
実施形態を示すフロー図である。

【図１６】図１５の処理を説明するための図である。

【図１７】図１５の処理を説明するための図である。

【図１８】図１５の処理を説明するための図である。

【図１９】図１５の処理を説明するための図である。

【図２０】本発明をエンジンの評価方法に適用した例を
示すフロー図である。

【図２１】図２０の評価方法を説明するための図であ
る。

───────────────────────────────────────────────────── フロントページの続きＦターム(参考） 3G301 HA19 JA02 LA07 MA11 NA01 NB18 ND21 ND43 ND45 PA09Z PA11Z PE01Z PE08Z PF07Z 5H004 GA15 GA26 GB09 GB12 GB20 HA08 HA13 HA16 HB01 HB02 HB03 HB07 JA03 JA12 JB07 JB20 KA61 KA62 KC02 KC03 KC05 KC10 KC33 KD33 KD43 KD45 KD67 LA15 LA18

Claims

【特許請求の範囲】

【請求項１】複数の作動状態に制御結果が現れる制御対
象において遺伝的アルゴリズムにおける個体の評価を行
う際、細分化された評価領域に評価用データを分類し、
個体の評価値を客観的に算出することを特徴とする評価
方法。
【請求項２】前記評価領域に分類された評価用データを
用い、個体の評価値をある基準値に対する係数のモデル
により置き換えることを特徴とする請求項１記載の評価
方法。
【請求項３】前記評価値をモデル的に算出する際の基準
値を、評価用データの属する領域の周辺を含めた領域に
含まれるデータの平均値とすることを特徴とする請求項
２記載の評価方法。
【請求項４】前記評価値をモデル的に算出する際の基準
値を、評価用データの属する領域の周辺を含めた領域に
含まれるデータの平均値及び分散値とすることを特徴と
する請求項２記載の評価方法。
【請求項５】前記評価値をモデル的に算出する際、各評
価用データの基準値に対する係数から最小２乗法により
得られる値を個体の評価値とすることを特徴とする請求
項２ないし４のいずれかに記載の評価方法。
【請求項６】前記評価領域に分類された評価用データに
対し、各評価領域の評価値への寄与度が等しくなるよう
評価用データの変換を行うことを特徴とする請求項２な
いし５のいずれかに記載の評価方法。
【請求項７】前記評価領域に分類された評価用データに
対し、各評価領域ごとの平均値及び／又は分散値が等し
くなるよう評価用データの変換を行うことを特徴とする
請求項６記載の評価方法。
【請求項８】制御対象がエンジン、電動モータ、空調装
置、冷蔵庫又はロボットであることを特徴とする請求項
１ないし７のいずれかに記載の評価方法。
【請求項９】評価領域を細分化するパラメータとして、
ユーザの好み、技量および状態、使用環境、運転状態の
うち少なくとも１つを用いることを特徴とする請求項８
記載の評価方法。
【請求項１０】制御対象の評価方法を、過渡時における
動特性と、定常時における静特性とで異なるものとする
ことを特徴とする請求項８又は９記載の評価方法。
【請求項１１】前記動特性をレスポンス性能にて評価す
ることを特徴とする請求項１０記載の評価方法。
【請求項１２】制御対象がエンジンであって、前記レス
ポンス性能に関する個体の評価の際、スロットルの操作
方法に依存した走行パターンにより評価領域を細分化す
ることを特徴とする請求項１１記載の評価方法。
【請求項１３】前記レスポンス性能に関する局所的な評
価値を、エンジン回転数変化率を平均スロットル開度変
化率で割って算出することを特徴とする請求項１２記載
の評価方法。
【請求項１４】制御対象がエンジンであって、静特性を
燃費性能および出力のうち少なくとも１つにて評価する
ことを特徴とする請求項１０記載の評価方法。
【請求項１５】燃費性能に関する局所的な評価値を、そ
の評価領域において単位時間中に噴射する燃料噴射量と
することを特徴とする請求項１４記載の評価方法。
【請求項１６】出力に関する局所的な評価値を、その評
価領域におけるスロットル開度とすることを特徴とする
請求項１４記載の評価方法。