JP2000020103A - 遺伝的アルゴリズムの評価方法 - Google Patents

遺伝的アルゴリズムの評価方法

Info

Publication number
JP2000020103A
JP2000020103A JP10187181A JP18718198A JP2000020103A JP 2000020103 A JP2000020103 A JP 2000020103A JP 10187181 A JP10187181 A JP 10187181A JP 18718198 A JP18718198 A JP 18718198A JP 2000020103 A JP2000020103 A JP 2000020103A
Authority
JP
Japan
Prior art keywords
evaluation
value
area
data
control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10187181A
Other languages
English (en)
Inventor
Hajime Kita
一 喜多
Takaaki Shibata
卓明 芝田
Masashi Yamaguchi
昌志 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Motor Co Ltd
Original Assignee
Yamaha Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Motor Co Ltd filed Critical Yamaha Motor Co Ltd
Priority to JP10187181A priority Critical patent/JP2000020103A/ja
Priority to EP99112586A priority patent/EP0969385A3/en
Priority to US09/347,469 priority patent/US6721647B1/en
Publication of JP2000020103A publication Critical patent/JP2000020103A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Physiology (AREA)
  • Feedback Control In General (AREA)
  • Combined Controls Of Internal Combustion Engines (AREA)
  • Electrical Control Of Air Or Fuel Supplied To Internal-Combustion Engine (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

(57)【要約】 【課題】評価領域に全個体のデータを持たない際の評価
を可能とし、少ない評価数で効率良い客観的な評価を実
現する。 【解決手段】複数の作動状態に制御結果が現れる制御対
象において遺伝的アルゴリズムにおける個体の評価を行
う際、細分化された評価領域に評価用データを分類し、
個体の評価値を客観的に算出する。具体的には、前記評
価領域に分類された評価用データを用い、個体の評価値
をある基準値に対する係数のモデルにより置き換え、評
価値をモデル的に算出する際、各評価用データの基準値
に対する係数から最小2乗法により得られる値を個体の
評価値とする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、遺伝的アルゴリズ
ムを用いる制御方法において個体の評価を客観的に行う
技術分野に属する。
【0002】
【従来の技術及び発明が解決しようとする課題】従来か
ら、例えば、車両や家電製品等の製品の特性を制御する
場合、制御対象となる製品の特性は、開発、設計段階で
使用者の好みや使用状況を加味し、できるだけ広い範囲
のユーザーに適応するように決められている。しかし、
使用者は個々に特有の個性を持っており、その好みも千
差万別であるため、全てのユーザーが満足する特性を提
供することは不可能である。この問題を解決するため
に、ニューラルネットワークを用いて使用者の好みや使
用状況を推定し、遺伝的アルゴリズムを用いてユーザー
が満足し得る特性を実現する制御方法が試みられてい
る。
【0003】自然進化の過程を模倣して構築された遺伝
的アルゴリズムでは、一般的に同一世代内の個体をユー
ザが主観的に評価し、その評価値に基づいて遺伝的操作
を行うようにしている。しかしながら、遺伝的アルゴリ
ズムを、例えばエンジンのような複数の作動状態に制御
結果が現れる制御に適用する場合、入力条件により出力
が大きく異なるため、単純に1個体に1評価値を与え個
体を客観的に比較することは困難である。この問題の対
策として、細分化された評価領域に評価用データを分類
し、それを総合評価することにより均等な条件で個体の
比較を行うことは可能であるが、従来、この評価手法で
は、全個体のデータを持たない評価領域に対しデータが
そろうまで待つか、もしくはその領域については評価に
含めないなどの操作が必要になり、個体評価の点で効率
が悪いとともに、適正な評価が困難であるという問題を
有している。
【0004】本発明は、上記問題を解決するものであっ
て、エンジン等のような複数の作動状態に制御結果が現
れる制御に遺伝的アルゴリズムを適用し、個体の評価を
行う際に生じる上記の問題に対し、評価領域に全個体の
データを持たない際の評価を可能とし、少ない評価数で
効率良い客観的な評価を実現することができる評価方法
を提供することを目的とする。
【0005】
【課題を解決するための手段】そのために本発明の遺伝
的アルゴリズムの評価方法は、複数の作動状態に制御結
果が現れる制御対象において遺伝的アルゴリズムにおけ
る個体の評価を行う際、細分化された評価領域に評価用
データを分類し、個体の評価値を客観的に算出すること
を特徴とする。
【0006】
【発明の実施の形態】以下、本発明の実施の形態を図面
を参照しつつ説明する。図1は、本発明が適用される制
御方法の基本概念を示す構成図である。本発明は、エン
ジン、電動モータ、空調装置、冷蔵庫又はロボットなど
のように、複数の作動状態に制御結果が現れる制御対象
に遺伝的アルゴリズムを適用するものである。この制御
方法は、反射層、学習層、進化適応層の3つの制御層か
らなり、外部から制御すべき制御対象に関する情報(例
えば、動作状態に関する情報等)を入力し、この入力情
報に基づいて反射層で基本操作量を決定し、学習層及び
進化適応層で基本操作量に対する補正量を決定し、これ
ら基本操作量及び補正量から最終的な制御出力を出力す
る。以下、反射層、学習層及び進化適応層の機能につい
て説明する。
【0007】反射層は、制御対象に関する情報(以下、
外界情報という)と、外界情報に対する基本操作量との
関係式を、マップ、ファジィルール、ニューラルネット
ワーク又はサブサンプションアーキテクチャ等の形式の
制御系予め備えられている層であり、外界情報が入力さ
れると、上記した制御系から外界情報に対する基本操作
量を決定し出力する。なお、サブサンプションアーキテ
クチャとは、並列的な処理を行う行動型人工知能として
公知である。
【0008】進化適応層は、評価系と進化適応系との2
つの制御系からなる。評価系は、外界情報、ユーザの特
性(例えば、好み、技量、使用状態等)に関する情報、
使用状況の特性(例えば、使用環境の変化等)に関する
情報を入力し、これら外界情報等から制御すべき制御対
象を使用する使用者及び使用状況の特性を推定すると共
に、このユーザ及び使用状況の特性に基づいて進化適応
系における進化処理中の評価を行う。
【0009】進化適応系は、反射層で決定された基本操
作量を使用者及び使用状況の特性に合わせるように補正
するための複数の制御モジュールを備え、この制御モジ
ュールを評価系の判断に基づいて遺伝的に進化させて、
その時点で最適な少なくとも1つの制御モジュールを獲
得する。進化適応系は、最適な制御モジュールを獲得し
た後は、制御モジュールを最適なものに固定して、反射
層から出力される基本操作量を補正する進化補正値を出
力する。
【0010】学習層は、学習用と実行用に入れ替え可能
な2つの制御系を備え、実行用制御系で制御を実行して
いる間、学習用制御系で進化適応層の進化した最適制御
モジュールに関する入出力関係と、学習層の実行用制御
系の入出力関係とを合わせて学習する。学習用制御系で
の学習が終了すると、制御を実行している制御系と学習
後の制御系が入れ替わり、学習後の制御系で学習結果か
ら得られる制御モジュールによる制御を開始し、制御を
実行していた制御系が学習用として機能し始める。
【0011】進化適応層は、最適な制御モジュールに関
する情報を学習層に学習させた後は、その出力をゼロに
戻し、一定時間間隔で作動して、使用者の好み及び使用
環境のの評価と、制御モジュールの進化とを行い、進化
適応層の出力を加えた時の評価が、進化適応層の出力を
加えていない時の評価より優れている場合は、再度、学
習層に最適な制御モジュールに関する情報を学習させ
る。
【0012】なお、学習層における学習済みの制御モジ
ュールに関する情報は、ICカードやフロッピィディス
ク等の外部記憶手段に保存、読み出し可能にされてお
り、使用者が必要に応じて過去の最適制御モジュールに
関する情報を外部記憶手段から読み出して、その情報に
基づいて学習層で基本補正量を出力するようにしてい
る。
【0013】上記した各層の機能により、この制御方法
による制御出力は、制御すべき制御対象をユーザの好み
や使用環境の変化等の特性に合わせるべく刻々と変化
し、その結果、制御対象の特性は使用者及び使用状況の
特性に適応した動作に刻々と変化していく。この制御方
法により制御対象の特性がユーザ及び使用状況の特性に
適応して進化していく。
【0014】図2は、図1の制御方法における処理の流
れを説明するための図である。初期状態では、学習層の
出力はゼロであり(ステップa)、従って、制御対象の
使用が開始された直後は反射層からの基本操作量だけで
制御対象は制御される。制御対象の使用が開始される
と、進化適応層は、使用者及び/又は使用状況の特性を
評価し、この評価値に応じてその制御モジュールを進化
させる(ステップb)。進化適応層は、各制御モジュー
ルを遺伝的に進化させることにより、その時点で最も望
ましい1つの制御モジュールを獲得する(ステップ
c)。
【0015】進化適応層は、その制御モジュールをステ
ップcで得た最も望ましい制御モジュールに固定し、そ
の制御モジュールに基づいて進化系補正値を出力して、
反射層から出力される基本操作量を補正する。学習層で
は、進化適応層が最適制御モジュールに固定された時の
進化適応層の入出力関係と学習層の実行用制御系の入出
力関係を学習用制御系で合わせて学習する。なお、初期
状態では学習層の実行用制御系の出力はゼロであるが、
学習後は反射層からの基本操作量を学習層からの基本補
正量と進化適応層からの進化補正量で補正する(ステッ
プd)。
【0016】反射層からの基本操作量に学習層における
学習用制御系の出力を加えた値と、実際の制御出力(基
本操作量+基本補正量+進化補正量)との差がしきい値
より小さくなった時点で学習層における学習用制御系は
学習を終了し、学習用制御系と実行用制御系が入れ替わ
って、学習後の制御系が実行用として機能し、制御を実
行していた制御系が学習用として機能し(ステップ
e)、反射層と学習層とによる制御が行われる(ステッ
プf)。
【0017】進化適応層は、最適制御モジュールに関す
る情報を学習層に学習させた後、一定時間間隔で作動
し、学習層の制御則の経時的なずれを評価する(ステッ
プg)。具体的には、進化適応層の制御モジュールを遺
伝的に進化させる時の初期世代において最大適応度の改
善がみられない場合には、制御層の制御則のずれはない
ものとしてステップfに移行して反射層と学習層とによ
る制御を継続し、最大適応度の改善がみられた場合に
は、ステップbに移行して進化適応層で新たな最適制御
モジュールの獲得を行う。
【0018】次に、上記した制御方法について、制御対
象として車両用エンジンを例に挙げてさらに具体的に説
明する。図3は、図1の制御方法を実行する制御装置1
0とエンジン1との関係を示す模式図である。制御装置
10には、エンジン回転数、吸気負圧、スロットル開
度、スロットル開度変化率、大気圧、吸気温度、冷却水
温、ギヤポジション等の情報が入力され、これら入力情
報に基づいて、燃料噴射装置、吸気制御バルブ、吸気バ
ルブ、排気バルブ、排気制御バルブに制御信号が出力さ
れ、エンジン制御を行うようにしている。
【0019】図4は、図3の制御装置の構成図である。
この制御装置10は上述した反射層、学習層、進化適応
層の3つの制御層からなる。反射層には、エンジン回転
数、吸気負圧、スロットル開度、スロットル開度変化
率、大気圧、吸気温度、冷却水温等の信号が入力され、
これらの信号に基づいて予め決められた燃料噴射モデル
から燃料噴射量の制御操作量が決定され出力される。
【0020】進化適応層は評価系と進化適応系とからな
る。評価系は、一定時間内の各ギヤポジションにおける
最高回転数の分布パターン(図5及び図6参照)と走行
状態指数Pとの関係を学習したニューラルネットワーク
(図7参照)を備えており、ギヤポジション信号とエン
ジン回転数信号を入力し、前記入力情報から前記ニュー
ラルネットワークにより走行状態指数Pを決定する。例
えば、スポーティな走行を好む使用者は、低速のギヤで
高い回転数までエンジンを回す傾向にあるため、その分
布パターンは図5(a)に示すようになり、また、マイ
ルドな走行を好む使用者は、早めに高速のギヤに変えて
いく傾向にあるため、その分布パターンは図5(b)に
示すようになる。従って、図7に示したニューラルネッ
トワークで、図5(a)に示す分布パターンの時に走行
状態指数Pが大きな値となり、また、図5(b)に示す
分布パターンの時に走行状態指数Pが小さな値となるよ
うに予め学習させておくと、前記ニューラルネットワー
クから得られる走行状態指数Pは、使用者の走行に対す
る好みがスポーティであればある程大きくなり、マイル
ドであればある程小さくなり、使用者の好みが反映した
ものになる。
【0021】また、図6(a)に示すように、一定時間
内に1速から6速までの各ギヤを使用した場合には走行
状態指数Pの値が大となり、図6(b)に示すように、
低速のギヤばかりを使用した場合には走行状態指数Pの
値がやや大となり、図6(c)に示すように、高速のギ
ヤばかりを使用した場合には走行状態指数Pの値が小と
なるように前記ニューラルネットワークで学習しておけ
ば、通常、車両では、通常走行の場合には各ギヤを使用
し、渋滞走行時には低速ギヤばかりを使用し、また、高
速走行時には高速ギヤばかりを使用するので、ニューラ
ルネットワークで得られる走行状態指数Pに基づいて、
例えば、図6(a)の場合は通常走行であり、図6
(b)の場合は渋滞路走行であり、図6(c)の場合は
高速道路走行であることを推定できることになる。
【0022】評価系は、この走行状態指数Pから、その
時の走行状況を推定し、かつ、使用者の好みが燃費性重
視か、加速性重視かを判断して加速度重視割合γを決定
する。加速度重視割合γは、図8に示すように、走行状
態指数Pにほぼ比例して設定されるが、最高回転数に達
するまでの時間が短い時には加速度重視割合γは大き
く、最高回転数に達するまでの時間が長い時には加速度
重視割合γは小さな値となる。
【0023】進化適応系は、燃費が最良となるような燃
料噴射制御則の獲得を目指す燃費モジュール及び出力が
最高となるような燃料噴射制御則の獲得を目指すパワー
モジュールとからなる下位モジュールと、使用者の好み
に合わせて運転状態に応じた前記燃費モジュールと前記
パワーモジュールの出力比の獲得を目指すコントロール
モジュールとを備えている。前記各モジュールは、図9
に示すように、各々2入力1出力の階層型ニューラルネ
ットワークで構成され、燃費モジュール及びパワーモジ
ュールは、正規化エンジン回転数と正規化スロットル開
度を入力して進化補正量の1次出力値を出力し、コント
ロールモジュールは正規化スロットル開度と正規化スロ
ットル開度変化率を入力して下位モジュール(燃費モジ
ュール及びパワーモジュール)の出力比を出力すること
で進化補正量の最終出力値を決定する。
【0024】前記燃費モジュール及びパワーモジュール
は、図10に示すように運転状態や使用者の好みに関係
なく、それぞれ燃費が最良になる空燃比と、出力が最高
になる空燃比が得られるような空燃比補正量を獲得する
よう各ニューラルネットワークの結合係数を遺伝的アル
ゴリズムを用いて順番に自律的に進化させる。これに対
してコントロールモジュールは、最良燃費空燃比と最良
出力空燃比の間で、使用者の好みに合った燃費モジュー
ル及びパワーモジュールの出力比を獲得するように、そ
のニューラルネットワークの結合係数を遺伝的アルゴリ
ズムを用いて自律的に進化させる。
【0025】次に、遺伝的アルゴリズムによるモジュー
ルの進化について説明する。図11は燃費モジュールの
進化の例を説明するためのフロー図、図12は図11の
処理を説明するための図である。先ず、燃費モジュール
を構成するニューラルネットワークの結合係数を遺伝子
としてコーディングして、複数の個体a(j)(本例で
は9個の個体)からなる第1世代を生成する(ステップ
1)。このとき、個体群に進化適応層の出力をゼロにで
きる個体を一つ含ませることにより、進化前の性能を維
持しながら個体数に制限がある場合でも進化の過程で個
体群の多様性を保つことができる。
【0026】次に、ステップ1で生成された個体a
(j)の中の1つ、例えば、個体a(1)に対して、燃
費モジュールのニューラルネットワークを用いて実際の
入力情報(エンジン回転数及びスロットル開度)に対す
るニューラルネットワークの出力xを決定し(ステップ
2)、さらにこの出力を下式を用いて線形変換して個体
a(1)に対する燃費モジュールの出力yf(1)を決
定する。 yf(n)=2×Gx(n)−G ここで、x(n)は燃費モジュールにおけるニューラル
ネットワークの出力、Gは進化適応層出力ゲイン、nは
個体である。このように、ニューラルネットワークの出
力xを線形変換して用いることにより、燃費モジュール
からの出力yfが極端に大きな値になることがなく、全
体として進化がすこしづつ進むようになり、エンジンの
挙動が評価や進化のために極端に変動することがなくな
る。
【0027】個体a(1)に対する燃費モジュールの出
力yf(1)を決定した後、パワーモジュールの出力y
a及びコントロールモジュールの出力ORを用いて下式
に基づいて進化適応層の出力(評価用補正値Ya
(n))を決定する(ステップ4)。 Ya(n)=OR×ya+(1−OR)×yf なお、燃費モジュールの進化処理中は、パワーモジュー
ル及びコントロールモジュールの結合係数は固定されて
いる。上式に示すように、コントロールモジュールの出
力ORは、燃費モジュールの出力yfとパワーモジュー
ルの出力yaとの比率であり、従って、コントロールモ
ジュールの出力ORが1の場合は、進化適応層の出力は
パワーモジュールの出力となり、また、前記出力ORが
0の場合は進化適応層の出力は燃費モジュールの出力と
なる。
【0028】次に、個体a(1)に対する進化適応層の
出力Ya(1)を実際に進化適応層から出力し、この評
価用補正値Ya(1)と学習層からの基本補正値Ybと
を反射層からの基本操作量に加算し、この補正値Ya
(1)+Ybにより補正された制御出力でエンジンを作
動させる(ステップ5)。個体a(1)を用いて実際に
制御を行いながら、進化適応層の評価系ではこの制御の
結果に関する情報をフィードバックして、個体a(1)
に対する評価値(ここでは燃料消費量)を決定する(ス
テップ6)。
【0029】上記したステップ1からステップ6までの
処理は、ステップ1で生成された9個の個体a(1)〜
a(9)に対する全ての評価値の算出を1サイクルの予
備評価処理として、この予備評価処理を予め決められた
所定のサイクル行うまで繰り返し行われ(ステップ
7)、全ての個体に対して所定サイクル分の評価値を算
出た後に各個体の総合評価処理(ステップ8)に進む。
この総合評価処理では、各個体毎に、上記した評価値算
出サイクル中の総走行距離を全ての評価値の合計(ここ
では総燃料消費量)で割った総合評価値を算出し、この
総合評価値に基づいて各個体の適応度の評価を行う。
【0030】図13に示すように、各個体を用いた制御
を順番に所定回数行い各個体を時分割により擬似的に並
列的に作動させることにより、刻々と変化する走行状況
のもとでも各個体の評価をほぼ同じ条件で公平に行うこ
とが可能となり、オンライン評価、すなわち車両走行中
の評価が可能になる。
【0031】上記した総合評価処理が終了した後、その
個体の属する世代が最終世代か否かを判断し(ステップ
9)、最終世代でなければ親個体の選択を行う(ステッ
プ10)。この選択にはルーレット式選択方式を用い、
各個体の適応度に比例した確率で、確率的にいくつかの
親個体を選択する。なお、この時、厳密に世代交代を適
用しすぎると、評価の高い個体を破壊してしまう恐れが
あるため、エリート(評価の最も高い個体)を無条件に
次世代に残すエリート保存戦略も合わせて用いる。
【0032】親個体の選択が終了すると、選択された個
体を親個体として交叉を行い、9個の子個体からなる第
2世代を生成する(ステップ11)。個体間の交叉に
は、1点交叉、2点交叉または正規分布交叉等の公知の
手法を用いる。また、生成された9個の子個体に対して
一定の確率で、ランダムに遺伝子(結合度)の値を変更
し、遺伝子の突然変異を発生させる。なお、これら9個
の子個体には、進化適応層の出力をゼロにできる個体を
一つ含むようにする。
【0033】上記した処理により、第2世代が生成した
後、再びステップ2からの予備評価処理を繰り返す。上
記処理は、生成する世代が予め決められた最終世代に達
するまで繰り返し行われる。これにより、各世代を構成
する子個体は評価系の評価に沿って、すなわち燃費モジ
ュールの場合には燃費が最良となるような燃料噴射制御
則を獲得するように進化していく。ステップ9で最終世
代に達したと判断された場合には、その世代の9個の子
個体の中から適応度の最も高い個体(最適個体)、すな
わちエリートを一つ選び出し(ステップ12)、燃費モ
ジュールのニューラルネットワークの結合係数を、前記
した最適個体を構成する遺伝子で固定し(ステップ1
3)、学習層の学習用制御モジュールに対する学習処理
に移行する。
【0034】パワーモジュール及びコントロールモジュ
ールの進化処理においても、上記した燃費モジュールと
同様の進化処理が行われるが、パワーモジュールにおけ
る各個体に対する総合評価値は、評価値算出サイクル中
の平均エンジン回転数を平均スロットル開度で割って算
出される。これにより、パワーモジュールの進化処理中
の各世代を構成する子個体は評価系の評価に沿って、す
なわち出力が最良となるような燃料噴射制御則を獲得す
るように進化していく。また、コントロールモジュール
における各個体に対する総合評価値CNTは、評価値算
出サイクル中の燃費評価値をFC、レスポンス評価値を
RP、加速度重視割合をγと、基準燃費評価値をFCba
se、基準レスポンス評価値をRPbaseとすると、 CNT=(1−γ)×Scale×(FC−FCbase)/F
Cbase+γ×(RP−RPbase)/RPbase となる。ここで、Scaleは燃費評価値とレスポンス評価
値とのバランスとるための係数である。また、燃費評価
値FCは上記した燃費モジュールにおける総合評価値と
同様に算出され、レスポンス評価値RPは、所定のしき
い値より大きいスロットル開度の変化が所定時間続いた
ら加速動作とみなして、そのときの速度変化をスロット
ル開度変化率で割り、これを所定の評価値算出サイクル
の時間内の各加速毎に算出したものの平均値とする。
【0035】上記したように、燃費評価値とレスポンス
評価値を使用者の好みに基づいて決められた加速度重視
割合γの比率に合わせて評価することにより、コントロ
ールモジュールは、使用者の好みに合わせて運転状態に
応じた燃費モジュールとパワーモジュールの出力比を獲
得できるように進化していくことになる。
【0036】次に学習層について説明する。学習層は、
図4に示すように、進化適応層の制御モジュールに対応
する種類の制御モジュール群を備え、各制御モジュール
群は、学習用ニューラルネットワークと実行用ニューラ
ルネットワークからなっている。この学習層における制
御モジュールは、進化適応層の対応する制御モジュール
が所定世代数進化する毎に、その学習用のニューラルネ
ットワークで、進化適応層の入力と出力との関係を、学
習層の実行用として機能しているニューラルネットワー
クの入力と出力との関係と合わせて学習する。
【0037】上記した学習は、学習中の学習用ニューラ
ルネットワークの出力と制御出力との誤差がしきい値よ
り小さくなった時点で終了し、その後、学習用のニュー
ラルネットワークは実行用になり、もとの制御用のニュ
ーラルネットワークが学習用となる。この学習は、上記
したように進化適応層における制御モジュールの進化処
理が所定の世代数行われる毎に行われる。従って、一つ
の制御モジュールに対して進化処理が始まってから進化
が収束するまでの間は、所定の世代数進化処理が行われ
る毎に学習が行われるようになる。このように、各制御
モジュールに対して進化と学習を交互に繰り返すことに
より、図14に示すように、学習を行わず進化処理のみ
で進化させる場合に比べて評価値の向上が早くなり進化
を早く進ませることができる。
【0038】次に、本発明の遺伝的アルゴリズムのオン
ライン評価方法について説明する。図15は、その1実
施形態である基本概念を示すフロー図、図16は評価領
域を説明するための図である。
【0039】先ず、個体jの評価用データを取得し、評
価用データを細分化された評価領域i(図16)へと分
類し(ステップ1)、その領域iにおけるk番目のデー
タをf(i,j,k)とする。なお、本例では評価領域
は、2次元のテーブルで表され、評価用データを分類す
るようにしているが、評価条件(パラメータ)を用いて
2次元或は3次元以上の領域に細分化してもよい。
【0040】次に、ステップ2でモデルの基準値を評価
領域ごとに算出し、その値はその領域に含まれるデータ
の平均値とする。ここで、平均値の算出に加わる個体数
を増加させ平均値の精度を向上させるため、ある評価領
域iにおける基準値は、その周辺領域を含めた領域に含
まれる評価用データの平均値とする。すなわち、領域i
での平均値は、領域iの周辺領域を含む図16に示す網
目領域i′(集合:U(i))についての平均値とし、
平均値は(数1)式で表される。
【0041】
【数1】
【0042】次に、ステップ3で、各評価領域の評価値
への寄与度を統一するため、各評価領域における平均値
・分散が等しくなるように評価用データの変換を行う。
この処理は、図17及び図18に示すように、各領域で
の評価データのそれぞれの平均値と分散が異なっている
ため、これらを規格化(正規化)することにより各評価
領域の評価値(後述する最小2乗法で推定)への寄与度
を均一にするためである。先ず、平均値を規格化するた
め、(数1)式を用い(数2)式に従い各データをf′
(i,j,k)へ変換する(図17参照)。
【0043】
【数2】
【0044】さらに、分散を規格化する。平均値を変え
ないデータ変換は、bを変換係数として(数3式)によ
り表される。
【0045】
【数3】
【0046】ここで、f′(i)は平均値規格化のため
のデータ変換後の領域iにおける平均値であり、領域i
におけるデータ数をN(i)として(数4)式で表され
る。
【0047】
【数4】
【0048】データ変換後の分散c″は、(数5)式に
より表される。
【0049】
【数5】
【0050】ここで、f″(i)は分散を規格化のため
のデータ変換後の領域iにおける平均値であり、(数
6)式で表され、規格化する分散を1とすると、(数
7)式により表される。
【0051】
【数6】
【0052】
【数7】
【0053】(数7)式において、データ変換前の分散
c′を用いると、(数8)式により表される。bは変換
係数である。
【0054】
【数8】
【0055】以上から(数3)式を書き直すと、最終的
に評価用データは(数9)式に変換される(図18参
照)。
【0056】
【数9】
【0057】次に、ステップ4で、各評価用データの基
準値に対する係数から評価値を得る。そのために、各個
体のそれぞれの評価領域における評価用データを、係数
α(j)、基準値f″(i)を用いて(数10)式のよ
うに基準値の係数倍としてモデル化する。
【0058】
【数10】
【0059】次に、係数α(j)を個体jに関するデー
タf″(i,j)から最小2乗法で推測する。これは
(数11)式の残差の二乗を最小値にするα(j)であ
る(図19参照)。
【0060】
【数11】
【0061】ただし、個体jの評価値F(j)を各領域
での評価用データα(j)f″(i)のN(i)の重み
付け和で与えると、評価値F(j)は(数12)式で表
され、
【0062】
【数12】
【0063】(数12)式より、F(j)の比較は単に
α(j)の比較に等しいことから、α(j)を評価値と
することができ、α(j)が大きいほど評価が高いと判
定する。
【0064】なお、上記実施形態においては、評価領域
に分類された評価用データに対し、各評価領域ごとの平
均値及び分散が等しくなるように評価用データの変換を
行うようにしているが、平均値または分散が等しくなる
ように評価用データの変換を行うようにしてもよい。
【0065】また、上記実施形態においては、平均値の
算出に周辺領域に含まれる評価用データを用いて行うよ
うにしているが、各評価領域ごとの平均値及び/又は分
散が等しくなるような評価用データの変換は、その周辺
領域に含まれる評価用データを用いて行うようにしても
よい。以下にこれを説明する。
【0066】領域iでの平均値は、領域iの周辺領域を
含む図16に示す網目領域i′(集合:U(i))につ
いての平均値とし、平均値は(数13)式で表される。
【0067】
【数13】
【0068】先ず、平均値を規格化するため、(数1
3)式を用い(数14)式に従い各データをf′(i,
j,k)へ変換する。
【0069】
【数14】
【0070】さらに、分散を規格化する。平均値を変え
ないデータ変換は、bを変換係数として(数15式)に
より表される。
【0071】
【数15】
【0072】ここで、f′(i)は平均値規格化のため
のデータ変換後の領域i′における平均値であり、(数
16)式で表される。
【0073】
【数16】
【0074】データ変換後の分散c″は、(数17)式
により表される。
【0075】
【数17】
【0076】ここで、f″(i)は分散を規格化のため
のデータ変換後の領域i′における平均値であり、(数
18)式で表され、規格化する分散を1とすると、(数
19)式により表される。
【0077】
【数18】
【0078】
【数19】
【0079】(数19)式において、データ変換前の分
散c′を用いると、(数20)式により表される。
【0080】
【数20】
【0081】以上から(数15)式を書き直すと、最終
的に評価用データは(数21)式に変換される。
【0082】
【数21】
【0083】次に、各個体のそれぞれの評価領域におけ
る評価用データを、係数α(j)、基準値f″(i)を
用いて(数22)式のように基準値の係数倍としてモデ
ル化する。
【0084】
【数22】
【0085】次に、係数α(j)を個体jに関するデー
タf″(i,j)から最小2乗法で推測する。これは
(数23)式の残差の二乗を最小値にするα(j)であ
る。
【0086】
【数23】
【0087】ただし、個体jの評価値F(j)を各領域
での評価用データα(j)f″(i)のN(i)の重み
付け和で与えると、評価値F(j)は(数24)式で表
され、
【0088】
【数24】
【0089】(数24)式より、F(j)の比較は単に
α(j)の比較に等しいことから、α(j)を評価値と
することができ、α(j)が大きいほど評価が高いと判
定する。
【0090】次に、本発明をエンジンの評価方法に適用
した例について説明する。エンジン特性のオンライン評
価をするにあたり、レスポンス(応答)性能、燃費性能
及び出力に関する個体は、それぞれ独立した制御モジュ
ールであり、異なる制御モジュール間での比較は行われ
ない。すなわち、図20に示すように、それぞれの制御
モジュールの評価は、走行状態を判定し、過渡時である
ならばレスポンス性能を評価し、定常時であるならば、
燃費性能及び出力の評価を行う。
【0091】図21(A)は、レスポンス性能の場合
で、評価領域は加速開始エンジン回転数と平均スロット
ル開度変化率により作成し、評価値はレスポンス度とす
る。局所的なレスポンス度は、スロットル開度変化率が
正の値である期間中の、エンジン回転数変化率を平均ス
ロットル開度変化率で割った値であり、単位時間あたり
のスロットル開度変化量に対し、エンジン回転数の変化
量が大きいほどレスポンス度は大きな値となる。スロッ
トル開度に対するエンジン回転数の追随性、つまりレス
ポンス性能は、加速中の空燃比に大きく影響される。加
速開始時のエンジン回転数が同じであるならば、加速中
の空燃比はスロットルの操作方法により決定される。こ
のことから、スロットルの操作方法に依存するスロット
ル開度変化率と、加速開始エンジン回転数、すなわちス
ロットルの操作方法に依存した走行パターンにより評価
領域を細分化するようにしている。
【0092】図21(B)は、燃費性能及び出力の場合
で、評価領域はいずれもエンジントルクとエンジン回転
数により作成し、局所的な評価値はそれぞれ燃料消費
量、スロットル開度とする。エンジントルク及びエンジ
ン回転数が同じ条件のもとで、単位時間当たりの燃料消
費量が少ないほど燃費性能が良く、また、スロットル開
度が小さいほど出力性能は良い。
【0093】なお、上記例においては、過渡時であるな
らばレスポンス性能を、定常時であるならば、燃費性能
及び出力の評価を行うようにしているが、他の評価項目
でもよく、要するに過渡時における動特性と、定常時に
おける静特性とを評価する。
【0094】
【発明の効果】以上の説明から明らかなように、請求項
1記載の発明によれば、個体の評価条件を細分化し評価
用データを分類することにより、取得条件が同様な評価
用データを同一条件で比較可能になり、制御結果が異な
る作動域に現れる特性を持つ個体の評価精度を向上させ
ることができ、請求項2、5記載の発明によれば、モデ
ルを用いて評価値を算出することにより、全個体のデー
タを持たない評価領域に含まれるデータについても評価
対象とすることが可能となり、少ないデータ数での進化
が可能となり、請求項3、4記載の発明によれば、モデ
ルの基準値の算出の際、周辺領域を含めた平均、分散を
求めることにより、基準値の算出に関わる個体数を増加
させることが可能となり、基準値の精度を高めることが
でき、請求項6、7記載の発明によれば、各評価領域へ
の寄与度を統一することにより、評価領域に対して使用
者の特性に応じた重み付けが可能となり、その領域を積
極的に進化させることができ、請求項8〜16記載の発
明によれば、本評価方法をエンジンなどに適用すること
により、ユーザの好み、技量および状態、使用環境、運
転状況等により、精度の高い客観的評価を実現すること
ができる。
【図面の簡単な説明】
【図1】本発明が適用される制御方法の基本概念を示す
構成図である。
【図2】図1の制御方法における処理の流れを説明する
ための図である。
【図3】制御対象を車両用エンジンとした場合、図1の
制御方法を実行する制御装置とエンジンとの関係を示す
模式図である。
【図4】図3の制御装置の構成図である。
【図5】図4の評価系の処理を説明するための図であ
る。
【図6】図4の評価系の処理を説明するための図であ
る。
【図7】図4の評価系の処理を説明するための図であ
る。
【図8】図4の評価系の処理を説明するための図であ
る。
【図9】図4の進化適応系の処理を説明するための図で
ある。
【図10】図4の進化適応系の処理を説明するための図
である。
【図11】図4の進化適応系の処理のうち遺伝的アルゴ
リズムによるモジュールの進化例を示すフロー図であ
る。
【図12】図11の処理を説明するための図である。
【図13】図11の処理を説明するための図である。
【図14】図11の処理を説明するための図である。
【図15】本発明の遺伝的アルゴリズムの評価方法の1
実施形態を示すフロー図である。
【図16】図15の処理を説明するための図である。
【図17】図15の処理を説明するための図である。
【図18】図15の処理を説明するための図である。
【図19】図15の処理を説明するための図である。
【図20】本発明をエンジンの評価方法に適用した例を
示すフロー図である。
【図21】図20の評価方法を説明するための図であ
る。
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 3G301 HA19 JA02 LA07 MA11 NA01 NB18 ND21 ND43 ND45 PA09Z PA11Z PE01Z PE08Z PF07Z 5H004 GA15 GA26 GB09 GB12 GB20 HA08 HA13 HA16 HB01 HB02 HB03 HB07 JA03 JA12 JB07 JB20 KA61 KA62 KC02 KC03 KC05 KC10 KC33 KD33 KD43 KD45 KD67 LA15 LA18

Claims (16)

    【特許請求の範囲】
  1. 【請求項1】複数の作動状態に制御結果が現れる制御対
    象において遺伝的アルゴリズムにおける個体の評価を行
    う際、細分化された評価領域に評価用データを分類し、
    個体の評価値を客観的に算出することを特徴とする評価
    方法。
  2. 【請求項2】前記評価領域に分類された評価用データを
    用い、個体の評価値をある基準値に対する係数のモデル
    により置き換えることを特徴とする請求項1記載の評価
    方法。
  3. 【請求項3】前記評価値をモデル的に算出する際の基準
    値を、評価用データの属する領域の周辺を含めた領域に
    含まれるデータの平均値とすることを特徴とする請求項
    2記載の評価方法。
  4. 【請求項4】前記評価値をモデル的に算出する際の基準
    値を、評価用データの属する領域の周辺を含めた領域に
    含まれるデータの平均値及び分散値とすることを特徴と
    する請求項2記載の評価方法。
  5. 【請求項5】前記評価値をモデル的に算出する際、各評
    価用データの基準値に対する係数から最小2乗法により
    得られる値を個体の評価値とすることを特徴とする請求
    項2ないし4のいずれかに記載の評価方法。
  6. 【請求項6】前記評価領域に分類された評価用データに
    対し、各評価領域の評価値への寄与度が等しくなるよう
    評価用データの変換を行うことを特徴とする請求項2な
    いし5のいずれかに記載の評価方法。
  7. 【請求項7】前記評価領域に分類された評価用データに
    対し、各評価領域ごとの平均値及び/又は分散値が等し
    くなるよう評価用データの変換を行うことを特徴とする
    請求項6記載の評価方法。
  8. 【請求項8】制御対象がエンジン、電動モータ、空調装
    置、冷蔵庫又はロボットであることを特徴とする請求項
    1ないし7のいずれかに記載の評価方法。
  9. 【請求項9】評価領域を細分化するパラメータとして、
    ユーザの好み、技量および状態、使用環境、運転状態の
    うち少なくとも1つを用いることを特徴とする請求項8
    記載の評価方法。
  10. 【請求項10】制御対象の評価方法を、過渡時における
    動特性と、定常時における静特性とで異なるものとする
    ことを特徴とする請求項8又は9記載の評価方法。
  11. 【請求項11】前記動特性をレスポンス性能にて評価す
    ることを特徴とする請求項10記載の評価方法。
  12. 【請求項12】制御対象がエンジンであって、前記レス
    ポンス性能に関する個体の評価の際、スロットルの操作
    方法に依存した走行パターンにより評価領域を細分化す
    ることを特徴とする請求項11記載の評価方法。
  13. 【請求項13】前記レスポンス性能に関する局所的な評
    価値を、エンジン回転数変化率を平均スロットル開度変
    化率で割って算出することを特徴とする請求項12記載
    の評価方法。
  14. 【請求項14】制御対象がエンジンであって、静特性を
    燃費性能および出力のうち少なくとも1つにて評価する
    ことを特徴とする請求項10記載の評価方法。
  15. 【請求項15】燃費性能に関する局所的な評価値を、そ
    の評価領域において単位時間中に噴射する燃料噴射量と
    することを特徴とする請求項14記載の評価方法。
  16. 【請求項16】出力に関する局所的な評価値を、その評
    価領域におけるスロットル開度とすることを特徴とする
    請求項14記載の評価方法。
JP10187181A 1998-07-02 1998-07-02 遺伝的アルゴリズムの評価方法 Pending JP2000020103A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP10187181A JP2000020103A (ja) 1998-07-02 1998-07-02 遺伝的アルゴリズムの評価方法
EP99112586A EP0969385A3 (en) 1998-07-02 1999-07-01 Evaluation method for a hereditary algorithm
US09/347,469 US6721647B1 (en) 1998-07-02 1999-07-02 Method for evaluation of a genetic algorithm

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10187181A JP2000020103A (ja) 1998-07-02 1998-07-02 遺伝的アルゴリズムの評価方法

Publications (1)

Publication Number Publication Date
JP2000020103A true JP2000020103A (ja) 2000-01-21

Family

ID=16201535

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10187181A Pending JP2000020103A (ja) 1998-07-02 1998-07-02 遺伝的アルゴリズムの評価方法

Country Status (3)

Country Link
US (1) US6721647B1 (ja)
EP (1) EP0969385A3 (ja)
JP (1) JP2000020103A (ja)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6961625B2 (en) 2000-04-04 2005-11-01 Yamaha Hatsudoki Kabushiki Kaisha Characteristic control device for control subject
JP2002251597A (ja) * 2001-02-23 2002-09-06 Yamaha Motor Co Ltd 最適解探索装置、最適化アルゴリズムによる制御対象の制御装置及び最適解探索プログラム
US20040044633A1 (en) * 2002-08-29 2004-03-04 Chen Thomas W. System and method for solving an optimization problem using a neural-network-based genetic algorithm technique
EP1611546B1 (en) * 2003-04-04 2013-01-02 Icosystem Corporation Methods and systems for interactive evolutionary computing (iec)
US7333960B2 (en) 2003-08-01 2008-02-19 Icosystem Corporation Methods and systems for applying genetic operators to determine system conditions
US7356518B2 (en) * 2003-08-27 2008-04-08 Icosystem Corporation Methods and systems for multi-participant interactive evolutionary computing
US7707220B2 (en) * 2004-07-06 2010-04-27 Icosystem Corporation Methods and apparatus for interactive searching techniques
WO2006014454A1 (en) * 2004-07-06 2006-02-09 Icosystem Corporation Methods and apparatus for query refinement using genetic algorithms
US7291934B2 (en) * 2005-08-30 2007-11-06 Caterpillar Inc. Machine with an electrical system
US8423323B2 (en) * 2005-09-21 2013-04-16 Icosystem Corporation System and method for aiding product design and quantifying acceptance
US7461035B2 (en) * 2005-10-26 2008-12-02 Motorola, Inc. Path determination facilitation method
JP4225314B2 (ja) * 2005-12-26 2009-02-18 トヨタ自動車株式会社 ハイブリッド車両
WO2008002906A2 (en) * 2006-06-26 2008-01-03 Icosystem Corporation Methods and systems for interactive customization of avatars and other animate or inanimate items in video games
US7792816B2 (en) * 2007-02-01 2010-09-07 Icosystem Corporation Method and system for fast, generic, online and offline, multi-source text analysis and visualization
KR101399199B1 (ko) * 2007-07-16 2014-05-27 삼성전자주식회사 소프트웨어 로봇의 유전자 코드 구성 방법
EP2666689A1 (en) * 2011-01-20 2013-11-27 Hino Motors Ltd. Regenerative control device, hybrid automobile, regenerative control method, and program
US10771329B1 (en) 2014-03-24 2020-09-08 Amazon Technologies, Inc. Automated service tuning
US11074503B2 (en) 2017-09-06 2021-07-27 SparkCognition, Inc. Execution of a genetic algorithm having variable epoch size with selective execution of a training algorithm
US11106978B2 (en) 2017-09-08 2021-08-31 SparkCognition, Inc. Execution of a genetic algorithm with variable evolutionary weights of topological parameters for neural network generation and training
US10635978B2 (en) * 2017-10-26 2020-04-28 SparkCognition, Inc. Ensembling of neural network models
JP6593560B1 (ja) * 2019-02-15 2019-10-23 トヨタ自動車株式会社 内燃機関の失火検出装置、内燃機関の失火検出システム、データ解析装置、および内燃機関の制御装置
CN112304831B (zh) * 2020-10-08 2021-09-24 大连理工大学 基于质量守恒的学生行为对教室内pm2.5浓度的计算方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4935877A (en) * 1988-05-20 1990-06-19 Koza John R Non-linear genetic algorithms for solving problems
JPH10154003A (ja) * 1996-09-27 1998-06-09 Yamaha Motor Co Ltd 進化的制御方式

Also Published As

Publication number Publication date
EP0969385A2 (en) 2000-01-05
EP0969385A3 (en) 2004-08-04
US6721647B1 (en) 2004-04-13

Similar Documents

Publication Publication Date Title
JP2000020103A (ja) 遺伝的アルゴリズムの評価方法
US7062333B2 (en) Optimal solution search device, device for controlling controlled object by optimizing algorithm, and optimal solution search program
JP3825845B2 (ja) 進化的制御方式
JP2000250604A (ja) 特性最適化方法における最適化の協調方法
CN114460941B (zh) 一种基于改进麻雀搜索算法的机器人路径规划方法及系统
CN111047085A (zh) 一种基于元学习的混合动力车辆工况预测方法
US6529816B1 (en) Evolutionary controlling system for motor
JPH11327606A (ja) 総合制御方式
CN113830097B (zh) 车辆、模型学习系统以及服务器
CN111597750A (zh) 一种基于bp神经网络的混合动力汽车能量管理方法
CN112581264A (zh) 一种基于蝗虫算法优化mlp神经网络的信用风险预测方法
CN115470862A (zh) 动态自适应负荷预测模型组合方法
CN114819316A (zh) 一种面向多智能体任务规划的复杂优化方法
JP2009129366A (ja) 車両の感性推定システム
JPH0298738A (ja) 知識コンパイル・パターン型推論システム
JPH11353298A (ja) 遺伝的アルゴリズムにおける個体のオンライン評価手法
JPH1011106A (ja) 動力源総合制御方式
JP2000250603A (ja) 総合特性最適化方法
JPH10333705A (ja) 総合制御方式
JPH10154002A (ja) 総合制御方式
JP2000250602A (ja) 総合特性最適化装置
CN113779858B (zh) 一种燃烧优化方法、系统、存储介质及电子设备
JP2004013328A (ja) 評価値算出方法、評価値算出装置、制御対象の制御装置及び評価値算出プログラム
CN113807005A (zh) 基于改进fpa-dbn的轴承剩余寿命预测方法
Lin et al. The design of TSK‐type fuzzy controllers using a new hybrid learning approach