JP2002251597A - 最適解探索装置、最適化アルゴリズムによる制御対象の制御装置及び最適解探索プログラム - Google Patents

最適解探索装置、最適化アルゴリズムによる制御対象の制御装置及び最適解探索プログラム

Info

Publication number
JP2002251597A
JP2002251597A JP2001049342A JP2001049342A JP2002251597A JP 2002251597 A JP2002251597 A JP 2002251597A JP 2001049342 A JP2001049342 A JP 2001049342A JP 2001049342 A JP2001049342 A JP 2001049342A JP 2002251597 A JP2002251597 A JP 2002251597A
Authority
JP
Japan
Prior art keywords
evaluation
control
evaluation function
output
individual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001049342A
Other languages
English (en)
Inventor
Takaaki Mizutani
卓明 水谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Motor Co Ltd
Original Assignee
Yamaha Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Motor Co Ltd filed Critical Yamaha Motor Co Ltd
Priority to JP2001049342A priority Critical patent/JP2002251597A/ja
Priority to PCT/JP2002/000932 priority patent/WO2002069257A1/ja
Priority to EP02710510A priority patent/EP1372107A4/en
Priority to US10/467,872 priority patent/US7062333B2/en
Publication of JP2002251597A publication Critical patent/JP2002251597A/ja
Pending legal-status Critical Current

Links

Classifications

    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F02COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
    • F02DCONTROLLING COMBUSTION ENGINES
    • F02D41/00Electrical control of supply of combustible mixture or its constituents
    • F02D41/02Circuit arrangements for generating control signals
    • F02D41/14Introducing closed-loop corrections
    • F02D41/1401Introducing closed-loop corrections characterised by the control or regulation method
    • F02D41/1405Neural network control
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F02COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
    • F02DCONTROLLING COMBUSTION ENGINES
    • F02D41/00Electrical control of supply of combustible mixture or its constituents
    • F02D41/02Circuit arrangements for generating control signals
    • F02D41/14Introducing closed-loop corrections
    • F02D41/1401Introducing closed-loop corrections characterised by the control or regulation method
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • G05B13/027Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using neural networks only
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F02COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
    • F02DCONTROLLING COMBUSTION ENGINES
    • F02D41/00Electrical control of supply of combustible mixture or its constituents
    • F02D41/02Circuit arrangements for generating control signals
    • F02D41/14Introducing closed-loop corrections
    • F02D41/1401Introducing closed-loop corrections characterised by the control or regulation method
    • F02D41/1406Introducing closed-loop corrections characterised by the control or regulation method with use of a optimisation method, e.g. iteration
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/32Operator till task planning
    • G05B2219/32028Electronic catalog, to select material, resources, make lists with prices
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/32Operator till task planning
    • G05B2219/32393Host and central distribution control between storage and cells

Abstract

(57)【要約】 【課題】 使用者の希望に沿った最適解を探索すること
ができ、しかも最適化に要する時間を短縮することがで
きる最適化アルゴリズムによる制御対象の制御装置を提
供する。 【解決手段】 対話型最適化部310については、対話
型最適化部310の制御係数を入力としてレスポンス度
を出力するレスポンス度算出部342を用いて、レスポ
ンス度算出部342のレスポンス度を対話型評価により
繰り返し評価しながら、レスポンス度算出部342の最
適解をGAにより探索する。自律型最適化部350につ
いては、自律型最適化部350の制御係数を入力として
燃費を出力する燃費算出部372を用いて、対話型最適
化部310の最適化で最適解として探索した解から求ま
るレスポンス度を基準として所定範囲内にレスポンス度
が属するように、燃費算出部372の燃費を自律型評価
により繰り返し評価しながら、燃費算出部372の最適
解をGAにより探索する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、評価関数の最適解
を最適化アルゴリズムにより探索する装置およびプログ
ラムに係り、特に、使用者の希望に沿った最適解を探索
することができ、しかも最適化に要する時間を短縮する
ことができる最適解探索装置、最適化アルゴリズムによ
る制御対象の制御装置および最適解探索プログラムに関
する。
【0002】
【従来の技術】従来から、車両や家電製品等の製品の特
性を制御する場合、制御対象となる製品の特性は、開発
・設計段階で、その製品を使用すると思われる使用者を
想定し、その仮想使用者の好みや使用状況を加味し、で
きるだけ幅広い使用者に適応するように決められる。し
かし、上記製品を使用する使用者は、個々に特有の個性
を持っており、その好みも千差万別であるため、前記し
たように、その製品を使用すると思われる使用者の好み
等を想定して製品の開発・設計を行ったとしても、すべ
ての使用者が満足する特性を提供ことはほぼ不可能に近
い。この問題を解決するために、遺伝的アルゴリズム
(以下、単にGAという。)等の最適化アルゴリズムを
用いて、購入後に使用者の好みや使用状況を推定し、使
用者が満足しうる特性に制御特性を変更していく制御方
法が試みられている。
【0003】
【発明が解決しようとする課題】最適化アルゴリズムに
より制御特性を最適化する場合には、その制御結果を数
値化し所定の評価基準に基づいて自律的に評価しながら
制御特性を最適化していく自律型評価手法と、その制御
結果を使用者に対して表示し使用者との対話により評価
しながら制御特性を最適化していく対話型評価手法との
いずれかが採用される。
【0004】自律型評価手法は、所定の評価基準に基づ
いて自律的に行うため、比較的短時間で制御特性を最適
化することができるが、使用者の好みが最適値となるよ
うな評価基準が使用者によって変化する場合には適して
いない。これに対し、対話型評価手法は、使用者の好み
が最適値となるような評価基準が使用者によって変化す
る場合に適したものではあるが、使用者による評価を短
期間にさほど多く得ることができないので、例えば車両
の制御特性のすべてをこの手法で最適化しようとすれ
ば、最適化が完了するまでに比較的長時間要するという
問題がある。
【0005】そこで、本発明は、このような従来の技術
の有する未解決の課題に着目してなされたものであっ
て、使用者の希望に沿った最適解を探索することがで
き、しかも最適化に要する時間を短縮することができる
最適解探索装置、最適化アルゴリズムによる制御対象の
制御装置および最適解探索プログラムを提供することを
目的としている。
【0006】
【課題を解決するための手段】上記目的を達成するため
に、本発明に係る請求項1記載の最適解探索装置は、評
価関数の出力を繰り返し評価しながら前記評価関数の最
適解を最適化アルゴリズムにより探索する装置であっ
て、前記評価関数の出力に対する評価を使用者との対話
に基づいて行う対話型評価と、前記評価関数の出力に対
する評価を所定の評価基準に基づいて行う自律型評価と
の組み合わせにより、前記最適化アルゴリズムによる探
索を行うようになっている。
【0007】このような構成であれば、対話型評価と自
律型評価との組合せにより評価関数の出力が繰り返し評
価されながら、評価関数の最適解が最適化アルゴリズム
により探索される。ここで、請求項1記載の発明は、例
えば、制御対象の制御特性を最適化する場合に適用する
こともできるが、これに限らず、最適化アルゴリズムが
これまで適用されてきた各種の問題にも適用することが
できる。以下、請求項12記載の最適解探索プログラム
において同じである。
【0008】また、請求項1記載の発明は、最適化アル
ゴリズムとして、GA、GP(Genetic Progress)また
はES(evolutional Stratage)のような進化型最適化
アルゴリズムを採用することもできるし、その他、近傍
計算型最適化アルゴリズムや強化学習による最適化アル
ゴリズムを採用することもできる。以下、請求項3記載
の最適化アルゴリズムによる制御対象の制御装置、およ
び請求項12記載の最適解探索プログラムにおいて同じ
である。
【0009】さらに、本発明に係る請求項2記載の最適
解探索装置は、請求項1記載の最適解探索装置におい
て、前記評価関数の出力を記憶するための記憶手段と、
前記評価関数の出力を評価値として算出して前記記憶手
段に記憶する評価値算出手段と、前記使用者による評価
を入力する評価入力手段とを備え、前記対話型評価は、
前記評価入力手段の入力内容に基づいて行い、前記自律
型評価は、前記記憶手段の評価値に基づいて行うように
なっている。
【0010】このような構成であれば、評価値算出手段
により、評価関数の出力が評価値として算出され、算出
された評価値が記憶手段に記憶される。ここで、使用者
は、評価値に対する評価を評価入力手段に入力すると、
入力された入力内容に基づいて対話型評価が行われる。
一方、記憶手段の評価値に基づいて自律型評価が行われ
る。そして、これら対話型評価と自律型評価との組合せ
により評価関数の出力が繰り返し評価されながら、評価
関数の最適解が最適化アルゴリズムにより探索される。
【0011】ここで、記憶手段は、評価値をあらゆる手
段でかつあらゆる時期に記憶するものであり、評価値を
あらかじめ記憶してあるものであってもよいし、評価値
をあらかじめ記憶することなく、本装置の動作時に外部
からの入力等によって評価値を記憶するようになってい
てもよい。以下、請求項4記載の最適化アルゴリズムに
よる制御対象の制御装置において同じである。
【0012】一方、上記目的を達成するために、本発明
に係る請求項3記載の最適化アルゴリズムによる制御対
象の制御装置は、制御対象の特性を制御する制御系の制
御特性に影響を及ぼす制御係数を入力として前記制御特
性を出力する評価関数を用いて、前記評価関数の出力を
繰り返し評価しながら前記評価関数の最適解を最適化ア
ルゴリズムにより探索することにより、前記制御系の制
御特性を最適化する装置であって、前記評価関数の出力
に対する評価を使用者との対話に基づいて行う対話型評
価と、前記評価関数の出力に対する評価を所定の評価基
準に基づいて行う自律型評価との組み合わせにより、前
記最適化アルゴリズムによる探索を行うようになってい
る。
【0013】このような構成であれば、対話型評価と自
律型評価との組合せにより評価関数の出力が繰り返し評
価されながら、評価関数の最適解が最適化アルゴリズム
により探索される。そして、探索が完了すると、最適解
として探索された制御係数に基づいて制御系が動作し、
これにより制御系の制御特性が最適化される。さらに、
本発明に係る請求項4記載の最適化アルゴリズムによる
制御対象の制御装置は、請求項3記載の最適化アルゴリ
ズムによる制御対象の制御装置において、前記評価関数
の出力を記憶するための記憶手段と、前記評価関数の出
力を評価値として算出して前記記憶手段に記憶する評価
値算出手段と、前記使用者による評価を入力する評価入
力手段とを備え、前記対話型評価は、前記評価入力手段
の入力内容に基づいて行い、前記自律型評価は、前記記
憶手段の評価値に基づいて行うようになっている。
【0014】このような構成であれば、評価値算出手段
により、評価関数の出力が評価値として算出され、算出
された評価値が記憶手段に記憶される。ここで、使用者
は、評価値に対する評価を評価入力手段に入力すると、
入力された入力内容に基づいて対話型評価が行われる。
一方、記憶手段の評価値に基づいて自律型評価が行われ
る。そして、これら対話型評価と自律型評価との組合せ
により評価関数の出力が繰り返し評価されながら、評価
関数の最適解が最適化アルゴリズムにより探索される。
【0015】さらに、本発明に係る請求項5記載の最適
化アルゴリズムによる制御対象の制御装置は、請求項3
および4のいずれかに記載の最適化アルゴリズムによる
制御対象の制御装置において、前記制御対象の第1の特
性を制御する第1制御系と、前記制御対象の第2の特性
を制御する第2制御系とを備え、前記第1制御系につい
ては、前記第1制御系の制御特性に影響を及ぼす制御係
数を入力として前記制御特性を出力する第1評価関数を
用いて、前記第1評価関数の出力を前記対話型評価によ
り繰り返し評価しながら、前記第1評価関数の最適解を
前記最適化アルゴリズムにより探索するようになってお
り、前記第2制御系については、前記第2制御系の制御
特性に影響を及ぼす制御係数を入力として前記制御特性
を出力する第2評価関数および前記第1評価関数を用い
て、前記第1制御系の最適化で最適解として探索した解
から求まる前記第1評価関数の出力を基準として所定範
囲内に前記第1評価関数の出力が属するように、前記第
2評価関数の出力を前記自律型評価により繰り返し評価
しながら、前記第2評価関数の最適解を前記最適化アル
ゴリズムにより探索するようになっている。
【0016】このような構成であれば、第1制御系につ
いては、第1評価関数の出力が対話型評価により繰り返
し評価されながら、第1評価関数の最適解が最適化アル
ゴリズムにより探索される。そして、第2制御系につい
ては、第1制御系の最適化で最適解として探索された解
から求まる第1評価関数の出力を基準として所定範囲内
に第1評価関数の出力が属するように、第2評価関数の
出力が自律型評価により繰り返し評価されながら、第2
評価関数の最適解が最適化アルゴリズムにより探索され
る。
【0017】さらに、本発明に係る請求項6記載の最適
化アルゴリズムによる制御対象の制御装置は、請求項3
および4のいずれかに記載の最適化アルゴリズムによる
制御対象の制御装置において、前記制御対象の第1の特
性を制御する第1制御系と、前記制御対象の第2の特性
を制御する第2制御系とを備え、前記第1制御系につい
ては、前記第1制御系の制御特性に影響を及ぼす制御係
数を入力として前記制御特性を出力する第1評価関数を
用いて、前記第1評価関数の出力を前記自律型評価によ
り繰り返し評価しながら、前記第1評価関数の最適解を
前記最適化アルゴリズムにより探索するようになってお
り、前記第2制御系については、前記第2制御系の制御
特性に影響を及ぼす制御係数を入力として前記制御特性
を出力する第2評価関数および前記第1評価関数を用い
て、前記第1制御系の最適化で最適解として探索した解
から求まる前記第1評価関数の出力を基準として所定範
囲内に前記第1評価関数の出力が属するように、前記第
2評価関数の出力を前記対話型評価により繰り返し評価
しながら、前記第2評価関数の最適解を前記最適化アル
ゴリズムにより探索するようになっている。
【0018】このような構成であれば、第1制御系につ
いては、第1評価関数の出力が自律型評価により繰り返
し評価されながら、第1評価関数の最適解が最適化アル
ゴリズムにより探索される。そして、第2制御系につい
ては、第1制御系の最適化で最適解として探索された解
から求まる第1評価関数の出力を基準として所定範囲内
に第1評価関数の出力が属するように、第2評価関数の
出力が対話型評価により繰り返し評価されながら、第2
評価関数の最適解が最適化アルゴリズムにより探索され
る。
【0019】さらに、本発明に係る請求項7記載の最適
化アルゴリズムによる制御対象の制御装置は、請求項5
および6のいずれかに記載の最適化アルゴリズムによる
制御対象の制御装置において、前記制御対象は、エンジ
ンであり、前記第1評価関数および前記第2評価関数の
出力のうち前記対話型評価の対象となるものは、前記エ
ンジンの回転数変化率およびスロットル開度変化率によ
り定まるレスポンス度であり、前記第1評価関数および
前記第2評価関数の出力のうち前記自律型評価の対象と
なるものは、前記エンジンの燃費である。
【0020】このような構成であれば、第1評価関数お
よび第2評価関数のうち対話型評価の対象となるものに
ついては、対話型評価を繰り返し経てレスポンス特性が
最適化される。一方、第1評価関数および第2評価関数
のうち自律型評価の対象となるものについては、自律型
評価を繰り返し経てエンジンの燃費特性が最適化され
る。
【0021】さらに、本発明に係る請求項8記載の最適
化アルゴリズムによる制御対象の制御装置は、請求項5
ないし7のいずれかに記載の最適化アルゴリズムによる
制御対象の制御装置において、前記最適化アルゴリズム
は、複数の個体の集合からなる個体群を仮想的に生成す
るとともに、前記各個体ごとにその個体の遺伝情報に見
立てて個体情報を構成し、当該個体情報には前記制御係
数を割り当て、さらに、遺伝子操作を模倣した情報操作
を前記個体情報に対して行う個体情報操作手段と、前記
個体の評価値を算出する評価値算出手段と、前記評価値
算出手段で算出した評価値に基づいて前記個体の生存ま
たは淘汰を行う個体選択手段とを備え、同一世代におい
て、前記個体情報操作手段による遺伝的操作および前記
個体選択手段による個体選択操作をそれぞれ少なくとも
1回行って世代を進行させる進化型最適化アルゴリズム
である。
【0022】このような構成であれば、個体情報操作手
段により、遺伝子操作を模倣した情報操作が個体情報に
対して行われ、評価値算出手段により、評価値が算出さ
れ、個体選択手段により、算出された評価値に基づいて
個体の生存または淘汰が行われる。そして、この個体情
報操作手段による遺伝的操作および個体選択手段による
個体選択操作が、同一世代においてそれぞれ少なくとも
1回行われることにより世代が進行する。
【0023】さらに、本発明に係る請求項9記載の最適
化アルゴリズムによる制御対象の制御装置は、請求項8
記載の最適化アルゴリズムによる制御対象の制御装置に
おいて、前記制御対象は、エンジンであり、前記個体情
報には、前記制御係数として、前記エンジンの燃料噴射
量、前記エンジンの過渡状態において前記燃料噴射量を
補正する過渡補正量、前記燃料噴射量の補正値または前
記過渡補正量の補正値を割り当てるようになっている。
【0024】このような構成であれば、評価値を向上す
る方向に個体群が進化していくにつれて、高い評価値を
得ることが期待できる、燃料噴射量、過渡補正量、燃料
噴射量の補正値または過渡補正量の補正値が決定され
る。さらに、本発明に係る請求項10記載の最適化アル
ゴリズムによる制御対象の制御装置は、請求項8記載の
最適化アルゴリズムによる制御対象の制御装置におい
て、前記制御対象は、エンジンであり、前記エンジンの
燃料噴射量、前記エンジンの過渡状態において前記燃料
噴射量を補正する過渡補正量、前記燃料噴射量の補正値
または前記過渡補正量の補正値をニューラルネットワー
クにより生成するようになっており、前記個体情報に
は、前記制御係数として、前記ニューラルネットワーク
におけるシナプスの結合係数を割り当てるようになって
いる。
【0025】このような構成であれば、ニューラルネッ
トワークにより、燃料噴射量、過渡補正量、燃料噴射量
の補正値または過渡補正量の補正値が生成されるが、評
価値を向上する方向に個体群が進化していくにつれて、
高い評価値を得ることが期待できる、ニューラルネット
ワークにおけるシナプスの結合係数が決定される。さら
に、本発明に係る請求項11記載の最適化アルゴリズム
による制御対象の制御装置は、請求項5および6のいず
れかに記載の最適化アルゴリズムによる制御対象の制御
装置において、前記制御対象は、電気モータであり、前
記第1評価関数および前記第2評価関数の出力のうち前
記対話型評価の対象となるものは、前記電気モータの回
転変化率であり、前記第1評価関数および前記第2評価
関数の出力のうち前記自律型評価の対象となるものは、
前記電気モータの電力消費である。
【0026】このような構成であれば、第1評価関数お
よび第2評価関数のうち対話型評価の対象となるものに
ついては、対話型評価を繰り返し経て電気モータの回転
変化特性が最適化される。一方、第1評価関数および第
2評価関数のうち自律型評価の対象となるものについて
は、自律型評価を繰り返し経て電気モータの電力消費特
性が最適化される。
【0027】一方、上記目的を達成するために、本発明
に係る請求項12記載の最適解探索プログラムは、評価
関数の出力を繰り返し評価しながら前記評価関数の最適
解を最適化アルゴリズムにより探索するコンピュータ実
行可能なプログラムであって、前記評価関数の出力に対
する評価を使用者との対話に基づいて行う対話型評価
と、前記評価関数の出力に対する評価を所定の評価基準
に基づいて行う自律型評価との組み合わせにより、前記
最適化アルゴリズムによる探索を行う処理をコンピュー
タに実行させるためのプログラムである。
【0028】このような構成であれば、プログラムに従
ってコンピュータが実行したときは、請求項1記載の最
適解探索装置と同等の作用が得られる。
【0029】
【発明の実施の形態】以下、本発明の実施の形態を図面
を参照しながら説明する。図1ないし図12は、本発明
に係る最適解探索装置、最適化アルゴリズムによる制御
対象の制御装置および最適解探索プログラムの実施の形
態を示す図である。まず、本発明の基本概念を図1を参
照しながら説明する。図1は、本発明の基本概念を示す
図である。
【0030】本発明の基本構成は、図1に示すように、
最適化対象1と、最適化対象1の評価を対話型評価によ
り行いながら進化型最適化アルゴリズムにより最適化対
象1の第1操作量を決定し出力する対話型最適化部2
と、最適化対象1の評価を自律型評価により行いながら
進化型最適化アルゴリズムにより最適化対象1の第2操
作量を決定し出力する自律型最適化部3とで構成されて
いる。
【0031】対話型最適化部2は、最適化対象1の操作
結果に基づいて、GAにより、最適化対象1の操作特性
が最適となるような第1操作量を決定し、決定した第1
操作量を最適化対象1に出力するようになっている。自
律型最適化部3は、最適化対象1の操作結果に基づい
て、GAにより、最適化対象1の操作特性が最適となる
ような第2操作量を決定し、決定した第2操作量を最適
化対象1に出力するようになっている。
【0032】次に、本発明の基本構成を図2を参照しな
がら説明する。図2は、本発明の基本構成を示すブロッ
ク図である。本発明の基本構成は、図2に示すように、
制御対象50と、制御対象50の制御結果に基づいて制
御対象50の制御量を制御する制御装置60とで構成さ
れている。
【0033】制御装置60は、反射層500、学習層6
00および進化適応層700の3つの制御層からなり、
制御対象50から制御結果を入力し、入力した制御結果
に基づいて反射層500で基本制御量を決定し、学習層
600および進化適応層700で基本制御量に対する補
正率を決定し、これら基本制御量および補正率から最終
的な制御量を決定する。以下、反射層500、学習層6
00および進化適応層700の構成を詳細に説明する。
【0034】反射層500は、数式、マップ、ニューラ
ルネットワーク、ファジールール、サブサンプションア
ーキテクチャ等の形式で、基本制御量と制御結果との関
係を定義付ける基礎制御部510を備え、基礎制御部5
10は、制御対象50から制御結果を入力し、入力した
制御結果に基づいて基本制御量を決定して出力する。な
お、サブサンプションアーキテクチャとは、並列的な処
理を行う行動型人工知能として公知である。
【0035】進化適応層700は、対話型評価を繰り返
し行いながら進化型最適化アルゴリズムにより制御対象
50の制御特性を最適化する対話型最適化部710と、
自律型評価を繰り返し行いながら進化型最適化アルゴリ
ズムにより制御対象50の制御特性を最適化する自律型
最適化部750とで構成されている。対話型最適化部7
10は、制御結果に基づいて制御対象50の制御量を出
力する制御モジュールを少なくとも一つ有し、制御対象
50の制御特性に対する評価をユーザとの対話に基づい
て行う対話型評価を繰り返し行いながら、GAにより制
御モジュールを最適化するように構成されている。GA
では、複数の個体の集合からなる個体群を仮想的に生成
するとともに、各個体ごとにその個体の遺伝情報に見立
てて個体情報を構成する。ここで、各個体情報には、制
御モジュールを構築するための制御係数を割り当てる。
そして、同一世代において、遺伝子操作を模倣した情報
操作を個体情報に対して行う遺伝的操作、および個体の
評価値に基づいて個体の生存または淘汰を行う個体選択
操作をそれぞれ少なくとも1回行って世代を所定回進行
させることにより、個体群を進化させる。所定回数の世
代交代が終了したときは、個体群のなかから評価値が最
も高い個体を抽出し、抽出した個体の個体情報を制御係
数として用い制御モジュールを構築する。以下、評価値
が最も高い個体の個体情報を用いて構築した制御モジュ
ールのことを「最適制御モジュール」という。なお、制
御モジュールとは、制御系のあるまとまった制御を行う
一単位をいう。
【0036】自律型最適化部750は、制御結果に基づ
いて、反射層500からの基本制御量を使用者の希望に
沿った値に補正するための進化補正率を出力する制御モ
ジュールを少なくとも一つ有し、GAにより制御モジュ
ールを最適化するように構成されている。また、最適制
御モジュールを構築した後、自律型最適化部750の制
御モジュールをその最適制御モジュールに固定し、反射
層500からの基本制御量を補正する進化補正率による
制御を行う一方、学習層600にその最適制御モジュー
ルに関する情報を学習させる。また、最適制御モジュー
ルに関する情報を学習層600に学習させた後は、その
出力を「1」に戻し、その後は、使用者の指示に応じて
作動する。すなわち、自律型最適化部750の制御モジ
ュールによる制御が行われるのは、進化シミュレーショ
ン中および学習中のみである。
【0037】学習層600は、学習用と実行用とに切換
可能な2つのニューラルネットワークを有する学習部6
10を備え、学習部610は、一方のニューラルネット
ワーク(実行用)で制御を実行している間、他方のニュ
ーラルネットワーク(学習用)で進化適応層700から
最適制御モジュールに関する入力と出力との関係を学習
する。学習用ニューラルネットワークでの学習が終了す
ると、制御を実行しているニューラルネットワークと学
習後のニューラルネットワークとを切り換え、学習後の
ニューラルネットワークで学習結果から得られる制御モ
ジュールによる制御を開始し、制御を実行していたニュ
ーラルネットワークが学習用として機能し始める。な
お、学習層600におけるニューラルネットワークは、
初期状態では「1」を出力するように設定されており、
したがって、初期状態では、反射層500と進化適応層
700とによる制御が行われる。
【0038】実行用ニューラルネットワークは、制御対
象50から制御結果を入力し、入力した制御結果に基づ
いて反射層500からの基本制御量を補正するための学
習補正率を出力するようになっている。この構成は、学
習用ニューラルネットワークについても同様である。そ
して、制御装置60は、学習層600からの学習補正率
と進化適応層700からの進化補正率とを加算し、反射
層500からの基本制御量にその加算結果を乗算するこ
とにより制御量を算出する。この制御量を制御対象50
に出力する。
【0039】以下、本発明のより具体的な実施の形態を
説明する。本実施の形態は、本発明に係る最適解探索装
置、最適化アルゴリズムによる制御対象の制御装置およ
び最適解探索プログラムを、図3に示すように、対話型
評価と自律型評価との組み合わせによる評価を繰り返し
行いながら、GAにより、エンジン10の燃費特性およ
びレスポンス特性を使用者向けに最適化する場合につい
て適用したものである。
【0040】まず、本発明を適用するエンジン制御シス
テムの構成を図3を参照しながら説明する。図3は、本
発明を適用するエンジン制御システムの構成を示すブロ
ック図である。エンジン制御システムは、図3に示すよ
うに、エンジン10と、シリンダへの吸気量を調整する
電子スロットル12と、エンジン10および電子スロッ
トル12の作動状態を検出してエンジン10の作動状態
に関する各種の情報(以下、外界情報と総称する。)を
出力する各種センサ20と、各種センサ20からの外界
情報に基づいてエンジン10の燃料噴射量を制御する制
御装置30とで構成されている。
【0041】各種センサ20は、エンジン10および電
子スロットル12の作動状態並びに車両の走行状態を検
出し、その検出結果に基づいて、エンジン10の回転
数、スロットル開度、スロットル開度の変化率、距離パ
ルスおよび燃料噴射量を外界情報として出力するように
なっている。制御装置30は、反射層100、学習層2
00および進化適応層300の3つの制御層からなり、
各種センサ20から外界情報を入力し、入力した外界情
報に基づいて反射層100で燃料の基本噴射量を決定
し、学習層200および進化適応層300で基本噴射量
に対する補正量を決定し、これら基本噴射量および補正
量から最終的な燃料噴射量を決定する。以下、反射層1
00、学習層200および進化適応層300の構成を詳
細に説明する。
【0042】反射層100は、数式、マップ、ニューラ
ルネットワーク、ファジールール、サブサンプションア
ーキテクチャ等の形式で、基本噴射量および過渡補正率
と外界情報との関係を定義付ける基礎制御部110を備
え、基礎制御部110は、各種センサ20から外界情報
を入力し、入力した外界情報に基づいて基本噴射量およ
び過渡補正率を決定して出力する。
【0043】進化適応層300は、対話型評価を繰り返
し行いながらGAにより電子スロットル12の制御特性
(レスポンス特性)を最適化する対話型最適化部310
と、自律型評価を繰り返し行いながらGAによりエンジ
ン10の制御特性(燃費特性)を最適化する自律型最適
化部350とで構成されている。対話型最適化部310
は、外界情報に基づいて電子スロットル12のバルブ開
度を出力する制御モジュールを少なくとも一つ有し、レ
スポンス度に対する評価をユーザとの対話に基づいて行
う対話型評価を繰り返し行いながら、GAにより制御モ
ジュールを最適化するように構成されている。
【0044】自律型最適化部350は、外界情報に基づ
いて、反射層100からの基本噴射量および過渡補正率
を使用者の希望に沿った値に補正するための補正率(以
下、この補正率うち基本噴射量を補正するものを進化補
正率といい、過渡補正率を補正するものを進化過渡補正
率という。)を出力する制御モジュールを少なくとも一
つ有し、GAにより制御モジュールを最適化するように
構成されている。また、最適制御モジュールを構築した
後、自律型最適化部350の制御モジュールをその最適
制御モジュールに固定し、反射層100からの基本噴射
量を補正する進化補正率による制御および反射層100
からの過渡補正率を補正する進化過渡補正率による制御
を行う一方、学習層200にその最適制御モジュールに
関する情報を学習させる。また、最適制御モジュールに
関する情報を学習層200に学習させた後は、その出力
を「1」に戻し、その後は、使用者の指示に応じて作動
する。すなわち、自律型最適化部350の制御モジュー
ルによる制御が行われるのは、進化シミュレーション中
および学習中のみである。
【0045】学習層200は、学習用と実行用とに切換
可能な2つのニューラルネットワークを有する学習部2
10を備え、学習部210は、一方のニューラルネット
ワーク(実行用)で制御を実行している間、他方のニュ
ーラルネットワーク(学習用)で進化適応層300から
最適制御モジュールに関する入力と出力との関係を学習
する。学習用ニューラルネットワークでの学習が終了す
ると、制御を実行しているニューラルネットワークと学
習後のニューラルネットワークとを切り換え、学習後の
ニューラルネットワークで学習結果から得られる制御モ
ジュールによる制御を開始し、制御を実行していたニュ
ーラルネットワークが学習用として機能し始める。な
お、学習層200におけるニューラルネットワークは、
初期状態では「1」を出力するように設定されており、
したがって、初期状態では、反射層100と進化適応層
300とによる制御が行われる。
【0046】実行用ニューラルネットワークは、特に図
示しないが、さらに、2つのニューラルネットワークを
含んで構成されている。一方のニューラルネットワーク
は、スロットル開度およびエンジン回転数を外界情報と
して各種センサ20から入力し、その入力情報に基づい
て反射層100からの基本噴射量を補正するための補正
率(以下、この補正率を学習補正率という。)を出力す
るようになっており、他方のニューラルネットワーク
は、スロットル開度の変化率およびエンジン回転数を外
界情報として各種センサ20から入力し、その入力情報
に基づいて反射層100からの過渡補正率を補正するた
めの補正率(以下、この補正率を学習過渡補正率とい
う。)を出力するようになっている。この構成は、学習
用ニューラルネットワークについても同様である。
【0047】そして、制御装置30は、学習層200か
らの学習補正率と進化適応層300からの進化補正率と
を加算し、反射層100からの基本噴射量にその加算結
果を乗算し、これを第1の乗算結果とする一方、学習層
200からの学習過渡補正率と進化適応層300からの
進化過渡補正率とを加算し、反射層100からの過渡補
正率にその加算結果を乗算し、これを第2の乗算結果と
し、第1の乗算結果に第2の乗算結果を乗算することに
より燃料噴射量を算出する。この燃料噴射量をエンジン
10に出力する。
【0048】次に、対話型最適化部310の構成を図4
を参照しながら詳細に説明する。図4は、対話型最適化
部310の構成を示すブロック図である。対話型最適化
部310は、図4に示すように、使用者との入出力を行
うインターフェース部320と、GAによる進化シミュ
レーションを行ってエンジン10の制御特性を最適化す
る進化適応部330と、GAにおける個体の評価値を算
出する評価部340とで構成されている。
【0049】インターフェース部320は、GAによる
進化シミュレーション中の個体の評価値を表示する表示
部322と、使用者による評価を入力する入力部324
とで構成されており、GAによる進化シミュレーション
中では、各世代ごとに各個体の評価値(後段で詳述する
が、レスポンス度)が表示部312に表示され、使用者
は、乗り心地等の車両の体感をもとに各個体の評価を入
力部314に入力する。
【0050】評価部340は、外界情報に基づいてレス
ポンス度を算出するレスポンス度算出部342で構成さ
れている。レスポンス度算出部342は、スロットル開
度およびエンジン回転数を外界情報として入力し、スロ
ットル開度の変化率およびエンジン回転数の変化率を算
出し、エンジン回転数の変化率をスロットル開度の変化
率で除算することによりレスポンス度を算出し、算出し
たレスポンス度を、GAにおける個体の評価値として進
化適応部330に出力するようになっている。
【0051】進化適応部330は、制御モジュール33
2を有している。制御モジュール332は、例えば、ス
ロットル開度とバルブ開度との静特性を示す2つの制御
係数SP1,SP2、およびスロットル開度とバルブ開度
との動特性を示す2つの制御係数DR(1次遅れ要
素),AG(不完全微分要素)に基づいて、スロットル
開度とバルブ開度との関係を規定し、スロットル開度を
外界情報として入力し、入力したスロットル開度に基づ
いてバルブ開度を決定して電子スロットル12に出力す
るようになっている。
【0052】GAにおける個体の個体情報には、静特性
を示す制御係数SP1,SP2、および動特性を示す2つ
の制御係数DR,AGを割り当てる。具体的には、図5
に示すように割り当てられている。図5は、個体情報の
データ構造を示す図である。GAにおける個体の個体情
報は、静特性を示す制御係数SP1,SP2を上位側に、
動特性を示す2つの制御係数DR,AGを下位側にそれ
ぞれ割り当てることにより構成されている。例えば、一
つの制御係数が16ビットのデータで構成されていれ
ば、個体情報は、全体で64ビットのデータとなる。ま
た、進化シミュレーションを開始する際に生成する初期
の個体情報は、各個体ごとに乱数により決定する。その
際、レスポンス度をある程度保証するために、乱数の発
生範囲を所定範囲に制限するのが好ましい。すなわち、
レスポンス度が明らかに悪くなるような範囲には、乱数
を発生させないようにする。
【0053】次に、進化適応部330で実行される処理
を図6を参照しながら詳細に説明する。図6は、進化適
応部330で実行される処理を示すフローチャートであ
る。GAは、各個体にランダムな初期値を与えて探索空
間内に配置し、世代ごとに交叉、突然変異と呼ばれる遺
伝的操作を適用し、個体の評価値に応じて個体の増殖お
よび選択を行うことにより、次世代の個体の集合を得
る。このような世代交代を繰り返すことにより、漸近的
に最適解に近づくことを目的とする。以下、遺伝的操作
である交叉、突然変異、選択について説明する。
【0054】交叉とは、少なくとも2つの個体を親と
し、親となる個体の個体情報の一部を入れ替えることに
より、子孫となる個体を1以上生成する操作である。あ
る個体の個体情報のよい部分と別の個体の個体情報のよ
い部分を合体させることにより、より評価値の高い個体
を得ることが期待できる。例えば、2つの個体を親とし
て子孫となる2つの個体を生成する場合、一方の親とな
る個体の個体情報を「000110」、他方の親となる個体の
個体情報を「110111」とし、3番目の位置で交叉させる
ことにより、「000111」の個体情報をもつ個体と、「11
0110」の個体情報をもつ個体とを子孫となる個体として
得る。
【0055】突然変異とは、所定の確率で個体の個体情
報のうち特定部分を変更する操作であり、個体群内での
多様性を増加させる。具体的には、個体情報の特定のビ
ットを反転させる操作であり、例えば、ある個体の個体
情報を「000111」とし、その3番目の位置で突然変異を
起こすことにより、「001111」の個体情報をもつ個体を
得る。
【0056】選択とは、個体の評価値に応じて個体群の
なかのよりよい個体を次世代に残すための操作である。
ルーレット選択と呼ばれる選択方法では、各個体は評価
値に比例した確率で選択される。例えば、ある世代にお
いて、「000000」、「111011」、「110111」、「01011
1」の個体情報をもつ個体の評価値がそれぞれ「8」、
「4」、「2」、「2」であったとする。それぞれの個
体が選択される確率は、「8/16」、「4/16」、
「2/16」、「2/16」となる。したがって、平均
的には、次世代において、「000000」の個体情報をもつ
個体は2つに増え、「111011」の個体情報をもつ個体は
一つのままで、「110111」の個体情報をもつ個体または
「010111」の個体情報をもつ個体はいずれかが残るよう
な個体群が得られる。もっとも、進化適応部330にお
いては、個体の選択を使用者の選択により行う。
【0057】以上のことをふまえて、進化適応部330
で実行される処理を説明する。なお、図6のフローチャ
ートに示す処理は、例えば、ROMにあらかじめ格納さ
れているプログラムを読み出し、読み出したプログラム
に従ってCPUが実行する。まず、ステップS100に
移行して、進化シミュレーションを開始する指示である
進化開始指示を入力部322から入力したか否かを判定
し、進化開始指示を入力したと判定したとき(Yes)は、
ステップS102に移行するが、そうでないと判定した
とき(No)は、進化開始指示を入力するまでステップS1
00で待機する。
【0058】ステップS102では、所定数(例えば、
9個)の個体の集合からなる個体群を仮想的に生成する
とともに各個体ごとに個体情報を構成する。ここで、各
個体情報には、静特性を示す制御係数SP1,SP2およ
び動特性を示す2つの制御係数DR,AGを割り当て、
各個体の個体情報を乱数により決定する。このとき、個
体情報のすべての値が「0」となる個体を一つ生成する
ことで、進化の過程で進化前のレスポンス性能を下回ら
ないようにすることができる。なお、各個体の個体情報
は、RAM等の記憶装置上に格納され管理される。
【0059】次いで、ステップS104に移行して、個
体群のうち先頭の個体の個体情報を読み出し、ステップ
S106に移行して、読み出した個体情報に基づいて制
御モジュール332を構築し、構築した制御モジュール
332により電子スロットル12の制御を開始する。次
いで、ステップS108に移行して、レスポンス度を評
価部340から取得する。ここで、個体情報に基づいて
制御モジュール332を構築し、構築した制御モジュー
ル332により電子スロットル12の制御を開始し、そ
の結果得られたレスポンス度は、その個体に対する評価
値とする。この評価値が高いほど、すなわち、GAによ
る進化シミュレーションにおいて優秀な個体であると位
置付けることができる。
【0060】次いで、ステップS110に移行して、個
体群のすべての個体についてステップS106からS1
08までの処理が終了したか否かを判定し、すべての個
体について処理が終了したと判定したとき(Yes)は、ス
テップS112に移行する。ステップS112では、各
個体ごとにその評価値であるレスポンス度を表示部32
4に表示し、ステップS114に移行して、使用者によ
る評価を入力部322から入力する。個体群のすべての
個体に対する評価の表示が終了すると、制御は一度評価
モードに入る。評価モードでは、使用者が表示部324
に表示された評価を見て試走してみたい特性の個体を選
択すると、使用者により選択された個体の個体情報に基
づいて制御モジュール332を構築して一時的に固定
し、その制御モジュール332による制御を行う。これ
により、使用者は、表示部324に表示された各個体の
特性を、実際に走行した乗り心地等から判定し、各個体
の評価値を乗り心地から評価する。そして、ステップS
116に移行して、使用者は、表示部324に表現され
た個体の評価と、実際に走行した時の乗り心地とに基づ
く各個体の評価を終了した段階で、制御を淘汰モードに
切り換え、個体群における個体の生存または淘汰を行
う。個体の生存または淘汰は、例えば、入力部322で
淘汰モードに切り換え、表示画面を参照しながら、個体
群のなかから使用者の好みの特性を持つ個体を幾つか選
択し、選択した個体を残し、それ以外の個体を消去する
ことにより行う。
【0061】次いで、ステップS118に移行して、G
Aにおける個体の交叉を行う交叉処理を実行する。具体
的に、ステップS118では、使用者により選択された
個体群のなかから乱数を用いて2個の親個体を選択し、
これらに交叉を施して2個の子個体を生成する。この処
理を5回行うことにより、再び、9個の子個体からなる
個体群を生成する(10番目の子個体は破棄する)。交
叉処理には、例えば、上記の1点交叉処理のほかに、2
点交叉処理または正規分布交叉処理等を採用することが
できる。正規分布交叉処理とは、実数値表現の個体情報
について、両親個体を結ぶ軸に対して回転対称な正規分
布にしたがって子個体を生成する処理である。正規分布
の標準偏差は、両親個体を結ぶ主軸方向の成分について
は両親個体間の距離に比例させ、その他の軸の成分につ
いては両親個体を結ぶ直線と個体群のなかからサンプル
した第3の親個体との距離に比例させる。この交叉方法
は、親個体の特質が子個体に引き継がれやすいという利
点がある。
【0062】次いで、ステップS120に移行して、G
Aにおける個体の突然変異を行う突然変異処理を実行
し、ステップS122に移行して、入力部322からの
入力により使用者が満足する特性が得られたか否かを判
定し、使用者が満足する特性が得られないと判定したと
き(No)は、ステップS124に移行して、世代交代数が
所定回数以上であるか否かを判定し、所定回数以上であ
ると判定したとき(Yes)は、ステップS126に移行す
る。
【0063】ステップS126では、進化シミュレーシ
ョンを開始すべき進化開始要求を自律型最適化部350
に出力し、ステップS128に移行して、個体群のなか
から評価値が最も高い個体を抽出し、抽出した個体の評
価値であるレスポンス度を基準として所定範囲を、レス
ポンス度の制限範囲として自律型最適化部350に出力
し、一連の処理を終了して元の処理に復帰させる。
【0064】一方、ステップS124で、世代交代数が
所定回数未満であると判定したとき(Yes)は、ステップ
S104に移行する。一方、ステップS122で、使用
者が満足する特性が得られたと判定したとき(Yes)は、
ステップS126に移行する。一方、ステップS110
で、個体群のすべての個体についてステップS106か
らS108までの処理が終了していないと判定したとき
(No)は、ステップS130に移行して、個体群のうち次
の個体の個体情報を読み出し、ステップS106に移行
する。
【0065】次に、自律型最適化部350の構成を図7
を参照しながら詳細に説明する。図7は、自律型最適化
部350の構成を示すブロック図である。自律型最適化
部350は、図7に示すように、GAによる進化シミュ
レーションを行ってエンジン10の制御特性を最適化す
る進化適応部360と、GAにおける個体の評価値を算
出する評価部370とで構成されている。
【0066】評価部370は、燃料噴射量および距離パ
ルスに基づいてエンジン10の燃費を算出する燃費算出
部372と、スロットル開度およびエンジン回転数に基
づいてレスポンス度を算出するレスポンス度算出部37
4とで構成されている。燃費算出部372は、燃料噴射
量および距離パルスを外界情報として入力し、所定距離
走行するごとに入力される距離パルスの入力間隔で噴出
量を総和して燃費として算出し、算出した燃費を、GA
における個体の第1評価値として進化適応部360に出
力するようになっている。レスポンス度算出部374
は、スロットル開度およびエンジン回転数を外界情報と
して入力し、スロットル開度の変化率およびエンジン回
転数の変化率を算出し、エンジン回転数の変化率をスロ
ットル開度の変化率で除算することによりレスポンス度
を算出し、算出したレスポンス度を、GAにおける個体
の第2評価値として進化適応部360に出力するように
なっている。
【0067】進化適応部360は、制御モジュール36
2を有し、制御モジュール362は、さらに、2つのニ
ューラルネットワークを含んで構成されている。一方の
ニューラルネットワーク362aは、スロットル開度お
よびエンジン回転数を外界情報として各種センサ20か
ら入力し、その入力情報に基づいて進化補正率を出力す
るようになっており、他方のニューラルネットワーク3
62bは、スロットル開度の変化率およびエンジン回転
数を外界情報として各種センサ20から入力し、その入
力情報に基づいて進化過渡補正率を出力するようになっ
ている。
【0068】GAにおける個体の個体情報には、ニュー
ラルネットワーク362a,362bにおけるシナプス
の結合係数を割り当てる。具体的には、図8に示すよう
に割り当てられている。図8は、ニューラルネットワー
ク362a,362bの構成および個体情報のデータ構
造を示す図である。ニューラルネットワーク362a
は、スロットル開度を入力する入力層fi1と、エンジン
回転数を入力する入力層fi2と、入力層fi1,fi2から
の出力を入力する中間層fh1,fh2と、中間層fh1,f
h2の出力を入力して進化補正率を出力する出力層fo1
の5つのパーセプトロンから構成されている。そして、
入力層fi1と中間層fh1とは結合係数kf1のシナプスに
より、入力層fi2と中間層fh1は結合係数kf2のシナプ
スにより、中間層fh1と出力層fo1とは結合係数kf3
シナプスにより、入力層fi1と中間層fh2とは結合係数
f4のシナプスにより、入力層fi2と中間層fh2とは結
合係数kf5のシナプスにより、中間層fh2と出力層fo2
とは結合係数kf6のシナプスによりそれぞれ結合されて
いる。
【0069】ニューラルネットワーク362bは、スロ
ットル開度の変化率を入力する入力層ai1と、エンジン
回転数を入力する入力層ai2と、入力層ai1,ai2から
の出力を入力する中間層ah1,ah2と、中間層ah1,a
h2の出力を入力して進化過渡補正率を出力する出力層a
o1との5つのパーセプトロンから構成されている。そし
て、入力層ai1と中間層ah1とは結合係数ka1のシナプ
スにより、入力層ai2と中間層ah1は結合係数ka2のシ
ナプスにより、中間層ah1と出力層ao1とは結合係数k
a3のシナプスにより、入力層ai1と中間層ah2とは結合
係数ka4のシナプスにより、入力層ai2と中間層ah2
は結合係数ka5のシナプスにより、中間層ah2と出力層
o2とは結合係数ka6のシナプスによりそれぞれ結合さ
れている。
【0070】そして、GAにおける個体の個体情報は、
シナプスの結合係数kf1〜kf6を上位側に、シナプスの
結合係数ka1〜ka6を下位側にそれぞれ連続して割り当
てることにより構成されている。例えば、一つの結合係
数が8ビットのデータで構成されていれば、個体情報
は、全体で96ビットのデータとなる。また、進化シミ
ュレーションを開始する際に生成する初期の個体情報
は、各個体ごとに乱数により決定する。その際、レスポ
ンス度をある程度保証するために、乱数の発生範囲を所
定範囲に制限するのが好ましい。すなわち、レスポンス
度が明らかに悪くなるような範囲には、乱数を発生させ
ないようにする。
【0071】次に、進化適応部360で実行される処理
を図9を参照しながら詳細に説明する。図9は、進化適
応部360で実行される処理を示すフローチャートであ
る。なお、図9のフローチャートに示す処理は、例え
ば、ROMにあらかじめ格納されているプログラムを読
み出し、読み出したプログラムに従ってCPUが実行す
る。
【0072】まず、ステップS200に移行して、進化
開始要求を対話型最適化部310から入力したか否かを
判定し、進化開始要求を入力したと判定したとき(Yes)
は、ステップS202に移行するが、そうでないと判定
したとき(No)は、進化開始要求を入力するまでステップ
S200で待機する。ステップS202では、レスポン
ス度の制限範囲を対話型最適化部310から入力し、ス
テップS204に移行して、所定数(例えば、9個)の
個体の集合からなる個体群を仮想的に生成するとともに
各個体ごとに個体情報を構成する。ここで、各個体情報
には、ニューラルネットワーク362a,362bにお
けるシナプスの結合係数を割り当て、各個体の個体情報
を乱数により決定する。このとき、個体情報のすべての
値が「0」となる個体を一つ生成することで、進化の過
程で進化前のレスポンス性能を下回らないようにするこ
とができる。なお、各個体の個体情報は、RAM等の記
憶装置上に格納され管理される。
【0073】次いで、ステップS206に移行して、個
体群のうち先頭の個体の個体情報を読み出し、ステップ
S208に移行して、読み出した個体情報に基づいてニ
ューラルネットワーク362a,362bの結合状態を
決定して制御モジュール362を構築し、構築した制御
モジュール362によりエンジン10の制御を開始す
る。このとき、自律型最適化部350からの出力は、ス
ロットル開度、スロットル開度の変化率およびエンジン
回転数をニューラルネットワーク362a,362bに
入力し、さらにその出力を下式(1)により線形変換す
ることにより算出する。また、スロットル開度、スロッ
トル開度の変化率およびエンジン回転数の入力情報は、
それぞれを正規化したものを用いる。下式(1)におい
て、Yは進化補正率または進化過渡補正率であり、xは
ニューラルネットワーク362a,362bの出力であ
り、Gは所定のゲインである。
【0074】
【数1】
【0075】このように、ニューラルネットワーク36
2a,362bの出力xを線形変換して用いることによ
り、自律型最適化部350から出力される進化補正率ま
たは進化過渡補正率の値が極端に大きくなることがな
く、全体として進化シミュレーションが少しずつ進行す
るようになり、エンジン10の挙動が評価や進化シミュ
レーションのために極端に変動することがなくなる。
【0076】次いで、ステップS210に移行して、燃
費およびレスポンス度を評価部370から取得する。こ
こで、個体情報に基づいて制御モジュール362を構築
し、構築した制御モジュール362によりエンジン10
の制御を開始し、その結果得られた燃費およびレスポン
ス度は、その個体に対する評価値とする。この評価値が
高いほど、すなわち、第1評価値である燃費について
は、小さければ小さいほど、第2評価値であるレスポン
ス度については、高ければ高いほど、GAによる進化シ
ミュレーションにおいて優秀な個体であると位置付ける
ことができる。
【0077】次いで、ステップS212に移行して、個
体群のすべての個体についてステップS208からS2
10までの処理が終了したか否かを判定し、すべての個
体について処理が終了したと判定したとき(Yes)は、ス
テップS214に移行する。ステップS214では、各
個体ごとにその第2評価値であるレスポンス度が、ステ
ップS202で入力したレスポンス度の制限範囲内に属
しているか否かを判定し、レスポンス度が制限範囲内に
属していないと判定したとき(No)は、ステップS216
に移行して、その個体を淘汰し、ステップS218に移
行する。
【0078】ステップS218では、個体群のすべての
個体についてステップS208からS210までの処理
が終了したか否かを判定し、すべての個体について処理
が終了したと判定したとき(Yes)は、ステップS220
に移行するが、そうでないと判定したとき(No)は、ステ
ップS214に移行する。ステップS220では、ステ
ップS214〜S218の処理により、レスポンス度が
制限範囲内に属している個体群が形成されるが、この処
理によって所定数(例えば、半数)以上の個体が淘汰さ
れないときは、さらに、個体群の総数が元の数の半数以
下となるように個体の生存または淘汰を行う選択処理を
実行する。選択処理としては、例えば、上記のルーレッ
ト選択処理のほかに、エリート優先選択処理または下位
適応度単純淘汰処理等を採用することができる。
【0079】次いで、ステップS222に移行して、G
Aにおける個体の交叉を行う交叉処理を実行し、ステッ
プS224に移行して、GAにおける個体の突然変異を
行う突然変異処理を実行し、ステップS226に移行し
て、世代交代数が所定回数以上であるか否かを判定し、
所定回数以上であると判定したとき(Yes)は、ステップ
S228に移行する。
【0080】ステップS228では、個体群のなかから
評価値が最も高い個体を抽出し、抽出した個体の個体情
報に基づいて最適制御モジュールを構築し、制御モジュ
ール362を最適制御モジュールに固定し、ステップS
230に移行して、制御モジュール362の入出力関係
を学習層200に学習させ、ステップS232に移行し
て、制御モジュール362の出力を「1」に設定し、一
連の処理を終了して元の処理に復帰させる。
【0081】一方、ステップS226で、世代交代数が
所定回数未満であると判定したとき(Yes)は、ステップ
S206に移行する。一方、ステップS212で、個体
群のすべての個体についてステップS208からS21
0までの処理が終了していないと判定したとき(No)は、
ステップS234に移行して、個体群のうち次の個体の
個体情報を読み出し、ステップS208に移行する。
【0082】次に、上記実施の形態の動作を図面を参照
しながら説明する。エンジン10および電子スロットル
12の制御特性を使用者向けに最適化するには、使用者
は、まず、進化開始指示を入力部322に入力する。対
話型最適化部310では、使用者から進化開始指示を入
力すると、ステップS100,S102を経て、9個の
個体の集合からなる個体群が生成されるとともに各個体
ごとに個体情報が構成される。ここで、個体情報には、
静特性を示す制御係数SP1,SP2および動特性を示す
2つの制御係数DR,AGが割り当てられる。
【0083】個体群が生成されると、第1世代目の進化
シミュレーションが開始される。第1世代目の進化シミ
ュレーションでは、まず、ステップS104を経て、個
体群のうち先頭の個体の個体情報が読み出され、読み出
された個体情報に基づいて制御モジュール332が構築
され、構築された制御モジュール332により電子スロ
ットル12の制御が開始され、しばらくの間その制御モ
ジュール332による制御が行われる。その間、ステッ
プS108を経て、レスポンス度が評価部340から取
得される。
【0084】これと同じ要領で、ステップS106から
S108までの処理が個体群のすべての個体について終
了すると、ステップS112を経て、各個体ごとにその
評価値であるレスポンス度が表示部324に表示され
る。ここで、使用者は、表示部324に表示された各個
体の評価を参照しながら、個体群のなかから自己の好み
の特性を持つ個体を幾つか選択する。使用者により個体
の選択が行われると、ステップS116を経て、個体群
のうち選択された個体が残され、それ以外の個体が消去
されることにより個体の生存または淘汰が行われる。
【0085】次いで、ステップS118,S120を経
て、交叉処理および突然変異処理が行われる。ここまで
の処理を経て、第1世代目の進化シミュレーションが終
了する。その後は、これと同じ要領で、使用者が満足す
る特性が得られるかまたは世代交代数が所定回数以上と
なるまで、進化シミュレーションが繰り返し行われる。
その結果、図10に示すように、レスポンス特性が使用
者向けに最適化される。図10の例では、制限範囲の中
心付近に位置する点がそれである。図10は、エンジン
10および電子スロットル12の制御特性を最適化する
順序を示す図である。
【0086】次いで、進化シミュレーションが完了する
と、ステップS126,S128を経て、進化開始要求
が自律型最適化部350に出力され、個体群のなかから
評価値が最も高い個体が抽出され、抽出された個体の評
価値であるレスポンス度を基準として所定範囲が、レス
ポンス度の制限範囲として自律型最適化部350に出力
される。
【0087】自律型最適化部350では、進化開始要求
を入力すると、ステップS200〜S204を経て、レ
スポンス度の制限範囲を入力し、9個の個体の集合から
なる個体群が生成されるとともに各個体ごとに個体情報
が構成される。ここで、個体情報には、ニューラルネッ
トワーク362a,362bにおけるシナプスの結合係
数が割り当てられる。
【0088】個体群が生成されると、第1世代目の進化
シミュレーションが開始される。第1世代目の進化シミ
ュレーションでは、まず、ステップS206,S208
を経て、個体群のうち先頭の個体の個体情報が読み出さ
れ、読み出された個体情報に基づいて制御モジュール3
62が構築され、構築された制御モジュール362によ
りエンジン10の制御が開始され、しばらくの間その制
御モジュール362による制御が行われる。その間、ス
テップS210を経て、燃費およびレスポンス度が評価
部370から取得される。
【0089】これと同じ要領で、ステップS208から
S210までの処理が個体群のすべての個体について終
了すると、ステップS214を経て、各個体ごとにその
第2評価値であるレスポンス度が、ステップS202で
入力したレスポンス度の制限範囲内に属しているか否か
が判定される。その結果、レスポンス度の制限範囲内に
属していない個体については、ステップS216を経て
淘汰される。これにより、レスポンス度が制限範囲内に
属している個体のみが次世代の個体を生成する親個体の
候補として生存することとなる。
【0090】次いで、ステップS220〜S224を経
て、選択処理、交叉処理および突然変異処理が行われ
る。ここまでの処理を経て、第1世代目の進化シミュレ
ーションが終了する。その後は、これと同じ要領で、世
代交代数が所定回数以上となるまで、進化シミュレーシ
ョンが繰り返し行われる。その結果、図10に示すよう
に、レスポンス度が制限範囲内に属するように燃費特性
が自律的に最適化される。図10の例では、制限範囲内
であって燃費特性とレスポンス特性の最大曲線(波線)
上に位置する点がそれである。
【0091】次いで、進化シミュレーションが完了する
と、ステップS228を経て、個体群のなかから評価値
が最も高い個体が抽出され、抽出された個体の個体情報
に基づいて最適制御モジュールが構築され、制御モジュ
ール362が最適制御モジュールに固定される。次い
で、ステップS230を経て、制御モジュール362の
入出力関係が学習層200に学習させられる。この学習
では、まず、最適制御モジュールにより得られる実際の
エンジン回転数等の入力情報に対する進化補正率および
進化過渡補正率による制御を行う。自律型最適化部35
0が進化補正率および進化過渡補正率による制御を実行
し始めると、学習層200の学習用ニューラルネットワ
ークは、制御モジュール362の入出関係を、学習層2
00の実行用として機能しているニューラルネットワー
クの入出関係と合わせて学習する。この間、自律型最適
化部350の出力は、それ以前の評価関数を最大とした
個体により行われ、制御則が時間的に変化することはな
い。前記した学習では、自律型最適化部350と学習層
200の実行用ニューラルネットワークとの入出力を、
あるステップ幅で平均化し、これを入出力データとして
教師データ集合の更新に用いる。例えば、1秒間の平均
エンジン回転数が5000[rpm]、平均スロットル
開度が20、平均吸気温度が28[℃]、平均大気圧が
1013[hPa]であった場合、これらと、その時の
自律型最適化部350および学習層200における実行
用ニューラルネットワークの出力を加算したものを入出
力データとして用いる(図11参照)。この入出力デー
タを、以前の教師データに加えて新しい教師データ集合
を得る。このとき、教師データ集合における新しいデー
タとのユークリッド距離が一定値以内の古い教師データ
は消去する。この様子を図12に示す。また、教師デー
タ集合の初期値は、すべての入力データに対して出力を
「1」にしておく。学習層200では、更新された教師
データ集合に基づいて、学習用ニューラルネットワーク
におけるシナプスの結合係数の学習を行う。結合係数の
学習は、学習中の学習用ニューラルネットワークの出力
と反射層100からの基本噴射量および過渡補正率とか
ら得られる仮想制御出力と、実際の制御出力との間の誤
差がしきい値以下になるまで行われ、この学習が終わる
と、学習用のニューラルネットワークは実行用になり、
もとの制御用のニューラルネットワークが学習用とな
る。この後、学習層200は、新しく得られた実行用の
ニューラルネットワークにより学習補正率および学習過
渡補正率を決定して実際に出力し、同時に、ステップS
232を経て、制御モジュール362の出力は「1」に
なり、学習層200と反射層100とによる制御が行わ
れる。また、学習層200の実行用のニューラルネット
ワークの初期値は、出力が常に「1」になるように設定
しておく。こうすることで、初期状態においては、反射
層100と自律型最適化部350のみで制御を行うよう
にできる。
【0092】このようにして、本実施の形態では、レス
ポンス特性を制御する対話型最適化部310と、燃費特
性を制御する自律型最適化部350とを備え、対話型最
適化部310については、対話型最適化部310の制御
特性に影響を及ぼす制御係数を入力としてレスポンス度
を出力するレスポンス度算出部342を用いて、レスポ
ンス度算出部342のレスポンス度を対話型評価により
繰り返し評価しながら、レスポンス度算出部342の最
適解をGAにより探索するようになっており、自律型最
適化部350については、自律型最適化部350の制御
特性に影響を及ぼす制御係数を入力として燃費を出力す
る燃費算出部372を用いて、対話型最適化部310の
最適化で最適解として探索した解から求まるレスポンス
度を基準として所定範囲内にレスポンス度が属するよう
に、燃費算出部372の燃費を自律型評価により繰り返
し評価しながら、燃費算出部372の最適解をGAによ
り探索するようになっている。
【0093】これにより、従来に比して、使用者の希望
に比較的沿ったレスポンス度となるような制御係数を探
索することができ、しかも最適化に要する時間を比較的
短縮することができる。特に、対話型最適化部310に
ついて最適化が完了した後は、レスポンス度をさほど損
なうことなく、自律型最適化部350の最適化を比較的
高速に行うことができる。
【0094】さらに、本実施の形態では、対話型最適化
部310の評価の対象がレスポンス度であり、自律型最
適化部350の評価の対象が燃費である。これにより、
エンジン10の制御特性のうちレスポンス特性を使用者
向けに、燃費特性を所定の評価基準に従ってそれぞれ最
適化することができる。さらに、本実施の形態では、エ
ンジン10の燃料噴射量の補正率または過渡補正率の補
正率をニューラルネットワーク362a,362bによ
り生成するようになっており、個体情報には、ニューラ
ルネットワーク362a,362bにおけるシナプスの
結合係数を割り当てるようになっている。
【0095】これにより、高い評価値を得ることが期待
できる、ニューラルネットワーク362a,362bに
おけるシナプスの結合係数を決定することができる。上
記実施の形態において、GAは、請求項1、3ないし
5、7、8、10若しくは12記載の最適化アルゴリズ
ム、または請求項8記載の進化型最適化アルゴリズムに
対応し、ニューラルネットワーク362a,362bに
おけるシナプスの結合係数は、請求項3、5、8または
10記載の制御係数に対応している。また、RAMは、
請求項2または4記載の記憶手段に対応し、評価部34
0,370は、請求項2、4または8記載の評価値算出
手段に対応し、入力部322は、請求項2または4記載
の評価入力手段に対応し、エンジン10および電子スロ
ットル12は、請求項3ないし5、7、8または10記
載の制御対象に対応している。
【0096】また、上記実施の形態において、対話型最
適化部310は、請求項5記載の第1制御系に対応し、
自律型最適化部350は、請求項5記載の第2制御系に
対応し、レスポンス度算出部342は、請求項5記載の
第1評価関数に対応し、燃費算出部372は、請求項5
または7記載の第2評価関数に対応している。また、ス
テップS118,S120,S222,S224は、請
求項8記載の個体情報操作手段に対応し、ステップS1
16,S214〜S220は、請求項8記載の個体選択
手段に対応している。
【0097】なお、上記実施の形態においては、対話型
評価を繰り返し行いながらレスポンス特性を最適化した
後に、レスポンス度の制限範囲を設定し、自律型評価を
繰り返し行いながら、レスポンス度が制限範囲内に属す
るように燃費特性を最適化するように構成したが、これ
に限らず、自律型評価を繰り返し行いながら燃費特性を
最適化した後に、燃費特性に制限範囲を設定し、対話型
評価を繰り返し行いながら、燃費が制限範囲内に属する
ようにレスポンス特性を最適化するように構成してもよ
い。もちろん、このように順番に行うに限らず、少しず
つ交互に行うようにしてもよいし、並列に行うようにし
てもよい。
【0098】また、上記実施の形態においては、制御装
置30の制御対象として車両用エンジン10を適用して
いるが、制御装置30の制御対象は本実施の形態に限定
されることなく任意のものでよく、例えば、車体のサス
ペンションやシートのダンパー特性の制御または、電気
モータやエンジンを補助動力とする自転車或いは車イス
における補助動力のアシスト特性、またはパーソナルロ
ボットの動作特性(きびきびした動作やのんびりした動
作)の制御に適用してもよい。
【0099】また、本実施の形態においては、制御出力
として燃料噴射量を取り扱っているが、制御対象として
エンジン10を適用する場合、制御出力としては、その
他に、例えば、噴射時間、点火時期、吸気バルブタイミ
ング、電子スロットル開度、バルブリフト量、排気バル
ブタイミング、または吸排気制御用バルブタイミング等
が考えられる。ここで、吸気制御用バルブとは、タンブ
ルおよびスワールの制御を行うために吸気管に設けられ
るバルブであり、また、排気制御バルブとは、排気脈動
を制御するために排気管に設けられるバルブである。
【0100】また、本実施の形態においては、学習層2
00を階層型ニューラルネットワークで構成している
が、学習層200の制御系の構成は本実施例に限定され
ることなく、例えば、CMAC(Cerebellar Model Ari
thmetic Computer)を用いてもよい。CMACを用いる
利点としては、階層型ニューラルネットワークに比べ
て、追加学習の能力が優れていること、学習が高速であ
る等が挙げられる。
【0101】また、上記実施の形態においては、エンジ
ン10の燃料噴射量の補正率または過渡補正率の補正率
をニューラルネットワーク362a,362bにより生
成するようになっており、個体情報には、ニューラルネ
ットワーク362a,362bにおけるシナプスの結合
係数を割り当てるように構成したが、これに限らず、個
体情報には、エンジン10の燃料噴射量の補正率または
過渡補正率の補正率を直接割り当てるように構成しても
よい。
【0102】これにより、高い評価値を得ることが期待
できる、エンジン10の燃料噴射量の補正率または過渡
補正率の補正率を決定することができる。また、上記実
施の形態においては、エンジン10の燃料噴射量の補正
率または過渡補正率の補正率をニューラルネットワーク
362a,362bにより生成するように構成したが、
これに限らず、エンジン10の燃料噴射量、過渡補正
量、燃料噴射量の補正量または過渡補正量の補正量をニ
ューラルネットワーク362a,362bにより生成す
るように構成してもよい。このことは、ニューラルネッ
トワーク362a,362bにより生成せずに直接算出
する構成についても同じである。
【0103】また、上記実施の形態においては、エンジ
ン10の燃費特性およびレスポンス特性を最適化するの
にGAを用いたが、これに限らず、GPやES等の進化
的アルゴリズムを用いることもできる。また、上記実施
の形態において、図6および図9のフローチャートに示
す処理を実行するにあたっては、ROMにあらかじめ格
納されているプログラムを実行する場合について説明し
たが、これに限らず、これらの手順を示したプログラム
が記録された記録媒体から、そのプログラムをRAMに
読み込んで実行するようにしてもよい。
【0104】ここで、記録媒体とは、RAM、ROM等
の半導体記録媒体、FD、HD等の磁気記録型記録媒
体、CD、CDV、LD、DVD等の光学的読取方式記
録媒体、MO等の磁気記録型/光学的読取方式記録媒体
であって、電子的、磁気的、光学的等の読み取り方法の
いかんにかかわらず、コンピュータで読み取り可能な記
録媒体であれば、あらゆる記録媒体を含むものである。
【0105】
【発明の効果】以上説明したように、本発明に係る請求
項1または2記載の最適解探索装置によれば、従来に比
して、使用者の希望に比較的沿った解を探索することが
でき、しかも最適化に要する時間を比較的短縮すること
ができるという効果が得られる。
【0106】一方、本発明に係る請求項3ないし11記
載の最適化アルゴリズムによる制御対象の制御装置によ
れば、従来に比して、使用者の希望に比較的沿った解を
探索することができ、しかも最適化に要する時間を比較
的短縮することができるという効果が得られる。さら
に、本発明に係る請求項5記載の最適化アルゴリズムに
よる制御対象の制御装置によれば、第1制御系について
最適化が完了した後は、第1評価関数の最適な評価値と
して得られた評価値をさほど損なうことなく、第2制御
系の最適化を比較的高速に行うことができるという効果
も得られる。
【0107】さらに、本発明に係る請求項6記載の最適
化アルゴリズムによる制御対象の制御装置によれば、第
1制御系の最適化を比較的高速に行うことができるとと
もに、第1制御系について最適化が完了した後は、第1
評価関数の最適な評価値として得られた評価値をさほど
損なうことなく、第2制御系を最適化することができる
という効果も得られる。
【0108】さらに、本発明に係る請求項7記載の最適
化アルゴリズムによる制御対象の制御装置によれば、エ
ンジンの制御特性のうちレスポンス特性を使用者向け
に、燃費特性を所定の評価基準に従ってそれぞれ最適化
することができるという効果も得られる。さらに、本発
明に係る請求項9記載の最適化アルゴリズムによる制御
対象の制御装置によれば、高い評価値を得ることが期待
できる、燃料噴射量、過渡補正量、燃料噴射量の補正値
または過渡補正量の補正値を決定することができるとい
う効果も得られる。
【0109】さらに、本発明に係る請求項10記載の最
適化アルゴリズムによる制御対象の制御装置によれば、
高い評価値を得ることが期待できる、ニューラルネット
ワークにおけるシナプスの結合係数を決定することがで
きるという効果も得られる。さらに、本発明に係る請求
項11記載の最適化アルゴリズムによる制御対象の制御
装置によれば、電気モータの制御特性のうち回転変化特
性を使用者向けに、電力消費特性を所定の評価基準に従
ってそれぞれ最適化することができるという効果も得ら
れる。
【0110】一方、本発明に係る請求項12記載の最適
解探索プログラムによれば、請求項1記載の最適解探索
装置と同等の効果が得られる。
【図面の簡単な説明】
【図1】本発明の基本概念を示す図である。
【図2】本発明の基本構成を示すブロック図である。
【図3】本発明を適用するエンジン制御システムの構成
を示すブロック図である。
【図4】対話型最適化部310の構成を示すブロック図
である。
【図5】個体情報のデータ構造を示す図である。
【図6】進化適応部330で実行される処理を示すフロ
ーチャートである。
【図7】自律型最適化部350の構成を示すブロック図
である。
【図8】ニューラルネットワーク362a,362bの
構成および個体情報のデータ構造を示す図である。
【図9】進化適応部360で実行される処理を示すフロ
ーチャートである。
【図10】エンジン10および電子スロットル12の制
御特性を最適化する順序を示す図である。
【図11】教師データ集合が新しい教師データを獲得す
る状態を概念的に示す図である。
【図12】教師データ集合の更新を概念的に示す図であ
る。
【符号の説明】
10 エンジン 12 電子スロットル 20 各種センサ 30 制御装置 100 反射層 110 基礎制御部 200 学習層 210 学習部 300 進化適応層 310 対話型最適化部 320 インターフェース部 322 入力部 324 表示部 330,360 進化適応部 332,362 制御モジュール 340 評価部 350 自律型最適化部 362a,362b ニューラルネットワーク 370 評価部 372 燃費算出部 374 レスポンス度算出部

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 評価関数の出力を繰り返し評価しながら
    前記評価関数の最適解を最適化アルゴリズムにより探索
    する装置であって、 前記評価関数の出力に対する評価を使用者との対話に基
    づいて行う対話型評価と、前記評価関数の出力に対する
    評価を所定の評価基準に基づいて行う自律型評価との組
    み合わせにより、前記最適化アルゴリズムによる探索を
    行うようになっていることを特徴とする最適解探索装
    置。
  2. 【請求項2】 請求項1において、 前記評価関数の出力を記憶するための記憶手段と、前記
    評価関数の出力を評価値として算出して前記記憶手段に
    記憶する評価値算出手段と、前記使用者による評価を入
    力する評価入力手段とを備え、 前記対話型評価は、前記評価入力手段の入力内容に基づ
    いて行い、前記自律型評価は、前記記憶手段の評価値に
    基づいて行うようになっていることを特徴とする最適解
    探索装置。
  3. 【請求項3】 制御対象の特性を制御する制御系の制御
    特性に影響を及ぼす制御係数を入力として前記制御特性
    を出力する評価関数を用いて、前記評価関数の出力を繰
    り返し評価しながら前記評価関数の最適解を最適化アル
    ゴリズムにより探索することにより、前記制御系の制御
    特性を最適化する装置であって、 前記評価関数の出力に対する評価を使用者との対話に基
    づいて行う対話型評価と、前記評価関数の出力に対する
    評価を所定の評価基準に基づいて行う自律型評価との組
    み合わせにより、前記最適化アルゴリズムによる探索を
    行うようになっていることを特徴とする最適化アルゴリ
    ズムによる制御対象の制御装置。
  4. 【請求項4】 請求項3において、 前記評価関数の出力を記憶するための記憶手段と、前記
    評価関数の出力を評価値として算出して前記記憶手段に
    記憶する評価値算出手段と、前記使用者による評価を入
    力する評価入力手段とを備え、 前記対話型評価は、前記評価入力手段の入力内容に基づ
    いて行い、前記自律型評価は、前記記憶手段の評価値に
    基づいて行うようになっていることを特徴とする最適化
    アルゴリズムによる制御対象の制御装置。
  5. 【請求項5】 請求項3及び4のいずれかにおいて、 前記制御対象の第1の特性を制御する第1制御系と、前
    記制御対象の第2の特性を制御する第2制御系とを備
    え、 前記第1制御系については、前記第1制御系の制御特性
    に影響を及ぼす制御係数を入力として前記制御特性を出
    力する第1評価関数を用いて、前記第1評価関数の出力
    を前記対話型評価により繰り返し評価しながら、前記第
    1評価関数の最適解を前記最適化アルゴリズムにより探
    索するようになっており、 前記第2制御系については、前記第2制御系の制御特性
    に影響を及ぼす制御係数を入力として前記制御特性を出
    力する第2評価関数及び前記第1評価関数を用いて、前
    記第1制御系の最適化で最適解として探索した解から求
    まる前記第1評価関数の出力を基準として所定範囲内に
    前記第1評価関数の出力が属するように、前記第2評価
    関数の出力を前記自律型評価により繰り返し評価しなが
    ら、前記第2評価関数の最適解を前記最適化アルゴリズ
    ムにより探索するようになっていることを特徴とする最
    適化アルゴリズムによる制御対象の制御装置。
  6. 【請求項6】 請求項3及び4のいずれかにおいて、 前記制御対象の第1の特性を制御する第1制御系と、前
    記制御対象の第2の特性を制御する第2制御系とを備
    え、 前記第1制御系については、前記第1制御系の制御特性
    に影響を及ぼす制御係数を入力として前記制御特性を出
    力する第1評価関数を用いて、前記第1評価関数の出力
    を前記自律型評価により繰り返し評価しながら、前記第
    1評価関数の最適解を前記最適化アルゴリズムにより探
    索するようになっており、 前記第2制御系については、前記第2制御系の制御特性
    に影響を及ぼす制御係数を入力として前記制御特性を出
    力する第2評価関数及び前記第1評価関数を用いて、前
    記第1制御系の最適化で最適解として探索した解から求
    まる前記第1評価関数の出力を基準として所定範囲内に
    前記第1評価関数の出力が属するように、前記第2評価
    関数の出力を前記対話型評価により繰り返し評価しなが
    ら、前記第2評価関数の最適解を前記最適化アルゴリズ
    ムにより探索するようになっていることを特徴とする最
    適化アルゴリズムによる制御対象の制御装置。
  7. 【請求項7】 請求項5及び6のいずれかにおいて、 前記制御対象は、エンジンであり、 前記第1評価関数及び前記第2評価関数の出力のうち前
    記対話型評価の対象となるものは、前記エンジンの回転
    数変化率及びスロットル開度変化率により定まるレスポ
    ンス度であり、前記第1評価関数及び前記第2評価関数
    の出力のうち前記自律型評価の対象となるものは、前記
    エンジンの燃費であることを特徴とする最適化アルゴリ
    ズムによる制御対象の制御装置。
  8. 【請求項8】 請求項5乃至7のいずれかにおいて、 前記最適化アルゴリズムは、複数の個体の集合からなる
    個体群を仮想的に生成するとともに、前記各個体ごとに
    その個体の遺伝情報に見立てて個体情報を構成し、当該
    個体情報には前記制御係数を割り当て、さらに、遺伝子
    操作を模倣した情報操作を前記個体情報に対して行う個
    体情報操作手段と、前記個体の評価値を算出する評価値
    算出手段と、前記評価値算出手段で算出した評価値に基
    づいて前記個体の生存又は淘汰を行う個体選択手段とを
    備え、同一世代において、前記個体情報操作手段による
    遺伝的操作及び前記個体選択手段による個体選択操作を
    それぞれ少なくとも1回行って世代を進行させる進化型
    最適化アルゴリズムであることを特徴とする最適化アル
    ゴリズムによる制御対象の制御装置。
  9. 【請求項9】 請求項8において、 前記制御対象は、エンジンであり、 前記個体情報には、前記制御係数として、前記エンジン
    の燃料噴射量、前記エンジンの過渡状態において前記燃
    料噴射量を補正する過渡補正量、前記燃料噴射量の補正
    値又は前記過渡補正量の補正値を割り当てるようになっ
    ていることを特徴とする最適化アルゴリズムによる制御
    対象の制御装置。
  10. 【請求項10】 請求項8において、 前記制御対象は、エンジンであり、 前記エンジンの燃料噴射量、前記エンジンの過渡状態に
    おいて前記燃料噴射量を補正する過渡補正量、前記燃料
    噴射量の補正値又は前記過渡補正量の補正値をニューラ
    ルネットワークにより生成するようになっており、 前記個体情報には、前記制御係数として、前記ニューラ
    ルネットワークにおけるシナプスの結合係数を割り当て
    るようになっていることを特徴とする最適化アルゴリズ
    ムによる制御対象の制御装置。
  11. 【請求項11】 請求項5及び6のいずれかにおいて、 前記制御対象は、電気モータであり、 前記第1評価関数及び前記第2評価関数の出力のうち前
    記対話型評価の対象となるものは、前記電気モータの回
    転変化率であり、前記第1評価関数及び前記第2評価関
    数の出力のうち前記自律型評価の対象となるものは、前
    記電気モータの電力消費であることを特徴とする最適化
    アルゴリズムによる制御対象の制御装置。
  12. 【請求項12】 評価関数の出力を繰り返し評価しなが
    ら前記評価関数の最適解を最適化アルゴリズムにより探
    索するコンピュータ実行可能なプログラムであって、 前記評価関数の出力に対する評価を使用者との対話に基
    づいて行う対話型評価と、前記評価関数の出力に対する
    評価を所定の評価基準に基づいて行う自律型評価との組
    み合わせにより、前記最適化アルゴリズムによる探索を
    行う処理をコンピュータに実行させるためのプログラム
    であることを特徴とする最適解探索プログラム。
JP2001049342A 2001-02-23 2001-02-23 最適解探索装置、最適化アルゴリズムによる制御対象の制御装置及び最適解探索プログラム Pending JP2002251597A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2001049342A JP2002251597A (ja) 2001-02-23 2001-02-23 最適解探索装置、最適化アルゴリズムによる制御対象の制御装置及び最適解探索プログラム
PCT/JP2002/000932 WO2002069257A1 (fr) 2001-02-23 2002-02-05 Dispositif de recherche de solution optimale, dispositif pour commander un objet commande par algorithme d'optimisation, et programme de recherche de solution optimale
EP02710510A EP1372107A4 (en) 2001-02-23 2002-02-05 SEARCH FOR OPTIMAL SOLUTIONS, DEVICE FOR CONTROLLING A CONTROLLED OBJECT BY OPTIMIZING ALGORITHM AND SEARCH PROGRAM FOR OPTIMUM SOLUTIONS
US10/467,872 US7062333B2 (en) 2001-02-23 2002-02-05 Optimal solution search device, device for controlling controlled object by optimizing algorithm, and optimal solution search program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001049342A JP2002251597A (ja) 2001-02-23 2001-02-23 最適解探索装置、最適化アルゴリズムによる制御対象の制御装置及び最適解探索プログラム

Publications (1)

Publication Number Publication Date
JP2002251597A true JP2002251597A (ja) 2002-09-06

Family

ID=18910457

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001049342A Pending JP2002251597A (ja) 2001-02-23 2001-02-23 最適解探索装置、最適化アルゴリズムによる制御対象の制御装置及び最適解探索プログラム

Country Status (4)

Country Link
US (1) US7062333B2 (ja)
EP (1) EP1372107A4 (ja)
JP (1) JP2002251597A (ja)
WO (1) WO2002069257A1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007231829A (ja) * 2006-03-01 2007-09-13 Denso Corp 内燃機関の制御装置
JP2010250442A (ja) * 2009-04-13 2010-11-04 Toyota Motor Corp 走行軌跡演算装置、および、走行軌跡演算方法
WO2011033661A1 (ja) * 2009-09-18 2011-03-24 本田技研工業株式会社 内燃機関の制御装置
WO2011033662A1 (ja) * 2009-09-18 2011-03-24 本田技研工業株式会社 内燃機関の制御装置
US8483949B2 (en) 2009-04-13 2013-07-09 Toyota Jidosha Kabushiki Kaisha Running pattern calculating apparatus and running pattern calculating method

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002251597A (ja) * 2001-02-23 2002-09-06 Yamaha Motor Co Ltd 最適解探索装置、最適化アルゴリズムによる制御対象の制御装置及び最適解探索プログラム
US7035834B2 (en) * 2002-05-15 2006-04-25 Caterpillar Inc. Engine control system using a cascaded neural network
DE10354322B4 (de) * 2003-11-20 2022-06-09 Bayerische Motoren Werke Aktiengesellschaft Verfahren und System zur Ermittlung der Fahrsituation
JP2005271824A (ja) * 2004-03-25 2005-10-06 Mitsubishi Fuso Truck & Bus Corp 車両の挙動制御装置
CA2616376A1 (en) * 2005-07-25 2007-02-01 Duke University Methods, systems, and computer program products for optimization of probes for spectroscopic measurement in turbid media
US7291934B2 (en) * 2005-08-30 2007-11-06 Caterpillar Inc. Machine with an electrical system
EP2001352A4 (en) * 2006-03-17 2010-04-07 Univ Duke MODEL OF FLUORESCENCE IN A DISORDER MEDIUM BASED ON THE MONTE CARLO METHOD AND SYSTEMS FOR USING THE SAME TO DETERMINE THE INTRINSIC FLUORESCENCE OF A DISORDER MEDIUM
US7751039B2 (en) * 2006-03-30 2010-07-06 Duke University Optical assay system for intraoperative assessment of tumor margins
WO2008103486A1 (en) * 2007-02-23 2008-08-28 Duke University Scaling method for fast monte carlo simulation of diffuse reflectance spectra
KR101399199B1 (ko) * 2007-07-16 2014-05-27 삼성전자주식회사 소프트웨어 로봇의 유전자 코드 구성 방법
WO2009043050A2 (en) * 2007-09-27 2009-04-02 Duke University Optical assay system with a multi-probe imaging array
WO2009043045A1 (en) * 2007-09-28 2009-04-02 Duke University Systems and methods for spectral analysis of a tissue mass using an instrument, an optical probe, and a monte carlo or a diffusion algorithm
US20110105865A1 (en) * 2008-04-24 2011-05-05 Duke University Diffuse reflectance spectroscopy device for quantifying tissue absorption and scattering
US20100049561A1 (en) * 2008-08-22 2010-02-25 Alstom Technology Ltd. Fluidized bed combustion optimization tool and method thereof
JP6857332B2 (ja) * 2018-03-13 2021-04-14 オムロン株式会社 演算装置、演算方法、及びそのプログラム
JP6702380B2 (ja) * 2018-09-14 2020-06-03 トヨタ自動車株式会社 内燃機関の制御装置
JP6593560B1 (ja) * 2019-02-15 2019-10-23 トヨタ自動車株式会社 内燃機関の失火検出装置、内燃機関の失火検出システム、データ解析装置、および内燃機関の制御装置
US10947919B1 (en) 2019-08-26 2021-03-16 Caterpillar Inc. Fuel injection control using a neural network
US11603111B2 (en) * 2019-10-18 2023-03-14 Toyota Jidosha Kabushiki Kaisha Vehicle controller, vehicle control system, and learning device for vehicle
JP7205503B2 (ja) 2020-01-22 2023-01-17 トヨタ自動車株式会社 内燃機関の制御装置
JP7222366B2 (ja) * 2020-01-27 2023-02-15 トヨタ自動車株式会社 内燃機関の制御装置
JP7359011B2 (ja) 2020-02-05 2023-10-11 トヨタ自動車株式会社 内燃機関の制御装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5418858A (en) * 1994-07-11 1995-05-23 Cooper Tire & Rubber Company Method and apparatus for intelligent active and semi-active vibration control
US5877954A (en) * 1996-05-03 1999-03-02 Aspen Technology, Inc. Hybrid linear-neural network process control
US5933345A (en) * 1996-05-06 1999-08-03 Pavilion Technologies, Inc. Method and apparatus for dynamic and steady state modeling over a desired path between two end points
US6381504B1 (en) * 1996-05-06 2002-04-30 Pavilion Technologies, Inc. Method for optimizing a plant with multiple inputs
JP3825845B2 (ja) * 1996-09-27 2006-09-27 ヤマハ発動機株式会社 進化的制御方式
US6032139A (en) * 1996-09-27 2000-02-29 Yamaha Hatsudoki Kabushiki Kaisha Electronic controller using genetic evolution techniques suitable for controlling a motor
US5963458A (en) * 1997-07-29 1999-10-05 Siemens Building Technologies, Inc. Digital controller for a cooling and heating plant having near-optimal global set point control strategy
JP2000020103A (ja) * 1998-07-02 2000-01-21 Yamaha Motor Co Ltd 遺伝的アルゴリズムの評価方法
US6549815B1 (en) * 1999-03-02 2003-04-15 Yamaha Hatsudoki Kabushiki Kaisha Method and apparatus for optimizing overall characteristics of device, using heuristic method
JP2000276206A (ja) 1999-03-24 2000-10-06 Yamaha Motor Co Ltd 総合特性最適化方法及び装置
JP2002251597A (ja) * 2001-02-23 2002-09-06 Yamaha Motor Co Ltd 最適解探索装置、最適化アルゴリズムによる制御対象の制御装置及び最適解探索プログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007231829A (ja) * 2006-03-01 2007-09-13 Denso Corp 内燃機関の制御装置
JP4561652B2 (ja) * 2006-03-01 2010-10-13 株式会社デンソー 内燃機関の制御装置
JP2010250442A (ja) * 2009-04-13 2010-11-04 Toyota Motor Corp 走行軌跡演算装置、および、走行軌跡演算方法
US8483949B2 (en) 2009-04-13 2013-07-09 Toyota Jidosha Kabushiki Kaisha Running pattern calculating apparatus and running pattern calculating method
WO2011033661A1 (ja) * 2009-09-18 2011-03-24 本田技研工業株式会社 内燃機関の制御装置
WO2011033662A1 (ja) * 2009-09-18 2011-03-24 本田技研工業株式会社 内燃機関の制御装置

Also Published As

Publication number Publication date
US7062333B2 (en) 2006-06-13
EP1372107A1 (en) 2003-12-17
US20040078095A1 (en) 2004-04-22
EP1372107A4 (en) 2006-03-08
WO2002069257A1 (fr) 2002-09-06

Similar Documents

Publication Publication Date Title
JP2002251597A (ja) 最適解探索装置、最適化アルゴリズムによる制御対象の制御装置及び最適解探索プログラム
JP3825845B2 (ja) 進化的制御方式
KR101899101B1 (ko) 인공 신경망 기반 예측 모델 생성 장치 및 방법
Stanley et al. Efficient reinforcement learning through evolving neural network topologies
Leng et al. Design for self-organizing fuzzy neural networks based on genetic algorithms
Park et al. Fuzzy polynomial neural networks: hybrid architectures of fuzzy modeling
CN112035746A (zh) 一种基于时空序列图卷积网络的会话推荐方法
US6721647B1 (en) Method for evaluation of a genetic algorithm
JP2009099050A (ja) パラメトリック多目的最適化装置、パラメトリック多目的最適化方法およびパラメトリック多目的最適化プログラム
WO2022166115A1 (en) Recommendation system with adaptive thresholds for neighborhood selection
CN114511021A (zh) 基于改进乌鸦搜索算法的极限学习机分类算法
JPH11327606A (ja) 総合制御方式
CN113326884B (zh) 大规模异构图节点表示的高效学习方法及装置
Chen et al. Generative adversarial reward learning for generalized behavior tendency inference
JP6795116B1 (ja) 車両、及びサーバ
Chidambaran et al. Multi-criteria evolution of neural network topologies: Balancing experience and performance in autonomous systems
JP2002245434A (ja) 進化的手法による最適解探索装置、進化的手法による制御対象の制御装置及び進化的手法による最適解探索プログラム
JP2002251598A (ja) 最適解探索装置、制御対象の制御装置及び最適解探索プログラム
JP2002251599A (ja) 進化的手法による最適解探索装置、進化的手法による制御対象の制御装置及び進化的手法による最適解探索プログラム
JP2000339005A (ja) 制御対象の最適化制御方法及び制御装置
CN115470406A (zh) 一种基于双通道信息融合的图神经网络会话推荐方法
JP2004013328A (ja) 評価値算出方法、評価値算出装置、制御対象の制御装置及び評価値算出プログラム
JPH10154003A (ja) 進化的制御方式
CN112528556A (zh) 一种基于集成模型辅助社会学习粒子群算法的微机电系统设计优化方法
Salomie et al. Hybrid immune-inspired method for selecting the optimal or a near-optimal service composition