JP5019744B2 - 多目的最適化装置、多目的最適化方法および多目的最適化プログラム - Google Patents

多目的最適化装置、多目的最適化方法および多目的最適化プログラム Download PDF

Info

Publication number
JP5019744B2
JP5019744B2 JP2005369267A JP2005369267A JP5019744B2 JP 5019744 B2 JP5019744 B2 JP 5019744B2 JP 2005369267 A JP2005369267 A JP 2005369267A JP 2005369267 A JP2005369267 A JP 2005369267A JP 5019744 B2 JP5019744 B2 JP 5019744B2
Authority
JP
Japan
Prior art keywords
individual
evaluation
fitness
individuals
storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005369267A
Other languages
English (en)
Other versions
JP2007172306A (ja
Inventor
洋隆 梶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Motor Co Ltd
Original Assignee
Yamaha Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Motor Co Ltd filed Critical Yamaha Motor Co Ltd
Priority to JP2005369267A priority Critical patent/JP5019744B2/ja
Publication of JP2007172306A publication Critical patent/JP2007172306A/ja
Application granted granted Critical
Publication of JP5019744B2 publication Critical patent/JP5019744B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F02COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
    • F02DCONTROLLING COMBUSTION ENGINES
    • F02D41/00Electrical control of supply of combustible mixture or its constituents
    • F02D41/02Circuit arrangements for generating control signals
    • F02D41/14Introducing closed-loop corrections
    • F02D41/1401Introducing closed-loop corrections characterised by the control or regulation method
    • F02D41/1406Introducing closed-loop corrections characterised by the control or regulation method with use of a optimisation method, e.g. iteration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F02COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
    • F02DCONTROLLING COMBUSTION ENGINES
    • F02D41/00Electrical control of supply of combustible mixture or its constituents
    • F02D41/02Circuit arrangements for generating control signals
    • F02D41/14Introducing closed-loop corrections
    • F02D41/1401Introducing closed-loop corrections characterised by the control or regulation method
    • F02D2041/1433Introducing closed-loop corrections characterised by the control or regulation method using a model or simulation of the system
    • F02D2041/1437Simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Genetics & Genomics (AREA)
  • Computational Linguistics (AREA)
  • Mechanical Engineering (AREA)
  • Computer Hardware Design (AREA)
  • Combustion & Propulsion (AREA)
  • Physiology (AREA)
  • Chemical & Material Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Geometry (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、最適化対象のパラメータを最適化する多目的最適化装置、多目的最適化方法および多目的最適化プログラムに関する。
本明細書において、最適化とは、最適解または最適に近い解(準最適解)を求めることをいう。
従来、多目的最適化問題と呼ばれる問題クラスが存在する。例えば、ある製品のコストを最小化し、性能を最大化するという問題を考えた場合、これは2つの目的関数の多目的最適化問題となる。この場合、コストおよび性能が2つの目的関数となる。一般的には、コストを下げると性能が悪化し、性能を上げるとコストがかさむというトレードオフの関係が生じるために、多目的最適化問題の解は一つではない。
図37は多目的最適化問題をエンジンの最適化に適用した例を示す図である。多目的最適化問題をエンジンの燃費およびトルクの最適化に適用する場合、燃費およびトルクが2つの目的関数f1,f2である。この場合、燃料噴射量、点火時期等のパラメータを調整することにより目的関数f1,f2の値を最適化する。
解Aは、燃費が解Bに比べて優れているが、トルクが解Bに比べて劣っている。このように、エンジンの燃費とエンジンのトルクとはトレードオフの関係を有するため、複数の最適解が存在する。使用者は、複数の最適解から目的に合った解を選択することができる。例えば、スポーツ走行に適した自動二輪車に用いるエンジンには解Aを選択し、ロングツーリングに適した自動二輪車に用いるエンジンには解Bを選択する。
一般に多目的最適化問題は、N個のパラメータについてM個の目的関数の値を、各パラメータの制約条件の範囲で最小化する問題と定義される。目的関数の値を最大化する場合は、目的関数に負の符号を付けて目的関数の値を最小化する問題に変換することとする。
このような多目的最適化問題は、一般的に単一の最適解を持たず、パレート最適解と呼ばれる概念で定義される最適解集合を持つ。ここで、パレート最適解とは、ある目的関数の値を改善するためには、少なくとも1つの他の目的関数の値を改悪せざるを得ない解のことをいい、以下のように定義される(例えば、非特許文献1参照)。
〔定義1〕あるp個の目的関数fk(k=1,・・・,p)の2つの解x1,x2∈Fに関して、fk(x1)≦fk(x2)(∀k=1,・・・,p)∧fk(x1)<fk(x2)(∃k=1,・・・,p)のとき、x1はx2に優越するという。ここで、Fは解の集合である。
〔定義2〕ある解x0が他のすべての解x∈Fに優越するとき、x0は最適解である。
〔定義3〕ある解x0に優越する解x∈Fが存在しないとき、x0はパレート最適解(または非劣解)である。
パレート最適解集合を求めることは、目的関数のトレードオフに関して最適な解の集合を求めることになる。
図38はパレート最適解について説明するための図である。図38は2つの目的関数f1,f2の例を示す。解aについての目的関数f1の値f1(a)は解bについての目的関数f1の値f1(b)よりも小さく、解aについての目的関数f2 の値f2(a)は解bについての目的関数f2の値f2(b)よりも小さい。したがって、解aは解bに優越する。
同様に、解aは解c,dに優越する。解aに優越する解は存在しない。同様に、解e,fに優越する解も存在しない。したがって、解a,e,fはパレート最適解である。
なお、解gは、弱パレート最適解である。弱パレート最適解とは、ある目的関数についてのみパレート最適解に優越されないパレート解である。弱パレート最適解は、合理的な解ではなく、本来求める必要のない解である。
多目的最適化問題の解法は多数提案されている。最近注目されている方法に多目的進化型アルゴリズム(MOEAs:Multiple Objective Evolutionary Algorithm)がある。
この方法の最大の特徴は、進化型アルゴリズムの多点探索を利用してパレート最適解集合を一度に求めることである。得られたパレ一ト最適解集合は、その中から目的に合致した解を探す意志決定、またはパレ一ト最適解集合(パレート境界)の形状からの知見の獲得等に用いられる。
進化型アルゴリズムとして遺伝的アルゴリズム(GA:Genetic Algorithm)を多目的最適化問題に適用する研究が数多く行われている。遺伝的アルゴリズムは、生物の適応進化を模倣した計算手法である。遺伝的アルゴリズムでは、解の候補を個体と呼ぶ。また、目的関数は適応関数と呼び、適応度関数の値を適応度と呼ぶ。
この遺伝的アルゴリズムは、自然進化に見られる過程(染色体の選択、交叉および突然変異)をヒントにして、J.Hollandにより提案されたアルゴリズムである。設計変数を遺伝子とみなして、初期設計の個体集合をランダムに生成し、各個体の適応度を評価する。適応度の良い個体ほど親として選択される可能性が高くなるように親を選択する。そして、交叉(遺伝子の入れ換え)および突然変異(遺伝子のランダムな変化)により子孫を作る。さらに、評価、選択、交叉および突然変異により世代を繰り返し、最適解を探索する。
具体的には、FonsecaらのMOGA(Multiple Objective Genetic Algorithm:例えば、非特許文献1参照)、DebらのNSGA−II(Non-Dominated Sorting Genetic Algorithm-II:例えば、非特許文献2参照)、ZitzlerらのSPEA2(Strength Pareto Evolutionary Algorithm 2: 例えば、非特許文献3参照)等が提案されている。特に、NSGA−IIおよびSPEA2は優秀な多目的進化型アルゴリズムとして知られている。
また、不確実性を伴う適応度関数の最適化のために、探索履歴を用いて真の適応度を推定するMFEGA(Memory-based Fitness Estimation Genetic Algorithm)が佐野、喜多らにより提案されている(例えば、非特許文献4参照)。ここで、MFEGAでは、過去に得られた個体の適応度のサンプル値を探索履歴として保存し、探索履歴を参照して真の適応度を推定する。MFEGAは、不確実性を持つ問題に関して、同一個体の適応度を複数回サンプリングする方法および通常の遺伝的アルゴリズムに比べて優秀な探索性能を持つことが報告されている。
C.M.fonseca,p.J.Flemimg:genetic algorithms for multiobjective optimization:formulation,discussion and generalization,of the 5th international conference on genetic algorithms,pp.416-423(1993) K.Deb,S.Agrawal,A.Pratab,and T.Meyarivan:A Fast Elitist Non-Dominated Sorting Genetic Algorithm for Multi-Objective Optimization:NSGA-II,KanGAL report 20001,Indian Institute of Technology,Kanpur,India(20OO) E.Zitzler,M.Laumanns,L.Thiele:SPEA2:Improving the Performance of the Strength Pareto Evolutionary A1gorithm,Technical Report 103,Computer Engineering and Communication Networks Lab(TIK),Swiss Federal Institute of Technology(ETH)Zurich(2001) 佐野,喜多:探索履歴を利用した遺伝的アルゴリズムによる不確実関数の最適化,電学論C 122巻6号,PP−1001−1008(2002) K.Ikeda, H.Kita, and S.Kobayashi : Failuer of Pareto-Based MOEAs, Does Non-Dominated Really Mean Near to Optimal? Congress on Evolutionary Computation, pp.957-962(2001) M.D.Berg, et.al. : Computational Geometry : Algorithms and Applications, Springer-Verlag (1997) 今井浩、今井桂子,計算幾何学,情報数学講座12,共立出版(1994) E.Zitzler, K.Deb, L,Thiele : Comparison of Mu1tiobjective Evo1utionary Algorithms : Empirical Results, Evolutionary Computation 8(2), pp.173-195 (2000) Y. Jin, M. Olhofer, B. Sendhoff: On Evolutionary Optimization with Approximate Fitness Functions, Proc. of GECCO2000, pp. 786-792 (2000)
しかしながら、通常の単目的遺伝的アルゴリズムおよび多目的遺伝的アルゴリズムを用いて大きな計算コストを有するシミュレーションまたは実験ベースの最適化を行う場合、適切なパレート最適個体を得るために適応度の推定値の評価回数が非常に多くなり、膨大な時間を要する。そこで、種々の評価回数低減手法が提案されている。
例えば、非特許文献9には、多数の子個体を生成し、それらの子個体の適応度をニューラルネットワークにより推定し、適応度の推定値が高い子個体のみを実環境で評価するという単目的の進化型計算法が提案されている。
一方、適応度の推定値の評価にランキングを用いた多目的遺伝的アルゴリズムにおいては、実環境で評価可能な個体数以上のパレート最適個体が子個体に含まれている場合、実環境で評価すべき子個体をどのようにして選択するかが問題となる。しかしながら、このような場合において子個体の有効な選択方法は提案されていない。
したがって、従来の多目的遺伝的アルゴリズムを用いてパレート最適個体を短時間で効率良く得ることができない。
本発明の目的は、適切なパレート最適個体を短時間で効率良く得ることが可能な多目的最適化装置、多目的最適化方法および多目的最適化プログラムを提供することである。
(1)第1の発明に係る多目的最適化装置は、最適化対象に個体のパラメータの組を与え、複数の目的に対応する複数の適応度関数についての適応度の組を最適化対象から受ける多目的最適化装置であって、個体のパラメータの組および最適化対象から出力される適応度の組を保存用個体として記憶する記憶部と、新たな個体を評価用個体候補として生成し、生成された評価用個体候補のうち評価用個体として選択された個体のパラメータの組を最適化対象および記憶部に与えるとともに、複数組の適応度に基づいて評価用個体集合を多目的進化型アルゴリズムに従って評価することによりパレート最適個体集合を求める演算部と、記憶部に記憶された複数の保存用個体に対応する複数組の適応度に基づいて、演算部により生成された評価用個体候補および記憶部に記憶された保存用個体の和集合に含まれる各個体に対応する真の適応度の推定値の組を求める推定部とを備え、演算部は、複数の適応度関数の各々について和集合に含まれる複数の個体に対応する推定値の優劣を比較し、複数の適応度関数の各々について優劣の比較結果に基づいて和集合に含まれる複数の個体のランク付けを行い、最上位ランクの各評価用個体候補について最上位ランクの保存用個体の分布における疎の程度を表す分布指標を算出し、算出された分布指標が大きい順に所定数の評価用個体候補を評価用個体として選択するものである。
その多目的最適化装置においては、個体のパラメータの組および最適化対象から出力される適応度の組が保存用個体として記憶部に記憶される。演算部により新たな個体が評価用個体候補として生成され、生成された評価用個体候補のうち評価用個体として推定部により選択された個体のパラメータの組が最適化対象および記憶部に与えられる。また、複数組の適応度に基づいて評価用個体集合が多目的進化型アルゴリズムに従って演算部により評価される。それにより、パレート最適個体集合が求められる。
上記の評価用個体の選択の際には、記憶部に記憶された複数の保存用個体に対応する複数組の適応度に基づいて、評価用個体候補および保存用個体の和集合に含まれる各個体に対応する真の適応度の推定値の組が推定部により求められる。そして、演算部により複数の適応度関数の各々について和集合に含まれる複数の個体に対応する推定値の優劣が比較され、複数の適応度関数の各々について優劣の比較結果に基づいて和集合に含まれる複数の個体のランク付けが行われる。次いで、最上位ランクの各評価用個体候補について最上位ランクの保存用個体の分布における疎の程度を表す分布指標が算出され、算出された分布指標が大きい順に所定数の評価用個体候補が評価用個体として選択される。
このように、複数の評価用個体候補が生成され、最上位ランクの複数の評価用個体候補から分布指標が大きい順に所定数の評価用個体候補が評価用個体として選択され、選択された評価用個体が実際に評価される。それにより、不要な評価用個体候補を評価する時間が省略される。その結果、最適化の速度が向上する。したがって、適切なパレート最適個体を短時間で効率良く得ることが可能となる。
(2)第2の発明に係る多目的最適化装置は、最適化対象に個体のパラメータの組を与え、複数の目的に対応する複数の適応度関数についての適応度のサンプル値の組を最適化対象から受ける多目的最適化装置であって、個体のパラメータの組および最適化対象から出力される適応度のサンプル値の組を保存用個体として記憶する記憶部と、記憶部に記憶された複数の保存用個体に対応する複数組のサンプル値に基づいて注目個体に対応する真の適応度の推定値の組を求める第1の推定部と、第1の推定部により求められた推定値に基づいて新たな個体を評価用個体候補として生成し、生成された評価用個体候補のうち評価用個体として選択された個体のパラメータの組を最適化対象および記憶部に与えるとともに、第1の推定部により求められた複数組の推定値に基づいて評価用個体集合を多目的進化型アルゴリズムに従って評価することによりパレート最適個体集合を求める演算部と、記憶部に記憶された複数の保存用個体に対応する複数組のサンプル値に基づいて、演算部により生成された評価用個体候補および記憶部に記憶された保存用個体の和集合に含まれる各個体に対応する真の適応度の推定値の組を求める第2の推定部とを備え、演算部は、複数の適応度関数の各々について和集合に含まれる複数の個体に対応する推定値の優劣を比較し、複数の適応度関数の各々について優劣の比較結果に基づいて和集合に含まれる複数の個体のランク付けを行い、最上位ランクの各評価用個体候補について最上位ランクの保存用個体の分布における疎の程度を表す分布指標を算出し、算出された分布指標が大きい順に所定数の評価用個体候補を評価用個体として選択するものである。
その多目的最適化装置においては、個体のパラメータの組および最適化対象から出力される適応度のサンプル値の組が保存用個体として記憶部に記憶される。記憶部に記憶された複数の保存用個体に対応する複数組のサンプル値に基づいて注目個体に対応する真の適応度の推定値の組が第1の推定部により求められる。推定値に基づいて演算部により新たな個体が評価用個体候補として生成され、生成された評価用個体候補のうち評価用個体として第2の推定部により選択された個体のパラメータの組が最適化対象および記憶部に与えられる。また、求められた複数組の推定値に基づいて評価用個体集合が多目的進化型アルゴリズムに従って演算部により評価される。それにより、パレート最適個体集合が求められる。
上記の評価用個体の選択の際には、記憶部に記憶された複数の保存用個体に対応する複数組のサンプル値に基づいて、評価用個体候補および保存用個体の和集合に含まれる各個体に対応する真の適応度の推定値の組が第2の推定部により求められる。そして、演算部により複数の適応度関数の各々について和集合に含まれる複数の個体に対応する推定値の優劣が比較され、複数の適応度関数の各々について優劣の比較結果に基づいて和集合に含まれる複数の個体のランク付けが行われる。次いで、最上位ランクの各評価用個体候補について最上位ランクの保存用個体の分布における疎の程度を表す分布指標が算出され、算出された分布指標が大きい順に所定数の評価用個体候補が評価用個体として選択される。
このように、複数の評価用個体候補が生成され、最上位ランクの複数の評価用個体候補から分布指標が大きい順に所定数の評価用個体候補が評価用個体として選択され、選択された評価用個体が実際に評価される。それにより、不要な評価用個体候補を評価する時間が省略される。その結果、最適化の速度が向上する。したがって、適切なパレート最適個体を短時間で効率良く得ることが可能となる。
(3)第1の推定部は、記憶部に記憶された複数の保存用個体をhlとし、注目個体xに対応するサンプル値の組をF(x)とし、パラメータ空間上で注目個体から距離dl離れた個体に対応するサンプル値の組をF(hl)とし、k’を係数とし、l=1,…,Hとし、nを自然数とした場合に、
Figure 0005019744
で表される推定式により注目個体xに対応する真の適応度の推定値の組f’(x)を算出してもよい。
この場合、パラメータ空間上で注目個体と他の保存用個体との距離を考慮して真の適応度からの誤差がより小さい推定値を得ることができる。
(4)第2の推定部は、記憶部に記憶された複数の保存用個体をhlとし、パラメータ空間上で評価用個体候補から距離dl離れた保存用個体に対応するサンプル値の組をF(hl)とし、k’を係数とし、l=1,…,Hとし、nを自然数とした場合に、
Figure 0005019744
で表される推定式により評価用個体候補xに対応する真の適応度の推定値の組f’(x)を算出してもよい。
この場合、パラメータ空間上で評価用個体候補と保存用個体との距離を考慮して真の適応度からの誤差がより小さい推定値を得ることができる。
(5)nは1であってもよい。この場合、推定値の算出において、パラメータ空間上で評価用個体候補から遠く離れた保存用個体の影響が小さくなる。それにより、真の適応度からの誤差が十分に小さい推定値を得ることができる。
(6)nは3であってもよい。この場合、推定値の算出において、パラメータ空間上で評価用個体候補から遠く離れた保存用個体の影響が大幅に小さくなる。それにより、真の適応度からの誤差がさらに十分に小さい推定値を得ることができる。
(7)演算部は、適応度関数空間上で最上位ランク内で各評価用個体候補に隣接する2つの保存用個体を検出し、適応度関数ごとに前記2つの保存用個体間の数学的距離を算出し、各評価用個体候補についての複数の適応度関数における数学的距離の合計を前記分布指標として算出し、複数の評価用個体候補から算出された分布指標が大きい順に所定数の評価用個体候補を評価用個体として選択してもよい。
この場合、適応度関数空間上で最上位ランク内で保存用個体が疎らな領域に新たな評価用個体を容易に生成することが可能となる。それにより、多様性の高いパレート最適個体を容易に得ることができる。
(8)演算部は、第1の推定部により求められた推定値の組に基づいてパレート最適個体を表示してもよい。
この場合、使用者は、パレート最適個体を視覚的に認識することができるので、種々の意思決定を容易に行うことができる。
(9)演算部は、多目的進化型アルゴリズムとして遺伝的アルゴリズムを用いて評価用個体集合の個体を評価してもよい。
この場合、遺伝的アルゴリズムに基づいて世代交代を行うことにより、最適なパレート最適個体を容易に得ることができる。
(10)最適化対象は、機器の複数の性能を評価するための評価システムを含み、パラメータの組は、評価システムのための制御用パラメータの組を含み、複数の適応度関数は評価システムの評価により得られる複数の性能であり、適応度の組は複数の性能の値であってもよい。
この場合、評価システムに制御用パラメータの組が与えられる。評価システムにより制御用パラメータの組に基づいて機器の性能が評価され、複数の性能に対応するサンプル値の組が出力される。この多目的最適化装置によれば、適切な制御用パラメータの組の集合をパレート最適個体として短時間で効率良く得ることができる。
(11)機器はエンジンであってもよい。この場合、評価システムにエンジン制御用パラメータの組が与えられる。評価システムによりエンジン制御用パラメータの組に基づいてエンジンの性能が評価され、複数の性能に対応するサンプル値の組が出力される。この多目的最適化装置によれば、適切なエンジン制御用パラメータの組の集合をパレート最適個体として短時間で効率良く得ることができる。
(12)機器はモータであってもよい。この場合、評価システムにモータ制御用パラメータの組が与えられる。評価システムによりモータ制御用パラメータの組に基づいてモータの性能が評価され、複数の性能に対応するサンプル値の組が出力される。この多目的最適化装置によれば、適切なモータ制御用パラメータの組の集合をパレート最適個体として短時間で効率良く得ることができる。
(13)評価システムは、パラメータの組に基づいて機器を制御するとともに機器の動作により発生される複数の性能の値をサンプル値として出力する機器評価装置であってもよい。
この場合、機器評価装置に制御用パラメータの組が与えられる。機器評価装置により制御用パラメータの組に基づいて機器の性能が評価され、複数の性能に対応するサンプル値の組が出力される。この多目的最適化装置によれば、適切な制御用パラメータの組の集合をパレート最適個体として効率良く短時間で得ることができる。
(14)評価システムは、パラメータの組に基づいて機器の動作をシミュレーションすることにより複数の性能を評価し、評価された複数の性能の値をサンプル値の組として出力する機器シミュレータであってもよい。
この場合、機器シミュレータに制御用パラメータの組が与えられる。機器シミュレータにより制御用パラメータの組に基づいて機器の動作がシミュレーションされることにより複数の性能が評価され、評価された複数の性能に対応するサンプル値の組が出力される。この多目的最適化装置によれば、適切な制御用パラメータの組の集合をパレート最適個体として短時間で効率良く得ることができる。
(15)第3の発明に係る多目的最適化方法は、最適化対象に個体のパラメータの組を与え、最適化対象から出力される複数の目的に対応する複数の適応度関数についての適応度のサンプル値の組に基づいてパラメータを最適化する多目的最適化方法であって、個体のパラメータの組および最適化対象から出力される適応度のサンプル値の組を保存用個体として記憶部に記憶するステップと、記憶部に記憶された複数の保存用個体に対応する複数組のサンプル値に基づいて注目個体に対応する真の適応度の推定値の組を求めるステップと、求められた推定値に基づいて新たな個体を評価用個体候補として生成するステップと、記憶部に記憶された複数の保存用個体に対応する複数組のサンプル値に基づいて、生成された評価用個体候補および記憶部に記憶された保存用個体の和集合に含まれる各個体に対応する真の適応度の推定値の組を求めるステップと、複数の適応度関数の各々について和集合に含まれる複数の個体に対応する推定値の優劣を比較し、複数の適応度関数の各々について優劣の比較結果に基づいて和集合に含まれる複数の個体のランク付けを行い、最上位ランクの各評価用個体候補について最上位ランクの保存用個体の分布における疎の程度を表す分布指標を算出し、算出された分布指標が大きい順に所定数の評価用個体候補を評価用個体として選択するステップと、選択された評価用個体のパラメータの組を最適化対象および記憶部に与えるとともに、求められた複数組の推定値に基づいて評価用個体集合を多目的進化型アルゴリズムに従って評価することによりパレート最適個体集合を求めるステップとを含むものである。
その多目的最適化方法においては、個体のパラメータの組および最適化対象から出力される適応度のサンプル値の組が保存用個体として記憶部に記憶される。記憶部に記憶された複数の保存用個体に対応する複数組のサンプル値に基づいて注目個体に対応する真の適応度の推定値の組が求められる。
次に、推定値に基づいて新たな個体が評価用個体候補として生成される。さらに、複数の保存用個体に対応する複数組のサンプル値に基づいて、評価用個体候補および保存用個体の和集合に含まれる各個体に対応する真の適応度の推定値の組が求められる。そして、複数の適応度関数の各々について和集合に含まれる複数の個体に対応する推定値の優劣が比較され、複数の適応度関数の各々について優劣の比較結果に基づいて和集合に含まれる複数の個体のランク付けが行われる。次いで、最上位ランクの各評価用個体候補について最上位ランクの保存用個体の分布における疎の程度を表す分布指標が算出され、算出された分布指標が大きい順に所定数の評価用個体候補が評価用個体として選択される。
さらに、評価用個体として選択された個体のパラメータの組が最適化対象および記憶部に与えられる。また、求められた複数組の推定値に基づいて評価用個体集合が多目的進化型アルゴリズムに従って評価される。それにより、パレート最適個体集合が求められる。
このように、複数の評価用個体候補が生成され、最上位ランクの複数の評価用個体候補から分布指標が大きい順に所定数の評価用個体候補が評価用個体として選択され、選択された評価用個体が実際に評価される。それにより、不要な評価用個体候補を評価する時間が省略される。その結果、最適化の速度が向上する。したがって、適切なパレート最適個体を短時間で効率良く得ることが可能となる。
(16)第4の発明に係る多目的最適化プログラムは、最適化対象に個体のパラメータの組を与え、最適化対象から出力される対応する複数の適応度関数についての適応度のサンプル値の組に基づいてパラメータを最適化するコンピュータにより実行可能な多目的最適化プログラムであって、個体のパラメータの組および最適化対象から出力される適応度のサンプル値の組を保存用個体として記憶部に記憶する処理と、記憶部に記憶された複数の保存用個体に対応する複数組のサンプル値に基づいて注目個体に対応する真の適応度の推定値の組を求める処理と、求められた推定値に基づいて新たな個体を評価用個体候補として生成する処理と、記憶部に記憶された複数の保存用個体に対応する複数組のサンプル値に基づいて、生成された評価用個体候補および記憶部に記憶された保存用個体の和集合に含まれる各個体に対応する真の適応度の推定値の組を求める処理と、複数の適応度関数の各々について和集合に含まれる複数の個体に対応する推定値の優劣を比較し、複数の適応度関数の各々について優劣の比較結果に基づいて和集合に含まれる複数の個体のランク付けを行い、最上位ランクの各評価用個体候補について最上位ランクの保存用個体の分布における疎の程度を表す分布指標を算出し、算出された分布指標が大きい順に所定数の評価用個体候補を評価用個体として選択する処理と、選択された評価用個体のパラメータの組を最適化対象および記憶部に与えるとともに、求められた複数組の推定値に基づいて評価用個体集合を多目的進化型アルゴリズムに従って評価することによりパレート最適個体集合を求める処理とを、コンピュータに実行させるものである。
その多目的最適化プログラムにおいては、個体のパラメータの組および最適化対象から出力される適応度のサンプル値の組が保存用個体として記憶部に記憶される。記憶部に記憶された複数の保存用個体に対応する複数組のサンプル値に基づいて注目個体に対応する真の適応度の推定値の組が求められる。
次に、推定値に基づいて新たな個体が評価用個体候補として生成される。さらに、複数の保存用個体に対応する複数組のサンプル値に基づいて、評価用個体候補および保存用個体の和集合に含まれる各個体に対応する真の適応度の推定値の組が求められる。そして、複数の適応度関数の各々について和集合に含まれる複数の個体に対応する推定値の優劣が比較され、複数の適応度関数の各々について優劣の比較結果に基づいて和集合に含まれる複数の個体のランク付けが行われる。次いで、最上位ランクの各評価用個体候補について最上位ランクの保存用個体の分布における疎の程度を表す分布指標が算出され、算出された分布指標が大きい順に所定数の評価用個体候補が評価用個体として選択される。
さらに、評価用個体として選択された個体のパラメータの組が最適化対象および記憶部に与えられる。また、求められた複数組の推定値に基づいて評価用個体集合が多目的進化型アルゴリズムに従って評価される。それにより、パレート最適個体集合が求められる。
このように、複数の評価用個体候補が生成され、最上位ランクの複数の評価用個体候補から分布指標が大きい順に所定数の評価用個体候補が評価用個体として選択され、選択された評価用個体が実際に評価される。それにより、不要な評価用個体候補を評価する時間が省略される。その結果、最適化の速度が向上する。したがって、適切なパレート最適個体を短時間で効率良く得ることが可能となる。
本発明によれば、複数の評価用個体候補が生成され、最上位ランクの複数の評価用個体候補から分布指標が大きい順に所定数の評価用個体候補が評価用個体として選択され、選択された評価用個体が実際に評価される。それにより、不要な評価用個体候補を評価する時間が省略される。その結果、最適化の速度が向上する。したがって、適切なパレート最適個体を短時間で効率良く得ることが可能となる。
(1)第1の実施の形態
まず、本発明の第1の実施の形態に係る多目的最適化装置を図1に基づき説明する。
(a)多目的最適化装置の機能的な構成
図1は本発明の第1の実施の形態に係る多目的最適化装置の機能的な構成を示すブロック図である。
図1の多目的最適化装置1は、多目的進化型アルゴリズムとして多目的遺伝的アルゴリズム(GA)を利用して多目的最適化問題のパレート最適個体集合を算出する。この多目的最適化装置1は、最適化対象6に接続される。
最適化対象6は、機器の性能を評価する評価システムである。評価システムは、実システムを評価する評価装置または確率要素を含むシミュレータである。実システムは、例えばエンジンまたはモータであり、評価装置は、例えばエンジン評価装置またはモータ評価装置である。また、シミュレータは、例えばエンジンシミュレータまたはモータシミュレータである。本実施の形態では、最適化対象6はエンジン評価装置である。
多目的最適化装置1は、多目的進化型アルゴリズム部2、適応度推定部3、出力インタフェース4および入力インタフェース5を含む。適応度推定部3は、適応度推定モジュール30a,30bおよび探索履歴記憶装置31を含む。
多目的進化型アルゴリズム部2および適応度推定部3の適応度推定モジュール30a,30bは、後述するCPU101(図2)が多目的最適化プログラムを実行することにより実現される。探索履歴記憶装置31は、後述する外部記憶装置106(図2)により構成される。
使用者10は、多目的進化型アルゴリズム部2に複数の適応度関数(目的関数)を設定する。本実施の形態では、複数の適応度関数としては、燃費、トルク、エンジンの排気ガスに含まれるCO(一酸化炭素)、HC(炭化水素)、NOx (窒素酸化物)等の成分の濃度等のうち複数が設定される。
ここで、トレードオフの関係としては、トルクと燃費、トルクとCO濃度、トルクとHC濃度、燃費とNOx 濃度、CO濃度とNOx 濃度、HC濃度とNOx 濃度等が挙げられる。
また、多目的遺伝的アルゴリズムの個体とは、多目的最適化問題の解の候補であり、複数のパラメータの組および複数の適応度を有する。パラメータは、調整可能な値であり、遺伝的アルゴリズムでは、遺伝子と呼ばれる。パラメータとしては、燃料噴射量、燃料噴射時期、点火時期、スロットル開度等が挙げられる。適応度は、適応度関数の値である。以下、多目的遺伝的アルゴリズムの個体を単に個体と呼ぶ。
多目的進化型アルゴリズム部2は、後述する適応度推定モジュール30a,30bにより算出された真の適応度の推定値を受け、個体のパラメータの組を適応度推定部3の探索履歴記憶装置31に与えるとともに出力インタフェース4を介して最適化対象6に与える。以下、真の適応度の推定値を単に適応度の推定値または推定値と呼ぶ。
最適化対象6は、多目的最適化装置1から与えられた個体のパラメータの組に基づいて適応度のサンプル値の組を出力する。最適化対象6から出力される各サンプル値は、後述するように、真の適応度およびノイズ成分を含む。サンプル値の詳細については、後述する。
最適化対象6から出力されるサンプル値の組は、入力インタフェース5を介して適応度推定部3の探索履歴記憶装置31に入力される。探索履歴記憶装置31は、個体のパラメータの組およびサンプル値の組を探索履歴として記憶する。以下、探索履歴に含まれる個体のパラメータおよびサンプル値の各組を履歴データと呼ぶ。
適応度推定モジュール30a,30bは、探索履歴記憶装置31に記憶される探索履歴の履歴データに基づいて適応度の推定値の組を算出し、推定値の組を多目的進化型アルゴリズム部2に与える。特に、適応度推定モジュール30bは、後述する子個体の選択時に子個体候補の適応度の推定値を算出するために用いられる。詳細は後述する。適応度推定モジュール30a,30bが1つの適応度推定モジュールにより構成されてもよい。
多目的進化型アルゴリズム部2は、複数組の推定値に基づいて遺伝的アルゴリズムにしたがって複数の個体を発生して多点探索を行い、適応度関数をパレート最適性で評価することにより、パレート最適個体集合を同時に求める。また、多目的進化型アルゴリズム部2は、求められたパレート最適個体集合を使用者10に提示する。
このように、多目的進化型アルゴリズム部2および適応度推定部3は、協働することにより個体のパラメータの最適化を行う。
多目的進化型アルゴリズム部2および適応度推定部3の詳細な動作については後述する。
(b)多目的最適化装置のハードウエア構成
図2は図1の多目的最適化装置1のハードウエア構成を示すブロック図である。
多目的最適化装置1は、CPU(中央演算処理装置)101、ROM(リードオンリメモリ)102、RAM(ランダムアクセスメモリ)103、入力装置104、表示装置105、外部記憶装置106、記録媒体駆動装置107および入出力インタフェース108を含む。
入力装置104は、キーボード、マウス等からなり、各種指令および各種データを入力するために用いられる。ROM102にはシステムプログラムが記憶される。記録媒体駆動装置107は、CD(コンパクトディスク)ドライブ、DVD(デジタルバーサタイルディスク)ドライブ、フレキシブルディスクドライブ等からなり、CD、DVD、フレキシブルディスク等の記録媒体109に対してデータの読み書きを行う。
記録媒体109には、多目的最適化プログラムが記録されている。外部記憶装置106は、ハードディスク装置等からなり、記録媒体駆動装置107を介して記録媒体109から読み込まれた多目的最適化プログラムおよび各種データを記憶する。CPU101は、外部記憶装置106に記憶された多目的最適化プログラムをRAM103上で実行する。
表示装置105は、液晶表示パネル、CRT(陰極線管)等からなり、パレート最適個体集合等の各種画像を表示する。入出力インタフェース108は、図1の出力インタフェース4および入力インタフェース5を含む。この入出力インタフェース108には最適化対象6が無線通信または有線通信により接続される。入出力インタフェース108は、最適化対象6から出力されるサンプル値の組を外部記憶装置106に転送するとともに、多目的最適化プログラムにより生成された個体のパラメータの組を最適化対象6に与える。
なお、多目的最適化プログラムを記録する記録媒体109として、ROM等の半導体メモリ、ハードディスク等の種々の記録媒体を用いることができる。また、多目的最適化プログラムを通信回線等の通信媒体を介して外部記憶装置106にダウンロードし、RAM103上で実行してもよい。
ここで、記録媒体109は、コンピュータで読み取り可能な記録媒体であれば、電子的読み取り方式、磁気的読み取り方式、光学的読み取り方式またはその他のあらゆる読み取り方式の記録媒体を含むものである。例えば、上記のCD、DVDおよびフレキシブルディスクの他、CDV(コンパクトディスクビデオ)等の光学的読取方式記録媒体、RAM、ROM等の半導体記録媒体、ハードディスク等の磁気記録型記録媒体、MO(光磁気ディスク)等の磁気記憶型/光学的読取方式記録媒体を用いることができる。
(c)最適化対象の構成
図3は最適化対象6の構成の一例を示すブロック図である。図3の最適化対象6はエンジン評価装置である。
最適化対象6は、エンジン61、ECU(エンジン制御ユニット)62、排気ガス分析計63、コントローラ64、スロットルユニット65およびダイナモ66を含む。
ECU62は、多目的最適化装置1からシリアル通信によりパラメータの組を受信する。本例では、パラメータの組は、点火時期および燃料噴射時期である。ECU62は、パラメータの組に基づいてエンジン61の点火時期および燃料噴射時期を制御する。エンジン61からコントローラ64に回転数、空燃比等のエンジン情報が与えられる。
コントローラ64は、エンジン情報に基づいてスロットルユニット65およびダイナモ66を制御する。スロットルユニット65は、エンジン61の吸入空気量を調整することによりエンジン61の出力トルクを制御する。ダイナモ66は、負荷トルクを制御する。
排気ガス分析計63は、エンジン61からの排気ガス中の成分を分析し、HC濃度およびNOx濃度をサンプル値の組としてシリアル通信により多目的最適化装置1に出力する。
図4はHC濃度、NOx濃度およびCO濃度と空燃比との関係を示す図である。
燃料が完全に燃焼すれば、排気ガスに二酸化炭素と水とが含まれる。しかし、運転状態が変化すると燃焼状態も変化し、排気ガスにCO、HCおよびNOxが含まれる。
図4に示すように、空燃比が小さいと、HC濃度およびNOx 濃度が低くなる。NOx 濃度は空燃比が理論空燃比(14.7)よりやや小さいときに最大となり、それ以外の領域では減少する。理論空燃比付近では、HC濃度とNOx 濃度はトレードオフの関係を有し、CO濃度とNOx 濃度とはトレードオフの関係を有する。
図3の最適化対象6は、多目的最適化装置1から個体のパラメータの組として点火時期を示す点火時期情報および燃料噴射時期を示す燃料噴射時期情報を受け、サンプル値の組としてHC濃度およびNOx 濃度を出力する。
(d)多目的最適化装置の全体処理
図5および図6は図1の多目的最適化装置1の全体処理を示すフローチャートである。
図5に示すように、最適化処理が開始されると、多目的進化型アルゴリズム部2は、初期個体集合として親個体集合Pを各パラメータの定められた範囲内でランダムに生成することにより親個体集合Pを初期化し、生成された親個体集合Pの各個体のパラメータの組を最適化対象6に順次与える(ステップS1)。それにより、最適化対象6から適応度のサンプル値の組が順次出力される。
なお、事前知識として知られているパレート最適個体が存在する場合は、そのパレート最適個体を初期個体集合の一部として用いてもよい。それにより、パレート最適個体の探索の収束性が向上する。
適応度推定部3の探索履歴記憶装置31は、最適化対象6から親個体集合Pの各個体に対応するサンプル値の組を取得し、親個体集合Pのパラメータの組およびサンプル値の組を探索履歴として記憶する(ステップS2)。
次に、適応度推定部3の適応度推定モジュール30aは、探索履歴記憶装置31に記憶された複数の個体に対応するサンプル値の組に基づいて親個体集合Pの各個体について適応度の推定値の組を算出する(ステップS3)。適応度の推定値の算出方法については後述する。
次に、多目的進化型アルゴリズム部2は、適応度の推定値の組に基づく優劣比較およびパレートランキングにより親個体集合Pをランクごとの個体集合に分割する(ステップS4)。パレートランキングについては後述する。
次に、多目的進化型アルゴリズム部2は、親個体集合Pの各ランクの個体集合に混雑度ソートを行う(ステップS5)。それにより、各ランクの個体が混雑度(混雑距離)の大きい順に並べられる。混雑度ソートについては後述する。そして、より上位のランクでより大きな混雑度を有する所定数の個体が選択され、他の個体が削除される。
さらに、多目的進化型アルゴリズム部2および適応度推定モジュール30bは、親個体集合Pの最上位ランク(ランク1)の個体集合から特定の1つの親個体を選択し、親個体集合Pからランダムに2つの個体を選択し、合計3つの親個体を選択するとともに、3つの親個体に交叉操作を施すことにより子個体集合Cを生成する(ステップS6a)。この場合、多数の子個体候補が生成され、後述する方法で子個体候補から所定数の子個体が選択される。子個体集合Cの生成処理の詳細については後述する。
多目的進化型アルゴリズム部2は、生成された子個体集合Cの各個体のパラメータの組を最適化対象6に順次与える(ステップS6b)。それにより、最適化対象6から適応度のサンプル値の組が順次出力される。
ここで、交叉操作とは、個体の遺伝子を掛け合わせることにより新たな個体を生成することをいう。特定の親個体の選択方法については後述する。
適応度推定部3の探索履歴記憶装置31は、最適化対象6から出力される子個体集合Cの各個体に対応する適応度のサンプル値の組を取得し、各個体に対応するパラメータの組およびサンプル値の組を探索履歴として記憶する(ステップS7)。
次いで、多目的進化型アルゴリズム部2は、子個体集合Cと親個体集合Pとから個体集合Fを生成する(ステップS8)。
適応度推定部3の適応度推定モジュール30aは、探索履歴記憶装置31に記憶された複数組のサンプル値に基づいて個体集合Fの各個体に対応する適応度の推定値の組を算出する(ステップS9)。
多目的進化型アルゴリズム部2は、適応度の推定値の組に基づく優劣比較およびパレートランキングにより個体集合Fをランクごとの個体集合に分割し、子個体集合Cにおいて親個体集合Pの個体と重複する個体に最下位ランクを付与する(ステップS10)。
次に、多目的進化型アルゴリズム部2は、個体集合Fの各ランクの個体集合に混雑度ソートを行って新たな親個体集合Pを生成する(ステップS11)。それにより、各ランクの個体が混雑度(混雑距離)の大きい順に並べられる。混雑度ソートについては後述する。そして、より上位のランクでより大きな混雑度を有する所定数の個体が選択され、他の個体が削除される。
その後、多目的進化型アルゴリズム部2は、世代数が所定の終了条件に到達したか否かを判定する(ステップS12)。
ここで、世代とは、個体集合から親個体を選択する選択ステップ、交叉操作により新たな子個体を生成する交叉ステップおよび親個体と子個体とを入れ替える世代交代ステップから構成される。世代数が所定の終了条件に到達していないと判定した場合には、ステップS6aに移行する。世代数が所定の終了条件に到達したと判定した場合には、多目的進化型アルゴリズム部2は、ステッブS11で生成された親個体集合Pをパレート最適個体集合として使用者10に提示し、処理を終了する。
(e)多目的最適化装置の各処理の具体例
図7〜図12は多目的最適化装置1の各処理の具体例を示す模式図である。
図7〜図12には、2つのパラメータx1,x2および2つの適応度関数f1,f2の例が示される。図3の最適化対象6の場合には、パラメータx1,x2は点火時期および燃料噴射時期であり、適応度関数f1,f2はHC濃度およびNOx 濃度である。
(e−1)親個体集合の初期化
図7は初期化により生成される親個体集合を示す模式図であり、(a)は適応度関数空間における親個体集合を示し、(b)はパラメータ空間における親個体集合を示す。初期化においては、図7に示すように、適応度関数空間およびパラメータ空間に複数の個体がランダムに生成される。
(e−2)個体の評価方法
多目的最適化問題においては、個体が複数の適応度関数に対応する適応度を有するため、単純な値の大小では個体の優劣を比較できない。本実施の形態では、以下に説明する優劣比較、パレートランキングおよび混雑度ソートを用いて個体を評価する。
(e−2−1)優劣比較
図5のステップS4および図6のステップS10における優劣比較について説明する。この優劣比較には、以下に示すα優越戦略(α-domination strategy)が用いられる。なお、α優越戦略の詳紬については、例えば、非特許文献5に掲載されている。
図8はα優越戦略を説明するための模式図である。ここで、一般に、α優越は、次のように定義される。
あるp個の目的度関数fk(k=1,・・・,p)の2つの解x1,x2∈Fに対して次式(8)で表されるgk(x1,x2)が次の関係を有する場合、解x1は解x2にα優越する。
k(x1,x2)≦0(∀k=1,・・・,p)∧gk(x1,x2)<0(∃k=1,・・・,p)
Figure 0005019744
上式において、fk(x1)およびfj(x1)はそれぞれ解x1に対応する目的関数fkおよびfjの値であり、fk(x2)およびfj(x2)はそれぞれ解x2に対応する目的関数fkおよびfjの値である。多目的遺伝的アルゴリズムでは、解x1および解x2が個体に相当し、目的関数fkおよびfjが適応度関数に相当する。
ここで、図8において、個体I3に注目する。一般的な優越比較によれば、個体I3から適応度関数f1に平行に延びる直線L11および個体I3から適応度関数f2に平行に延びる直線L12で個体I3が他の個体に優越する領域が定められる。すなわち、個体I3は、直線L11よりも上でかつ直線L12より右の領域にある他の個体I6,I7,I8に優越する。個体I2,I4は、個体I3により優越されない。
個体I2は、適応度関数f1に関しては個体I3によりもわずかに優れているが、適応度関数f2に関しては個体I3よりもかなり劣っている。個体I4は、適応度関数f2に関しては個体I3よりもわずかに優れているが、適応度関数f1に関しては個体I3よりもかなり劣っている。このような個体I2,I4の適応度が不確実性(例えばノイズ)を有する場合には、個体I2,I4は個体I3により優越される可能性がある。
これに対して、α優越戦略によれば、個体I3から適応度関数f1の軸に近づくように傾斜した直線L1および個体I3から適応度関数f2の軸に近づくように傾斜した直線L2により個体I3が他の個体に優越する領域が定められる。すなわち、個体I3は、直線L1よりも上側でかつ直線L2より右側の領域にある個体I2,I4,I6,I7,I8に優越する。α優劣戦略によれば、個体I2,I4はパレート最適個体から排除される。
本実施の形態では、α優越戦略により複数の推定値の重み付線形和に基づいて個体の優劣比較が行われる。α優越戦略によれば、ある個体の1つの適応度が1悪くなれば、他の適応度はα悪くなる。すなわち、優劣比較において、1つの適応度の優劣が他の適応度の優劣に影響を与える。それにより、次のように、複数の適応度間の関係を考慮した合理的な解を求めることが可能となる。
弱パレート最適個体は、複数の適応度のうち少なくとも1つが他の個体に優越されない(すなわち少なくとも1つの適応度があるパレート最適解と等しい)解である。このような弱パレート最適個体は、ある適応度関数について最適解を有するが、残りの適応度関数についてはパレート最適個体に劣る。したがって、弱パレート最適個体は、合理的な解とは言えず、本来は求める必要の無い解である。そこで、α優越戦略を導入することにより、弱パレート最適個体を淘汰することができる。
また、適応度が不確実性を伴っている場合、弱パレート最適個体が不確実性によりパレート最適個体となる現象が生じる。弱パレート最適個体が不確実性によりパレート最適個体と判定されると、いつまでも淘汰されることなく個体集合中に存続することとなり、パレート最適個体の探索が停滞する原因となる。そこで、α優越戦略を導入することにより、このようなパレート最適個体と判定される弱パレート最適個体を淘汰することが可能となる。
図9はα優劣戦略による個体の優劣比較を説明するための模式図である。
図9において、個体I3は個体I2,I4,I5,I6,I7に優越しており、個体I6は個体I8に優越しており、個体I7は個体I8に優越している。個体I1,I3,I5に優越する個体はない。よって、個体I1,I3,I5パレート最適個体である。
(e−2−2)パレートランキング
次に、図5のステップS4および図6のステップS10のパレートランキングについて説明する。図10はパレートランキングを説明するための図である。パレートランキングでは、各個体のランク付けに基づいてパレート最適個体集合を求める。
i個の個体に優越されている個体xiのランクr(xi)は次式で与えられる。
r(xi)=1+pi
ここでは、ランク1を最上位ランクとし、それ以上の数値のランクは数値が大きくなるほど下位のランクとなることにする。
図10において、個体I1,I3,I5は他の個体に優越されていない。したがって、個体I1,I3,I5のランクは1である。個体I2,I4は1つの個体I3に優越されている。したがって、個体I2,I4のランクは2である。同様にして、個体I6のランクは6であり、個体I7のランクは5であり、個体I8のランクは8である。
(e−2−3)混雑度ソート
次に、図5のステップS5および図6のステップS11における混雑度ソートについて説明する。図11は混雑度ソートを説明するための模式図である。
混雑度ソートでは、同じランクの各注目個体について、それに隣接する2つの個体を結ぶ線を対角線とする長方形を想定し、長方形の縦および横の辺の長さの合計で混雑度(混雑距離)を表す。混雑度の値が小さいほど注目個体は混雑した領域に存在する。同じランクの両端の個体には最大の混雑度を与える。
図11において、個体I3の混雑度は、隣接する個体I1,I5が作る長方形s1の縦および横の辺の合計で表される。個体I1の混雑度は、隣接する個体I9,I3が作る長方形s2の縦および横の辺の合計で表される。個体I5の混雑度は、隣接する個体I3,I10が作る長方形s3の縦および横の辺の合計で表される。
図12は多目的進化型アルゴリズム部2による混雑度ソートの処理を示すフローチャートである。
まず、多目的進化型アルゴリズム部2は、個体集合を適応度関数ごとにソートし、適応度関数ごとに同一ランク内で各注目個体に隣接する2つの個体を調べる(ステップS31)。
次に、多目的進化型アルゴリズム部2は、各注目個体に隣接する2つの個体間の数学的距離を適応度関数ごとに算出し、各注目個体についての複数の適応度関数における数学的距離の合計を混雑度として算出する(ステップS32)。ここで、数学的距離としてはユークリッド距離を用いる。
その後、多目的進化型アルゴリズム部2は、各ランクの個体集合の個体を混雑度の値の大きい順にソートする(ステップS33)。
(e−3)探索履歴による推定値の算出
次に、図5のステップS3および図6のステップS9における推定値の算出について説明する。
図13は適応度推定部3の適応度推定モジュール30aによる推定値の算出を説明するための模式図である。
図1の探索履歴記憶装置31には、多目的進化型アルゴリズム部2から与えられる個体のパラメータの組および最適化対象6から出力される適応度のサンプル値の組が探索履歴HSとして順次記憶される。図13においては、個体ごとにパラメータx1,x2の組およびサンプル値F1,F2の組が探索履歴HSとして記憶されている。
適応度推定モジュール30aは、探索履歴HSに基づいて各個体に対応する真の適応度を推定値として算出する。各個体に対応するパラメータの組および推定値の組は、推定結果Eとして図1の探索履歴記憶装置31に記憶される。
図13に示すように、探索履歴記憶装置31には、個体ごとにパラメータx1,x2の組および推定値f1’,f2'の組が推定結果Eとして記憶されている。
また、適応度推定モジュール30aは、各個体のパラメータの組および推定値の組に基づいて適応度関数空間およびパラメータ空間上のパレート最適個体集合を図2の表示装置105の画面に表示することができる。
図13においては、適応度関数f1,f2からなる適応度関数空間上およびパラメータx1,x2からなるパラメータ空間上にパレート最適個体集合が表示されている。パレート最適個体集合が形成する境界をパレート境界と呼ぶ。
このように、探索履歴記憶装置31に記憶された探索履歴HSを用いて個体の適応度を推定する方法をメモリベース適応度推定法(Memory-based Fitness Estimated Method:MFEM)と呼ぶ(非特許文献5参照)。
注目個体の推定値を算出する場合、一般に注目個体と探索履歴HSの個体とは異なる探索点である。また、不確実な環境を想定するため、最適化対象6に同じパラメータの組を与えても、異なるサンプル値の組が出力される。したがって、探索履歴HSのサンプル値の組から注目個体の推定値の組を算出するためには適応度関数の性質に何らかの仮定を設ける必要がある。MFEMでは、適応度関数が注目個体からの数学的距離に応じてランダムに変動すると考えて不確実な環境をモデル化している。
注目個体をxとし、その注目個体xの真の適応度をf(x)とする。パラメータ空間において注目個体xから距離dだけ離れた個体hの適応度f(h)を考える。適応度f(h)の期待値がf(x)であり、適応度f(h)の分散が距離dに比例して増大する正規分布に従うモデルは次式(1)で表される。
f(h)〜N(f(x),kd) …(1)
上式(1)において、kは距離による重みを決定する正の定数であり、N(f(x),kd)は平均がf(x)でかつ分散がkdである正規分布の確率密度関数を表す。
ここで、真の適応度f(x)には、平均0および分散σE 2 でかつ個体の位置に無関係な正規分布に従うノイズδが加わるものとする。この場合、個体xに対応するサンプル値F(x)は次式のように定義される。
F(x)=f(x)+δ …(2)
図14は正規分布に従うノイズδを伴うサンプル値を示す模式図である。ここで、サンプル値F(x)は適応度関数f1についてのサンプル値F1(x)および適応度関数f2についてのサンプル値F2(x)の組であり、真の適応度f(x)は適応度関数f1についての真の適応度f1(x)および適応度関数f2についての真の適応度f2(x)の組である。また、ノイズδは適応度関数f1についてのノイズδ1および適応度関数f2についてのノイズδ2の組である。ノイズδi(i=1,2)は次式で表される。
δi〜N(0,σEi 2 ) (i=1,2)
上式において、N(0,σEi 2 )は平均0および分散σE 2である正規分布の確率密度関数を表す。
適応度推定部3は、サンプル値F(x)の期待値を最小にするパレート最適個体集合を求める。このとき、個体hに対応するサンプル値F(h)は、次式(3.1)および(3.2)としてモデル化される。
F(h)〜N(f(x),kd+σE 2 ) …(3.1)
d=|h−x|・・・(3.2)
上式(3.1)において、N(f(x),kd+σE 2 )は平均がf(x)でありかつ分散がkd+σE 2 である正規分布の確率密度関数を表す。
図15は不確実な適応度関数のモデルを示す模式図である。このモデルでは、注目個体xから遠く離れるほどサンプル値F(h)が大きく不規則に変化するものと仮定している。
このモデルに基づいて探索履歴HSを用いた最尤法により真の適応度f(x)の推定値を算出する。
探索履歴HSに記憶された個体hl(l=1,…,H)、個体hlのサンプル値F(hl )および注目個体xから個体hlまでの距離dl(l=1,…,H)を考えると、サンプル値F(hl),…,F(hH)が得られる確率は次式により表わすことができる。
Figure 0005019744
ここで、p(F(hl),dl)は、サンプル値F(hl)が得られる確率を表す確率密度関数であり、次式で表すことができる。
Figure 0005019744
ここで、k’=k/σE 2 である。本実施の形態においては、定数k’は事前実験にて求めるものとする。非特許文献4には、探索中に定数k’を推定する方法が提案されている。提案された方法により定数k’を求めてもよい。
上記式(4)および(5)を真の適応度f(x)の尤度と考え、最尤法を用いる。それにより、真の適応度f(x)の推定値f’(x)は、次式(6)に示すように、距離dl を含む関数により重み付けされた加重平均の式で表すことができる。
Figure 0005019744
図16は適応度推定部3の適応度推定モジュール30aによる推定値の算出処理を示すフローチャートである。
まず、適応度推定モジュール30aは、多目的進化型アルゴリズム部2において親個体集合Pが初期化されたことを確認する(ステップS41)。次に、適応度推定モジュール30aは、探索履歴記憶装置31の探索履歴HSをすべてクリアする(ステップS42)。
その後、適応度推定モジュール30aは、最適化対象6から出力されるサンプル値の組を探索履歴記憶装置31に探索履歴HSとして記憶する(ステップS43)。次いで、適応度推定モジュール30aは、探索履歴記憶装置31の探索履歴HSに基づいて上記式(6)より各個体に対応する真の適応度の推定値の組を算出する(ステップS44)。
適応度推定モジュール30aは、多目的進化型アルゴリズム部2の処理が終了したか否かを判定する(ステップS45)。
多目的進化型アルゴリズム部2の処理が終了していない場合には、ステップS43に戻ってステップS43〜S45の処理を繰り返す。多目的進化型アルゴリズム部2の処理が終了した場合には、推定値の算出処理を終了する。
(e−4)親個体の選択から世代交代までの方法
次に、図6のステップS6aの特定の親個体の選択からステップS11の世代交代までの方法を説明する。図17は特定の親個体の選択から世代交代までの方法を説明するための模式図である。
図17(a)に示すように、パレートランキングにより親個体集合Pがランク付けされる。図17(b)に示すように、親個体集合Pのランク1の個体集合について、適応度関数空間における隣接する各2つの個体間のユークリッド距離を分布指標として算出する。本実施の形態では、適応度関数空間は、2つの適応度関数f1およびf2からなる。
ユークリッド距離が最大となる2つの個体Ia,Ibのうちいずれか1つの個体を第1の親個体Iaとして確率1/2でランダムに選択する。さらに、第2の親個体Icおよび第3の親個体Idを親個体集合Pからランダム選択で選択する。
本実施の形態においては、分布指標のユークリッド距離Lは、図17(f)に示すように、隣接する2つの個体をxおよびyとすると、次式により求められる。
L=[{f1(x)−f1(y)}2 +{f2(x)−f2(y)}2 1/2 …(7)
次いで、図17(c)に示すように、第1、第2および第3の親個体Ia,Ic,Idから複数の子個体候補を生成し、後述する方法で複数の子個体候補から所定数の個体を含む子個体集合Cを生成する。さらに、図17(d)に示すように、子個体集合Cおよび親個体集合Pから個体集合Fを生成し、個体集合Fに上記のα優越戦略を用いたパレートランキングを行う。このとき、子個体集合Cにおいて親個体集合Pに含まれる個体に重複する個体がある場合には、その個体に最下位ランクを付与する。
その後、図17(e)に示すように、個体集合Fに混雑度ソートを行い、個体のランクおよび各ランク内の混雑度に基づいて所定数の個体を選択し、残りの個体を削除する。それにより、新たな親個体集合Pを生成する。このようにして、世代交代が行われる。
図18は子個体候補の生成処理を説明するための模式図である。図18(a)はパラメータ空間上の親個体集合Pを示し、図18(b)はパラメータ空間上の子個体候補集合を示す。子個体候補集合の個体I21のパラメータx1,x2が親個体集合Pの個体I11のパラメータx1,x2と一致する場合には、個体I21には最下位ランクが付与される。同様に、子個体候補集合の個体I22のパラメータx1,x2が親個体集合Pの個体I12のパラメータx1,x2と一致する場合には、個体I22には最下位ランクが付与される。
なお、特定の親個体の選択方法は、本実施の形態に限定されず、ランク1の個体集合からユークリッド距離Lが最大となる2つの個体を第1および第2の親個体として選択し、第3の親個体を親個体集合Pからランダム選択、ルーレット選択またはトーナメント選択等の方法により選択してもよい。
図19は多目的進化型アルゴリズム部2による特定の親個体の選択処理を示すフローチャートである。
まず、多目的進化型アルゴリズム部2は、親個体集合Pから選択されたランク1の個体集合を適応度関数ごとにソートする(ステップS51)。
次に、多目的進化型アルゴリズム部2は、ランク1の個体集合において隣接する2つの個体間のユークリッド距離を算出する(ステップS52)。
さらに、多目的進化型アルゴリズム部2は、最大のユークリッド距離を与える2つの個体のうち1つの個体を第1の親個体として確率1/2でランダムに選択し、第2の親個体および第3の親個体を親個体集合Pからランダム選択で選択する(ステップS53)。
本実施の形態では、第1、第2および第3の親個体から交叉操作により子個体候補が生成される。交叉操作としては、例えば、UNDX(単峰性正規分布交叉:Unimodal Normal Distribution Crossover)が用いられる。
図20はUNDXによる子個体候補の生成処理を示す模式図である。UNDXでは、第1の親個体P1、第2の親個体P2および第3の親個体P3の位置関係に基づいて定められる正規分布乱数に従って子個体候補C1を生成する。この場合、第1の親個体P1と第2の親個体P2とを結ぶ軸AXの周辺の正規分布に従って子個体候補C1が生成されるので、子個体候補C1が第1〜第3の親個体P1〜P3から遠くに離れた位置に生成されることがない。
(e−5)子個体集合Cの生成方法
図21は多目的進化型アルゴリズム部2および適応度推定モジュール30bによる子個体集合Cの生成処理を示すフローチャートである。
まず、多目的進化型アルゴリズム部2は、上記の方法で第1、第2および第3の親個体から複数の子個体候補を生成する(ステップS61)。
次に、適応度推定モジュール30bは、全ての親個体および子個体候補についての真の適応度の推定値を算出する(ステップS62)。
子個体候補についての真の適応度f(x)の推定値f’(x)は、次式(6a)に示すように、距離dlを含む関数により重み付けされた加重平均の式で表すことができる。
Figure 0005019744
ただし、この段階では、子個体候補に対応するサンプル値は得られていないため、子個体候補についての推定値f’(x)の算出式は、上記式(6)とは異なり、その子個体候補のサンプル値F(x)を含まない。
なお、推定値の算出方法としては、上式(6a)以外に、多項式回帰、ニューラルネットワーク、放射基底関数(Radial Basis Function)、クリギング、ガウシアンプロセス、局所重み付き回帰(Locally Weighted Regression)等の他の手法を用いることもできる。
さらに、多目的進化型アルゴリズム部2は、全ての親個体および子個体候補のランキングを行う(ステップS63)。このランキングには、図8のα優越戦略、図9の優劣比較および図10のパレートランキングを用いる。
次に、多目的進化型アルゴリズム部2は、最上位ランクの1つの子個体候補を親個体集合Pに追加して混雑度を算出する(ステップS64)。混雑度の算出方法については、後述する。
次に、多目的進化型アルゴリズム部2は、最上位ランクの全ての子個体の混雑度の算出が終了したか否かを判別する(ステップS65)。最上位ランクの全ての子個体候補の混雑度の算出が終了していない場合には、ステップS64に戻る。
最上位ランクの全ての子個体候補の混雑度の算出が終了した場合には、それらの子個体候補を混雑度の良い順にソートし(ステップS66)、より良い混雑度を有する所定数の子個体候補を子個体集合Cとして選択する(ステップS67)。
図22は子個体集合Cの生成処理を示す模式図であり、(a)は適応度関数空間における親個体および子個体候補を示し、(b)は適応度空間における混雑度の算出方法を示す。
子個体候補の混雑度の算出方法は、図11に示した注目個体の混雑度の算出方法と同様である。
図22(a)の適応度関数空間には、親個体Pa〜Pdおよび生成された子個体候補C11〜C20が示されている。図22(b)には、親個体Pa〜Pdおよび最上位ランクの1つの子個体候補C12が示されている。
図22(a)に示すように、適応度関数空間において親個体から多数の子個体候補が生成される。
混雑度の算出では、1つの子個体候補について、それに隣接する2つの親個体を結ぶ線を対角線とする長方形を想定し、長方形の縦および横の辺の長さの合計で混雑度(混雑距離)を表す。混雑度の値が小さいほど子個体候補は混雑した領域に存在する。同じランクの両端の子個体候補には最大の混雑度を与える。
図22(b)において、子個体候補C12の混雑度は、隣接する親個体Pb,Pcが作る長方形の縦および横の辺の合計で表される。
(f)第1の実施の形態の効果
本実施の形態に係る多目的最適化装置1においては、多数の子個体候補が生成され、最上位ランクの複数の子個体候補から混雑度が高い順に所定数の子個体候補が子個体として選択され、選択された子個体が実際に評価される。それにより、不要な子個体候補を評価する時間が省略される。その結果、最適化の速度が向上する。したがって、適切なパレート最適個体を短時間で効率良く得ることが可能となる。
また、上式(6)により探索履歴記憶装置31に記憶された各個体に対応するサンプル値の組に重み付けが行われ、重み付けられた複数組のサンプル値の線形和を用いて注目個体に対応する適応度の推定値の組が求められる。
各個体の重みは、パラメータ空間上で注目個体とその個体との距離を含む関数であるので、真の適応度からの誤差が十分に小さい推定値を得ることができる。したがって、最適化対象から出力されるサンプル値が不確実性を有する場合でも、適切なパレート最適個体集合を得ることができる。
また、α優越戦略により複数の適応度関数の各々について個体集合の複数の個体に対応する推定値の優劣が比較され、複数の適応度関数の各々についての比較結果に重み付けが行われる。そして、複数の適応度関数について重み付けられた複数の比較結果の線形和に基づいて個体集合の複数の個体のランク付けが行われる。それにより、最適化対象が不確実性を有する場合でも、複数の適応度間の関係を考慮した合理的なパレート最適個体を求めることが可能となる。
さらに、適応度関数空間上での最上位ランクの個体の分布において、隣接する個体間の距離を分布指標として用いることにより、疎らな領域に新たな子個体を容易に生成することができる。それにより、最上位ランクの個体を適応度関数空間上の広い領域に偏りなく分布するように生成することが可能となる。したがって、多様性を有するパレート最適個体を容易に得ることができる。
さらに、生成された新たな子個体が親個体集合の個体と重複する場合に、新たな子個体に最下位ランクが付与される。それにより、パレート最適個体の探索初期には、緩やかに悪い個体を減少させることができ、パレート最適個体の探索後期には、パレート最適個体の多様性を維持することができる。
また、適応度推定部3により算出された推定値の組に基づいてパレート最適個体が表示装置105の画面上に表示される。それにより、使用者は、パレート最適個体を視覚的に認識することができるので、種々の意思決定を容易に行うことができる。
(2)第2の実施の形態
次に、本発明の第2の実施の形態に係るに多目的最適化装置について説明する。本実施の形態に係る多目的最適化装置は、図1および図2に示した構成を有する。また、本実施の形態に係る多目的最適化装置の全体処理は、図5および図6に示した処理と同様である。
本実施の形態が第1の実施の形態と異なるのは、図5のステップS3および図6のステップS9における推定値の算出方法および図6のステップS6aにおける特定の親個体の選択方法である。
(a)推定値の算出
本実施の形態では、真の適応度f(x)の推定値f’(x)は、改良された推定式により算出される。
Figure 0005019744
上式(9)に示すように、推定値f’(x)はパラメータ空間上の距離dlの3乗を含む関数により重み付けされた加重平均の式で表される。
上式(9)によれば、注目個体から探索履歴HS内の個体までの距離が短いほど重みが大きくなる。一方、注目個体から探索履歴HS内の個体までの距離が長くなると、極端に重みが小さくなる。したがって、注目個体から離れた個体は推定値f’(x)の算出にほとんど寄与しない。
図23は探索履歴記憶装置31に記憶された探索履歴に基づく個体の探索を示す模式図である。図23(a)は単目的最適化における探索初期の個体集合を示し、図23(b)は多目的最適化における探索初期の個体集合を示し、図23(c)は単目的最適化における探索後期の個体集合を示し、図23(d)は多目的最適化における探索後期の個体集合を示す。
図23(a),(c)の縦軸は適応度関数fを示し、横軸はパラメータxを示す。図23(b),(d)の縦軸は適応度関数f2を示し、横軸は適応度関数f1を示す。
探索初期には、図23(a),(b)に示すように複数の個体が分散している。探索後期には、単目的最適化では、図23(c)に示すように個体があるパラメータの値の近傍に集中し、多目的最適化では、図23(d)に示すように複数の個体がパレート最適個体集合を形成する。
このように、多目的最適化では、個体が適応度関数空間の広い範囲に分散するので、式(9)を用いることにより、注目個体から遠く離れた個体の寄与が小さくなるので、推定値の精度が高くなる。
(b)特定の親個体の選択から世代交代までの方法
図24は親個体の選択から世代交代までの方法を説明するための模式図である。本実施の形態では、3つの適応度関数f1,f2,f3の例が示される。
図24(a)に示すように、パレートランキングにより親個体集合Pがランク付けされている。図24(b)に示すように、親個体集合Pのランク1の個体集合について、適応度関数空間における隣接する各3つの個体が形成する三角形の面積を分布指標として算出する。
三角形の形成には、ドローネ三角形分割(Delaunay Triangulation)の方法を用いる(非特許文献6参照)。
ここで、ドローネ三角形分割について簡単に説明する。ドローネ三角形分割は、計算幾何学(Computational Geometry)の中で重要な概念であるボロノイ図(Voronoi Diagram)の双対図形である。平面(空間)上の点集合の三角形分割の中で、種々の意味で最適な三角形分割として知られており、コンピュータグラフィクスにおけるメッシュ生成または有限要素法等にも用いられる。ドローネ三角形分割は、分割された三角形の最小角を最大にする分割方法であり、アルゴリズムとして逐次添加法、分割統治法または幾何変換を用いる方法等がある。なお、ドローネ三角形分割の詳細については、例えば非特許文献7に記載されている。
最大の三角形の面積を与える3つの個体IA,IB,ICのうちいずれか1つの個体を第1の親個体IAとして確率1/3でランダムに選択する。さらに、第2の親個体IDおよび第3の親個体IEを親個体集合Pからランダム選択で選択する。
次いで、図24(c)に示すように、第1、第2および第3の親個体IA,ID,IEから複数の子個体候補を生成し、上記の方法で複数の子個体候補から所定数の個体を含む子個体集合Cを生成する。さらに、図24(d)に示すように、子個体集合Cおよび親個体集合Pから個体集合Fを生成し、個体集合Fに上記のα優越戦略を用いたパレートランキングを行う。このとき、子個体集合Cにおいて親個体集合Pに含まれる個体に重複する個体がある場合には、その個体に最下位ランクを付与する。
その後、図24(e)に示すように、個体集合Fに混雑度ソートを行い、個体のランクおよび各ランク内の順位に基づいて所定数の個体を選択し、残りの個体を削除する。それにより、新たな親個体集合Pを生成する。このようにして、世代交代が行われる。
なお、特定の親個体の選択方法は、本実施の形態に限定されず、最大の三角形の面積を与える3つの個体を第1、第2および第3の親個体として選択してもよく、あるいは最大の三角形の面積を与える3つの個体のうち2つを第1および第2の親個体として選択し、第3の親個体を親個体集合Pからランダム選択、ルーレット選択またはトーナメント選択等の方法により選択してもよい。
また、パラメータが3つ以上の場合には、多親拡張された交叉方法、例えばUNDX−m等を用いてもよい。
図25は多目的進化型アルゴリズム部2による特定の親個体の選択処理を示すフローチャートである。
まず、多目的進化型アルゴリズム部2は、親個体集合Pから選択されたランク1の個体集合をfi−fj平面に正射影する(ステップS61)。ここで、fiおよびfjは適応度関数である。i,j=1,2,3であり、かつi≠jであり、それらの組み合わせは世代ごとに変化させる。
次に、多目的進化型アルゴリズム部2は、正射影した個体集合のドローネ三角形分割を行う(ステップS62)。
さらに、多目的進化型アルゴリズム部2は、ドローネ三角形分割されたランク1の個体集合に適応度関数fkの成分を高さ成分として与え、複数の三角形を3次元空間上に展開する(ステップS63)。ここで、k≠i,jである。
次いで、多目的進化型アルゴリズム部2は、3次元空間上に展開された複数の三角形の面積をそれぞれ算出する(ステップS64)。
面積最大の三角形を形成する3つの個体のうち1つの個体を第1の親個体として確率1/3でランダムに選択し、親個体集合Pから2つの個体を第2の親個体および第3の親個体としてランダム選択で選択する(ステップS65)。
(c)子個体集合Cの生成方法
本実施の形態における子個体集合Cの生成処理は、図20に示した処理と同様である。
ただし、子個体候補についての真の適応度f(x)の推定値f’(x)は、改良された推定式により算出される。
Figure 0005019744
上式(9a)に示すように、推定値f’(x)はパラメータ空間上の距離dlの3乗を含む関数により重み付けされた加重平均の式で表される。
ただし、この段階では、子個体候補に対応するサンプル値は得られていないため、子個体候補についての推定値f’(x)の算出式は、上記式(9)とは異なり、その子個体候補のサンプル値F(x)を含まない。
(d)第2の実施の形態の効果
本実施の形態に係る多目的最適化装置1においては、多数の子個体候補が生成され、最上位ランクの複数の子個体候補から混雑度が高い順に所定数の子個体候補が子個体として選択され、選択された子個体が実際に評価される。それにより、不要な子個体候補を評価する時間が省略される。その結果、最適化の速度が向上する。したがって、適切なパレート最適個体を短時間で効率良く得ることが可能となる。
また、上式(9)により探索履歴記憶装置31に記憶された各個体に対応するサンプル値の組に重み付けが行われ、重み付けられた複数組のサンプル値の線形和を用いて注目個体に対応する適応度の推定値の組が求められる。
各個体の重みは、パラメータ空間上で注目個体とその個体との距離の3乗を含む関数であるので、パラメータ空間上で注目個体から遠く離れた他の個体の影響が十分に小さくなる。それにより、真の適応度からの誤差が十分に小さい推定値を得ることができる。したがって、最適化対象から出力されるサンプル値が不確実性を有する場合でも、適切なパレート最適個体集合を得ることができる。
また、適応度関数空間上での最上位ランクの個体の分布において、隣接する3つの個体を頂点とする三角形の面積を分布指標として用いることにより、疎らな領域に新たな子個体を容易に生成することができる。それにより、最上位ランクの個体を適応度関数空間上の広い領域に偏りなく分布するように生成することが可能となる。したがって、多様性を有するパレート最適個体を容易に得ることができる。
(3)他の実施の形態
(a)拡張された推定式
上記の推定式(4)および(9)を一般化すると、次式のようになる。
Figure 0005019744
上式(10)において、nは任意の自然数である。第1の実施の形態の推定式(4)はn=1の場合を示し、第2の実施の形態の推定式(9)はn=3の場合を示す。n=3が好ましいが、nが他の自然数であってもよい。
このように、注目個体の真の適応度の推定値は、ノイズ成分を有する適応度のサンプル値を用いずに、探索履歴HSにおける他の個体の推定値の重み付け線形和により算出される。それにより、サンプル値が不確実性を有する場合でも、パレート最適個体を安定に探索することができる。
また、パラメータ空間上で注目個体と他の個体との距離のn乗の関数を含む重みが用いられるので、推定値の算出が広範囲に広がる他の個体の影響を大きく受けることが防止される。したがって、推定値を高精度に算出することができる。
(b)親個体の選択
第1の実施の形態で示されるように、2目的最適化問題では、特定の親個体の選択のための分布指標として個体間の距離が用いられる。また、第2の実施の形態で示されるように、3目的最適化問題では、特定の親個体の選択のための分布指標として3つの個体が形成する三角形の面積が用いられる。
特定の親個体の選択のための分布指標をm目的最適化問題に拡張した場合、分布指標は、適応度関数空間上で隣接するm個の個体が形成する単体(simplex)の大きさである。mは2以上の自然数である。上記の単体は、ドローネ三角形分割により形成することができる。
図26はm目的最適化問題に拡張された分布指標を示す図である。図26に示すように、2目的の場合には、分布指標は隣接する2つの個体間を結ぶ直線の長さであり、3目的の場合には、分布指標は隣接する3つの個体を頂点とする三角形の面積であり、4目的の場合には、分布指標は隣接する4つの個体を頂点とする三角錐の体積である。分布指標は4次元単体の大きさであり、底体積×高さ÷4により算出される。5目的の場合には、分布指標は5次元単体の大きさであり、底4次元面積×高さ÷5により算出される。(m+1)目的の場合には、分布指標はm次元単体の大きさであり、底(m−1)次元面積×高さ÷mにより算出される。
このように、分布指標に基づいて特定の親個体を選択することにより、適応度関数空間上で分布が疎らな領域で積極的な個体の探索が行われる。それにより、広い領域で個体の探索が行われるので、推定値を高精度に算出することができるとともに、適応度関数空間上の広い領域で均等にパレート最適個体を見出すことができる。
(c)子個体集合の生成時の拡張された推定式
上記の推定式(4a)および(9a)を一般化すると、次式のようになる。
Figure 0005019744
上式(10a)において、nは任意の自然数である。第1の実施の形態の推定式(4a)はn=1の場合を示し、第2の実施の形態の推定式(9a)はn=3の場合を示す。n=3が好ましいが、nが他の自然数であってもよい。
なお、上式(10a)の近似モデルとして、多項式回帰、ニューラルネットワーク、放射基底関数(Radial Basis Function)、クリギング、ガウシアンプロセス、局所重み付き回帰(Locally Weighted Regression)等の他の手法を用いることもできる。
(d)エンジンシミュレータへの適応例
図27は多目的最適化装置をエンジンシミュレータに適用した例を示すブロック図である。
図27の最適化対象6aはエンジンシミュレータである。エンジンシミュレータは、例えばパーソナルコンピュータからなる。この最適化対象6aは、多目的最適化装置1から与えられるパラメータの組に基づいてエンジンの動作のシミュレーションを行い、シミュレーション結果を適応度のサンプル値の組として多目的最適化装置1に出力する。
本実施の形態では、複数の適応度関数としては、燃費、トルク、エンジンの排気ガスに含まれるCO(一酸化炭素)、HC(炭化水素)、NOx (窒素酸化物)等の成分の濃度等のうち複数が設定される。
また、パラメータとしては、燃料噴射量、燃料噴射時期、点火時期、スロットル開度等が挙げられる。
図27の多目的最適化装置1によれば、適応度関数の組およびパラメータの組を設定することにより、パレート最適個体集合を短時間で効率良く求めることができる。
(e)モータ評価装置への適応例
図28は多目的最適化装置をモータ評価装置に適用した例を示すブロック図である。
図28の最適化対象6bはモータ評価装置である。モータ評価装置は、モータ、制御回路および各種検出回路により構成される。この最適化対象6bは、多目的最適化装置1から与えられる個体のパラメータの組に基づいてモータを制御するとともにモータの複数の性能項目を測定し、測定結果を適応度のサンプル値の組として多目的最適化装置1に出力する。
複数の適応度関数としては、立ち上がり時間、整定時間、オーバーシュート量、消費電流等のうち複数が設定される。
また、パラメータとしては、PID(比例積分微分:Proportional Integral Derivative)ゲイン、駆動電流等が挙げられる。
ここで、トレードオフの関係としては、立ち上がり時間とオーバーシュート量、立ち上がり時間と消費電流、整定時間とオーバーシュート量等が挙げられる。
図28の多目的最適化装置1によれば、適応度関数の組およびパラメータの組を設定することにより、パレート最適個体集合を短時間で効率良く求めることができる。
また、パレート最適個体集合をリアルタイムに算出することにより実環境に即したモータのリアルタイム制御を行うことも可能である。
(f)モータシミュレータへの適応例
図29は多目的最適化装置をモータシミュレータに適用した例を示すブロック図である。
図29の最適化対象6cはモータシミュレータである。モータシミュレータは、例えばパーソナルコンピュータからなる。この最適化対象6cは、多目的最適化装置1から与えられるパラメータの組に基づいてモータの動作のシミュレーションを行い、シミュレーション結果を適応度のサンプル値の組として多目的最適化装置1に出力する。
複数の適応度関数としては、立ち上がり時間、整定時間、オーバーシュート量、消費電流等のうち複数が設定される。また、パラメータとしては、PIDゲイン、駆動電流等が挙げられる。
図29の多目的最適化装置1によれば、適応度関数の組およびパラメータの組を設定することにより、パレート最適個体集合を短時間で効率良く求めることができる。
(g)多目的進化型アルゴリズムの他の例
上記実施の形態では、多目的進化型アルゴリズムとして遺伝的アルゴリズム(GA)を用いているが、これに限定されず、遺伝的アルゴリズムの代わりに、進化戦略(ES:Evolution Strategy)等の同様のアイデアに基づく計算法を用いてもよい。
なお、GA、ES等の計算法は、進化アルゴリズム(EAs:Evolutionary Algorithms)または進化計算(Evolutionary Computation)と総称される。
(h)4以上の目的への適用
上記実施の形態では、2目的および3目的の最適化を例に挙げて説明したが、本発明は、4以上の目的の最適化にも同様に適用することができる。この場合、トレードオフの関係を有する4以上の適応度関数が設定される。
(i)世代交代方法
上記の図6のステップS10において、子個体集合Cのうち親個体集合Pの個体と重複しない個体を親個体集合Pの下位の個体と入れ換えることにより新たな親個体集合Pを生成してもよい。
この場合、パレート最適個体の探索初期には、緩やかに悪い個体を減少させることができるとともに、パレート最適個体の探索後期には、パレート最適個体の多様性を維持することができる。
(j)親個体の再評価
上記実施の形態においては、親個体の再評価を行っているが、実システムまたは大規模シミュレーションにおいて個体の評価回数に制限がある場合には、子個体のみ再評価してもよい。それにより、評価回数を低減することが可能になる。
(k)サンプル値の取得の制限
探索履歴記憶装置31に記憶されるサンプル値の量が所定の記憶容量に達した時点で探索履歴記憶装置31へのサンプル値の取得を終了してもよい。それにより、以後は探索履歴記憶装置31に記憶された探索履歴HSに基づいて推定値を算出し、算出された推定値に基づいてパレート最適個体の探索を進めることが可能になる。
(l)ランク付け
上記実施の形態では、パレートランキングにより複数の個体のランク付けが行われているが、これに限定されず、非優越ソート等の他の方法を用いて複数の個体がランク付けされてもよい。
(m)最適化対象の不確実性を考慮しない多目的最適化装置への適用
上記実施の形態では、最適化対象6が観測ノイズ等の不確実性を有する場合でも多様性を有するパレート最適個体を短時間で得ることができる多目的最適化装置1について説明したが、本発明は、最適化対象の観測ノイズ等の不確実性を考慮しない多目的最適化装置にも適用することができる。この場合にも、不要な子個体候補を評価する時間が省略される。その結果、最適化の速度が向上する。
(n)各部の実現方法
上記実施の形態では、多目的進化型アルゴリズム部2、適応度推定モジュール30a,30bおよび探索履歴記憶部31がCPU101およびプログラムにより実現されるが、多目的進化型アルゴリズム部2、適応度推定モジュール30および探索履歴記憶部31の一部または全てが電子回路等のハードウエアにより実現されてもよい。
(4)実施例および比較例
以下の実施例では、第1および第2の実施の形態に係る多目的最適化装置によりベンチマーク問題を実行した。また、比較例では、子個体集合Cの生成方法を除いて第1および第2の実施の形態に係る多目的最適化装置と同様の多目的最適化装置によりベンチマーク問題を実行した。
図30は実施例および比較例の多目的最適化の条件を示す図である。図31は実施例および比較例において実行するベンチマーク問題を示す。
図31に示すように、評価回数を1500として実施例と比較例とを比較した。なお、参考のため、比較例では、3000回まで評価を行った。実施例および比較例において、個体集合サイズは100である。実施例では、第2の実施の形態の子個体集合の生成方法により100個の子個体候補から3個の子個体を選択し、3個の子個体および2個の親個体を評価した。一方、比較例では、特定の親個体から8個の子個体を生成し、8個の子個体および2個の親個体を評価した。これは、実施例の評価回数が比較例の評価回数の半分であっても良好な結果が得られることを確認するためである。
また、実施例および比較例では、交叉オペレータとしてUNDXを用い、選択オペレータとして第1および第2の実施の形態の選択方法(図17および図24に示した特定の親個体の選択方法)を用いた。さらに、図17および図24に示した世代交代方法を用いた。さらに、最上位ランクの決定方法としては、パレートランキングを用いた。
ここで、評価回数とは、(世代数×子個体の数+初期個体集合の個体の数)で求められる。
実施例および比較例では、ベンチマーク問題として図31に示すテスト関数ZDT1、ZDT2およびDTLZ2を用いた(非特許文献8参照)。
テスト関数ZDT1は、パレート最適解集合が凸型のパレート境界を有する2目的最適化問題である。テスト関数ZDT2は、パレート最適解集合が凹型のパレート境界を有する2目的最適化問題である。ここで、テスト関数ZDT1およびテスト関数ZDT2を2変数2目的関数の最小化問題とした。なお、このテスト関数ZDT1およびテスト関数ZDT2は弱パレート最適解を持つ。また、それぞれの目的関数には適当なノイズを加える。
テスト関数DTLZ2は、パレート最適解集合が凹型のパレート境界を有する3目的最適化問題である。ここで、テスト関数DTLZ2を3変数3目的関数の最小化問題とした。また、それぞれの目的関数には適当なノイズを加える。
テスト関数ZDT1およびテスト関数ZDT2の定数k'(i=1,2 )は予備実験にて決定し、k'=310000とした。テスト関数DTLZ2の定数k'(i=1,2,3)は予備実験にて決定し、k'=31000とした。また、α優越戦略におけるαij(i=1,…n;j=1,…,n;i≠j)は0.1とした。ここで、nは目的の数である。
ここで、実施例および比較例において、平均絶対誤差Aerrorおよび平均推定誤差Eerrorを算出した。
次式はテスト関数ZDT1およびテスト関数ZDT2における平均絶対誤差Aerrorの算出式である。
Figure 0005019744
次式はテスト関数DTLZ2における平均絶対誤差Aerrorの算出式である。
Figure 0005019744
上式(11),(12)において、|P|は親個体集合Pの数を示し、mはパラメータ(決定変数)の数を示し、xijはパラメータを示す。また、実施例および比較例において、平均推定誤差Eerrorを次式により算出した。
Figure 0005019744
上式(13)において、|P|は親個体集合Pの数を示し、nは適応度関数(目的関数)の数を示し、f(x)は真の適応度の値を示し、f’(x)は真の適応度の推定値を示す。
実施例および比較例では、平均絶対誤差Aerrorおよび平均推定誤差Eerrorを30回の試行で評価した。
図32(a)はテスト関数ZDT1およびテスト関数ZDT2における平均絶対誤差Aerrorの概念を示す模式図、図32(b)はテスト関数DTLZ2における平均絶対誤差Aerrorの概念を示す模式図である。
図32(a)において、ノイズ成分がない場合には、個体i101,i102,i103はパラメータ空間のx=0の直線上に存在する。最適化により得られた個体I101,I102,I103とノイズ成分がない場合の個体i101,i102,i103との距離の平均値を算出することによりテスト関数ZDT1およびテスト関数ZDT2における平均絶対誤差Aerrorが得られる。
図32(b)において、ノイズ成分がない場合には、個体i111,i112,i113はパラメータ空間のx=0.5の平面上に存在する。最適化により得られた個体I111,I112,I113とノイズ成分がない場合の個体i111,i112,i113との距離の平均値を算出することによりテスト関数DTLZ2における平均絶対誤差Aerrorが得られる。
図33は2目的の場合における平均絶対誤差Aerrorの概念を示す模式図である。
図33において、適応度関数空間に真の適応度f(xa),f(xb),f(xc)および真の適応度の推定値f’(xa),f’(xb),f’(xc)が示されている。
真の適応度f(xa)と推定値f’(xa)との間における適応度関数fについての距離と適応度関数fについての距離との合計、真の適応度f(xb)と推定値f’(xb)との間における適応度関数fについての距離と適応度関数fについての距離との合計、および真の適応度f(xc)と推定値f’(xc)との間における適応度関数fについての距離と適応度関数fについての距離との合計を算出し、それらの合計の平均を算出することにより平均絶対誤差Aerrorが得られる。
図34は実施例および比較例における平均絶対誤差および平均推定誤差の算出結果を示す図である。
図34には、平均絶対誤差および平均推定誤差に加えて、参考のために絶対誤差の標準偏差および推定誤差の標準偏差が示されている。また、参考のために、比較例については評価回数が3000回の場合の平均絶対誤差および平均推定誤差の算出結果も示されている。
図34に示すように、テスト関数ZDT1、テスト関数ZDT2およびテスト関数DTLZ2における実施例の平均絶対誤差は、比較例に比べて小さくなり、比較例の評価回数を3000回とした場合に比べても小さくなった。
また、テスト関数ZDT1およびテスト関数ZDT2における実施例の平均推定誤差は、比較例に比べて小さくなり、比較例の評価回数を3000回とした場合に比べても小さくなった。
これは、実施例では、パレート最適個体の分布が広がりにくいことにより、パレート最適個体のある領域で探索が進みやすいからであると考えられる。なお、テスト関数DTLZ2における実施例の平均推定誤差のみが比較例に比べて大きくなった。テスト関数DTLZ2の平均推定誤差が悪いのは、探索履歴中の個体が偏って存在していることが原因だと思われる。
図35は実施例および比較例における平均絶対誤差と評価回数との関係を示す図である。図35の関係はテスト関数ZDT1を用いた場合の算出結果を示す。
図35に示すように、実施例では、比較例の2〜3倍の速度で平均絶対誤差が減少することがわかる。
図36は実施例および比較例における平均推定誤差と評価回数との関係を示す図である。図36の関係はテスト関数ZDT1を用いた場合の算出結果を示す。
図36に示すように、実施例では、比較例に比べて評価の初期段階から高い推定精度が得られることがわかる。
実施例および比較例から上記第1および第2の実施の形態に係る多目的最適化装置によれば、評価回数を低減することができることがわかった。
(5)請求項の構成要素と実施の形態の各部との対応
以下、請求項の各構成要素と実施の形態の各部との対応の例について説明するが、本発明は下記の例に限定されない。
上記実施の形態では、探索履歴記憶装置31が記憶部に相当し、適応度推定モジュール30aが第1の推定部に相当し、適応度推定モジュール30bが第2の推定部に相当し、多目的進化型アルゴリズム部2が演算部に相当する。
また、親個体が保存用個体に相当し、子個体候補が評価用個体候補に相当し、子個体が評価用個体に相当する。
なお、第1の推定部を用いずに、実システムがシミュレーションから得た適応度を直接用いてもよい。
本発明は、実システムまたは不確実性を有するシミュレーション等の最適化対象のパラメータ、不確実性を有しないシミュレーション等の最適化対象等の種々の最適化対象を最適化するため等に利用することができる。
本発明の第1の実施の形態に係る多目的最適化装置の機能的な構成を示すブロック図である。 図1の多目的最適化装置のハードウエア構成を示すブロック図である。 最適化対象の構成の一例を示すブロック図である。 HC濃度、NOx濃度およびCO濃度と空燃比との関係を示す図である。 図1の多目的最適化装置の全体処理を示すフローチャートである。 図1の多目的最適化装置の全体処理を示すフローチャートである。 多目的最適化装置の各処理の具体例を示す模式図である。 多目的最適化装置の各処理の具体例を示す模式図である。 多目的最適化装置の各処理の具体例を示す模式図である。 多目的最適化装置の各処理の具体例を示す模式図である。 多目的最適化装置の各処理の具体例を示す模式図である。 多目的最適化装置の各処理の具体例を示す模式図である。 適応度推定部の適応度推定モジュールによる推定値の算出を説明するための模式図である。 正規分布に従うノイズを伴うサンプル値を示す模式図である。 不確実な適応度関数のモデルを示す模式図である。 適応度推定部の適応度推定モジュールによる推定値の算出処理を示すフローチャートである。 特定の親個体の選択から世代交代までの方法を説明するための模式図である。 子個体候補の生成処理を説明するための模式図である。 多目的進化型アルゴリズム部による特定の親個体の選択処理を示すフローチャートである。 UNDXによる子個体候補の生成処理を示す模式図である。 多目的進化型アルゴリズム部および適応度推定モジュールによる子個体集合の生成処理を示すフローチャートである。 子個体集合の生成処理を示す模式図である。 探索履歴記憶装置に記憶された探索履歴に基づく個体の探索を示す模式図である。 親個体の選択から世代交代までの方法を説明するための模式図である。 多目的進化型アルゴリズム部による特定の親個体の選択処理を示すフローチャートである。 m目的最適化問題に拡張された分布指標を示す図である。 多目的最適化装置をエンジンシミュレータに適用した例を示すブロック図である。 多目的最適化装置をモータ評価装置に適用した例を示すブロック図である。 多目的最適化装置をモータシミュレータに適用した例を示すブロック図である。 実施例および比較例の多目的最適化の条件を示す図である。 実施例および比較例において実行するベンチマーク問題を示す図である。 テスト関数ZDT1およびテスト関数ZDT2における平均絶対誤差の概念を示す模式図およびテスト関数DTLZ2における平均絶対誤差の概念を示す模式図である。 2目的の場合における平均絶対誤差の概念を示す模式図である。 実施例および比較例における平均絶対誤差および平均推定誤差の算出結果を示す図である。 実施例および比較例における平均絶対誤差と評価回数との関係を示す図である。 実施例および比較例における平均推定誤差と評価回数との関係を示す図である。 多目的最適化問題をエンジンの最適化に適用した例を示す図である。 パレート最適解について説明するための図である。
符号の説明
1 多目的最適化装置
2 多目的進化型アルゴリズム部
3 適応度推定部
4 出力インタフェース
5 入力インタフェース
6 最適化対象
10 使用者
30a,30b 適応度推定モジュール
31 探索履歴記憶装置
61 エンジン
62 ECU(エンジン制御ユニット)
63 排気ガス分析計
64 コントローラ
65 スロットルユニット
66 ダイナモ
101 CPU(中央演算処理装置)
102 ROM(リードオンリメモリ)
103 RAM(ランダムアクセスメモリ)
104 入力装置
105 表示装置
106 外部記憶装置
107 記録媒体駆動装置
108 入出力インタフェース
109 記録媒体
C 子個体集合
l 距離
1,f2 適応度関数
F 個体集合
HS 探索履歴
I1,I2,I3,I4,I5,I6,I7,I8,I9,I10,I11,I12,I21,I22 個体
L1,L2,L11,L12 直線
P 親個体集合
P1 第1の親個体
P2 第2の親個体
P3 第3の親個体
s1,s2,s3 長方形
1,x2 パラメータ

Claims (16)

  1. 最適化対象に個体のパラメータの組を与え、複数の目的に対応する複数の適応度関数についての適応度の組を前記最適化対象から受ける多目的最適化装置であって、
    個体のパラメータの組および前記最適化対象から出力される適応度の組を保存用個体として記憶する記憶部と、
    新たな個体を評価用個体候補として生成し、生成された評価用個体候補のうち評価用個体として選択された個体のパラメータの組を前記最適化対象および前記記憶部に与えるとともに、複数組の適応度に基づいて評価用個体集合を多目的進化型アルゴリズムに従って評価することによりパレート最適個体集合を求める演算部と、
    前記記憶部に記憶された複数の保存用個体に対応する複数組の適応度に基づいて、前記演算部により生成された評価用個体候補および前記記憶部に記憶された保存用個体の和集合に含まれる各個体に対応する真の適応度の推定値の組を求める推定部とを備え、
    前記演算部は、前記複数の適応度関数の各々について前記和集合に含まれる複数の個体に対応する推定値の優劣を比較し、前記複数の適応度関数の各々について優劣の比較結果に基づいて前記和集合に含まれる複数の個体のランク付けを行い、最上位ランクの各評価用個体候補について最上位ランクの保存用個体の分布における疎の程度を表す分布指標を算出し、算出された分布指標が大きい順に所定数の評価用個体候補を前記評価用個体として選択することを特徴とする多目的最適化装置。
  2. 最適化対象に個体のパラメータの組を与え、複数の目的に対応する複数の適応度関数についての適応度のサンプル値の組を前記最適化対象から受ける多目的最適化装置であって、
    個体のパラメータの組および前記最適化対象から出力される適応度のサンプル値の組を保存用個体として記憶する記憶部と、
    前記記憶部に記憶された複数の保存用個体に対応する複数組のサンプル値に基づいて注目個体に対応する真の適応度の推定値の組を求める第1の推定部と、
    前記第1の推定部により求められた推定値に基づいて新たな個体を評価用個体候補として生成し、生成された評価用個体候補のうち評価用個体として選択された個体のパラメータの組を前記最適化対象および前記記憶部に与えるとともに、前記第1の推定部により求められた複数組の推定値に基づいて評価用個体集合を多目的進化型アルゴリズムに従って評価することによりパレート最適個体集合を求める演算部と、
    前記記憶部に記憶された複数の保存用個体に対応する複数組のサンプル値に基づいて、前記演算部により生成された評価用個体候補および前記記憶部に記憶された保存用個体の和集合に含まれる各個体に対応する真の適応度の推定値の組を求める第2の推定部とを備え、
    前記演算部は、前記複数の適応度関数の各々について前記和集合に含まれる複数の個体に対応する推定値の優劣を比較し、前記複数の適応度関数の各々について優劣の比較結果に基づいて前記和集合に含まれる複数の個体のランク付けを行い、最上位ランクの各評価用個体候補について最上位ランクの保存用個体の分布における疎の程度を表す分布指標を算出し、算出された分布指標が大きい順に所定数の評価用個体候補を前記評価用個体として選択することを特徴とする多目的最適化装置。
  3. 前記第1の推定部は、前記記憶部に記憶された複数の保存用個体をhlとし、注目個体xに対応するサンプル値の組をF(x)とし、パラメータ空間上で注目個体から距離dl離れた保存用個体に対応するサンプル値の組をF(hl)とし、k’を係数とし、l=1,…,Hとし、nを自然数とした場合に、
    Figure 0005019744
    で表される推定式により注目個体xに対応する真の適応度の推定値の組f’(x)を算出することを特徴とする請求項2記載の多目的最適化装置。
  4. 前記第2の推定部は、前記記憶部に記憶された複数の保存用個体をhlとし、パラメータ空間上で評価用個体候補から距離dl離れた保存用個体に対応するサンプル値の組をF(hl)とし、k’を係数とし、l=1,…,Hとし、nを自然数とした場合に、
    Figure 0005019744
    で表される推定式により評価用個体候補xに対応する真の適応度の推定値の組f’(x)を算出することを特徴とする請求項2または3のいずれかに記載の多目的最適化装置。
  5. 前記nは1であることを特徴とする請求項3または4記載の多目的最適化装置。
  6. 前記nは3であることを特徴とする請求項3または4記載の多目的最適化装置。
  7. 前記演算部は、適応度関数空間上で最上位ランク内で各評価用個体候補に隣接する2つの保存用個体を検出し、適応度関数ごとに前記2つの保存用個体間の数学的距離を算出し、各評価用個体候補についての複数の適応度関数における数学的距離の合計を前記分布指標として算出し、複数の評価用個体候補から算出された分布指標が大きい順に所定数の評価用個体候補を評価用個体として選択することを特徴とする請求項2〜6のいずれかに記載の多目的最適化装置。
  8. 前記演算部は、前記第1の推定部により求められた推定値の組に基づいて前記パレート最適個体を表示することを特徴とする請求項2〜7のいずれかに記載の多目的最適化装置。
  9. 前記演算部は、前記多目的進化型アルゴリズムとして遺伝的アルゴリズムを用いて前記評価用個体集合の個体を評価することを特徴とする請求項1〜8のいずれかに記載の多目的最適化装置。
  10. 前記最適化対象は、機器の複数の性能を評価するための評価システムを含み、前記パラメータの組は、前記評価システムのための制御用パラメータの組を含み、前記複数の適応度関数は前記評価システムの評価により得られる前記複数の性能であり、前記適応度の組は前記複数の性能の値であることを特徴とする請求項1〜9のいずれかに記載の多目的最適化装置。
  11. 前記機器はエンジンであることを特徴とする請求項10記載の最適化装置。
  12. 前記機器はモータであることを特徴とする請求項10記載の最適化装置。
  13. 前記評価システムは、前記パラメータの組に基づいて前記機器を制御するとともに前記機器の動作により発生される複数の性能の値をサンプル値として出力する機器評価装置であることを特徴とする請求項10記載の機器最適化装置。
  14. 前記評価システムは、前記パラメータの組に基づいて前記機器の動作をシミュレーションすることにより複数の性能を評価し、評価された複数の性能の値をサンプル値の組として出力する機器シミュレータであることを特徴とする請求項10記載の機器最適化装置。
  15. 最適化対象に個体のパラメータの組を与え、前記最適化対象から出力される複数の目的に対応する複数の適応度関数についての適応度のサンプル値の組に基づいてパラメータを最適化する多目的最適化方法であって、
    個体のパラメータの組および前記最適化対象から出力される適応度のサンプル値の組を保存用個体として記憶部に記憶するステップと、
    前記記憶部に記憶された複数の保存用個体に対応する複数組のサンプル値に基づいて注目個体に対応する真の適応度の推定値の組を求めるステップと、
    求められた前記推定値に基づいて新たな個体を評価用個体候補として生成するステップと、
    前記記憶部に記憶された複数の保存用個体に対応する複数組のサンプル値に基づいて、前記生成された評価用個体候補および前記記憶部に記憶された保存用個体の和集合に含まれる各個体に対応する真の適応度の推定値の組を求めるステップと、
    前記複数の適応度関数の各々について前記和集合に含まれる複数の個体に対応する推定値の優劣を比較し、前記複数の適応度関数の各々について優劣の比較結果に基づいて前記和集合に含まれる複数の個体のランク付けを行い、最上位ランクの各評価用個体候補について最上位ランクの保存用個体の分布における疎の程度を表す分布指標を算出し、算出された分布指標が大きい順に所定数の評価用個体候補を評価用個体として選択するステップと、
    前記選択された評価用個体のパラメータの組を前記最適化対象および前記記憶部に与えるとともに、求められた複数組の推定値に基づいて評価用個体集合を多目的進化型アルゴリズムに従って評価することによりパレート最適個体集合を求めるステップとを含むことを特徴とする多目的最適化方法。
  16. 最適化対象に個体のパラメータの組を与え、前記最適化対象から出力される対応する複数の適応度関数についての適応度のサンプル値の組に基づいてパラメータを最適化するコンピュータにより実行可能な多目的最適化プログラムであって、
    個体のパラメータの組および前記最適化対象から出力される適応度のサンプル値の組を保存用個体として記憶部に記憶する処理と、
    前記記憶部に記憶された複数の保存用個体に対応する複数組のサンプル値に基づいて注目個体に対応する真の適応度の推定値の組を求める処理と、
    求められた前記推定値に基づいて新たな個体を評価用個体候補として生成する処理と、
    前記記憶部に記憶された複数の保存用個体に対応する複数組のサンプル値に基づいて、前記生成された評価用個体候補および前記記憶部に記憶された保存用個体の和集合に含まれる各個体に対応する真の適応度の推定値の組を求める処理と、
    前記複数の適応度関数の各々について前記和集合に含まれる複数の個体に対応する推定値の優劣を比較し、前記複数の適応度関数の各々について優劣の比較結果に基づいて前記和集合に含まれる複数の個体のランク付けを行い、最上位ランクの各評価用個体候補について最上位ランクの保存用個体の分布における疎の程度を表す分布指標を算出し、算出された分布指標が大きい順に所定数の評価用個体候補を評価用個体として選択する処理と、
    前記選択された評価用個体のパラメータの組を前記最適化対象および前記記憶部に与えるとともに、求められた複数組の推定値に基づいて評価用個体集合を多目的進化型アルゴリズムに従って評価することによりパレート最適個体集合を求める処理とを、コンピュータに実行させることを特徴とする多目的最適化プログラム。
JP2005369267A 2005-12-22 2005-12-22 多目的最適化装置、多目的最適化方法および多目的最適化プログラム Expired - Fee Related JP5019744B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005369267A JP5019744B2 (ja) 2005-12-22 2005-12-22 多目的最適化装置、多目的最適化方法および多目的最適化プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005369267A JP5019744B2 (ja) 2005-12-22 2005-12-22 多目的最適化装置、多目的最適化方法および多目的最適化プログラム

Publications (2)

Publication Number Publication Date
JP2007172306A JP2007172306A (ja) 2007-07-05
JP5019744B2 true JP5019744B2 (ja) 2012-09-05

Family

ID=38298788

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005369267A Expired - Fee Related JP5019744B2 (ja) 2005-12-22 2005-12-22 多目的最適化装置、多目的最適化方法および多目的最適化プログラム

Country Status (1)

Country Link
JP (1) JP5019744B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210373888A1 (en) * 2019-08-29 2021-12-02 Huazhong University Of Science And Technology Multi-objective optimization method and system for master production plan of casting parallel workshops

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8098054B2 (en) * 2007-10-10 2012-01-17 John Alexander Verschuur Optimal load controller method and device
JP5124230B2 (ja) * 2007-10-18 2013-01-23 ヤマハ発動機株式会社 パラメトリック多目的最適化装置、パラメトリック多目的最適化方法およびパラメトリック多目的最適化プログラム
JP5156329B2 (ja) * 2007-10-18 2013-03-06 ヤマハ発動機株式会社 パラメトリック多目的最適化装置、パラメトリック多目的最適化方法およびパラメトリック多目的最適化プログラム
JP5235652B2 (ja) * 2008-12-26 2013-07-10 ヤマハ発動機株式会社 多目的最適化装置、多目的最適化方法および多目的最適化プログラム
US7987143B2 (en) * 2009-09-29 2011-07-26 Livermore Software Technology Corporation Methods and systems for multi-objective evolutionary algorithm based engineering desgin optimization
JP2015230702A (ja) * 2014-06-06 2015-12-21 株式会社リコー 処理フロー生成装置、処理フロー生成方法、処理フロー生成プログラム、情報処理装置の製造方法及び情報処理プログラムの製造方法
JP2019095819A (ja) * 2016-03-31 2019-06-20 株式会社インテック 情報処理装置及びプログラム
CN106227988A (zh) * 2016-07-11 2016-12-14 浪潮(北京)电子信息产业有限公司 一种相对误差计算优化方法
WO2019008695A1 (en) * 2017-07-05 2019-01-10 Nec Corporation DEVICE, METHOD AND PROGRAM FOR DETERMINING COST CLASSIFICATION
CN107705110B (zh) * 2017-09-29 2021-03-19 杭州乒乓智能技术股份有限公司 基于多目标的资金池支付序列优化方法及装置
CN107657311B (zh) * 2017-11-03 2019-10-29 电子科技大学 基于多目标粒子群算法的测试优选方法
CN107909194B (zh) * 2017-11-07 2021-07-13 电子科技大学 系统级测试性设计多目标优化方法
CN110728394A (zh) * 2019-04-24 2020-01-24 内蒙古电力(集团)有限责任公司内蒙古电力经济技术研究院分公司 一种考虑潮流分布的高压变电站规划方法
WO2024201834A1 (ja) * 2023-03-29 2024-10-03 富士通株式会社 演算プログラム、演算方法、および情報処理装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210373888A1 (en) * 2019-08-29 2021-12-02 Huazhong University Of Science And Technology Multi-objective optimization method and system for master production plan of casting parallel workshops

Also Published As

Publication number Publication date
JP2007172306A (ja) 2007-07-05

Similar Documents

Publication Publication Date Title
JP5019744B2 (ja) 多目的最適化装置、多目的最適化方法および多目的最適化プログラム
EP1548608A2 (en) Multiobjective optimization
Nam et al. Multiobjective simulated annealing: A comparative study to evolutionary algorithms
Di Pierro et al. An investigation on preference order ranking scheme for multiobjective evolutionary optimization
Zhou et al. Multiobjective evolutionary algorithms: A survey of the state of the art
Yen et al. Dynamic multiobjective evolutionary algorithm: adaptive cell-based rank and density estimation
JP4947903B2 (ja) 最適化方法及び最適化プログラム
Mahmoodabadi et al. A novel combination of Particle Swarm Optimization and Genetic Algorithm for Pareto optimal design of a five-degree of freedom vehicle vibration model
Alajlan et al. Global path planning for mobile robots in large-scale grid environments using genetic algorithms
JP5156329B2 (ja) パラメトリック多目的最適化装置、パラメトリック多目的最適化方法およびパラメトリック多目的最適化プログラム
JP5124230B2 (ja) パラメトリック多目的最適化装置、パラメトリック多目的最適化方法およびパラメトリック多目的最適化プログラム
JP2005285090A (ja) 多目的最適化装置、多目的最適化方法および多目的最適化プログラム
Lu et al. Genetic algorithm modelling and solution of inspection path planning on a coordinate measuring machine (CMM)
US7437336B2 (en) Polyoptimizing genetic algorithm for finding multiple solutions to problems
Benavides et al. Real path planning based on genetic algorithm and Voronoi diagrams
Guo A survey of decomposition based evolutionary algorithms for many-objective optimization problems
Büche Multi-objective evolutionary optimization of gas turbine components
Hamda et al. Multi-objective evolutionary topological optimum design
CN111813669A (zh) 基于多目标群体智能的适应性随机测试用例生成方法
Ott et al. Approximate sequential optimization for informative path planning
Choy et al. Sparse actor-critic: Sparse tsallis entropy regularized reinforcement learning in a continuous action space
Li et al. A surrogate-assisted offspring generation method for expensive multi-objective optimization problems
Zakaria et al. Effects of genetic algorithm parameters on multiobjective optimization algorithm applied to system identification problem
Aliniya et al. Dynamic constrained multi-objective optimization with combination response mechanism
Duan et al. Research on welding robot path planning based on genetic algorithm

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081104

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111227

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120410

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120514

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120612

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120612

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5019744

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150622

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees