JP2010026751A - 状態空間の探索方法および状態空間の探索装置 - Google Patents

状態空間の探索方法および状態空間の探索装置 Download PDF

Info

Publication number
JP2010026751A
JP2010026751A JP2008186753A JP2008186753A JP2010026751A JP 2010026751 A JP2010026751 A JP 2010026751A JP 2008186753 A JP2008186753 A JP 2008186753A JP 2008186753 A JP2008186753 A JP 2008186753A JP 2010026751 A JP2010026751 A JP 2010026751A
Authority
JP
Japan
Prior art keywords
state
search
evaluation value
evaluation values
states
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008186753A
Other languages
English (en)
Inventor
Masanobu Koshio
正展 古塩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2008186753A priority Critical patent/JP2010026751A/ja
Publication of JP2010026751A publication Critical patent/JP2010026751A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Feedback Control In General (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】探索の効率化を図り、少ない処理時間でより良い状態を得ることができる状態空間の探索装置を提供する。
【解決手段】指定された着目状態から出発し、第1の距離を有する隣接状態の中から遷移する状態を決定して次の着目状態とすることを順次繰り返し、遷移する状態において最良の評価値を持つ状態から評価値の良い上位n個の評価値を持つ状態までを探索する第1の探索手段2と、評価値の良い上位n個までの評価値を持つ状態を各々初期の着目状態とし、第1の距離より小さい距離の第2の距離を有する隣接状態の中から遷移する状態を決定して次の着目状態とすることを順次繰り返すことにより、評価値の良い上位n個までの評価値を持つ状態を各々初期の着目状態とする各々の最良の評価値を持つ局所最良状態を探索する第2の探索手段4と、複数の局所最良状態の中から、最良の評価値を持つ状態を最良状態とする最良状態探索手段5とを備える。
【選択図】図1

Description

この発明は、ロジスティクス、DNAの塩基配列類似度を決定する配列アライメント、LSI最適配線決定などの各種最適化設計、電力系統における発電機起動停止問題や系統構成作成、ガスや水道の供給経路作成、最適スケジュール作成などの各種最適計画、最適制御の組合せ最適解を求める状態空間の探索方法および状態空間の探索装置に関し、特に、探索の効率化を図り、少ない処理時間でより良い状態を得るものである。
従来の状態空間の探索方法および状態空間の探索装置には、問題空間探索法、ローカルサーチ、あるいはタブーサーチ法などに代表される状態空間の探索に関わる最適化技術がある。従来のローカルサーチは、組合せ最適化問題の1つの組合せを1つの状態と考え、状態の良否の評価値を用いて評価し、着目状態から最急降下方向に状態を遷移しながら最良解を求める方法である(例えば、非特許文献1)。
他の従来の問題空間探索法は、ローカルサーチが有する特徴の他に、極小解に到達し最急降下方向に遷移できなくなった場合には、極小解の評価値を増大させることにより探索を継続することができ、無限に時間をかければ大域的最適解への到達が保証されているという特徴を持つ探索方法である(例えば、特許文献1)。
他の従来のタブーサーチ法は、大域的最適解が得られる保証はないが、遷移前後の状態について状態を一意に特定できる特徴的な変更点をタブーリストに探索の一定期間記憶しておくと同時に、隣接状態を作成する際タブーリストに記憶されている変更点についての変更を禁止することにより、広範な問題空間を探索することができるというものである(例えば、非特許文献1参照)。
これらの各探索手法は、各々特徴は異なるが、いずれの探索手法も以下1)ないし3)にて示す手順が含まれるという点については同一である。
1)着目状態を作成して問題毎に与えられる評価関数に従って評価を行う。
2)着目状態に対して、少なくとも1箇所以上組合せの異なる隣接状態を複数作成して評価を行う。
3)前述2)で評価を行った隣接状態のうち、最も評価関数が改善する状態を1つ選び次の着目状態とする。
特開平05−81325公報 平成12年度電気学会全国大会講演番号6−034_268
従来の探索手法のローカルサーチでは、極小解を脱出できないという問題があった。また、タブーサーチ法では、比較的広範囲の問題空間を探索することができるという特長があるが、求めた最良解の近傍に存在するより良い解を見落とす可能性があるという問題点があった。また、問題空間探索法については、初期解近傍の最良解を高速に見つけることができるという特長があるが、初期解依存性が高く広範囲な問題空間を実用的な処理時間で探索することが難しいという問題点があった。
この発明は上記のような課題を解決するためになされたものであり、探索の効率化を図り、少ない処理時間でより良い状態を得ることができる状態空間の探索方法および状態空間の探索装置を提供することを目的とする。
この発明は、複数の要素の組合せを表す状態の集まりである状態空間の中から最良状態を探索する状態空間の探索方法において、
状態空間の中における指定された着目状態から出発し、第1の距離を有する隣接状態の中から遷移する状態を決定して次の着目状態とすることを順次繰り返し、所定の探索回数の遷移を繰り返した後に、着目状態とした状態の中でその評価値の良い上位n個までの評価値を持つ状態を出力し、
評価値の良い上位n個までの評価値を持つ状態を各々初期の着目状態とし、第1の距離より小さい距離の第2の距離を有する隣接状態の中から遷移する状態を決定して次の着目状態とすることを順次繰り返すことにより、評価値の良い上位n個までの評価値を持つ状態を各々初期の着目状態とする所定の探索回数での探索における各々の最良の評価値を持つ局所最良状態を探索し、
複数の局所最良状態の中から、最良の評価値を持つ状態を選択し、最良状態として抽出するものである。
また、この発明は、複数の要素の組合せを表す状態の集まりである状態空間の中から最良状態を探索する状態空間の探索装置において、
状態空間の中における指定された着目状態から出発し、第1の距離を有する隣接状態の中から遷移する状態を決定して次の着目状態とすることを順次繰り返し、所定の探索回数の遷移を繰り返した後に、着目状態とした状態の中でその評価値の良い上位n個までの評価値を持つ状態を出力する第1の探索手段と、
第1の探索手段にて探索された評価値の良い上位n個の評価値の状態を格納するベストnデータベースと、
評価値の良い上位n個までの評価値を持つ状態を各々初期の着目状態とし、第1の距離より小さい距離の第2の距離を有する隣接状態の中から遷移する状態を決定して次の着目状態とすることを順次繰り返すことにより、評価値の良い上位n個までの評価値を持つ状態を各々初期の着目状態とする所定の探索回数での探索における各々の最良の評価値を持つ局所最良状態を探索する第2の探索手段と、
第2の探索手段により探索された複数の局所最良状態を格納する局所最良状態データベースと、
複数の局所最良状態の中から、最良の評価値を持つ状態を選択し、最良状態として抽出する第3の探索手段とを備えたものである。
この発明の状態空間の探索方法は、複数の要素の組合せを表す状態の集まりである状態空間の中から最良状態を探索する状態空間の探索方法において、
状態空間の中における指定された着目状態から出発し、第1の距離を有する隣接状態の中から遷移する状態を決定して次の着目状態とすることを順次繰り返し、所定の探索回数の遷移を繰り返した後に、着目状態とした状態の中でその評価値の良い上位n個までの評価値を持つ状態を出力し、
評価値の良い上位n個までの評価値を持つ状態を各々初期の着目状態とし、第1の距離より小さい距離の第2の距離を有する隣接状態の中から遷移する状態を決定して次の着目状態とすることを順次繰り返すことにより、評価値の良い上位n個までの評価値を持つ状態を各々初期の着目状態とする所定の探索回数での探索における各々の最良の評価値を持つ局所最良状態を探索し、
複数の局所最良状態の中から、最良の評価値を持つ状態を選択し、最良状態として抽出するので、探索の効率化を図り、少ない処理時間でより良い状態を得ることができる。
また、この発明の状態空間の探索装置は、複数の要素の組合せを表す状態の集まりである状態空間の中から最良状態を探索する状態空間の探索装置において、
状態空間の中における指定された着目状態から出発し、第1の距離を有する隣接状態の中から遷移する状態を決定して次の着目状態とすることを順次繰り返し、所定の探索回数の遷移を繰り返した後に、着目状態とした状態の中でその評価値の良い上位n個までの評価値を持つ状態を出力する第1の探索手段と、
第1の探索手段にて探索された評価値の良い上位n個の評価値の状態を格納するベストnデータベースと、
評価値の良い上位n個までの評価値を持つ状態を各々初期の着目状態とし、第1の距離より小さい距離の第2の距離を有する隣接状態の中から遷移する状態を決定して次の着目状態とすることを順次繰り返すことにより、評価値の良い上位n個までの評価値を持つ状態を各々初期の着目状態とする所定の探索回数での探索における各々の最良の評価値を持つ局所最良状態を探索する第2の探索手段と、
第2の探索手段により探索された複数の局所最良状態を格納する局所最良状態データベースと、
複数の局所最良状態の中から、最良の評価値を持つ状態を選択し、最良状態として抽出する第3の探索手段とを備えたので、探索の効率化を図り、少ない処理時間でより良い状態を得ることができる。
実施の形態1.
以下、本願発明の実施の形態について説明する。図1はこの発明の実施の形態1における状態空間の探索装置の構成を示すブロック図、図2および図3はこの発明の実施の形態1における状態空間の探索方法を示すフローチャート、図4は図2に示した状態空間の探索方法の具体例、例えば1時間刻みの発電機運転/停止状態を組合せとし、様々な制約を考慮した上で評価値が最も良い1日分の発電機運転/停止状態を決定する問題に対して、本実施の形態1を適用した場合の隣接状態の例を示す図、図5は図2および図3に示した状態空間の探索方法の各状態のイメージを示した図である。
図において、複数の要素の組合せを表す状態の集まりである状態空間の中から最良状態を探索する状態空間の探索装置100は、入力部1から状態空間の探索に対し、LANなどの通信手段、あるいはGUIを通じて、探索を開始する上で必要となる情報が入力され格納される入力条件データベース6と、入力条件データベース6において指定された、状態空間の中における着目状態から出発し、第1の距離を有する隣接状態の中から遷移する状態を決定して次の着目状態とすることを順次繰り返し、所定の探索回数の遷移を繰り返した後に、着目状態とした状態の中でその評価値の良い上位n個の状態を、新たな初期の着目状態として抽出して次工程に送信する第1の探索手段2と、この第1の探索手段2にて探索された状態のうち、評価値の良い上位n個の状態を探索結果として格納するベストnデータベース7とを備える。
さらに、評価値の良い上位n個までの評価値を持つ状態を各々初期の着目状態とし、第1の距離より小さい距離の第2の距離を有する隣接状態の中から遷移する状態を決定して次の着目状態とすることを順次繰り返すことにより、評価値の良い上位n個までの評価値を持つ状態を各々初期の着目状態とする所定の探索回数での探索における各々の最良の評価値を持つ局所最良状態を探索する第2の探索手段4と、この第2の探索手段4にて探索された局所最良状態を格納する局所最良状態データベース8と、第2の探索手段4において得られた複数の局所最良状態の中から、最も本来の目的に沿う状態を抽出し、これを最良状態として探索するとともに、LANなどの通信手段、あるいはGUIを通じて、例えば、出力結果の表示、計画・制御対象機器に対する運転停止信号あるいは計画値・制御指令値などの出力値として出力部12に出力を行う第3の探索手段としての最良状態探索手段5とを備えている。尚、本実施の形態1においては、評価値が小さいほど最適であると評価するものとして説明する。また、第1の探索手段2および第2の探索手段4における探索方法としては、問題空間探索法を用いる場合について説明する。
次に上記のように構成された実施の形態1の状態空間の探索方法について説明する。まず、第1の探索手段2は、入力部1で入力条件データベース6に入力された入力条件に基づいて、状態空間の探索の出発点となる状態を“着目状態”に初期設定する(図2のステップS1)。次に、この”着目状態”の評価値を算出する(図2のステップS2)。次に、探索回数をカウントするためのカウンタの初期設定を行う。このときカウンタL1のカウントは0とする(図2のステップS3)。次に、“着目状態”から遷移可能な第1の距離を有する隣接状態を抽出するとともに、これら各隣接状態の評価値をそれぞれ算出する(図2のステップS4)。次に、ステップS4で抽出された状態の中に評価値の変更が必要なものが存在すれば、評価値の変更を行う(図2のステップS5)。具体的には、抽出された状態の中において、過去に評価値が増大された状態が存在すれば、その状態の評価値を過去に増大された増大後の値に変更するものである。
次に、抽出された状態の中で、最小の評価値を持つ状態を見つけ、この状態を“次の着目状態”として選択する(図2のステップS6)。これらステップS4、5、6によって、“着目状態”から遷移可能な状態の中で、最小の評価値を持つ状態が“次の着目状態”として選択されることとなる。次に、”次の着目状態”が、求められている性質を持つ状態であるか否かを判定する(図2のステップS7)。次に、求めている性質である場合(Yes)、すなわち、”次の着目状態”の評価値が最良状態を決定するために予め設定されている評価値である場合には、”次の着目状態”が最良状態であると判断される。よって、この”次の着目状態”が最良解として抽出して(図2のステップS50)、動作を終了する。
次に、求めている性質でない場合(No)には、”次の着目状態”が、保持されているベストn番目の状態(尚、図中のおいては”状態”と同義である”解”にて示している。以下においても同様であるためその説明は適宜省略する。)より望ましい状態であるかを判断する。そして、望ましい状態の場合には、これを保存対象状態として保存する。また、望ましい状態でない場合には、保存を行わない(図2のステップS8)。次に、”次の着目状態”の評価値が”着目状態”の評価値より小さいか否かを判断する(図2のステップS9)。次に、小さい場合にはステップS14に移る。また、小さくない(大きい)場合には、“着目状態”の評価値を、“次の着目状態”の評価値より大きくなるように増大する(図2のステップS10)。
次に、保存されている過去に評価値の増大を行った状態の中に、“着目状態”と同一の状態が存在するかを判断する(図2のステップS11)。次に、過去に評価値の増大を行ったことがある場合(Yes)には、”着目状態”と同一状態である過去に評価値の増大を行った状態の評価値を、“着目状態”の評価値に変更する(図2のステップS12)。次に、過去に評価値の増大を行ったことない場合(No)には、”着目状態”を過去に評価値の増大を行った状態として、その評価値と共に保存する(図2のステップS13)。次に、探索回数(L1)が所定の探索回数L1MAXを越えたのか否かを判定する(図2のステップS14)。
次に、所定の探索回数L1MAXを超えている場合(Yes)には、ステップS17に移る。また、所定の探索回数L1MAXを超えていない場合(No)には、“着目状態”とその評価値を、“次の着目状態”とその評価値に変更する(図2のステップS15)。このことにより次の探索段階に移ることとなる。次に、探索回数(L1)のカウンタを1増加(L1+1)させる(図2のステップS16)。次に、再びステップS4に移り、上記に示した探索の動作が繰り返される。上記のような工程を経て、第1の探索手段2において所定の探索回数が終了し、第2の探索手段4での探索が開始される。
まず、第2の探索手段4では、評価値の良い上位n個までの評価値を持つ状態の探索を行うためのカウントのカウンタの初期設定を行う。このときカウンタL2のカウントは0とする(図3のステップS17)。そして、第1の探索手段2により抽出された評価値の良い上位n個のうち、最初に探索対象となる状態を“着目状態”に初期設定する(図3のステップS18)。次に、この”着目状態”の評価値を算出する(図3のステップS19)。次に、第2の探索手段4における探索回数をカウントするためのカウンタの初期設定を行う。このときカウンタL3のカウントは0とする(図3のステップS20)。
次に、“着目状態”から遷移可能な第2の距離を有する隣接状態を抽出するとともに、これら各隣接状態の評価値をそれぞれ算出する(図3のステップS21。次に、ステップS21で抽出された状態の中に評価値の変更が必要なものが存在すれば、評価値の変更を行う(図3のステップS22)。具体的には、抽出された状態の中において、過去に評価値が増大された状態が存在すれば、その状態の評価値を過去に増大された増大後の値に変更するものである。
次に、抽出された状態の中で、最小の評価値を持つ状態を見つけ、この状態を“次の着目状態”として選択する(図3のステップS23)。これらステップS21、22、23によって、“着目状態”から遷移可能な状態の中で、最小の評価値を持つ状態が“次の着目状態”として選択されることとなる。次に、”次の着目状態”が、求められている性質を持つ状態であるか否かを判定する(図3のステップS24)。次に、求めている性質である場合(Yes)、すなわち、”次の着目状態”の評価値が最良状態を決定するために予め設定されている評価値である場合には、”次の着目状態”が最良状態であると判断される。よって、この”次の着目状態”が最良解として抽出して(図3のステップS51)、動作を終了する。
次に、求めている性質でない場合(No)には、”次の着目状態”が、保持されているL2番目の局所最良状態より望ましい状態であるかを判断する。そして、望ましい状態の場合には、これをL2番目(評価値の良い上位n個のうち、選択された状態)の局所最良状態として保存する。また、望ましい状態でない場合には、保存を行わない(図3のステップS25)。次に、”次の着目状態”の評価値が”着目状態”の評価値より小さいか否かを判断する(図3のステップS26)。次に、小さい場合にはステップS31に移る。また、小さくない(大きい)場合には、“着目状態”の評価値を、“次の着目状態”の評価値より大きくなるように増大する(図3のステップS27)。
次に、保存されている過去に評価値の増大を行った状態の中に、“着目状態”と同一の状態が存在するかを判断する(図3のステップS28)。次に、過去に評価値の増大を行ったことがある場合(Yes)には、”着目状態”と同一状態である過去に評価値の増大を行った状態の評価値を、“着目状態”の評価値に変更する(図3のステップS29)。次に、過去に評価値の増大を行ったことない場合(No)には、”着目状態”を過去に評価値の増大を行った状態として、その評価値と共に保存する(図3のステップS30)。次に、探索回数(L3)が所定の探索回数L3MAXを越えたのか否かを判定する(図3のステップS31)。
次に、所定の探索回数L3MAXを超えていない場合(No)には、“着目状態”とその評価値を、“次の着目状態”とその評価値に変更する(図3のステップS32)。このことにより次の探索段階に移ることとなる。次に、探索回数(L3)のカウンタを1増加(L3+1)させる(図3のステップS33)。次に、再びステップS21に移り、上記に示した探索の動作が繰り返される。また、所定の探索回数L3MAXを超えている場合(Yes)には、L2番目が評価値の良い上位n個すべてが終了したか否かを判断する(図3のステップS34)。次に、評価値の良い上位n個までの終了していない場合(No)には、評価値の良い上位n個のカウントであるL2に1を増加(L2+1)させる(図3のステップS35)。次に、ステップS18に移り、終了していない評価値の良い上位n個までの評価値を持つ状態を初期の着目状態として上記に示した工程が繰り返される。また、終了している場合(Yes)には、最良状態探索手段5がこの各局所最良状態から最も望ましい状態を最良状態として抽出する(図3のステップS36)。
本実施の形態1における、第1の探索手段2(図2のステップS1からステップS16までのステップ)と、第2の探索手段4(図3のステップS20からステップS35までのステップ)との相違点は、隣接状態の定義にある。図2のステップS4にて作成する隣接状態、すなわち、第1の探索手段2にて行われる探索の場合には、例えば図4(a)に示すような昼間帯(8:00〜20:00)の複数時間帯の発電機運転/停止状態を1度に変更する隣接状態や、深夜(0:00〜8:00)、午前(8:00〜12:00)、午後(12:00〜20:00)、あるいは夜間(20:00〜24:00)の複数時間帯について発電機運転/停止状態を変更する隣接状態など、当該日に運転するかしないか、運転するなら昼か夜か、など大まかな方針を決定する隣接状態を定義する。このように隣接状態を定義することにより、第1の探索手段2の探索では、以下において詳細に説明する、図5(b)に示すように本来の状態空間の極小状態を1つ1つ探すことはせず、なるべく広範な状態空間で状態を作成・評価する。
一方、図3のステップS21にて作成する隣接状態、すなわち、第2の探索手段4にて行われる探索の場合には、例えば図4(b)に示すような1時間分の状態を停止から運転に変更する、あるいは逆に運転から停止に変更するなど、より詳細に発電機の運転/停止状態を決定する隣接状態を定義する。このように隣接状態を定義することにより、第2の探索手段4の探索では、以下のおいて詳細に説明する、図5(c)に示すように第1の探索手段2の探索で保存した評価値の良い上位n個までの評価値を持つ状態の隣接する状態空間について、本来の状態空間に沿った探索を行い局所最良状態を探索して、さらに最良状態探索手段5において最良の状態を選択することにより、本来の状態空間において求められている性質を持つ状態を効率的に得ることができる。
この隣接状態の違いによる探索がどのように遷移するかについて図5に基づいて説明する。まず、図5は縦軸を評価値、横軸を状態として表すものである。図5(a)は、探索しようとする状態空間のイメージを示したもので、各状態の評価値がそれぞれ○にて示されている。そして、第1の探索手段2における探索は、例えば図5(b)の一番左の○の状態を着目状態として、第1の距離を有する隣接状態にて遷移して探索を行っていく。すると、図5(b)に示すように、一番左の○から点線にて結ばれた状態が次々に探索され遷移していく。そしてこの第1の距離を有する隣接状態にて所定の探索回数の探索を行い、その評価値において評価の良い上位n個までの評価値を持つ状態が△として探索される。
次に、評価値において評価の良い上位n個である△の状態をそれぞれ初期の着目状態として、第2の距離を有する隣接状態にて所定の探索回数の探索を行う。すると、△の状態からそれぞれ範囲A、範囲Bの範囲が探索される。そして、評価値の良い上位n個までの評価値を持つ状態を各々初期の着目状態とする各々の最良の評価値を持つ局所最良状態その評価値において最良の評価値を有するものを局所最良状態として□の状態が探索される。次に、最良状態探索手段5により、各局所最良状態の中から最良の評価値を持つ状態選択し、最良状態として抽出される。ここでは図5(c)の右側の□の状態が最良状態として抽出されることとなる。
上記のように構成された実施の形態1によれば、初期に設定された着目状態から第1の距離を有する隣接状態に遷移して評価値の良い上位n個までの評価値を持つ状態を探索し、評価値の良い上位n個までの評価値を持つ状態を各々初期の着目状態として、先の探索より距離の小さい距離の第2の隣接状態にて、各々の最良の評価値を持つ局所最良状態を探索し、各局所最良状態の中から最良の評価値を持つ状態選択し、最良状態として抽出されるため、探索の効率化を図り、少ない処理時間でより良い状態を得ることができる。
また、第1の探索手段においては、遷移する状態の評価値が最良状態を決定するために予め設定されている評価値であることを探索すると、この遷移する状態を最良状態として抽出しているため(本実施の形態1における、図2のステップS7において、Yesと判断される工程を示す)、探索の効率化をより一層図り、より一層少ない処理時間でより良い状態を得ることができる。
また、第2の探索手段においては、遷移する状態の評価値が上記最良状態を決定するために予め設定されている評価値であることを探索すると、この遷移する状態を最良状態として抽出しているため(本実施の形態1における、図3のステップS24において、Yesと判断される工程を示す)、探索の効率化をより一層図り、より一層少ない処理時間でより良い状態を得ることができる。
実施の形態2.
図6および図7はこの発明の実施の形態2における状態空間の探索方法を示すフローチャートである。尚、この発明の実施の形態2における状態空間の探索装置の構成は、上記実施の形態1と同様に形成されているため、ここでは図1を用いて説明する。尚、本実施の形態2においては、評価値が小さいほど最適であると評価するものとして説明する。また、第1の探索手段2における探索方法としては、タブーサーチ法にて、また、第2の探索手段4における探索方法としては、ローカルサーチを用いる場合について説明する。
次に上記のように構成された実施の形態2の状態空間の探索方法について説明する。まず、上記実施の形態1と同様に、第1の探索手段2は、入力部1で入力条件データベース6に入力された入力条件に基づいて、状態空間の探索の出発点となる状態を“着目状態”に初期設定する(図6のステップS1)。次に、この”着目状態”の評価値を算出する(図6のステップS2)。次に、探索回数をカウントするためのカウンタの初期設定を行う。このときカウンタL1のカウントは0とする(図6のステップS3)。次に、“着目状態”から遷移可能な第1の距離を有する隣接状態を抽出するとともに、これら各隣接状態の評価値をそれぞれ算出する(図6のステップS4)。
次に、抽出された状態の中で、最小の評価値を持つ状態を見つけ、この状態を“次の着目状態”として選択する(図6のステップS6)。これらステップS4、6によって、“着目状態”から遷移可能な状態の中で、最小の評価値を持つ状態が“次の着目状態”として選択されることとなる。次に、”次の着目状態”が、求められている性質を持つ状態であるか否かを判定する(図6のステップS7)。次に、求めている性質である場合(Yes)、すなわち、”次の着目状態”の評価値が最良状態を決定するために予め設定されている評価値である場合には、”次の着目状態”が最良状態であると判断される。よって、この”次の着目状態”が最良解として抽出して(図6のステップS50)、動作を終了する。
次に、求めている性質でない場合(No)には、着目状態からの次の着目状態への遷移を一意に特定できる特徴的な情報をタブーリストに登録、また、タブーリストを更新する(図6のステップS37)。次に、”次の着目状態”が、保持されているベストn番目の状態より望ましい状態であるかを判断する。そして、望ましい状態の場合には、これを保存対象状態として保存する。また、望ましい状態でない場合には、保存を行わない(図6のステップS8)。次に、探索回数(L1)が所定の探索回数L1MAXを越えたのか否かを判定する(図6のステップS14)。
次に、所定の探索回数L1MAXを超えている場合(Yes)には、ステップS17に移る。また、所定の探索回数L1MAXを超えていない場合(No)には、“着目状態”とその評価値を、“次の着目状態”とその評価値に変更する(図6のステップS15)。このことにより次の探索段階に移ることとなる。次に、探索回数(L1)のカウンタを1増加(L1+1)させる(図6のステップS16)。次に、再びステップS4に移り、上記に示した探索の動作が繰り返される。尚、本実施の形態2においては、第1の探索手段2においてはタブーサーチ法を用いているため、ステップS37にて作成されたタブーリストが、次のステップS4の工程の探索から利用されることは言うまでもない。そして、上記のような工程を経て、第1の探索手段2において所定の探索回数が終了し、第2の探索手段4でのローカルサーチによる探索が開始される。
まず、第2の探索手段4では、評価値の良い上位n個までの評価値を持つ状態の探索を行うためのカウントのカウンタの初期設定を行う。このときカウンタL2のカウントは0とする(図7のステップS17)。そして、第1の探索手段2により抽出された評価値の良い上位n個のうち、最初に探索対象となる状態を“着目状態”に初期設定する(図7のステップS18)。次に、この”着目状態”の評価値を算出する(図7のステップS19)。次に、第2の探索手段4における探索回数をカウントするためのカウンタの初期設定を行う。このときカウンタL3のカウントは0とする(図7のステップS20)。
次に、“着目状態”から遷移可能な第2の距離を有する隣接状態を抽出するとともに、これら各隣接状態の評価値をそれぞれ算出する(図7のステップS21)。次に、抽出された状態の中で、最小の評価値を持つ状態を見つけ、この状態を“次の着目状態”として選択する(図7のステップS23)。これらステップS21、23によって、“着目状態”から遷移可能な状態の中で、最小の評価値を持つ状態が“次の着目状態”として選択されることとなる。次に、”次の着目状態”が、求められている性質を持つ状態であるか否かを判定する(図7のステップS24)。次に、求めている性質である場合(Yes)、すなわち、”次の着目状態”の評価値が最良状態を決定するために予め設定されている評価値である場合には、”次の着目状態”が最良状態であると判断される。よって、この”次の着目状態”が最良解として抽出して(図7のステップS51)、動作を終了する。
次に、求めている性質でない場合(No)には、”次の着目状態”が、保持されているL2番目の局所最良状態より望ましい状態であるかを判断する。そして、望ましい状態の場合には、これをL2番目(評価値の良い上位n個のうち、選択された状態)の局所最良状態として保存する。また、望ましい状態でない場合には、保存を行わない(図7のステップS25)。次に、”次の着目状態”の評価値が”着目状態”の評価値より小さいか否かを判断する(図7のステップS38)。次に、大きい場合にはステップS34に移り、L2番目の探索を終了する。また、小さい場合には、探索回数(L3)が所定の探索回数L3MAXを越えたのか否かを判定する(図7のステップS31)。
次に、所定の探索回数L3MAXを超えていない場合(No)には、“着目状態”とその評価値を、“次の着目状態”とその評価値に変更する(図7のステップS32)。このことにより次の探索段階に移ることとなる。次に、探索回数(L3)のカウンタを1増加(L3+1)させる(図7のステップS33)。次に、再びステップS21に移り、上記に示した探索の動作が繰り返される。また、所定の探索回数L3MAXを超えている場合(Yes)には、L2番目が評価値の良い上位n個すべてが終了したか否かを判断する(図7のステップS34)。次に、評価値の良い上位n個までの処理が終了していない場合(No)には、評価値の良い上位n個のカウントであるL2に1を増加(L2+1)させる(図7のステップS35)。次に、ステップS18に移り、終了していない評価値の良い上位n個までの評価値を持つ状態を初期の着目状態として上記に示した工程を繰り返される。また、終了している場合(Yes)には、最良状態探索手段5がこの各局所最良状態から最も望ましい状態を最良状態として抽出する(図7のステップS36)。
上記探索における隣接状態の違いは上記実施の形態1と同様であるため説明を省略する。ここではこの隣接状態の違いによる探索がどのように遷移するかについて図8に基づいて説明する。まず、図8は縦軸を評価値、横軸を状態として表すものである。図8(a)は、探索しようとする状態空間のイメージを示したもので、各状態の評価値がそれぞれ○にて示されている。そして、第1の探索手段2における探索は、例えば図8(b)の一番左の○の状態を着目状態として、第1の距離を有する隣接状態にて遷移して探索を行っていく。すると、図8(b)に示すように、一番左の○から点線にて結ばれた状態が次々に探索され遷移していく。そしてこの第1の距離を有する隣接状態にて所定の探索回数の探索を行い、その評価値において評価の良い上位n個までの評価値を持つ状態が△として探索される。
次に、評価値において評価の良い上位n個である△の状態をそれぞれ初期の着目状態として、第2の距離を有する隣接状態にて所定の探索回数の探索を行う。すると、△の状態からそれぞれ範囲C、範囲Dの範囲が探索される。そして、評価値の良い上位n個までの評価値を持つ状態を各々初期の着目状態とする各々の最良の評価値を持つ局所最良状態その評価値において最良の評価値を有するものを局所最良状態として□の状態が探索される。次に、最良状態探索手段5により、各局所最良状態の中から最良の評価値を持つ状態選択し、最良状態として抽出される。ここでは図8(c)の左側の□の状態が最良状態として抽出されることとなる。
上記のように構成された実施の形態2によれば、上記実施の形態1と同様に、初期に設定された着目状態から第1の距離を有する隣接状態に遷移して評価値の良い上位n個までの評価値を持つ状態を探索し、評価値の良い上位n個までの評価値を持つ状態を各々初期の着目状態として、先の探索より距離の小さい距離を第2の隣接状態にて、各々の最良の評価値を持つ局所最良状態を探索し、各局所最良状態の中から最良の評価値を持つ状態選択し、最良状態として抽出されるため、探索の効率化を図り、少ない処理時間でより良い状態を得ることができる。
尚、上記各実施の形態においては探索方法として、上記実施の形態1においては、問題空間探索法を用いる例を、また、上記実施の形態2においては、タブーサーチ法とローカルサーチ法とを組合せて用いる例をそれぞれ示したが、これに限られることはなく、いずれの探索方法を採用することが可能であることは言うまでもなく、第1の距離を有する隣接状態と、第1の距離より小さい距離の第2の距離を有する隣接状態との関係にて探索を行うものであれば上記各実施の形態と同様の効果を奏することは言うまでもない。
実施の形態3.
図9はこの発明の実施の形態3における状態空間の探索装置の第1の探索手段の構成を示す図である。図において、上記各実施の形態と同様の部分は同一符号を付して説明を省略する。また、第1の探索手段2以外の構成は上記各実施の形態と同様であるため省略する。第1の探索手段2としての複数のCPU2aを備えたものである。
上記のように構成された実施の形態3の状態空間の探索装置によれば、第1の探索手段2として、複数のCPU2aを備え、第1の探索手段2として探索する複数の隣接状態の探索を複数のCPU2aに振り分けて行う。また、この複数のCPU2aを第1の探索手段4の評価値の良い上位n個までの評価値の探索を行う際に、第2の探索手段4が複数のCPU2aを用いて振り分けて行うようにしても良い。
上記に示した実施の形態3によれば、第1の探索手段の探索または第2の探索手段の探索を複数のCPUに分散して行うため、より一層少ない処理時間でより良い状態を得ることができる。
この発明の実施の形態1の状態空間の探索装置の構成を示す図である。 この発明の実施の形態1の状態空間の探索方法を示すフローチャートである。 この発明の実施の形態1の状態空間の探索方法を示すフローチャートである。 図2に示した状態空間の探索方法の具体例を示した図である。 図2および図3に示した状態空間の探索方法の各状態のイメージを示した図である。 この発明の実施の形態2の状態空間の探索方法を示すフローチャートである。 この発明の実施の形態3の状態空間の探索方法を示すフローチャートである。 図6および図7に示した状態空間の探索方法の各状態のイメージを示した図である。 この発明の実施の形態3の状態空間の探索装置の構成を示す図である。
符号の説明
2 第1の探索手段、2a 複数のCPU、4 第2の探索手段、
5 最良状態探索手段、7 ベストnデータベース、8 局所最良状態データベース。

Claims (8)

  1. 複数の要素の組合せを表す状態の集まりである状態空間の中から最良状態を探索する状態空間の探索方法において、
    上記状態空間の中における指定された着目状態から出発し、第1の距離を有する隣接状態の中から遷移する状態を決定して次の着目状態とすることを順次繰り返し、所定の探索回数の遷移を繰り返した後に、着目状態とした状態の中でその評価値の良い上位n個までの評価値を持つ状態を出力する第1の工程と、
    上記評価値の良い上位n個までの評価値を持つ状態を各々初期の着目状態とし、上記第1の距離より小さい距離の第2の距離を有する隣接状態の中から遷移する状態を決定して次の着目状態とすることを順次繰り返すことにより、上記評価値の良い上位n個までの評価値を持つ状態を各々初期の着目状態とする所定の探索回数での探索における各々の最良の評価値を持つ局所最良状態を探索する第2の工程と、
    上記複数の局所最良状態の中から、最良の評価値を持つ状態を選択し、上記最良状態として抽出する第3の工程とを備えたことを特徴とする状態空間の探索方法。
  2. 上記第1の工程において、上記遷移する状態の評価値が上記最良状態を決定するために予め設定されている評価値であることを探索すると当該遷移する状態を上記最良状態として抽出することを特徴とする請求項1に記載の状態空間の探索方法。
  3. 上記第2の工程において、上記遷移する状態の評価値が上記最良状態を決定するために予め設定されている評価値であることを探索すると当該遷移する状態を上記最良状態として抽出することを特徴とする請求項1または請求項2に記載の状態空間の探索方法。
  4. 複数の要素の組合せを表す状態の集まりである状態空間の中から最良状態を探索する状態空間の探索装置において、
    上記状態空間の中における指定された着目状態から出発し、第1の距離を有する隣接状態の中から遷移する状態を決定して次の着目状態とすることを順次繰り返し、所定の探索回数の遷移を繰り返した後に、着目状態とした状態の中でその評価値の良い上位n個までの評価値を持つ状態を出力する第1の探索手段と、
    上記第1の探索手段にて探索された上記評価値の良い上位n個の評価値の状態を格納するベストnデータベースと、
    上記評価値の良い上位n個までの評価値を持つ状態を各々初期の着目状態とし、上記第1の距離より小さい距離の第2の距離を有する隣接状態の中から遷移する状態を決定して次の着目状態とすることを順次繰り返すことにより、上記評価値の良い上位n個までの評価値を持つ状態を各々初期の着目状態とする所定の探索回数での探索における各々の最良の評価値を持つ局所最良状態を探索する第2の探索手段と、
    上記第2の探索手段により探索された複数の局所最良状態を格納する局所最良状態データベースと、
    上記複数の局所最良状態の中から、最良の評価値を持つ状態を選択し、上記最良状態として抽出する第3の探索手段とを備えたことを特徴とする状態空間の探索装置。
  5. 上記第1の探索手段は、上記遷移する状態の評価値が上記最良状態を決定するために予め設定されている評価値であるとことを探索すると当該遷移する状態を上記最良状態として抽出することを特徴とする請求項4に記載の状態空間の探索装置。
  6. 上記第2の探索手段は、上記遷移する状態の評価値が上記最良状態を決定するために予め設定されている評価値であることを探索すると当該遷移する状態を上記最良状態として抽出することを特徴とする請求項4または請求項5に記載の状態空間の探索装置。
  7. 上記第1の探索手段は、複数CPUを有し、上記隣接状態の探索を上記各CPUに振り分けて行うことを特徴とする請求項4ないし請求項6のいずれか1項に記載の状態空間の探索装置。
  8. 上記第2の探索手段は、複数CPUを有し、上記評価値の良い上位n個までの評価値の探索を上記各CPUに振り分けて行うことを特徴とする請求項4ないし請求項7のいずれか1項に記載の状態空間の探索装置。
JP2008186753A 2008-07-18 2008-07-18 状態空間の探索方法および状態空間の探索装置 Pending JP2010026751A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008186753A JP2010026751A (ja) 2008-07-18 2008-07-18 状態空間の探索方法および状態空間の探索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008186753A JP2010026751A (ja) 2008-07-18 2008-07-18 状態空間の探索方法および状態空間の探索装置

Publications (1)

Publication Number Publication Date
JP2010026751A true JP2010026751A (ja) 2010-02-04

Family

ID=41732535

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008186753A Pending JP2010026751A (ja) 2008-07-18 2008-07-18 状態空間の探索方法および状態空間の探索装置

Country Status (1)

Country Link
JP (1) JP2010026751A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020140345A (ja) * 2019-02-27 2020-09-03 国立大学法人 名古屋工業大学 パラメータ探索方法、パラメータ探索用データ構造、パラメータ調整システム、コンピュータプログラム及び制御システム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07219920A (ja) * 1994-01-31 1995-08-18 Nippon Steel Corp 最適化問題解決処理方法および装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07219920A (ja) * 1994-01-31 1995-08-18 Nippon Steel Corp 最適化問題解決処理方法および装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020140345A (ja) * 2019-02-27 2020-09-03 国立大学法人 名古屋工業大学 パラメータ探索方法、パラメータ探索用データ構造、パラメータ調整システム、コンピュータプログラム及び制御システム
JP7470318B2 (ja) 2019-02-27 2024-04-18 国立大学法人 名古屋工業大学 パラメータ探索方法、パラメータ探索用データ構造、パラメータ調整システム、コンピュータプログラム及び制御システム

Similar Documents

Publication Publication Date Title
Knuth “Breakthroughs” for a green economy? Financialization and clean energy transition
Gonçalves et al. An extended Akers graphical method with a biased random‐key genetic algorithm for job‐shop scheduling
Tran et al. Opposition multiple objective symbiotic organisms search (OMOSOS) for time, cost, quality and work continuity tradeoff in repetitive projects
Goncharov et al. Genetic algorithm for the resource-constrained project scheduling problem
Steiner et al. Computing all efficient solutions of the biobjective minimum spanning tree problem
Koulinas et al. Construction resource allocation and leveling using a threshold accepting–based hyperheuristic algorithm
JP2009048353A (ja) 組み合わせ最適化システム
CN104346434A (zh) 用于数据可视化的方法、设备和系统以及相关应用
Schaus et al. Solving steel mill slab problems with constraint-based techniques: CP, LNS, and CBLS
Li et al. Scheduling policies for the stochastic resource leveling problem
JP2005304118A (ja) 分散型エネルギーシステムの制御装置および制御方法
CN104954263B (zh) 一种复杂网络目标节点的搜索方法及装置
Anagnostopoulos et al. A genetic hyperheuristic algorithm for the resource constrained project scheduling problem
CN106533979B (zh) 一种网络更新方法及装置
JP2010026751A (ja) 状態空間の探索方法および状態空間の探索装置
CN109359760B (zh) 一种物流路径优化方法、装置及服务器
JP2006039838A (ja) 水系の発電運用計画作成支援装置
Gunawan et al. Well-tuned ILS for extended team orienteering problem with time windows
CN101894063B (zh) 一种用于微处理器功能验证的测试程序生成方法及装置
Gonçalves et al. A biased random-key genetic algorithm for job-shop scheduling
Pan et al. A polyhedral study on fuel-constrained unit commitment
JP2013030019A (ja) 生産計画立案装置、生産計画立案方法および生産計画立案プログラム
EP3157209B1 (en) Route search apparatus and route search method
CN102750265A (zh) 一种数据替换的方法及装置
JP2006072820A (ja) 組合せ最適化問題の解析装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120131

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120612