JP2021124978A

JP2021124978A - 情報処理装置、プログラム、情報処理方法および情報処理システム

Info

Publication number: JP2021124978A
Application number: JP2020018245A
Authority: JP
Inventors: 悟半田; Satoru Handa; マチューパリジ; Matthew Parisi; 英俊松岡; Hidetoshi Matsuoka
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2020-02-05
Filing date: 2020-02-05
Publication date: 2021-08-30
Also published as: CN113298284A; EP3862936A1; US20210239481A1

Abstract

【課題】求解の実行回数を低減すること。
【解決手段】処理部１１は、巡回主体が複数の拠点ノードを巡回するための複数のルートであって、デポノードを各ルートの起点および終点とする複数のルートを求める組合せ最適化問題に関して、１のルートに割り当てる拠点ノードの最大数を取得する。処理部１１は、最大数に基づいて組合せ最適化問題の定式化に用いる状態変数の数を決定する。処理部１１は、決定した数の状態変数に対して、各ルートにおいて拠点ノードからデポノードへ巡回主体が移動した後には同一ルート内での複数の拠点ノードそれぞれへの巡回主体の移動を制限することを示す制約項３２を含む目的関数３０の情報を生成する。出力部１２は、目的関数３０に含まれる状態変数の組により表される基底状態を探索する探索部２０に、生成した目的関数３０の情報を出力する。
【選択図】図１

Description

本発明は情報処理装置、プログラム、情報処理方法および情報処理システムに関する。

組合せ最適化問題を解くために、問題を目的関数に変換して目的関数に含まれる状態変数の値の組合せのうち、目的関数を最小化または最大化する組合せを探索することが行われる。目的関数を最小化または最大化する状態変数の値の組合せは、状態変数の組により表される基底状態または最適解に相当する。実用的な時間で組合せ最適化問題の近似解を得る手法として、シミュレーテッドアニーリング（ＳＡ：Simulated Annealing）法やレプリカ交換法などのマルコフ連鎖モンテカルロ法がある。

組合せ最適化問題の実用的な問題の一例として、配送計画問題（ＶＲＰ：Vehicle Routing Problem）が挙げられる。ＶＲＰでは、デポ（Ｄｅｐｏｔ）と呼ばれる特定の場所に待機する運搬車などの巡回主体が、顧客位置などの拠点に需要を運搬し、または拠点の需要を収集し、再びデポに戻るための複数のルートを、コストを最小化するように求めることがある。

例えば、配送問題をエネルギー関数に帰着させ、エネルギー関数をＳＡ法により最小化して最適な配車と配送順序を探索する探索装置の提案がある。
また、複数の地点を任意の分割数Ｎで分割した分割グループごとに当該分割グループ内の地点を巡回する分割巡回経路を探索するシステムの提案がある。提案のシステムは、遺伝アルゴリズムおよびＳＡ法を併用して、各分割グループ内の各地点を巡回する分割巡回経路のコストがほぼ均等になるように、同時に各分割巡回経路を探索する。

なお、届先へ配送対象物品を配送許容時間内に配送でき、且つ、物流施設数がより少なくて足りるように物流施設の立地を決めるコンピュータシステムの提案がある。

特開平７−１７５５０４号公報特開２００７−２４１３４０号公報特開２００４−２７２６１５号公報

ＳＡ法などによりＶＲＰを解くために、例えば問題に課される制約条件に基づき、各ルートで訪問する拠点数の有り得る組合せを、予め複数個決定しておくことが考えられる。当該組合せは、例えば運搬車の最大積載量の制約と各拠点に運搬する荷物の重量との関係などから求められ、当該組合せに属する拠点数の合計は訪問対象の全拠点数に一致する。

この場合、得られた複数の組合せに対応する複数の目的関数それぞれに対して、コンピュータなどによりＳＡ法などを用いた求解が行われ、複数の目的関数に対して得られた複数の解のうち最も良い解が最終的な解として選択される。しかし、複数の目的関数の数に対応する回数だけ求解を行うことになる。このため、各ルートで訪問する拠点数の有り得る組合せの数が増えるほど、求解の実行回数が増えるという問題がある。

１つの側面では、本発明は、求解の実行回数を低減できる情報処理装置、プログラム、情報処理方法および情報処理システムを提供することを目的とする。

１つの態様では、情報処理装置が提供される。この情報処理装置は、処理部と出力部とを有する。処理部は、巡回主体が複数の拠点ノードを巡回するための複数のルートであって、デポノードを各ルートの起点および終点とする複数のルートを求める組合せ最適化問題に関して、１のルートに割り当てる拠点ノードの最大数を取得し、最大数に基づいて組合せ最適化問題の定式化に用いる状態変数の数を決定し、決定した数の状態変数に対して、各ルートにおいて拠点ノードからデポノードへ巡回主体が移動した後には同一ルート内での複数の拠点ノードそれぞれへの巡回主体の移動を制限することを示す制約項を含む目的関数の情報を生成する。出力部は、目的関数に含まれる状態変数の組により表される基底状態を探索する探索部に、生成した目的関数の情報を出力する。

また、１つの態様では、プログラムが提供される。
また、１つの態様では、情報処理方法が提供される。
また、１つの態様では、情報処理システムが提供される。

１つの側面では、求解の実行回数を低減できる。

第１の実施の形態の情報処理装置の処理例を示す図である。第２の実施の形態の情報処理システムのハードウェア例を示す図である。ルートの例を示す図である。情報処理装置の機能例を示す図である。最適化装置によるビットフリップ制御例を示す図である。情報処理システムの第１の処理例を示すフローチャートである。情報処理システムの第２の処理例を示すフローチャートである。各ルートの最大拠点ノード数決定例（その１）を示す図である。各ルートの最大拠点ノード数決定例（その２）を示す図である。各ルートの最大拠点ノード数決定例（その３）を示す図である。各ルートの最大拠点ノード数決定例（その４）を示す図である。ルートの計算例（その１）を示す図である。イタレーション数と正解レプリカ数との関係の第１の例を示す図である。イタレーション数と正解レプリカ数との関係の第２の例を示す図である。ルートの計算例（その２）を示す図である。比較例を示すフローチャートである。

以下、本実施の形態について図面を参照して説明する。
［第１の実施の形態］
第１の実施の形態を説明する。

図１は、第１の実施の形態の情報処理装置の処理例を示す図である。
情報処理装置１０は、組合せ最適化問題に対応する目的関数の情報を生成し、生成した目的関数の情報を出力する。組合せ最適化問題は、バイナリ変数の二次形式によって定式化される。目的関数は、イジングモデルのエネルギーを表し、エネルギー関数や評価関数とも呼ばれる。組合せ最適化問題の一例としてＣＶＲＰ（Capacitated VRP）がある。

ＣＶＲＰは、巡回主体が複数の拠点ノードを巡回するための複数のルートを求める組合せ最適化問題であり、巡回主体に対して容量に関する制約が設けられる。容量は、重量、体積または面積などにより定められる。容量に関する制約の一例として、トラックにおける最大積載量が挙げられる。拠点ノードには、拠点ノードへ運搬する荷物の重量、または、拠点ノードで回収する荷物の重量などの需要量が対応付けられる。また、各ルートの起点および終点はデポノードである。複数のルートの数は、例えば巡回主体の数によって決定される。例えば巡回主体として４台のトラックを利用できる場合、ルート数は「４」である。各ルートでは少なくとも１つの拠点ノードが訪問される。

情報処理装置１０は、処理部１１および出力部１２を有する。
処理部１１は、１のルートに割り当てる拠点ノードの最大数を取得する。処理部１１は、ユーザにより情報処理装置１０に入力された当該最大数を取得してもよいし、巡回主体の容量と各拠点ノードの需要量とに基づいて当該最大数を計算してもよい。

処理部１１は、取得した最大数に基づいて組合せ最適化問題の定式化に用いる状態変数の数を決定する。後述される目的関数の性質により、各ルートに割り当てる最大拠点ノード数の合計が、巡回すべき全拠点ノード数よりも大きくなることが許容される。最大拠点ノード数は、特定のルートに割り当てる最大の拠点ノード数を示す。

処理部１１は、少なくとも１つのルートにおいて、最大拠点ノード数が、取得した最大数となるようにし、他のルートでは最大拠点ノード数が当該最大数以下になるようにする。例えば、巡回対象の全拠点ノード数が「１２」の場合に、各ルートに割り当てる最大拠点ノード数の合計を「１３」以上にすることができる。一例として、処理部１１は、複数のルートに割り当てる複数の最大拠点ノード数を一律に、取得した上記最大数として、組合せ最適化問題の定式化に用いる状態変数の数を決定してもよい。

処理部１１は、決定した数の状態変数に対して、目的関数３０の情報を生成する。目的関数３０における状態変数は、例えば０または１の値を取るバイナリ変数であり、ビット変数などと呼ばれてもよい。複数の状態変数の値によりイジングモデルの状態が表される。複数の状態変数の値の組は状態ベクトルと呼ばれることがある。

目的関数３０は、コスト項３１および制約項３２を含む。
コスト項３１は、巡回主体が拠点ノードを巡回する際のコストを示す。コストは、最小化したい値であり、例えば、総移動距離や総移動費用などである。

制約項３２は、各ルートにおいて拠点ノードからデポノードへ巡回主体が移動した後には同一ルート内での複数の拠点ノードそれぞれへの巡回主体の移動を制限することを示す。制約項３２は、各ルートでデポノードに帰還後、デポノードから何れかの拠点ノードへ巡回主体が移動することを表す状態変数の値の変化に対して比較的大きなペナルティ値を目的関数に加算する項として表される。

なお、目的関数３０は、例えば巡回主体の容量に関する制約項など、制約項３２以外の制約項を含んでもよい。
出力部１２は、目的関数３０に含まれる状態変数の組により表される基底状態を探索する探索部２０に、生成した目的関数３０の情報を出力する。探索部２０は、目的関数３０に基づいて、ＳＡ法、レプリカ交換法および量子アニーリング法などにより基底状態の探索を行う。

例えば、拠点ノードｎ１，ｎ２，…をルートＲ１，Ｒ２を含む複数のルートにより巡回することを考える。ルートＲ１，Ｒ２それぞれの起点および終点はデポノードｄ１である。処理部１１は、１のルートに割り当てる拠点ノード数の最大数として、例えば「６」を取得する。この場合、処理部１１は、取得した拠点ノードの最大数「６」を１番目のルートＲ１の第１の最大拠点ノード数として割り当てる。また、処理部１１は、当該第１の最大拠点ノード数以下の第２の最大拠点ノード数として、例えば「５」を２番目のルートＲ２に割り当てる。

ルートＲ１で回る拠点ノードが拠点ノードｎ１，ｎ２，ｎ３，ｎ４のように４つ決定され、拠点ノードｎ４からデポノードｄ１に戻ることを示す状態が探索部２０で生成されることを考える。このとき、ルートＲ１に割り当てられた第１の最大拠点ノード数に対する残りの拠点ノード数「２」（＝６−４）がある。しかし、探索部２０では、制約項３２により、ルートＲ１において、巡回主体が拠点ノードｎ４からデポノードｄ１に戻った後にデポノードｄ１から他の拠点ノードへ移動することを示す状態の生成が制限される。

また、ルートＲ２で回る拠点ノードが拠点ノードｎ５，ｎ６，ｎ７のように３つ決定され、拠点ノードｎ７からデポノードｄ１に戻ることを示す状態が探索部２０で生成されることを考える。このとき、ルートＲ２に割り当てられた第２の最大拠点ノード数に対する残りの拠点ノード数「２」（＝５−３）がある。しかし、探索部２０では、制約項３２により、ルートＲ２において、巡回主体が拠点ノードｎ７からデポノードｄ１に戻った後にデポノードｄ１から他の拠点ノードへ移動することを示す状態の生成が制限される。

情報処理装置１０によれば、求解の実行回数を低減できる。
ここで、問題に課される制約条件に基づき、各ルートで回る拠点ノード数の有り得る組合せを予め複数個決定しておくことが考えられる。有り得る組合せでは、各ルートで回る拠点ノード数が固定的に決定されており、各ルートで回る拠点ノード数の全ルートでの合計は、訪問対象の全拠点ノード数に一致する。

例えば、全拠点ノード数が「１２」でルート数が「４」の場合に、各ルートで回る拠点ノード数の有り得る組合せが、巡回主体の容量と各拠点ノードの需要量に対し、第１の組合せ（４，４，３，１）、第２の組合せ（４，４，２，２）、…のようにＮ（Ｎは２以上の整数）個決定され得る。この場合、Ｎ個の組合せに対してＮ個の目的関数を生成し、目的関数ごとに探索部２０による解探索を実行し、Ｎ個の目的関数に対して得られた解のうち最も良い解を最終的な解として採用することになる。ここで、求解とは、１つの目的関数について、ある初期状態から開始して解を得るまでの一連のプロセスに相当する。しかし、この方法では、各ルートで回る拠点ノード数の有り得る組合せの数が増すほど、解くべき目的関数の数が増え、探索部２０による求解の実行回数が増える。

一方、情報処理装置１０では、制約項３２を含む目的関数３０を生成する。制約項３２により、各ルートに割り当てる最大拠点ノード数の合計が、巡回すべき全拠点ノード数よりも大きくなることが許容される。制約項３２によって、探索部２０においてルート数が増加するような状態の生成を制限できるためである。このため、上記のＮ個の目的関数を、Ｎ個よりも少ない数の目的関数に集約して表すことができる。例えば、１つの目的関数で表す場合、Ｎ個の目的関数を用いる場合に比べて、求解の実行回数を１／Ｎに減らすことができる。

一例として、全拠点ノード数が「１２」、ルート数が「４」の場合に、処理部１１は、１のノードに割り当てる拠点ノードの最大数として「５」を取得したとする。このとき、処理部１１は、各ルートに割り当てる拠点ノード数の組合せを（５，５，５，５）のように決めて、目的関数における状態変数の数を決定してもよい。例えば、制約項３２を用いることで、上記のＮ個の組合せ（４，４，３，１）、（４，４，２，２）、…に対応するＮ個の目的関数に代えて、組合せ（５，５，５，５）に応じた数の状態変数に関する１つの目的関数３０で問題を定式化できる。

処理部１１は、目的関数３０に基づいて得られた解を探索部２０から取得し、取得した解において、あるルートで最大拠点ノード数に達せずにデポノードに帰還したことを、当該ルートの終点に達したものとみなす。すると、当該１つの目的関数３０により生成され得る解は、Ｎ個の組合せ（４，４，３，１）、（４，４，２，２）、…に対するＮ個の目的関数で生成され得る解を全て包含する。こうして、解探索に用いる目的関数の数を減らすことができ、当該目的関数を用いた求解の実行回数を低減できる。

なお、処理部１１は、目的関数３０の状態変数の数がより少なくなるように、複数のルートに割り当てる複数の最大拠点ノード数を決定することで、探索部２０による解探索を効率化してもよい。また、処理部１１は、探索部２０による探索機能の特性に応じて、ダミーのデポノードの数を増やすように目的関数３０の状態変数の数を調整し、解探索を高速化してもよい。

処理部１１は、ＣＰＵ（Central Processing Unit）、ＤＳＰ（Digital Signal Processor）、ＡＳＩＣ（Application Specific Integrated Circuit）、ＦＰＧＡ（Field Programmable Gate Array）などにより実現される。処理部１１はプログラムを実行するプロセッサであってもよい。ここでいう「プロセッサ」には、複数のプロセッサの集合（マルチプロセッサ）も含まれ得る。

探索部２０は、デジタル回路を用いてＳＡ法やレプリカ交換法などを実行するハードウェアにより実現されてもよいし、量子アニーリングを行うハードウェアにより実現されてもよい。また、探索部２０は、情報処理装置１０が有するＣＰＵなどのプロセッサにより実現されてもよい。

出力部１２は、探索部２０内のメモリあるいは探索部２０が参照する情報処理装置１０内のメモリに対するＩＯ（Input/Output）を行うＩＯインタフェースにより実現される。探索部２０がネットワークを介して接続された他の装置により実現される場合、出力部１２は、ＮＩＣ（Network Interface Card）などの通信インタフェースにより実現されてもよい。

［第２の実施の形態］
次に、第２の実施の形態を説明する。
図２は、第２の実施の形態の情報処理システムのハードウェア例を示す図である。

情報処理システム５０は、情報処理装置１００および最適化装置２００を有する。
情報処理装置１００は、組合せ最適化問題を定式化することで、組合せ最適化問題に対応する目的関数の情報を生成し、生成した目的関数の情報を最適化装置２００に入力する。情報処理装置１００は、ＣＰＵ１０１、ＲＡＭ（Random Access Memory）１０２、ＨＤＤ（Hard Disk Drive）１０３、ＩＯインタフェース１０４、画像信号処理部１０５、入力信号処理部１０６、媒体リーダ１０７およびＮＩＣ１０８を有する。ＣＰＵ１０１は、第１の実施の形態の処理部１１に対応する。ＩＯインタフェース１０４は、第１の実施の形態の出力部１２に対応する。

ＣＰＵ１０１は、プログラムの命令を実行するプロセッサである。ＣＰＵ１０１は、ＨＤＤ１０３に記憶されたプログラムやデータの少なくとも一部をＲＡＭ１０２にロードし、プログラムを実行する。なお、ＣＰＵ１０１は複数のプロセッサコアを含んでもよい。また、情報処理装置１００は複数のプロセッサを有してもよい。複数のプロセッサの集合を「マルチプロセッサ」または単に「プロセッサ」と言うことがある。

ＲＡＭ１０２は、ＣＰＵ１０１が実行するプログラムやＣＰＵ１０１が演算に用いるデータを一時的に記憶する揮発性の半導体メモリである。なお、情報処理装置１００は、ＲＡＭ以外の種類のメモリを備えてもよく、複数個のメモリを備えてもよい。

ＨＤＤ１０３は、ＯＳ（Operating System）やミドルウェアやアプリケーションソフトウェアなどのソフトウェアのプログラム、および、データを記憶する不揮発性の記憶装置である。なお、情報処理装置１００は、フラッシュメモリやＳＳＤ（Solid State Drive）などの他の種類の記憶装置を備えてもよく、複数の不揮発性の記憶装置を備えてもよい。

ＩＯインタフェース１０４は、最適化装置２００と接続され、ＣＰＵ１０１からの命令に従って、最適化装置２００に対するデータの入出力を行う。例えば、ＩＯインタフェース１０４は、ＣＰＵ１０１の命令に応じて、ＲＡＭ１０２のデータを最適化装置２００のレジスタまたはメモリに書き込んだり、最適化装置２００からデータを読み出して、ＲＡＭ１０２に書き込んだりする。ＩＯインタフェース１０４としては、例えば、ＰＣＩ−ｅ（Peripheral Component Interconnect - Express）などが用いられる。

画像信号処理部１０５は、ＣＰＵ１０１からの命令に従って、情報処理装置１００に接続されたディスプレイ１１１に画像を出力する。ディスプレイ１１１としては、ＣＲＴ（Cathode Ray Tube）ディスプレイ、液晶ディスプレイ（ＬＣＤ：Liquid Crystal Display）、プラズマディスプレイ、有機ＥＬ（ＯＥＬ：Organic Electro-Luminescence）ディスプレイなど、任意の種類のディスプレイを用いることができる。

入力信号処理部１０６は、情報処理装置１００に接続された入力デバイス１１２から入力信号を取得し、ＣＰＵ１０１に出力する。入力デバイス１１２としては、マウス・タッチパネル・タッチパッド・トラックボールなどのポインティングデバイス、キーボード、リモートコントローラ、ボタンスイッチなどを用いることができる。また、情報処理装置１００に、複数の種類の入力デバイスが接続されていてもよい。

媒体リーダ１０７は、記録媒体１１３に記録されたプログラムやデータを読み取る読み取り装置である。記録媒体１１３として、例えば、磁気ディスク、光ディスク、光磁気ディスク（ＭＯ：Magneto-Optical disk）、半導体メモリなどを使用できる。磁気ディスクには、フレキシブルディスク（ＦＤ：Flexible Disk）やＨＤＤが含まれる。光ディスクには、ＣＤ（Compact Disc）やＤＶＤ（Digital Versatile Disc）が含まれる。

媒体リーダ１０７は、例えば、記録媒体１１３から読み取ったプログラムやデータを、ＲＡＭ１０２やＨＤＤ１０３などの他の記録媒体にコピーする。読み取られたプログラムは、例えば、ＣＰＵ１０１によって実行される。なお、記録媒体１１３は可搬型記録媒体であってもよく、プログラムやデータの配布に用いられることがある。また、記録媒体１１３やＨＤＤ１０３を、コンピュータ読み取り可能な記録媒体と言うことがある。

ＮＩＣ１０８は、ネットワーク３００に接続され、ネットワーク３００を介して他のコンピュータと通信を行うインタフェースである。ＮＩＣ１０８は、例えば、ネットワーク３００に含まれるスイッチやルータなどの通信装置とケーブルで接続される。

最適化装置２００は、目的関数の情報に基づいて、ＳＡ法やレプリカ交換法による基底状態探索をハードウェアにより行うアクセラレータである。最適化装置２００は、イジングマシン、イジング最適化装置などと呼ばれてもよい。また、最適化装置２００は、量子アニーリング法により基底状態探索を行うハードウェアでもよい。最適化装置２００は、第１の実施の形態の探索部２０の一例である。ただし、最適化装置２００に代えて、ＣＰＵ１０１が所定のソフトウェアを実行することで、ＳＡ法、レプリカ交換法あるいはＳＱＡ（Simulated Quantum Annealing）法などを実行する探索部２０の機能を実現することもできる。

第２の実施の形態では、組合せ最適化問題の一例としてＣＶＲＰを挙げる。ＣＶＲＰの標準的な問題の例として、Ｅ−ｎ１３ｋ４がある。Ｅ−ｎ１３ｋ４の表記について、「ｎ１３」における「１３」は、１つのデポと１２個の拠点とが存在することを示す。また、「ｋ４」における「４」は、巡回主体である車両の数が４台であることを示す。１つの車両に対して１つのルートが対応付けられるので、ルート数は４である。以下の説明において、車両は、トラックであるとする。

図３は、ルートの例を示す図である。
デポノード６０は、ルートの起点および終点となるデポを表すノードである。拠点ノード６１，６２，６３，６４は、顧客位置などの拠点を表すノードである。ルートＲ１０は、デポノード６０および拠点ノード６１，６２，６３，６４を結ぶ１つのルートの例である。図３では、デポノード６０およびその他の拠点ノードを結ぶ他の３つのルートも示されている。１つのルートには、１以上の拠点が属する。

各拠点をインデックスｊで表す。拠点ｊの需要量をｄ_ｊとする。需要量は、運搬対象、または、収集対象の荷物の重量である。ＣＶＲＰでは、巡回主体であるトラックに対して最大積載量の制約が課される。各トラックの最大積載量は同じであるとする。トラックの最大積載量をＱと表す。ＣＶＲＰでは、各拠点間のコストが与えられており、コストの合計を最小化するように複数のルートを決める。なお、需要量として、荷物の体積や面積など、トラックが配送する荷物の重量以外の条件を考慮してもよい。また、コストとしては、移動距離、移動費用および移動時間などが考えられる。

ＣＶＲＰでは次の制約条件がある。（制約条件Ａ）１つのルートに属する需要量ｄ_ｊの合計値は最大積載量Ｑ以下である。（制約条件Ｂ）全ての時刻において、トラックは、同時刻に１つの拠点またはデポを訪問する。（制約条件Ｃ）全ての拠点は、トラックによって１回だけ訪問される。（制約条件Ｄ）各ルートの起点および終点はデポである。

図４は、情報処理装置の機能例を示す図である。
情報処理装置１００は、記憶部１２０、ノード数計算部１３０、定式化部１４０、ルート計算部１５０を有する。記憶部１２０は、ＲＡＭ１０２またはＨＤＤ１０３の記憶領域により実現される。ノード数計算部１３０、定式化部１４０およびルート計算部１５０は、ＣＰＵ１０１により実現される。

記憶部１２０は、ノード数計算部１３０、定式化部１４０およびルート計算部１５０の処理に用いられるデータを記憶する。
ノード数計算部１３０は、入力されたインスタンス情報に基づいて、各ルートに割り当てる最大拠点ノード数、すなわち、最大拠点数を決定する。インスタンス情報は、ＣＶＲＰにおけるトラックの最大積載量、各拠点の需要量、ルート数（すなわち、トラックの配車数）、拠点数および拠点間のコストなどの問題の内容を表す情報である。後述される目的関数の性質により、各ルートに割り当てる最大拠点ノード数の全ルートでの合計が、全拠点ノード数よりも大きくなることが許容される。

定式化部１４０は、ノード数計算部１３０により決定された各ルートに割り当てる最大拠点ノード数に基づいて、ＣＶＲＰの定式化に用いる状態変数の数を決定する。定式化部１４０は、決定した数の状態変数を用いて、与えられたインスタンス情報から目的関数の情報を生成する。目的関数は、種々の制約項を含み得る。制約項は、ペナルティ項と呼ばれることもある。目的関数の情報は、例えば、目的関数に含まれる変数間の重み係数、バイアス値および定数を含むファイルとして生成される。定式化部１４０は、生成した目的関数の情報を、最適化装置２００に出力し、最適化装置２００により目的関数に基づく基底状態の探索を実行させる。

ルート計算部１５０は、最適化装置２００から基底状態の探索結果を解として取得する。最適化装置２００から得られた解はビット列として得られる。ルート計算部１５０は、当該ビット列を、図３のようなルートを表す画像や拠点名をルートごとに巡回順に並べた画像など、ユーザに分かり易い形式の情報に変換し、変換後の情報を出力する。例えば、ルート計算部１５０は、当該変換により生成した画像などの情報を、ディスプレイ１１１に表示したり、ネットワーク３００を介して、他のコンピュータに送信したりする。

ここで、最適化装置２００は、目的関数に基づいて、ＳＡ法やレプリカ交換法による基底状態の探索を行う。
イジング型の目的関数Ｅ（ｘ）は、例えば以下の式（１）で定義される。なお、数式中、複数の状態変数により表される状態、あるいは状態ベクトルを添え字無しの「ｘ」で表す。

式（１）の右辺第１項は、全状態変数から選択可能な２つの状態変数の全組合せについて、漏れと重複なく、２つの状態変数の値と結合係数との積を積算したものである。ｘ_ｉは、ｉ番目の状態変数である。ｘ_ｊは、ｊ番目の状態変数である。結合係数Ｗ_ｉｊは、ｉ番目の状態変数とｊ番目の状態変数との間の結合の強さ、あるいは、重みを示す。なお、行列Ｗ＝｛Ｗ_ｉｊ｝について、Ｗ_ｉｊ＝Ｗ_ｊｉ、Ｗ_ｉｉ＝０であることが多い。状態変数ｘ_ｉなどの変数に付加される添え字ｉは、当該変数の識別情報であり、インデックスと呼ばれる。

式（１）の右辺第２項は、全状態変数のそれぞれのバイアス値と状態変数の値との積の総和である。ｂ_ｉは、ｉ番目の状態変数に対するバイアス値を示す。
例えば、イジングモデルにおけるスピンの「−１」は、状態変数の値「０」に対応する。イジングモデルにおけるスピンの「＋１」は、状態変数の値「１」に対応する。上記のＣＶＲＰで言えば、状態変数をある時点における拠点またはデポに対応付けることができ、該当の拠点またはデポを訪問しないことを状態変数の値「０」に、訪問することを状態変数の値「１」にそれぞれ対応付けることができる。

状態変数ｘ_ｉの値が変化して１−ｘ_ｉとなると、状態変数ｘ_ｉの増加分は、δｘ_ｉ＝（１−ｘ_ｉ）−ｘ_ｉ＝１−２ｘ_ｉと表せる。したがって、目的関数Ｅ（ｘ）に対して、状態変数ｘ_ｉの変化に伴うエネルギー変化ΔＥ_ｉは、式（２）で表される。

ｈ_ｉは局所場（ローカルフィールド）と呼ばれ、式（３）で表される。

状態変数ｘ_ｊが変化したときの局所場ｈ_ｉの変化分δｈ_ｉ ^（ｊ）は、式（４）で表される。

最適化装置２００は、局所場ｈ_ｉを保持し、状態変数ｘ_ｊの値が変化したときに変化分δｈ_ｉ ^（ｊ）をｈ_ｉに加算することで、ビット反転後の状態に対応するｈ_ｉを得る。
最適化装置２００では、基底状態の探索において、エネルギー変化がΔＥ_ｉとなる状態遷移（状態変数ｘ_ｉの値の変化）を許容するか否かを決定するためにメトロポリス法やギブス法が用いられる。すなわち、最適化装置２００は、ある状態から当該状態よりもエネルギーの低い他の状態への遷移を探索する近傍探索において、エネルギーが下がる状態だけでなく、エネルギーが上がる状態への遷移を確率的に許容する。例えば、エネルギー変化ΔＥの状態変数の値の変化を受け入れる確率Ａは、式（５）で表される。

逆温度βは温度Ｔの逆数（β＝１／Ｔ）である。ｍｉｎ演算子は、引数のうちの最小値を取ることを示す。したがって、例えば、メトロポリス法を用いる場合、一様乱数ｕ（０＜ｕ≦１）に対して、エネルギー変化ΔＥが式（６）を満たす場合に、該当の状態変数の値の変化が許容される。

最適化装置２００が利用する温度のプロファイル情報は、問題に応じて、情報処理装置１００により最適化装置２００に設定され得る。
最適化装置２００では、演算の高速化を図るため、状態変数の値の変化、すなわちビットフリップを次のように制御することがある。

図５は、最適化装置によるビットフリップ制御例を示す図である。
マルコフ連鎖モンテカルロ法を用いる場合、式（７）のように状態変数ｘ_ｉを１つずつフリップさせることが考えられる。ｉはフリップさせる状態変数を示すインデックスである。エネルギー変化ΔＥ_ｉは、式（８）で表される。状態変数ｘ_ｍに対応する局所場の変化Δｈ_ｍは、式（９）で表される。ｍは任意の状態変数を示すインデックスである。

ここで、組合せ最適化問題では、１−Ｈｏｔ制約と呼ばれる制約条件が課されることがある。１−Ｈｏｔ制約とは、「ある状態変数の組の中で、値が１の変数は１個だけである」という制約である。例えば、図５では、ｎ^２個（ｎは２以上の整数）の状態変数ｘ_１，ｘ_２，…，が、ｎ行ｎ列で示されている。ただし、（状態変数の数）≠ｎ^２でもよい。グループｇ１１，ｇ１２は、行に対応する状態変数のグループの例を示す。グループｇ２１，ｇ２２は、列に対応する状態変数のグループの例を示す。

各行に対応する状態変数のグループに１−Ｈｏｔ制約を課す場合、各行の状態変数の和は１である。例えば、グループｇ１１に属する状態変数の和は１である。また、グループｇ１２に属する状態変数の和は１である。あるいは、各列に対応する状態変数のグループに１−Ｈｏｔ制約を課す場合、各列の状態変数の和は１である。例えば、グループｇ２１に属する状態変数の和は１である。グループｇ２２に属する状態変数の和は１である。

１−Ｈｏｔ制約の第１の例として、「１つのトラックは、ある時刻に１つの拠点またはデポに滞在する」という制約が挙げられる。あるいは、１−Ｈｏｔ制約の第２の例として、「１つの拠点はトラックによって１回だけ訪問される」という制約が挙げられる。

１−Ｈｏｔ制約は、目的関数において、比較的エネルギーの高い状態として表される。このため、１つの状態変数の遷移、すなわち、１ビットフリップのみを繰り返していると、ある状態から、１−Ｈｏｔ制約を満たさない状態を経由する別の状態に遷移し難くなり、より良い解への到達可能性が低減する。そこで、最適化装置２００は、「１−Ｗａｙ１−Ｈｏｔ」（１Ｗ１Ｈと表記する）および「２−Ｗａｙ１−Ｈｏｔ」（２Ｗ１Ｈと表記する）と呼ばれるビットフリップ制御を行う。

１Ｗ１Ｈでは、１つの１−Ｈｏｔ制約を満たすように、１度に２つの状態変数の値を変化させる。すなわち、式（１０）のような２ビットフリップである。ｉ，ｊは、フリップさせる状態変数の組を示すインデックスの組である。エネルギー変化ΔＥ_ｊは、式（１１）で表される。状態変数ｘ_ｍに対応する局所場の変化Δｈ_ｍは、式（１２）で表される。

２Ｗ１Ｈでは、２つの１−Ｈｏｔ制約を満たすように、１度に４つの状態変数の値を変化させる。すなわち、式（１３）のような４ビットフリップである。ｉ，ｊ，ｋ，ｌは、フリップさせる状態変数の組を示すインデックスの組である。図５では、インデックスｉ，ｊ，ｋ，ｌに対応する状態変数の組の例が示されている。２Ｗ１Ｈは、状態変数の数がｎ^２であり、ｎ行の各行およびｎ列の各列でそれぞれ状態変数が、１−Ｈｏｔ制約が課されたグループとしてグループ化される場合に利用可能である。このときのエネルギー変化ΔＥ_ｊは、式（１４）で表される。状態変数ｘ_ｍに対応する局所場の変化Δｈ_ｍは、式（１５）で表される。

次に、情報処理システム５０の処理手順を説明する。まずは、第１の処理例として、１ビットフリップまたは１Ｗ１Ｈ（２ビットフリップ）による探索を行う場合を例示する。
図６は、情報処理システムの第１の処理例を示すフローチャートである。

（Ｓ１０）ノード数計算部１３０は、入力されたインスタンス情報に含まれる各拠点の需要量を小さい順に並べる。
（Ｓ１１）ノード数計算部１３０は、トラックの積載量を超えない最大拠点ノード数を１番目のルートの最大拠点ノード数とする。最大拠点ノード数は、該当のルートで回り得る拠点ノードの最大数である。

（Ｓ１２）ノード数計算部１３０は、Ｎ番目のルートの最大拠点ノード数を、累積需要量がＮＱを超えない最大の累積拠点数ｊをＮで割ったときの商とする。ノード数計算部１３０は、全てのルートに対して最大拠点ノード数を決定し、各ルートに対する最大拠点ノード数のパターンを生成する。このようにして最大拠点ノード数を決めると、Ｎ番目のルートで回る拠点ノード数は、Ｎ番目のルートに対応する最大拠点ノード数以下になる。また、１番目のルートの最大拠点ノード数は、Ｎ個のルートそれぞれに対する最大拠点ノード数のうちの最大値となる。

（Ｓ１３）定式化部１４０は、ステップＳ１２で得られたパターンで定式化する。すなわち、定式化部１４０は、当該パターンに基づいて状態変数の数を決定し、決定した数の状態変数に対してＣＶＲＰを定式化する。定式化部１４０は、定式化により目的関数の情報を生成する。定式化部１４０は、「各ルートにおいて拠点ノードからデポノードへトラックが移動した後には複数の拠点ノードそれぞれへの巡回主体の移動を制限する」ことを示す制約項を、目的関数に追加する。第１の処理例では、当該制約項は、「各ルートにおいて拠点ノードからデポノードへトラックが移動した後には当該ルート内ではデポノードに留まる」ことを示す制約項となる。目的関数の情報は、式（１）で表されるイジングモデルのＱＵＢＯ（Quadratic Unconstrained Binary Optimization）データであり、式（１）の｛Ｗ_ｉｊ｝、｛ｂ_ｉ｝および定数項の情報を含む。

なお、定式化部１４０は、１Ｗ１Ｈを用いる場合、各状態変数に、１−Ｈｏｔ制約の対象となるグループを示すラベルを付与する。例えば、定式化部１４０は、図５のグループｇ１１，ｇ１２のように、該当の状態変数が属するグループの識別情報をラベルとして状態変数に付与する。同一グループのラベルをもつ状態変数の間で、２ビットフリップが行われるように最適化装置２００に指定するためである。

（Ｓ１４）定式化部１４０は、目的関数の情報を最適化装置２００に出力し、当該目的関数の情報に基づいて、最適化装置２００による解探索を実行させる。なお、定式化部１４０が最適化装置２００に出力する情報には、目的関数の情報に加えて、上記のラベルの情報や探索の初期状態を示す情報などが含まれ得る。

最適化装置２００は、ＳＡ法やレプリカ交換法などによる解探索を実行し、解探索により得られた解をルート計算部１５０に出力する。ルート計算部１５０は、最適化装置２００から解を受信し、当該解をユーザにとって分かり易い形式に変換して、変換後の解の内容をディスプレイ１１１に表示させたり、他のコンピュータに送信したりする。

次に、第２の処理例として、２Ｗ１Ｈ（４ビットフリップ）による探索を行う場合を例示する。
図７は、情報処理システムの第２の処理例を示すフローチャートである。

（Ｓ２０）ノード数計算部１３０は、入力されたインスタンス情報に含まれる各拠点の需要量を小さい順に並べる。
（Ｓ２１）ノード数計算部１３０は、トラックの積載量を超えない最大拠点ノード数を１番目のルートの最大拠点ノード数とする。

（Ｓ２２）ノード数計算部１３０は、Ｎ番目のルートの最大拠点ノード数を累積需要量がＮＱを超えない最大の累積拠点数ｊをＮで割ったときの商とする。ノード数計算部１３０は、全てのルートに対して最大拠点ノード数を決定し、各ルートに対する最大拠点ノード数のパターンを生成する。

（Ｓ２３）定式化部１４０は、ステップＳ２２で得られた各ルートの最大拠点ノード数に応じてダミーデポをビットとして増やす。すなわち、定式化部１４０は、拠点ノードに対応する状態変数に加えて、状態変数の数が整数Ｍの２乗（Ｍ^２）になるように、ダミーデポと呼ばれるダミーのデポノードに対応する状態変数を追加する。ダミーデポは、何れもデポとして扱われる。ここで、整数Ｍは、各ルートの最大拠点ノード数の和である。

（Ｓ２４）定式化部１４０は、ステップＳ２２で得られたパターンで、ダミーデポ間の制約を考慮して定式化する。すなわち、定式化部１４０は、Ｍ^２個の状態変数に対してＣＶＲＰを定式化する。定式化部１４０は、定式化により目的関数の情報を生成する。定式化部１４０は、「各ルートにおいて拠点ノードからデポノードへトラックが移動した後には複数の拠点ノードそれぞれへの巡回主体の移動を制限する」ことを示す制約項を、目的関数に追加する。第２の処理例では、当該制約項は、「各ルートにおいて拠点ノードからダミーデポへトラックが移動した後には当該ルート内では別のダミーデポを巡回する」ことを示す制約項となる。目的関数の情報は、式（１）で表されるイジングモデルのＱＵＢＯデータであり、式（１）の｛Ｗ_ｉｊ｝、｛ｂ_ｉ｝および定数項の情報を含む。

また、定式化部１４０は、各状態変数に、１−Ｈｏｔ制約の対象となるグループを示すラベルを付与する。例えば、定式化部１４０は、図５のグループｇ１１，ｇ１２，ｇ２１，ｇ２２のように、該当の状態変数が属するグループの識別情報をラベルとして状態変数に付与する。同一グループのラベルをもつ状態変数の間で、２ビットフリップが行われることで、図５の行列方向の２ビットフリップの組合せにより４ビットフリップが行われるように最適化装置２００に指定するためである。

（Ｓ２５）定式化部１４０は、目的関数の情報を最適化装置２００に出力し、当該目的関数の情報に基づいて、最適化装置２００による２Ｗ１Ｈを用いた解探索を実行させる。なお、定式化部１４０が最適化装置２００に出力する情報には、目的関数の情報に加えて、上記のラベルの情報や探索の初期状態を示す情報などが含まれ得る。

次に、上記の第１の処理例のステップＳ１０〜Ｓ１２および第２の処理例のステップＳ２０〜Ｓ２２における各ルートの最大拠点ノード数の決定例を説明する。
図８は、各ルートの最大拠点ノード数決定例（その１）を示す図である。

ＣＶＲＰとして、Ｅ−ｎ１３ｋ４を例示する。ただし、ノード数計算部１３０は、Ｅ−ｎ２２ｋ４などの他の種類の問題でも同様にして各ルートの最大拠点ノード数を決定可能である。図８の例では、トラックの最大積載量ＱをＱ＝６０００とする。

まず、ルート計算部１５０は、１２個の拠点ノードを需要量の小さい順、すなわち、需要量の昇順に並べる。そして、需要量の小さい順に累積需要量を求める。テーブル１２１は、１２個の拠点ノードに対する累積需要量を示す。テーブル１２１は、記憶部１２０に格納される。

テーブル１２１は、拠点、需要量および累積需要量の項目を含む。拠点の項目には、拠点ノードを需要量の昇順に数えた累積拠点数が登録される。需要量の項目には、拠点ノードの需要量が登録される。累積需要量の項目には、需要量の昇順に需要量を累積した累積需要量が登録される。

ノード数計算部１３０は、Ｎ番目のルートの最大ノード数Ｒ［Ｎ］を式（１６）により求める。Ｎはルートを表すインデックスである。

累積拠点数ｊは、累積需要量がＮ×Ｑを超えない最大の拠点数である。累積拠点数ｊは、累積拠点ノード数ｊと呼ばれてもよい。式（１６）は、ｊをＮで割った商の整数部をＲ［Ｎ］とすることを示す。

図８の例では、Ｎ＝１に対して累積需要量が１×Ｑ＝６０００を超えない最大の累積拠点数ｊは、ｊ＝４である。よって、Ｒ［１］＝４である。Ｒ［１］は、１のルートにおける拠点ノードの最大数に相当する。他のルートにおける最大拠点ノード数は、Ｒ［１］以下になる。

続いて、Ｎ＝２に対して累積需要量が２×Ｑ＝１２０００を超えない最大の累積拠点数ｊは、ｊ＝８である。よって、Ｒ［２］＝４である。
Ｎ＝３に対して累積需要量が３×Ｑ＝１８０００を超えない最大の累積拠点数ｊは、ｊ＝１１である。よって、Ｒ［３］＝３である。

Ｎ＝４に対して累積需要量が４×Ｑ＝２４０００を超えない最大の累積拠点数ｊは、ｊ＝１２である。よって、Ｒ［４］＝３である。
この場合、各ルートに対する最大拠点ノード数の組、すなわち、最大拠点ノード数のパターンは（４，４，３，３）となる。

需要量の小さい順に並べたことにより、Ｒ［１］、Ｒ［２］、…、Ｒ［Ｎ］は、Ｒ［１］≧Ｒ［２］≧…≧Ｒ［Ｎ］のように単調減少列となる。Ｎ番目のルートについて、Ｒ［Ｎ］がｊをＮで割った数よりも大きくなることは、当該単調減少列となることに矛盾するので、式（１６）によりＲ［Ｎ］を求めることができる。

パターン（４，４，３，３）は、図８の条件における各ルートに対する拠点ノード数の有り得るパターン（４，４，３，１）、（４，４，２，２）、（４，３，３，２）、（３，３，３，３）を全て包含する。有り得るパターンとは、各ルートで回る拠点ノード数の実現可能な組合せを示し、例えば、トラックの最大積載量の制約と各拠点に運搬する荷物の重量との関係などから求めることができる。有り得るパターンでは、各ルートで回る拠点数が固定的に決定されており、各ルートで回る拠点数の全ルートでの合計は、訪問対象の全拠点数に一致する。

図９は、各ルートの最大拠点ノード数決定例（その２）を示す図である。
図９では、Ｑ＝５０００の場合を例示する。他の条件は図８の例と同じである。
この場合、Ｎ＝１に対してｊ＝４である。よって、Ｒ［１］＝４である。Ｎ＝２に対してｊ＝７である。よって、Ｒ［２］＝３である。Ｎ＝３に対してｊ＝１０である。よって、Ｒ［３］＝３である。Ｎ＝４に対してｊ＝１２である。よって、Ｒ［４］＝３である。この場合、各ルートに対する最大拠点ノード数の組、すなわち、最大拠点ノード数のパターンは（４，３，３，３）となる。

図１０は、各ルートの最大拠点ノード数決定例（その３）を示す図である。
全拠点に対する需要量の合計がトラックの積載量Ｑ×（ルート総数よりも小さい数）より小さくなる場合も、図８，９と同様にして各ルートの最大拠点ノード数を計算できる。すなわち、あるルートＫ（Ｋ≠ルート総数ｋ）が存在しており、Ｋについて式（１７）となる場合である。

ここで、条件として、予めルート数、すなわち、トラックの数が決まっている場合は、１つのルートで少なくとも１つのルートを回ることになる。Ｋ番目のルートにおいて、式（１７）が満たされる場合、ノード数計算部１３０は、残りのルートが少なくとも１つの拠点を取れるように、拠点の取り方を変更してもよい。

図１０では、Ｑ＝７０００とし、他の条件が図８の例と同じである場合を考える。
図１０の例では、Ｎ＝１に対してｊ＝５である。よって、Ｒ［１］＝５である。Ｎ＝２に対してｊ＝９である。よって、Ｒ［２］＝４である。

Ｎ＝３に対してｊ＝１１である。ただし、図８，９と同様の方法を用いる場合、ｊ＝１２である。一方、Ｎ＝Ｋ＜ｋであり、Ｋ×Ｑ＝３×７０００＝２１０００≧Σｄ＝１８２００であるため、残りのＮ＝４番目のルートに少なくとも１つの拠点ノードが割り当てられるように、ｊ＝１２−１＝１１とする。ここで、ｊについて、拠点ノード数「１２」から引いた「１」は、３番目のルートよりも後の残りのルートの数である。よって、Ｒ［３］＝３である。そして、Ｎ＝４に対してｊ＝１２である。よって、Ｒ［４］＝３である。

この場合、各ルートに割り当てる最大拠点ノード数の組、すなわち、最大拠点ノード数のパターンは（５，４，３，３）となる。
一方、図１０の例において図８，９と同様の方法により求められる最大拠点ノード数のパターンは、（５，４，４，３）である。図１０の方法のように、パターンに属する最大拠点ノード数を少なくすることで、定式化に用いられる状態変数の数の増加を抑えることができる。

なお、各ルートに割り当てる最大拠点ノード数の決定方法には他の方法も考えられる。例えば、ノード数計算部１３０は、図８のＥ−ｎ１３ｋ４の問題の例において、１番目のルートに対する最大拠点ノード数を４と決定し、２番目以降のルートに対しても当該最大拠点ノード数４を一律に割り当てることで（４，４，４，４）のパターンとしてもよい。

あるいは、ノード数計算部１３０は、各ルートに対する拠点ノード数の有り得る複数のパターンを全て列挙してもよい。そして、ノード数計算部１３０は、列挙した複数のパターンに基づいて、各ルートにおける最大値を組合せることで、各ルートに対する最大拠点ノード数を示す１つのパターンを決定してもよい。具体的には次の通りである。

図１１は、各ルートの最大拠点ノード数決定例（その４）を示す図である。
ノード数計算部１３０は、拠点の需要量を小さい順に並び替えたとき、トラックの最大積載量を超えない拠点数の組合せを全て求める。ノード数計算部１３０は、各ルートに対して求めた拠点数以下で、合計が拠点ノードの総数に一致する組合せを全て列挙する。こうして得られた組合せが、拠点ノード数の有り得るパターンである。

例えば、ノード数計算部１３０は、Ｅ−ｎ１３ｋ４における拠点ノードの総数「１２」に対して、拠点ノード数の有り得るパターン（４，４，３，１）、（４，４，２，２）、（４，３，３，２）、（３，３，３，３）を列挙し得る。この場合、ノード数計算部１３０は、列挙した複数のパターンに基づいて、各ルートにおける最大値を抽出し、当該最大値を組合せることで、（４，４，３，３）という最大拠点ノード数の１つのパターンを決定してもよい。

ただし、最適化装置２００による余計な探索を省いて探索を効率化するには、情報処理装置１００により、パターンに属する数値の合計を小さくして状態変数の数を減らすことが好ましい。例えば、図８〜１０の方法を用いることで、図１１の方法よりも状態変数の数を減らすことができる。

次に、Ｅ−ｎ１３ｋ４に対するルートの計算の具体例を説明する。まず、２Ｗ１Ｈを用いる場合を例示する。
図１２は、ルートの計算例（その１）を示す図である。

最適化装置２００において２Ｗ１Ｈを用いる場合、定式化部１４０は、ダミーデポに対応する状態変数を追加することで、状態変数の数が整数を２乗した値になるように調整する。

定式化部１４０は、図８〜１１に示される方法で決定されたパターンＲに基づいてダミーデポの数を決定する。パターンＲは、式（１８）で表される。

式（１８）のｋは全ルート数である。また、パターンＲに属する最大拠点ノード数の合計を｜Ｒ｜と表す。｜Ｒ｜は、式（１９）で表される。

図１２では、図８の例、すなわち、Ｒ［１］＝４、Ｒ［２］＝４、Ｒ［３］＝３、Ｒ［４］＝３の場合を例示する。この場合、｜Ｒ｜＝１４である。マトリクス７０は、状態変数列、すなわち、ビット列を示す。マトリクス７０の１つの行は１つの時刻に対応する。マトリクス７０の１つの列は１つのノードに対応する。１つのノードは、１つの拠点ノードまたは１つのダミーデポに相当する。

状態変数列は、式（２０）で表される。

ｊはノードを示すインデックスである。ｔは時刻を示すインデックスである。ｘ_ｊ，ｔは、時刻ｔにノードｊにいれば「１」、いなければ「０」である。マトリクス７０では、ｘ_ｊ，ｔ＝１の場合に「１」を記載し、ｘ_ｊ，ｔ＝０の場合に「０」の表記を省略し、空欄としている。

Ｉは拠点ノードの集合であり、式（２１）で表される。

ｎは、Ｅ−ｎ１３ｋ４において与えられたノード数「１３」である。ｎ−１は、拠点ノード数である。
また、式（２０）のＤは、ダミーデポの集合であり、式（２２）で表される。

｜Ｒ｜−ｎ＋１は、ダミーデポの数である。更に、式（２０）のＴは、時刻の集合であり、式（２３）で表される。

上記のように、定式化部１４０は、パターンに属する最大ノード数の合計｜Ｒ｜と拠点ノード数（ｎ−１）の差（｜Ｒ｜−ｎ＋１）をダミーデポの数とする。これにより、状態変数の数が｜Ｒ｜^２となるように調整される。図１２の例では、ダミーデポの数は、１４−１２＝２である。また、状態変数の数は、１４^２＝１９６である。マトリクス７０は、状態変数列が１４行１４列の正方形状で表される。この場合、最適化装置２００における２Ｗ１Ｈ（４ビットフリップ）を利用可能である。

マトリクス７０の例では、ｔ＝１〜４が１番目のルート、すなわち、１台目のトラックに対応する。ｔ＝５〜８が２番目のルート、すなわち、２台目のトラックに対応する。ｔ＝９〜１１が３番目のルート、すなわち、３台目のトラックに対応する。ｔ＝１２〜１４が４番目のルート、すなわち、４台目のトラックに対応する。なお、１台のトラックが４回に分けて４つのルートを回ると考えても同じである。

「Ｆ」の文字が付された行は、各ルートにおいて、トラックが、起点のデポの次に拠点を訪問する時刻を示す。また、「Ｌ」の文字が付された行は、各ルートにおいて、トラックが、終点のデポを訪問する時刻の１つ前の時刻を示す。なお、起点および終点では、トラックは必ずデポに滞在することが分かっているため、定式化部１４０は、各ルートの起点および終点に対応する時刻について状態変数を省略する。

Ｆの行は、式（２４）で表される。Ｌの行は、式（２５）で表される。

Ｓ［ｌ］（ｌ＝０，１，２，…，ｋ）は、式（２６）、（２７）で表される。

この場合、定式化部１４０は、式（２８）のように目的関数Ｅ（ｘ，ｙ）を定式化する。

Ｃ（ｘ）はコストの総和を示すコスト項である。Ｐ_１（ｘ）は、ダミーデポに関する制約を示す制約項である。Ｐ_２（ｘ，ｙ）は、スラック変数ｙの不等式制約を示す制約項である。スラック変数ｙは、０，１の値をとるバイナリ変数であり、スラックビットと呼ばれてもよい。スラック変数ｙは、不等式制約を等式制約に変換するために用いられる。定式化部１４０は、トラックの最大積載量と積み荷の需要量との関係をスラック変数ｙを用いて定式化する。

マトリクス７０の例では、２Ｗ１Ｈを利用可能である。このため、定式化部１４０は、１−Ｈｏｔ制約に対応する制約項を目的関数に含めなくてよい。
式（２８）のコスト項Ｃ（ｘ）は、式（２９）で表される。

｛ｃ_ｉ，ｊ｝（ｉ，ｊ∈Ｉ∪Ｖ）は、ノード間のコストである。｛ｃ_ｉ，ｊ｝は、拠点ノード間のコスト、拠点ノードとダミーデポとの間のコスト、および、ダミーデポ間のコストを含む。ある拠点ノードと各ダミーデポとのコストは全て同じである。また、ダミーデポ同士の間のコストは０である。インデックスｏは、ダミーデポを表す代表のインデックスであり、Ｄ_１，Ｄ_２，…それぞれと同じ意味である。また、バックスラッシュ記号は、バックスラッシュ記号の左側の集合（例えばＴ）から、バックスラッシュ記号の右側の集合（例えばＬ）の要素を除くことを示す。

コスト項Ｃ（ｘ）の右辺第一項は、ノード間のコストの総和である。当該第一項は、時刻ｔでノードｉにいて、時刻ｔ＋１で別のノードｊにいれば、ノードｉ，ｊの間の移動コストｃ_ｉｊがかかることを示す。Ｌの時刻が除かれる理由は、ルートを跨いでノード間を移動することを防ぐためである。

コスト項Ｃ（ｘ）の右辺第二項は、各ルートでのＬおよびＦに属する時刻に訪問するノードとデポとの間のコストの総和である。当該第二項は、ＬおよびＦに属する時刻に訪問するノードとデポとが必ず繋がっているため、その分のコストを補正する項である。上記のように予めデポにいることが分かっていることを利用して一部のビットを削減しているため、当該第二項によりコストを補正する。なお、当該ビットの削減により、余計なビットだけでなく制約項も削減される。

式（２８）の制約項Ｐ_１（ｘ）は、式（３０）で表される。

式（３０）のＡは、予め与えられる定数である。
制約項Ｐ_１（ｘ）は、同一のルート内で、あるダミーデポに一度入ったら、そのルート内では別のダミーデポを巡回する制約を示す。例えば、マトリクス７０の例では、Ｒ［３］に対応するルート内で、ｔ＝１０，１１においてダミーデポＤ_１，Ｄ_２の間での巡回が生じている。制約項Ｐ_１（ｘ）がない場合、１つのルート内で一度デポに戻って再び拠点に移動してしまう可能性が生じる。これは、ルートの数が増えることに相当する。ルートの数が増えてしまった解は求めるべき解ではない。制約項Ｐ_１（ｘ）により、最適化装置２００において、求めるべき解ではない状態の生成が抑制され、解探索が効率化される。なお、式（３０）の定数Ａは、予め与えられる。制約項Ｐ_１（ｘ）は、第１の実施の形態の制約項３２の一例である。

制約項Ｐ_２（ｘ，ｙ）は、式（３１）で表される。

式（３１）のＢは、予め与えられる定数である。
制約項Ｐ_２（ｘ，ｙ）は、トラックの積載量制約をスラック変数ｙ_ｌを用いて表した制約である。スラック変数ｙ_ｌの総数はルート総数ｋ個である。トラックの積載量制約は、不等式制約である。制約項Ｐ_２（ｘ，ｙ）は、各ルートｌ（ｌ＝１，…，ｋ）における需要量の合計をＱ以下とする制約である。図１２の例では、４ルート分の項がペナルティとして加算される。

定式化部１４０は、式（２９）、（３０）、（３１）の全ての項の和を取った後、非対角成分を｛Ｗ_ｉｊ｝、対角成分を｛ｂ_ｉ｝として、最適化装置２００に入力する。式（３１）はスラック変数を含むので、目的関数は状態変数に加えてスラック変数を含む。このように、目的関数はスラック変数を含んでもよい。

マトリクス７０は、最適化装置２００により計算された解を示す。マトリクス７０で示される解は、図８の問題例に対する最適解となっている。マトリクス７０で示される解は、以下のようなルートを示す。ここで、「−＞」は、「−＞」の左側のノードから「−＞」の右側のノードへトラックが移動することを示す。また、拠点をマトリクス７０における拠点ノードのインデックスで示す。

１番目のルートは、デポ−＞６−＞１０−＞１２−＞９−＞デポである。
２番目のルートは、デポ−＞１１−＞４−＞７−＞２−＞デポである。
３番目のルートは、デポ−＞１−＞ダミーデポ−＞ダミーデポ−＞デポであり、これはデポ−＞１−＞デポに相当する。ルート途中でダミーデポに帰還した場合には、当該ルートの終点に達したとみなすという解の解釈は、ルート計算部１５０により行われる。

４番目のルートは、デポ−＞３−＞５−＞８−＞デポである。
なお、式（２９）の目的関数において、ノード間のコストが三角不等式を満たすものの場合、定式化部１４０は、Ａ＝０、すなわち、制約項Ｐ_１（ｘ）＝０としてよい。三角不等式を満たすコストの例として、数学的な意味の距離が挙げられる。また、ノード間のコストが三角不等式を満たさないものの場合、Ａ≠０とする。「同一のルート内でデポに一度戻って、再び拠点に行く」という解が違反解として生じてしまうためである。

図１３は、イタレーション数と正解レプリカ数との関係の第１の例を示す図である。
グラフ８０は、Ｅ−ｎ１３ｋ４に対し、最適化装置２００でレプリカ交換法および２Ｗ１Ｈを用いる場合のイタレーション数と、最適解に到達したレプリカ数との関係を示す。当該関係を得るために、Ｅ−ｎ１３ｋ４として図１２の最適解が予め分かっているものを用いている。また、最適解に到達したレプリカを正解レプリカと言う。１イタレーションは、１回分のビットフリップに相当する。２Ｗ１Ｈでは１回分のビットフリップが４ビットフリップのことがある。また、解探索に用いるレプリカの総数は３０である。

グラフ８０の横軸は、解探索におけるイタレーション数の常用対数である。グラフ８０の縦軸は、正解レプリカ数である。２Ｗ１Ｈを用いる場合、１０^５程度のイタレーション数で正解レプリカが表れている。

一方、２Ｗ１Ｈを用いずに１ビットフリップで解探索を行う既存の方法では、例えば、最適解が存在することが分かっているパターン（４，４，３，１）に対して解探索を行う場合、１０^６程度のイタレーション数で正解レプリカが表れる。したがって、２Ｗ１Ｈを用いるようにすることで、１０倍程度演算が高速化される。

また、新規の問題に対しては、複数のパターンのうちのどのパターンに最適解が存在するか分からないため、既存の方法では、複数のパターンを全て解くことになる。これに対し、情報処理装置１００によれば、例えば、パターン（４，４，３，３）のように当該複数のパターンを包含した１つのパターンを最適化装置２００で解けばよくなるので、最適化装置２００による求解の実行回数が低減される。

図１４は、イタレーション数と正解レプリカ数との関係の第２の例を示す図である。
グラフ８１は、Ｅ−ｎ２２ｋ４に対し、最適化装置２００でレプリカ交換法および２Ｗ１Ｈを用いる場合のイタレーション数と、正解レプリカ数との関係を示す。当該関係を得るために、Ｅ−ｎ２２ｋ４として最適解が予め分かっているものを用いている。解探索に用いるレプリカの総数は３０である。

グラフ８１の横軸は、解探索におけるイタレーション数の常用対数である。グラフ８１の縦軸は、正解レプリカ数である。２Ｗ１Ｈを用いる場合、１０^４程度のイタレーション数で正解レプリカが表れている。

一方、２Ｗ１Ｈを用いずに１ビットフリップで解探索を行う既存の方法では、例えば、最適解が存在することが分かっているパターンに対して解探索を行う場合、１０^８程度のイタレーション数で正解レプリカが表れる。したがって、２Ｗ１Ｈを用いるようにすることで、１００００倍程度演算が高速化される。

また、新規の問題に対しては、複数のパターンのうちのどのパターンに最適解が存在するか分からないため、既存の方法では、複数のパターンを全て解くことになる。これに対し、情報処理装置１００によれば、例えば、当該複数のパターンを包含した１つのパターンを最適化装置２００で解けばよくなるので、最適化装置２００による求解の実行回数が低減される。

次に、Ｅ−ｎ１３ｋ４に対するルートの計算の他の例を説明する。１Ｗ１Ｈ（２ビットフリップ）、または、１ビットフリップを用いる場合の例である。
図１５は、ルートの計算例（その２）を示す図である。

図１５では、図８の例、すなわち、Ｒ［１］＝４、Ｒ［２］＝４、Ｒ［３］＝３、Ｒ［４］＝３の場合を例示する。この場合、｜Ｒ｜＝１４である。マトリクス７１は、状態変数列、すなわち、ビット列を示す。マトリクス７１の１つの行は１つの時刻に対応する。マトリクス７１の１つの列は１つのノードに対応する。１つのノードは、１つの拠点ノードまたは１つのデポノードに相当する。状態変数の数は｜Ｒ｜×（ノード数ｎ）であり、マトリクス７１の例では、１４×１３＝１８２である。図１５では、デポノードを「Ｄ」と表記する。

状態変数列は、式（２０）で表される。ｘ_ｊ，ｔは、時刻ｔにノードｊにいれば「１」、いなければ「０」である。マトリクス７１では、ｘ_ｊ，ｔ＝１の場合に「１」を記載し、ｘ_ｊ，ｔ＝０の場合に「０」の表記を省略し、空欄としている。

１Ｗ１Ｈを用いる場合、定式化部１４０は式（３２）のように目的関数Ｅ（ｘ，ｙ）を定式化する。

式（３２）では、式（２８）の制約項Ｐ_１（ｘ）の代わりに、制約項Ｐ_３（ｘ）が追加されている。また、式（３２）では、式（２８）にはない制約項Ｐ_４（ｘ）が追加されている。各時刻でトラックが１つの拠点またはデポを訪れるという１−Ｈｏｔ制約は、最適化装置２００の１Ｗ１Ｈにより対応するため、当該１−Ｈｏｔ制約に対応する制約項は不要となる。

式（３２）の制約項Ｐ_３（ｘ）は、式（３３）で表される。

式（３３）のＡは、予め与えられる定数である。また、変数ｘ_Ｄ，ｔは、時刻ｔにデポにいれば「１」、いなければ「０」の値を取るバイナリ変数である。制約項Ｐ_３（ｘ）は、同一のルート内で一度デポに入ったらデポに留まり続けることを表す制約である。制約項Ｐ_３（ｘ）は、第１の実施の形態の制約項３２の一例である。

式（３２）の制約項Ｐ_４（ｘ）は、式（３４）で表される。

式（３４）のＣ，Ｄは、予め与えられる定数である。式（３４）の右辺第一項は、拠点に関する１−Ｈｏｔ制約、すなわち、各拠点はトラックにより１回だけ訪問されることを表す。式（３４）の右辺第二項は、デポを訪れる回数が（｜Ｒ｜−ｎ＋１）回であるという制約である。ただし、各ルートの起点と終点はデポであり、マトリクス７１の例では各ルートの起点と終点に対応するビットを除去しているため、各ルートの起点と終点でデポを訪れる回数を除いている。図１５の例では、｜Ｒ｜−ｎ＋１＝１４−１３＋１＝２である。

マトリクス７１は、最適化装置２００により計算された解を示す。マトリクス７１で示される解は、図８の問題例に対する最適解となっている。マトリクス７１で示される解は、マトリクス７０で示される各ルートと同じである。マトリクス７１の例では、Ｒ［３］に対応するルート内で、ｔ＝１０，１１においてトラックがデポＤに留まり続ける解となっている。

１Ｗ１Ｈを用いずに、１ビットフリップの探索を行う場合、定式化部１４０は、式（３５）のように目的関数Ｅ（ｘ，ｙ）を定式化する。

式（３５）では、式（３２）に対して、制約項Ｐ_５（ｘ）が追加されている。制約項Ｐ_５（ｘ）は、各時刻でトラックが１つの拠点またはデポを訪れるという１−Ｈｏｔ制約を表す。

式（３５）の制約項Ｐ_５（ｘ）は、式（３６）で表される。

式（３６）のＥは、予め与えられる定数である。
目的関数Ｅ（ｘ，ｙ）を式（３５）のように定式化する場合も、マトリクス７１で示される解と同様の解が取得され得る。ただし、１Ｗ１Ｈを用いない場合よりも、１Ｗ１Ｈを用いる方が求解性能は向上する。例えば、１Ｗ１Ｈを用いない場合よりも、１Ｗ１Ｈを用いる方がより良い解に到達する可能性を高められる。また、１Ｗ１Ｈを用いない場合よりも、１Ｗ１Ｈを用いる方が高速に解を求められる。更に、１Ｗ１Ｈよりも２Ｗ１Ｈを用いる方が求解性能は向上する。

次に、処理手順の比較例を説明する。比較例の処理主体をＣＰＵ１０１とする。
図１６は、比較例を示すフローチャートである。
（Ｓ３０）ＣＰＵ１０１は、入力されたインスタンス情報に含まれる各拠点の需要量を小さい順に並べる。

（Ｓ３１）ＣＰＵ１０１は、トラックの積載量を超えない最大拠点ノード数を１番目のルートのノード数とする。
（Ｓ３２）ＣＰＵ１０１は、２番目以降のルートに関して有り得るノード数を求め、各ルートに対するノード数の全ての組合せを列挙する。例えば、図８のＥ−ｎ１３ｋ４の問題に対して、ＣＰＵ１０１は、（４，４，３，１）、（４，４，２，２）、（４，３，３，２）、（３，３，３，３）の４つの組合せ、すなわち、４つのパターンを列挙する。

（Ｓ３３）ＣＰＵ１０１は、列挙された組合せで未選択のものがあるか否かを判定する。未選択のものがある場合、ＣＰＵ１０１は、ステップＳ３４に処理を進める。未選択のものがない場合、ＣＰＵ１０１は、ステップＳ３７に処理を進める。

（Ｓ３４）ＣＰＵ１０１は、列挙された組合せから未選択の組合せを１つ選択する。
（Ｓ３５）ＣＰＵ１０１は、未選択の組合せに対して目的関数の情報を生成し、当該目的関数の情報を最適化装置２００に出力することで、最適化装置２００による求解を実行させる。

（Ｓ３６）ＣＰＵ１０１は、最適化装置２００により求められた解を取得し、得られた解が最低エネルギーを更新したら、ＲＡＭ１０２に保持している解を新たに取得した解に置き換える。そして、ＣＰＵ１０１は、ステップＳ３３に処理を進める。

（Ｓ３７）ＣＰＵ１０１は、最後に最低エネルギーを更新した解を最適解として出力する。
このように、各ルートに対して有り得るノード数の組合せを全て列挙する方法では、当該組合せの数だけ目的関数を生成し、目的関数ごとに最適化装置２００による求解を実行させることになる。例えば、当該組合せの数がＮ個の場合には、目的関数がＮ個になり、最適化装置２００による求解をＮ回実行することになる。

一方、情報処理装置１００によれば、各ルートに対して有り得るノード数の全ての組合せを包含した１つの組合せに対して、目的関数を生成し、当該目的関数で最適化装置２００による求解を実行させればよい。このため、求解の実行回数が比較例の方法に比べて１／Ｎに低減される。このように、求解の実行回数を低減することができる。

なお、１回の求解当たりの解探索のイタレーション数、すなわち、ビットフリップの回数は、比較例の方法と第２の実施の形態とで同じとすることができる。すると、第２の実施の形態では、比較例の方法よりも解探索のイタレーション数を減らせ、比較例の方法よりも早く解を得られる。

以上をまとめると、情報処理装置１００は、例えば次の機能を有する。以下の説明において、ｍは２以上の整数とする。
ノード数計算部１３０は、複数のルートのうちの１番目のルートに、取得した１のルートに対する拠点ノードの最大数に等しい第１の最大拠点ノード数を割り当てる。また、ノード数計算部１３０は、複数のルートのうちのｍ番目のルートに、ｍ−１番目のルートに割り当てた第ｍ−１の最大拠点ノード数以下で０より大きい第ｍの最大拠点ノード数を割り当てる。そして、ノード数計算部１３０は、複数のルートに割り当てた複数の最大拠点ノード数に基づいて状態変数の数を決定する。

これにより、複数のルートに対して有り得る拠点ノード数の複数のパターンを包含するように、複数のルートに対する最大拠点ノード数のパターンを決定し、決定した当該パターンに対する問題の定式化が可能になる。

一例では、ノード数計算部１３０は、複数の拠点ノードに対応する複数の需要量を小さい方から順番に累積した累積需要量が巡回主体における需要量の容量を超えない最大の累積拠点ノード数を、１のルートに割り当てる拠点ノードの最大数として取得する。また、ノード数計算部１３０は、累積需要量が当該容量のｍ倍を超えない最大の累積拠点ノード数をｍで割った商の整数部を、ｍ番目のルートに割り当てる第ｍの最大拠点ノード数とする。

これにより、１のルートに割り当てる拠点ノードの最大数を一律に複数のルートに割り当てたり、図１１の方法を用いたりするよりも、状態変数の数を少ない数に抑えることができる。前述のように、状態変数の数を少なく抑えるほど、最適化装置２００での余計な探索を抑えられる。

また、ノード数計算部１３０は、巡回主体の需要量の容量のｍ−１倍が複数の需要量の合計以上の場合、ｍ番目以降の残りのルートの第１の数を複数の拠点ノードの総数から引いた第２の数を求める。そして、ノード数計算部１３０は、第２の数をｍ−１で割った商の整数部を、ｍ−１番目のルートに割り当てる第ｍ−１の最大拠点ノード数とする。

これにより、状態変数の数をより少ない数に抑えることができる。
他の例では、ノード数計算部１３０は、複数のルートに対して有り得る複数の拠点ノード数のパターンであって、当該パターンに属する複数の拠点ノード数の合計が複数の拠点ノードの総数に等しいパターンを複数取得してもよい。そして、ノード数計算部１３０は、取得した複数のパターンから各ルートに対応する拠点ノード数の最大値を抽出し、各ルートに対して抽出した最大値を、当該ルートに割り当てる最大拠点ノード数としてもよい。

これにより、１のルートに割り当てる拠点ノードの最大数を一律に複数のルートに割り当てるよりも、状態変数の数を少ない数に抑えることができる。
また、ノード数計算部１３０は、取得した最大数に基づいて複数のルートに割り当てられる複数の最大拠点ノード数の合計が、複数の拠点ノードの総数よりも大きくなることを許容する。

また、最適化装置２００、すなわち、探索部２０で２Ｗ１Ｈを利用可能な場合、定式化部１４０は、状態変数の数が、複数のルートに割り当てる複数の最大拠点ノード数の合計の２乗に等しくなるように、ダミーのデポノードに対応する状態変数を追加する。

これにより、最適化装置２００において、２Ｗ１Ｈにより高速に解探索を行える。
このとき、定式化部１４０は、１度の状態遷移に対して値を変化させる４つの状態変数の組を示す識別情報を最適化装置２００、すなわち、探索部２０に出力する。当該識別情報は、例えば４つの状態変数が属する４つのグループを識別する４つのラベルでもよい。この場合、１つの状態変数は、図５に示されるように行方向および列方向の２つのグループに属するので、当該２つのグループに対応する２つのラベルが付与される。

これにより、最適化装置２００に対して２Ｗ１Ｈでの４ビットフリップを行う状態変数の組を適切に指示し、最適化装置２００により２Ｗ１Ｈでの解探索を適切に行わせることができる。

更に、定式化部１４０は、２つの拠点ノードの間、および、拠点ノードとデポノードとの間のコストが三角不等式を満たす場合、制約項Ｐ_１を０に設定してもよい。
これにより、制約項Ｐ_１が目的関数Ｅ（ｘ，ｙ）に含まれることによる解探索への影響を小さくできる。

なお、第１の実施の形態の情報処理は、処理部１１にプログラムを実行させることで実現できる。また、第２の実施の形態の情報処理は、ＣＰＵ１０１にプログラムを実行させることで実現できる。プログラムは、コンピュータ読み取り可能な記録媒体１１３に記録できる。

例えば、プログラムを記録した記録媒体１１３を配布することで、プログラムを流通させることができる。また、プログラムを他のコンピュータに格納しておき、ネットワーク経由でプログラムを配布してもよい。コンピュータは、例えば、記録媒体１１３に記録されたプログラムまたは他のコンピュータから受信したプログラムを、ＲＡＭ１０２やＨＤＤ１０３などの記憶装置に格納し（インストールし）、当該記憶装置からプログラムを読み込んで実行してもよい。

１０情報処理装置
１１処理部
１２出力部
２０探索部
３０目的関数
３１コスト項
３２制約項
Ｒ１，Ｒ２ルート
ｄ１デポノード
ｎ１，ｎ２，…，ｎ７拠点ノード

Claims

巡回主体が複数の拠点ノードを巡回するための複数のルートであって、デポノードを各ルートの起点および終点とする前記複数のルートを求める組合せ最適化問題に関して、１のルートに割り当てる拠点ノードの最大数を取得し、前記最大数に基づいて前記組合せ最適化問題の定式化に用いる状態変数の数を決定し、決定した前記数の前記状態変数に対して、各ルートにおいて前記拠点ノードから前記デポノードへ前記巡回主体が移動した後には同一ルート内での前記複数の拠点ノードそれぞれへの前記巡回主体の移動を制限することを示す制約項を含む目的関数の情報を生成する処理部と、
前記目的関数に含まれる前記状態変数の組により表される基底状態を探索する探索部に、生成した前記目的関数の情報を出力する出力部と、
を有する情報処理装置。
前記処理部は、
前記複数のルートのうちの１番目のルートに、取得した前記最大数に等しい第１の最大拠点ノード数を割り当て、前記複数のルートのうちのｍ（ｍは２以上の整数）番目のルートに、ｍ−１番目のルートに割り当てた第ｍ−１の最大拠点ノード数以下で０より大きい第ｍの最大拠点ノード数を割り当て、
前記複数のルートに割り当てた複数の最大拠点ノード数に基づいて前記状態変数の前記数を決定する、
請求項１記載の情報処理装置。
前記処理部は、
前記複数の拠点ノードに対応する複数の需要量を小さい方から順番に累積した累積需要量が前記巡回主体における需要量の容量を超えない最大の累積拠点ノード数を前記最大数として取得し、
前記累積需要量が前記容量のｍ倍を超えない最大の累積拠点ノード数をｍで割った商の整数部を、前記ｍ番目のルートに割り当てる前記第ｍの最大拠点ノード数とする、
請求項２記載の情報処理装置。
前記処理部は、前記容量のｍ−１倍が前記複数の需要量の合計以上の場合、ｍ番目以降の残りのルートの第１の数を前記複数の拠点ノードの総数から引いた第２の数をｍ−１で割った商の整数部を、前記ｍ−１番目のルートに割り当てる前記第ｍ−１の最大拠点ノード数とする、
請求項３記載の情報処理装置。
前記処理部は、
前記複数のルートに対して有り得る複数の拠点ノード数のパターンであって、前記パターンに属する前記複数の拠点ノード数の合計が前記複数の拠点ノードの総数に等しい前記パターンを複数取得し、複数の前記パターンから各ルートに対応する拠点ノード数の最大値を抽出し、
各ルートに対して抽出した前記最大値を、当該ルートに割り当てる最大拠点ノード数とする、
請求項２記載の情報処理装置。
前記複数の最大拠点ノード数の合計は、前記複数の拠点ノードの総数よりも大きい、
請求項２記載の情報処理装置。
前記処理部は、前記状態変数の前記数が、前記最大数に基づいて前記複数のルートに割り当てられる複数の最大拠点ノード数の合計の２乗に等しくなるように、ダミーの前記デポノードに対応する前記状態変数を追加する、
請求項１記載の情報処理装置。
前記出力部は、１度の状態遷移に対して値を変化させる４つの前記状態変数の組を示す識別情報を前記探索部に出力する、
請求項７記載の情報処理装置。
前記処理部は、２つの前記拠点ノードの間、および、前記拠点ノードと前記デポノードとの間のコストが三角不等式を満たす場合、前記制約項を０に設定する、
請求項７記載の情報処理装置。
コンピュータに、
巡回主体が複数の拠点ノードを巡回するための複数のルートであって、デポノードを各ルートの起点および終点とする前記複数のルートを求める組合せ最適化問題に関して、１のルートに割り当てる拠点ノードの最大数を取得し、
前記最大数に基づいて前記組合せ最適化問題の定式化に用いる状態変数の数を決定し、
決定した前記数の前記状態変数に対して、各ルートにおいて前記拠点ノードから前記デポノードへ前記巡回主体が移動した後には同一ルート内での前記複数の拠点ノードそれぞれへの前記巡回主体の移動を制限することを示す制約項を含む目的関数の情報を生成し、
前記目的関数に含まれる前記状態変数の組により表される基底状態を探索する探索部に、生成した前記目的関数の情報を出力する、
処理を実行させるプログラム。
コンピュータが、
巡回主体が複数の拠点ノードを巡回するための複数のルートであって、デポノードを各ルートの起点および終点とする前記複数のルートを求める組合せ最適化問題に関して、１のルートに割り当てる拠点ノードの最大数を取得し、
前記最大数に基づいて前記組合せ最適化問題の定式化に用いる状態変数の数を決定し、
決定した前記数の前記状態変数に対して、各ルートにおいて前記拠点ノードから前記デポノードへ前記巡回主体が移動した後には同一ルート内での前記複数の拠点ノードそれぞれへの前記巡回主体の移動を制限することを示す制約項を含む目的関数の情報を生成し、
前記目的関数に含まれる前記状態変数の組により表される基底状態を探索する探索部に、生成した前記目的関数の情報を出力する、
情報処理方法。
巡回主体が複数の拠点ノードを巡回するための複数のルートであって、デポノードを各ルートの起点および終点とする前記複数のルートを求める組合せ最適化問題に関して、１のルートに割り当てる拠点ノードの最大数を取得し、前記最大数に基づいて前記組合せ最適化問題の定式化に用いる状態変数の数を決定し、決定した前記数の前記状態変数に対して、各ルートにおいて前記拠点ノードから前記デポノードへ前記巡回主体が移動した後には同一ルート内での前記複数の拠点ノードそれぞれへの前記巡回主体の移動を制限することを示す制約項を含む目的関数の情報を生成し、生成した前記目的関数の情報を出力する情報処理装置と、
前記情報処理装置により出力された前記目的関数の情報に基づいて、前記目的関数に含まれる前記状態変数の組により表される基底状態を探索する最適化装置と、
を有する情報処理システム。