JP6791151B2 - 最適化システム、最適化方法および最適化プログラム - Google Patents

最適化システム、最適化方法および最適化プログラム Download PDF

Info

Publication number
JP6791151B2
JP6791151B2 JP2017542682A JP2017542682A JP6791151B2 JP 6791151 B2 JP6791151 B2 JP 6791151B2 JP 2017542682 A JP2017542682 A JP 2017542682A JP 2017542682 A JP2017542682 A JP 2017542682A JP 6791151 B2 JP6791151 B2 JP 6791151B2
Authority
JP
Japan
Prior art keywords
optimization
programming problem
solution
unit
equation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017542682A
Other languages
English (en)
Other versions
JPWO2017056366A1 (ja
Inventor
遼平 藤巻
遼平 藤巻
伸志 伊藤
伸志 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2017056366A1 publication Critical patent/JPWO2017056366A1/ja
Application granted granted Critical
Publication of JP6791151B2 publication Critical patent/JP6791151B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N99/00Subject matter not provided for in other groups of this subclass
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、数理最適化を行う最適化システム、最適化方法および最適化プログラムに関する。
近年、過去の実績データに基づいて予測モデルを生成する方法が各種提案されている。例えば、特許文献1には、混合型データを自動で分離し分析する学習方法について記載されている。
また、定量的な問題について最適化(以下、数理最適化)を行う方法として、数理計画法(numerical optimization)が知られている。数理計画法には、例えば、線形計画法、二次計画法、半正定計画法などの連続変数に関する方法や、混合整数計画法のような離散変数に関する方法がある。特許文献2には、収集されたデータに数理計画法を適用することによって、最適充電スケジュールを決定する方法が記載されている。
米国特許第8909582号明細書 特開2012−213316号公報
数理最適化を行う場合、通常、数理計画法へ入力されるデータが観測されることを前提としている。例えば、工業製品の生産ラインを最適化する場合、各ラインである製品を作るために必要な材料の量、コスト、製造時間などのデータが入力される。
一方、データが観測されない場合には、人手でデータを準備する必要があり、大規模な最適化や高頻度な最適化が難しい。例えば小売店舗において、商品の将来の需要予測線が得られれば、需要に基づいて発注と在庫を最適化することは可能である。しかし、人手で需要予測線を引く事ができる商品数には限りがあり、また数時間に1回の発注作業のたびに手作業による需要予測を繰り返すことは現実的ではない。
また例えば、将来のある期間の売上が最大となるように、その期間の各商品価格を最適化するためには、大量の商品の価格と需要の間の複雑な相関関係を把握する必要があり、人手でこれを行う事は難しい。
以上の知見に基づいて、本発明の発明者は、例えば特許文献2に記載された方法によって過去のデータから観測されないデータを予測するモデルを学習し、その予測モデルに基づく将来の予測結果に基づいて数理計画法の目的関数や制約条件を自動的に生成し最適化を実行する方法等に係る発明をした。この発明により、数理最適化で観測されない大量の入力データが存在する状況や複数の大量のデータ間に複雑な相関関係が存在する場合であっても、適切に最適化を行うことができる。
一方、このような最適化を行う過程において、上記で述べた機械学習に基づく予測モデルが、非線形な基底関数に基づく場合がある。例えば、上記で述べた価格の予測問題について、機械学習に基づく予測モデルへ入力する特徴量として、価格の二乗や価格の対数変換といった非線形変換を行うとする。この場合、数理最適化の目的関数(将来のある期間の売上)は、価格を複雑に非線形変換した特徴量の関数になるため、一般的な方法を用いて、このような数理最適化を効率的に解くことは難しい。そのため、最適化に用いられる予測モデルが非線形な基底関数に基づく場合であっても、高速かつ高精度に数理最適化の解を求められることができることが好ましい。
そこで、本発明は、最適化に用いられる予測モデルが非線形な基底関数に基づく場合であっても、高速かつ高精度に数理最適化の解を求めることができる最適化システム、最適化方法および最適化プログラムを提供することを目的とする。
本発明による最適化システムは、二値二次計画問題で表される計画を最適化する最適化システムであって、最適化により解こうとする数理計画問題を記憶する問題記憶部と、問題記憶部に記憶された数理計画問題の目的関数として二値二次計画問題を生成する目的関数生成部と、二値二次計画問題を半正定計画問題に緩和して、その半正定計画問題の解を導出する最適化部を備え、最適化部が、後述する式48で表される1−of−K制約、線形等式制約、および、線形不等式制約つきの二値二次計画問題を、後述する式49で表される半正定計画問題に緩和し、半正定計画問題の解を二値二次計画問題の解に変換することで、その二値二次計画問題の解を導出することを特徴とする。
本発明による最適化方法は、二値二次計画問題で表される計画を最適化する最適化方法であって、コンピュータが、最適化により解こうとする数理計画問題を記憶する問題記憶部に記憶されたその数理計画問題の目的関数として二値二次計画問題を生成し、コンピュータが、二値二次計画問題を半正定計画問題に緩和して、その半正定計画問題の解を導出し、上記解の導出処理において、コンピュータが、後述する式48で表される1−of−K制約、線形等式制約、および、線形不等式制約つきの二値二次計画問題を、後述する式49で表される半正定計画問題に緩和し、半正定計画問題の解を二値二次計画問題の解に変換することで、その二値二次計画問題の解を導出することを特徴とする。
本発明による最適化プログラムは、二値二次計画問題で表される計画を最適化するコンピュータに適用される最適化プログラムであって、コンピュータに、最適化により解こうとする数理計画問題を記憶する問題記憶部に記憶されたその数理計画問題の目的関数として二値二次計画問題を生成する目的関数生成処理、および、二値二次計画問題を半正定計画問題に緩和して、その半正定計画問題の解を導出する最適化処理を実行させ、最適化処理で、以下の問題1で表される1−of−K制約、線形等式制約、および、線形不等式制約つきの二値二次計画問題を、以下の問題2で表される半正定計画問題に緩和させ、半正定計画問題の解を二値二次計画問題の解に変換することで、その二値二次計画問題の解を導出させることを特徴とする。
本発明によれば、上述した技術的手段により、最適化に用いられる予測モデルが非線形な基底関数に基づく場合であっても、高速かつ高精度に数理最適化の解を求めることができるという技術的効果を奏する。
本発明による最適化システムの第1の実施形態の構成例を示すブロック図である。 第1の実施形態の最適化システムの動作例を示すフローチャートである。 第1の実施形態の最適化システムの変形例を示す説明図である。 本発明による最適化システムの第2の実施形態の構成例を示すブロック図である。 候補点の入力を受け付ける画面の例を示す説明図である。 第2の実施形態の最適化システムの動作例を示すフローチャートである。 SDP緩和によりBQPを解く動作例を示すフローチャートである。 SDP緩和によりBQPを解く他の動作例を示すフローチャートである。 SDP緩和によりBQPを解くさらに他の動作例を示すフローチャートである。 本発明による最適化システムの概要を示すブロック図である。 少なくとも1つの実施形態に係るコンピュータの構成を示す概略ブロック図である。
まず、本発明の概要を説明する。本発明では、数理最適化で観測されない大量の入力データが存在する状況や複数の大量のデータ間に複雑な相関関係が存在する状況において、機械学習技術によって観測されない大量のデータや複雑なデータの相関関係を学習し、それによって適切に最適化を行う。具体的には、本発明では、例えば特許文献1に記載された方法によって過去のデータから観測されないデータを予測するモデルを学習し、その予測モデルに基づく将来の予測結果に基づいて数理計画法の目的関数や制約条件を自動的に生成し最適化を実行する。
以下、本発明の実施形態を図面を参照して説明する。なお、以下の説明では、必要に応じて、複数の商品の売上の予測に基づいて複数の商品の売上高の総和を最大にするように複数の商品の価格を最適化する場合について例示する。ただし、最適化の対象は上記の例に限定されない。また、以下の説明では、機械学習による予測対象となる変数を「被説明変数」、予測に用いられる変数を「説明変数」、最適化の出力となる変数を「目的変数」と記す。なお、これらの変数は排他的な関係ではなく、例えば説明変数の一部が目的変数となることがある。
実施形態1.
まず初めに、予測モデルに基づく将来の予測結果に基づいて数理計画法の目的関数や制約条件を自動的に生成し最適化を実行する方法を説明する。図1は、本発明による最適化システムの第1の実施形態の構成例を示すブロック図である。本実施形態の最適化システムは、訓練データ記憶部10と、学習器20と、最適化装置30とを備えている。図1に例示する最適化システムは、本発明における情報処理システムに対応する。
訓練データ記憶部10は、学習器20が予測モデルの学習に用いる各種訓練データを記憶する。本実施形態では、訓練データ記憶部10は、後述する最適化装置30が最適化結果として出力する変数(目的変数)について、過去に取得された実績データを記憶する。例えば、最適化装置30が複数の商品の価格を最適化しようとする場合、訓練データ記憶部10は、過去に取得された実績データとして、説明変数に対応する各商品の価格や、被説明変数に対応する商品の売上数量を記憶する。
また、訓練データ記憶部10は、過去に取得された被説明変数の実績データおよび説明変数の実績データ以外にも、天気や暦情報などの外的情報を記憶していてもよい。
学習器20は、訓練データ記憶部10に記憶された各種訓練データに基づいて、機械学習により、設定された被説明変数ごとに予測モデルを学習する。本実施形態で学習される予測モデルは、後述する最適化装置30が最適化結果として出力する変数(目的変数)の関数で表される。すなわち、目的変数(または、その関数)が、予測モデルの説明変数になっている。
例えば、売上高の総和を最大にするように価格の最適化を行う場合、学習器20は、過去の売上情報(価格、売上量など)や外部情報(天候や気温など)に基づいて、各商品の価格を説明変数とする売上数量の予測モデルを、対象とする商品ごとに生成する。このような予測モデルを複数の商品の売上数量を被説明変数として生成することにより、天候などの複雑な外部関係を考慮したうえで価格と需要との関係、および、競合する商品により発生する市場の共食い現象(いわゆる、カニバリゼーション)をモデル化できる。
予測モデルの生成方法は任意であり、例えば、単純な回帰手法が用いられてもよく、特許文献1に記載されたような学習方法が用いられてもよい。
ここで、最適化対象のインデックスの集合を{m|m=1,…,M}と記す。上述する例では、最適化対象は各商品の価格であり、Mは商品数に対応する。また、各最適化対象mについて予測する内容をSと記す。上述する例では、Sは、商品mの売上数量に対応する。また、各最適化対象mについて最適化する内容(すなわち、最適化の目的変数)をPまたはP´と記す。上述する例では、Pは、商品mの価格に対応する。線形回帰を使用してS(例えば、売上数量(需要))とP(例えば、価格)との依存関係をモデル化すると、Sを予測する予測モデルは、例えば、以下に例示する式1で表される。
Figure 0006791151
式1において、fは特徴生成関数であり、P´に対する変換を表わす。また、Dは特徴生成関数の数を示し、P´に対して行われる変換の数を示す。fの内容は任意であり、例えば、線形変換を行う関数であってもよく、対数や多項式のような非線形変換を行う関数であってもよい。上述するように、Pが商品mの価格であり、Sが商品mの売上数量を示す場合、fは、例えば、価格に関する売上の反応を表わす。売上の反応とは、例えば、ある程度の値下げをすると売上の反応が良くなる、または、反応が悪くなる、値下げに応じて売上数量が二乗になる、などが挙げられる。
また、式1において、gは、外的特徴(上述する例の場合、天候など)であり、D´は、外的特徴の数である。なお、外的特徴に関しては、事前に変換をしておいてもよい。また、式1におけるα、β、γは、それぞれ学習器20による機械学習の結果得られる回帰式の定数項および係数である。これまでの説明から明らかである通り、予測モデルは、被説明変数(S)および説明変数(Pや、各種外的特徴など)に基づいて学習され、被説明変数と説明変数との間の関係を示し、説明変数の関数で表されるものである。
なお、時間経過を考慮し、上述する式1を以下に例示する式2に変形することも可能である。
Figure 0006791151
式2において上付きtは、時間のインデックスを表わす。これは、例えば窓関数によって時間的に訓練データ集合をスライドさせ、時間tとともに予測式を更新している場合に相当する。このように、予測モデルは、過去に取得された最適化の目的変数の実績データに基づいて学習され、その目的変数を説明変数とする関数で表される。このように、学習器20が、過去に取得された実績データを用いるため、人手で訓練データを生成する必要がない。また、機械学習により予測モデルを学習するため、対象とするデータが大量になっても対応可能であり、また、時間と共に変化する売上量のトレンドに対して自動的にモデルを再学習し追従することができる。学習器20は、生成した予測モデルを最適化装置30に入力する。
最適化装置30は、目的とする内容の最適化を行う。具体的には、最適化装置30は、目的変数等に対して定められた各種制約条件(詳細は後述)を満たしつつ、目的関数の値が最適(最大、最小など)になるように、目的変数の値を最適化する。上述する例では、最適化装置30は、複数の商品の価格を最適化する。
最適化装置30は、予測モデル入力部31と、外的情報入力部32と、記憶部33と、問題記憶部34と、制約条件入力部35と、最適化部37と、出力部38と、目的関数生成部39とを含む。
予測モデル入力部31は、予測モデルを入力する装置である。具体的には、予測モデル入力部31は、学習器20が学習した予測モデルを入力する。また、予測モデル入力部31は、予測モデルを入力する際、最適化処理を行うために必要なパラメータも併せて入力する。予測モデル入力部31は、学習器20が学習した予測モデルに対してオペレータが手動で修正した予測モデルを入力してもよい。なお、予測モデル入力部31は、最適化装置30で利用される予測モデルを受け付けていることから、予測モデルを受け付ける予測モデル受付部ということができる。
外的情報入力部32は、予測モデル以外で、最適化に用いられる外的情報を入力する。例えば、上述する例において来週の価格を最適化しようとする場合、外的情報入力部32は、来週の天気に関する情報を入力してもよい。また、例えば来週の来店人数を予測できるような場合、外的情報入力部32は、来週の来店人数に関する情報を入力してもよい。この例のように、外部情報は、機械学習による予測モデルによって生成されたものでもよい。ここで入力される外的情報は、例えば、予測モデルの説明変数に適用される。
記憶部33は、予測モデル入力部31が入力した予測モデルを記憶する。また、記憶部33は、外的情報入力部32が入力した外的情報を記憶する。記憶部33は、例えば、磁気ディスク装置により実現される。
問題記憶部34は、最適化部37による最適化の評価尺度を記憶する。具体的には、問題記憶部34は、最適化により解こうとする数理計画問題を記憶する。数理計画問題は、ユーザ等により予め問題記憶部34に記憶される。問題記憶部34は、例えば、磁気ディスク装置により実現される。
なお、本実施形態では、数理計画問題の目的関数あるいは制約条件は、予測モデルがパラメータになるように定義される。すなわち、本実施形態の目的関数あるいは制約条件は、予測モデルの汎関数として定義される。例えば、上述する例の場合、問題記憶部34は、売上高の総和を最大化するための数理計画問題を記憶する。この場合、最適化部37は、売上高の総和を最大化するように各商品の価格を最適化する。各商品の売上高は、商品の価格と予測モデルで予測される売上数量の積で定義できるため、問題記憶部34は、例えば、以下に例示する式3で特定される数理計画問題を記憶してもよい。
Figure 0006791151
式3において、Tteは、最適化すべき期間の時間インデックスである。例えば次の1週間の売上高の総和を最大化する場合で、時間の単位が「日」の場合、Tteは、次の日から1週間の日付の集合である。
制約条件入力部35は、最適化する際の制約条件を入力する。制約条件の内容は任意であり、例えば、ビジネス上の制約などが制約条件として入力される。例えば、ある商品の売上数量に対してノルマがある場合、“Sm(t)≧ノルマ”という制約条件を課すことが考えられる。他にも、2つの商品の価格P、価格Pの大小を規定した制約条件(例えば、P≧Pなど)が課されてもよい。
また、制約条件が予測モデルを引数としている場合、制約条件入力部35は、予測モデルの入力を受け付ける予測モデル受付部として動作してもよいし、記憶部33に記憶された予測モデルを読み取ってもよい。そして、制約条件入力部35は、取得した予測モデルを引数とする制約条件を生成してもよい。
目的関数生成部39は、数理計画問題の目的関数を生成する。具体的には、目的関数生成部39は、予測モデルをパラメータとする数理計画問題の目的関数を生成する。目的関数生成部39は、例えば、問題記憶部34に記憶された数理計画問題に適用する予測モデルを記憶部33から読み取り、目的関数を生成する。
また、上述する例のように、予測する内容に応じて、機械学習により複数の予測モデルが学習される。この場合、問題記憶部34にも、複数の予測モデルが記憶されることになる。この場合、目的関数生成部39は、問題記憶部34に記憶された数理計画問題に適用する複数の予測モデルを記憶部33から読み取り、目的関数を生成してもよい。
最適化部37は、入力された各種情報に基づいて、目的とする内容の最適化を行う。具体的には、最適化部37は、目的関数の値が最適になるように、目的変数の値を最適化する。上述するように、目的変数等に対して各種制約条件が定められるため、最適化部37は、制約条件を満たしつつ、目的関数の値が最適(最大、最小など)になるように、目的変数の値を最適化する。
本実施形態では、最適化部37は、上述するような予測モデルがパラメータになっている目的関数の値を最適化するように数理計画問題を解いていると言うことができる。最適化部37は、例えば、上述する式3で特定される数理計画問題を解くことで、複数の商品の価格を最適化してもよい。また、制約条件が予測モデルを引数としている場合、最適化部37は、この制約条件のもとで、目的関数を最適化する目的変数を算出しているとも言える。
出力部38は、最適化部37による最適化結果を出力する。
予測モデル入力部31と、外的情報入力部32と、制約条件入力部35と、最適化部37と、出力部38と、目的関数生成部39とは、プログラム(情報処理用プログラム、または、最適化プログラム)に従って動作するコンピュータのCPUによって実現される。例えば、プログラムは、最適化装置30の記憶部33に記憶され、CPUは、そのプログラムを読み込み、プログラムに従って、予測モデル入力部31、外的情報入力部32、制約条件入力部35、最適化部37、出力部38および目的関数生成部39として動作してもよい。
また、予測モデル入力部31と、外的情報入力部32と、制約条件入力部35と、最適化部37と、出力部38と、目的関数生成部39とは、それぞれが専用のハードウェアで実現されていてもよい。予測モデル入力部31と、外的情報入力部32と、制約条件入力部35と、最適化部37と、出力部38と、目的関数生成部39とは、それぞれが電気回路構成(circuitry )により実現されていてもよい。ここで、電気回路構成(circuitry )とは、単一のデバイス(single device )、複数のデバイス(multiple devices)、チップセット(chipset )またはクラウド(cloud )を概念的に含む文言である。また、本発明による最適化システムは、2つ以上の物理的に分離した装置が有線または無線で接続されることにより構成されていてもよい。
次に、本実施形態の最適化システムの動作を説明する。図2は、本実施形態の最適化システムの動作例を示すフローチャートである。まず、学習器20は、訓練データ記憶部10に記憶された各種訓練データに基づいて、設定された被説明変数ごとに予測モデルを学習する(ステップS11)。
予測モデル入力部31は、学習器20が生成した予測モデルを入力し(ステップS12)、記憶部33に記憶する。また、外的情報入力部32は、外的情報を入力し(ステップS13)、記憶部33に記憶する。
目的関数生成部39は、予測モデル入力部31に入力された1つ以上の予測モデル、および、問題記憶部34に記憶された数理計画問題を読み込む。そして、目的関数生成部39は、数理計画問題の目的関数を生成する(ステップS14)。一方、制約条件入力部35は、最適化を行う際の制約条件を入力する(ステップS15)。
最適化部37は、入力された制約条件のもとで、目的関数の値が最適になるように、目的変数の値を最適化する(ステップS16)。
以上のように、本実施形態では、 予測モデル入力部31が、被説明変数および説明変数に基づいて学習され、被説明変数と説明変数との間の関係を示し、説明変数の関数で表される予測モデルを受け付ける。そして、最適化部37が、受け付けられた予測モデルを引数とする目的関数について、制約条件のもとで、その目的関数を最適化する目的変数を算出する。
具体的には、目的関数生成部39により、数理計画問題の目的関数が予測モデルを引数として定義され、最適化部37が、その予測モデルを引数とする制約条件のもとで、数理計画問題の目的関数の値が最大化されるように目的変数の値を最適化する。そのような構成により、数理最適化で観測されない入力データが存在する状況であっても、適切に最適化を行うことができる。
なお、本実施形態では、売上高の総和を最大化するように複数の商品の価格を最適化する方法を例示した。他にも、最適化部37は、利益を最大にするように複数の商品の価格を最適化してもよい。
以下、第1の実施形態の理解を容易にするため、簡単な具体例を用いて、第1の実施形態の適用例を説明する。まず、第1の適用例として、複数の商品の売上の予測に基づいて、複数の商品の売上高の総和を最大にするように複数の商品の価格を最適化する場合について説明する。
例えば、ある小売店において、この先一ヶ月のサンドイッチ群の売上高の総和を最大にする場合を考える。サンドイッチ群は、サンドイッチA、B、CおよびDの4種類のサンドイッチを含むとする。この場合、サンドイッチ群の売上高の総和、すなわち、サンドイッチA、B、CおよびDの4つのサンドイッチの売上高の総和が最大化されるように、サンドイッチA,B、CおよびDのそれぞれの販売価格を最適化するという問題を解くことになる。
訓練データ記憶部10は、過去の各サンドイッチの売上高を示すデータおよび過去の各サンドイッチの販売価格を記憶する。訓練データ記憶部10は、天気や暦情報などの外的情報を記憶していてもよい。
学習器20は、訓練データ記憶部10に記憶された各種訓練データに基づいて、機械学習により、例えば、各サンドイッチの売上数量を予測するための予測モデルを学習する。
ここでは、サンドイッチAの売上数量を予測するための予測モデルについて例示する。サンドイッチAの売上数量は、サンドイッチA自体の販売価格の影響を受けると考えられる。また、サンドイッチAの売上数量は、サンドイッチAと共に商品棚に陳列されるサンドイッチ、すなわちサンドイッチB、CおよびDの販売価格の影響も受けると考えられる。その小売店に来店する顧客は、商品棚に同時に陳列されるサンドイッチA、B、CおよびDのうちから、好ましいサンドイッチを選択的に購入すると考えられるからである。
この状況で、例えば、サンドイッチBが大安売りされている日を想定する。普段はサンドイッチAを好んで購入する顧客であっても、このような日にはサンドイッチAではなくサンドイッチBを選択して購入する可能性がある。顧客(人間)が一度に食することができるサンドイッチの量には限りがあるので、一般的な顧客がサンドイッチAとBの両方を購入しようと考える可能性は低いからである。
この場合、結果的には、サンドイッチBが安売りされていることにより、サンドイッチAの売上数量が減ることになる。このような関係は、カニバリゼーション(市場の共食い関係)の関係と呼ばれる。
すなわち、このカニバリゼーションとは、ある商品の価格を下げると、その商品の売上量は上がる一方で、他の競合商品(性質や特徴が互いに類似した複数の商品)の売上量が減少するような関係である。
したがって、サンドイッチAの売上数量S(被説明変数)を予測する予測モデルは、例えば、サンドイッチAの価格P、サンドイッチBの価格P、サンドイッチCの価格PおよびサンドイッチDの価格Pを説明変数として含む関数として表すことができる。
学習器20は、訓練データ記憶部10に記憶された各種訓練データに基づいて、サンドイッチAの売上数量Sを予測する予測モデル、サンドイッチBの売上数量Sを予測する予測モデル、サンドイッチCの売上数量Sを予測する予測モデル、サンドイッチDの売上数量Sを予測する予測モデルをそれぞれ生成する。
なお、サンドイッチの売上が外部情報(天候や気温など)の影響を受けると考えて、これら外部情報をも考慮した予測モデルが生成されてもよい。また、時間経過を考慮した予測モデルが生成されてもよい。これらの予測モデルは、例えば、上述した式1や式2で表現される。
これまでの説明から明らかである通り、予測モデルは、被説明変数(本実施形態においてはサンドイッチの売上数量)および説明変数(本実施形態においては、そのサンドイッチの販売価格および競合するサンドイッチの販売価格等)に基づいて学習され、被説明変数と説明変数との間の関係を示し、説明変数の関数で表されるものである。
最適化装置30は、目的とする内容、すなわち、サンドイッチA、B、CおよびDのそれぞれの販売価格(すなわち、P、P、PおよびP)の最適化を行う。具体的には、最適化装置30は、目的変数(すなわち、P、P、PおよびP)等に対して定められた各種制約条件を満たしつつ、目的関数(すなわち、サンドイッチ群の売上高の総和)の値が最大になるように、目的変数(すなわち、P、P、PおよびP)の値を最適化する。目的関数は、例えば、上述した式3で表現される。
本適用例では、目的関数が予測モデルを引数として定義される例を説明し、最適化装置30が扱う目的関数(すなわちサンドイッチ群の売上高の総和)は上記に例示する式3で表すことができる。
最適化装置30には、上述する式3で表されるような目的関数の“形”があらかじめ記憶されているとする。最適化装置30は、学習器20が生成した予測モデル(すなわちSを予測する予測モデル、Sを予測する予測モデル、Sを予測する予測モデルおよびSを予測する予測モデル)を上記目的関数の“形”に代入することにより、最適化問題の目的関数を生成する。
最適化装置30は、予測モデルを引数とする目的関数について、制約条件のもとでその目的関数を最適化する目的変数の値(すなわちP、P、PおよびPの値)を算出する。以上、簡単な具体例を用いて、第1の実施形態の適用例を説明した。なお、上述の説明では、理解を容易にするために、高々4つの商品の売上高の総和が最大になるように、個々の商品の販売価格を最適化したが、最適化の対象は4つに限定されず、2つまたは3つであってもよく、5つ以上であってもよい。また、予測対象も商品に限定されず、例えば、サービスなどであってもよい。
次に、実際の小売店において、大量の商品の総売上数が最大化されるように個々の商品の販売価格を最適化したい、という問題を扱う場合を考える。このような場合、数理計画問題(最適化問題)の目的関数を人手で定義することは、煩雑に過ぎ、現実的ではない。
例えば小売店において、商品の将来の需要予測線が得られれば、需要に基づいて発注と在庫を最適化することは可能である。しかし、人手で需要予測線を引く事ができる商品数には限りがあり、また数時間に1回の発注作業のたびに需要予測を繰り返すことは現実的ではない。また例えば、将来のある期間の売上が最大となるように、その期間の各商品価格を最適化するためには、大量の商品の価格と需要の間の複雑な相関関係を把握する必要があり、人手でこれを行う事は難しい。
上記適用例にて示したとおり、まずは目的関数の“形”を定義しておき、具体的な目的関数は予測モデルを引数として定義されるよう設計することで、数理最適化で観測されない大量の入力データが存在する状況においても、数理計画問題の目的関数を効率良く生成することができる。また、本実施形態では、上記カニバリゼーションのように複数の大量のデータ間に複雑な相関関係が存在する状況においても、適切に最適化を行うことができる。
また、商品の売上や利益を最大化する商品の価格を決定する以外に、本実施形態の最適化システムを、例えば、商品の棚割りを最適化する事案に適用してもよい。この場合、学習器20が、例えば、商品mの売上数量Sの予測モデルを、以下のように線形回帰モデルで学習する。なお、Pは商品の価格であり、Hは棚の位置であり、θはパラメータである。
=linear_regression(P,H,θ)
このとき、最適化装置30は、PおよびHについて、売上(具体的には、商品mの価格Pと売上数量Sとの積の総和)を最大にするように最適化すればよい。また、この場合も、任意のビジネス制約(例えば、価格の条件など)が設定されてもよい。
また、上述した棚割り以外にも、小売価格最適化、ホテル部屋価格最適化、航空券価格最適化、駐車場料金最適化、キャンペーン最適化など、商材(サービス、製品いずれも含む)の価格と、商材の需要(複数の商材の価格の関数)との積で表される目的関数の最適化に、本願発明の最適化方法を適用可能である。
以下、上述する第1の適用例に続き、簡単な具体例を用いて、これらの第1の実施形態への適用例を説明する。ここでは、第2の適用例として、ホテル価格の最適化を説明する。この適用例の場合、売上高または利益を最大化することが目的であるため、目的関数は、売上高または利益を算出する関数で表わされる。目的変数として、例えば、ホテルの各部屋を利用するプランの料金設定が挙げられる。上述する小売と比較すると、小売の例で示した「サンドイッチ」が、本適用例では、例えば、「シングルルームの朝食付きプラン」に対応する。また、外部情報として、例えば、天候や季節、ホテルの周辺で行われるイベントなどが挙げられる。
次に、第3の適用例として、ホテル価格と在庫の最適化を説明する。この適用例の場合も、売上高または利益を最大化することが目的であるため、目的関数は、売上高または利益を算出する関数で表わされる。目的変数には、価格および在庫を考慮した内容が選択される。例えば、第1の目的変数として、各プランで利用される部屋をどの時期にどのくらいの料金で販売するかを表わす変数、第2の目的変数として、各プランで利用される部屋をどの時期に何部屋販売するかを表わす変数、などが挙げられる。また、第2の適用例と同様、外部情報として、例えば、天候や季節、ホテルの周辺で行われるイベントなどが挙げられる。
次に、第4の適用例として、航空券の価格と在庫の最適化を説明する。この適用例の場合も、売上高または利益を最大化することが目的であるため、目的関数は、売上高または利益を算出する関数で表わされる。目的変数も、第3の適用例と同様、価格および在庫を考慮した内容が選択される。各航空券が、目的地までのルートや座席の種類(クラス)表すとすると、例えば、第1の目的変数として、各航空券をどの時期にどのくらいの料金で販売するかを表わす変数、第2の目的変数として、各航空券をどの時期に何枚販売するかを表わす変数、などが挙げられる。また、外部情報として、例えば、季節や開催されるイベントなどが挙げられる。
次に、第5の適用例として、各駐車場の駐車料金の最適化を説明する。この適用例の場合も、売上高または利益を最大化することが目的であるため、目的関数は、売上高または利益を算出する関数で表わされる。目的変数は、例えば、時間帯および場所別の駐車料金が挙げられる。また、外部情報として、例えば、周囲の駐車場の駐車料金、ロケーション情報(住宅地、オフィス街、駅からの距離など)が挙げられる。
次に、予測モデルおよび予測に必要なデータ(予測用データ)の流れを中心に、図1に例示する構成と比較しながら、第1の実施形態の最適化システムの変形例を説明する。図3は、本変形例による最適化システムの構成例を示す説明図である。
図3に例示する最適化システムは、データ前処理部150と、データ前処理部160と、学習エンジン170と、最適化装置180とを備えている。データ前処理部150と、データ前処理部160とは、各データに対して、欠損値を埋めるなど、一般的な処理を行う機能を有する。また、学習エンジン170は、第1の実施形態の学習器20に対応し、最適化装置180は、第1の実施形態の最適化装置30に対応する。
まず、分析・予測対象データ100dから、分析用データ110dおよび予測用データ120dが生成される。分析・予測対象データ100dは、例えば、気象やカレンダデータなどの外部情報101d、売上・価格情報102d、商品情報103dなどを含む。
分析用データ110dは、学習エンジン170が学習に用いるデータであり、第1の実施形態の訓練データ記憶部10が記憶するデータに対応する。また、予測用データ120dは、外部データおよびその他予測に必要なデータであり、具体的には、予測モデルにおける説明変数の値である。予測用データ120dは、第1の実施形態の記憶部33が記憶するデータの一部または全部に対応する。
図3に示す例では、データ前処理部150が分析・予測対象データ100dから分析用データ110dを生成し、データ前処理部160が分析・予測対象データ100dから予測用データ120dを生成する。
学習エンジン170は、分析用データ110dを用いて学習し、予測モデル130dを出力する。最適化装置180は、予測モデル130dと、予測用データ120dを入力として最適化処理を行う。
なお、図3において例示する各データ(分析・予測対象データ110d(具体的には、外部情報101d、売上・価格情報102d、および、商品情報103d)、分析用データ110d、および、予測用データ120d)は、例えば、最適化システムにおける記憶部(図示せず)のデータベースに保持される。
第1の実施形態で説明するように、最適化する目的関数が予測モデルを引数として定義される。また、図3に示すように、予測用データが最適化の入力にもなっている。すなわち、本発明では、図3に例示するように、予測モデルと予測用データとが最適化の入力になっていることも特徴である。
実施形態2.
次に、本発明による最適化システムの第2の実施形態を説明する。第1の実施形態では、過去のデータから観測されないデータを予測するモデルを機械学習し、その予測モデルに基づく将来の予測結果に基づいて数理計画法の目的関数や制約条件を自動的に生成し最適化を実行する方法について説明した。
一方、前述するように、このような最適化を行う過程において、上記で述べた機械学習に基づく予測モデルが、非線形な基底関数に基づく場合がある。例えば、上記で述べた価格の予測問題について、機械学習に基づく予測モデルへ入力する特徴量として、価格の二乗や価格の対数変換といった非線形変換を行うとする。この場合、数理最適化の目的関数(将来のある期間の売上)は、価格を複雑に非線形変換した特徴量の関数になるため、一般的な方法を用いて、このような数理最適化を効率的に解くことは難しい。
そこで、第2の実施形態では、最適化に用いられる予測モデルが非線形な基底関数に基づく場合であっても、高速かつ高精度に数理最適化の解を求めることができる方法を説明する。
図4は、本発明による最適化システムの第2の実施形態の構成例を示すブロック図である。本実施形態の最適化システムは、訓練データ記憶部10と、学習器20と、最適化装置40とを備えている。図4に例示する最適化システムは、本発明における情報処理システムに対応する。また、訓練データ記憶部10および学習器20の内容は、第1の実施形態と同様である。
最適化装置40は、予測モデル入力部31と、外的情報入力部32と、記憶部33と、問題記憶部34と、制約条件入力部35と、候補点入力部36と、最適化部37と、出力部38と、目的関数生成部39とを含む。
最適化装置40は、第1の実施形態と同様、目的とする内容の最適化を行う装置である。ただし、最適化装置40は、候補点入力部36をさらに備えている点において、第1の実施形態の最適化装置30と異なる。そして、本実施形態の最適化部37は、候補点入力部36の入力も考慮して最適化を行う。それ以外の構成の内容は、第1の実施形態と同様である。
候補点入力部36は、最適化の候補点を入力する。候補点とは、目的変数の候補となる離散的な値である。例えば、上述する例の場合、候補点として価格の候補(例えば、割引なし、5%割引、7%割引、など)が挙げられる。このような候補点を入力することで、最適化のコストを低減できる。
図5は、候補点入力部36がユーザから候補点の入力を受け付ける画面の例を示す説明図である。図5に示す例では、候補点入力部36は、線形回帰モデルで使われている商品の価格の一覧を左側に表示し、その各商品の価格に設定する価格候補の一覧を右側に表示していることを示す。すなわち、候補点入力部36は、最適化する目的変数の一覧およびその目的変数が取り得る値の候補を表示し、選択された目的変数の候補を受け付けて入力する。
図5に示す例では、オペレータがサンドイッチA(200円)の価格の候補として、割引なし、1%割引、2%割引および5%割引という4つの候補を設定したことを示す。なお、図5に示す例では、目的変数の候補として割引を示す情報を表示しているが、候補点入力部36は、具体的な価格の候補値(例えば、190円、200円、210円および220円という候補値)を表示してもよい。
以下、候補点が入力される場合の数理計画問題について具体例を挙げて説明する。ここで、最適化する内容のインデックスの集合を{k|k=1,…,K}と記す。上述する例では、Kは価格の候補の数に対応する。例えば、商品「サンドイッチA」の価格の候補が、“割引なし、1%割引、2%割引および5%割引”の4つである場合、K=4である。また、商品mの最適化する内容の候補の集合を、以下に示すように、上付きバーを付したPmkと記す。上述する例では、上付きバーを付したPmkは、商品mについての価格の候補を示す。
Figure 0006791151
また、mのk番目のインジケータをZmkと記す。ここで、Zmkは、以下の条件を満たす。
Figure 0006791151
このように定義した場合、商品mの価格Pは、以下に例示する式4で定義される。すなわち、この定義により、目的変数である価格Pが離散化されたと言うことができる。
Figure 0006791151
このとき、上述する式1は、以下のように変形可能である。
Figure 0006791151
また、上述する式3は、以下に例示する式5のように変形可能である。なお、式5において、Z=(Z11,…,Z1K,…,ZMK)である。
Figure 0006791151
例えば、候補点が入力されない場合、最適化部37は、上述する式3で特定される数理計画問題を解くことで、複数の商品の価格を最適化してもよい。また、候補点が入力された場合、最適化部37は、上述する式5の数理計画問題を解くことで、複数の商品の価格を最適化してもよい。
このとき、制約条件入力部35も候補点を考慮した入力を受け付けてもよい。ここで、上述する商品の最適化で設定される制約条件の具体的一例を説明する。一般に、ボールペン1本単体の価格と、同じブランドのボールペン6本セットの価格とを比較した場合、ボールペン6本セットのボールペン1本当たりの価格は、ボールペン1本単体の価格よりも安いことが期待される。この種の制約条件は、以下に例示する式6で定義される。
Figure 0006791151
式6において、PCは、制約条件が適用されるインデックス対の集合を示し、wm,nは、重みを示す。なお、PCおよびwm,nは、予め与えられる。
以下、最適化部37が最適化処理を行う具体例を、上述する式5を用いて説明する。上述する式5の場合、目的関数は、以下のように変形可能である。
Figure 0006791151
ここで、[Q]i,jは行列Qの(i,j)番目の要素であり、[r]はベクトルrのi番目の要素である。したがって、上述するQは、対称行列ではなく、半正定値ではない。この問題は、非凸基数(0−1整数)二次計画問題と呼ばれる、混合整数二次計画問題の一種である。この問題は、混合整数計画問題に変形することで効率的に解くことが可能である。
ここでは、混合整数計画緩和を用いて、上述する式5で特定される数理計画問題を解く方法を説明する。上付きバーを付した新たな変数Zi,jを用いて、以下の式7で例示する変形処理が行われる。
Figure 0006791151
ここで、最適解において、上付きバーを付した変数Zi,jがZをとる、以下の式8で示す制約が定義される。
Figure 0006791151
上述する式8に示す等式を追加することにより、上述する式7を以下に例示する式9のように新たに定式化できる。
Figure 0006791151
なお、制約条件数を減らして計算を効率化するために、上述する式9の条件から以下の不等式が削除されてもよい。
Figure 0006791151
最適化部37は、このようにして変形された定式を最大化するように、複数の商品の価格を最適化すればよい。なお、候補点入力部36に候補点が入力されない場合、最適化部37は、上述する式3の数理計画問題を解いてもよい。また、なお、MILP(mixed integer linear programming)緩和において、上述する式6の制約条件を適用することも可能である。
予測モデル入力部31と、外的情報入力部32と、制約条件入力部35と、候補点入力部36と、最適化部37と、出力部38と、目的関数生成部39とは、プログラム(情報処理用プログラム、または、最適化プログラム)に従って動作するコンピュータのCPUによって実現される。
また、予測モデル入力部31と、外的情報入力部32と、制約条件入力部35と、候補点入力部36と、最適化部37と、出力部38と、目的関数生成部39とは、それぞれが専用のハードウェアで実現されていてもよい。また、予測モデル入力部31と、外的情報入力部32と、制約条件入力部35と、候補点入力部36と、最適化部37と、出力部38と、目的関数生成部39とは、それぞれが電気回路構成(circuitry )により実現されていてもよい。
次に、本実施形態の最適化システムの動作を説明する。図6は、本実施形態の最適化システムの動作例を示すフローチャートである。なお、学習されたモデル及び外的情報を入力して目的変数を生成し、制約条件を入力するまでのステップS11からステップS15までの処理は、図2に示す内容と同様である。
候補点入力部36は、目的変数の取り得る値の候補である候補点を入力する(ステップS18)。ここで入力される候補点の数は、1つであってもよく、複数であってもよい。そして、最適化部37は、入力された候補点および入力された制約条件のもとで、目的関数の値が最適になるように、目的変数の値を最適化する(ステップS19)。
以上のように、本実施形態では、数理計画問題の目的関数の値が最適になるように目的変数の値を最適化する最適化システムについて説明した。具体的には、予測モデル入力部31が、数理計画問題の目的変数を説明変数とする関数で表される線形回帰モデルを入力する。また、候補点入力部36が、線形回帰モデルに含まれる目的変数について、その目的変数が取り得る値の離散的な候補(候補点)を入力する。そして、最適化部37が、線形回帰モデルを引数とする数理計画問題の目的関数を最適化する目的変数を算出する。その際、最適化部37は、目的変数を最適化する候補点を選択して目的変数を算出する。
そのような構成により、最適化に用いられる予測モデルが非線形な基底関数に基づく場合であっても、高速かつ高精度に数理最適化の解を求めることができる。
具体的には、最適化部37は、上述する式1に例示する線形回帰式で表される予測モデルをパラメータとする目的関数を最適化する。ここで、式1の線形回帰式は、説明変数の少なくとも一部が非線形関数fで表されるとする。
例えば、価格のようにあらゆる候補を想定可能な目的変数であっても、現実的には、一定の価格候補を予め定めて最適化を実施することが多い。上述する式1の形式で表される予測モデルSは、最適化の対象である目的変数Pにfという関数を適用したものである。説明変数が非線形関数fで表される場合、線形回帰式の形式で表されている関数であっても、価格に関して言えば非線形関数であるため、最適化をするのは難しい。
しかし、本実施形態では、目的変数を離散化して候補点を与えることにより、最適化の目的関数に関する非線形な式を、fに関わらず、Zという離散変数に関する線形式に変形できる。すなわち、線形回帰として表現されてはいるが、非線形変換をしているような線形回帰式に対し、最適化の目的変数を予め設定する(例えば、人間が与える)ことによって、最適化処理を高速に行うことが可能になる。
また、本実施形態による方法を用いることで、後述する第3の実施形態に示す方法を適用することが可能になり、最適化処理を高速に行うことが可能になる。
なお、本実施形態では、売上高の総和を最大化するように複数の商品の価格を最適化する方法を例示した。他にも、最適化部37は、利益を最大にするように複数の商品の価格を最適化してもよい。この場合、目的関数生成部39は、例えば、以下に例示する目的関数を生成してもよい。なお、cは、Zに依存しない項である。
Figure 0006791151
上述する目的関数も、非凸基数(0−1整数)二次計画問題であり、cがZに依存しないため、上述する式Aと数理的に等価な問題として、上述した解法を適用可能である。
また、本実施形態では、第1の実施形態と同様、売上数量を回帰することで売上高(価格×売上数量)を最適化する場合について説明した。一方、回帰する対象を売上数量でなく、売上高としてもよい。売上高を直接回帰する場合、学習器20が、目的変数の二次関数の非線形変換を規定とする回帰式で売上高を学習する。この場合の回帰式は、例えば、以下に示す式B1で表わされる。
Figure 0006791151
式B1において、φ、およびψは、それぞれ任意の基底関数である。また、xが価格に対応する。この関数を最適化の目的関数とする。上述する式4で示す場合と同様、以下の式B2に示すようにxを離散化する。
Figure 0006791151
このようにxを離散化した後、以下に示す変形を経ることで、以下の式B3に示すようなBQP問題に帰着させることが可能である。したがって、売上高を回帰する場合にも、本実施形態で示した方法を用いて最適化できる。
Figure 0006791151
Figure 0006791151
Figure 0006791151
実施形態3.
次に、本発明による最適化システムの第3の実施形態を説明する。最適化の手法として、BQP(Binary Quadratic Programming Problem:二値二次計画問題)が知られている。第2の実施形態で示すように、線形予測に離散化を適用することで、上述する式Aを生成できるため、第2の実施形態の問題は、BQPに変換可能である。BQPは、NP困難な問題であり、厳密解が求まらないため、一般に整数計画法という枠組みを用いて解くことが知られている。
第2の実施形態では、混合整数計画緩和により、BQPを解く方法を説明した。本実施形態では、上述する式Aに例示されるBQPをより高速に解くための方法を説明する。なお、本実施形態の最適化システムの構成は、第2の実施形態の最適化システムの構成と同様である。ただし、最適化部37が最適化処理を行う方法が、第2の実施形態と異なる。
具体的には、本実施形態の最適化部37は、BQPをSDP(Semidefinite Programming:半正定計画問題)と呼ばれる解きやすい問題に緩和し、SDPの解を基にBQPを最適化する。
一例として、まずBQPを以下に例示する式10のように定式化する。式10において、MおよびKは自然数である。また、式10において、Qは、KM×KMの正方行列であり、rはKM次ベクトルである。
Figure 0006791151
ここで、サイズnの全ての対称行列の集合をSymと記す。具体的には、Symは、以下のように記される。
Figure 0006791151
また、全てが1のベクトルを、太字の1で記すことがある。なお、太字の1=(1,1,…,1)である。また、Sym上の内積が、黒丸記号を用いて、以下のように定義される。
Figure 0006791151
また、全てのベクトルxについて以下に例示する式11が成り立つ。そのため、上述する式10のQは、以下に例示する式12に置き換えることが可能である。したがって、一般性を失うことなく、Qは対称行列と想定される。
Figure 0006791151
次に、SDP緩和の方法を説明する。まず、最適化部37は、式10に例示するBQPを{1,−1}値を取る変数に変換する。t=−1+2Zとすると、上述する式10は、以下に例示する式13に変形される。
Figure 0006791151
したがって、上述する式10は、以下に例示する式14と等価になる。
Figure 0006791151
次に、最適化部37は、S={1,−1}値を取る各変数tを、SKM値を取る変数xに緩和する。Snは、以下の式15に例示するように、n次元単位球面を表わす。
Figure 0006791151
この場合、上述する式14は、以下に例示する式16の問題に緩和される。
Figure 0006791151
ここで、上述する式14の目的関数の“1”も同様に、単位ベクトルxに置き換えられる。上述する式14の許容解tについて、以下に示す式17により、式16の許容解が定義され、目的関数の値は矛盾しない。したがって、上述する式16の問題は、上述する式14を緩和したものになる。
Figure 0006791151
最適化部37は、上述する式16の問題をSDP問題に変換する。式16に示される目的関数は、以下に示す式18に変換される。
Figure 0006791151
この定義により、Yは、半正定値であり、以下に示す式19を満たす。
Figure 0006791151
Yが半正定値であるならば、(KM+1)次元ベクトルx,x,…,xKMは、上述する式18に示す条件および式19を満たす。
行列Yを用いてyii=1とすることにより、制約条件||x||=1を表現することが可能である。xは、単位ベクトルであるため、以下に示す式20を満たす場合にのみ、式21が成り立つ。
Figure 0006791151
行列Yを用いると、これらの条件は、以下に示す式22のように表現される。
Figure 0006791151
以上のことから、最適化部37は、以下の式23で示すSDP問題を生成できる。この問題は、上述する式16に示す問題と等価であり、上述する式10の緩和である。したがって、式23の最適値は、上述する式10の最適値の上界になる。
Figure 0006791151
次に、式23に示す問題の最適解が与えられたときに、その最適解を式10に示す問題のZに変換する方法を説明する。以下ではこの変換操作を丸めと呼ぶ。ここで、SDP緩和により導出された最適解をチルダYとする。
上述する式16の導出において、“1”がベクトルxに置き換えられ、t(i=1,…,KM)がベクトルxに置き換えられた。したがって、ZとYとの間には、以下の式24で示す関係が存在する。
Figure 0006791151
そのため、チルダy0iが他のチルダy0jを超えるようなiについてZを1に固定するのは適当であると言える。以上のことを前提に、最適化部37がSDP緩和により上述する式10で示されるBQPを解く動作を説明する。
図7は、最適化部37がSDP緩和によりBQPを解く動作例を示すフローチャートである。図7に例示する動作例(アルゴリズム)は、丸めを1度行うものである。
最適化部37は、上述する式10で示されるBQPをSDP緩和した式23に示す問題に変換し(ステップS21)、最適解をチルダYとする。最適化部37は、以下に示す式25を満たす値(以下、チルダkと記す。)を探索する(ステップS22)。ただし、チルダkは、{1,…,K}の要素である。
Figure 0006791151
最適化部37は、ZKm+チルダkが1になるように(それ以外は0になるように)設定する(ステップS23)。
図8は、最適化部37がSDP緩和によりBQPを解く他の動作例を示すフローチャートである。図8に例示する動作例(アルゴリズム)は、丸めを反復して行うものである。
最適化部37は、まず、インデックスの集合U={1,…,M}を初期化する(ステップS31)。最適化部37は、Uに含まれる各インデックスについて、以下の処理を繰り返す(ステップS32〜ステップS36)。
まず、最適化部37は、Zを部分的に固定して、上述する式10に示す問題を式23に示す問題(すなわち、SDP)に構築する(ステップS32)。最適化部37は、式23に示す問題を解き、最適解をチルダYとする(ステップS33)。最適化部37は、以下に示す式26を満たすチルダmおよびチルダkを探索する(ステップS34)。そして、最適化部37は、以下の式27に基づいてZを部分的に固定する(ステップS35)。
Figure 0006791151
最適化部37は、以下に示すようにUを更新する(ステップS36)。
Figure 0006791151
最適化部37は、図7または図8に例示するアルゴリズムを上述する式10で示す問題に適用することで、以下の3つを取得する。1つ目は、計算された(ほぼ正確な)式10で示す問題の解である。2つ目は、計算された(ほぼ正確な)式10で示す問題の最適値である。3つ目は、式23で示す問題の最適値である。このことから、以下の式28に示す不等式が得られる。
0 < 計算された式10の最適値 ≦ 式10の最適値 ≦ 式23の最適値
・・・(式28)
したがって、計算された解は、以下の式29を満たすことが保証される。
計算された解の近似率=計算された式10の最適値/式10の最適値
≧計算された式10の最適値/式23の最適値・・・(式29)
この不等式によって、計算された解の質を評価でき、また、分枝限定法などの、より高度なアルゴリズムを導出できる。
なお、最適化部37は、ユーザによって定義されたパラメータに基づいて網羅的に解の探索を行ってもよい。図9は、最適化部37がSDP緩和によりBQPを解くさらに他の動作例を示すフローチャートである。
図9に例示する動作例(アルゴリズム)では、最適解に近い少なくともTの解を列挙する。なお、Tは、ユーザによって定義されるパラメータである。
最適化部37は、上述する式10で示されるBQPをSDP緩和した式23に示す問題に変換し(ステップS41)、最適解をチルダYとする。最適化部37は、以下に示す式30を満たす値(チルダk)を探索する(ステップS42)。また、最適化部37は、インデックスの集合Cを以下に示す式31のように初期化する(ステップS43)。
Figure 0006791151
最適化部37は、以下に示す式32を満たす間、以下の処理を繰り返す(ステップS44〜ステップS45)。
Figure 0006791151
最適化部37は、以下に示す式33を満たす2つの値(チルダm、チルダk)を探索する(ステップS44)。ただし、チルダmは、{1,…,M}の要素であり、チルダkは、{1,…,K}の要素である。
Figure 0006791151
さらに、最適化部37は、チルダkを集合Cチルダmに追加する(ステップS45)。具体的には、以下の式34で表される。
Figure 0006791151
最適化部37は、DをZの集合とする(ステップS46)。ここで、Zは、以下の形式で示される。この場合、Dは、以下に示す式35を満たす。
Figure 0006791151
最適化部37は、全てのZについて目的関数の値を算出し(ステップS47)、算出した値でDの要素を並べ替える(ステップS48)。
図9に例示するアルゴリズムは、SDP緩和と網羅的探索とを組み合わせたものである。最適化部37が図9に例示するアルゴリズムを用いて最適化を行うことにより、SDPの解を使って網羅的探索の範囲を制限することが可能になる。
以上のように、本実施形態では、BQP問題で表される計画を最適化する最適化システムについて説明した。具体的には、最適化部37が、BQP問題をSDP問題に緩和して、そのSDP問題の解を導出する。したがって、一般に知られたBQPの解法と比較して、非常に高速に最適解を導出することができる。
具体的には、コンピュータを使用して本実施形態の方法を用いた実験の結果、一般的な方法ではBPQの最適解を求めるのに数時間要していた処理が、1秒程度にまで速度を上げることができた。
また、本実施形態では、上述する式10にように定式化されたBQPを例示して最適化部37の動作を説明した。ただし、BQPは、以下に例示する式36のようにも定式化できる。
Figure 0006791151
上述する式13の式によりAを定義する。この場合、式36で示す問題は、以下に例示する式37の問題と等価になる。また、式37に示す問題を緩和したものを以下の式38に示す。
Figure 0006791151
式38で示す問題は、以下に例示する式39のように等式および不等式を含む標準的な形式に書き換えることが可能である。なお、B4u、B5uおよびB6uは、以下に示す式40で定義される。また、Symn+1の要素であるB1i、B2sおよびB3sは、以下に示す式41で定義される。
Figure 0006791151
一方、上述する式39で示す問題は、以下に例示する式42のように等式で表される標準的な形式に書き換えることが可能である。なお、A´、B´1i、B´2s、B´3s、B´4u、B´5u、B´6vは、以下に示す式43で定義される。また、Symの要素であるKは、以下に示す式44で与えられる。
Figure 0006791151
次に、上述する式36で示す問題の双対問題を説明する。式36で示す問題の双対問題は、以下の式45で示される。
Figure 0006791151
式45において、fは、上述する式42の制約の右辺で与えられる。また、xは変数である。
一方、式36において許容解Zが与えられると、式42における許容解を、以下に例示する式46で表すことができる。
Figure 0006791151
また、式45で示す双対問題の許容解は、以下に例示する式47で与えられる。
Figure 0006791151
したがって、最適化部37は、上述する式46および式47を、上述する式42で示す問題の初期解として利用することが可能になる。
以上に示す内容を纏めると、最適化部37は、以下の式48に示すBQP問題を以下の式49に示すSDP問題に緩和する。すなわち、最適化部37は、式48に示すように、1−of−K制約(one−hot制約)、線形等式制約、および、線形不等式制約つきのBQP問題をSDP問題に緩和する。そして、最適化部37は、式49に示す問題から導出される解を、式48に示す問題の解に変換することで、式48に示す問題の最適解を導出する。
Figure 0006791151
式48において、Sは、1−of−K制約(one−hot制約)の個数、Uは、線形等式制約の個数、Vは、線形不等式制約の個数を表わす。また、式48における入力のうち、aおよびcがそれぞれn次元ベクトルを表わし、bおよびdがスカラ値を表わす。また、式49において、ベクトルa=(au,1,au,2,...,au,nであり、ベクトルc=(cu,1,cu,2,...,cu,nである。なお、上付きTは転置を示す。
次に、本発明の概要を説明する。図10は、本発明による最適化システムの概要を示すブロック図である。本発明による最適化システムは、二値二次計画問題で表される計画を最適化する最適化システムであって、二値二次計画問題を半正定計画問題に緩和して、その半正定計画問題の解を導出する最適化部88(例えば、最適化部37)を備えている。
そのような構成により、最適化に用いられる予測モデルが非線形な基底関数に基づく場合であっても、高速かつ高精度に数理最適化の解を求めることができる。
具体的には、最適化部88は、導出された半正定計画問題の解を二値二次計画問題の解に変換することで最適解を導出する。その際、最適化部88は、二値変数を多次元単位球面上の変数に拡張して半正定計画問題への緩和を行う。
その際、最適化部88は、上記の式48で表される1−of−K制約、線形等式制約、および、線形不等式制約つきの二値二次計画問題を、上記の式49で表される半正定値問題に緩和し、前記半正定値問題の解を前記二値二次計画問題の解に変換することで、当該二値二次計画問題の最適解を導出してもよい。
また、本発明は、数理計画問題を解くという処理と予測モデルを生成するという処理を、大量のデータ高速に短時間で処理するプロセッサ(コンピュータ)の能力により実現している。したがって、本発明は、単純な数学的処理にとどまらず、数理計画問題を応用して、大量のデータから予測結果および最適化結果を高速に得るために、コンピュータを駆使したものである。
図11は、少なくとも1つの実施形態に係るコンピュータの構成を示す概略ブロック図である。コンピュータ1000は、CPU1001、主記憶装置1002、補助記憶装置1003、インタフェース1004を備える。
上述の学習器20や最適化装置30は、それぞれコンピュータ1000に実装される。なお、学習器20が実装されたコンピュータ1000と最適化装置30が実装されたコンピュータ1000は異なるものであって良い。そして、上述した各処理部の動作は、プログラム(情報処理用プログラム、または、最適化プログラム)の形式で補助記憶装置1003に記憶されている。CPU1001は、プログラムを補助記憶装置1003から読み出して主記憶装置1002に展開し、当該プログラムに従って上記処理を実行する。また、上述の学習器20や最適化装置30は、それぞれが電気回路構成(circuitry )により実現されていてもよい。ここで、電気回路構成(circuitry )とは、単一のデバイス(single device )、複数のデバイス(multiple devices)、チップセット(chipset )またはクラウド(cloud )を概念的に含む文言である。
なお、少なくとも1つの実施形態において、補助記憶装置1003は、一時的でない有形の媒体の一例である。一時的でない有形の媒体の他の例としては、インタフェース1004を介して接続される磁気ディスク、光磁気ディスク、CD−ROM、DVD−ROM、半導体メモリ等が挙げられる。また、このプログラムが通信回線によってコンピュータ1000に配信される場合、配信を受けたコンピュータ1000が当該プログラムを主記憶装置1002に展開し、上記処理を実行しても良い。
また、当該プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、当該プログラムは、前述した機能を補助記憶装置1003に既に記憶されている他のプログラムとの組み合わせで実現するもの、いわゆる差分ファイル(差分プログラム)であっても良い。
以上、実施形態及び実施例を参照して本願発明を説明したが、本願発明は上記実施形態および実施例に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
この出願は、2015年9月30日に出願された米国仮出願第62/235,051号を基礎とする優先権を主張し、その開示の全てをここに取り込む。
10 訓練データ記憶部
20 学習器
30 最適化装置
31 予測モデル入力部
32 外的情報入力部
33 記憶部
34 問題記憶部
35 制約条件入力部
36 候補点入力部
37 最適化部
38 出力部
39 目的関数生成部

Claims (7)

  1. 二値二次計画問題で表される計画を最適化する最適化システムであって、
    最適化により解こうとする数理計画問題を記憶する問題記憶部と、
    前記問題記憶部に記憶された前記数理計画問題の目的関数として二値二次計画問題を生成する目的関数生成部と、
    前記二値二次計画問題を半正定計画問題に緩和して、当該半正定計画問題の解を導出する最適化部を備え
    前記最適化部は、以下の問題1で表される1−of−K制約、線形等式制約、および、線形不等式制約つきの二値二次計画問題
    Figure 0006791151
    を、以下の問題2で表される半正定計画問題
    Figure 0006791151
    に緩和し、前記半正定計画問題の解を前記二値二次計画問題の解に変換することで、当該二値二次計画問題の解を導出する
    ことを特徴とする最適化システム。
  2. 最適化部は、導出された半正定計画問題の解を変換して二値二次計画問題の解を導出する
    請求項1記載の最適化システム。
  3. 最適化部は、二値変数を多次元単位球面上の変数に拡張して半正定計画問題への緩和を行う
    請求項1または請求項2記載の最適化システム。
  4. 二値二次計画問題で表される計画を最適化する最適化方法であって、
    コンピュータが、最適化により解こうとする数理計画問題を記憶する問題記憶部に記憶された当該数理計画問題の目的関数として二値二次計画問題を生成し、
    前記コンピュータが、前記二値二次計画問題を半正定計画問題に緩和して、当該半正定計画問題の解を導出し、
    前記解の導出処理において、前記コンピュータが、以下の問題1で表される1−of−K制約、線形等式制約、および、線形不等式制約つきの二値二次計画問題
    Figure 0006791151
    を、以下の問題2で表される半正定計画問題
    Figure 0006791151
    に緩和し、前記半正定計画問題の解を前記二値二次計画問題の解に変換することで、当該二値二次計画問題の解を導出する
    ことを特徴とする最適化方法。
  5. コンピュータが、導出された半正定計画問題の解を変換して二値二次計画問題の解を導出する
    請求項記載の最適化方法。
  6. 二値二次計画問題で表される計画を最適化するコンピュータに適用される最適化プログラムであって、
    前記コンピュータに、
    最適化により解こうとする数理計画問題を記憶する問題記憶部に記憶された当該数理計画問題の目的関数として二値二次計画問題を生成する目的関数生成処理、および、
    前記二値二次計画問題を半正定計画問題に緩和して、当該半正定計画問題の解を導出する最適化処理
    を実行させ
    前記最適化処理で、以下の問題1で表される1−of−K制約、線形等式制約、および、線形不等式制約つきの二値二次計画問題
    Figure 0006791151
    を、以下の問題2で表される半正定計画問題
    Figure 0006791151
    に緩和させ、前記半正定計画問題の解を前記二値二次計画問題の解に変換することで、当該二値二次計画問題の解を導出させる
    ための最適化プログラム。
  7. コンピュータに、
    最適化処理で、導出された半正定計画問題の解を変換して二値二次計画問題の解を導出させる
    請求項記載の最適化プログラム。
JP2017542682A 2015-09-30 2016-08-09 最適化システム、最適化方法および最適化プログラム Active JP6791151B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562235051P 2015-09-30 2015-09-30
US62/235,051 2015-09-30
PCT/JP2016/003685 WO2017056366A1 (ja) 2015-09-30 2016-08-09 最適化システム、最適化方法および最適化プログラム

Publications (2)

Publication Number Publication Date
JPWO2017056366A1 JPWO2017056366A1 (ja) 2018-07-19
JP6791151B2 true JP6791151B2 (ja) 2020-11-25

Family

ID=58423212

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017542682A Active JP6791151B2 (ja) 2015-09-30 2016-08-09 最適化システム、最適化方法および最適化プログラム

Country Status (2)

Country Link
JP (1) JP6791151B2 (ja)
WO (1) WO2017056366A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6696655B2 (ja) * 2018-06-28 2020-05-20 株式会社ビジネスインテリジェンス 計画作成プログラム、計画作成装置、及び計画作成方法
JP7193708B2 (ja) 2018-10-19 2022-12-21 富士通株式会社 最適化装置及び最適化装置の制御方法
JP7124767B2 (ja) * 2019-03-05 2022-08-24 日本電信電話株式会社 問題求解装置、方法、及びプログラム
JP7185140B2 (ja) 2019-04-11 2022-12-07 富士通株式会社 最適化装置及び最適化装置の制御方法
JP7323777B2 (ja) 2019-06-18 2023-08-09 富士通株式会社 最適化装置および最適化方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3190844B2 (ja) * 1996-12-20 2001-07-23 日本電気株式会社 コンピュータ演算処理方法

Also Published As

Publication number Publication date
WO2017056366A1 (ja) 2017-04-06
JPWO2017056366A1 (ja) 2018-07-19

Similar Documents

Publication Publication Date Title
JP6856023B2 (ja) 最適化システム、最適化方法および最適化プログラム
WO2017056367A1 (ja) 情報処理システム、情報処理方法および情報処理用プログラム
US11281969B1 (en) Artificial intelligence system combining state space models and neural networks for time series forecasting
JP6791151B2 (ja) 最適化システム、最適化方法および最適化プログラム
Lazzeri Machine learning for time series forecasting with Python
US20140324521A1 (en) Qualitative and quantitative analytical modeling of sales performance and sales goals
JP7114900B2 (ja) 情報処理装置、情報処理方法、及び、プログラム
CN109840730B (zh) 用于数据预测的方法及装置
Meyer et al. Stochastic volatility: Bayesian computation using automatic differentiation and the extended Kalman filter
Voulgaridou et al. An analytic network process approach for sales forecasting
Zhou et al. Scheduling just-in-time part replenishment of the automobile assembly line with unrelated parallel machines
Makris et al. Customer's behaviour modelling for manufacturing planning
Khalfi et al. Stochastic risk analysis in Monte Carlo simulation: a case study
Aksu et al. Automated prediction of relevant key performance indicators for organizations
Fahmi et al. Best Products with TOPSIS Method and Sales Forecasting with Weighted Moving Average
Catalano et al. Book allocations in a university library: An evaluation of multiple formulas
JP7243533B2 (ja) 情報処理方法および情報処理装置
US11004156B2 (en) Method and system for predicting and indexing probability of financial stress
Uskenbayeva et al. Managing Business Process Based on the Tonality of the Output Information
Katharakisa et al. SFA vs. DEA for measuring healthcare efficiency: A systematic review
Tran et al. Building a Lucy hybrid model for grocery sales forecasting based on time series
Dashtakian-Nasrabad et al. A bi-objective optimization mathematical model integrated with bulk arrival Markovian queueing system and machine learning in publishing industries
Ji et al. Interactive portfolio optimization using Mean-Gini criteria
US20230252504A1 (en) Predictive analytical model for financial transactions
Achtari Applications of Machine Learning in Revenue Management and Routing

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190704

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200519

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200701

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201006

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201019

R150 Certificate of patent or registration of utility model

Ref document number: 6791151

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150