WO2023286170A1

WO2023286170A1 - 情報生成装置、情報生成方法および情報生成プログラム

Info

Publication number: WO2023286170A1
Application number: PCT/JP2021/026334
Authority: WO
Inventors: 力江藤; 英恵下村; 大窪田
Original assignee: 日本電気株式会社
Priority date: 2021-07-13
Filing date: 2021-07-13
Publication date: 2023-01-19
Also published as: JPWO2023286170A1

Abstract

入力手段８１は、目的関数と制約とを含む最適化問題を示す第１データと、その最適化問題の特徴を示す第２データとの入力を受け付ける。生成手段８２は、第１データと第２データとを対応付けた検索情報を生成する。

Description

情報生成装置、情報生成方法および情報生成プログラム

　本発明は、検索可能な情報を生成する情報生成装置、情報生成方法および情報生成プログラムに関する。

　特許文献１には、ユーザ側装置から取得した利用要求に応じて、データベースに予め保管されている複数の機械学習モデルから１または複数の機械学習モデルを選択してユーザ側装置に提供する装置が記載されている。特許文献１に記載されたデータベースは、複数の機械学習モデルを記憶し、各機械学習モデルについての機能および生成環境の少なくとも一方の情報であるモデル情報も併せて記憶する。

国際公開２０１８／１４２７６６号

　特許文献１に記載された機械学習モデルは、学習データおよび正解データに基づき、機械学習により生成した予測モデルを想定しているが組み合わせ最適化問題のような意思決定に利用されることを想定していない。

　そこで、本発明では、最適化問題を検索するための情報を生成できる情報生成装置、情報生成方法および情報生成プログラムを提供することを目的とする。

　本発明による情報生成装置は、目的関数と制約とを含む最適化問題を示す第１データと、その最適化問題の特徴を示す第２データとの入力を受け付ける入力手段と、第１データと第２データとを対応付けた検索情報を生成する生成手段とを備えたことを特徴とする。

　本発明による情報生成方法は、コンピュータが、目的関数と制約とを含む最適化問題を示す第１データと、その最適化問題の特徴を示す第２データとの入力を受け付け、コンピュータが、第１データと第２データとを対応付けた検索情報を生成することを特徴とする。

　本発明による情報生成プログラムは、コンピュータに、目的関数と制約とを含む最適化問題を示す第１データと、その最適化問題の特徴を示す第２データとの入力を受け付ける入力処理、および、第１データと第２データとを対応付けた検索情報を生成する生成処理を実行させることを特徴とする。

　本発明によれば、最適化問題を検索するための情報を生成できる。

発明による情報流通システムの一実施形態の構成例を示すブロック図である。意思決定の種類の例を示す説明図である。情報生成装置の構成例を示すブロック図である。検索情報の例を示す説明図である。検索装置の構成例を示すブロック図である。情報生成装置の動作例を示すフローチャートである。検索装置２００の動作例を示すフローチャートである。ロボット制御システムの一実施形態の構成例を示すブロック図である。本発明による情報生成装置の概要を示すブロック図である。少なくとも１つの実施形態に係るコンピュータの構成を示す概略ブロック図である。

　以下、本発明の実施形態を図面を参照して説明する。

　図１は、本発明による情報流通システムの一実施形態の構成例を示すブロック図である。本実施形態の情報流通システム１は、情報生成装置１００と、検索装置２００と、ストレージサーバ３００とを備えている。情報生成装置１００と、検索装置２００と、ストレージサーバ３００とは、通信回線を通じて相互に接続される。

　情報生成装置１００は、後述する検索装置２００が最適化問題を検索するために用いられる情報（以下、検索情報と記す。）を生成する装置である。本実施形態における最適化問題は、解くべき問題に対して定式化された目的関数（より具体的には、目的関数の構造）および制約条件を含むものである。そのため、本実施形態における最適化問題は、解くべき問題に対するユーザの意思決定の種類を表わしていると言える。なお、検索情報の生成方法については後述される。

　図２は、意思決定の種類（すなわち、最適化問題）の例を示す説明図である。図２に示す例では、解くべき問題の種類が、いわゆる「シフトスケジューリング問題」に分類されるものであり、最適化問題が、３つの条件（条件１，条件２，条件３）の違反度（説明変数）の線形和で規定される目的関数、および２つの制約条件（条件４，条件５）を含むことを示す。

　また、図２に例示する目的関数のλは、ユーザが条件を重視する度合い（以下、ユーザの意図、と記すこともある。）を示す値であり、意思決定の種類に応じて、様々な値に設定される。この目的関数の値を最小化する組み合わせを探索することで、適切な行動を導出することが可能になる。

　ストレージサーバ３００は、情報生成装置１００が生成した検索情報を記憶する。ストレージサーバ３００は、例えば、一般的なテータベース（データベースシステム）により検索情報を管理してもよい。また、ストレージサーバ３００は、情報生成装置１００以外が生成した検索情報を記憶してもよい。

　検索装置２００は、ストレージサーバ３００（より具体的には、ストレージサーバ３００のデータベース）に記憶された検索情報を利用して、最適化問題を検索する。また、検索装置２００は、検索された最適化問題を利用して、ユーザの最適な行動を導出する。

　以下、情報生成装置１００および検索装置２００の具体的な構成例を説明する。

　図３は、本実施形態の情報生成装置１００の構成例を示すブロック図である。本実施形態の情報生成装置１００は、記憶部１１０と、入力部１２０と、特徴生成部１３０と、推薦部１４０と、学習部１５０と、生成部１６０と、登録部１７０とを含む。

　記憶部１１０は、情報生成装置１００が処理を行う際に用いる各種情報を記憶する。記憶部１１０は、後述する学習部１５０が学習処理に用いるトレーニングデータやパラメータ、学習結果などを記憶してもよい。記憶部１１０は、例えば、磁気ディスク等により実現される。

　入力部１２０は、検索情報を生成する際に用いる各種情報の入力を受け付ける。具体的には、入力部１２０は、目的関数と制約とを含む最適化問題を示す情報（以下、第１データと記す。）と、その最適化問題の特徴を示す情報（以下、第２データと記す。）の入力を受け付ける。

　入力部１２０は、第１データおよび第２データの入力をユーザから受け付けてもよい。また、入力部１２０は、後述する学習部１５０が生成した目的関数の入力（より具体的には、記憶部１１０に記憶された目的関数）を受け付けてもよい。また、入力部１２０は、後述する特徴生成部１３０から、第２データ（すなわち、最適化問題の特徴を示す情報）の入力を受け付けてもよい。

　さらに、入力部１２０は、第１のデータと共に、最適化問題を解くための候補とする最適化ソルバ（または、最適化ソルバを特定する情報）の入力を受け付けてもよい。最適化ソルバの例として、例えば、数理計画ソルバなどが挙げられる。

　例えば、最適化問題を入力するユーザは、その最適化問題を解くために適した最適化ソルバを把握している場合も多い。そのため、このような情報の入力を第１のデータと共に受け付けることで、後述する検索装置２００により最適化問題を検索したユーザが、その最適化問題に利用する最適化ソルバを把握することが可能になる。

　第１データは、上述するような目的関数の構造や、制約を示す条件などにより、最適化問題を示す情報を表わす。なお、目的関数の態様は任意であり、例えば、図２に例示するように、説明変数（条件）の線形和で表されるような関数であってもよい。また、制約の態様も任意であり、制約を満たす、または、制約を満たさないを、２値で特定するような情報であってもよく、制約を満たす程度を示すような情報であってもよい。

　また、第２データは、最適化問題の特徴を示す内容であれば任意である。ただし、第２データは、最適化問題を一意に識別可能な情報である必要はない。最適化問題の特徴として、例えば、その最適化問題の種類や、含まれる説明変数（特徴量）などの属性情報、いつ、どこで、だれが、どのような意思決定をする際に用いられる最適化問題かを示す最適化状況、および、利用可能な（公開する）対象者の範囲や日時などの利用条件、などが挙げられる。

　最適化問題の種類は、例えば、スケジュール最適化問題やナップサック問題などのように、最適化問題のテンプレート的な種類であってもよく、用いられる業種（例えば、小売、製造、旅行など）の種類などであってもよい。

　特徴生成部１３０は、最適化問題の特徴を生成する。具体的には、特徴生成部１３０は、第１データから、上述する第２データを生成する。特徴生成部１３０が第２データを生成する方法は任意である。特徴生成部１３０は、例えば、予め定めた方法に基づいて自動で第２データを生成してもよく、ユーザからの指定に基づいて第２データを生成してもよい。

　例えば、目的関数が上述する説明変数の線形和で表されている場合、特徴生成部１３０は、その目的関数に含まれる説明変数の重み（すなわち、重視する度合い）に応じて、最適化問題の特徴を生成してもよい。特徴生成部１３０は、例えば、重みが最も大きい説明変数の内容を、最適化問題の特徴として生成してもよい。

　また、例えば、明示的にユーザから説明変数が指定された場合（例えば、他の最適化問題では用いられない特徴など）、特徴生成部１３０は、その指定された説明変数の内容を、最適化問題の特徴として生成してもよい。

　また、特徴生成部１３０は、目的関数に含まれる説明変数（特徴量）に基づいて、最適化問題の種類を特定し、特定した最適化問題の種類を特徴として生成してもよい。例えば、入力部１２０が、「従業員の勤務時間」という説明変数が含まれる目的関数の入力を受け付けたとする。この場合、最適化問題の種類は、「発注量最適化」よりも「シフトスケジューリング」である可能性が高いと言える。「シフトスケジューリング」には「従業員の勤務時間」が特徴量として含まれている可能性が高いからである。そこで、説明変数に応じた最適化問題の種類を予め定めておき、特徴生成部１３０は、目的関数に含まれる説明変数に基づいて、予め定められた対応する最適化問題の種類を特徴として生成してもよい。

　なお、生成された最適化問題の特徴の全てが、後述する検索情報に含まれていてもよく、後述する推薦部１４０がユーザから指定された特徴が、後述する検索情報に含まれていてもよい。

　推薦部１４０は、特徴生成部１３０によって生成された特徴をユーザに推薦する。具体的には、推薦部１４０は、推薦する特徴をユーザに提示して指定させる。なお、推薦部１４０が、特徴を提示する方法は任意であり、例えば、図４に例示する第２データのような内容を提示してもよい。また、推薦部１４０がユーザに指定させる特徴の数も限定されず、１つであってもよく、複数であってもよい。

　学習部１５０は、記憶部１１０に記憶されたトレーニングデータを用いた機械学習により目的関数を生成する。具体的には、学習部１５０は、ユーザが意思決定を行った際の履歴データ（以下、意思決定履歴データと記す。）をトレーニングデータとして用いた逆強化学習により、最適化問題（より具体的には、第１データ）の目的関数を生成する。

　また、将来の予測結果を利用する場合、学習部１５０は、所望の予測結果を導出する予測モデルの入力を受け付けてもよい。そして、学習部１５０は、受け付けた予測モデルの予測結果を説明変数に用いて目的関数を生成してもよい。将来の予測結果の一例として、商品需要予測や、道路混雑度予測、来客数予測などが挙げられる。なお、予測モデルが、記憶部１１０に予め記憶されている場合、学習部１５０は、記憶部１１０に記憶された予測モデルを取得してもよい。

　ここで、特徴生成部１３０は、目的関数の学習に用いられたトレーニングデータを生成する基になったユーザを示す情報を第２データとして生成してもよい。そのような情報を用いることで、その目的関数を生成する基になる意思決定を行ったユーザの情報を、最適化問題の特徴として利用することが可能になる。

　学習部１５０は、生成された目的関数を記憶部１１０に記憶する。なお、最適化問題（より具体的には、目的関数）が既に生成されている場合や、目的関数を学習する必要がない場合、情報生成装置１００は、学習部１５０を備えていなくてもよい。

　生成部１６０は、第１データと第２データとを対応付けた検索情報を生成する。これにより、最適化問題を検索するための情報を生成できるため、第２データに対応付けられた第１データを、その第２データをキーとして検索することが可能になる。

　また、入力部１２０が最適化問題を解くための候補とする最適化ソルバの入力を受け付けていた場合、生成部１６０は、最適化ソルバの情報を含む検索情報を生成してもよい。これにより、対応する最適化問題に利用可能な最適化ソルバを把握することが可能になる。

　また、推薦部１４０が推薦した特徴の指定をユーザから受け付けた場合、生成部１６０は、ユーザから指定された特徴を第２データに含めた検索情報を生成してもよい。

　登録部１７０は、生成された検索情報をストレージサーバ３００に登録する。

　図４は、ストレージサーバ３００に記憶された検索情報の例を示す説明図である。図４には、第１データと第２データとを対応付けた検索情報が例示されている。例えば、１行目の検索情報の場合、最適化問題が、３つの条件（説明変数）の線形和で表わされた目的関数と、満たすべき２つの制約条件とを含むことを示す。

　さらに、１行目の検索情報の場合、最適化問題が、いわゆる「スケジュール最適化」問題の種類に該当し、時間効率を重視しつつも、夜間はゆっくり過ごすような行動を重視することを目的とするものであることを示す。他にも、１行目に示す最適化問題は、２０代男性が大阪旅行を行った際の状況に関するものであり、全ユーザが一ヶ月間利用可能なものであることを示す。さらに、１行目に示す最適化問題を解くための最適化ソルバの候補として、「ソルバＡ」が指定されていることを示す。

　なお、第１のデータには、図４に例示するような想定される特徴の全てが対応付けられている必要はなく、一部の特徴のみが対応付けられていればよい。また、第２データに含まれる特徴の分類や表現態様は例示である。これらの特徴が、例えば、各データベースで規定されるインデックスの仕様に基づいて表現されていてもよい。

　入力部１２０と、特徴生成部１３０と、推薦部１４０と、学習部１５０と、生成部１６０と、登録部１７０とは、プログラム（情報生成プログラム）に従って動作するコンピュータのプロセッサ（例えば、ＣＰＵ（Central Processing Unit ）、ＧＰＵ（Graphics Processing Unit））によって実現される。

　例えば、プログラムは、情報生成装置１００が備える記憶部１１０に記憶され、プロセッサは、そのプログラムを読み込み、プログラムに従って、入力部１２０、特徴生成部１３０、推薦部１４０、学習部１５０、生成部１６０、および、登録部１７０として動作してもよい。また、情報生成装置１００の機能がＳａａＳ（Software as a Service ）形式で提供されてもよい。

　また、入力部１２０と、特徴生成部１３０と、推薦部１４０と、学習部１５０と、生成部１６０と、登録部１７０とは、それぞれが専用のハードウェアで実現されていてもよい。また、各装置の各構成要素の一部又は全部は、汎用または専用の回路（circuitry ）、プロセッサ等やこれらの組合せによって実現されもよい。これらは、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。各装置の各構成要素の一部又は全部は、上述した回路等とプログラムとの組合せによって実現されてもよい。

　また、情報生成装置１００の各構成要素の一部又は全部が複数の情報処理装置や回路等により実現される場合には、複数の情報処理装置や回路等は、集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。

　図５は、本実施形態の検索装置２００の構成例を示すブロック図である。本実施形態の検索装置２００は、検索条件入力部２１０と、検索部２２０と、モデル入力部２３０と、問題抽出部２４０と、問題生成部２５０と、最適化部２６０と、出力部２７０とを含む。

　検索条件入力部２１０は、最適化問題を検索するための条件（以下、単に検索条件と記すこともある。）の入力を受け付ける。具体的には、検索条件入力部２１０は、検索条件として、最適化問題の特徴を示す情報（具体的には、第２データ）の入力を受け付ける。

　なお、入力される情報の態様は任意であり、検索条件入力部２１０は、想定される入力に基づいて、検索条件を抽出すればよい。検索条件入力部２１０は、例えば、最適化問題として解くべき内容を示す文字列の入力を受け付けてもよい。この場合、検索条件入力部２１０は、既知の自然言語処理に基づいて、入力された文字列から抽出したい最適化問題の特徴を抽出してもよい。抽出された特徴は、後述する検索部２２０で利用される。

　例えば、「２０代の男性が大阪旅行を行う場合の最適なプランを作成したい」という文字列が入力された場合、検索条件入力部２１０は、入力された文字列から、「２０代男性」、「大阪旅行」などの特徴を抽出してもよい。

　また、検索条件入力部２１０は、検索条件として、最適化問題を示す情報（具体的には、第１データを示す情報）の入力を受け付けてもよい。検索条件入力部２１０は、例えば、最適化問題を示す第１データの候補の一覧を表示し、ユーザから候補の指定を受け付けてもよい。

　検索部２２０は、ストレージサーバ３００（より具体的には、第１データと第２データとを対応付けた検索情報を記憶するデータベース）から、検索条件入力部２１０への入力により指定された検索条件に合致する最適化問題を検索する。より具体的には、検索部２２０は、入力された第２データ（すなわち、最適化問題の特徴）に合致する検索情報に対応付けられた第１データ（すなわち、最適化問題）を検索する。

　また、第１データを示す情報が入力された場合、検索部２２０は、入力された第１データを示す情報に合致する最適化問題を検索してもよい。また、検索情報に最適化ソルバの候補が含まれている場合、検索部２２０は、対応する最適化ソルバを併せて検索してもよい。

　また、検索部２２０は、検索結果をユーザに提示して、ユーザが所望する最適化問題の指定を受け付けてもよい。検索部２２０は、例えば、検索結果として、第１データと共に、最適化問題の特徴（すなわち、第２データ）を表示し、表示した第１データに対するユーザの指定を受け付けてもよい。

　モデル入力部２３０は、対象ユーザの意思決定履歴データに基づいて学習されたモデル（以下、意思決定モデルと記すこともある）の入力を受け付ける。すなわち、モデル入力部２３０は、対象ユーザの過去の意思決定を反映したモデルの入力を受け付ける。なお、モデル入力部２３０は、モデルと共に、そのモデルに課せられた制約条件の入力を併せて受け付けてもよい。

　なお、入力を受け付けるモデルが生成される方法は任意である。モデル入力部２３０は、例えば、情報生成装置１００の学習部１５０が目的関数を生成する方法と同様の方法（例えば、逆強化学習）で学習されたモデルの入力を受け付けてもよい。

　なお、受け付けたモデルは、検索部２２０によって検索された最適化問題との比較が行われる。そのため、入力されるモデルは、検索される最適化問題と同様の方法により生成されたモデル、または、同様の態様で生成されたモデルであることが好ましい。

　問題抽出部２４０は、検索部２２０によって検索された最適化問題と、モデル入力部２３０が入力を受け付けた意思決定モデルとの比較を行い、検索された最適化問題（すなわち、第１データ）のうち、入力された意思決定モデルとの類似度が所定の条件を満たす最適化問題を抽出する。所定の条件として、例えば、類似度が予め定めた閾値よりも大きいこと、などが挙げられる。

　意思決定モデルは、対象ユーザの意思決定履歴データに基づいて学習されたモデルであることから、対象ユーザの意思が反映されているモデルと言える。そのため、問題抽出部２４０が、そのようなモデルと最適化問題との類似度を判断することで、その対象ユーザに類似する意思が反映された最適化問題を抽出することが可能になる。

　問題抽出部２４０が類似度を算出する方法は任意である。問題抽出部２４０は、意思決定モデルと最適化問題のそれぞれに含まれる特徴量（説明変数）の類似度を算出してもよい。問題抽出部２４０は、例えば、特徴量の種類が重複する度合いを類似度として算出してもよい。他にも、問題抽出部２４０は、重複する特徴量それぞれの重み係数の値の差異を、例えば、コサイン類似度やＲＭＳＥ（Root Mean Square Error）により算出することで類似度を算出してもよい。

　さらに、意思決定モデルおよび最適化問題を生成する際に用いられた学習データが存在する場合、問題抽出部２４０は、同一の特徴量において取り得る値域の範囲の重複度合いや、各特徴量の平均または分散を類似度として算出してもよい。

　なお、問題抽出部２４０が類似度を算出する方法は、上述するような、意思決定モデルと最適化問題との構造に基づく方法に限定されない。問題抽出部２４０は、例えば、意思決定モデルおよび最適化問題のそれぞれに同じデータを入力した際の出力値の差分に基づいて類似度を算出してもよい。また、最適化問題および意思決定モデルに、それぞれ、問題またはモデルの特徴を示す文章が付与されている場合、問題抽出部２４０は、各文章間の類似度を最適化問題と意思決定モデルの類似度として算出してもよい。

　なお、検索装置２００は、必ずしも意思決定モデルの入力を受け付ける必要はない。意思決定モデルの入力がない場合、検索装置２００は、モデル入力部２３０および問題抽出部２４０を含んでいなくてもよい。

　問題生成部２５０は、最適化問題が複数抽出された場合、抽出された複数の最適化問題から、新たな目的関数を生成する。具体的には、問題生成部２５０は、複数の最適化問題から選択された２以上の目的関数を組み合わせて、新たな目的関数を生成する。なお、最適化問題が１つに特定されている場合、問題生成部２５０は、新たな目的関数を生成する必要はない。

　ここで、２以上の目的関数を組み合わせるとは、各目的関数に含まれる一部または全部の説明変数を予め定めた規則に基づいてそれぞれ抽出し、抽出された説明変数を用いて定式化（関数化）することを意味する。なお、この規則は、各目的関数が示す意図を反映させる程度に応じてユーザ等により定められる。予め定めた規則として、例えば、元の説明変数の重みに所定の割合を乗じて全て抽出した後、抽出されたそれぞれの説明変数の和を算出する方法などが挙げられる。

　以下、目的関数を組み合わせる具体例を説明する。例えば、目的関数Ａと、目的関数Ｂが、以下に例示するように重複する複数の特徴量ｆ_１，ｆ_２，ｆ_３を含むとする。
　目的関数Ａ：ａ_１＊ｆ_１＋ａ_２＊ｆ_２＋ａ_３＊ｆ_３
　目的関数Ｂ：ｂ_１＊ｆ_１＋ｂ_２＊ｆ_２＋ｂ_３＊ｆ_３

　ここで、目的関数Ａが示す意図と目的関数Ｂが示す意図の中間の意図（すなわち、両者の意図を等分に反映した意図）を示すような目的関数を生成したいとする。この場合、問題生成部２５０は、組み合わせ比率が１：１になるように、各説明変数の係数それぞれに０．５を乗じた目的関数同士を加算して、以下に例示するような目的関数Ｃを生成してもよい。
　目的関数Ｃ：０．５＊（ａ_１＋ｂ_１）＊ｆ_１＋０．５＊（ａ_２＋ｂ_２）＊ｆ_２＋０．５＊（ａ_３＋ｂ_３）＊ｆ_３

　同様に、目的関数Ａが示す意図を目的関数Ｂが示す意図よりも、より反映させた意図を示すような目的関数を生成したいとする。この場合、問題生成部２５０は、組み合わせ比率が、例えば、４：１になるように目的変数を組み合わせて、以下に例示するような目的関数Ｄを生成してもよい。
　目的関数Ｄ：（０．８＊ａ_１＋０．２＊ｂ_１）＊ｆ_１＋（０．８＊ａ_２＋０．２＊ｂ_２）＊ｆ_２＋（０．８＊ａ_３＋０．２＊ｂ_３）＊ｆ_３

　最適化部２６０は、生成された新たな目的関数に基づいて最適化処理を行い、最適化結果を導出する。また、例えば、最適化ソルバの候補が指定されてた場合、最適化部２６０は、指定された最適化ソルバを用いて最適化結果を導出してもよい。

　出力部２７０は、最適化部２６０により導出された最適化結果（例えば、最適な行動）を出力する。

　検索条件入力部２１０と、検索部２２０と、モデル入力部２３０と、問題抽出部２４０と、問題生成部２５０と、最適化部２６０と、出力部２７０とは、プログラム（検索プログラム）に従って動作するコンピュータのプロセッサによって実現される。

　例えば、プログラムは、検索装置２００が備える記憶部（図示せず）に記憶され、プロセッサは、そのプログラムを読み込み、プログラムに従って、検索条件入力部２１０、検索部２２０、モデル入力部２３０、問題抽出部２４０、問題生成部２５０、最適化部２６０、および、出力部２７０として動作してもよい。また、検索装置２００の機能がＳａａＳ（Software as a Service ）形式で提供されてもよい。

　また、情報生成装置１００の構成と同様、検索条件入力部２１０と、検索部２２０と、モデル入力部２３０と、問題抽出部２４０と、問題生成部２５０と、最適化部２６０と、出力部２７０とは、それぞれが専用のハードウェアで実現されていてもよい。

　次に、本実施形態の情報流通システム１の動作を説明する。図６は、本実施形態の情報生成装置１００の動作例を示すフローチャートである。入力部１２０は、目的関数と制約とを含む最適化問題を示す第１データと、その最適化問題の特徴を示す第２データとの入力を受け付ける（ステップＳ１１）。生成部１６０は、第１データと第２データとを対応付けた検索情報を生成する（ステップＳ１２）。そして、登録部１７０は、生成された検索情報をストレージサーバ３００に登録する（ステップＳ１３）。

　図７は、本実施形態の検索装置２００の動作例を示すフローチャートである。検索条件入力部２１０は、最適化問題の特徴を示す情報（すなわち、第２データ）の入力を受け付ける（ステップＳ２１）。検索部２２０は、ストレージサーバ３００から、入力された情報（すなわち、第２データ）に合致する検索情報に対応付けられた最適化問題（すなわち、第１データ）を検索する（ステップＳ２２）。以降、最適化部２６０が、検索された第１データを用いて最適化処理を行い、出力部２７０が、最適化結果を出力する。

　以上のように、本実施形態では、入力部１２０が、第１データと第２データとの入力を受け付け、生成部１６０が、第１データと第２データとを対応付けた検索情報を生成する。よって、最適化問題を検索するための情報を生成できる。

　すなわち、上述するように、最適化問題は、一般にユーザの観点や各種の制約条件を考慮して個別に生成されるものであるため、複数の最適化問題を検索可能な態様でデータベース等に記憶させるという技術的思想は存在しなかった。一方、本実施形態では、生成部１６０が、第１データと第２データとを対応付けた検索情報を生成するため、この検索情報を用いて最適化問題を管理することが可能になる。

　また、本実施形態では、検索条件入力部２１０が、検索条件として、第２データの入力を受け付け、検索部２２０が、入力された第２データに合致する検索情報に対応付けられた第１データをストレージサーバ３００から検索する。よって、所望の最適化問題を検索できる。

　すなわち、上述するように、個別に生成される最適化問題の特性上、他の最適化問題をデータベースから検索するという技術的思想は存在しなかった。一方、本実施形態では、検索部２２０が、入力された第２データに合致する検索情報に対応付けられた第１データをストレージサーバ３００から検索する。よって、所望の最適化問題を取得することが可能になる。

　次に、本実施形態の検索装置２００を利用したロボット制御システムの具体例を説明する。図８は、ロボット制御システムの一実施形態の構成例を示すブロック図である。図８に例示するロボット制御システム２０００は、検索装置２００と、ロボット２３００とを備えている。

　図８に例示する検索装置２００は、上記実施形態における検索装置２００と同様である。検索装置２００は、最適化結果を後述するロボット２３００の記憶部２３１０に記憶させる。

　ロボット２３００は、最適化結果に基づいて動作する機器である。なお、ここでのロボットには、人や動物を模した形状の機器に限られず、自動作業（自動運転、自動制御など）を行う機器なども含まれる。ロボット２３００は、記憶部２３１０と、入力部２３２０と、制御部２３３０とを含む。

　記憶部２３１０は、検索装置２００によって導出された最適化結果を記憶する。

　入力部２３２０は、ロボットを動作させる際に用いる各種情報の入力を受け付ける。

　制御部２３３０は、受け付けた各種情報、および、記憶部２３１０に記憶された最適化結果に基づいて、ロボット２３００の動作を制御する。なお、制御部２３３０が、最適化結果に基づいてロボット２３００の動作を制御する方法は予め定められればよい。本実施形態では、ロボット２３００のような自動作業を行う機器を、導出された最適化結果に基づいて制御することができる。

　次に、本発明の概要を説明する。図９は、本発明による情報生成装置の概要を示すブロック図である。本発明による情報生成装置８０（例えば、情報生成装置１００）は、目的関数と制約とを含む最適化問題を示す第１データと、その最適化問題の特徴を示す第２データとの入力を受け付ける入力手段８１（例えば、入力部１２０）と、第１データと第２データとを対応付けた検索情報を生成する生成手段８２（例えば、生成部１６０）とを備えている。

　そのような構成により、最適化問題を検索するための情報を生成できる。

　また、生成手段８２は、対象者の意思決定履歴データを用いて学習された目的関数を含む第１データと、第２データとを対応付けた検索情報を生成してもよい。

　また、情報生成装置８０は、最適化問題の特徴を生成する特徴生成手段（例えば、特徴生成部１３０）を備えていてもよい。そして、生成手段８２は、生成された最適化問題の特徴を第１データに対応付けた検索情報を生成してもよい。

　また、目的関数が、説明変数の線形和で表わされていてもよい。このとき、特徴生成手段は、目的関数に含まれる説明変数の重みに応じて最適化問題の特徴を生成してもよい。

　また、特徴生成手段は、目的関数の学習に用いられたトレーニングデータを生成する基になったユーザを示す情報を最適化問題の特徴として生成してもよい。

　また、情報生成装置８０は、特徴生成手段によって生成された特徴をユーザに推薦する推薦手段（例えば、推薦部１４０）を備えていてもよい。そして、推薦手段は、推薦する特徴をユーザに提示して指定させ、生成手段８２は、ユーザから指定された特徴を第２データに含めた検索情報を生成してもよい。

　また、入力手段８１は、最適化問題を解くための候補とする最適化ソルバの情報の入力を受け付けてもよい。そして、生成手段８２は、最適化ソルバの情報を含む検索情報を生成してもよい。

　また、情報生成装置８０は、対象者の意思決定履歴データを用いた逆強化学習により、最適化問題の目的関数を生成する学習手段（例えば、学習部１５０）を備えていてもよい。そして、生成手段８２は、生成された目的関数を含む第１データと、第２データとを対応付けた検索情報を生成してもよい。

　このとき、学習部は、予測モデルの入力を受け付け、受け付けた予測モデルの予測結果を説明変数に用いて目的関数を生成してもよい。

　また、情報生成装置８０は、生成された検索情報をデータベース（例えば、ストレージサーバ３００）に登録する登録手段（例えば、登録部１７０）を備えていてもよい。

　図１０は、少なくとも１つの実施形態に係るコンピュータの構成を示す概略ブロック図である。コンピュータ１０００は、プロセッサ１００１、主記憶装置１００２、補助記憶装置１００３、インタフェース１００４を備える。

　上述の情報流通システム１の各装置（情報生成装置１００、および、検索装置２００）は、それぞれ、コンピュータ１０００に実装される。そして、上述した各処理部の動作は、プログラムの形式で補助記憶装置１００３に記憶されている。プロセッサ１００１は、プログラムを補助記憶装置１００３から読み出して主記憶装置１００２に展開し、当該プログラムに従って上記処理を実行する。

　なお、少なくとも１つの実施形態において、補助記憶装置１００３は、一時的でない有形の媒体の一例である。一時的でない有形の媒体の他の例としては、インタフェース１００４を介して接続される磁気ディスク、光磁気ディスク、ＣＤ－ＲＯＭ（Compact Disc Read-only memory ）、ＤＶＤ－ＲＯＭ（Read-only memory）、半導体メモリ等が挙げられる。また、このプログラムが通信回線によってコンピュータ１０００に配信される場合、配信を受けたコンピュータ１０００が当該プログラムを主記憶装置１００２に展開し、上記処理を実行してもよい。

　また、当該プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、当該プログラムは、前述した機能を補助記憶装置１００３に既に記憶されている他のプログラムとの組み合わせで実現するもの、いわゆる差分ファイル（差分プログラム）であってもよい。

　上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。

（付記１）目的関数と制約とを含む最適化問題を示す第１データと、当該最適化問題の特徴を示す第２データとの入力を受け付ける入力手段と、
　前記第１データと前記第２データとを対応付けた検索情報を生成する生成手段とを備えた
　ことを特徴とする情報生成装置。

（付記２）生成手段は、対象者の意思決定履歴データを用いて学習された目的関数を含む第１データと、第２データとを対応付けた検索情報を生成する
　付記１記載の情報生成装置。

（付記３）最適化問題の特徴を生成する特徴生成手段を備え、
　生成手段は、生成された最適化問題の特徴を第１データに対応付けた検索情報を生成する
　付記１または付記２記載の情報生成装置。

（付記４）目的関数が、説明変数の線形和で表わされ、
　特徴生成手段は、前記目的関数に含まれる説明変数の重みに応じて最適化問題の特徴を生成する
　付記３記載の情報生成装置。

（付記５）特徴生成手段は、目的関数の学習に用いられたトレーニングデータを生成する基になったユーザを示す情報を最適化問題の特徴として生成する
　付記３または付記４記載の情報生成装置。

（付記６）特徴生成手段によって生成された特徴をユーザに推薦する推薦手段を備え、
　前記推薦手段は、推薦する特徴をユーザに提示して指定させ、
　生成手段は、前記ユーザから指定された特徴を第２データに含めた検索情報を生成する
　付記３から付記５のうちのいずれか１つに記載の情報生成装置。

（付記７）入力手段は、最適化問題を解くための候補とする最適化ソルバの情報の入力を受け付け、
　生成手段は、前記最適化ソルバの情報を含む検索情報を生成する
　付記１から付記６のうちのいずれか１つに記載の情報生成装置。

（付記８）対象者の意思決定履歴データを用いた逆強化学習により、最適化問題の目的関数を生成する学習手段を備え、
　生成手段は、生成された目的関数を含む第１データと、第２データとを対応付けた検索情報を生成する
　付記１から付記７のうちのいずれか１つに記載の情報生成装置。

（付記９）学習手段は、予測モデルの入力を受け付け、受け付けた予測モデルの予測結果を説明変数に用いて目的関数を生成する
　付記８記載の情報生成装置。

（付記１０）生成された検索情報をデータベースに登録する登録手段を備えた
　付記１から付記９のうちのいずれか１つに記載の情報生成装置。

（付記１１）コンピュータが、目的関数と制約とを含む最適化問題を示す第１データと、当該最適化問題の特徴を示す第２データとの入力を受け付け、
　前記コンピュータが、前記第１データと前記第２データとを対応付けた検索情報を生成する
　ことを特徴とする情報生成方法。

（付記１２）コンピュータが、対象者の意思決定履歴データを用いて学習された目的関数を含む第１データと、第２データとを対応付けた検索情報を生成する
　付記１１記載の情報生成方法。

（付記１３）コンピュータに、
　目的関数と制約とを含む最適化問題を示す第１データと、当該最適化問題の特徴を示す第２データとの入力を受け付ける入力処理、および、
　前記第１データと前記第２データとを対応付けた検索情報を生成する生成処理を実行させる
　ための情報生成プログラムを記憶するプログラム記憶媒体。

（付記１４）コンピュータに、
　生成処理で、対象者の意思決定履歴データを用いて学習された目的関数を含む第１データと、第２データとを対応付けた検索情報を生成させるための情報生成プログラムを記憶する
　付記１３記載のプログラム記憶媒体。

（付記１５）コンピュータに、
　目的関数と制約とを含む最適化問題を示す第１データと、当該最適化問題の特徴を示す第２データとの入力を受け付ける入力処理、および、
　前記第１データと前記第２データとを対応付けた検索情報を生成する生成処理を実行させる
　ための情報生成プログラム。

（付記１６）コンピュータに、
　生成処理で、対象者の意思決定履歴データを用いて学習された目的関数を含む第１データと、第２データとを対応付けた検索情報を生成させる
　付記１５記載の情報生成プログラム。

　１　情報流通システム
　１００　情報生成装置
　１１０　記憶部
　１２０　入力部
　１３０　特徴生成部
　１４０　推薦部
　１５０　学習部
　１６０　生成部
　１７０　登録部
　２００　検索装置
　２１０　検索条件入力部
　２２０　検索部
　２３０　モデル入力部
　２４０　問題抽出部
　２５０　問題生成部
　２６０　最適化部
　２７０　出力部
　３００　ストレージサーバ

Claims

　目的関数と制約とを含む最適化問題を示す第１データと、当該最適化問題の特徴を示す第２データとの入力を受け付ける入力手段と、
　前記第１データと前記第２データとを対応付けた検索情報を生成する生成手段とを備えた
　ことを特徴とする情報生成装置。
　生成手段は、対象者の意思決定履歴データを用いて学習された目的関数を含む第１データと、第２データとを対応付けた検索情報を生成する
　請求項１記載の情報生成装置。
　最適化問題の特徴を生成する特徴生成手段を備え、
　生成手段は、生成された前記最適化問題の特徴を第１データに対応付けた検索情報を生成する
　請求項１または請求項２記載の情報生成装置。
　目的関数が、説明変数の線形和で表わされ、
　特徴生成手段は、前記目的関数に含まれる説明変数の重みに応じて最適化問題の特徴を生成する
　請求項３記載の情報生成装置。
　特徴生成手段は、目的関数の学習に用いられたトレーニングデータを生成する基になったユーザを示す情報を最適化問題の特徴として生成する
　請求項３または請求項４記載の情報生成装置。
　特徴生成手段によって生成された特徴をユーザに推薦する推薦手段を備え、
　前記推薦手段は、推薦する特徴をユーザに提示して指定させ、
　生成手段は、前記ユーザから指定された特徴を第２データに含めた検索情報を生成する
　請求項３から請求項５のうちのいずれか１項に記載の情報生成装置。
　入力手段は、最適化問題を解くための候補とする最適化ソルバの情報の入力を受け付け、
　生成手段は、前記最適化ソルバの情報を含む検索情報を生成する
　請求項１から請求項６のうちのいずれか１項に記載の情報生成装置。
　対象者の意思決定履歴データを用いた逆強化学習により、最適化問題の目的関数を生成する学習手段を備え、
　生成手段は、生成された目的関数を含む第１データと、第２データとを対応付けた検索情報を生成する
　請求項１から請求項７のうちのいずれか１項に記載の情報生成装置。
　学習手段は、予測モデルの入力を受け付け、受け付けた予測モデルの予測結果を説明変数に用いて目的関数を生成する
　請求項８記載の情報生成装置。
　生成された検索情報をデータベースに登録する登録手段を備えた
　請求項１から請求項９のうちのいずれか１項に記載の情報生成装置。
　コンピュータが、目的関数と制約とを含む最適化問題を示す第１データと、当該最適化問題の特徴を示す第２データとの入力を受け付け、
　前記コンピュータが、前記第１データと前記第２データとを対応付けた検索情報を生成する
　ことを特徴とする情報生成方法。
　コンピュータが、対象者の意思決定履歴データを用いて学習された目的関数を含む第１データと、第２データとを対応付けた検索情報を生成する
　請求項１１記載の情報生成方法。
　コンピュータに、
　目的関数と制約とを含む最適化問題を示す第１データと、当該最適化問題の特徴を示す第２データとの入力を受け付ける入力処理、および、
　前記第１データと前記第２データとを対応付けた検索情報を生成する生成処理を実行させる
　ための情報生成プログラムを記憶するプログラム記憶媒体。
　コンピュータに、
　生成処理で、対象者の意思決定履歴データを用いて学習された目的関数を含む第１データと、第２データとを対応付けた検索情報を生成させるための情報生成プログラムを記憶する
　請求項１３記載のプログラム記憶媒体。