JP2021064049A

JP2021064049A - 計算機システム及び数理モデルの生成支援方法

Info

Publication number: JP2021064049A
Application number: JP2019186973A
Authority: JP
Inventors: 正啓間瀬; Tadakei Mase; ユヨオウ; Yuyao Wang; 雄司千葉; Yuji Chiba; やえみ寺本; Yaemi Teramoto; 俊宏鯨井; Toshihiro Kujirai
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2019-10-10
Filing date: 2019-10-10
Publication date: 2021-04-22

Abstract

【課題】計算機が実行可能な計算量で、精度が高いデータを出力する数理モデルを生成する。【解決手段】計算機システムは、数理モデルの生成に用いることができる複数の設計情報の中から有効な設計情報を選択する選択部と、選択された設計情報を用いて数理モデルを生成するモデル生成部と、を備え、選択部は、複数の設計情報の各々に関連する設計パラメータを含む第１入力データと、第１入力データから算出される、対象システムの目的の達成度を評価するための第１指標とに基づいて、第１指標に対する複数の設計パラメータの各々の寄与の大きさを示す第２指標を算出し、第２指標に基づいて、複数の設計情報の中から有効な設計情報を選択する。【選択図】図１

Description

本発明は、数理モデルの生成技術に関する。

近年、システムの最適化等を実現するために様々な数理モデルが活用されている。例えば、生産ラインにおける製品の生産計画を生成するために、数理モデルが利用される。ユーザは、システムの状態等に応じて数理モデルを生成又は選択する必要がある。

数理計画問題（数理最適化問題）に適用するモデルを生成する技術としては、深層学習及び強化学習等の学習手法が知られている。また、モデルを選択する技術として例えば、特許文献１に記載の技術が知られている。特許文献１には、「予測問題のための予測モデルを選択するための方法は、予測問題のための予測モデル化プロシージャの好適性を、予測問題の特性および／またはそれぞれのモデル化プロシージャの属性に基づいて判定する。予測モデル化プロシージャのサブセットを、予測問題のための選択されたモデル化プロシージャの判定された好適性に基づいて選択する。選択したモデル化プロシージャの実行のための計算リソースを割り付ける、リソース割付スケジュールを、予測問題のための選択されたモデル化プロシージャの判定された好適性に基づいて生成する。リソース割付スケジュールに従った選択したモデル化プロシージャの実行の結果を、取得する。予測問題のための予測モデルを、これらの結果に基づいて選択する。」ことが記載されている。

特開２０１９−２３９０６号公報

Marco Tulio Ribeiro 他、「"Why Should I Trust You?": Explaining the Predictions of Any Classifier」、KDD '16 Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining、２０１６年８月、Pages 1135-1144 Scott M Lundberg 他、「A Unified Approach to Interpreting Model Predictions」、Advances in Neural Information Processing Systems 30、２０１７年１２月、Pages 4765-4774

計算機が実行可能な計算量で、出力されるデータの精度が高い数理モデルを生成するためには、数理モデルを適応するシステムの構成及び状態等に適した、パラメータ及び制約条件等の設計情報を設定する必要がある。問題が複雑な場合、扱う状態空間が大きい場合、又は、制約条件が多い場合、設計情報の数が膨大となる。また、システムの構成及び条件等が変化した場合、設計情報が変わる。

本発明は、数理モデルの生成に有効な設計情報の設定を実現するシステム及び方法を提供することを目的とする。

本願において開示される発明の代表的な一例を示せば以下の通りである。すなわち、対象システムの数理計画問題に用いる数理モデルの生成を支援する計算機システムであって、演算装置及び記憶装置を有する少なくとも一つの計算機を備え、前記数理モデルの生成に用いることができる複数の設計情報の中から有効な前記設計情報を選択する選択部と、前記選択された設計情報を用いて前記数理モデルを生成するモデル生成部と、を備え、前記選択部は、前記複数の設計情報の各々に関連する設計パラメータを含む第１入力データと、前記第１入力データから算出される、前記対象システムの目的の達成度を評価するための第１指標とに基づいて、前記第１指標に対する前記複数の設計パラメータの各々の寄与の大きさを示す第２指標を算出し、前記第２指標に基づいて、前記複数の設計情報の中から前記有効な設計情報を選択する。

本発明によれば、数理モデルの生成に有効な設計情報を設定することができる。前述した以外の課題、構成及び効果は、以下の実施例の説明によって明らかにされる。

実施例１の計算機システムの構成の一例を示す図である。実施例１のＫＰＩ算出部が実行する処理を説明するフローチャートである。実施例１の設計情報選択部が実行する処理を説明するフローチャートである。実施例１のモデル生成部が実行する処理を説明するフローチャートである。実施例１の処理部が実行する処理を説明するフローチャートである。実施例２の計算機システムの構成の一例を示す図である。実施例２の計算機が提供するインタフェースの一例を示す図である。実施例２の計算機システムが扱うシステムの構成例を示す図である。実施例２の処理部が提供するインタフェースの一例を示す図である。

以下、本発明の実施例を、図面を用いて説明する。ただし、本発明は以下に示す実施の形態の記載内容に限定して解釈されるものではない。本発明の思想ないし趣旨から逸脱しない範囲で、その具体的構成を変更し得ることは当業者であれば容易に理解される。

以下に説明する発明の構成において、同一又は類似する構成又は機能には同一の符号を付し、重複する説明は省略する。

本明細書等における「第１」、「第２」、「第３」等の表記は、構成要素を識別するために付するものであり、必ずしも、数又は順序を限定するものではない。

図面等において示す各構成の位置、大きさ、形状、及び範囲等は、発明の理解を容易にするため、実際の位置、大きさ、形状、及び範囲等を表していない場合がある。したがって、本発明では、図面等に開示された位置、大きさ、形状、及び範囲等に限定されない。

実施例１では発明の概要について説明する。図１は、実施例１の計算機システムの構成の一例を示す図である。

図１に示す計算機システムは、複数の計算機１００−１、１００−２及びユーザ端末１０１から構成される。各装置はネットワーク１０２を介して互いに接続される。なお、ネットワーク１０２の種類としては、ＷＡＮ（ＷｉｄｅＡｒｅａＮｅｔｗｏｒｋ）及びＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）等が考えられる。また、ネットワーク１０２の接続方式は有線又は無線のいずれでもよい。

本明細書では、計算機１００−１、１００−２を区別しない場合、計算機１００と記載する。

計算機１００−１は、数理モデルを生成するために用いることができる設計情報の中から、数理モデルの生成に有効な設計情報を選択する。設計情報は、例えば、パラメータ及び制約条件である。計算機１００−２は、選択された設計情報に基づいて数理モデルを生成する。計算機システムで扱われる数理モデルは、ある対象システムにおける数理計画問題に使用する数理モデルである。

計算機１００は、ＣＰＵ１１１、メモリ１１２、ストレージ装置１１３、及びネットワークインタフェース１１４を有する。各ハードウェアは内部バス等を介して接続される。

ＣＰＵ１１１は、メモリ１１２に格納されるプログラムを実行する。ＣＰＵ１１１がプログラムにしたがって処理を実行することによって、所定の機能を有する機能部（モジュール）として動作する。以下の説明では、機能部を主語に処理を説明する場合、ＣＰＵ１１１が、当該機能部を実現するプログラムを実行していることを表す。

メモリ１１２は、ＣＰＵ１１１が実行するプログラム及び当該プログラムに必要な情報を格納する。また、メモリ１１２は、プログラムが一時的に使用するワークエリアを含む。

ストレージ装置１１３は、データを永続的に格納する。ストレージ装置１１３は、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）及びＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）等の記憶媒体、又は不揮発性メモリ等が考えられる。なお、メモリ１１２に格納されるプログラム及び情報は、ストレージ装置１１３に格納されてもよい。この場合、ＣＰＵ１１１は、ストレージ装置１１３からプログラム及び情報を読み出し、メモリ１１２にプログラム及び情報をロードし、また、メモリ１１２にロードされたプログラムを実行する。

ネットワークインタフェース１１４は、ネットワークを介して他の装置と接続する。

ユーザ端末１０１は、ユーザが使用する端末である。ユーザ端末１０１は、図示しないＣＰＵ、メモリ、ストレージ装置、ネットワークインタフェース、入力装置、及び出力装置を有する。入力装置は、キーボード、マウス、及びタッチパネル等である。出力装置は、ディスプレイ及びプリンタ等である。

ユーザは、ユーザ端末１０１を用いて、数理モデルを適用するシステムの構成等に関する定義情報及びＫＰＩ（ＫｅｙＰｅｒｆｏｒｍａｎｃｅＩｎｄｉｃａｔｏｒ）に関する定義情報等を入力する。ＫＰＩに関する定義情報には、後述するＫＰＩ予測モデルに入力するデータの構造等が含まれる。

ＫＰＩは、システムの目的の達成度を評価するための指標である。例えば、製品を製造する生産ラインの制御を最適化するための数理モデルの場合、稼働率、処理時間、及び費用等がＫＰＩとして定義される。

計算機１００−１のメモリ１１２は、ＫＰＩ算出部１２０及び設計情報選択部１２１を実現するプログラム、並びに、稼働データ情報１３０を格納する。

稼働データ情報１３０は、数理モデルを適用するシステムから取得される稼働データを管理する情報である。稼働データは、実際に運用しているシステムから取得されたログでもよいし、シミュレータによって生成されたデータでもよい。なお、メモリ１１２は、稼働データ情報１３０の代わりに、シミュレータを定義する情報を格納してもよい。この場合、当該情報により定義されるシミュレータによって稼働データが生成される。

ＫＰＩ算出部１２０は、ＫＰＩを算出するためのＫＰＩ予測モデルに、ＫＰＩ用入力データを入力することによってＫＰＩを算出する。ＫＰＩ用入力データには、設計情報に関連するパラメータの値が含まれる。以下の説明では、設計情報に関連するパラメータを設計パラメータとも記載する。

ＫＰＩ予測モデルは、計算機１００−１又は他の計算機によって生成される。例えば、計算機１００−１のＫＰＩ算出部１２０は、ＫＰＩの定義情報に基づいて、数理モデルの適用先となるシステムの稼働データから学習用入力データを生成し、また、稼働データからＫＰＩを算出する。計算機１００−１は、学習用入力データ及びＫＰＩから構成される学習データ及び既存の学習アルゴリズムに基づいて、ＫＰＩ予測モデルを生成する。ＫＰＩ予測モデルは、例えば、ニューラルネットワーク又は決定木等である。

なお、ＫＰＩ予測モデルは、予め生成されてもよいし、ＫＰＩ算出部１２０の処理の実行時に生成されてもよい。ＫＰＩ予測モデルの情報はメモリ１１２に格納される。

設計情報選択部１２１は、ＫＰＩに対する設計パラメータの寄与の大きさを示す寄与度（影響度）を算出する。設計情報選択部１２１は算出された寄与度に基づいて、数理モデルの生成に有効な設計情報を選択する。ＫＰＩ予測モデルに入力するＫＰＩ用入力データに含まれる設計パラメータの寄与度は、例えば、非特許文献１及び非特許文献２に記載の技術を用いて算出することができる。

計算機１００−２のメモリ１１２は、モデル生成部１４０及び処理部１４１を実現するプログラム、並びに、モデル情報１５０を格納する。

モデル生成部１４０は、設計情報選択部１２１によって選択された設計情報に基づいて数理モデルを生成する。モデル生成部１４０は、生成された数理モデルの情報をモデル情報１５０として記憶する。

処理部１４１は、処理用入力データを受け付け、処理用入力データを数理モデルに入力することによって出力データを生成する。

なお、計算機１００が有する各機能部については、複数の機能部を一つの機能部にまとめてもよいし、一つの機能部を機能毎に複数の機能部に分けてもよい。例えば、設計情報選択部１２１がＫＰＩ算出部１２０を含んでもよい。

図２は、実施例１のＫＰＩ算出部１２０が実行する処理を説明するフローチャートである。

ＫＰＩ算出部１２０は稼働データ情報１３０から稼働データを取得する（ステップＳ１０１）。ここでは、ユーザが、ユーザ端末１０１を用いて稼働データを入力するものとする。なお、ユーザは稼働データの取得先を指定してもよい。ユーザによって入力された稼働データは、稼働データ情報１３０に格納される。

次に、ＫＰＩ算出部１２０は、稼働データを用いてＫＰＩ用入力データを生成する（ステップＳ１０２）。ＫＰＩ算出部１２０は、稼働データをそのままＫＰＩ用入力データとして生成してもよいし、稼働データの統計処理又は変換処理により生成されるデータをＫＰＩ用入力データとして生成してもよい。

なお、複数のＫＰＩが存在する場合、ＫＰＩ算出部１２０は、ＫＰＩ毎に、異なる設計パラメータから構成されるＫＰＩ用入力データを生成してもよい。

次に、ＫＰＩ算出部１２０は、ＫＰＩ予測モデルにＫＰＩ用入力データを入力することによってＫＰＩを算出する（ステップＳ１０３）。ＫＰＩ算出部１２０は、ＫＰＩ用入力データ及び算出されたＫＰＩを設計情報選択部１２１に出力する。

図３は、実施例１の設計情報選択部１２１が実行する処理を説明するフローチャートである。

設計情報選択部１２１は、ＫＰＩ及びＫＰＩ用入力データを受信した場合（ステップＳ２０１）、ＫＰＩに対する設計パラメータの寄与度を算出する（ステップＳ２０２）。ここでは、ＫＰＩに対する設計パラメータの組合せの寄与度も算出される。

例えば、設計情報選択部１２１は、非特許文献１に記載の算出方法を用いて、ＫＰＩ予測モデルを加法分解することによって、設計パラメータ及び設計パラメータの組合せの各々について寄与度を算出する。設計パラメータの組合せを構成する設計パラメータの数は任意に設定できる。

なお、複数のＫＰＩが存在する場合、設計情報選択部１２１は、ＫＰＩ毎に、設計パラメータ及び設計パラメータの組合せの各々の寄与度を算出する。

設計情報選択部１２１は、設計パラメータ及び設計パラメータの組合せの寄与度に基づいて、ＫＰＩへの寄与（影響）が大きい設計情報及び設計情報の組合せを選択する（ステップＳ２０３）。

例えば、設計情報選択部１２１は、寄与度が閾値より大きい設計パラメータ及び設計パラメータの組合せに対応する設計情報及び設計情報の組合せを選択する。

設計情報選択部１２１は、選択された設計情報及び設計情報の組合せを計算機１００−２に通知し（ステップＳ２０４）、その後、処理を終了する。具体的には、設計情報選択部１２１は、選択された設計情報及び設計情報の組合せに関する情報と、寄与度とを計算機１００−２に送信する。

以上で説明したように、設計情報選択部１２１は、ＫＰＩへの寄与が大きい設計情報及び設計情報の組合せを、数理モデルの生成に有効な設計情報として選択する。設計情報を絞り込むことによって、計算機が実行可能な計算量に抑えることができる。また、ＫＰＩへの寄与が大きい設計情報を選択することによって、精度の高い出力データを出力できる数理モデルを効率的かつ容易に生成できる。

図４は、実施例１のモデル生成部１４０が実行する処理を説明するフローチャートである。

モデル生成部１４０は、設計情報選択部１２１から情報を受信した場合（ステップＳ３０１）、設計情報選択部１２１によって選択された設計情報及び設計情報の組合せを設定する（ステップＳ３０２）。

次に、モデル生成部１４０は、設定された設計情報及び設計情報の組合せに基づいて数理モデルを生成する（ステップＳ３０３）。

モデル生成部１４０は、生成された数理モデルの情報をモデル情報１５０として記憶する。このとき、モデル生成部１４０は、選択された設計情報及び設計情報の組合せに関する情報及び寄与度もあわせてモデル情報１５０に記憶する。

なお、本発明は、モデルの生成手法及びアルゴリズムに限定されない。また、生成するモデルの種別に限定されない。

図５は、実施例１の処理部１４１が実行する処理を説明するフローチャートである。

処理部１４１は、処理用入力データを受け付けた場合（ステップＳ４０１）、モデル情報１５０に格納される数理モデルにしたがって処理を実行することによって、出力データを生成する（ステップＳ４０２）。なお、処理用入力データは、ユーザ端末１０１から入力される。

次に、処理部１４１は、ユーザ端末１０１に出力データ及び説明情報を送信する（ステップＳ４０３）。ここで、説明情報は、設計情報及び設計情報の組合せに関する情報並びに寄与度を含む。

なお、システム環境及びＫＰＩの定義の少なくともいずれかが変化した場合、計算機システムは、再度、ＫＰＩ予測モデルを生成した後、同様の処理を実行する。これによって、システム環境及びＫＰＩの定義の変化に柔軟に対応した数理モデルを、効率的かつ容易に生成することができる。

実施例１によれば、ＫＰＩに対する寄与が大きい設計情報及び設計情報の組合せを選択することによって、計算機が実行可能な計算量で、出力されるデータの精度が高い数理モデルを生成できる。

また、数理モデルを用いて得られた出力データとともに、数理モデルを生成するために使用した設計情報及び設計情報の組合せを、出力データの根拠としてユーザに提示できる。

実施例２では、数理モデルを生成するために用いるパラメータ（データ項目）が設計情報として選択される。特に、施策を数理モデルとして生成する強化学習における環境及び行動の少なくともいずれかを定義するパラメータが設計情報として選択される。以下、実施例１との差異を中心に実施例２について説明する。

図６は、実施例２の計算機システムの構成の一例を示す図である。

実施例２の計算機システムのハードウェア構成は実施例１と同一である。

実施例２の計算機１００−２は、強化学習を実行することによって、エージェントが行動を選択するための施策を数理モデルとして生成する。実施例２の計算機１００−１は、強化学習における環境又は行動の少なくともいずれかを定義するパラメータを選択する。

実施例２の計算機１００−１のハードウェア構成及びソフトウェア構成は実施例１と同一である。実施例２の計算機１００−２のハードウェア構成は実施例１と同一である。実施例２では、計算機１００−２のソフトウェア構成が実施例１と一部異なる。

具体的には、実施例２のモデル生成部１４０は、強化学習部６００及び環境実行部６０１を含む。

強化学習部６００は、強化学習におけるエージェントとして機能する。強化学習部６００は、環境（環境実行部６０１）から出力される環境の状態及び報酬の値等の情報を取得し、取得した情報及び施策に基づいて行動を選択する。また、強化学習部６００は、選択した行動に関する情報を環境実行部６０１に出力する。

環境実行部６０１は、強化学習における環境として機能する。環境実行部６０１は、強化学習部６００から出力される行動に関する情報を取得し、取得した情報及び現在の環境の状態に基づいて、状態の遷移のシミュレーションを実行する。また、環境実行部６０１は、報酬関数を管理し、シミュレーション結果及び報酬関数に基づいて報酬を算出する。環境実行部６０１は、遷移後の環境の状態及び報酬を強化学習部６００に出力する。

図７は、実施例２の計算機１００−１が提供するインタフェースの一例を示す図である。

計算機１００−１は、ユーザ端末１０１から学習実行要求を受け付けた場合、図７に示すようなＧＵＩ７００をインタフェースとしてユーザ端末１０１に提示する。ここで、ＧＵＩ７００について説明する。

ＧＵＩ７００は、ユーザ端末１０１の出力装置に表示される。ＧＵＩ７００は、モデル構成定義ファイル入力欄７０１、行動定義ファイル入力欄７０２、ＫＰＩ定義ファイル入力欄７０３、強化学習定義ファイル入力欄７０４、及び設定ボタン７０５を含む。

モデル構成定義ファイル入力欄７０１は、数理モデルを適用するシステム及び環境等を定義するモデル構成定義ファイルを設定するための欄である。行動定義ファイル入力欄７０２は、エージェントの行動を定義する行動定義ファイルを設定するための欄である。ＫＰＩ定義ファイル入力欄７０３は、ＫＰＩを定義するＫＰＩ定義ファイルを設定するための欄である。強化学習定義ファイル入力欄７０４は、学習方法を定義する強化学習定義ファイルを入力するための欄である。当該ファイルには、報酬関数、報酬の算出タイミング、数理モデルを適用するシステムのパラメータ等が含まれる。

設定ボタン７０５は、ＧＵＩ７００に入力した情報を計算機１００−１に送信するための操作ボタンである。

計算機１００−１は、ＧＵＩ７００を介して入力された情報のうち、モデル構成定義ファイル、行動定義ファイル、及び強化学習定義ファイルを計算機１００−２に送信する。モデル生成部１４０は、モデル構成定義ファイル、行動定義ファイル、及び強化学習定義ファイルに基づいて、強化学習部６００及び環境実行部６０１を生成する。

ここで、図８に示すようなシステム及び環境を例に施策の学習について説明する。図８は、実施例２の計算機システムが生成する数理モデルを適用するシステムの構成例を示す図である。

ディスパッチャ８１０は、施策８１１にしたがって、製造業務を行う、複数の装置８０１を有する工場８００に投入するアイテム８２１をキュー８２０から選択する。キュー８２０からのアイテム８２１の選択が行動に対応する。また、装置８０１、アイテム８２１、及び工場８００の状態等が環境として定義される。ＫＰＩとしては、アイテム８２１の処理に要する処理時間及び納期余裕時間等のアイテム８２１個々のＫＰＩと、平均処理時間及び納期順守率等のシステム全体のＫＰＩが考えられる。報酬は、例えば、平均処理時間及び納期順守率をパラメータとする関数として与えることができる。

実施例２の設計情報は、環境及び行動の少なくともいずれかを定義するパラメータとして用いることができるパラメータである。また、実施例２の設計パラメータは設計情報そのものである。

図８に示すようなシステムでは、装置８０１毎に、投入時間、投入されたアイテム８２１の種別、アイテム８２１の温度、装置８０１の状態、装置８０１への次のアイテム８２１の投入待ち時間等を含む稼働データが取得される。また、工場８００の温度等を含む環境に関する稼働データが取得される。

なお、装置８０１の稼働データには、あるアイテム８２１の前後に投入されたアイテム８２１の情報、処理待ちのアイテム８２１の情報が含まれてもよい。この場合、ウインドウ幅等を設定してもよい。

なお、図８に示すシステムは、製造業務以外の業務にも適用できる。より、具体的には、アイテムを処理する複数の工程から構成される業務にも適用できる。例えば、データがアイテム、データ処理が工程である、情報処理業務にも適用できる。

次に、実施例２の計算機システムにおける処理について説明する。

実施例２では、ＫＰＩ算出部１２０は、稼働データから以下のようなＫＰＩ用入力データを生成する。

アイテム８２１個々のＫＰＩが定義されている場合、ＫＰＩ算出部１２０は、アイテム８２１単位のデータをＫＰＩ用入力データとして生成する（ステップＳ１０２）。具体的には、以下のような処理が実行される。

（処理１）ＫＰＩ算出部１２０は、各装置８０１から取得される稼働データをアイテム毎に分類し、アイテム単位の稼働データから構成されるデータセットを生成する。ＫＰＩ算出部１２０は、データセットに含まれる稼働データを時間順にソートする。

（処理２）ＫＰＩ算出部１２０は、ターゲットデータセットを選択する。ＫＰＩ算出部１２０は、ターゲットデータセットに対応するアイテムのＫＰＩ入力用データを生成する。ＫＰＩ算出部１２０は、ターゲットデータセットからターゲット稼働データを選択する。

（処理３）ＫＰＩ算出部１２０は、ターゲット稼働データに含まれる時刻と同一の時刻を含む、環境に関する稼働データを検索する。ＫＰＩ算出部１２０は、ターゲット稼働データ及び検索された稼働データに基づいて、ＫＰＩ入力用データのフィールドを設定する。ＫＰＩ算出部１２０は、ターゲットデータセットに含まれる全ての稼働データについて同様の処理を実行する。

なお、ＫＰＩ算出部１２０は、ターゲット稼働データに含まれる時刻と同一の時刻を基準とした時間幅に含まれる時刻を含む、環境に関する稼働データを検索してもよい。

ＫＰＩ算出部１２０は、全てのデータセットに対して（処理２）及び（処理３）の処理を実行する。

以上の操作によって生成されたＫＰＩ用入力データのフィールドは、例えば、アイテム８２１の投入時刻、アイテム８２１の種別、納期、アイテム８２１の温度、アイテム８２１投入時の装置８０１の状態、及び装置８０１へのアイテム８２１の投入待ち時間等が含まれる。

システム全体のＫＰＩが定義されている場合、ＫＰＩ算出部１２０は、アイテム８２１単位のデータを生成し、時系列が連続するデータ群からＫＰＩ用入力データを生成する（ステップＳ１０２）。例えば、複数のデータの各パラメータの平均値を含むＫＰＩ用入力データが生成される。

実施例２では、設計情報選択部１２１は、ＫＰＩに対するパラメータ及びパラメータの組合せの寄与度を算出する（ステップＳ２０２）。また、設計情報選択部１２１は、ＫＰＩへの寄与（影響）が大きいパラメータ及びパラメータの組合せを選択する（ステップＳ２０３）。

実施例２では、モデル生成部１４０は、モデル構成定義ファイル、行動定義ファイル、及び強化学習定義ファイルの少なくともいずれかについて、ファイルに含めるパラメータ及びパラメータの組合せを更新する（ステップＳ３０２）。

モデル生成部１４０は、各定義ファイルに基づいて強化学習を実行し、施策を生成する（ステップＳ３０３）。

実施例２では、処理部１４１は、ユーザ端末１０１から複数のアイテム８２１を含む生産計画生成要求を受信した場合、施策８１１に基づいてアイテム８２１の投入順を決定する。このとき、処理部１４１は、シミュレータ等を用いて出力データから稼働データを生成し、また、稼働データをＫＰＩ算出部１２０に入力することによって、ＫＰＩを算出してもよい。

また、処理部１４１は、処理結果をユーザ端末１０１に出力する。ここで、処理結果を提示するためのインタフェースについて説明する。図９は、実施例２の処理部１４１が提供するインタフェースの一例を示す図である。

処理部１４１は、図９に示すようなＧＵＩ９００をユーザ端末１０１に提示する。ＧＵＩ９００は、ＫＰＩ寄与度表示欄９０１、問題設定表示欄９０２、及び結果表示欄９０３を含む。

ＫＰＩ寄与度表示欄９０１は、ＫＰＩに対するパラメータ及びパラメータの組合せの寄与度を示す欄である。ＫＰＩ寄与度表示欄９０１は、ＫＰＩに対するパラメータの寄与度を示す表９１１、及びＫＰＩに対するパラメータの組合せの寄与度を示す表９１２を含む。表９１１は、行がＫＰＩ、列がパラメータである行列形式のデータであり、セルにはＫＰＩに対するパラメータの寄与度が格納される。表９１２は、行がＫＰＩ、列がパラメータの組合せである行列形式のデータであり、セルにはＫＰＩに対するパラメータの組合せの寄与度が格納される。

問題設定表示欄９０２は、強化学習における問題設定に関する情報を表示する欄である。問題設定表示欄９０２には、例えば、状態を定義するパラメータ、行動、報酬に関する情報が表示される。

結果表示欄９０３は、出力データ及び処理部１４１によって算出されたＫＰＩ等、処理部１４１によって実行された処理結果を表示する欄である。

ユーザは、ＫＰＩが所望の値ではないと判断した場合、再度、学習実行要求を送信する。この場合、計算機１００−１、１００−２は、同様の処理を実行する。また、ＫＰＩが追加又は変更された場合も同様の処理が実行される。なお、再学習の要否を判断する基準に限定されない。

なお、選択されたパラメータ及びパラメータの組合せが前回から変化していない場合、モデル生成部１４０は、モデル構成定義ファイル、行動定義ファイル、及び強化学習定義ファイルを更新しない。なお、ＫＰＩの変更に伴って施策を再学習する場合、モデル生成部１４０は、前回の施策を初期施策として用いてもよい。前述のような学習は転移学習に相当する。

実施例２によれば、計算機１００−１は、環境及び行動の少なくともいずれかを定義するパラメータとして設定可能な複数のパラメータの中から、ＫＰＩへの寄与が大きいパラメータ（データ項目）を選択できる。選択されたパラメータから定義される環境等を用いた強化学習を実行することによって、計算機が実行可能な計算量で、出力されるデータの精度が高い数理モデルを生成できる。

また、ＫＰＩ及びパラメータ等の変更にも柔軟に対応した数理モデルの学習を実現できる。

実施例３では、数理モデルに入力される処理用入力データを構成するパラメータに課す制約条件が設計情報として選択される。以下、実施例１との差異を中心に実施例３について説明する。

実施例３の計算機システムの構成は実施例１と同一である。実施例３の計算機１００−２は、制約条件を満たす出力データを出力する数理モデルを生成する。実施例３の計算機１００−１は制約条件を選択する。実施例３の計算機１００−１、１００−２のハードウェア構成及びソフトウェア構成は実施例１と同一である。

実施例３では、ＫＰＩ算出部１２０は、稼働データから、制約条件の順守率を設計パラメータの値として含むＫＰＩ用入力データを生成する（ステップＳ１０２）。

なお、実施例３では、システムに設定できる、処理用入力データを構成するパラメータに課される制約条件の情報がＧＵＩ７００を介して入力される。

実施例３では、設計情報選択部１２１は、ＫＰＩに対する設計パラメータの寄与度を算出する（ステップＳ２０２）。また、設計情報選択部１２１は、ＫＰＩへの寄与（影響）が大きい設計パラメータ及び設計パラメータの組合せを選択する（ステップＳ２０３）。

実施例３では、ＫＰＩ用入力データには制約条件の順守率が設計パラメータの値として含まれることから、設計パラメータ及び設計パラメータの組合せを選択することは、制約条件及び制約条件の組合せを選択することに対応する。

実施例３では、モデル生成部１４０は、制約条件及び制約条件の組合せが設定されたシミュレータを数理モデルとして生成する（ステップＳ３０３）。

実施例３では、処理部１４１は、実行要求を受信した場合、選択された制約条件及び制約条件の組合せが設定されたシミュレータを呼び出す。

実施例３によれば、計算機１００−１は、システムに設定可能な複数の制約条件の中から、ＫＰＩへの寄与が大きい制約条件を選択できる。選択された制約条件が設定されたシミュレータは、計算機が実行可能な計算量で、高い精度の出力データを出力することができる。

なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。また、例えば、上記した実施例は本発明を分かりやすく説明するために構成を詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、実施例の構成の一部について、他の構成に追加、削除、置換することが可能である。

また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、本発明は、実施例の機能を実現するソフトウェアのプログラムコードによっても実現できる。この場合、プログラムコードを記録した記憶媒体をコンピュータに提供し、そのコンピュータが備えるＣＰＵが記憶媒体に格納されたプログラムコードを読み出す。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施例の機能を実現することになり、そのプログラムコード自体、及びそれを記憶した記憶媒体は本発明を構成することになる。このようなプログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、ＣＤ−ＲＯＭ、ＤＶＤ−ＲＯＭ、ハードディスク、ＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）、光ディスク、光磁気ディスク、ＣＤ−Ｒ、磁気テープ、不揮発性のメモリカード、ＲＯＭなどが用いられる。

また、本実施例に記載の機能を実現するプログラムコードは、例えば、アセンブラ、Ｃ／Ｃ＋＋、ｐｅｒｌ、Ｓｈｅｌｌ、ＰＨＰ、Ｐｙｔｈｏｎ、Ｊａｖａ（登録商標）等の広範囲のプログラム又はスクリプト言語で実装できる。

さらに、実施例の機能を実現するソフトウェアのプログラムコードを、ネットワークを介して配信することによって、それをコンピュータのハードディスクやメモリ等の記憶手段又はＣＤ−ＲＷ、ＣＤ−Ｒ等の記憶媒体に格納し、コンピュータが備えるＣＰＵが当該記憶手段や当該記憶媒体に格納されたプログラムコードを読み出して実行するようにしてもよい。

上述の実施例において、制御線や情報線は、説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。全ての構成が相互に接続されていてもよい。

１００計算機
１０１ユーザ端末
１０２ネットワーク
１１１ＣＰＵ
１１２メモリ
１１３ストレージ装置
１１４ネットワークインタフェース
１２０ＫＰＩ算出部
１２１設計情報選択部
１３０稼働データ情報
１４０モデル生成部
１４１処理部
１５０モデル情報
６００強化学習部
６０１環境実行部
７００、９００ＧＵＩ

Claims

対象システムの数理計画問題に用いる数理モデルの生成を支援する計算機システムであって、
演算装置及び記憶装置を有する少なくとも一つの計算機を備え、
前記数理モデルの生成に用いることができる複数の設計情報の中から有効な前記設計情報を選択する選択部と、
前記選択された設計情報を用いて前記数理モデルを生成するモデル生成部と、を備え、
前記選択部は、
前記複数の設計情報の各々に関連する設計パラメータを含む第１入力データと、前記第１入力データから算出される、前記対象システムの目的の達成度を評価するための第１指標とに基づいて、前記第１指標に対する前記複数の設計パラメータの各々の寄与の大きさを示す第２指標を算出し、
前記第２指標に基づいて、前記複数の設計情報の中から前記有効な設計情報を選択することを特徴とする計算機システム。
請求項１に記載の計算機システムであって、
前記選択部は、
前記第１指標を算出するための指標算出モデルを管理するための情報を保持し、
前記第１入力データを前記指標算出モデルに入力することによって、前記第１指標を算出することを特徴とする計算機システム。
請求項２に記載の計算機システムであって、
前記選択部は、前記第２指標が閾値より大きい前記設計パラメータに対応する前記設計情報を、前記有効な設計情報として選択することを特徴とする計算機システム。
請求項３に記載の計算機システムであって、
前記設計情報は、強化学習の環境及び行動の少なくともいずれかを定義するパラメータとして用いることができる定義パラメータであり、
前記モデル生成部は、選択された前記定義パラメータに基づく前記強化学習を実行することによって、第２入力データに基づいて行動を選択するための施策を前記数理モデルとして生成することを特徴とする計算機システム。
請求項４に記載の計算機システムであって、
前記対象システムの数理計画問題は、アイテムを処理する複数の工程から構成される業務における前記アイテムの投入順を最適化する問題であって、
前記選択部は、
前記業務の稼働データを取得し、
前記アイテム毎に、前記アイテムの識別情報を含む前記稼働データを収集することによってデータセットを生成し、
複数の前記データセットからターゲット稼働データを選択し、
前記複数のデータセットのいずれにも含まれない前記稼働データであって、前記ターゲット稼働データに含まれる時刻と同一の時刻を含む前記稼働データを検索し、
前記ターゲット稼働データ及び前記検索された稼働データを用いて、前記アイテム単位の前記第１入力データを生成することを特徴とする計算機システム。
請求項３に記載の計算機システムであって、
前記設計情報は、前記数理モデルに入力する第２入力データを構成する定義パラメータに対して課すことができる制約条件であり、
前記モデル生成部は、前記選択された制約条件を満たす出力データを出力するシミュレータを前記数理モデルとして生成することを特徴とする計算機システム。
演算装置及び記憶装置を有する少なくとも一つの計算機を含む計算機システムが実行する、対象システムの数理計画問題に用いる数理モデルの生成支援方法であって、
前記少なくとも一つの計算機が、前記数理モデルの生成に用いることができる複数の設計情報の各々に関連する設計パラメータを含む第１入力データと、前記第１入力データから算出される、前記対象システムの目的の達成度を評価するための第１指標とに基づいて、前記第１指標に対する前記複数の設計パラメータの各々の寄与の大きさを示す第２指標を算出する第１のステップと、
前記少なくとも一つの計算機が、前記第２指標に基づいて、前記複数の設計情報の中から有効な前記設計情報を選択する第２のステップと、
前記少なくとも一つの計算機が、前記選択された設計情報を用いて前記数理モデルを生成する第３のステップと、を含むことを特徴とする数理モデルの生成支援方法。
請求項７に記載の数理モデルの生成支援方法であって、
前記計算機システムは、前記第１指標を算出するための指標算出モデルを管理するための情報を保持し、
前記第１のステップは、前記少なくとも一つの計算機が、前記第１入力データを前記指標算出モデルに入力することによって、前記第１指標を算出するステップを含むことを特徴とする数理モデルの生成支援方法。
請求項８に記載の数理モデルの生成支援方法であって、
前記第２のステップは、前記少なくとも一つの計算機が、前記第２指標が閾値より大きい前記設計パラメータに対応する前記設計情報を、前記有効な設計情報として選択するステップを含むことを特徴とする数理モデルの生成支援方法。
請求項９に記載の数理モデルの生成支援方法であって、
前記設計情報は、強化学習の環境及び行動の少なくともいずれかを定義するパラメータとして用いることができる定義パラメータであり、
前記第３のステップは、前記少なくとも一つの計算機が、選択された前記定義パラメータに基づく前記強化学習を実行することによって、第２入力データに基づいて行動を選択するための施策を前記数理モデルとして生成するステップを含むことを特徴とする数理モデルの生成支援方法。
請求項１０に記載の数理モデルの生成支援方法であって、
前記対象システムの数理計画問題は、アイテムを処理する複数の工程から構成される業務における前記アイテムの投入順を最適化する問題であって、
前記数理モデルの生成支援方法は、
前記少なくとも一つの計算機が、前記業務の稼働データを取得するステップと、
前記少なくとも一つの計算機が、前記アイテム毎に、前記アイテムの識別情報を含む前記稼働データを収集することによってデータセットを生成するステップと、
前記少なくとも一つの計算機が、複数の前記データセットからターゲット稼働データを選択するステップと、
前記少なくとも一つの計算機が、前記複数のデータセットのいずれにも含まれない前記稼働データであって、前記ターゲット稼働データに含まれる時刻と同一の時刻を含む前記稼働データを検索するステップと、
前記少なくとも一つの計算機が、前記ターゲット稼働データ及び前記検索された稼働データを用いて、前記アイテム単位の前記第１入力データを生成するステップと、を含むことを特徴とする数理モデルの生成支援方法。
請求項９に記載の数理モデルの生成支援方法であって、
前記設計情報は、前記数理モデルに入力する第２入力データを構成する定義パラメータに対して課すことができる制約条件であり、
前記第３のステップは、前記少なくとも一つの計算機が、前記選択された制約条件を満たす出力データを出力するシミュレータを前記数理モデルとして生成するステップを含むことを特徴とする数理モデルの生成支援方法。