JP2021064049A - 計算機システム及び数理モデルの生成支援方法 - Google Patents

計算機システム及び数理モデルの生成支援方法 Download PDF

Info

Publication number
JP2021064049A
JP2021064049A JP2019186973A JP2019186973A JP2021064049A JP 2021064049 A JP2021064049 A JP 2021064049A JP 2019186973 A JP2019186973 A JP 2019186973A JP 2019186973 A JP2019186973 A JP 2019186973A JP 2021064049 A JP2021064049 A JP 2021064049A
Authority
JP
Japan
Prior art keywords
mathematical model
design information
computer
index
generation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019186973A
Other languages
English (en)
Inventor
正啓 間瀬
Tadakei Mase
正啓 間瀬
ユヨ オウ
Yuyao Wang
ユヨ オウ
雄司 千葉
Yuji Chiba
雄司 千葉
やえみ 寺本
Yaemi Teramoto
やえみ 寺本
俊宏 鯨井
Toshihiro Kujirai
俊宏 鯨井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2019186973A priority Critical patent/JP2021064049A/ja
Publication of JP2021064049A publication Critical patent/JP2021064049A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Abstract

【課題】計算機が実行可能な計算量で、精度が高いデータを出力する数理モデルを生成する。【解決手段】計算機システムは、数理モデルの生成に用いることができる複数の設計情報の中から有効な設計情報を選択する選択部と、選択された設計情報を用いて数理モデルを生成するモデル生成部と、を備え、選択部は、複数の設計情報の各々に関連する設計パラメータを含む第1入力データと、第1入力データから算出される、対象システムの目的の達成度を評価するための第1指標とに基づいて、第1指標に対する複数の設計パラメータの各々の寄与の大きさを示す第2指標を算出し、第2指標に基づいて、複数の設計情報の中から有効な設計情報を選択する。【選択図】図1

Description

本発明は、数理モデルの生成技術に関する。
近年、システムの最適化等を実現するために様々な数理モデルが活用されている。例えば、生産ラインにおける製品の生産計画を生成するために、数理モデルが利用される。ユーザは、システムの状態等に応じて数理モデルを生成又は選択する必要がある。
数理計画問題(数理最適化問題)に適用するモデルを生成する技術としては、深層学習及び強化学習等の学習手法が知られている。また、モデルを選択する技術として例えば、特許文献1に記載の技術が知られている。特許文献1には、「予測問題のための予測モデルを選択するための方法は、予測問題のための予測モデル化プロシージャの好適性を、予測問題の特性および/またはそれぞれのモデル化プロシージャの属性に基づいて判定する。予測モデル化プロシージャのサブセットを、予測問題のための選択されたモデル化プロシージャの判定された好適性に基づいて選択する。選択したモデル化プロシージャの実行のための計算リソースを割り付ける、リソース割付スケジュールを、予測問題のための選択されたモデル化プロシージャの判定された好適性に基づいて生成する。リソース割付スケジュールに従った選択したモデル化プロシージャの実行の結果を、取得する。予測問題のための予測モデルを、これらの結果に基づいて選択する。」ことが記載されている。
特開2019−23906号公報
Marco Tulio Ribeiro 他、「"Why Should I Trust You?": Explaining the Predictions of Any Classifier」、KDD '16 Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining、2016年8月、Pages 1135-1144 Scott M Lundberg 他、「A Unified Approach to Interpreting Model Predictions」、Advances in Neural Information Processing Systems 30、2017年12月、Pages 4765-4774
計算機が実行可能な計算量で、出力されるデータの精度が高い数理モデルを生成するためには、数理モデルを適応するシステムの構成及び状態等に適した、パラメータ及び制約条件等の設計情報を設定する必要がある。問題が複雑な場合、扱う状態空間が大きい場合、又は、制約条件が多い場合、設計情報の数が膨大となる。また、システムの構成及び条件等が変化した場合、設計情報が変わる。
本発明は、数理モデルの生成に有効な設計情報の設定を実現するシステム及び方法を提供することを目的とする。
本願において開示される発明の代表的な一例を示せば以下の通りである。すなわち、対象システムの数理計画問題に用いる数理モデルの生成を支援する計算機システムであって、演算装置及び記憶装置を有する少なくとも一つの計算機を備え、前記数理モデルの生成に用いることができる複数の設計情報の中から有効な前記設計情報を選択する選択部と、前記選択された設計情報を用いて前記数理モデルを生成するモデル生成部と、を備え、前記選択部は、前記複数の設計情報の各々に関連する設計パラメータを含む第1入力データと、前記第1入力データから算出される、前記対象システムの目的の達成度を評価するための第1指標とに基づいて、前記第1指標に対する前記複数の設計パラメータの各々の寄与の大きさを示す第2指標を算出し、前記第2指標に基づいて、前記複数の設計情報の中から前記有効な設計情報を選択する。
本発明によれば、数理モデルの生成に有効な設計情報を設定することができる。前述した以外の課題、構成及び効果は、以下の実施例の説明によって明らかにされる。
実施例1の計算機システムの構成の一例を示す図である。 実施例1のKPI算出部が実行する処理を説明するフローチャートである。 実施例1の設計情報選択部が実行する処理を説明するフローチャートである。 実施例1のモデル生成部が実行する処理を説明するフローチャートである。 実施例1の処理部が実行する処理を説明するフローチャートである。 実施例2の計算機システムの構成の一例を示す図である。 実施例2の計算機が提供するインタフェースの一例を示す図である。 実施例2の計算機システムが扱うシステムの構成例を示す図である。 実施例2の処理部が提供するインタフェースの一例を示す図である。
以下、本発明の実施例を、図面を用いて説明する。ただし、本発明は以下に示す実施の形態の記載内容に限定して解釈されるものではない。本発明の思想ないし趣旨から逸脱しない範囲で、その具体的構成を変更し得ることは当業者であれば容易に理解される。
以下に説明する発明の構成において、同一又は類似する構成又は機能には同一の符号を付し、重複する説明は省略する。
本明細書等における「第1」、「第2」、「第3」等の表記は、構成要素を識別するために付するものであり、必ずしも、数又は順序を限定するものではない。
図面等において示す各構成の位置、大きさ、形状、及び範囲等は、発明の理解を容易にするため、実際の位置、大きさ、形状、及び範囲等を表していない場合がある。したがって、本発明では、図面等に開示された位置、大きさ、形状、及び範囲等に限定されない。
実施例1では発明の概要について説明する。図1は、実施例1の計算機システムの構成の一例を示す図である。
図1に示す計算機システムは、複数の計算機100−1、100−2及びユーザ端末101から構成される。各装置はネットワーク102を介して互いに接続される。なお、ネットワーク102の種類としては、WAN(Wide Area Network)及びLAN(Local Area Network)等が考えられる。また、ネットワーク102の接続方式は有線又は無線のいずれでもよい。
本明細書では、計算機100−1、100−2を区別しない場合、計算機100と記載する。
計算機100−1は、数理モデルを生成するために用いることができる設計情報の中から、数理モデルの生成に有効な設計情報を選択する。設計情報は、例えば、パラメータ及び制約条件である。計算機100−2は、選択された設計情報に基づいて数理モデルを生成する。計算機システムで扱われる数理モデルは、ある対象システムにおける数理計画問題に使用する数理モデルである。
計算機100は、CPU111、メモリ112、ストレージ装置113、及びネットワークインタフェース114を有する。各ハードウェアは内部バス等を介して接続される。
CPU111は、メモリ112に格納されるプログラムを実行する。CPU111がプログラムにしたがって処理を実行することによって、所定の機能を有する機能部(モジュール)として動作する。以下の説明では、機能部を主語に処理を説明する場合、CPU111が、当該機能部を実現するプログラムを実行していることを表す。
メモリ112は、CPU111が実行するプログラム及び当該プログラムに必要な情報を格納する。また、メモリ112は、プログラムが一時的に使用するワークエリアを含む。
ストレージ装置113は、データを永続的に格納する。ストレージ装置113は、HDD(Hard Disk Drive)及びSSD(Solid State Drive)等の記憶媒体、又は不揮発性メモリ等が考えられる。なお、メモリ112に格納されるプログラム及び情報は、ストレージ装置113に格納されてもよい。この場合、CPU111は、ストレージ装置113からプログラム及び情報を読み出し、メモリ112にプログラム及び情報をロードし、また、メモリ112にロードされたプログラムを実行する。
ネットワークインタフェース114は、ネットワークを介して他の装置と接続する。
ユーザ端末101は、ユーザが使用する端末である。ユーザ端末101は、図示しないCPU、メモリ、ストレージ装置、ネットワークインタフェース、入力装置、及び出力装置を有する。入力装置は、キーボード、マウス、及びタッチパネル等である。出力装置は、ディスプレイ及びプリンタ等である。
ユーザは、ユーザ端末101を用いて、数理モデルを適用するシステムの構成等に関する定義情報及びKPI(Key Performance Indicator)に関する定義情報等を入力する。KPIに関する定義情報には、後述するKPI予測モデルに入力するデータの構造等が含まれる。
KPIは、システムの目的の達成度を評価するための指標である。例えば、製品を製造する生産ラインの制御を最適化するための数理モデルの場合、稼働率、処理時間、及び費用等がKPIとして定義される。
計算機100−1のメモリ112は、KPI算出部120及び設計情報選択部121を実現するプログラム、並びに、稼働データ情報130を格納する。
稼働データ情報130は、数理モデルを適用するシステムから取得される稼働データを管理する情報である。稼働データは、実際に運用しているシステムから取得されたログでもよいし、シミュレータによって生成されたデータでもよい。なお、メモリ112は、稼働データ情報130の代わりに、シミュレータを定義する情報を格納してもよい。この場合、当該情報により定義されるシミュレータによって稼働データが生成される。
KPI算出部120は、KPIを算出するためのKPI予測モデルに、KPI用入力データを入力することによってKPIを算出する。KPI用入力データには、設計情報に関連するパラメータの値が含まれる。以下の説明では、設計情報に関連するパラメータを設計パラメータとも記載する。
KPI予測モデルは、計算機100−1又は他の計算機によって生成される。例えば、計算機100−1のKPI算出部120は、KPIの定義情報に基づいて、数理モデルの適用先となるシステムの稼働データから学習用入力データを生成し、また、稼働データからKPIを算出する。計算機100−1は、学習用入力データ及びKPIから構成される学習データ及び既存の学習アルゴリズムに基づいて、KPI予測モデルを生成する。KPI予測モデルは、例えば、ニューラルネットワーク又は決定木等である。
なお、KPI予測モデルは、予め生成されてもよいし、KPI算出部120の処理の実行時に生成されてもよい。KPI予測モデルの情報はメモリ112に格納される。
設計情報選択部121は、KPIに対する設計パラメータの寄与の大きさを示す寄与度(影響度)を算出する。設計情報選択部121は算出された寄与度に基づいて、数理モデルの生成に有効な設計情報を選択する。KPI予測モデルに入力するKPI用入力データに含まれる設計パラメータの寄与度は、例えば、非特許文献1及び非特許文献2に記載の技術を用いて算出することができる。
計算機100−2のメモリ112は、モデル生成部140及び処理部141を実現するプログラム、並びに、モデル情報150を格納する。
モデル生成部140は、設計情報選択部121によって選択された設計情報に基づいて数理モデルを生成する。モデル生成部140は、生成された数理モデルの情報をモデル情報150として記憶する。
処理部141は、処理用入力データを受け付け、処理用入力データを数理モデルに入力することによって出力データを生成する。
なお、計算機100が有する各機能部については、複数の機能部を一つの機能部にまとめてもよいし、一つの機能部を機能毎に複数の機能部に分けてもよい。例えば、設計情報選択部121がKPI算出部120を含んでもよい。
図2は、実施例1のKPI算出部120が実行する処理を説明するフローチャートである。
KPI算出部120は稼働データ情報130から稼働データを取得する(ステップS101)。ここでは、ユーザが、ユーザ端末101を用いて稼働データを入力するものとする。なお、ユーザは稼働データの取得先を指定してもよい。ユーザによって入力された稼働データは、稼働データ情報130に格納される。
次に、KPI算出部120は、稼働データを用いてKPI用入力データを生成する(ステップS102)。KPI算出部120は、稼働データをそのままKPI用入力データとして生成してもよいし、稼働データの統計処理又は変換処理により生成されるデータをKPI用入力データとして生成してもよい。
なお、複数のKPIが存在する場合、KPI算出部120は、KPI毎に、異なる設計パラメータから構成されるKPI用入力データを生成してもよい。
次に、KPI算出部120は、KPI予測モデルにKPI用入力データを入力することによってKPIを算出する(ステップS103)。KPI算出部120は、KPI用入力データ及び算出されたKPIを設計情報選択部121に出力する。
図3は、実施例1の設計情報選択部121が実行する処理を説明するフローチャートである。
設計情報選択部121は、KPI及びKPI用入力データを受信した場合(ステップS201)、KPIに対する設計パラメータの寄与度を算出する(ステップS202)。ここでは、KPIに対する設計パラメータの組合せの寄与度も算出される。
例えば、設計情報選択部121は、非特許文献1に記載の算出方法を用いて、KPI予測モデルを加法分解することによって、設計パラメータ及び設計パラメータの組合せの各々について寄与度を算出する。設計パラメータの組合せを構成する設計パラメータの数は任意に設定できる。
なお、複数のKPIが存在する場合、設計情報選択部121は、KPI毎に、設計パラメータ及び設計パラメータの組合せの各々の寄与度を算出する。
設計情報選択部121は、設計パラメータ及び設計パラメータの組合せの寄与度に基づいて、KPIへの寄与(影響)が大きい設計情報及び設計情報の組合せを選択する(ステップS203)。
例えば、設計情報選択部121は、寄与度が閾値より大きい設計パラメータ及び設計パラメータの組合せに対応する設計情報及び設計情報の組合せを選択する。
設計情報選択部121は、選択された設計情報及び設計情報の組合せを計算機100−2に通知し(ステップS204)、その後、処理を終了する。具体的には、設計情報選択部121は、選択された設計情報及び設計情報の組合せに関する情報と、寄与度とを計算機100−2に送信する。
以上で説明したように、設計情報選択部121は、KPIへの寄与が大きい設計情報及び設計情報の組合せを、数理モデルの生成に有効な設計情報として選択する。設計情報を絞り込むことによって、計算機が実行可能な計算量に抑えることができる。また、KPIへの寄与が大きい設計情報を選択することによって、精度の高い出力データを出力できる数理モデルを効率的かつ容易に生成できる。
図4は、実施例1のモデル生成部140が実行する処理を説明するフローチャートである。
モデル生成部140は、設計情報選択部121から情報を受信した場合(ステップS301)、設計情報選択部121によって選択された設計情報及び設計情報の組合せを設定する(ステップS302)。
次に、モデル生成部140は、設定された設計情報及び設計情報の組合せに基づいて数理モデルを生成する(ステップS303)。
モデル生成部140は、生成された数理モデルの情報をモデル情報150として記憶する。このとき、モデル生成部140は、選択された設計情報及び設計情報の組合せに関する情報及び寄与度もあわせてモデル情報150に記憶する。
なお、本発明は、モデルの生成手法及びアルゴリズムに限定されない。また、生成するモデルの種別に限定されない。
図5は、実施例1の処理部141が実行する処理を説明するフローチャートである。
処理部141は、処理用入力データを受け付けた場合(ステップS401)、モデル情報150に格納される数理モデルにしたがって処理を実行することによって、出力データを生成する(ステップS402)。なお、処理用入力データは、ユーザ端末101から入力される。
次に、処理部141は、ユーザ端末101に出力データ及び説明情報を送信する(ステップS403)。ここで、説明情報は、設計情報及び設計情報の組合せに関する情報並びに寄与度を含む。
なお、システム環境及びKPIの定義の少なくともいずれかが変化した場合、計算機システムは、再度、KPI予測モデルを生成した後、同様の処理を実行する。これによって、システム環境及びKPIの定義の変化に柔軟に対応した数理モデルを、効率的かつ容易に生成することができる。
実施例1によれば、KPIに対する寄与が大きい設計情報及び設計情報の組合せを選択することによって、計算機が実行可能な計算量で、出力されるデータの精度が高い数理モデルを生成できる。
また、数理モデルを用いて得られた出力データとともに、数理モデルを生成するために使用した設計情報及び設計情報の組合せを、出力データの根拠としてユーザに提示できる。
実施例2では、数理モデルを生成するために用いるパラメータ(データ項目)が設計情報として選択される。特に、施策を数理モデルとして生成する強化学習における環境及び行動の少なくともいずれかを定義するパラメータが設計情報として選択される。以下、実施例1との差異を中心に実施例2について説明する。
図6は、実施例2の計算機システムの構成の一例を示す図である。
実施例2の計算機システムのハードウェア構成は実施例1と同一である。
実施例2の計算機100−2は、強化学習を実行することによって、エージェントが行動を選択するための施策を数理モデルとして生成する。実施例2の計算機100−1は、強化学習における環境又は行動の少なくともいずれかを定義するパラメータを選択する。
実施例2の計算機100−1のハードウェア構成及びソフトウェア構成は実施例1と同一である。実施例2の計算機100−2のハードウェア構成は実施例1と同一である。実施例2では、計算機100−2のソフトウェア構成が実施例1と一部異なる。
具体的には、実施例2のモデル生成部140は、強化学習部600及び環境実行部601を含む。
強化学習部600は、強化学習におけるエージェントとして機能する。強化学習部600は、環境(環境実行部601)から出力される環境の状態及び報酬の値等の情報を取得し、取得した情報及び施策に基づいて行動を選択する。また、強化学習部600は、選択した行動に関する情報を環境実行部601に出力する。
環境実行部601は、強化学習における環境として機能する。環境実行部601は、強化学習部600から出力される行動に関する情報を取得し、取得した情報及び現在の環境の状態に基づいて、状態の遷移のシミュレーションを実行する。また、環境実行部601は、報酬関数を管理し、シミュレーション結果及び報酬関数に基づいて報酬を算出する。環境実行部601は、遷移後の環境の状態及び報酬を強化学習部600に出力する。
図7は、実施例2の計算機100−1が提供するインタフェースの一例を示す図である。
計算機100−1は、ユーザ端末101から学習実行要求を受け付けた場合、図7に示すようなGUI700をインタフェースとしてユーザ端末101に提示する。ここで、GUI700について説明する。
GUI700は、ユーザ端末101の出力装置に表示される。GUI700は、モデル構成定義ファイル入力欄701、行動定義ファイル入力欄702、KPI定義ファイル入力欄703、強化学習定義ファイル入力欄704、及び設定ボタン705を含む。
モデル構成定義ファイル入力欄701は、数理モデルを適用するシステム及び環境等を定義するモデル構成定義ファイルを設定するための欄である。行動定義ファイル入力欄702は、エージェントの行動を定義する行動定義ファイルを設定するための欄である。KPI定義ファイル入力欄703は、KPIを定義するKPI定義ファイルを設定するための欄である。強化学習定義ファイル入力欄704は、学習方法を定義する強化学習定義ファイルを入力するための欄である。当該ファイルには、報酬関数、報酬の算出タイミング、数理モデルを適用するシステムのパラメータ等が含まれる。
設定ボタン705は、GUI700に入力した情報を計算機100−1に送信するための操作ボタンである。
計算機100−1は、GUI700を介して入力された情報のうち、モデル構成定義ファイル、行動定義ファイル、及び強化学習定義ファイルを計算機100−2に送信する。モデル生成部140は、モデル構成定義ファイル、行動定義ファイル、及び強化学習定義ファイルに基づいて、強化学習部600及び環境実行部601を生成する。
ここで、図8に示すようなシステム及び環境を例に施策の学習について説明する。図8は、実施例2の計算機システムが生成する数理モデルを適用するシステムの構成例を示す図である。
ディスパッチャ810は、施策811にしたがって、製造業務を行う、複数の装置801を有する工場800に投入するアイテム821をキュー820から選択する。キュー820からのアイテム821の選択が行動に対応する。また、装置801、アイテム821、及び工場800の状態等が環境として定義される。KPIとしては、アイテム821の処理に要する処理時間及び納期余裕時間等のアイテム821個々のKPIと、平均処理時間及び納期順守率等のシステム全体のKPIが考えられる。報酬は、例えば、平均処理時間及び納期順守率をパラメータとする関数として与えることができる。
実施例2の設計情報は、環境及び行動の少なくともいずれかを定義するパラメータとして用いることができるパラメータである。また、実施例2の設計パラメータは設計情報そのものである。
図8に示すようなシステムでは、装置801毎に、投入時間、投入されたアイテム821の種別、アイテム821の温度、装置801の状態、装置801への次のアイテム821の投入待ち時間等を含む稼働データが取得される。また、工場800の温度等を含む環境に関する稼働データが取得される。
なお、装置801の稼働データには、あるアイテム821の前後に投入されたアイテム821の情報、処理待ちのアイテム821の情報が含まれてもよい。この場合、ウインドウ幅等を設定してもよい。
なお、図8に示すシステムは、製造業務以外の業務にも適用できる。より、具体的には、アイテムを処理する複数の工程から構成される業務にも適用できる。例えば、データがアイテム、データ処理が工程である、情報処理業務にも適用できる。
次に、実施例2の計算機システムにおける処理について説明する。
実施例2では、KPI算出部120は、稼働データから以下のようなKPI用入力データを生成する。
アイテム821個々のKPIが定義されている場合、KPI算出部120は、アイテム821単位のデータをKPI用入力データとして生成する(ステップS102)。具体的には、以下のような処理が実行される。
(処理1)KPI算出部120は、各装置801から取得される稼働データをアイテム毎に分類し、アイテム単位の稼働データから構成されるデータセットを生成する。KPI算出部120は、データセットに含まれる稼働データを時間順にソートする。
(処理2)KPI算出部120は、ターゲットデータセットを選択する。KPI算出部120は、ターゲットデータセットに対応するアイテムのKPI入力用データを生成する。KPI算出部120は、ターゲットデータセットからターゲット稼働データを選択する。
(処理3)KPI算出部120は、ターゲット稼働データに含まれる時刻と同一の時刻を含む、環境に関する稼働データを検索する。KPI算出部120は、ターゲット稼働データ及び検索された稼働データに基づいて、KPI入力用データのフィールドを設定する。KPI算出部120は、ターゲットデータセットに含まれる全ての稼働データについて同様の処理を実行する。
なお、KPI算出部120は、ターゲット稼働データに含まれる時刻と同一の時刻を基準とした時間幅に含まれる時刻を含む、環境に関する稼働データを検索してもよい。
KPI算出部120は、全てのデータセットに対して(処理2)及び(処理3)の処理を実行する。
以上の操作によって生成されたKPI用入力データのフィールドは、例えば、アイテム821の投入時刻、アイテム821の種別、納期、アイテム821の温度、アイテム821投入時の装置801の状態、及び装置801へのアイテム821の投入待ち時間等が含まれる。
システム全体のKPIが定義されている場合、KPI算出部120は、アイテム821単位のデータを生成し、時系列が連続するデータ群からKPI用入力データを生成する(ステップS102)。例えば、複数のデータの各パラメータの平均値を含むKPI用入力データが生成される。
実施例2では、設計情報選択部121は、KPIに対するパラメータ及びパラメータの組合せの寄与度を算出する(ステップS202)。また、設計情報選択部121は、KPIへの寄与(影響)が大きいパラメータ及びパラメータの組合せを選択する(ステップS203)。
実施例2では、モデル生成部140は、モデル構成定義ファイル、行動定義ファイル、及び強化学習定義ファイルの少なくともいずれかについて、ファイルに含めるパラメータ及びパラメータの組合せを更新する(ステップS302)。
モデル生成部140は、各定義ファイルに基づいて強化学習を実行し、施策を生成する(ステップS303)。
実施例2では、処理部141は、ユーザ端末101から複数のアイテム821を含む生産計画生成要求を受信した場合、施策811に基づいてアイテム821の投入順を決定する。このとき、処理部141は、シミュレータ等を用いて出力データから稼働データを生成し、また、稼働データをKPI算出部120に入力することによって、KPIを算出してもよい。
また、処理部141は、処理結果をユーザ端末101に出力する。ここで、処理結果を提示するためのインタフェースについて説明する。図9は、実施例2の処理部141が提供するインタフェースの一例を示す図である。
処理部141は、図9に示すようなGUI900をユーザ端末101に提示する。GUI900は、KPI寄与度表示欄901、問題設定表示欄902、及び結果表示欄903を含む。
KPI寄与度表示欄901は、KPIに対するパラメータ及びパラメータの組合せの寄与度を示す欄である。KPI寄与度表示欄901は、KPIに対するパラメータの寄与度を示す表911、及びKPIに対するパラメータの組合せの寄与度を示す表912を含む。表911は、行がKPI、列がパラメータである行列形式のデータであり、セルにはKPIに対するパラメータの寄与度が格納される。表912は、行がKPI、列がパラメータの組合せである行列形式のデータであり、セルにはKPIに対するパラメータの組合せの寄与度が格納される。
問題設定表示欄902は、強化学習における問題設定に関する情報を表示する欄である。問題設定表示欄902には、例えば、状態を定義するパラメータ、行動、報酬に関する情報が表示される。
結果表示欄903は、出力データ及び処理部141によって算出されたKPI等、処理部141によって実行された処理結果を表示する欄である。
ユーザは、KPIが所望の値ではないと判断した場合、再度、学習実行要求を送信する。この場合、計算機100−1、100−2は、同様の処理を実行する。また、KPIが追加又は変更された場合も同様の処理が実行される。なお、再学習の要否を判断する基準に限定されない。
なお、選択されたパラメータ及びパラメータの組合せが前回から変化していない場合、モデル生成部140は、モデル構成定義ファイル、行動定義ファイル、及び強化学習定義ファイルを更新しない。なお、KPIの変更に伴って施策を再学習する場合、モデル生成部140は、前回の施策を初期施策として用いてもよい。前述のような学習は転移学習に相当する。
実施例2によれば、計算機100−1は、環境及び行動の少なくともいずれかを定義するパラメータとして設定可能な複数のパラメータの中から、KPIへの寄与が大きいパラメータ(データ項目)を選択できる。選択されたパラメータから定義される環境等を用いた強化学習を実行することによって、計算機が実行可能な計算量で、出力されるデータの精度が高い数理モデルを生成できる。
また、KPI及びパラメータ等の変更にも柔軟に対応した数理モデルの学習を実現できる。
実施例3では、数理モデルに入力される処理用入力データを構成するパラメータに課す制約条件が設計情報として選択される。以下、実施例1との差異を中心に実施例3について説明する。
実施例3の計算機システムの構成は実施例1と同一である。実施例3の計算機100−2は、制約条件を満たす出力データを出力する数理モデルを生成する。実施例3の計算機100−1は制約条件を選択する。実施例3の計算機100−1、100−2のハードウェア構成及びソフトウェア構成は実施例1と同一である。
実施例3では、KPI算出部120は、稼働データから、制約条件の順守率を設計パラメータの値として含むKPI用入力データを生成する(ステップS102)。
なお、実施例3では、システムに設定できる、処理用入力データを構成するパラメータに課される制約条件の情報がGUI700を介して入力される。
実施例3では、設計情報選択部121は、KPIに対する設計パラメータの寄与度を算出する(ステップS202)。また、設計情報選択部121は、KPIへの寄与(影響)が大きい設計パラメータ及び設計パラメータの組合せを選択する(ステップS203)。
実施例3では、KPI用入力データには制約条件の順守率が設計パラメータの値として含まれることから、設計パラメータ及び設計パラメータの組合せを選択することは、制約条件及び制約条件の組合せを選択することに対応する。
実施例3では、モデル生成部140は、制約条件及び制約条件の組合せが設定されたシミュレータを数理モデルとして生成する(ステップS303)。
実施例3では、処理部141は、実行要求を受信した場合、選択された制約条件及び制約条件の組合せが設定されたシミュレータを呼び出す。
実施例3によれば、計算機100−1は、システムに設定可能な複数の制約条件の中から、KPIへの寄与が大きい制約条件を選択できる。選択された制約条件が設定されたシミュレータは、計算機が実行可能な計算量で、高い精度の出力データを出力することができる。
なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。また、例えば、上記した実施例は本発明を分かりやすく説明するために構成を詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、実施例の構成の一部について、他の構成に追加、削除、置換することが可能である。
また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、本発明は、実施例の機能を実現するソフトウェアのプログラムコードによっても実現できる。この場合、プログラムコードを記録した記憶媒体をコンピュータに提供し、そのコンピュータが備えるCPUが記憶媒体に格納されたプログラムコードを読み出す。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施例の機能を実現することになり、そのプログラムコード自体、及びそれを記憶した記憶媒体は本発明を構成することになる。このようなプログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、CD−ROM、DVD−ROM、ハードディスク、SSD(Solid State Drive)、光ディスク、光磁気ディスク、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどが用いられる。
また、本実施例に記載の機能を実現するプログラムコードは、例えば、アセンブラ、C/C++、perl、Shell、PHP、Python、Java(登録商標)等の広範囲のプログラム又はスクリプト言語で実装できる。
さらに、実施例の機能を実現するソフトウェアのプログラムコードを、ネットワークを介して配信することによって、それをコンピュータのハードディスクやメモリ等の記憶手段又はCD−RW、CD−R等の記憶媒体に格納し、コンピュータが備えるCPUが当該記憶手段や当該記憶媒体に格納されたプログラムコードを読み出して実行するようにしてもよい。
上述の実施例において、制御線や情報線は、説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。全ての構成が相互に接続されていてもよい。
100 計算機
101 ユーザ端末
102 ネットワーク
111 CPU
112 メモリ
113 ストレージ装置
114 ネットワークインタフェース
120 KPI算出部
121 設計情報選択部
130 稼働データ情報
140 モデル生成部
141 処理部
150 モデル情報
600 強化学習部
601 環境実行部
700、900 GUI

Claims (12)

  1. 対象システムの数理計画問題に用いる数理モデルの生成を支援する計算機システムであって、
    演算装置及び記憶装置を有する少なくとも一つの計算機を備え、
    前記数理モデルの生成に用いることができる複数の設計情報の中から有効な前記設計情報を選択する選択部と、
    前記選択された設計情報を用いて前記数理モデルを生成するモデル生成部と、を備え、
    前記選択部は、
    前記複数の設計情報の各々に関連する設計パラメータを含む第1入力データと、前記第1入力データから算出される、前記対象システムの目的の達成度を評価するための第1指標とに基づいて、前記第1指標に対する前記複数の設計パラメータの各々の寄与の大きさを示す第2指標を算出し、
    前記第2指標に基づいて、前記複数の設計情報の中から前記有効な設計情報を選択することを特徴とする計算機システム。
  2. 請求項1に記載の計算機システムであって、
    前記選択部は、
    前記第1指標を算出するための指標算出モデルを管理するための情報を保持し、
    前記第1入力データを前記指標算出モデルに入力することによって、前記第1指標を算出することを特徴とする計算機システム。
  3. 請求項2に記載の計算機システムであって、
    前記選択部は、前記第2指標が閾値より大きい前記設計パラメータに対応する前記設計情報を、前記有効な設計情報として選択することを特徴とする計算機システム。
  4. 請求項3に記載の計算機システムであって、
    前記設計情報は、強化学習の環境及び行動の少なくともいずれかを定義するパラメータとして用いることができる定義パラメータであり、
    前記モデル生成部は、選択された前記定義パラメータに基づく前記強化学習を実行することによって、第2入力データに基づいて行動を選択するための施策を前記数理モデルとして生成することを特徴とする計算機システム。
  5. 請求項4に記載の計算機システムであって、
    前記対象システムの数理計画問題は、アイテムを処理する複数の工程から構成される業務における前記アイテムの投入順を最適化する問題であって、
    前記選択部は、
    前記業務の稼働データを取得し、
    前記アイテム毎に、前記アイテムの識別情報を含む前記稼働データを収集することによってデータセットを生成し、
    複数の前記データセットからターゲット稼働データを選択し、
    前記複数のデータセットのいずれにも含まれない前記稼働データであって、前記ターゲット稼働データに含まれる時刻と同一の時刻を含む前記稼働データを検索し、
    前記ターゲット稼働データ及び前記検索された稼働データを用いて、前記アイテム単位の前記第1入力データを生成することを特徴とする計算機システム。
  6. 請求項3に記載の計算機システムであって、
    前記設計情報は、前記数理モデルに入力する第2入力データを構成する定義パラメータに対して課すことができる制約条件であり、
    前記モデル生成部は、前記選択された制約条件を満たす出力データを出力するシミュレータを前記数理モデルとして生成することを特徴とする計算機システム。
  7. 演算装置及び記憶装置を有する少なくとも一つの計算機を含む計算機システムが実行する、対象システムの数理計画問題に用いる数理モデルの生成支援方法であって、
    前記少なくとも一つの計算機が、前記数理モデルの生成に用いることができる複数の設計情報の各々に関連する設計パラメータを含む第1入力データと、前記第1入力データから算出される、前記対象システムの目的の達成度を評価するための第1指標とに基づいて、前記第1指標に対する前記複数の設計パラメータの各々の寄与の大きさを示す第2指標を算出する第1のステップと、
    前記少なくとも一つの計算機が、前記第2指標に基づいて、前記複数の設計情報の中から有効な前記設計情報を選択する第2のステップと、
    前記少なくとも一つの計算機が、前記選択された設計情報を用いて前記数理モデルを生成する第3のステップと、を含むことを特徴とする数理モデルの生成支援方法。
  8. 請求項7に記載の数理モデルの生成支援方法であって、
    前記計算機システムは、前記第1指標を算出するための指標算出モデルを管理するための情報を保持し、
    前記第1のステップは、前記少なくとも一つの計算機が、前記第1入力データを前記指標算出モデルに入力することによって、前記第1指標を算出するステップを含むことを特徴とする数理モデルの生成支援方法。
  9. 請求項8に記載の数理モデルの生成支援方法であって、
    前記第2のステップは、前記少なくとも一つの計算機が、前記第2指標が閾値より大きい前記設計パラメータに対応する前記設計情報を、前記有効な設計情報として選択するステップを含むことを特徴とする数理モデルの生成支援方法。
  10. 請求項9に記載の数理モデルの生成支援方法であって、
    前記設計情報は、強化学習の環境及び行動の少なくともいずれかを定義するパラメータとして用いることができる定義パラメータであり、
    前記第3のステップは、前記少なくとも一つの計算機が、選択された前記定義パラメータに基づく前記強化学習を実行することによって、第2入力データに基づいて行動を選択するための施策を前記数理モデルとして生成するステップを含むことを特徴とする数理モデルの生成支援方法。
  11. 請求項10に記載の数理モデルの生成支援方法であって、
    前記対象システムの数理計画問題は、アイテムを処理する複数の工程から構成される業務における前記アイテムの投入順を最適化する問題であって、
    前記数理モデルの生成支援方法は、
    前記少なくとも一つの計算機が、前記業務の稼働データを取得するステップと、
    前記少なくとも一つの計算機が、前記アイテム毎に、前記アイテムの識別情報を含む前記稼働データを収集することによってデータセットを生成するステップと、
    前記少なくとも一つの計算機が、複数の前記データセットからターゲット稼働データを選択するステップと、
    前記少なくとも一つの計算機が、前記複数のデータセットのいずれにも含まれない前記稼働データであって、前記ターゲット稼働データに含まれる時刻と同一の時刻を含む前記稼働データを検索するステップと、
    前記少なくとも一つの計算機が、前記ターゲット稼働データ及び前記検索された稼働データを用いて、前記アイテム単位の前記第1入力データを生成するステップと、を含むことを特徴とする数理モデルの生成支援方法。
  12. 請求項9に記載の数理モデルの生成支援方法であって、
    前記設計情報は、前記数理モデルに入力する第2入力データを構成する定義パラメータに対して課すことができる制約条件であり、
    前記第3のステップは、前記少なくとも一つの計算機が、前記選択された制約条件を満たす出力データを出力するシミュレータを前記数理モデルとして生成するステップを含むことを特徴とする数理モデルの生成支援方法。
JP2019186973A 2019-10-10 2019-10-10 計算機システム及び数理モデルの生成支援方法 Pending JP2021064049A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019186973A JP2021064049A (ja) 2019-10-10 2019-10-10 計算機システム及び数理モデルの生成支援方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019186973A JP2021064049A (ja) 2019-10-10 2019-10-10 計算機システム及び数理モデルの生成支援方法

Publications (1)

Publication Number Publication Date
JP2021064049A true JP2021064049A (ja) 2021-04-22

Family

ID=75486255

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019186973A Pending JP2021064049A (ja) 2019-10-10 2019-10-10 計算機システム及び数理モデルの生成支援方法

Country Status (1)

Country Link
JP (1) JP2021064049A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023166631A1 (ja) * 2022-03-02 2023-09-07 日本電信電話株式会社 支援装置、支援方法及び支援プログラム
WO2023248426A1 (ja) * 2022-06-23 2023-12-28 日本電気株式会社 学習装置、表示装置、学習方法、表示方法および記録媒体
JP7459856B2 (ja) 2021-11-26 2024-04-02 横河電機株式会社 装置、方法およびプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7459856B2 (ja) 2021-11-26 2024-04-02 横河電機株式会社 装置、方法およびプログラム
WO2023166631A1 (ja) * 2022-03-02 2023-09-07 日本電信電話株式会社 支援装置、支援方法及び支援プログラム
WO2023248426A1 (ja) * 2022-06-23 2023-12-28 日本電気株式会社 学習装置、表示装置、学習方法、表示方法および記録媒体

Similar Documents

Publication Publication Date Title
Valledor et al. Solving multi-objective rescheduling problems in dynamic permutation flow shop environments with disruptions
US10528563B2 (en) Predictive table pre-joins in large scale data management system using graph community detection
US8321183B2 (en) Multi-variable control-based optimization to achieve target goal
US10496436B2 (en) Method and apparatus for automatically scheduling jobs in computer numerical control machines using machine learning approaches
US20160328273A1 (en) Optimizing workloads in a workload placement system
Khalili-Damghani et al. Solving multi-mode time–cost–quality trade-off problems under generalized precedence relations
Mokhtari et al. A reliability/availability approach to joint production and maintenance scheduling with multiple preventive maintenance services
JP6975692B2 (ja) 計算機システム及び予測器が出力した予測値の根拠に関連する情報の提示方法
JP2021064049A (ja) 計算機システム及び数理モデルの生成支援方法
JP6982557B2 (ja) 報酬関数の生成方法及び計算機システム
US11531643B2 (en) Computer system and method of evaluating changes to data in a prediction model
US11416302B2 (en) Computer system and method for determining of resource allocation
JP7057761B2 (ja) 計算機システム及び情報の提示方法
JP6094593B2 (ja) 情報システム構築装置、情報システム構築方法および情報システム構築プログラム
US20220207414A1 (en) System performance optimization
Van Ha et al. Solving intertemporal CGE models in parallel using a singly bordered block diagonal ordering technique
KR20220096531A (ko) 빅데이터 분석을 위한 인공지능 기반의 클라우드 최적화 장치 및 방법
Almomani et al. Selecting a good stochastic system for the large number of alternatives
CN111309712A (zh) 基于数据仓库的优化任务调度方法、装置、设备及介质
KR102259945B1 (ko) 인공지능 기반의 예측을 활용하는 a/b 테스팅 시스템 및 방법
Voneva et al. Optimizing parametric dependencies for incremental performance model extraction
JP6689316B2 (ja) 計算機システム及び学習制御方法
JP7373384B2 (ja) 計算機システム及びスケジューリングシステムの検証方法
JP7280921B2 (ja) 計算機システム、推論方法、及びプログラム
Blažević et al. Modelling regional economic development