JPWO2019224909A1 - パラメータ選択方法、パラメータ選択プログラム、及び情報処理装置 - Google Patents

パラメータ選択方法、パラメータ選択プログラム、及び情報処理装置 Download PDF

Info

Publication number
JPWO2019224909A1
JPWO2019224909A1 JP2020520901A JP2020520901A JPWO2019224909A1 JP WO2019224909 A1 JPWO2019224909 A1 JP WO2019224909A1 JP 2020520901 A JP2020520901 A JP 2020520901A JP 2020520901 A JP2020520901 A JP 2020520901A JP WO2019224909 A1 JPWO2019224909 A1 JP WO2019224909A1
Authority
JP
Japan
Prior art keywords
parameter
value
evaluation
values
contour line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020520901A
Other languages
English (en)
Inventor
信貴 今村
信貴 今村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2019224909A1 publication Critical patent/JPWO2019224909A1/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

上記課題は、記憶部に記憶された、学習用データから得られた評価値とパラメータ値の組とから、評価値を予測する応答曲面を算出し、得られた前記評価値のうち最大の評価値のそれぞれから、算出した前記応答曲面上の、該最大の評価値以下で定めた等高線までの最短距離を求め、前記最大の評価値それぞれに対して求めた前記最短距離のうち、前記等高線から最も遠いパラメータ値の組を特定する処理をコンピュータが行うパラメータ選択方法により達成される。

Description

本発明は、パラメータ選択方法、パラメータ選択プログラム、及び情報処理装置に関する。
機械学習では、学習用のデータに対してグリッド状でパラメータを選択する等によりパラメータを設定し、選択されたパラメータそれぞれで学習し、学習により得られた予測値を評価することで、最も適切な評価値を得られるパラメータを特定し最適化を行っている。
評価関数に対するパラメータごとの感度を求め、感度の高いパラメータを優先的にチューニングし、収束回数を大幅に短縮する技術等が知られている。
特開平8−272761号公報 特開平5−265512号公報 特開平10−301975号公報
しかしながら、学習用のデータで最適な評価値の得られるパラメータを選択した場合でも、実際のデータにおける評価は低いことがある。学習用のデータと実際のデータでは傾向が異なる場合がある。
したがって、1つの側面では、判定精度を向上させることを目的とする。
一態様によれば、記憶部に記憶された、学習用データから得られた評価値とパラメータ値の組とから、評価値を予測する応答曲面を算出し、得られた前記評価値のうち最大の評価値のそれぞれから、算出した前記応答曲面上の、該最大の評価値以下で定めた等高線までの最短距離を求め、前記最大の評価値それぞれに対して求めた前記最短距離のうち、前記等高線から最も遠いパラメータ値の組を特定する処理をコンピュータが行うパラメータ選択方法が提供される。
判定精度を向上させることができる。
方法Aと本実施例とのパラメータの組の採用の違いを説明するための図である。 本実施例における距離を説明するための図である。 情報処理装置のハードウェア構成例を示す図である。 機械学習部の機能構成例を示す図である。 本実施例における機械学習処理の例を説明するための図である。 図5(A)の工程における気象データの例を示す図である。 電力量の実績値のデータ例を示す図である。 選択処理における構成例を示す図である。 選択処理を説明するためのフローチャート図である。 パラメータ空間における評価値の出現例を示す図である。 図10の出現例に対して評価値を加えた3次元グラフの表示例を示す図である。 等高線の生成例を示す図である。 最良パラメータ値の特定方法を説明するための図である。
以下、本発明の実施の形態を図面に基づいて説明する。機械学習では、学習用のデータで学習を行い、評価データでその予測結果を評価する。また、予め正解が分かっているデータを用いてその正解を当てられるようにチューニングを行う。しかし、正解が分かっているデータは過去のデータである場合が多いか、又は、一部しかない等により、実運用ではチューニングされた機械学習が正解を出せるとは限らない。
この主な原因として、学習用のデータと実際のデータの傾向の違い、ノイズの影響等が考えられる。また、学習用のデータと実際のデータとではデータ数が異なり、学習用のデータでは実際のデータのすべての傾向を学習させることが困難な場合がある。
このため、なるべく汎用性の高いチューニングを行う必要があるが、一般的な状況下で汎用性を高める技術は既存の技術として存在するが、評価値が量子化されている場合、又は、ノイズの影響等により最善の評価となるチューニング結果が複数存在する場合等がある。このような場合には、実際のデータに対して良い評価値となるパラメータを選択するのが困難である。
本実施例では、最善の評価となるチューニング結果が複数存在する場合に、最も汎用性が高いと考えられるチューニング結果をその複数の結果の中から選択するパラメータ選択方法、パラメータ選択プログラム、及び情報処理装置を提供する。
すなわち、各パラメータ値の組から最も近い、最良評価点を含むパラメータ空間の境目までの距離を求め、当該境目から最も遠いパラメータ値の組を取得する。それぞれの最良評価点は、評価の最高値と、そのときのパラメータ値の組とを示す。
一方、パラメータによって尺度が異なるため、パラメータ値を正規化する。また、評価値に効くパラメータと、評価値に効かないパラメータとが存在するため、評価値に効かないパラメータを閾値等を用いて削減し、評価値にある程度以上貢献するパラメータのみを用いて評価することが望ましい。
最良評価点を含むパラメータ空間の境目とは、パラメータの組のうち、1つ以上のパラメータ値の僅かな違いが評価値に大きく影響を与える「変化点」が位置するところである。最良評価点を含むパラメータ空間を、「最良パラメータ空間」というものとする。
また、最良パラメータ空間の境目は形状を表している。境目の少なくとも1つのパラメータ値が僅かに違うと評価結果が悪化するということは、評価されるデータが僅かに違うだけで、評価結果が異なってしまう(評価値が悪化する直前の)点であると考えられる。したがって、実際のデータでの利用時に影響を受けかねない危険性があるパラメータ値の組に相当する。
本実施例では、
(1)安定して良い評価値を得られる点を定量化する。
(2)評価結果から解の予測曲面を合成する。一例として、応答曲面を生成する。
(3)生成された応答曲面に対して定めた高さで等高線を生成する。
(4)それぞれの最良評価点と等高線の最短距離を求める。
(5)求めた最短距離のうち、最も近い等高線からの距離が最も大きい最良評価点を境目から最も遠い評価点であると判定する。安定して良い評価値となるパラメータの組を得るためには、境目から外側の傾きも評価し、傾きの評価結果を用いて、最短距離を加点評価してもよい。
上記(1)から(5)において、上記(4)を行う理由について説明する。まず、以下について検討する。
<方法A>
最良パラメータ空間の中央に最も近い点を採用する方法である。
<方法B>
最初に最良評価点を得たパラメータの組、最後に最良評価点を得たパラメータの組、又はランダムに選択したパラメータの組を採用する方法である。
<方法C>
パラメータの感度分析によりパラメータの組を採用する方法である。
図1は、方法Aと本実施例とのパラメータの組の採用の違いを説明するための図である。図1は、生成した応答曲面に対して作成された等高線3a、3b、3c、及び3dを上から見た俯瞰図を示している。等高線3aの内部が、最良パラメータ空間4spである。この例では、最良パラメータ空間4spに同じ評価値となった6個の最良評価点が示されている。各点は、パラメータの組を表す。
最良パラメータ空間4spの6点のうち、点4aが中央に最も近い点に相当し、方法Aにより選択される最良評価点である。一方、本実施例では、等高線3aからの距離が最も大きい点4bが最良評価点として選択される。このように、方法Aにより選択された中央に近い点4aが、必ずしも境目(等高線3a)から遠いとは限らない。方法Aでは、より安定して良い評価値となる点4bを特定し損なう場合がある。
次に、方法Bであるが、方法Bでは最良パラメータ空間4spの6点のうちいずれか1つが選択される。即ち、方法Aで選択された点4aよりも等高線3aの境目により近い点が選択される可能性がある。方法A以上に、安定して良い評価値となる点4bを特定し損なう恐れがある。
そして、方法Cであるが、方法Cではパラメータの感度分析によりパラメータの組が選択される。従来より、方法Cによるパラメータの組を選択することが行われていたが、パラメータ間に相互作用がある場合、個別にそれぞれのパラメータの感度を分析するだけでは不十分である。パラメータの感度とは、評価への貢献度に相当する。
本実施例では、最良パラメータ空間4spの境目(等高線3a)までの距離に基づいて安定して最良評価点となる点4bを選択することで、複数のパラメータの影響を同時に考慮することができる。ここで、本実施例で計算される距離について説明する。
図2は、本実施例における距離を説明するための図である。図2は、等高線3a〜3bを上から見た俯瞰図である。等高線3a〜3bが各軸P及びPに対して斜めに傾いた楕円形をしている場合で説明する。
本実施例では、最良パラメータ空間4sp内の各点4wに対して、等高線3aの接線に対する垂線を求めて点4wから等高線3aまでの距離を計算し、計算した距離のうち短い距離を点4wの距離とする。この例では、距離D1、D2、D3、及びD4が求められる。これら距離D1〜D4のうち最も短い距離D1を点4wの距離とする。図2の破線で示す距離は、等高線3aへの垂線に相当しないため計算されない。
既存の最適化問題の多くは、パラメータが比較的等質であるため、解の形状が円等の単純な形状である。従って、中心に近い点で十分であった。しかしながら、機械学習では、パラメータによって特徴が異なり解の形状が複雑になる。本実施例は、このような機械学習において、最良評価点の安定性を等高線3aまでの最短距離で定量化することで、複数の最良評価点から好適に1つを選択することができる。
上述したような、本実施例におけるパラメータ選択処理を実現する情報処理装置は、図3に示すようなハードウェア構成を有する。図3は、情報処理装置のハードウェア構成例を示す図である。
図3において、情報処理装置100は、コンピュータによって制御される情報処理装置であって、CPU(Central Processing Unit)11と、主記憶装置12と、補助記憶装置13と、入力装置14と、表示装置15と、通信I/F(インターフェース)17と、ドライブ装置18とを有し、バスBに接続される。
CPU11は、主記憶装置12に格納されたプログラムに従って情報処理装置100を制御するプロセッサに相当する。主記憶装置12には、RAM(Random Access Memory)、ROM(Read Only Memory)等が用いられ、CPU11にて実行されるプログラム、CPU11での処理に必要なデータ、CPU11での処理にて得られたデータ等を記憶又は一時保存する。
補助記憶装置13には、HDD(Hard Disk Drive)等が用いられ、各種処理を実行するためのプログラム等のデータを格納する。補助記憶装置13に格納されているプログラムの一部が主記憶装置12にロードされ、CPU11に実行されることによって、各種処理が実現される。主記憶装置12、補助記憶装置13、情報処理装置100がアクセス可能が外部記憶装置等を総称して記憶部130という。
入力装置14は、ユーザが情報処理装置100による処理に必要な各種情報を入力するために用いられる。表示装置15は、CPU11の制御のもとに必要な各種情報を表示する。入力装置14と表示装置15とは、一体化したタッチパネル等によるユーザインタフェースであってもよい。通信I/F17は、有線又は無線などのネットワークを通じて通信を行う。通信I/F17による通信は無線又は有線に限定されるものではない。
ドライブ装置18は、ドライブ装置18にセットされた記憶媒体19(例えば、CD−ROM(Compact Disc Read-Only Memory)等)と情報処理装置100とのインターフェースを行う。
情報処理装置100によって行われる処理を実現するプログラムは、例えば、CD−ROM等の記憶媒体19によってドライブ装置18を介して情報処理装置100に提供される。尚、プログラムを格納する記憶媒体19はCD−ROMに限定されず、コンピュータが読み取り可能な、構造(structure)を有する1つ以上の非一時的(non-transitory)な、有形(tangible)な媒体であればよい。コンピュータ読取可能な記憶媒体として、CD−ROMの他に、DVD(Digital Versatile Disk)ディスク、USBメモリ等の可搬型記録媒体、フラッシュメモリ等の半導体メモリであっても良い
本実施例が適用された機械学習部の機能構成例について説明する。図4は、機械学習部の機能構成例を示す図である。
図4より、本実施例における機械学習部200は、予測部71と、評価部73と、選択部80とを有する。予測部71と、評価部73と、選択部80とは、CPU11が対応するプログラムを実行することにより行われる処理により実現される。記憶部130には、入力データ51、出力データ53、評価結果55、最良パラメータ値97等が記憶される。
予測部71は、入力データ51を入力し、予測処理aを実行して、対象となる事象を予測する。予測処理aにはパラメータPaが設定される。入力データ51は、学習用のデータ(訓練データともいう)に相当する。パラメータPaは、予測処理aに対するパラメータ値を示す。予測処理aによって、出力データ53が記憶部130に出力され、出力データ53は予測結果を示す。簡単のため、予測部71は予測処理aのみを行うものとして説明するが、2以上の処理を実行してもよい。
評価部73は、出力データ53の精度を評価する。評価部73によって、評価結果55が記憶部130に蓄積される。評価結果55には、パラメータ値の組と評価値とが示される。出力データ53の精度は、予測誤差を算出することにより行われる。一例として、RMSE(Root Mean Squared Error)を用いればよい。
Figure 2019224909
選択部80は、評価結果55を蓄積したテーブル(後述される「評価結果蓄積テーブル57」)を用いて最良パラメータ値97を選択する。選択部80によって、最良パラメータ値97がパラメータPaに設定される。新たに設定されたパラメータPaにより、予測部71、評価部73、選択部80による処理が繰り返される。前回のパラメータPaと今回のパラメータPaとの差が予め定めた収束したことを判定するための判定値以下の場合に、今回のパラメータPaを実際に予測する際の最適化Paとして採用する。
このような本実施例における機械学習部200において、気象データから電力量を予測する場合を適用例として説明する。図5は、本実施例における機械学習処理の例を説明するための図である。
図5(A)は、図4に相当し、気象データから電力量を予測する場合の機械学習部200の工程を例示している。図5(A)では、パラメータPaを設定した予測部71は、気象データを入力データ51として入力し、電力量を予測し、出力データ53として出力する。
評価部73は、電力量の実績データ54を参照して出力データ53の精度を評価し、評価結果55を出力する。電力量の実績データ54は、教師データに相当する。本実施例に係る選択部80は、評価結果55の蓄積テーブルを用いて最良パラメータ値97を得る。最良パラメータ値97は、予測処理aのパラメータPaに設定される。
予測部71は、更新されたパラメータPaを予測処理aに設定して、気象データの入力データ51から電力量を予測して、出力データ53を更新する。評価部73は、出力データ53の精度を電力量の実績に基づいて評価し、評価結果55を出力する。本実施例に係る選択部80は、評価結果55の蓄積テーブルを用いて最良パラメータ値97を得る。最良パラメータ値97は、パラメータPaに設定される。
好ましくは、今回得られた最良パラメータ値97が、前回の最良パラメータ値97と略同一となった場合、今回の最良パラメータ値97を最適化Paとして記憶部130に記憶し、実際の電力量の予測に利用する。
図5(B)は、最適化Paを用いて、気象データ51−2に基づいて電力量を予測する工程を例示している。図5(B)では、予測部71は、気象データ51−2を入力し、最適化Paを設定した予測処理aを実行して、電力量の予測データ53−2を出力する。電力量の予測データ53−2は、現在時刻から所定期間における1時間ごとの電力量の予測値を示す。
図5(A)で示す工程と、図5(B)で示す工程とは、必ずしも同一の情報処理装置100によって行われない。それぞれ別の情報処理装置によって行われてもよい。一例として、図5(B)の工程を行うユーザに、本実施例に係る図5(A)の工程により得られた最適化Paを提供してもよい。
本実施例に係る選択部80を適用した図5(A)の工程において、利用される入力データ51及び電力量の実績データ54のデータ例を図6及び図7で示す。図6は、図5(A)の工程における気象データの例を示す図である「出典:気象庁ホームページ、インターネット<URL:http://www.jma.go.jp/jma/>」)。
図6に例示する入力データ51としての気象データは、年月日時、気温(℃)、降水量(mm)、日照時間(時間)、風速(m/s)、風向、現地気圧(hPa)、相対湿度(%)、積雪(cm)等の項目を有する。
年月日時は、計測した年月及び日時を示す。この例では、2017年1月1日の1時間ごとに計測した、気温(℃)、降水量(mm)、日照時間(時間)、風速(m/s)、風向、現地気圧(hPa)、相対湿度(%)、積雪(cm)等の値が記録されている。
一例として、年月日時「2017/1/1 1:00」では、気温(℃)「5.1」、降水量「0」mm、日照時間「0」時間、風速「3.5」m/s、風向「西北西」、現地気圧「1019.8」hPa、相対湿度「73」%、そして積雪「0」cmが記録されている。
このような気象データに対して、年月日時ごとの電力量の予測値が出力データ53として、予測部71から出力される。そして、図7に示されるような電力量の実績データ54を用いて、出力データ53の精度が評価される。
図7は、電力量の実績値のデータ例を示す図である。図7において、電力量の実績データ54は、日付、時間、実績値(万kW)等の項目を有する。日付は年月日を示し、時間は1時間ごとの時間を示す。実績値(万kW)は、日付及び時間における電力量の実測値を示している。図7のそれぞれの項目値は、実際のデータを想定して作成した架空のデータを示している。
評価部73は、年月日時ごとの、出力データ53で示される電力量の予測値と、電力量の実績データ54の実績値とに基づいて、出力データ53の精度を評価し、評価結果55を出力する。評価結果55は、評価部73が行われるごとに記憶部130に蓄積され、評価結果蓄積テーブル57として、選択部80で利用される。
図8は、選択処理における構成例を示す図である。図8において、選択部80は、応答曲面生成部81と、等高線生成部83と、最良評価点選択部85と、最遠点特定部87とを有する。応答曲面生成部81と、等高線生成部83と、最良評価点選択部85と、最遠点特定部87とは、CPU11が対応するプログラムを実行することにより行われる処理により実現される。また、記憶部130は、評価結果蓄積テーブル57、応答曲面情報91、等高線情報93、最良評価点情報95、最良パラメータ値97を含む選択情報99等を記憶する。
応答曲面生成部81は、評価結果蓄積テーブル57を用いて応答曲面を生成する応答曲面生成処理を行う。応答曲面生成部81によって応答曲面情報91が記憶部130に出力される。等高線生成部83は、生成した応答曲面に対して等高線を生成する等高線生成処理を行う。等高線生成部83によって等高線情報93が記憶部130に出力される。
最良評価点選択部85は、全ての評価点から最良評価点を選択する最良評価点選択処理を行う。本実施例では、評価値が同じ複数の最良評価点が選択されてもよい。最良評価点選択部85によって最良評価点情報95が記憶部130に出力される。
最遠点特定部87は、等高線情報93と最良評価点情報95とを参照して、複数の最良評価点が含まれる最良パラメータ空間4spの等高線を特定し、複数の最良評価点のうち、特定した等高線までの距離が最も遠い最良評価点を特定する最遠点特定処理を行う。最遠点特定部87は、複数の最良評価点のそれぞれについて、等高線までの距離を計算し、最も距離が長い最良パラメータ値97を特定する。最良パラメータ値97は、パラメータPaとして記憶部130に記憶される。
評価結果蓄積テーブル57は、既に得られた評価結果55を蓄積したデータテーブルであり、評価点と使用したパラメータPa(パラメータP、P、P、・・・、及びPの組)とを1レコードとし、評価した回数のレコード数を有する。
応答曲面情報91は、得られた応答曲面関数、曲面関数のパラメータ値等を示す。等高線情報93は、求める等高線の高さと、応答曲面情報とを示す。求める等高線の高さは、評価の最高値に定めた割合を乗算した値により指定される。一例として、最高値に0.9を乗算した値が示される。
最良評価点情報95は、評価点のうち最高値を得たパラメータ値の組とその最高値とを示したテーブルに相当する。選択情報99は、少なくとも最良パラメータ値97を示す情報である。選択情報99によって、更に、評価の最高値が示されてもよい。
図9は、選択処理を説明するためのフローチャート図である。図9において、選択部80による選択処理では、評価部73からの評価結果55の出力に応じて、評価結果蓄積テーブル57を読み込む(ステップS301)。
応答曲面生成部81は、評価結果蓄積テーブル57で示される評価値とパラメータ値とによるn次元空間に応答曲面を生成する(ステップS302)。応答曲面の生成には、既知点の近くを通る近似関数を求めて、解の形状を予測し最適解を得る応答曲面法等を用いることで、解の形状をn次元で表すことができる。応答曲面情報91が記憶部130に出力される。そして、得られた解の形状を表す応答曲面に対して等高線が作成される。
等高線生成部83は、最良評価点から定めた値分低い位置で等高線を生成する(ステップS303)。等高線生成部83は、応答曲面情報91で表される応答曲面に対して、予め設定された値(0.9等)を用いて等高線の高さを求め、求めた高さで等高線を生成する。
一方、最良評価点選択部85は、評価結果蓄積テーブル57の評価値の中から、最高値と最高値を得たパラメータ値の組とを最良評価点として取得する(ステップS304)。複数の最良評価点が取得されてもよい。最良評価点情報95が記憶部130に記憶される。
そして、最遠点特定部87は、最良評価点情報95で示される最良評価点のそれぞれについて、等高線までの最短距離を計算する(ステップS305)。次に、最遠点特定部87は、得られた最短距離が最も大きい最良評価点を特定し、特定した最良評価点からパラメータ値を取得して最良パラメータ値97に設定する(ステップS306)。最良パラメータ値97を示す選択情報99が記憶部130に出力される。最良パラメータ値97と、最高値とを示す最良評価点が、選択情報99に設定されてもよい。そして、選択部80による選択処理を終了する。
次に、選択処理の例について図10から図13で説明する。以下の例では、評価値は、0、1、2、3のいずれかの整数値を示すものとする。また、説明を簡潔にするため、パラメータをP及びPの2つとし、2次元のパラメータ空間において、三日月形にそれぞれの評価値が現れるものとする。
図10は、パラメータ空間における評価値の出現例を示す図である。図10では、パラメータP及びPの2次元空間上に、評価値「1」、「2」、「3」のそれぞれの値をとる領域5c、5b、5aを、順に色を濃くして示している。評価値「3」をとる領域5aが最も濃い色で表されている。
パラメータPが取りうる値「−3」から「3」の範囲と、パラメータPが取りうる値「−3」から「3」の範囲とにおいて、5000点のパラメータ値の組をサンプリングし、パラメータ値の組による評価値をz軸に示した3次元グラフの表示例を図11に示す。
図11は、図10の出現例に対して評価値を加えた3次元グラフの表示例を示す図である。図11では、見易さのため、パラメータPは奥がマイナス値を示す。サンプリングした5000点のパラメータ値の組と評価値とを与えて、RandomForestにより近似曲面を生成し、合成することで、応答曲面6(図12)を生成する。
応答曲面生成部81による応答曲面処理では、評価結果蓄積テーブル57のレコード数が予め定めたサンプリング数に満たない場合には、全レコードを用いて応答曲面6を生成すればよい。評価結果蓄積テーブル57のレコード数が予め定めたサンプリング数以上存在する場合には、評価値が高い順にサンプリング数のレコードを抽出すればよい。そして、等高線生成部83による等高線生成処理によって、生成した応答曲面6に等高線3aが定められる。
図12は、等高線の生成例を示す図である。図12において、生成された応答曲面6に対して等高線3aが生成される。一例として、評価の最高値「3」に対して0.9を乗算して得た「2.7」の位置に等高線3aが生成される。最高値「3」より僅かに低い位置に等高線3aを生成することで、複数の最良評価点間の等高線3aまでの距離の差をより明確に示すことができる。従って、最良評価点の選択の精度を上げることができる。
評価の最高値「3」の最良評価点が、最良評価点選択部85により得られると、最遠点特定部87による最遠点特定処理が行われる。この例における最良評価点では、評価の最高値「3」を得たパラメータPとPの値も示される。
図13は、最良パラメータ値の特定方法を説明するための図である。図13では、6個の最良評価点MP_a、MP_b、MP_c、MP_d、MP_e、及びMP_fが、最良評価点選択部85により特定された場合を例として説明する。
図13(A)は、最良評価点情報95に対して、得られた等高線3aまでの距離を対応付けたテーブル例を示している。図13(A)のテーブルは、最良評価点ID、P、P、評価値、距離等の項目を有する。最良評価点IDは、最良評価点を特定する識別子を示す。Pは、パラメータPの値を示す。Pは、パラメータPの値を示す。評価値は、(P、P)の組の時の評価値を示す。この例では、最高値「3」を示す。距離は、最遠点特定部87によって計算された図12に示す等高線3aまでの距離を示す。
この例では、最良評価点MP_aの、パラメータPの値は「0.0」であり、パラメータPの値は「0.1」であり、評価値は「3.0」であり、距離は「0.10」であったことを示している。最良評価点MP_bの、パラメータPの値は「0.85」であり、パラメータPの値は「0.85」であり、評価値は「3.0」であり、距離は「0.011」であったことを示している。
以下、距離の値のみを示す。最良評価点MP_cの距離は「0.070」であり、最良評価点MP_dの距離は「0.050」であり、最良評価点MP_eの距離は「0.038」であり、最良評価点MP_fの距離は「0.067」である。
図13(B)では、P及びPのパラメータ空間に評価点をプロットした拡大図である。この例では、評価値「3.0」の最良評価点MP_a〜MP_fのみを示す。プロットされた最良評価点MP_a〜MP_fのうち、図13(A)のテーブルより、距離が一番遠い最良評価点MP_aが特定され、最良評価点MP_aのパラメータP及びPの値(0.0、0.1)が最良パラメータ値97であると決定される。
このように、最良評価点のそれぞれに対して、定めた等高線3aの境目までの最短距離を求め、求めた最短距離のうち、当該境目から最も遠い最良評価点を選択することで、より安定して良い評価値を得られるパラメータ値の組を選択することができる。複数の最良評価点から1つを選択する際の判定精度を向上させることができる。
上記説明において、応答曲面生成部81は応答曲面算出部の一例に相当し、最遠点特定部87は特定部の一例に相当する。
本発明は、具体的に開示された実施例に限定されるものではなく、特許請求の範囲から逸脱することなく、主々の変形や変更が可能である。
11 CPU
12 主記憶装置
13 補助記憶装置
14 入力装置
15 表示装置
17 通信I/F
18 ドライブ装置
19 記憶媒体
51 入力データ
53 出力データ
55 評価結果
71 予測部
73 評価部
80 選択部
81 応答曲面生成部
83 等高線生成部
85 最良評価点選択部
91 応答曲面情報
93 等高線情報
95 最良評価点情報
97 最良パラメータ値
100 情報処理装置
130 記憶部

Claims (7)

  1. 記憶部に記憶された、学習用データから得られた評価値とパラメータ値の組とから、評価値を予測する応答曲面を算出し、
    得られた前記評価値のうち最大の評価値のそれぞれから、算出した前記応答曲面上の、該最大の評価値以下で定めた等高線までの最短距離を求め、
    前記最大の評価値それぞれに対して求めた前記最短距離のうち、前記等高線から最も遠いパラメータ値の組を特定する
    処理をコンピュータが行うパラメータ選択方法。
  2. 前記コンピュータは、
    前記最大の評価値に対する割合に基づいて、該最大の評価値から一定の高さ分低い位置を取得し、
    前記応答曲面に対して、取得した前記一定の高さ分低い位置で、前記最短距離を計算する前記等高線を定める
    処理を行うを特徴とする請求項1記載のパラメータ選択方法。
  3. 前記コンピュータは、
    前記最大の評価値のそれぞれから前記等高線への複数の垂線の長さを算出し、
    前記最大の評価値のそれぞれに対して、前記複数の垂線の長さのうち最も短い長さを特定することで、該最大の評価値の前記最短距離を求め、
    前記最大の評価値のうち、最も長い前記最短距離の最大の評価値のパラメータ値の組を取得する
    ことを特徴とする請求項1又は2項記載のパラメータ選択方法。
  4. 前記コンピュータは、
    前記等高線から前記最も遠いパラメータ値の組を用いて、前記学習用データから定めた対象の状態を予測し、該状態を示す予測値を出力し、
    前記対象の状態の実測値を用いて、前記予測値を評価し、得られた評価値と、予測に用いた前記最も遠いパラメータ値の組とを前記記憶部に出力して蓄積する
    処理を行うことを特徴とする請求項1乃至3のいずれか一項記載のパラメータ選択方法。
  5. 前記評価値と、予測に用いた前記最も遠いパラメータ値の組とが前記記憶部に出力されるごとに、該等高線から最も遠いパラメータ値の組が更新される
    ことを特徴とする請求項4記載のパラメータ選択方法。
  6. 記憶部に記憶された、学習用データから得られた評価値とパラメータ値の組とから、評価値を予測する応答曲面を算出し、
    得られた前記評価値のうち最大の評価値のそれぞれから、算出した前記応答曲面上の、該最大の評価値以下で定めた等高線までの最短距離を求め、
    前記最大の評価値それぞれに対して求めた前記最短距離のうち、前記等高線から最も遠いパラメータ値の組を特定する
    処理をコンピュータに行わせるパラメータ選択プログラム。
  7. 記憶部に記憶された、学習用データから得られた評価値とパラメータ値の組とから、評価値を予測する応答曲面を算出する応答曲面算出部と、
    得られた前記評価値のうち最大の評価値のそれぞれから、算出した前記応答曲面上の、該最大の評価値以下で定めた等高線までの最短距離を求め、該最大の評価値それぞれに対して求めた前記最短距離のうち、求めた該最短距離のうち、該等高線から最も遠いパラメータ値の組を特定する特定部と
    を有する情報処理装置。
JP2020520901A 2018-05-22 2018-05-22 パラメータ選択方法、パラメータ選択プログラム、及び情報処理装置 Pending JPWO2019224909A1 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2018/019661 WO2019224909A1 (ja) 2018-05-22 2018-05-22 パラメータ選択方法、パラメータ選択プログラム、及び情報処理装置

Publications (1)

Publication Number Publication Date
JPWO2019224909A1 true JPWO2019224909A1 (ja) 2021-02-18

Family

ID=68616916

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020520901A Pending JPWO2019224909A1 (ja) 2018-05-22 2018-05-22 パラメータ選択方法、パラメータ選択プログラム、及び情報処理装置

Country Status (4)

Country Link
US (1) US20210064918A1 (ja)
EP (1) EP3798935A4 (ja)
JP (1) JPWO2019224909A1 (ja)
WO (1) WO2019224909A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7123988B2 (ja) * 2020-01-24 2022-08-23 矢崎エナジーシステム株式会社 吸収式冷凍機
JP2023149463A (ja) * 2022-03-31 2023-10-13 東レエンジニアリング株式会社 乾燥システム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008299413A (ja) * 2007-05-29 2008-12-11 Mitsubishi Electric Corp パラメータ決定支援装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05265512A (ja) 1992-03-17 1993-10-15 Hitachi Ltd 学習型制御装置およびファジィ推論装置
JPH08272761A (ja) 1995-03-28 1996-10-18 Nippon Telegr & Teleph Corp <Ntt> パラメータチューニング法
JP3481075B2 (ja) 1997-04-28 2003-12-22 中沢 弘 最適な設計パラメータ値を有する製品の製造方法および設計パラメータ最適値決定システム
JP6703264B2 (ja) * 2016-06-22 2020-06-03 富士通株式会社 機械学習管理プログラム、機械学習管理方法および機械学習管理装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008299413A (ja) * 2007-05-29 2008-12-11 Mitsubishi Electric Corp パラメータ決定支援装置

Also Published As

Publication number Publication date
US20210064918A1 (en) 2021-03-04
WO2019224909A1 (ja) 2019-11-28
EP3798935A1 (en) 2021-03-31
EP3798935A4 (en) 2021-08-18

Similar Documents

Publication Publication Date Title
JP5984153B2 (ja) 情報処理装置、プログラム、及び情報処理方法
US20170371073A1 (en) Prediction apparatus, prediction method, and non-transitory storage medium
US20150112900A1 (en) Time-series data prediction device, time-series data prediction method, and program
JP6815708B2 (ja) インフルエンザ予測モデルの生成方法、装置及びコンピュータ可読記憶媒体
US9111388B2 (en) Information processing apparatus, control method, and recording medium
JP4937608B2 (ja) 指標推計装置、指標推計方法、及び指標推計プログラム
US9626631B2 (en) Analysis device, analysis method, and program
McDermott et al. A model‐based approach for analog spatio‐temporal dynamic forecasting
CN107766573B (zh) 基于数据处理的商品推荐方法、装置、设备和存储介质
JP6718500B2 (ja) 生産システムにおける出力効率の最適化
JP2017146888A (ja) 設計支援装置及び方法及びプログラム
US20210064918A1 (en) Parameter selection method, computer-readable recording medium recording parameter selection program, and information processing device
JP2020144493A (ja) 学習モデル生成支援装置、及び学習モデル生成支援方法
JP2021039739A (ja) 予測装置、予測プログラム、及び予測方法
JP2019125206A (ja) 情報処理装置、情報処理方法及びプログラム
US20160196506A1 (en) Incremental learning management device, incremental learning management method and computer readable recording medium storing incremental learning management program
JP6895334B2 (ja) 運用ルール抽出装置、運用ルール抽出システムおよび運用ルール抽出方法
JP2020027540A (ja) ラベリング装置、ラベリング方法及びプログラム
JP2022039406A (ja) 情報処理装置、情報処理方法およびプログラム
KR20180129496A (ko) 전력 수요를 예측하는 방법 및 장치
CN113779859B (zh) 可解释的时序预测模型的训练方法、装置和计算设备
JP2017134197A (ja) パラメータ調整システム、パラメータ調整方法、プログラム
JP2006318013A (ja) 評価装置及びそのコンピュータプログラム
JP5842704B2 (ja) 推定装置、プログラム、及び推定方法
JP2017120258A (ja) 機械の性能を最適化する波形分析のための装置、方法、およびコンピュータ・プログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200909

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200909

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211109

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20220510