JPWO2016151618A1 - 予測モデル更新システム、予測モデル更新方法および予測モデル更新プログラム - Google Patents

予測モデル更新システム、予測モデル更新方法および予測モデル更新プログラム Download PDF

Info

Publication number
JPWO2016151618A1
JPWO2016151618A1 JP2017507099A JP2017507099A JPWO2016151618A1 JP WO2016151618 A1 JPWO2016151618 A1 JP WO2016151618A1 JP 2017507099 A JP2017507099 A JP 2017507099A JP 2017507099 A JP2017507099 A JP 2017507099A JP WO2016151618 A1 JPWO2016151618 A1 JP WO2016151618A1
Authority
JP
Japan
Prior art keywords
prediction model
prediction
closeness
relearning
learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017507099A
Other languages
English (en)
Other versions
JP6531821B2 (ja
Inventor
啓 谷本
啓 谷本
洋介 本橋
洋介 本橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2016151618A1 publication Critical patent/JPWO2016151618A1/ja
Application granted granted Critical
Publication of JP6531821B2 publication Critical patent/JP6531821B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

予測モデル評価手段81は、再学習後の予測モデルと再学習前の予測モデルの性質の近さを評価する。予測モデル更新手段82は、性質の近さが所定の条件で規定される近さを満たす場合、再学習後の予測モデルで再学習前の予測モデルを更新する。このとき、予測モデル評価手段81は、予測結果の近さ、または、構造的な近さを予測モデルの性質の近さとして評価する。

Description

本発明は、予測モデルを更新する予測モデル更新システム、予測モデル更新方法および予測モデル更新プログラムに関する。
予測モデルは、環境の変化などが原因で、時間の経過とともに予測精度が劣化することが知られている。そのため、更新することによって精度が向上すると判断される予測モデルを対象として再学習が行われ、再学習により生成された予測モデルが新たな予測モデルとして更新される。例えば、実測値と予測値との差が大きくなった予測モデルが選択され、この予測モデルを対象に再学習することも行われている。
また、特許文献1には、各種設備のエネルギー需要を予測する装置が記載されている。特許文献1に記載された装置は、所定期間経過するごとに、前日に取得されたデータ、1時間前に取得されたデータ、1分前に取得されたデータを用いて、逐次、エネルギー需要予測モデルを更新する。
特開2012−194700号公報
予測モデルは、一般に、複数の要因に基づいて定義される。例えば、目的変数と説明変数との間で成り立つ規則性を示す関数が予測モデルに用いられる。管理者は、予測モデルによる予測結果に基づいて、各要因の影響度合いを分析する。
特許文献1に記載された装置のように、逐次予測モデルを更新することにより、予測精度を向上させることは可能である。しかし、予測モデルを更新する際に用いられる学習データや学習方法により、通常、予測に用いられる要因自体や、要因の影響度合いは変化する。分析対象とする要因が予測モデルの更新のたびに大きく変化してしまうと、管理者は、更新のたびに予測モデルの内容を把握しなければならず、その理解に多くの人的コスト(ヒューマンリソース)がかかってしまうという技術的課題がある。
そこで、本発明は、予測モデルを更新する際の人的コストを低減できる予測モデル更新システム、予測モデル更新方法および予測モデル更新プログラムを提供することを目的とする。
本発明による予測モデル更新システムは、再学習後の予測モデルと再学習前の予測モデルの性質の近さを評価する予測モデル評価手段と、性質の近さが所定の条件で規定される近さを満たす場合、再学習後の予測モデルで再学習前の予測モデルを更新する予測モデル更新手段と備え、予測モデル評価手段が、予測結果の近さ、または、構造的な近さを予測モデルの性質の近さとして評価することを特徴とする。
本発明による予測モデル更新方法は、コンピュータが、再学習後の予測モデルと再学習前の予測モデルの性質の近さを評価し、コンピュータが、性質の近さが所定の条件で規定される近さを満たす場合、再学習後の予測モデルで再学習前の予測モデルを更新し、コンピュータが、性質の近さを評価する際、予測結果の近さ、または、構造的な近さを予測モデルの性質の近さとして評価することを特徴とする。
本発明による予測モデル更新プログラムは、コンピュータに、再学習後の予測モデルと再学習前の予測モデルの性質の近さを評価する予測モデル評価処理、および、性質の近さが所定の条件で規定される近さを満たす場合、再学習後の予測モデルで再学習前の予測モデルを更新する予測モデル更新処理を実行させ、予測モデル評価処理で、予測結果の近さ、または、構造的な近さを予測モデルの性質の近さとして評価させることを特徴とする。
本発明によれば、予測モデルを更新する際の人的コストを低減できる。
本発明による予測モデル更新システムの一実施形態を示すブロック図である。 評価指標、再学習ルールおよび更新評価ルールの例を示す説明図である。 予測モデルの精度指標を可視化した例を示す説明図である。 予測モデルの精度指標を可視化した他の例を示す説明図である。 予測モデルの類似性を可視化する例を示す説明図である。 予測モデル更新システムの動作例を示すフローチャートである。 本発明による予測モデル更新システムの概要を示すブロック図である。
以下、本発明の実施形態を図面を参照して説明する。
図1は、本発明による予測モデル更新システムの一実施形態を示すブロック図である。本実施形態の予測モデルは、複数の予測モデルの中から更新候補の予測モデルを抽出し、抽出された予測モデルを再学習後、再学習前の予測モデルを再学習後の予測モデルで実際に更新するか否か判断する。
本実施形態の予測モデル更新システムは、予測モデル更新判断部11と、予測モデル再学習部12と、予測モデル評価部13と、予測モデル更新部14と、結果出力部15とを備えている。
予測モデル更新判断部11は、更新候補の予測モデルを判断する。具体的には、予測モデル更新判断部11は、複数の予測モデルの中から、再学習するか否かを判断するためのルール(以下、再学習ルールと記す。)に基づいて、更新候補である再学習対象の予測モデルを抽出する。再学習ルールは、予測モデルの再学習要否を予め定めた評価指標に基づいて規定したルールである。
再学習ルールに用いられる評価指標の内容は任意である。評価指標として、前回の予測モデルを学習してからの期間や更新してからの期間、学習データの増加量、時間の経過に対する精度劣化度合、サンプル数などの変化、計算リソースなどが挙げられる。ただし、評価指標の内容はこれらの内容に限定されず、予測モデルを更新すべきかの判断に利用することが可能な指標であれば、他の内容であってもよい。また、評価指標は、予測結果により算出される内容に限定されない。
このように、予測モデル更新判断部11が、複数の予測モデルの中から再学習対象を絞り込むことにより、再学習対象の予測モデルの数を減らせるため、再学習に要するコスト(マシンリソース)を低減させることが可能になる。これは、更新候補の予測モデルの数が大量になった場合、より大きな効果を示す。
予測モデル再学習部12は、予測モデル更新判断部11によって抽出された予測モデルを再学習する。再学習の方法は任意である。予測モデル再学習部12は、例えば、あるデータ区間を選定し、予め定められた方法で決定されるパラメータを用いて、ランダムリスタートにより予測モデルを再学習してもよい。また、予測モデル再学習部12は、再学習ルールで定義されたアルゴリズムに基づいて、予測モデルを再学習してもよく、1つの予測モデルについて複数の再学習結果を生成してもよい。
また、予測モデル再学習部12は、再学習前による予測モデルの変化を抑制するため、再学習前の予測モデルを入力とする、いわゆるホットスタートにより、予測モデルを再学習してもよい。例えば、予測モデルが木構造で表され、各ノードに配される条件に基づいて、入力されるデータの内容に応じてそのデータの予測に用いられる予測式が場合分けされる場合、予測モデル再学習部12がホットスタートによる予測モデルの再学習をすることで、その木構造や条件が近似する予測モデルを生成することが可能になる。このような再学習方法を用いることにより、再学習後の予測モデルの構造が再学習前の予測モデルに近づくため、結果的に予測モデルを更新する際の人的コストを低減できる。
予測モデル評価部13は、再学習前の予測モデルを再学習後の予測モデルで更新するか判断する。具体的には、予測モデル評価部13は、再学習後の予測モデルを実際に更新するか否かを判断するためのルール(以下、更新評価ルールと記す。)に基づいて、更新対象とする予測モデルを抽出する。更新評価ルールは、更新前の予測モデルと更新後の予測モデルの変化状況を規定したルールである。
更新評価ルールで規定する変化状況の内容も任意である。本実施形態では、予測モデル評価部13は、予測モデルの性質の近さに着目して、更新前の予測モデルと更新後の予測モデルの変化状況を判断する。すなわち、予測モデル評価部13は、再学習後の予測モデルと再学習前の予測モデルの性質の近さを評価する。
ここで、予測モデルの性質の近さとは、少なくとも、予測結果の近さ、または、予測モデルの構造的な近さを意味する。すなわち、本実施形態では、予測モデルの精度向上とともに、予測モデル自体の性質の変化を評価することで、予測モデルが大きく変化することを抑制する。
以下、予測モデルの性質の近さを評価する方法を説明する。まず、予測結果の近さを評価する方法を説明する。予測結果の近さとは、更新前の予測モデルによる予測結果と、更新後の予測モデルによる予測結果との近似度合いを意味する。
予測モデル評価部13は、予測結果に様々な指標を用いることが可能である。例えば、更新後の予測モデルによる予測値と更新前の予測モデルによる予測値の差分をそれぞれ算出した結果に対して統計処理(例えば、差分の2乗和、分散の計算など)を行ったものを、予測モデルの予測結果の近さと定義してもよい。同じ対象に対する予測結果の変化が小さいほど、予測モデルの変化は小さいと言えるからである。
次に、予測モデルの構造的な近さを評価する方法を説明する。予測モデルの構造的な近さの例として、予測する際の回帰式で用いられる属性(説明変数、要因)の重複度合いが挙げられる。また、入力されるデータの内容に応じてそのデータの予測に用いられるコンポーネン(予測式)場合分けされる場合、その場合分けに用いられるデータの属性(説明変数、要因)の重複度合いを予測モデルの構造的な近さと定義してもよい。いずれも、重複度合いが高いほど、予測モデルの構造が近いと判断できる。
特に、解釈性の高い予測モデルでは、予測に用いられる属性(説明変数、要因)の影響をユーザが認識できる場合が多い。例えば、予測に用いられる説明変数が変化すると使用する原料を変えなければならないような場合、説明変数は極力固定されることが好ましい。このような場合、予測モデル評価部13が、説明変数の重複度合いを予測モデルの構造的な近さとして評価することで、ユーザにとってより近い予測モデルを特定できる。
また、入力されるデータの内容に応じてそのデータの予測に用いられるコンポーネント(予測式)が場合分けされる場合、予測モデル評価部13は、学習データの観点で予測モデルの構造的な近さを評価してもよい。以下、学習データの観点から予測モデルの構造的な近さを評価する一例を説明する。
まず、予測モデル評価部13は、ある学習区間における複数のサンプル点が、再学習前の予測モデルで用いられる各コンポーネントのいずれに配置されるか特定し、コンポーネントごとにサンプル点の集合を生成する。次に、予測モデル評価部13は、同じ複数のサンプル点が、再学習後の予測モデルで用いられる各コンポーネントのいずれに配置されるか特定し、コンポーネントごとにサンプル点の集合を生成する。そして、予測モデル評価部13は、再学習前の同一の集合内のサンプル点が、再学習後の各サンプル点の集合に含まれる割合を集合ごとに算出し、その割合の中から最大割合を特定する。予測モデル評価部13は、これを、全ての再学習前の集合に対して実施し、算出されたそれぞれの最大割合の平均を算出する。
この最大割合の平均が大きいほど、再学習前のコンポーネントに分類されるサンプル点の集合が、できるだけ分散せずに再学習後のコンポーネントに分類されることを意味する。これは、ユーザから見れば、再学習前に同様の予測が行われるデータ群が、再学習後でも同様の予測が行われることになるため、予測モデルが構造的に近いと言える。このように、予測モデル評価部13は、再学習前の予測モデルで共通して分類されるサンプル点集合のうち、再学習後の予測モデルでも共通して分類されるサンプル点の割合を、予測モデルの構造的な近さとして評価してもよい。
また、入力されるデータの内容に応じてそのデータの予測に用いられるコンポーネント(予測式)が場合分けされる場合、予測モデル評価部13は、その場合分けの近さを予測モデルの構造的な近さとして評価してもよい。場合分け処理は、コンポーネントが混合している予測モデル(例えば、回帰木など)について、各コンポーネントを分割する処理とも言えるため、予測モデルの構造の近さは、コンポーネントを分割する近さということもできる。
以下の説明では、コンポーネントを分割する近さをエントロピーを用いた具体例で説明する。また、本説明では、再学習前の予測モデルを旧モデル、再学習後の予測モデルを新モデルと記し、コンポーネントのことを単に式と記すこともある。また、旧モデルで用いられるコンポーネント(予測式)の番号をxと記し、新モデルで用いられるコンポーネント(予測式)の番号をyと記す。
ここでは、与えられたサンプルが予測モデルの各式にばらつく度合いをエントロピーで表わす。例えば、旧モデルが与えられた場合のエントロピーH(x)は、以下の式1で定義される。式1において、Pは、サンプルが旧モデルのx番目の式に割り当てられる確率を示す。
Figure 2016151618
また、旧モデルおよび新モデルが与えられた場合の結合エントロピーH(x,y)は、以下の式2で定義される。式2において、Px,yは、旧モデルでx番目の式が新モデルのy番目に式に対応する確率を示し、実質的には対応するデータセットが新旧のモデルの各式に割り当てられる数に基づいて算出される。すなわち、割り当てられる式の偏りが小さいほど結合エントロピーは小さく算出される。
Figure 2016151618
予測モデル評価部13は、あるサンプルの旧モデルで割り当てられていたコンポーネントが明らかになることで、そのサンプルが割り当てられる新モデルのコンポーネントがどの程度明らかになるかを示す指標が大きいほど、両モデルが構造的に近いと評価する。この指標は、相互情報量で表され、上述する確率分布の相互情報量I(x;y)は、以下の式3で定義される。
Figure 2016151618
このように、旧モデルのある式に割り当てられたサンプルが新モデルの式に偏って割り当てられるほど両モデルが近いと言える。一方、旧モデルのある式に割り当てられたサンプルが新モデルの式に一様に割り当てられるほど両モデルは遠いと言える。このように、予測モデル評価部13は、旧モデルで決定されるコンポーネントと新モデルで決定されるコンポーネントの無秩序の度合いに基づいて、両予測モデルの性質の近さを評価してもよい。無秩序であるほど、両予測モデルは遠いと判断される。
なお、上記説明では、予測モデル評価部13が予測モデルの性質の変化に着目して評価する場合について説明した。ただし、着目する予測モデルの変化は、予測結果の変化、または、予測モデルの構造的な変化に限られない。予測モデル評価部13は、例えば、推定精度の変化や、予測モデルで用いられるサンプル数の変化など、評価指標の変化を予測モデルの性質の変化として評価してもよい。
図2は、評価指標、再学習ルールおよび更新評価ルールの例を示す説明図である。図2に例示する「再学習判定」の欄は、再学習ルールを定義する構成要素であり、再学習ルールが、「評価指標」の列に示す各評価指標の条件を「論理構造」の欄に示す演算子で結合した条件として表されることを示す。また、「対象選択」の欄は、再学習ルールに適合する予測モデルのうち、再学習する対象を選択するルールを示す。また、「再学習データの作り方」の欄は、再学習に用いられる学習データの生成方法を示す。また、「再学習後の出荷判定」の欄は、更新評価ルールを定義する構成要素であり、更新評価ルールが、「評価指標」の列に示す各評価指標の条件を「論理構造」の欄に示す演算子で結合した条件として表されることを示す。
図2に例示する評価指標以外にも、例えば、直近1週間と学習直後1週間の平均誤差率の差、異種混合学習における1つの予測式(門関数を通った後)ごとの誤差率変化や時間経過などが評価指標に用いられてもよい。予測モデル評価部13は、これらの評価指標が論理結合(AND/OR)または一次結合された式の値を評価し、予め定めた条件を満たす予測モデルを更新対象として判定してもよい。
なお、予測モデル更新判断部11も同様に、これらの評価指標が論理結合(AND/OR)または一次結合された式の値を評価し、さらに、計算リソースを考慮して、決められた数の予測モデルを再学習対象の予測モデルとして抽出してもよい。
図2に例示する評価指標には、人間が判断しやすい内容が設定される。すなわち、図2に例示する評価指標を論理構造で組み合わせたルールは、人間が把握しやすく、更新判断を行う際に有用である。すなわち、図2に例示する評価指標を用いることで、再学習処理および更新処理がホワイトボックス化されて分かりやすくなるため、ルールを検討する際の人的コストを低減させることが可能になる。
図2に例示するように、予測モデル更新判断部11が用いる基準(再学習ルール)と、予測モデル評価部13が用いる基準(更新評価ルール)は、同一でなくてもよい。本実施形態では、運用中の予測モデルを更新するまでに、2段階の基準を設けている。このように、2段階の基準を設けることで、処理対象の予測モデルを絞り込めるため、システム全体のコストを低減できる。
また、更新評価ルールは、運用中の予測モデルを更新することになるため、更新評価ルールを再学習ルールよりも厳しい条件に設定してもよい。また、再学習ルールと更新評価ルールに用いられる判定対象(属性や経過日数など)は、同一であってもよく、異なっていてもよい。
予測モデル更新部14は、予測モデル評価部13によって評価された両予測モデルの性質の近さが、更新評価ルールで規定する条件を満たす場合、再学習後の予測モデルで再学習前の予測モデルを更新する。更新評価ルールには、評価内容に応じて、予測モデルの更新を許容する近さが規定される。なお、予測モデル更新部14は、自動的に予測モデルを更新せず、ユーザにアラートを通知するようにしてもよい。アラートの通知方法は任意であり、例えば、画面への表示やメールによる通知であってもよい。
結果出力部15は、予測モデル再学習部12による再学習結果や、予測モデル更新部14による更新結果を出力する。結果出力部15は、再学習結果や更新結果を表示装置(図示せず)に表示してもよい。
結果出力部15は、例えば、再学習ルールに適合した予測モデルの評価指標を他の評価指標と区別して(例えば、強調して)可視化してもよい。図3は、予測モデルの精度指標を可視化した例を示す説明図である。図3では、3種類の予測対象(おにぎり、サンドイッチ、猫缶)の一ヶ月ごとの評価指標を例示している。また、図3に示す例では、“三ヶ月連続で最大誤差の絶対値が5を超えた”という再学習ルールを予測モデルが満たす場合に、再学習が行われるとする。
図3に示す例では、まず、結果出力部15は、3種類の予測対象の一ヶ月ごとの平均誤差を出力する。この状態で、1つの予測対象(ここでは、おにぎり)が選択されると、結果出力部15は、選択された予測対象について、他の評価指標(ここでは、最大誤差、クレーム回数)を含む表形式で出力する。
さらに、結果出力部15は、再学習を行うきっかけとなった箇所を他の指標と区別して可視化する。図3に示す例では、1月から3月の最大誤差の絶対値が5を超えており、そのことがきっかけで予測モデルが再学習されている。そこで、結果出力部15は、1月から3月の最大誤差の絶対値を示す欄を網掛け表示(強調表示)する。また、結果出力部15は、更新タイミング(図3に例示するラインL)を可視化してもよい。
図4は、予測モデルの精度指標を可視化した他の例を示す説明図である。図4に示す例は、予測対象の評価指標をグラフ形式で出力したものであり、図3の表形式で出力された他の評価指標に相当する。そこで、結果出力部15は、1月から3月の最大誤差の絶対値を示す折れ線グラフを強調表示する。また、図3の場合と同様に、結果出力部15は、更新タイミング(図4に例示するラインL)を可視化してもよい。
また、結果出力部15は、予測モデル再学習部12による再学習結果として、再学習前の予測モデルと再学習後の予測モデルの性質の類似性を可視化してもよい。図5は、再学習前の予測モデルと再学習後の予測モデルの類似性を可視化する例を示す説明図である。図5に示す例は、再学習前の予測モデルで各式に割り当てられたバリデーション用データが再学習後の予測モデルの式にどの程度の割合で割り当てられたかを示し、上述するPx,yに対応する。結果出力部15は、図5に例示する表を出力してもよく、割合を示す値に応じて図5に示すようにヒートマップで出力してもよい。
このように、結果出力部15が再学習結果や更新結果を可視化して出力することで、人間が更新理由や更新タイミングを容易に把握できるため、結果として人的コストを低減できる。
予測モデル更新判断部11と、予測モデル再学習部12と、予測モデル評価部13と、予測モデル更新部14と、結果出力部15とは、プログラム(予測モデル更新プログラム)に従って動作するコンピュータのCPUによって実現される。例えば、プログラムは、予測モデル更新システムの記憶部(図示せず)に記憶され、CPUは、そのプログラムを読み込み、プログラムに従って、予測モデル更新判断部11、予測モデル再学習部12、予測モデル評価部13、予測モデル更新部14および結果出力部15として動作してもよい。
また、予測モデル更新判断部11と、予測モデル再学習部12と、予測モデル評価部13と、予測モデル更新部14と、結果出力部15とは、それぞれが専用のハードウェアで実現されていてもよい。また、本発明による予測モデル更新システムは、2つ以上の物理的に分離した装置が有線または無線で接続されることにより構成されていてもよい。
次に、本実施形態の予測モデル更新システムの動作を説明する。図6は、本実施形態の予測モデル更新システムの動作例を示すフローチャートである。まず、予測モデル更新判断部11は、再学習ルールに基づいて、複数の予測モデルの中から更新候補の予測モデルを抽出する(ステップS11)。予測モデル再学習部12は、抽出された予測モデルを再学習する(ステップS12)。
予測モデル評価部13は、更新評価ルールに基づいて、再学習後の予測モデルと再学習前の予測モデルの性質の近さを評価する(ステップS13)。評価された性質の近さが更新評価ルールで規定される近さを満たす場合、予測モデル更新部14は、再学習後の予測モデルで再学習前の予測モデルを更新する(ステップS14)。
以上のように、本実施形態では、予測モデル評価部13が、再学習後の予測モデルと再学習前の予測モデルの性質の近さを評価し、評価された性質の近さが更新評価ルールで規定される近さを満たす場合、予測モデル更新部14が、再学習後の予測モデルで再学習前の予測モデルを更新する。具体的には、予測モデル評価部13が、予測結果の近さ、または、構造的な近さを予測モデルの性質の近さとして評価する。よって、予測モデルを更新する際の人的コストを低減できる。
一般的に、解釈性のある予測モデルを用いて運用を行うと、ユーザは予測モデルの特性(例えば、当たりにくい状況や、予測モデルの活用方法など)を理解し、運用を最適化していく。そのため、例えば、性能指標だけでモデルを評価し、予測モデルを更新する方法の場合、予測モデルの構造自体が大きく変化してしまう場合もある。この場合、予測モデルの特性も大きく変化する為、ユーザは予測モデルの特性を把握しなおすとともに、運用方法も見直さなければならなくなるため、多くの人的コストがかかるおそれがある。
しかし、本実施形態では、予測モデル評価部13が、再学習後の再学習後の予測モデルと再学習前の予測モデルの性質の近さを評価し、その性質の近さが所定の条件を満たす場合に、予測モデル更新部14が予測モデルを更新する。そのため、更新される予測モデルは、更新前の予測モデルと性質的に近似することになる。この場合、予測モデルの特性の変化も抑えられるため、結果としてユーザの運用が効率的に回る可能性が高く、予測モデルの更新に伴う人的コストを低減できる。
また、本実施形態では、予測モデル更新システムが、予測モデル更新判断部11、予測モデル再学習部12、予測モデル評価部13、予測モデル更新部14および結果出力部15を含む構成を例示した。
ただし、結果出力部15が再学習結果と更新結果のいずれか一方を可視化して出力する場合、予測モデル更新システムの一部の構成で、別途システムが実現されてもよい。例えば、再学習結果に特化して可視化をする再学習結果可視化システムが、予測モデル更新判断部11と、予測モデル再学習部12と、結果出力部15を備える構成で実現されてもよい。また、更新結果に特化して可視化をする更新結果可視化システムが、予測モデル評価部13と、予測モデル更新部14と、結果出力部15を備える構成で実現されてもよい。
次に、本発明の概要を説明する。図7は、本発明による予測モデル更新システムの概要を示すブロック図である。本発明による予測モデル更新システムは、再学習後の予測モデルと再学習前の予測モデルの性質の近さを評価する予測モデル評価手段81(例えば、予測モデル評価部13)と、性質の近さが所定の条件(例えば、更新評価ルール)で規定される近さを満たす場合、再学習後の予測モデルで再学習前の予測モデルを更新する予測モデル更新手段82(例えば、予測モデル更新部14)と備えている。
そして、予測モデル評価手段81は、予測結果の近さ、または、構造的な近さを予測モデルの性質の近さとして評価する。そのような構成により、予測モデルを更新する際の人的コストを低減できる。
また、予測モデル更新システムは、複数の予測モデルの中から、再学習するか否かを判断するためのルール(例えば、再学習ルール)で規定される条件を満たす予測モデルを抽出する予測モデル抽出手段(例えば、予測モデル更新判断部11)と、抽出された予測モデルを再学習する予測モデル再学習手段(例えば、予測モデル再学習部12)とを備えていてもよい。そして、予測モデル評価手段81は、予測モデル再学習手段による再学習後の予測モデルと、再学習前の予測モデルの性質の近さを評価してもよい。
そのような構成によれば、再学習対象の予測モデルを絞り込むことができるため、計算に要するコスト(例えば、マシンリソースなど)を低減できる。これは、対象とする予測モデルが多くなればなるほど、より大きな効果を奏する。
また、再学習前の予測モデルおよび再学習後の予測モデルが、予測対象のサンプルの内容に応じて、そのサンプルの予測に用いられるコンポーネントが決定される予測モデル(例えば、木構造の予測モデル、異種混合学習アルゴリズムにより生成される予測モデルなど)であってもよい。そして、予測モデル評価手段81は、予測対象のサンプルに対して、再学習前の予測モデルで決定されるコンポーネントと、再学習後の予測モデルで決定されるコンポーネントの無秩序の度合い(例えば、エントロピー、相互情報量)に基づいて予測モデルの性質の近さを評価してもよい。
一方、予測モデル評価手段81は、再学習前の予測モデルによる予測結果と、再学習後の予測モデルによる予測結果の近さを、予測モデルの性質の近さ(例えば、予測結果の近さ)として評価してもよい。
他にも、予測モデル評価手段81は、再学習前の予測モデルで用いられる属性(例えば、説明変数)と、再学習後の予測モデルで用いられる属性の重複度合いを、予測モデルの性質の近さ(例えば、構造的な近さ)として評価してもよい。
他にも、予測モデル評価手段81は、再学習前の予測モデルで共通して分類されるサンプル点集合のうち、再学習後の予測モデルでも共通して分類されるサンプル点の割合を、予測モデルの性質の近さ(例えば、構造的な近さ)として評価してもよい。
11 予測モデル更新判断部
12 予測モデル再学習部
13 予測モデル評価部
14 予測モデル更新部
15 結果出力部

Claims (10)

  1. 再学習後の予測モデルと再学習前の予測モデルの性質の近さを評価する予測モデル評価手段と、
    前記性質の近さが所定の条件で規定される近さを満たす場合、再学習後の予測モデルで再学習前の予測モデルを更新する予測モデル更新手段と備え、
    前記予測モデル評価手段は、予測結果の近さ、または、構造的な近さを予測モデルの性質の近さとして評価する
    ことを特徴とする予測モデル更新システム。
  2. 複数の予測モデルの中から、再学習するか否かを判断するためのルールで規定される条件を満たす予測モデルを抽出する予測モデル抽出手段と、
    抽出された予測モデルを再学習する予測モデル再学習手段とを備え、
    予測モデル評価手段は、前記予測モデル再学習手段による再学習後の予測モデルと、再学習前の予測モデルの性質の近さを評価する
    請求項1記載の予測モデル更新システム。
  3. 再学習前の予測モデルおよび再学習後の予測モデルが、予測対象のサンプルの内容に応じて当該サンプルの予測に用いられるコンポーネントが決定される予測モデルであり、
    予測モデル評価手段は、予測対象のサンプルに対して、前記再学習前の予測モデルで決定されるコンポーネントと、前記再学習後の予測モデルで決定されるコンポーネントの無秩序の度合いに基づいて予測モデルの性質の近さを評価する
    請求項1または請求項2記載の予測モデル更新システム。
  4. 予測モデル評価手段は、再学習前の予測モデルによる予測結果と、再学習後の予測モデルによる予測結果の近さを、予測モデルの性質の近さとして評価する
    請求項1または請求項2記載の予測モデル更新システム。
  5. 予測モデル評価手段は、再学習前の予測モデルで用いられる属性と、再学習後の予測モデルで用いられる属性の重複度合いを、予測モデルの性質の近さとして評価する
    請求項1または請求項2記載の予測モデル更新システム。
  6. 予測モデル評価手段は、再学習前の予測モデルで共通して分類されるサンプル点集合のうち、再学習後の予測モデルでも共通して分類されるサンプル点の割合を、予測モデルの性質の近さとして評価する
    請求項1または請求項2記載の予測モデル更新システム。
  7. コンピュータが、再学習後の予測モデルと再学習前の予測モデルの性質の近さを評価し、
    前記コンピュータが、前記性質の近さが所定の条件で規定される近さを満たす場合、再学習後の予測モデルで再学習前の予測モデルを更新し、
    前記コンピュータが、前記性質の近さを評価する際、予測結果の近さ、または、構造的な近さを予測モデルの性質の近さとして評価する
    ことを特徴とする予測モデル更新方法。
  8. コンピュータが、複数の予測モデルの中から、再学習するか否かを判断するためのルールで規定される条件を満たす予測モデルを抽出し、
    前記コンピュータが、抽出された予測モデルを再学習し、
    前記コンピュータが、性質の近さを評価する際、前記再学習された予測モデルと、再学習前の予測モデルの性質の近さを評価する
    請求項7記載の予測モデル更新方法。
  9. コンピュータに、
    再学習後の予測モデルと再学習前の予測モデルの性質の近さを評価する予測モデル評価処理、および、
    前記性質の近さが所定の条件で規定される近さを満たす場合、再学習後の予測モデルで再学習前の予測モデルを更新する予測モデル更新処理を実行させ、
    前記予測モデル評価処理で、予測結果の近さ、または、構造的な近さを予測モデルの性質の近さとして評価させる
    ための予測モデル更新プログラム。
  10. コンピュータに、
    複数の予測モデルの中から、再学習するか否かを判断するためのルールで規定される条件を満たす予測モデルを抽出する予測モデル抽出処理、および、
    抽出された予測モデルを再学習する予測モデル再学習処理を実行させ、
    予測モデル評価処理で、前記予測モデル再学習処理による再学習後の予測モデルと、再学習前の予測モデルの性質の近さを評価させる
    請求項9記載の予測モデル更新プログラム。
JP2017507099A 2015-03-23 2015-03-23 予測モデル更新システム、予測モデル更新方法および予測モデル更新プログラム Active JP6531821B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2015/001625 WO2016151618A1 (ja) 2015-03-23 2015-03-23 予測モデル更新システム、予測モデル更新方法および予測モデル更新プログラム

Publications (2)

Publication Number Publication Date
JPWO2016151618A1 true JPWO2016151618A1 (ja) 2017-12-21
JP6531821B2 JP6531821B2 (ja) 2019-06-19

Family

ID=56978834

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017507099A Active JP6531821B2 (ja) 2015-03-23 2015-03-23 予測モデル更新システム、予測モデル更新方法および予測モデル更新プログラム

Country Status (3)

Country Link
US (1) US20180082185A1 (ja)
JP (1) JP6531821B2 (ja)
WO (1) WO2016151618A1 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6781957B2 (ja) * 2017-03-14 2020-11-11 オムロン株式会社 通知装置、通知方法、及びそのプログラム
KR102102772B1 (ko) * 2017-06-09 2020-05-29 한국과학기술원 전자 장치 및 학습 모델 생성 방법
WO2020161901A1 (ja) * 2019-02-08 2020-08-13 日本電気株式会社 生体情報処理装置、方法、及びコンピュータ読取可能記録媒体
JP7279445B2 (ja) * 2019-03-20 2023-05-23 富士通株式会社 予測方法、予測プログラムおよび情報処理装置
US11144035B2 (en) * 2019-06-14 2021-10-12 General Electric Company Quality assessment feedback control loop for additive manufacturing
WO2020255305A1 (ja) * 2019-06-19 2020-12-24 日本電気株式会社 予測モデル再学習装置、予測モデル再学習方法及びプログラム記録媒体
JP7419035B2 (ja) 2019-11-22 2024-01-22 キヤノン株式会社 学習モデル管理システム、学習モデル管理方法、およびプログラム
JP2021131757A (ja) 2020-02-20 2021-09-09 富士通株式会社 モデル更新支援方法、装置、及びプログラム
JP7041299B1 (ja) 2021-03-18 2022-03-23 ヤフー株式会社 情報処理装置、情報処理方法および情報処理プログラム
US20220317675A1 (en) * 2021-03-31 2022-10-06 Johnson Controls Technology Company Efficient integration of machine learning models in building management systems
WO2023157622A1 (ja) * 2022-02-15 2023-08-24 ソニーグループ株式会社 情報処理装置、および情報処理方法、並びにプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1074188A (ja) * 1996-05-23 1998-03-17 Hitachi Ltd データ学習装置およびプラント制御装置
JP2010516301A (ja) * 2007-01-03 2010-05-20 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ コンピュータ支援治療モニタリング装置及び方法
WO2014155690A1 (ja) * 2013-03-29 2014-10-02 富士通株式会社 モデル更新方法、装置、およびプログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8214308B2 (en) * 2007-10-23 2012-07-03 Sas Institute Inc. Computer-implemented systems and methods for updating predictive models
US8533224B2 (en) * 2011-05-04 2013-09-10 Google Inc. Assessing accuracy of trained predictive models
EP2973106A1 (en) * 2013-03-15 2016-01-20 The Cleveland Clinic Foundation Self-evolving predictive model
US9697476B1 (en) * 2014-05-13 2017-07-04 Neustar, Inc. System and method for utilizing a model to process big data
US9778639B2 (en) * 2014-12-22 2017-10-03 Johnson Controls Technology Company Systems and methods for adaptively updating equipment models

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1074188A (ja) * 1996-05-23 1998-03-17 Hitachi Ltd データ学習装置およびプラント制御装置
JP2010516301A (ja) * 2007-01-03 2010-05-20 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ コンピュータ支援治療モニタリング装置及び方法
WO2014155690A1 (ja) * 2013-03-29 2014-10-02 富士通株式会社 モデル更新方法、装置、およびプログラム

Also Published As

Publication number Publication date
JP6531821B2 (ja) 2019-06-19
WO2016151618A1 (ja) 2016-09-29
US20180082185A1 (en) 2018-03-22

Similar Documents

Publication Publication Date Title
WO2016151618A1 (ja) 予測モデル更新システム、予測モデル更新方法および予測モデル更新プログラム
US11645581B2 (en) Meaningfully explaining black-box machine learning models
JP6451895B2 (ja) 予測モデル選択システム、予測モデル選択方法および予測モデル選択プログラム
US11429878B2 (en) Cognitive recommendations for data preparation
US20170060931A1 (en) Intelligent data munging
US20180075357A1 (en) Automated system for development and deployment of heterogeneous predictive models
US20170286866A1 (en) Merging feature subsets using graphical representation
TW202030685A (zh) 電腦執行的事件風險評估的方法及裝置
JP6937659B2 (ja) ソフトウェアテスト装置および方法
US20120239596A1 (en) Classification of stream-based data using machine learning
US10983786B2 (en) Automatically evaluating software project requirements
US20230128318A1 (en) Automated Parameterized Modeling And Scoring Intelligence System
JPWO2018079225A1 (ja) 自動予測システム、自動予測方法および自動予測プログラム
US20180285128A1 (en) Automated user interface analysis
JP6178023B2 (ja) モジュール分割支援装置、方法、及びプログラム
EP3076314A1 (en) System, method, and program for storing and analysing a data graph
CN105488599B (zh) 预测文章热度的方法和装置
JP2018170008A (ja) エンティティの属性をマッピングする方法及びシステム
WO2016063502A1 (ja) 知識管理装置、知識管理方法、及び、プログラムの記録媒体
JP6399206B2 (ja) 推定器管理システム
De Luna et al. Choosing a model selection strategy
CN114385121B (zh) 一种基于业务分层的软件设计建模方法及系统
CN109284354B (zh) 脚本搜索方法、装置、计算机设备及存储介质
US9317125B2 (en) Searching of line pattern representations using gestures
CN112183714A (zh) 基于人工神经网络的自动化数据切片

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170816

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170816

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181002

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181129

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190423

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190506

R150 Certificate of patent or registration of utility model

Ref document number: 6531821

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150