JP2022081335A - 予測規則校正システム、および予測規則校正方法 - Google Patents

予測規則校正システム、および予測規則校正方法 Download PDF

Info

Publication number
JP2022081335A
JP2022081335A JP2020192808A JP2020192808A JP2022081335A JP 2022081335 A JP2022081335 A JP 2022081335A JP 2020192808 A JP2020192808 A JP 2020192808A JP 2020192808 A JP2020192808 A JP 2020192808A JP 2022081335 A JP2022081335 A JP 2022081335A
Authority
JP
Japan
Prior art keywords
prediction rule
branch condition
calibration
rule
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020192808A
Other languages
English (en)
Inventor
博之 難波
Hiroyuki Namba
正史 恵木
Masashi Egi
真生 濱本
Masanari Hamamoto
正和 高橋
Masakazu Takahashi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2020192808A priority Critical patent/JP2022081335A/ja
Priority to US17/477,314 priority patent/US20220156602A1/en
Publication of JP2022081335A publication Critical patent/JP2022081335A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】分類問題または回帰問題において、高精度であり、単純であり、なおかつ専門家の知識に整合するような予測規則を得ること。【解決手段】評価指標と制約とを用いて学習モデルの予測規則を単純化する予測規則単純化部と、予測値または特定の分岐条件に対する要請を表す校正情報に基づいて、単純化した予測規則の一部の分岐条件を更新する分岐条件探索部と、校正情報に基づいて、単純化した予測規則の一部の閾値を更新する閾値最適化部と、を有する。【選択図】 図3

Description

本発明は、例えばセンサデータを用いて医療機器が良品であるか不良品であるかを判定するシステムにおいて、専門家が要請する条件に適合するように予測規則を部分的に修正するシステム、および方法に関する。
分類問題または回帰問題において、学習モデルの予測規則を明確にしたいという課題が挙げられる。例えば、センサデータを用いて医療機器が良品であるか不良品であるかを判定するシステムにおいて、学習モデルが不良品であると判断した理由がわからないと、学習モデルを信頼することができない。また、予測規則が単純なものであっても、専門家の知識と整合していないと学習モデルを信頼することができない。この課題に対し、従来技術では学習モデルの予測規則を単純な規則で近似したり、単純な規則の納得度が上がるように修正する方法が試みられている。例えば、特許文献1に記載の技術は、単純な規則を、特定のデータを正しく予測せよという条件を満たすように修正する技術である。
特開2000-155680号公報
分類問題または回帰問題において、学習モデルの予測規則は高精度であっても、不明瞭であったり、専門家の知識に整合しなかったりするために信頼できない場合がある。すなわち、本発明が解決しようとする課題は、高精度であり、単純であり、なおかつ専門家の知識に整合するような予測規則を得たいという課題である。
本発明は、高精度であり、単純であり、なおかつ専門家の知識に整合するような予測規則を得ることが可能な予測規則校正システム、および予測規則校正方法を提供することを目的とする。
本発明にかかる予測規則校正システムは、評価指標と制約とを用いて学習モデルの予測規則を単純化する予測規則単純化部と、予測値または特定の分岐条件に対する要請を表す校正情報に基づいて、前記単純化した予測規則の一部の分岐条件を更新する分岐条件探索部と、前記校正情報に基づいて、前記単純化した予測規則の一部の閾値を更新する閾値最適化部と、を有することを特徴とする予測規則校正システムとして構成される。
本発明によれば、高精度であり、単純であり、なおかつ専門家の知識に整合するような予測規則を得ることができる。
コンピュータのハードウェア構成例を示すブロック図である。 学習データの例を示す図である。 実施例1におけるシステム構成の例を示す図である。 単純予測規則の例を示す図である。 校正情報の例を示す図である。 校正情報を入力する画面の例を示す図である。 校正済単純予測規則を確認する画面の例を示す図である。 実施例1における予測規則単純化部の処理フローを示す図である。 実施例1における分岐条件探索部の処理フローを示す図である。 実施例1における閾値最適化部の処理フローを示す図である。
以下、図面を参照して本発明の実施形態を説明する。以下の記載および図面は、本発明を説明するための例示であって、説明の明確化のため、適宜、省略および簡略化がなされている。本発明は、他の種々の形態でも実施する事が可能である。特に限定しない限り、各構成要素は単数でも複数でも構わない。
図面において示す各構成要素の位置、大きさ、形状、範囲などは、発明の理解を容易にするため、実際の位置、大きさ、形状、範囲などを表していない場合がある。このため、本発明は、必ずしも、図面に開示された位置、大きさ、形状、範囲などに限定されない。
以下の説明では、「テーブル」、「リスト」等の表現にて各種情報を説明することがあるが、各種情報は、これら以外のデータ構造で表現されていてもよい。データ構造に依存しないことを示すために「XXテーブル」、「XXリスト」等を「XX情報」と呼ぶことがある。識別情報について説明する際に、「識別情報」、「識別子」、「名」、「ID」、「番号」等の表現を用いた場合、これらについてはお互いに置換が可能である。
同一あるいは同様な機能を有する構成要素が複数ある場合には、同一の符号に異なる添字を付して説明する場合がある。ただし、これらの複数の構成要素を区別する必要がない場合には、添字を省略して説明する場合がある。
また、以下の説明では、プログラムを実行して行う処理を説明する場合があるが、プログラムは、プロセッサ(例えばCPU(Central Processing Unit)、GPU(Graphics Processing Unit))によって実行されることで、定められた処理を、適宜に記憶資源(例えばメモリ)および/またはインターフェースデバイス(例えば通信ポート)等を用いながら行うため、処理の主体がプロセッサとされてもよい。同様に、プログラムを実行して行う処理の主体が、プロセッサを有するコントローラ、装置、システム、計算機、ノードであってもよい。プログラムを実行して行う処理の主体は、演算部であれば良く、特定の処理を行う専用回路(例えばFPGA(Field-Programmable Gate Array)やASIC(Application Specific Integrated Circuit))を含んでいてもよい。
プログラムは、プログラムソースから計算機のような装置にインストールされてもよい。プログラムソースは、例えば、プログラム配布サーバまたは計算機が読み取り可能な記憶メディアであってもよい。プログラムソースがプログラム配布サーバの場合、プログラム配布サーバはプロセッサと配布対象のプログラムを記憶する記憶資源を含み、プログラム配布サーバのプロセッサが配布対象のプログラムを他の計算機に配布してもよい。また、以下の説明において、2以上のプログラムが1つのプログラムとして実現されてもよいし、1つのプログラムが2以上のプログラムとして実現されてもよい。
以下に本実施の形態にかかる予測規則校正システム、および予測規則校正方法を、センサデータを用いて医療機器が良品であるか不良品であるかを判定するシステムに適用した場合を例示しているが、医療機器以外の様々な機器あるいはその部品が、良品であるか不良品であるかを判定する場合について、広く適用することができる。
本発明の第1の実施形態として、学習データと、学習モデルと、校正情報をもとに、予測規則を計算する方式について説明する。本実施例では、まず、従来技術と同様に、学習モデルを単純な予測規則に変換する。さらに、専門家の知識を、予測値に対する要請または特定の予測規則に対する要請を記述した校正情報として入力し、校正情報を満たすように予測規則を部分的に修正する。具体的には、予測値に対する要請に対しては、予測規則の分岐条件の閾値を修正する。また、特定の予測規則に対する要請に対しては、要請対象である分岐条件を含む一部の予測規則の変更を行い、この校正を繰り返す。以下、図面を用いて具体的に説明する。
図1は、コンピュータのハードウェア構成例を示すブロック図である。コンピュータは、プロセッサ101と、記憶デバイス102と、入力デバイス103と、出力デバイス104と、通信インターフェース(通信IF)105と、を有する。プロセッサ101、記憶デバイス102、入力デバイス103、出力デバイス104、および通信IF105は、バス106により接続される。プロセッサ101は、コンピュータ100を制御する。記憶デバイス102は、プロセッサ101の作業エリアとなる。また、記憶デバイス102は、各種プログラムやデータを記憶する非一時的なまたは一時的な記録媒体である。記憶デバイス102としては、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)、HDD(Hard Disk Drive)、フラッシュメモリがある。入力デバイス103は、データを入力する。入力デバイス103としては、例えば、キーボード、マウス、タッチパネル、テンキー、スキャナがある。出力デバイス104は、データを出力する。出力デバイス104としては、例えば、ディスプレイ、プリンタ、スピーカがある。通信IF105は、ネットワークと接続し、データを送受信する。通信IF105としては、例えば、NIC(Network Interface Card)がある。
図2は、実施例1にかかる学習データの一例を示す説明図である。学習データ200は、1つ以上の説明変数と1つの目的変数の情報を含む。学習データ200は、列として、例えば、説明変数を表す製造時の温度と、湿度と、圧力と、目的変数を表す不良品判定結果を有する。温度、湿度、圧力は、製造時の加工パラメータを表し、不良品判定結果は、0ならば良品、1ならば不良品であることを表す2値変数である。一行目のエントリーは、温度50度、湿度60%、圧力100MPaで加工した際に得られた製品が良品であったことを表す。本実施例において、目的変数は2値としたが、例えば、製品のサイズといった連続値であってもよい。
学習モデル210は、学習データ200の説明変数の値の組み合わせを入力すると、目的変数の予測値を出力するプログラムである。例えば、温度55度、湿度60%、圧力100Mpaという説明変数の値の組み合わせを入力すると、目的変数の予測値として1、つまり不良品と予測という出力が得られるプログラムである。本実施例では、出力である目的変数の予測値は0または1の2値とするが、連続値であってもよい。
図3は、実施例1にかかる予測規則校正システム300のシステム構成例を示すブロック図である。予測規則校正システム300は、1以上のクライアント端末301と、DB(データベース)サーバ302と、予測規則校正装置303と、を有する。クライアント端末301、DBサーバ302および予測規則校正装置303とは、インターネット、LAN(Local Area Network)、WAN(Wide Area Network)などのネットワーク304を介して通信可能に接続される。クライアント端末301、DBサーバ302、および予測規則校正装置303は、図1に示したコンピュータ100により実現される。
DBサーバ302は、学習データ200および学習モデル210を記憶する。学習データ200および学習モデル210は、予測規則校正装置303に記憶されていてもよい。
予測規則校正装置303は、データ取得部331と、予測規則単純化部332と、予測規則校正部333を有する。データ取得部331、予測規則単純化部332、予測規則校正部333は、具体的には、例えば、図1に示した記憶デバイス102に記憶されたプログラムをプロセッサ101に実行させることにより実現される機能である。
データ取得部331は、DBサーバ302にアクセスして、DBサーバ302から学習データ200および学習モデル210を取得し、記憶デバイス102に記憶する。
予測規則単純化部332は、学習データ200および学習モデル210をもとに、単純予測規則を生成するプログラムである。ここで、単純予測規則とは、学習モデル200の一部または全部を木構造で単純化した予測規則を表す。単純予測規則の一例を図4に示す。単純予測規則のノードは分岐条件を表し、説明変数の組み合わせを入力すると、分岐先が決まる。分岐条件の右辺は実数とする。また、単純予測規則のリーフには、予測値または単純予測規則では予測困難であることを示すフラグが対応する。例えば、図4の単純予測規則において、学習データ1行目に示す温度50度、湿度60%、圧力100MPaというデータは一番右のリーフにたどりつき、不良品判定結果が0、すなわち良品であると予測される。また、学習データ5行目に示す温度53度、湿度57%、圧力103MPaというデータは右から2番目のリーフにたどりつき、予測困難であると予想される。なお、単純予測規則の1つのノードを構成する変数の個数は、図4のように1つであってもよいし、複数あってもよい。例えば、温度÷圧力が0.5以上かというノードがあってもよい。また、リーフの予測値は図4のように2値であってもよいし、連続値であってもよい。また、単純予測規則の各ノードには、分岐条件IDが付与されている。リーフの値として予測困難を許可しないような単純予測規則は、一般的な決定木と一致する。特に、予測値が2値である場合には、2値分類問題に対する分類木と一致し、予測値が連続値である場合には、回帰木と一致する。
予測規則単純化部332が単純予測規則を生成する際には、あらかじめ評価指標と木構造に関する制約と予測困難なデータに関する制約を設定しておく。設定はクライアント端末301から事前に入力してもよいし、予測規則単純化部332内にハードコーディングされていてもよい。ここで、評価指標とは、2値分類の精度であってもよいし、回帰問題における二乗誤差であってもよい。ここで、単純予測規則の学習データ200全体に対する評価指標を計算する際に、学習データの各行に対する予測値が必要になるが、予測困難なデータに対しては、予測値を計算することができない。このように予測困難なデータに対しては、もともとの学習モデル210を適用し、予測値を計算することができる。すなわち、単純予測規則と学習モデル210をセットで1つの予測モデルと考えることで、単純予測規則の学習データ200全体に対する評価指標を計算することができる。また、木構造に関する制約とは、木の深さ、ノードを構成する変数の個数などである。例えば、木の深さが3以下であり、ノードを構成する変数の個数が1つであるという制約が挙げられる。また、予測困難なデータに関する制約とは、単純予測規則では予測困難なデータとなってしまうものについての制約である。例えば、予測規則なデータの割合は20%以下にせよ、という制約、あるいは、特定のデータについては予測困難にするな、という制約が挙げられる。
予測規則単純化部332は、木構造に関する制約と予測困難なデータに関する制約を満たす中で、評価指標が最適となるような単純予測規則を探索する。予測規則単純化部332の処理フローの詳細は後述する。
予測規則校正部333は、単純予測規則と校正情報500をもとに、校正済単純予測規則を計算するプログラムである。ここで、校正情報500とは、単純予測規則の出力値または特定の分岐条件に対する修正要求を表す情報である。校正情報の例を図5に示す。校正情報は、1つ以上の校正条件要素からなる。校正条件要素は、図5における1行分を表す。校正条件要素は、校正のタイプおよび校正内容という属性を有する。校正のタイプとしては、以下の4種類のいずれかである。
1つめは、特定分岐条件に対する要求であって、含むべき特徴量を指定するタイプである。例えば、図5における1行目がこのタイプに該当する。このタイプを持つ校正条件要素の校正内容は、単純予測規則の分岐条件IDと、含むべき特徴量のリストを有する。例えば、図5における1行目では、2,{圧力}と指定しているが、これは、IDが2の分岐条件に対して、圧力という説明変数を含んでほしいという要求を表す。
2つめは、特定分岐条件に対する要求であって、含まないべき特徴量を指定するタイプである。例えば、図5における3行目がこのタイプに該当する。このタイプを持つ校正条件要素の校正内容は、単純予測規則の分岐条件IDと、含まないべき特徴量のリストを有する。例えば、図5における3行目では、3,{圧力}と指定しているが、これは、IDが3の分岐条件に対して、圧力という説明変数を含まないでほしいという要求を表す。
3つめは、特定分岐条件に対する要求であって、閾値の範囲を指定するタイプである。ここで、閾値とは、分岐条件の右辺の実数を表す。例えば、図5における4行目がこのタイプに該当する。このタイプを持つ校正条件要素の校正内容は、単純予測規則の分岐条件IDと、閾値が含まれるべき範囲を有する。例えば、図5における4行目では、1,[50,52]と指定しているが、これは、IDが1の分岐条件に対して、閾値が50以上52以下であってほしいという要求を表す。区間としては、開区間も指定可能とする。例えば、[50,53)と指定した場合、閾値が50以上53未満であってほしいという要求を表す。
4つめは、予測値に関する要求である。例えば、図5における2行目がこのタイプに該当する。このタイプを持つ校正条件要素の校正内容は、大小関係を表すペアのリストを有する。ペアの各要素は、全説明変数の値のリストまたは実数である。全説明変数の値のリストである場合は、その説明変数の値の場合の単純予測規則の予測値を表す。このタイプの校正条件要素は、ペアの第一要素が、第二要素以下であってほしいという要求を表す。例えば、図5における2行目では、[54,58,101],0と指定しているが、これは、温度が54度で、湿度が58%で、圧力が101Mpaの場合の単純予測規則の予測値が0以下であってほしいという要求を表す。本実施例においては、予測値は0または1であるので、予測値が0であってほしいという要求と等価である。このタイプの校正条件要素は、特定のデータについての予測値を指定したり、特定のデータについて目的変数値を正しく予測してほしいと指定したりするのに使うことができる。
予測規則校正部333は、校正情報取得部334と、分岐条件探索部335と、閾値最適化部336を有する。
校正情報取得部334は、予測規則単純化部332の出力である単純予測規則をクライアント端末に送付し、図6の例に示すような画面を表示し校正情報の入力を促し、クライアント端末301より入力された校正情報500を取得し、分岐条件探索部335に出力するプログラムである。ここで、図6に示す校正情報を入力する画面は、現在の単純予測規則を表示する部分と、校正情報を入力する部分と、校正実行ボタンを有する。現在の単純予測規則を表示する部分には、予測規則単純化部332の出力である単純予測規則の木構造を表示する。合わせて、1つ以上の評価指標の値を表示する。評価指標としては、例えば、2値分類の精度、回帰問題における二乗誤差、あるいは予測困難なデータの割合などが挙げられる。
校正情報を入力する部分は、校正情報500をクライアント端末301より入力することができる。例えば、校正のタイプ列は予測値または分岐条件からプルダウンで選択し、校正内容列は自由に入力可能であり、校正情報の行数を増やすボタンおよび減らすボタンを有する。また、校正のタイプ列が予測値であるような行については、校正内容列に全説明変数の値のリストを指定する際に、学習データ200の特定の行を指定してもよい。すなわち、校正情報を入力する際に、学習データ200の表を画面に表示し、その1行をユーザが指定することによって、校正内容列にその行の全説明変数の値が反映されるという方式でもよい。
また、校正実行ボタンを押すと、入力信号が予測規則校正装置303の校正情報取得部に送信される。
分岐条件探索部335は、校正情報取得部334から入力された単純予測規則に対して、校正情報を満たすように分岐条件を更新するためのプログラムである。なお、分岐条件探索部335で分岐条件を探索する際に、閾値最適化部336も活用する。
また、閾値最適化部336は、校正情報取得部334から入力された単純予測規則に対して、校正情報を満たすように閾値を更新するためのプログラムである。分岐条件探索部335および閾値最適化部336により校正済単純予測規則を計算する処理フローの詳細は後述する。
校正済単純予測規則は、クライアント端末301に送信され、図7の例に示すような画面に表示される。ここで、図7の例に示すように、校正済単純予測規則を確認する画面は、現在の単純予測規則を表示する部分と、前回校正情報を表示する部分と、校正を許容して確定するか決める校正確定ボタンと、校正情報を入力する部分と、校正実行ボタンを有する。現在の単純予測規則を表示する部分には、閾値最適化部336から送信された校正済単純予測規則を表示する。その際、前回の単純予測規則と今回の校正済単純予測規則の評価指標の推移を合わせて表示する。また、前回校正情報を表示する部分には、校正情報を入力する画面において前回入力した校正情報を表示する。その際、各校正情報の校正が達成されたかどうかを表す校正達成列を付加し表示する。また、校正情報を入力する部分と、校正実行ボタンは図6に示す校正情報を入力する画面と同様である。
校正確定ボタンは、前回の校正を許容して単純予測規則を更新するかどうかを決めるためのボタンである。評価指標と校正済単純予測規則を確認し、前回の校正を許容する場合は、校正確定ボタンを押下することで、単純予測規則が更新され、新しい単純予測規則をもとに、校正を繰り返すことができる。一方、前回の校正を許容しない場合は、校正確定ボタンを押下せず、再度校正情報を入力し、校正実行ボタンを押下することで、前回の単純予測規則の状態からもう一度校正をやり直すことができる。いずれの場合も、校正実行ボタンを押下すると、もととなる単純予測規則の情報が再度予測規則校正装置303に送信され、予測規則校正部333の処理が実行される。実行結果は再度、図7に示すような校正済単純予測規則を確認する画面としてクライアント端末301に表示される。以上のように、精度を維持しながら専門家の知識に整合するような予測規則を得るために、校正情報の入力操作、校正の実行処理、校正を確定する操作を繰り返すことができる。
次に、予測規則単純化部332および分岐条件探索部335および閾値最適化部336の処理フローを述べる。予測規則単純化部332の処理フローを図8に示す。以下、図8の各ステップの詳細を述べる。
ステップS101は、分岐条件の候補を列挙する処理である。例えば、予測規則単純化部332は、学習データ200のすべての説明変数Xと、すべての閾値αに対して、X≧αという分岐条件の候補を列挙する。ここで、すべての閾値αとは、学習データ200における説明変数Xのすべての値である。例えば、学習データ200における圧力という説明変数が95、100、103の3通りである場合、予測規則単純化部332は、圧力に関する分岐条件としては、圧力≧95、圧力≧100、圧力≧103という3つの候補を列挙する。列挙した全体を分岐条件候補集合と呼ぶ。
ステップS102は、探索の初期状態を決定する処理である。具体的には、予測規則単純化部332は、分岐条件候補集合の要素をランダムにつなげて暫定木構造を作成する。その際、木構造に関する制約を満たすようにする。ランダムにつなげる、の具体的な方法としては、ランダムに1つの要素を抽出して深さ1の木とする、あるいは、ランダムにN個の要素を抽出して深さNのパスとする、などが挙げられる。探索における現時点の木を暫定木と呼ぶ。
ステップS103では、予測規則単純化部332は、暫定木における各リーフの予測値を最適な値に決定する。これは、一般的な決定木の作成方法と同様である。例えば、評価指標が二乗誤差である場合、予測規則単純化部332は、各リーフにたどりついたデータの目的変数の平均値を予測値とする。また、評価指標が多値分類の正解率である場合、予測規則単純化部332は、各リーフにたどりついたデータの目的変数の最頻値を予測値とする。
ステップS104では、予測規則単純化部332は、暫定木におけるリーフの一部の予測値を予測困難に設定する。これは、暫定木における各リーフの予測値を予測困難に変更する、つまり単純化していない学習モデル210に変更してブラックボックス化することで、評価指標を上げるためである。すなわち、予測規則単純化部332は、単純予測規則で予測できるデータの割合を犠牲にすることで、評価指標を上げる。具体的な処理としては、予測規則単純化部332は、予測困難なデータに関する制約を満たしながら、評価指標が最大になるようにする。例えば、制約を破る直前まで、予測困難に変更することで評価指標が最も上がるリーフから順に、変更していくという方法がある。
ステップS105からステップS107では、予測規則単純化部332は、暫定木を部分的に更新していきながら、評価指標の最適化を行う。
ステップS105では、予測規則単純化部332は、暫定木の更新方法を選択する。例えば、予測規則単純化部332は、分岐の追加、分岐の削除、分岐の交換の中から、ランダムに方法を選択する。ここで、分岐の追加は、ランダムに暫定木のリーフを選び、そのリーフの部分に、ランダムに選ばれた分岐条件候補集合の要素を追加する処理である。分岐の削除は、ランダムに暫定木の最も下位の分岐条件を削除し、リーフに置き換える処理である。分岐の交換は、暫定木の分岐をランダムに選び、その場所に、ランダムに選ばれた分岐条件候補集合の要素を追加する処理である。
ステップS106では、予測規則単純化部332は、選択した更新方法における評価指標を計算する。ステップS105で、暫定木の構造の更新方法が決定しているので、予測規則単純化部332は、ステップS103と同様にリーフの最適値を計算し、ステップS104と同様にリーフの一部を予測困難に変更し、その暫定木における評価指標を計算する。
ステップS107では、予測規則単純化部332は、ステップS106で計算した今回の評価指標と、更新前の暫定木の評価指標を比較し、暫定木を更新するかどうかを決定する。例えば、予測規則単純化部332は、今回の評価指標が更新前の評価指標よりも高ければ暫定木を更新し、そうでない場合には暫定木は前回のままとする。
ステップS108では、予測規則単純化部332は、指定実行時間未満かどうかを判定する。予測規則単純化部332は、指定実行時間未満であると判定する間は(S108;YES)、ステップS105からS107を繰り返し、暫定木の改善を続ける。一方、予測規則単純化部332は、指定実行時間以上になったと判定した場合は(S108;NO)、その時点の暫定木を、単純予測規則として出力する。ここで、予測規則単純化部の指定実行時間は、ハードコーディングされていてもよいし、予め分析者にクライアント端末301を通じて入力されたものを用いてもよい。
次に、分岐条件探索部335の処理フローを図9に示す。以下、図9の各ステップの詳細を述べる。ステップS201からステップ206までは、入力された校正情報500の各行に対して行う。
ステップS201では、分岐条件探索部335は、処理対象である校正条件要素、すなわち校正情報500の1行、のタイプが予測値であるかそうでないかを判定する。分岐条件探索部335は、予測値でないと判定した場合(S201;NO)、すなわち特定分岐条件に対する要求の場合にはステップS202に進む。一方、分岐条件探索部335は、予測値であると判定した場合には(S201;YES)、ステップS207に進む。
ステップS202実行時において、処理対象である校正条件要素のタイプは特定の分岐条件に関するものである。この場合、S202からS205では、分岐条件探索部335は、特定分岐条件に対する要求を満たす中で、評価指標が最大になるように、単純予測規則を更新する。具体的には、分岐条件探索部335は、S203で、処理対象である校正条件要素に基づいて、いくつかの分岐条件{M_1,M_2,…}を、別の分岐条件{N_1,N_2,…}に交換し、S204で閾値を最適化することを様々な交換に対して行い、最終的に評価指標が最も良いものを出力する。各ステップの詳細は以下の通りである。
ステップS202では、交換の候補を列挙する。例えば、分岐条件探索部335は、処理対象である校正条件要素の校正内容で指定されたIDを持つ分岐条件{M_1}のみを交換するとし、その交換先の候補{N_1}を列挙する。例えば、校正情報500の1行目にあるように、分岐条件に圧力という変数を含んで欲しい場合、分岐条件探索部335は、圧力≧100Mpa、圧力≧105Mpaなどの分岐条件を列挙する。具体的には、予測規則単純化部332で生成した分岐条件候補集合の中で、分岐条件に圧力という変数を含むものを全列挙することで実現できる。ステップS203からS205は、S202で列挙したすべての候補に対して行う。
ステップS203では、分岐条件探索部335は、処理対象の候補と、校正情報要素によって指定された分岐条件を交換する。例えば、図5に示す校正情報500の1行目を処理している場合、分岐条件IDが2であるノードを、圧力≧100Mpaなどの新しい候補と交換する。
ステップS204では、S203の出力である暫定木を入力として、分岐条件探索部335は、閾値最適化部336を呼び出し、閾値を最適化する。閾値最適化部336の処理の詳細は後述する。
ステップS205では、分岐条件探索部335は、S203からS205での探索における最適解と最適値を更新する。具体的には、分岐条件探索部335は、現在の単純予測規則の評価指標である最適値E_0が、今回のS204で出力された単純予測規則の評価指標Eよりも悪ければ、最適値をEに更新し、最適解を今回のS204で出力された単純予測規則に更新する。そうでなければ、更新はしない。
すべての候補Aに対するループが終了したら、分岐条件探索部335は、最適解である単純予測規則を出力し、ステップS206に進む。
ステップS206では、分岐条件探索部335は、S205までに得た単純予測規則Tが、ここまでに処理した校正情報要素をすべて満たすかどうかを判定する。例えば、処理対象の校正条件要素が、校正情報500の2行目である場合、分岐条件探索部335は、単純予測規則Tが校正情報500の1行目と2行目の条件を満たすかどうかを判定する。分岐条件探索部335は、これらの条件を満たすと判定した場合には(S206;YES)、Tを最新の単純予測規則として、次の校正情報要素の処理に進む。一方、分岐条件探索部335は、これらの条件を満たさないと判定した場合は(S206;NO)、処理を終了する。その際、図7に示す画面表示に必要な、現在の単純予測規則Tと、Tが各校正情報要素を満たすかどうかを出力する。
ステップS207では、S204と同様に、分岐条件探索部335は、閾値最適化部336を呼び出し、最新の単純予測規則の閾値を最適化する。
次に、閾値最適化部336の処理フローを図10に示す。閾値最適化部336では、単純予測規則における分岐条件の閾値変更を繰り返すことで、校正情報を満たしながら評価指標の高い単純予測規則を計算する。以下、図10の各ステップの詳細を述べる。
ステップS301では、閾値最適化部336は、暫定木の分岐条件を選択して閾値を変更する。例えば、ランダムに分岐条件を1つ選択し、その閾値をランダムな値に変更する。閾値の変更量はランダムでなくても、あらかじめ決めていた一定量としてもよいし、閾値を変更することで評価指標が変動するという条件を満たす中で最小の量としてもよい。
ステップS302では、閾値最適化部336は、まず、ステップS301で決定した暫定木における各リーフの予測値を、ステップS103と同様にして再計算する。そして、ステップS104と同様にして、一部のリーフの予測困難に設定する。そして、暫定木における評価指標を計算する。
ステップS303では、閾値最適化部336は、暫定木を、ステップS302までで計算した木に更新するか、それとも更新しないかを判定し、必要なら更新する。判定の際には、校正情報500と、評価指標を用いる。例えば、閾値最適化部336は、校正情報を満たし、評価指標が更新することで改善するならば、更新すると判定する。ここで、校正情報を満たすとは、現在処理している校正条件要素のみを満たすことを表しても良いし、現在までに処理したすべての校正条件要素を満たすことを表しても良い。
ステップS304では、閾値最適化部336は、終了条件を満たすかどうかを判定し、満たさないと判定した場合は(S304;NO)、再度ステップS301に戻り、満たすと判定した場合には(S304;YES)、閾値最適化処理を終了する。終了条件とは、例えば、ステップS304を実行した回数が一定値以上であるという条件でもよいし、閾値最適化部336の実行時間が一定時間以上であるという条件でもよい。
このように、本実施例によれば、予測規則校正システム1000が、あらかじめ設定された評価指標と制約(例えば、木構造に関する制約と予測困難なデータに関する制約)とを用いて学習モデル210の予測規則を単純化する予測規則単純化部332と、予測値または特定の分岐条件に対する要請を表す校正情報500に基づいて、単純化した予測規則の一部の分岐条件を更新する分岐条件探索部225と、校正情報に基づいて、単純化した予測規則の一部の閾値を更新する閾値最適化部336と、を有し、予測値に対する要請または特定の予測規則に対する要請を記述した校正情報を満たすような予測規則の微修正を繰り返すことによって、高精度であり、単純であり、なおかつ専門家の知識に整合するような予測規則を出力することができる。
本発明の第2の実施形態として、学習データと、校正情報をもとに、予測規則を計算する方式について説明する。本実施例は、実施例1と同様であるが、いくつかの点で異なる。
まず、本実施例では、入力として事前に準備した学習モデル210は用いない。この場合、学習モデルは、予測規則単純化部332実行前に、学習データを用いて一般的な方法で生成する。ここで、一般的な方法とは、ニューラルネットワーク、勾配ブースティング木、ランダムフォレストなどが挙げられる。いずれの手法も、分類問題の場合にも回帰問題の場合にも学習データから学習モデルを作成することができる。
また、閾値最適化部336のステップS301において、実施例1では暫定木の分岐条件をランダムに選択して閾値を変更していたが、本実施例では、閾値の変更対象を、校正条件要素によって指定された分岐条件の下位部分木のみとする。例えば、図4の単純予測規則において、分岐条件ID2に対する校正条件要素を処理する場合、閾値の変更対象は、分岐条件ID2または分岐条件ID3であるものに限定し、分岐条件ID1の閾値は変更しない。
このように、本実施例では、分岐条件探索部335と閾値最適化部336において、単純化した予測規則を更新する部分が、校正情報500で指定された分岐条件の下位部分木に限定されている。これにより、暫定木が一定以上大きい場合でも、部分的に閾値を変更することができ、より効率よく校正条件要素を処理することができる。
また、分岐条件探索部335のステップS202において、実施例1では分岐条件の交換候補列挙する際、条件をみたすものを全列挙した。一方、本実施例では、条件を満たす分岐条件候補を、相関分析を用いてさらに限定し、探索の効率を上げる。例えば、特定の分岐条件に湿度という変数が含まれているが、含まないでほしいという校正条件要素を処理する場合、湿度を含まない分岐条件候補を全て探索するのではなく、湿度と相関が一定以上高い変数を含む分岐条件候補のみを探索する。例えば、湿度と他のすべての説明変数の相関係数を計算し、高いものK個を抽出し、そのK個のいずれかが含まれる分岐条件候補のみを探索する。K=1で、湿度ともっとも相関の高い他の説明変数が温度である場合、湿度を含む分岐条件の交換対象として、温度を含む分岐条件のみを列挙する。
このように、本実施例では、分岐条件探索部335において更新する部分が、校正情報500で指定された分岐条件に限定されており、分岐条件探索部335において、更新前の分岐条件を構成する変数と相関の高い変数を抽出する処理を行うので、より効率的な探索を実行することができる。この場合、分岐条件探索部335と閾値最適化部336において、単純化した予測規則を更新する部分が、校正情報500で指定された分岐条件の下位部分木に限定されることにより、上述のように、より効率よく校正条件要素を処理することができる。
また、本実施例では、図6および図7において現在の単純予測規則を提示する際に、分岐条件IDをクリックするたびに、その分岐条件に対応する付加的な情報を提示する。例えば、実システムの概要図と、その概要図において分岐条件を構成する変数が対応する場所を提示する。例えば、センサデータを用いて医療機器が良品であるか不良品であるかを判定するシステムにおいて、製造ラインの概要図とセンサの場所を表示する。また、分岐条件ID構成する変数が温度である場合、その温度を取得したセンサの場所を強調して提示する。
200 学習データ
210 学習モデル
301 クライアント端末
302 DBサーバ
303 予測規則校正装置
304 ネットワーク
331 データ取得部
332 予測規則単純化部
333 予測規則校正部
334 校正情報取得部
335 分岐条件探索部
336 閾値最適化部
500 校正情報

Claims (8)

  1. 評価指標と制約とを用いて学習モデルの予測規則を単純化する予測規則単純化部と、
    予測値または特定の分岐条件に対する要請を表す校正情報に基づいて、前記単純化した予測規則の一部の分岐条件を更新する分岐条件探索部と、
    前記校正情報に基づいて、前記単純化した予測規則の一部の閾値を更新する閾値最適化部と、
    を有することを特徴とする予測規則校正システム。
  2. 請求項1に記載の予測規則校正システムであって、
    前記分岐条件探索部と前記閾値最適化部において、前記単純化した予測規則を更新する部分が、前記校正情報で指定された分岐条件の下位部分木に限定されている、
    ことを特徴とする予測規則校正システム。
  3. 請求項1に記載の予測規則校正システムであって、
    前記分岐条件探索部において更新する部分が、前記校正情報で指定された分岐条件に限定されており、
    前記分岐条件探索部において、更新前の分岐条件を構成する変数と相関の高い変数を抽出する処理を行う、
    ことを特徴とする予測規則校正システム。
  4. 請求項3に記載の予測規則校正システムであって、
    前記分岐条件探索部と前記閾値最適化部において、前記単純化した予測規則を更新する部分が、前記校正情報で指定された分岐条件の下位部分木に限定されている、
    ことを特徴とする予測規則校正システム。
  5. コンピュータで行われる予測規則校正方法であって、
    予測規則単純化部が、評価指標と制約とを用いて学習モデルの予測規則を単純化し、
    分岐条件探索部が、予測値または特定の分岐条件に対する要請を表す校正情報に基づいて、前記単純化した予測規則の一部の分岐条件を更新し、
    閾値最適化部が、前記校正情報に基づいて、前記単純化した予測規則の一部の閾値を更新する、
    ことを特徴とする予測規則校正方法。
  6. 請求項5に記載の予測規則校正方法であって、
    前記分岐条件探索部と前記閾値最適化部において、前記単純化した予測規則を更新する部分が、前記校正情報で指定された分岐条件の下位部分木に限定されている、
    ことを特徴とする予測規則校正方法。
  7. 請求項5に記載の予測規則校正方法であって、
    前記分岐条件探索部において更新する部分が、前記校正情報で指定された分岐条件に限定されており、
    前記分岐条件探索部において、更新前の分岐条件を構成する変数と相関の高い変数を抽出する処理を行う、
    ことを特徴とする予測規則校正方法。
  8. 請求項7に記載の予測規則校正方法であって、
    前記分岐条件探索部と前記閾値最適化部において、前記単純化した予測規則を更新する部分が、前記校正情報で指定された分岐条件の下位部分木に限定されている、
    ことを特徴とする予測規則校正方法。
JP2020192808A 2020-11-19 2020-11-19 予測規則校正システム、および予測規則校正方法 Pending JP2022081335A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2020192808A JP2022081335A (ja) 2020-11-19 2020-11-19 予測規則校正システム、および予測規則校正方法
US17/477,314 US20220156602A1 (en) 2020-11-19 2021-09-16 Prediction rule calibration system and prediction rule calibration method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020192808A JP2022081335A (ja) 2020-11-19 2020-11-19 予測規則校正システム、および予測規則校正方法

Publications (1)

Publication Number Publication Date
JP2022081335A true JP2022081335A (ja) 2022-05-31

Family

ID=81587680

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020192808A Pending JP2022081335A (ja) 2020-11-19 2020-11-19 予測規則校正システム、および予測規則校正方法

Country Status (2)

Country Link
US (1) US20220156602A1 (ja)
JP (1) JP2022081335A (ja)

Also Published As

Publication number Publication date
US20220156602A1 (en) 2022-05-19

Similar Documents

Publication Publication Date Title
US8700548B2 (en) Optimization technique using evolutionary algorithms
JP4429236B2 (ja) 分類ルール作成支援方法
US8364610B2 (en) Process modeling and optimization method and system
US20060230018A1 (en) Mahalanobis distance genetic algorithm (MDGA) method and system
US20060229852A1 (en) Zeta statistic process method and system
JP2008536218A (ja) 確率モデル作成用のコンピュータシステム
JP4591794B2 (ja) 情報処理装置および方法、並びにプログラム
CN110058679B (zh) 一种马达的激励信号搜索方法及电子设备
CN110222838B (zh) 文档排序方法、装置、电子设备及存储介质
CN112905809B (zh) 知识图谱学习方法和系统
KR101806628B1 (ko) 통합 회귀 분석 네트워크 구축 방법 및 이에 의한 통합 분석 시스템
JP2022081335A (ja) 予測規則校正システム、および予測規則校正方法
US20230004870A1 (en) Machine learning model determination system and machine learning model determination method
JP4591793B2 (ja) 推定装置および方法、並びにプログラム
JP6172315B2 (ja) 混合モデル選択の方法及び装置
KR102658417B1 (ko) 방향성을 가지는 네트워크를 이용한 타겟 탐색 방법
JP2017167979A (ja) 特徴選択装置、特徴選択方法およびプログラム
WO2024070170A1 (ja) 試作条件提案システム、試作条件提案方法
CN112818228B (zh) 向用户推荐对象的方法、装置、设备和介质
CN117077605B (zh) 基于系统封装的工艺设计方法、装置、设备及存储介质
CN116680323B (zh) 基于大数据安全平台的用户需求挖掘方法及系统
US20050160055A1 (en) Method and device for dividing a population of individuals in order to predict modalities of a given target attribute
US20230289619A1 (en) Adaptive data models and selection thereof
WO2022176293A1 (ja) 物性予測装置及びプログラム
WO2023209983A1 (ja) パラメータ生成装置、システム、方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230428

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240123

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240228

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240521