JPWO2019235603A1 - 関係性分析装置、関係性分析方法およびプログラム - Google Patents

関係性分析装置、関係性分析方法およびプログラム Download PDF

Info

Publication number
JPWO2019235603A1
JPWO2019235603A1 JP2020523195A JP2020523195A JPWO2019235603A1 JP WO2019235603 A1 JPWO2019235603 A1 JP WO2019235603A1 JP 2020523195 A JP2020523195 A JP 2020523195A JP 2020523195 A JP2020523195 A JP 2020523195A JP WO2019235603 A1 JPWO2019235603 A1 JP WO2019235603A1
Authority
JP
Japan
Prior art keywords
data
parameter
sample data
type
distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020523195A
Other languages
English (en)
Other versions
JP7017711B2 (ja
Inventor
慶一 木佐森
慶一 木佐森
山崎 啓介
啓介 山崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
National Institute of Advanced Industrial Science and Technology AIST
Original Assignee
NEC Corp
National Institute of Advanced Industrial Science and Technology AIST
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, National Institute of Advanced Industrial Science and Technology AIST filed Critical NEC Corp
Publication of JPWO2019235603A1 publication Critical patent/JPWO2019235603A1/ja
Application granted granted Critical
Publication of JP7017711B2 publication Critical patent/JP7017711B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Operations Research (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Complex Calculations (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

関係性分析装置は、第1種類のデータの入力を受けて第2種類のデータを出力するシミュレータのパラメータに関して仮設定された分布に基づいて、前記パラメータの複数のサンプルデータを算出するパラメータサンプルデータ算出部と、前記第1種類の観測データと前記パラメータの複数のサンプルデータの各々とを前記シミュレータに入力して、前記パラメータの複数のサンプルデータの各々毎に前記第2種類のサンプルデータを取得する第2種類サンプルデータ取得部と、前記第2種類の観測データと、算出された前記第2種類のサンプルデータとの差異に基づいて前記パラメータの複数のサンプルデータの各々に対する重みを算出し、算出された前記重みを用いて前記パラメータの値を算出するパラメータ値決定部と、を備える。

Description

本発明は、関係性分析装置、関係性分析方法および記録媒体に関する。
予測モデルを用いた数値予測、および、この予測モデルの学習に関連して幾つかの技術が提案されている。
例えば、特許文献1には、気象予測モデルを用いて定期的に気象予測を行う気象予測システムが記載されている。この気象予測システムは、気象予測モデルに観測データを同化して気象予測を行い、気象予測の演算に用いる演算パラメータを予測時刻に応じて変更する。
また、特許文献2に記載の予測装置は、複数の予測モデルを作成し、予測モデルそれぞれに対して残差を予測する残差予測モデルを作成する。そして、この予測装置は、予測モデル毎の予測値に対して、残差予測モデルによる残差予測値を合成して、予測装置としての予測値を算出する。
日本国特開2008−008772号公報 日本国特開2005−135287号公報
機械学習の1つに回帰分析がある。一般的な回帰分析では、微分可能な関数によるモデルを使用し、モデルのパラメータ(関数の係数)の値を機械学習する。
しかし、モデルが不明である場合(例えば、モデルとして用いられている関数を参照できない場合)には、回帰分析手法を適用することはできない。
本発明の目的の一例は、上述の課題を解決することのできる関係性分析装置、関係性分析方法およびプログラムを提供することである。
本発明の第1の態様によれば、関係性分析装置は、第1種類のデータの入力を受けて第2種類のデータを出力するシミュレータのパラメータに関して仮設定された分布に基づいて、前記パラメータの複数のサンプルデータを算出するパラメータサンプルデータ算出部と、前記第1種類の観測データと前記パラメータの複数のサンプルデータの各々とを前記シミュレータに入力して、前記パラメータの複数のサンプルデータの各々毎に前記第2種類のサンプルデータを取得する第2種類サンプルデータ取得部と、前記第2種類の観測データと、算出された前記第2種類のサンプルデータとの差異に基づいて前記パラメータの複数のサンプルデータの各々に対する重みを算出し、算出された前記重みを用いて前記パラメータの値を算出するパラメータ値決定部と、を備える。
本発明の第2の態様によれば、関係性分析方法は、第1種類のデータの入力を受けて第2種類のデータを出力するシミュレータのパラメータに関して仮設定された分布に基づいて、前記パラメータの複数のサンプルデータを算出し、前記第1種類の観測データと前記パラメータの複数のサンプルデータの各々とを前記シミュレータに入力して、前記パラメータの複数のサンプルデータの各々毎に前記第2種類のサンプルデータを算出し、前記第2種類の観測データと、算出された前記第2種類のサンプルデータとの差異に基づいて前記複数のパラメータのサンプルデータの各々に対する重みを算出し、算出された前記重みを用いて前記パラメータの値を算出する、ことを含む。
本発明の第3の態様によれば、記録媒体は、コンピュータに、第1種類のデータの入力を受けて第2種類のデータを出力するシミュレータのパラメータに関して仮設定された分布に基づいて、前記パラメータの複数のサンプルデータを算出し、前記第1種類の観測データと前記パラメータの複数のサンプルデータの各々とを前記シミュレータに入力して、前記パラメータの複数のサンプルデータの各々毎に前記第2種類のサンプルデータを算出し、前記第2種類の観測データと、算出された前記第2種類のサンプルデータとの差異に基づいて前記パラメータの複数のサンプルデータの各々に対する重みを算出し、算出された前記重みを用いて前記パラメータの値を算出する、ことを実行させるためのプログラムを記憶する。
この発明の実施形態によれば、関係性分析について、モデルが不明な場合であっても対応可能である。
第1実施形態に係る関係性分析装置の機能構成の例を示す概略ブロック図である。 第1実施形態における、シミュレータによる回帰関数の設定例を示す図である。 第1実施形態に係る関係性分析装置が行う処理の手順の例を示すフローチャートである。 第2実施形態に係る関係性分析装置の機能構成の例を示す概略ブロック図である。 第2実施形態に係る関係性分析装置が行う処理の手順の例を示すフローチャートである。 第2実施形態における共変量シフトの例を示す図である。 第3実施形態に係る関係性分析装置が行う処理の手順の例を示すフローチャートである。 第4実施形態に係る関係性分析装置が行う処理の手順の例を示すフローチャートである。 実施形態に係る実験におけるシミュレーション対象の組立工程の例を示す図である。 実施形態に係る実験で得られたXとYの関係を示す図である。 実施形態に係る実験得られたパラメータの値を示す図である。 実施形態に係る共変量シフトの実験におけるパラメータ値の設定例を示す図である。 実施形態に係る共変量シフトの実験で得られたXとYの関係を示す図である。 実施形態に係る共変量シフトの実験で得られたパラメータの値を示す図である。 本発明の実施形態に係る関係性分析装置の構成の例を示す図である。
以下、本発明の実施形態を説明するが、以下の実施形態は請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
<第1実施形態>
図1は、第1実施形態に係る関係性分析システムの機能構成の例を示す概略ブロック図である。図1に示す構成で、関係性分析システム1は、関係性分析装置100と、シミュレータサーバ900とを備える。関係性分析装置100は、入出力部110と、記憶部170と、制御部180とを備える。制御部180は、パラメータサンプルデータ算出部181と、第2種類サンプルデータ取得部182と、パラメータ値決定部183とを備える。
関係性分析装置100は、関係性分析を行う。具体的には、関係性分析装置100は、第1種類のデータおよび第2種類のデータ間の関係性(例えば、相関関係)のモデルのパラメータ値を観測データに基づいて決定することで、データ間の関係性(例えば、相関関係)を分析する。
関係性分析装置100は、例えばパソコン(Personal Computer;PC)またはワークステーション(Workstation)等のコンピュータを用いて構成される。
以下では、第1種類のデータをデータXと称し、第2種類のデータをデータYと称する。また、観測データの個数をn(nは正の整数)として、データXの観測データ(第1種類の観測データ)を観測データXと表記し、データYの観測データ(第2種類の観測データ)を観測データYと表記する。また、観測データXの要素をX、・・・、Xと表記し、観測データYの要素をY、・・・、Yと表記する。このように、関係性分析装置100は、データX(iは、1≦i≦nの整数)とデータYとが一対一に対応付けられた観測データ(従って、X−Y平面にプロット可能な観測データ)を取得する。
観測データXおよびYは特定の種類のデータに限定されず、実測されたいろいろなデータとすることができる。観測データを得るための実測方法は特定の方法に限定されず、ユーザなど人による計数または測定、あるいはセンサを用いたセンシングなど、いろいろな方法を採用可能である。
例えば、観測データXの要素は、観測対象を構成している構成要素の状態を表すものであってもよい。観測データYの要素は、センサ等を用いて観測対象に関して観測された状態を表すものであってもよい。例えばユーザが、製造工場の生産性を分析したい場合、観測データXは、当該製造工場における各設備の稼働状況を表すものであってもよい。観測データYは、複数の設備によって構成されるラインにて製造される製品の個数を表すものであってもよい。
観測対象、および、観測データは、上述した例に限定されず、たとえば、加工工場における設備であってもよいし、ある施設を建設する場合における建設システムであってもよい。
関係性分析装置100は、観測データXおよびYと、シミュレータサーバ900が提供するシミュレータr(x,θ)と、パラメータθについて仮設定された事前分布(Prior)である分布π(θ)とを与えられて、データXとデータYとの関係性分析を行う。
分布π(θ)は、例えば関係性分析装置100のユーザが、シミュレーション対象に関して有する知識に応じた精度で設定する。
シミュレータサーバ900は、シミュレータr(x,θ)を提供する。シミュレータサーバ900が提供するシミュレータr(x,θ)は、パラメータθの値の設定、および、変数xへのデータXの値の入力を受けて、データYの値を出力する。一般的な関係性分析では微分可能な関数がモデルとして用いられるのに対し、関係性分析装置100では、シミュレータr(x,θ)のモデルの関数を微分できる必要はない。例えば、シミュレータr(x,θ)が、シミュレータサーバ900のように関係性分析装置100以外の装置によって管理され、関係性分析装置100が、この装置にデータXの値とパラメータθの値とを送信してデータYの値を受信する形態であってもよい。
あるいは、関係性分析装置100が、関係性分析装置100自らの内部にシミュレータr(x,θ)を備えていてもよい。この場合、シミュレータr(x,θ)がブラックボックス化されているなど、関係性分析装置100にとってシミュレータの回帰関数が未知であってもよい。
図2は、シミュレータによる回帰関数の設定例を示す図である。図2では、横軸はX座標(データXの座標)を示し、縦軸はY座標(データYの座標)を示す。なお、以下の説明においては、説明の便宜上、回帰関数という言葉を用いて説明するが、必ずしも一般的な(数学的な)「回帰」を表しているものに限定されない。たとえば、モデルが不明確である場合も含めて「回帰」にて表すとする。
線L11は、真のモデルを示す。ここでは、真のモデルの関数をy=R(x)とする。
上述したように、真のモデル(線L11)は、必ずしも、数学的な関数(たとえば、一次関数、二次関数、指数関数、ガウス関数)を用いて表されているとは限らず、xと、yとの関係性を便宜的に示したものである。さらには、真のモデルが実際に表現される必要はない。以降、説明の便宜上、関数という言葉を用いるが、関数という言葉を、関係性を表すものという意味で用いる。
また、点P11のように丸で示されるデータが、真のモデルに基づいて生成されている。図2の例では、データにノイズが含まれており、各データが線L12の近傍にプロットされている。
線L12は、シミュレータの入出力であるxおよびyに関して数学的な回帰分析を行い、その結果得られた回帰関数の例を示す。シミュレータサーバ900が提供するシミュレータr(x,θ)は、パラメータθの値の設定を受けると、例えば、線L12に例示されるような数学的な回帰関数に従うデータYを出力する。言い換えると、この状態でデータXの値の入力を受けると、シミュレータr(x,θ)は、入力されたデータXの値に対応するデータYの値を出力する。これは、観測対象が工場であるという例の場合、シミュレータに入力されたデータX(例えば、設備の状態)と、出力されたデータY(例えば、あるラインの製造数)との間には、統計的に当該回帰関数に従う関係性があるということを表す。
関係性分析装置100は、観測データに基づいて、観測データに対応するパラメータ値を算出し、算出したパラメータ値をシミュレータに設定する。これにより、シミュレータは、データXの値の入力に対してデータYの値を出力する。すなわち、パラメータ値の設定により、シミュレータがシミュレーションを実行可能になる。
入出力部110は、データの入出力を行う。特に、入出力部110は、観測データを取得する。例えば、入出力部110が、設備を監視しているセンサ、製品個数を数える装置等を用いて構成されていてもよい。あるいは、入出力部110は、通信装置を備え、他の装置と通信を行ってデータを送受信するようにしてもよい。また、入出力部110が、通信装置に加えて、或いは代えて、キーボードおよびマウス等の入力デバイスを備え、ユーザ操作によるデータの入力を受け付けるようにしてもよい。
記憶部170は、各種データを記憶する。記憶部170は、関係性分析装置100が備える記憶デバイスを用いて構成される。
制御部180は、関係性分析装置100の各部を制御して各種処理を実行する。制御部180は、関係性分析装置100が備えるCPU(Central Processing Unit、中央処理装置)が、記憶部170からプログラムを読み出して実行することで構成される。
パラメータサンプルデータ算出部181は、パラメータθに関して仮設定された分布π(θ)に基づいて、パラメータθのサンプルデータを複数算出する。分布π(θ)は、ガウス分布に従う分布であってもよいし、ある数値区間における一様乱数を用いて設定されてもよい。但し、分布π(θ)は、これらの例に限定されない。上記のように、パラメータθは、シミュレータr(x,θ)のパラメータである。シミュレータr(x,θ)は、第1種類のデータ(データX)の値の入力を受けて第2種類のデータ(データY)の値を出力する。
第2種類サンプルデータ取得部182は、第1種類の観測データ(観測データX)とパラメータθのサンプルデータとをシミュレータr(x,θ)に入力して、パラメータθのサンプルデータ毎に第2種類のサンプルデータ(データYのサンプルデータ)を取得する。
パラメータ値決定部183は、第2種類の観測データ(観測データY)と、第2種類サンプルデータ取得部182が取得した第2種類のサンプルデータ(データYのサンプルデータ)との差異に基づいてパラメータθのサンプルデータの各々に対する重みを算出し、得られた重みを用いてパラメータθの値を算出する。パラメータ値決定部183が算出するパラメータθの値は、関係性分析装置100がパラメータθの適切な値(データXとデータYとの関係を模擬するための値)として決定する値である。
図3は、第1実施形態に係る関係性分析装置100が行う処理の手順の例を示すフローチャートである。
(ステップS11)
パラメータサンプルデータ算出部181は、パラメータθの事前分布(分布π(θ))に基づいてパラメータθのサンプルデータθ<1> を生成する。<1>は、事前分布に基づくデータであることを示す。
生成するデータの数をm(mは正の整数)とし、jを1≦j≦mの整数として、θ<1> は式(1)のように示される。
Figure 2019235603
θは、パラメータθの次元数を示す。
式(1)に示されるように、θ<1> は、dθ次元の実数として示され、分布π(θ)に従う。この時点では最適なパラメータ値は不明であり、例えばユーザが、得られている情報に基づいてパラメータθの分布を推定し、事前分布π(θ)として登録しておく。
ステップS11の後、処理がステップS12へ進む。
(ステップS12)
第2種類サンプルデータ取得部182は、ステップS11で得られたサンプルデータθ<1> 毎に、観測データXに対応するサンプルデータY<1>n を取得する。第2種類サンプルデータ取得部182は、θ<1> とXとをシミュレータr(x,θ)に入力してY<1>n を取得する。第2種類サンプルデータ取得部182は、サンプルデータθ<1> 毎に、n個(観測データXの要素数と同数)の要素を有するサンプルデータY<1>n を取得する。観測データXの要素と、サンプルデータY<1>n の要素とが一対一に対応付けられ、X−Y平面にプロット可能である。
<1>n は、式(2)のように示される。
Figure 2019235603
式(2)に示されるように、Y<1>n は、n次元の実数として示され、シミュレータr(x,θ)の学習モデルp(y|x,θ)に観測データXおよびサンプルデータθ<1> を入力した分布p(y|X,θ<1> )に従う。
ステップS12の後、処理がステップS13へ進む。
(ステップS13)
パラメータ値決定部183は、ステップS12で得られたY<1>n と、観測データYとに基づいて、θ<1> 毎に重みを算出し、重み付け平均する。
重み付け平均で得られるパラメータ値θ<2>は、式(3)のように示される。<2>は、Y<1>n とYとの比較に基づく重みを反映済みのデータであることを示す。
Figure 2019235603
重みwは、式(4)のように示される。
Figure 2019235603
kは、Y<1>n とYとの近さ(ノルム)を算出する関数である。kとしてガウシアンカーネルを用いることができ、式(5)のように示される。
Figure 2019235603
パラメータ値決定部183は、Y<1>n とYとが近いほど、サンプルデータθ<1> に対する重みを大きくする。すなわち、パラメータ値決定部183は、尤度が高いサンプルデータθ<1> (観測データYを近似する精度が高いサンプルデータθ<1> )に対する重みを大きくする。
ステップS13の後、関係性分析装置100は、図3の処理を終了する。
関係性分析装置100が、パラメータ値決定部183が決定した重みを用いて、シミュレータにおけるパラメータを更新するようにしてもよい。このような処理を行うことによって、第2種類のサンプルデータに対して予測精度が高いシミュレーションを行うことができる。
以上のように、パラメータサンプルデータ算出部181は、第1種類のデータ(データX)の値の入力を受けて第2種類のデータ(データY)の値を出力するシミュレータr(x,θ)のパラメータθに関して仮設定された分布π(θ)に基づいて、パラメータθのサンプルデータθ<1> を複数算出する。第2種類サンプルデータ取得部182は、第1種類の観測データXとパラメータθのサンプルデータθ<1> とをシミュレータr(x,θ)に入力して、パラメータθのサンプルデータθ<1> 毎に第2種類のサンプルデータY<1>n を取得する。パラメータ値決定部183は、第2種類の観測データYと、算出された第2種類のサンプルデータY<1>n との差異に基づいて、パラメータθのサンプルデータθ<1> の各々に対する重みを算出し、得られた重みを用いてパラメータθの値θ<2>を算出する。
このように、関係性分析装置100では、シミュレータのパラメータθのサンプルデータθ<1> を生成し、生成したサンプルデータθ<1> をシミュレータに入力して評価することで、モデルの関数を微分する必要なしにパラメータθの値を決定することができる。関係性分析装置100によればこの点で、関係性分析について、モデルの関数を微分できない場合や、モデルが不明な場合であっても対応可能である。
<第2実施形態>
第1実施形態では、パラメータθの推定値がdθ次元の実数値で求まる。これに対し、第2実施形態では、パラメータθの推定値を分布で求める例について説明する。
図4は、第2実施形態に係る関係性分析装置の機能構成の例を示す概略ブロック図である。図4に示す構成は、パラメータ値決定部183が、カーネル平均算出部191と、カーネル平均対応パラメータ算出部192と、パラメータ予測分布算出部193と、第2種類予測分布データ算出部194とを備える点で、図1の場合と異なる。それ以外は、図1の場合と同様である。
カーネル平均算出部191は、第1種類の観測データXと、第2種類サンプルデータ取得部182が取得した第2種類のサンプルデータY<1>n との下でのパラメータθの事後分布を示すカーネル平均を算出する。
カーネル平均対応パラメータ算出部192は、カーネル平均算出部191が算出したカーネル平均に基づくパラメータθのサンプルデータを算出する。
パラメータ予測分布算出部193は、カーネル平均算出部191が算出したカーネル平均に基づくパラメータθのサンプルデータを用いてパラメータθの予測分布のカーネル表現を算出する。
第2種類予測分布データ算出部194は、パラメータ予測分布算出部193が算出したパラメータの予測分布のカーネル表現を用いて、第2種類のデータ(データY)の予測分布に従うサンプルデータを算出する。
図5は、第2実施形態に係る関係性分析装置100が行う処理の手順の例を示すフローチャートである。
図5のステップS21〜S22は、図3のステップS11〜S12と同様である。ステップS22の後、処理がステップS23へ進む。
(ステップS23)
カーネル平均算出部191は、カーネル平均を求める。
上述した式(3)は、カーネル平均を求める式と捉えて式(6)のように表すことができる。カーネル平均算出部191は、式(6)に基づいてカーネル平均μ^θ|XYを求める。
Figure 2019235603
重みwは、式(7)のように示される。
Figure 2019235603
上付きのTは、行列またはベクトルの転置を示す。
は、式(8)のように示される。
Figure 2019235603
として、式(9)で示されるガウシアンカーネル関数(Gaussian Kernel Function)を用いる。
Figure 2019235603
Gはグラム行列(Gramm Matrix)を示し、式(10)のように示される。
Figure 2019235603
カーネル平均μ^θ|XYは、XおよびYの元でのθの事後分布をカーネル平均埋め込み(Kernel Mean Embeddings)により再生核ヒルベルト空間(Reproducing Kernel Hilbert Space;RKHS)上で表現したものに該当する。
ステップS23の後、処理がステップS24へ進む。
(ステップS24)
カーネル平均対応パラメータ算出部192は、パラメータθについて、カーネル平均μ^θ|XYに基づくサンプルデータ{θ<3> ,・・・,θ<3> }(mはサンプル数を示す正の整数)を求める。<3>は、カーネル平均に基づくデータであることを示す。
カーネル平均に基づくサンプルデータは、カーネルハーディング(Kernel Herding)の手法を用いて帰納的に求めることができる。この場合、jを0≦j≦m(mはサンプル数を示す正の整数)として、カーネル平均対応パラメータ算出部192は、式(11)に基づいて、サンプルデータθ<3> j+1を算出する。
Figure 2019235603
argmaxθ(θ)は、h(θ)の値を最大にするθの値を示す。
は、式(12)により再帰的に示される。
Figure 2019235603
式(12)のμには、ステップS23で得られたカーネル平均μ^θ|XYを入力する。また、hの初期値hを、h:=μ^θ|XYと設定する。
Hは再生核ヒルベルト空間を示す。
ステップS24で得られるサンプルデータ{θ<3> ,・・・,θ<3> }には、事前分布に基づくサンプルデータY<1>n と観測データYとの近さ(ノルム)に応じた重み付けが反映されている。
ステップS24の後、処理がステップS25へ進む。
(ステップS25)
パラメータ予測分布算出部193は、シミュレータr(x,θ)に観測データXおよびサンプルデータθ<3> を入力して、分布p(y|X,θ<3> )に従う{θ<3> ,Y<3>n }をシミュレーションにより算出する。
ステップS25の後、処理がステップS26へ進む。
(ステップS26)
パラメータ予測分布算出部193は、ステップS25で得られたサンプルデータ{θ<3> ,Y<3>n }を用いて、データYの予測分布(Predictive Distribution)のカーネル表現ν^y|YXを算出する。
予測分布のカーネル表現ν^y|YXは、カーネルサムルール(Kernel Sum Rule)を用いて算出することができる。この場合、予測分布p(y|X,Y)は、式(13)のように示される。
Figure 2019235603
予測分布p(y|X,Y)のカーネル表現ν^y|YXは、式(14)のように示される。
Figure 2019235603
、・・・、vは、式(15)のように示される。
Figure 2019235603
グラム行列Gθ<3>は、式(16)のように示される。
Figure 2019235603
グラム行列Gθ<3>θは、式(17)のように示される。
Figure 2019235603
δは、逆行列の計算を安定化させるための係数である。
Iは単位行列を示す。
ステップS26の後、処理がステップS27へ進む。
(ステップS27)
第2種類予測分布データ算出部194は、ステップS26で得られた予測分布のカーネル表現ν^y|YXを用いて、予測分布に基づくサンプルデータY<4>n を求める。
<4>は、予測分布のカーネル表現に基づくデータであることを示す。
ステップS27でも、ステップS24の場合と同様、カーネルハーディングの手法を用いて帰納的にサンプルデータを求めることができる。ステップS27では、式(18)に基づいてサンプルデータを算出する。
Figure 2019235603
argmax(y)は、h(y)の値を最大にするyの値を示す。
h’は、式(19)により再帰的に示される。
Figure 2019235603
式(19)のνにはステップS26で得られた予測分布のカーネル表現ν^y|YXを入力する。また、h’の初期値h’を、h’:=ν^y|YXと設定する。
ステップS27の後、処理がステップS28へ進む。
(ステップS28)
第2種類予測分布データ算出部194は、ステップS24で得られたサンプルデータ{θ<3> ,・・・,θ<3> }から、パラメータθの分布を求める。例えば、第2種類予測分布データ算出部194は、パラメータθの分布がガウス分布など特定の分布に従うと仮定し、サンプルデータから平均値および分散など分布の特徴量を算出する。
あるいは、関係性分析装置100が、ステップS24で得られたパラメータのサンプルデータをそのままユーザに提示する(例えば、グラフで表示する)ようにしてもよい。ユーザは、パラメータのサンプルデータそのものを参照することで、信頼区間、および、カーネル平均対応パラメータ算出部192が算出したパラメータそのものの信頼性を、より高精度に判断することができる。また、例えばパラメータの分布が多峰的である場合、または、パラメータの分布が非対称な場合など、特定の分布でパラメータのサンプルデータを捉えられない場合、関係性分析装置100が、パラメータのサンプルデータをそのままユーザに提示することで、ユーザは、パラメータの分布を把握し得る。
また、第2種類予測分布データ算出部194が、パラメータのサンプルデータに加えて、あるいは代えて、ステップS27で得られたデータYのサンプルデータY<4>n の分布を求めるようにしてもよい。
ステップS28の後、関係性分析装置100は、図5の処理を終了する。
以上のように、カーネル平均算出部191は、第1種類の観測データXと、第2種類サンプルデータ取得部182が取得した第2種類のサンプルデータY<1>n との下でのパラメータθの事後分布を示すカーネル平均μ^θ|XYを算出する。カーネル平均対応パラメータ算出部192は、カーネル平均算出部191が算出したカーネル平均μ^θ|XYに基づくパラメータθのサンプルデータ{θ<3> ,・・・,θ<3> }を算出する。パラメータ予測分布算出部193は、パラメータθのサンプルデータ{θ<3> ,・・・,θ<3> }を用いてデータYの予測分布のカーネル表現ν^y|YXを算出する。第2種類予測分布データ算出部194は、パラメータ予測分布算出部193が算出したデータYの予測分布のカーネル表現ν^y|YXを用いて、第2種類のデータ(データY)の予測分布に従うサンプルデータY<4>n を算出する。
このように、関係性分析装置100がサンプルデータを生成することで、サンプルデータからデータの分布を求めることができる。関係性分析装置100が、データの分布を求めるようにしてもよい。あるいは、関係性分析装置100がサンプルデータをユーザに提示し、ユーザがデータの分布を求めるようにしてもよい。
<第3実施形態>
第3実施形態では、関係性分析装置が、共変量シフト(Covariate Shift)に対応する場合について説明する。共変量シフトとは、訓練時とテスト時とで入力の分布が異なるが入出力関数は変わらないことである。ここでは、観測データのデータXの分布と、関係性分析対象(分析したい範囲)のデータXの分布とが異なるが真のモデルは変わらない場合を共変量シフトとして扱う。観測データのデータXの分布をq(x)と表記し、関係性分析対象のデータXの分布をq(x)と表記する。
図6は、共変量シフトの例を示す図である。図6で、横軸はX座標(データXの座標)を示し、縦軸はY座標(データYの座標)を示す。
線L21は、真のモデルを示す。ここでは、真のモデルの関数をy=R(x)とする。
また、点P22のように丸で示されるデータ、点P23のように十字で示されるデータのいずれも真のモデルに基づいて生成されている。丸で示されるデータを丸データと称し、十字で示されるデータを十字データと称する。
図6の例では、データにノイズが含まれており、丸データ、十字データのいずれも、線L21の近傍にプロットされている。
一方、丸データと十字データとでは、x軸方向の分布が異なる。丸データが図6の左右に広く分布しているのに対し、十字データは、図6の左側に偏って分布している。この分布の違いから、丸データの場合と十字データの場合とで回帰関数が異なる。例えば直線回帰を行う場合、丸データの回帰直線は線L22となり、十字データの回帰直線は線L23となる。
このように、真のモデルが同じであっても分布の違いから回帰関数が異なる場合がある。例えば、得られた観測データが丸データである場合、この観測データ(丸データ)に基づいて回帰関数を求めると線L22が得られる。一方、ユーザが、十字データの分布の場合について関係性分析を行いたい場合、線L22を回帰関数としたのでは精度が低く、線L23を回帰関数として求めたい。
そこで、関係性分析装置100は、観測データの場合のデータXの分布と関係性分析を行いたい範囲のデータXの分布との比較に基づいて観測データに重みづけを行い、関係性分析を行いたい範囲のデータXの分布に対応するパラメータθの値を求める。
第3実施形態にかかる関係性分析システムの構成および関係性分析装置100の構成は、第1実施形態の場合(図1)と同様である。第3実施形態では、パラメータ値決定部183が行う処理が、第1実施形態の場合と異なる。第3実施形態では、パラメータ値決定部183は、第2種類の観測データYと、第2種類のサンプルデータY<1>n との差異、および、第1種類の観測データXが従う第1分布と、第1種類のデータの分布であって関係を求めたい領域を示す第2分布との関係に基づいて、パラメータのサンプルデータの各々に対する重みを算出し、得られた重みを用いてパラメータの値を算出する。
第1実施形態では、パラメータ値決定部183は、観測データYと、サンプルデータY<1>n との近さで示される、パラメータのサンプルデータθ<1> の尤度に基づく重みを算出している。これに対し、第3実施形態では、パラメータ値決定部183は、サンプルデータθ<1> の尤度に加えて、観測データの分布d(x)への一致度合いに基づいてサンプルデータθ<1> の各々を重み付けする。
図7は、第3実施形態に係る関係性分析装置100が行う処理の手順の例を示すフローチャートである。
図7のステップS31〜S32は、図3のステップS11〜S12と同様である。ステップS32の後、処理がステップS33へ進む。
(ステップS33)
パラメータ値決定部183は、パラメータのサンプルデータθ<1> 毎に重みを算出し、重み付け平均する。図3のステップS12では、パラメータ値決定部183は、サンプルデータY<1>n と、観測データYとに基づいて、θ<1> 毎に重みを算出する。これに対し、ステップS33では、パラメータ値決定部183は、サンプルデータY<1>n および観測データYに加えて、さらに、観測データXの分布q(x)および回帰を求めたい領域を示す分布q(x)に基づいて重みを算出する。
重み付け平均で得られるパラメータ値θ<5>は、式(20)のように示される。<5>は、Y<1>n 、Y、q(x)およびq(x)に基づく重みを反映済みのデータを示す。
Figure 2019235603
重みw’は、式(21)のように示される。
Figure 2019235603
k’は、Y<1>n とYとの近さ(ノルム)を算出し、分布q(x)への一致度合いを加味する関数である。k’としてガウシアンカーネルを変形した式を用いることができ、式(22)のように示される。
Figure 2019235603
βは、Xの各要素の分布q(x)への一致度合いを示す関数であり、式(23)のように示される。
Figure 2019235603
白丸の演算子は、アダマール積(Hadamard Product)、すなわち、行列またはベクトルの要素毎の積を示す。
ステップS13の後、関係性分析装置100は、図7の処理を終了する。
以上のように、パラメータサンプルデータ算出部181は、第1種類のデータ(データX)の値の入力を受けて第2種類のデータ(データY)の値を出力するシミュレータr(x,θ)のパラメータθに関して仮設定された分布π(0)に基づいて、パラメータθのサンプルデータθ<1> を複数算出する。第2種類サンプルデータ取得部182は、第1種類の観測データXとパラメータθのサンプルデータθ<1> とをシミュレータr(x,θ)に入力して、パラメータθのサンプルデータθ<1> 毎に第2種類のサンプルデータY<1>n を取得する。パラメータ値決定部183は、第2種類の観測データYと、算出された第2種類のサンプルデータY<1>n との差異、および、第1種類の観測データXが従う第1分布q(x)と、第1種類のデータの分布であって関係を求めたい領域を示す第2分布q(x)との関係に基づいて、パラメータθのサンプルデータの各々に対する重みを算出し、得られた重みを用いてパラメータθの値を算出する。
これにより、関係性分析装置100は、共変量シフトに対応して、より高精度に関係性分析を行うことができる。
また、第1実施形態の場合と同様第3実施形態でも、関係性分析装置100では、シミュレータのパラメータθのサンプルデータθ<1> を生成し、生成したサンプルデータθ<1> をシミュレータに入力して評価することで、モデルの関数を微分する必要なしにパラメータθの値を決定することができる。関係性分析装置100によればこの点で、関係性分析について、モデルの関数を微分できない場合や、モデルが不明な場合であっても対応可能である。
このように、関係性分析装置100によれば、複数種類のデータ間の関係性分析で一部の領域における関係性を分析する際に、モデルが不明な場合であっても対応可能である。
<第4実施形態>
第3実施形態では、パラメータθの推定値がdθ次元の実数値で求まる。これに対し、第4実施形態では、パラメータθの推定値を分布で求める例について説明する。
第4実施形態に係る関係性分析システムの構成および関係性分析装置100の構成は、第2実施形態の場合(図4)と同様である。第4実施形態では、パラメータ値決定部183が行う処理が、第1実施形態の場合と異なる。第3実施形態では、パラメータ値決定部183は、第2種類の観測データYと、第2種類のサンプルデータY<1>n との差異、および、第1種類の観測データXが従う第1分布と、第1種類のデータの分布であって関係を求めたい領域を示す第2分布とに基づいて、パラメータのサンプルデータの各々に対する重みを算出し、得られた重みを用いてパラメータの値を算出する。
図8は、第4実施形態に係る関係性分析装置100が行う処理の手順の例を示すフローチャートである。
ステップS41〜S42は、図2のステップS11〜S12と同様である。
ステップS42の後、処理がステップS43へ進む。
(ステップS43)
カーネル平均算出部191は、カーネル平均を求める。
上述した式(20)は、カーネル平均を求める式と捉えて式(24)のように表すことができる。カーネル平均算出部191は、式(24)に基づいてカーネル平均μ^θ<6>|XYを求める。<6>は、分布q(x)への適合度合いに基づく重み付け済みのデータであることを示す。
Figure 2019235603
重みw<6> は、式(25)のように示される。
Figure 2019235603
<6> (Y)は、式(26)のように示される。
Figure 2019235603
グラム行列G<6>は、式(27)のように示される。
Figure 2019235603
<6> (Y,Y’)は、式(28)のように示される。
Figure 2019235603
式(28)は、重み付けされたカーネル関数に該当する。
カーネル平均μ^θ<6>|XYは、XおよびYの下でのθの事後分布に、分布q(x)への一致度合いに基づく重みづけをしたものを、カーネル平均埋め込みにより再生核ヒルベルト空間上で表現したものに該当する。
ステップS43の後、処理がステップS44へ進む。
(ステップS44)
カーネル平均対応パラメータ算出部192は、パラメータθ<6>について、カーネル平均μ^θ<6>|XYに基づくサンプルデータ{θ<6> ,・・・,θ<6> }(mはサンプル数を示す正の整数)を求める。
カーネル平均に基づくサンプルデータは、カーネルハーディングの手法を用いて帰納的に求めることができる。この場合、カーネル平均対応パラメータ算出部192は、jを0≦j≦m(mはサンプル数を示す正の整数)として、式(29)に基づいて、サンプルデータθ<6> j+1を算出する。
Figure 2019235603
argmaxθ(θ)は、h(θ)の値を最大にするθの値を示す。
は、式(30)により再帰的に示される。
Figure 2019235603
式(30)のμには、ステップS43で得られたカーネル平均μ^θ<6>|XYを入力する。また、hの初期値hを、h:=μ^θ<6>|XYと設定する。
Hは再生核ヒルベルト空間を示す。
ステップS24で得られるサンプルデータ{θ<6> ,・・・,θ<6> }には、事前分布に基づくサンプルデータY<1>n と観測データYとの近さに応じた重み付け、および、分布q(x)への一致度合いに基づく重み付けが反映されている。
ステップS44の後、処理がステップS45へ進む。
(ステップS45)
パラメータ予測分布算出部193は、学習モデルp(y|x,θ)に観測データXおよびサンプルデータθ<6> を入力した分布p(y|X,θ_mc )に従う{θ<6> ,Y<6>n }を、シミュレーションにより算出する。
ステップS45の後、処理がステップS26へ進む。
(ステップS46)
パラメータ予測分布算出部193は、ステップS45で得られたサンプルデータ{θ<6> ,Y<6>n }を用いて、分布q(x)に対応するデータYの予測分布のカーネル表現ν^y|YXを算出する。
予測分布のカーネル表現ν^y|YXは、カーネルサムルールを用いて算出することができる。この場合、予測分布p(y|X<6> ,Y<6> )は、式(31)のように示される。
Figure 2019235603
予測分布p(y|X,Y)のカーネル表現ν^y|XYは、式(32)のように示される。
Figure 2019235603
、・・・、vは、式(33)のように示される。
Figure 2019235603
グラム行列Gθ<6>は、式(34)のように示される。
Figure 2019235603
グラム行列Gθ<6>θは、式(35)のように示される。
Figure 2019235603
δは、逆行列の計算を安定化させるための係数である。
Iは単位行列を示す。
ステップS46の後、処理がステップS47へ進む。
(ステップS47)
第2種類予測分布データ算出部194は、ステップS46で得られた予測分布のカーネル表現ν^y|YXを用いて、予測分布Y<6>n のサンプルデータを求める。
ステップS47でも、ステップS44の場合と同様、カーネルハーディングの手法を用いて帰納的にサンプルデータを求めることができる。ステップS47では、式(36)に基づいてサンプルデータを算出する。
Figure 2019235603
argmaxh’(y)は、h’(y)の値を最大にするyの値を示す。
h’は、式(37)により再帰的に示される。
Figure 2019235603
式(37)のνにはステップS46で得られた予測分布のカーネル表現ν^y|YXを入力する。また、h’の初期値h’を、h’:=ν^y|YXと設定する。
ステップS47の後、処理がステップS48へ進む。
(ステップS28)
第2種類予測分布データ算出部194は、ステップS44で得られたサンプルデータ{θ<6> ,・・・,θ<6> }から、パラメータθの分布を求める。例えば、第2種類予測分布データ算出部194は、パラメータθの分布がガウス分布など特定の分布に従うと仮定し、サンプルデータから平均値および分散など分布の特徴量を算出する。
あるいは、関係性分析装置100が、ステップS44で得られたサンプルデータをそのままユーザに提示する(例えば、グラフで表示する)ようにしてもよい。ユーザは、サンプルデータそのものを参照することで、信頼区間およびデータそのものの信頼性を、より高精度に判断することができる。また、例えばデータの山が複数ある場合または非対称な分布の場合など、特定の分布でサンプルデータを捉えられない場合、関係性分析装置100が、サンプルデータをそのままユーザに提示することで、ユーザは、データの分布を把握し得る。
また、第2種類予測分布データ算出部194が、パラメータのサンプルデータに加えて、あるいは代えて、ステップS47で得られたデータYのサンプルデータY<6>n の分布を求めるようにしてもよい。
ステップS48の後、関係性分析装置100は、図8の処理を終了する。
以上のように、カーネル平均算出部191は、第1種類の観測データXと、第2種類サンプルデータ取得部182が取得した第2種類のサンプルデータY<1>n との下でのパラメータθの事後分布を示すカーネル平均μ^θ|XYを算出する。カーネル平均対応パラメータ算出部192は、カーネル平均算出部191が算出したカーネル平均μ^θ|XYに基づくパラメータθのサンプルデータ{θ<6> ,・・・,θ<6> }を算出する。パラメータ予測分布算出部193は、パラメータθのサンプルデータ{θ<6> ,・・・,θ<6> }を用いてデータYの予測分布のカーネル表現ν^y|YXを算出する。第2種類予測分布データ算出部194は、パラメータ予測分布算出部193が算出した予測分布のカーネル表現ν^y|YXを用いて、第2種類のデータ(データY)の予測分布に従うサンプルデータY<6>n を算出する。
このように、関係性分析装置100がサンプルデータを生成することで、サンプルデータからデータの分布を求めることができる。関係性分析装置100が、データの分布を求めるようにしてもよい。あるいは、関係性分析装置100がサンプルデータをユーザに提示し、ユーザがデータの分布を求めるようにしてもよい。
次に、関係性分析装置100の動作実験について説明する。
図9は、実験におけるシミュレーション対象の組立工程の例を示す図である。図9に示す組立工程では、組立装置が、上側部品、下側部品、および2つのねじの4つの部品を組み立てて製品を生成する。組立装置が組み立てた製品は検査装置に搬入される。検査装置は、製品が4つ搬入されると検査を行う。
この組立工程で、単位時間当たりの製品の生産量をデータXとし、X個(データXの値)の製品の出荷時間をデータYとする。また、パラメータの数は2とし、組立装置の作業時間をθ、検査装置の作業時間をθとする。
図10は、得られたXとYの関係を示す図である。図10のグラフの横軸はデータXを示し、縦軸はデータYを示す。また、点P31のような丸で観測データが示されている。
線L31は、関係性分析の結果得られたXとYの関係を示す線である。
線L31が階段状になっているのは、検査装置が、製品が4つ搬入されてから検査を行うことによる待ち時間が生じているものと考えられ、XとYとの関係を高精度に求められている。
図11は、実験で得られたパラメータの値を示す図である。図11のグラフの横軸はパラメータθを示し、縦軸はパラメータθを示す。
点P31は、パラメータの真の値を示す。点P32は、実験で得られたパラメータの値を示す。点P32は点P31に近く、パラメータ値を適切に算出できている。
図12は、共変量シフトの実験におけるパラメータ値の設定例を示す図である。
上述した組立工程のシミュレーションの実験で、Xの値が110を超えると、θ、θ共に値が大きくなる(組立および検査に時間を要する)ように、真のパラメータ値を設定する。
図13は、実験で得られたXとYの関係を示す図である。図13のグラフの横軸はデータXを示し、縦軸はデータYを示す。また、点P41のような丸で観測データが示されている。
観測データの分布が、q(X)=N(X|100,10)と、X=100を中心に分布しているのに対し、予測したい領域は、q1(X)=N(X|120,10)と、X=120の場合について予測したいとする。
線L41は、共変量シフトの処理を行わない場合に得られるXとYの関係を示す線である。線L42は、共変量シフトを行った場合に得られるXとYの関係を示す線である。
共変量シフトを行わない場合の線L41が、X=100付近のデータを精度よく近似しているのに対し、共変量シフトを行った場合の線L42は、X=120付近のデータを精度よく近似している。このように、共変量シフトに対応した結果を得られた。
また、図10の場合と同様、階段状の線を得られており、この点でもXとYとの関係を高精度に求められている。
図14は、共変量シフトの実験で得られたパラメータの値を示す図である。図11のグラフの横軸はパラメータθを示し、縦軸はパラメータθを示す。
点P51は、パラメータの真の値を示す。点P52は、共変量シフトによるパラメータの真の値を示す。点P53は、共変量シフトで得られたパラメータの値を示す。また、点P54等により、カーネルハーディングで得られたパラメータ値の分布が示されている。
点P53は、点P52に近く、パラメータ値を適切に算出できている。
また、カーネルハーディングで得られたパラメータ値の分布は、縦方向の分布が大きい。これにより、パラメータθの値の影響よりもパラメータθの値の影響の方が大きいことが示されている。また、カーネルハーディングで得られたパラメータ値の分布は、左肩上がりとなっている。これにより、パラメータθの値を改善すれば、多少の効率の改善は見込まれることが示されている。
このように、関係性分析装置100が求めるパラメータ値の分布を参照して、ボトルネック解析等の感度解析を行うことができる。
次に、図15を参照して本発明の実施形態の構成について説明する。
図15は、本発明の実施形態に係る関係性分析装置の構成の例を示す図である。図15に示す関係性分析装置10は、パラメータサンプルデータ算出部11と、第2種類サンプルデータ取得部12と、パラメータ値決定部13とを備える。
かかる構成にて、パラメータサンプルデータ算出部11は、第1種類のデータの入力を受けて第2種類のデータを出力するシミュレータのパラメータに関して仮設定された分布に基づいて、前記パラメータのサンプルデータを複数算出する。第2種類サンプルデータ取得部12は、前記第1種類の観測データと前記パラメータのサンプルデータとを前記シミュレータに入力して、前記パラメータのサンプルデータ毎に前記第2種類のサンプルデータを取得する。パラメータ値決定部13は、前記第2種類の観測データと、算出された前記第2種類のサンプルデータとの差異に基づいて前記パラメータのサンプルデータの各々に対する重みを算出し、得られた重みを用いて前記パラメータの値を算出する。
このように、関係性分析装置10では、シミュレータのパラメータのサンプルデータを生成し、生成したサンプルデータをシミュレータに入力して評価することで、モデルの関数を微分する必要なしにパラメータの値を決定することができる。関係性分析装置10によればこの点で、関係性分析について、モデルの関数を微分できない場合に対応可能である。
なお、制御部180の機能の全部または一部を実行するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより各部の処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
この出願は、2018年6月7日に出願された日本国特願2018−109878を基礎とする優先権を主張し、その開示の全てをここに取り込む。
本発明は、関係性分析装置、関係性分析方法および記録媒体に適用してもよい。
100 関係性分析装置
110 入出力部
170 記憶部
180 制御部
181 パラメータサンプルデータ算出部
182 第2種類サンプルデータ取得部
183 パラメータ値決定部
191 カーネル平均算出部
192 カーネル平均対応パラメータ算出部
193 パラメータ予測分布算出部
194 第2種類予測分布データ算出部
本発明は、関係性分析装置、関係性分析方法およびプログラムに関する。
本発明の第3の態様によれば、プログラムは、コンピュータに、第1種類のデータの入力を受けて第2種類のデータを出力するシミュレータのパラメータに関して仮設定された分布に基づいて、前記パラメータの複数のサンプルデータを算出し、前記第1種類の観測データと前記パラメータの複数のサンプルデータの各々とを前記シミュレータに入力して、前記パラメータの複数のサンプルデータの各々毎に前記第2種類のサンプルデータを算出し、前記第2種類の観測データと、算出された前記第2種類のサンプルデータとの差異に基づいて前記パラメータの複数のサンプルデータの各々に対する重みを算出し、算出された前記重みを用いて前記パラメータの値を算出する、ことを実行させるためのプログラムである

Claims (4)

  1. 第1種類のデータの入力を受けて第2種類のデータを出力するシミュレータのパラメータに関して仮設定された分布に基づいて、前記パラメータの複数のサンプルデータを算出するパラメータサンプルデータ算出部と、
    前記第1種類の観測データと前記パラメータの複数のサンプルデータの各々とを前記シミュレータに入力して、前記パラメータの複数のサンプルデータの各々毎に前記第2種類のサンプルデータを取得する第2種類サンプルデータ取得部と、
    前記第2種類の観測データと、算出された前記第2種類のサンプルデータとの差異に基づいて前記パラメータの複数のサンプルデータの各々に対する重みを算出し、算出された前記重みを用いて前記パラメータの値を算出するパラメータ値決定部と、
    を備える関係性分析装置。
  2. 前記パラメータ値決定部は、
    前記第1種類の観測データと、算出された前記第2種類のサンプルデータとの下での前記パラメータの事後分布を示すカーネル平均を算出するカーネル平均算出部と、
    前記カーネル平均に基づく前記パラメータのサンプルデータを算出するカーネル平均対応パラメータ算出部と、
    前記カーネル平均に基づく前記パラメータのサンプルデータを用いて前記パラメータの予測分布のカーネル表現を算出するパラメータ予測分布算出部と、
    前記パラメータの予測分布のカーネル表現を用いて、前記第2種類のデータの予測分布に従うサンプルデータを算出する第2種類予測分布データ算出部と、
    を備える請求項1に記載の関係性分析装置。
  3. 第1種類のデータの入力を受けて第2種類のデータを出力するシミュレータのパラメータに関して仮設定された分布に基づいて、前記パラメータの複数のサンプルデータを算出し、
    前記第1種類の観測データと前記パラメータの複数のサンプルデータの各々とを前記シミュレータに入力して、前記パラメータの複数のサンプルデータの各々毎に前記第2種類のサンプルデータを算出し、
    前記第2種類の観測データと、算出された前記第2種類のサンプルデータとの差異に基づいて前記複数のパラメータのサンプルデータの各々に対する重みを算出し、
    算出された前記重みを用いて前記パラメータの値を算出する、
    ことを含む関係性分析方法。
  4. コンピュータに、
    第1種類のデータの入力を受けて第2種類のデータを出力するシミュレータのパラメータに関して仮設定された分布に基づいて、前記パラメータの複数のサンプルデータを算出し、
    前記第1種類の観測データと前記パラメータの複数のサンプルデータの各々とを前記シミュレータに入力して、前記パラメータの複数のサンプルデータの各々毎に前記第2種類のサンプルデータを算出し、
    前記第2種類の観測データと、算出された前記第2種類のサンプルデータとの差異に基づいて前記パラメータの複数のサンプルデータの各々に対する重みを算出し、
    算出された前記重みを用いて前記パラメータの値を算出する、
    ことを実行させるためのプログラムを記憶した記録媒体。
JP2020523195A 2018-06-07 2019-06-07 関係性分析装置、関係性分析方法およびプログラム Active JP7017711B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2018109878 2018-06-07
JP2018109878 2018-06-07
PCT/JP2019/022670 WO2019235603A1 (ja) 2018-06-07 2019-06-07 関係性分析装置、関係性分析方法および記録媒体

Publications (2)

Publication Number Publication Date
JPWO2019235603A1 true JPWO2019235603A1 (ja) 2021-07-08
JP7017711B2 JP7017711B2 (ja) 2022-02-09

Family

ID=68770280

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020523195A Active JP7017711B2 (ja) 2018-06-07 2019-06-07 関係性分析装置、関係性分析方法およびプログラム

Country Status (3)

Country Link
US (1) US20210224664A1 (ja)
JP (1) JP7017711B2 (ja)
WO (1) WO2019235603A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US12086697B2 (en) * 2018-06-07 2024-09-10 Nec Corporation Relationship analysis device, relationship analysis method, and recording medium for analyzing relationship between a plurality of types of data using kernel mean learning
JP7140191B2 (ja) * 2018-07-31 2022-09-21 日本電気株式会社 情報処理装置、制御方法、及びプログラム
EP3839781B1 (en) * 2018-10-02 2024-09-11 Nippon Telegraph And Telephone Corporation Calculation device, calculation method, and calculation program
US20210357699A1 (en) * 2020-05-14 2021-11-18 International Business Machines Corporation Data quality assessment for data analytics

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11296561A (ja) * 1998-04-07 1999-10-29 Toshiba Corp ワーストケース・モデルパラメータ生成方法及び装置
JP2012149920A (ja) * 2011-01-17 2012-08-09 Toshiba Denpa Syst Eng Kk 降水強度推定システム及び降水強度推定方法
WO2016194051A1 (ja) * 2015-05-29 2016-12-08 株式会社日立製作所 確率的システムの注目指標の統計量を最小化するパラメータセットを探索するシステム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11296561A (ja) * 1998-04-07 1999-10-29 Toshiba Corp ワーストケース・モデルパラメータ生成方法及び装置
JP2012149920A (ja) * 2011-01-17 2012-08-09 Toshiba Denpa Syst Eng Kk 降水強度推定システム及び降水強度推定方法
WO2016194051A1 (ja) * 2015-05-29 2016-12-08 株式会社日立製作所 確率的システムの注目指標の統計量を最小化するパラメータセットを探索するシステム

Also Published As

Publication number Publication date
JP7017711B2 (ja) 2022-02-09
US20210224664A1 (en) 2021-07-22
WO2019235603A1 (ja) 2019-12-12

Similar Documents

Publication Publication Date Title
JP7017712B2 (ja) 関係性分析装置、関係性分析方法およびプログラム
JP7017711B2 (ja) 関係性分析装置、関係性分析方法およびプログラム
Giagopoulos et al. Structural health monitoring and fatigue damage estimation using vibration measurements and finite element model updating
EP2342603A2 (en) Method and apparatus for creating state estimation models in machine condition monitoring
JP7063389B2 (ja) 処理装置、処理方法、およびプログラム
JP7058386B2 (ja) 分析装置、分析方法およびプログラム
JP7164799B2 (ja) 分析装置、分析方法およびプログラム
Sengupta et al. An improved Bayesian model updating framework by enhanced iterative model reduction technique in time domain
Tsompanakis et al. Soft computing techniques in parameter identification and probabilistic seismic analysis of structures
Liu et al. Software reliability forecasting: singular spectrum analysis and ARIMA hybrid model
Souza et al. Impact of damping models in damage identification
Haj Mohamad et al. Detection of cracks in a rotating shaft using density characterization of orbit plots
Warner et al. Probabilistic damage characterization using the computationally-efficient Bayesian approach
Warner et al. A computationally-efficient inverse approach to probabilistic strain-based damage diagnosis
US11367020B2 (en) Signal selection device, learning device, and signal selection method and program
Bui et al. Modal analysis of slow varying non-stationary vibration by model updating with Schur complement
Coble et al. A data-driven framework for predicting machining stability: employing simulated data, operational modal analysis, and enhanced transfer learning
Stepashko et al. Technology of Quantitative Integral Assessment and Forecast of a Complex Economic System Performance
Fan et al. Damage State Estimation via Multi-fidelity Gaussian Process Regression Models for Active-Sensing Structure Health Monitoring
CN110187340B (zh) 一种基于熵的探测目标的信息表征方法及系统
Singh et al. Inception Time Model for Structural Damage Detection Using Vibration Measurements
JP2005267474A (ja) マハラノビス距離を利用した異常原因診断方法及びプログラム
van Oijen et al. Introduction to Bayesian Science
Hernández et al. Nonlinear Models in Optimal Instrumentation. A Fast Technique for Precision Evaluation
Castello et al. Bayesian model selection for structural damage identification: comparative analysis of marginal likelihood estimators

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201204

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201204

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20201204

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211221

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220113

R150 Certificate of patent or registration of utility model

Ref document number: 7017711

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350