JP2021179906A - 影響度算出プログラム、影響度算出装置、影響度算出方法 - Google Patents

影響度算出プログラム、影響度算出装置、影響度算出方法 Download PDF

Info

Publication number
JP2021179906A
JP2021179906A JP2020085979A JP2020085979A JP2021179906A JP 2021179906 A JP2021179906 A JP 2021179906A JP 2020085979 A JP2020085979 A JP 2020085979A JP 2020085979 A JP2020085979 A JP 2020085979A JP 2021179906 A JP2021179906 A JP 2021179906A
Authority
JP
Japan
Prior art keywords
influence
degree
gradient value
data
sampling points
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2020085979A
Other languages
English (en)
Inventor
智 雨宮
Satoshi Amemiya
利雄 伊東
Toshio Ito
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2020085979A priority Critical patent/JP2021179906A/ja
Priority to EP21164861.3A priority patent/EP3910564A1/en
Priority to US17/220,398 priority patent/US20210357478A1/en
Publication of JP2021179906A publication Critical patent/JP2021179906A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Complex Calculations (AREA)

Abstract

【課題】影響度を適切に算出できる影響度算出プログラム、影響度算出装置、影響度算出方法を提供する。【解決手段】影響度算出プログラムは、非線形回帰モデルの複数のサンプリング点について勾配値を算出し、前記複数のサンプリング点の各々について、各サンプリング点における勾配値と、各サンプリング点の周辺の所定範囲内のサンプリング点の勾配値との二乗平均平方根を影響度として算出する処理をコンピュータに実行させる。【選択図】図3

Description

本発明は、影響度算出プログラム、影響度算出装置、影響度算出方法に関する。
従来より、複数の試料の各々について分析装置により収集された、該分析装置が備えるマルチチャンネル検出器の複数のチャンネルの出力値から成る多次元の分析データに対して統計的機械学習を用いた解析手法を適用することにより該分析データを処理する方法がある。既知の試料について得られた分析データを表す非線形な回帰関数又は判別関数を算出し、当該算出された非線形な回帰関数又は判別関数の微分値から、該非線形回帰関数又は前記非線形判別関数に対する、前記既知試料の分析データを構成する複数のチャンネルの出力値の各々の寄与度を算出する。そして、該寄与度に基づき、前記検出器の複数のチャンネルの中から、未知試料について得られた分析データの処理に用いるチャンネルを決定する(例えば、特許文献1参照)。
国際公開第2018/025361号
ところで、従来の分析データを処理する方法は、各チャンネルについて、寄与度(影響度又は感度と同義)を非線形な回帰関数又は判別関数の全体の微分値から求めているため、例えば関数の周波数が高い場合又はノイズの影響が大きい場合のように変動が大きい場合に、適切な影響度を算出できないおそれがあった。
そこで、影響度を適切に算出できる影響度算出プログラム、影響度算出装置、影響度算出方法を提供することを目的とする。
本発明の実施形態の影響度算出プログラムは、非線形回帰モデルの複数のサンプリング点について勾配値を算出し、前記複数のサンプリング点の各々について、各サンプリング点における勾配値と、各サンプリング点の周辺の所定範囲内のサンプリング点の勾配値との二乗平均平方根を影響度として算出する処理をコンピュータに実行させる。
影響度を適切に算出できる影響度算出プログラム、影響度算出装置、影響度算出方法を提供することができる。
コンピュータシステム20を示す図である。 コンピュータシステム20の本体部21内の要部の構成を説明するブロック図である。 影響度算出プログラムがインストールされた分析サーバ100を示す図である。 周辺の所定範囲内のサンプリング点の勾配の取得方法を示す図である。 データx1、x2の分布の一例を示す図である。 データx1、x2について求めた影響度を示す図である。 データx1の分布の一例を示す図である。 データx1、x2について求めた影響度を示す図である。 データx1の分布の一例を示す図である。 データx1、x2について求めた影響度を示す図である。 データx1の分布の一例を示す図である。 データx1、x2について求めた影響度を示す図である。 分析サーバ100が実行する処理を示すフローチャートである。
以下、本発明の影響度算出プログラム、影響度算出装置、影響度算出方法を適用した実施形態について説明する。
<実施形態>
図1は、コンピュータシステム20を示す図である。コンピュータシステム20は、本体部21、ディスプレイ22、キーボード23、マウス24、及びモデム25を含み、実施形態の影響度算出プログラムがインストールされるサーバとして利用される。
本体部21は、CPU(Central Processing Unit:中央演算装置)、HDD(Hard Disk Drive:ハードディスクドライブ)、及びディスクドライブ等を内蔵する。ディスプレイ22は、本体部21からの指示により画面22A上に処理結果等を表示する。ディスプレイ22は、例えば、液晶モニタであればよい。キーボード23は、コンピュータシステム20に種々の情報を入力するための入力部である。マウス24は、ディスプレイ22の画面22A上の任意の位置を指定する入力部である。モデム25は、外部のデータベース等にアクセスして他のコンピュータシステムに記憶されているプログラム等をダウンロードする。
実施形態の影響度算出プログラムは、ディスク27等の可搬型記録媒体に格納されるか、モデム25等の通信装置を使って他のコンピュータシステムの記録媒体26からダウンロードされ、コンピュータシステム20に入力されてコンパイルされる。また、可搬型記録媒体は、ICカードメモリ、フロッピー(登録商標)ディスク等の磁気ディスク、光磁気ディスク、CD−ROM、USB(Universal Serial Bus)メモリ等であってもよい。また、可搬型記録媒体の代わりに、モデム25又はLAN等の通信装置を介して接続されるコンピュータシステムでアクセス可能なコンピュータ読み取り可能な記録媒体を用いてもよい。
図2は、コンピュータシステム20の本体部21内の要部の構成を説明するブロック図である。本体部21は、バス30によって接続されたCPU31、RAM又はROM等を含むメモリ部32、ディスク27用のディスクドライブ33、及びハードディスクドライブ(HDD)34を含む。なお、コンピュータシステム20は、図1及び図2に示す構成のものに限定されず、各種周知の要素を付加してもよく、又は代替的に用いてもよい。
図3は、影響度算出プログラムがインストールされた分析サーバ100を示す図である。分析サーバ100は、影響度算出装置の一例である。分析サーバ100が影響度算出プログラムを実行することにより、影響度算出方法が実現される。
図3には、分析サーバ100の他にデータベース(DB:Data Base)サーバ50を示す。分析サーバ100及びDBサーバ50は、ともに図1及び図2に示すコンピュータシステム20で実現される。DBサーバ50は、様々な事象の測定値等のデータを格納するデータベースを有する。様々な事象の測定値等は、どのようなものであってもよく、例えば、EV(Electric Vehicle:電気自動車)又は船舶の種々のセンサの測定値であってもよく、特定の異常を検出するための測定値等であってもよい。DBサーバ50は、分析サーバ100から要求された測定値等のデータを分析サーバ100に伝送する。
分析サーバ100は、データクレンジング部110及び診断予測部120を含む。診断予測部120は、図3に示すように多くの処理部(130〜180)を含む。データクレンジング部110、診断予測部120、及び診断予測部120の内部の処理部(130〜180)は、分析サーバ100が実行するプログラムの機能(ファンクション)を機能ブロックとして示したものである。データクレンジング部110、診断予測部120、及び診断予測部120の内部の処理部(130〜180)は、データ等を格納するメモリを含む。メモリは、図2に示すメモリ部32、ディスク27用のディスクドライブ33、及びハードディスクドライブ34のうちの少なくともいずれか1つによって実現される。
データクレンジング部110は、DBサーバ50から伝送されたデータのクレンジング(前処理)を行う。データクレンジング部110は、例えば、ノイズ、エラー等の除去、サイズ、次元の統一等の処理を行い、診断予測部120に出力する。
診断予測部120は、データクレンジング部110から入力される学習用のデータ(以下、学習データと称す)に対して診断、予測を行う。学習データは、(x,y),(x,y),・・・,(x,y)である。診断予測部120は、状態推定部130と予測部180を有する。状態推定部130は、学習部140と分析部150を有する。
学習部140は、教師ありモデリング部140Aと教師なしモデリング部140Bとを有する。学習部140には、データクレンジング部110から学習データが入力される。教師ありモデリング部140Aは、分類モデリング部141A、回帰モデリング部142Aを有する。分類モデリング部141Aは、教師あり学習によって学習データから分類モデルを生成する。
回帰モデリング部142Aは、教師あり学習によって学習データから非線形回帰モデルを生成する処理部であり、カーネル回帰モデル生成部142A1と重回帰モデル生成部142A2とを有する。カーネル回帰モデル生成部142A1は、教師あり学習によって学習データからK近傍交叉カーネル回帰モデルを生成する。重回帰モデル生成部142A2は、教師あり学習によって学習データから重回帰モデルを生成する。教師なしモデリング部140Bは、教師なし学習によって学習データから所定の回帰モデル又は分類モデル等を生成する。
学習部140は、分類モデリング部141A、カーネル回帰モデル生成部142A1、重回帰モデル生成部142A2、又は教師なしモデリング部140Bによって生成されたモデルf(x)を表すデータを分析部150に伝送する。
分析部150は、影響度分析部160と回帰推定部170を有する。分析部150には、学習部140からモデルf(x)を表すデータが伝送される。影響度分析部160は、勾配値算出部161、周辺勾配値取得部162、影響度算出部163を有する。
勾配値算出部161は、学習部140から入力されるモデルf(x)と、回帰推定部170から入力される推定値y=f(xt)及び学習データxtとに基づいて、モデルf(x)の複数のサンプリング点(測定点)の各々について勾配値∂f(x)/∂xを算出する。サンプリング点は、学習データ(x,y),(x,y),・・・,(x,y)の各々が表す点である。なお、勾配値算出部161の処理の一例については式(2)〜(4)等を用いて後述する。
周辺勾配値取得部162は、勾配値算出部161によって複数のサンプリン点のすべてについて算出された勾配値∂f(x)/∂xを勾配値算出部161から取得し、各サンプリング点の周辺の所定範囲内のサンプリング点の勾配値∂f(x)/∂xを取得する。なお、このような処理の一例については図4及び式(6)等を用いて後述する。
影響度算出部163は、複数のサンプリング点の各々について、勾配値算出部161によって算出された勾配値∂f(x)/∂xと、周辺勾配値取得部162によって各サンプリング点について取得された周辺の所定範囲内のサンプリング点の勾配値∂f(x)/∂xとに基づいて、影響度Stを算出する。影響度算出部163は、各サンプリング点について影響度Stを算出し、予測部180に出力する。なお、このような処理の一例については式(7)、(8)等を用いて後述する。
回帰推定部170は、データクレンジング部110から入力される学習データxtと、学習部140から入力されるモデルf(x)とに基づいて、推定値y=f(xt)を生成し、推定値y=f(xt)と学習データxtを勾配値算出部161と予測部180に出力する。
予測部180は、影響度算出部163から入力される各サンプリング点における影響度Stと、回帰推定部170から入力される推定値y=f(xt)及び学習データxtとに基づいて、影響度Stを目的変数に対する説明変数の影響度とした場合における異常の原因を推定(予測)する。また、予測部180は、推定した原因を用いて、さらに、EV又は船舶等の移動体の状態(動き等の状態)を予測し、さらに移動体の部品等の各部の寿命を予測してもよい。
分析サーバ100では、一例としてEV又は船舶等の移動体の各部の動き等を表す測定値等を表すデータから、各部の動き等を表す目的変数を推定するための非線形回帰モデルを生成し、目的変数に影響を与える説明変数を推定する影響度を各サンプリング点について算出する。非線形回帰モデルの生成は、カーネル回帰モデル生成部142A1が行い、影響度の算出は影響度分析部160が行う。以下、勾配値の算出方法、周辺の所定範囲内のサンプリング点の勾配の取得方法、影響度の算出方法、影響度を用いた場合の効果等について順番に説明する。
<勾配値の算出方法>
カーネル回帰モデル生成部142A1が生成するK近傍交叉カーネル回帰モデル(ガウスカーネル回帰モデル)は、次式(1)で表すことができる。式(1)で表されるK近傍交叉カーネル回帰モデルは、モデルf(x)として勾配値算出部161に入力される。
Figure 2021179906
勾配値算出部161は、K近傍交叉カーネル回帰モデルの複数のサンプリング点の各々について、次式(2)に基づいて勾配値∂f(x)/∂xを算出する。なお、Exmは平均値を求めることを表し、N(x|xi,σΣi)は、xiの正規分布を表す。σΣiは、xiの分布の分散を表す。また、mはデータセットXmに含まれるxiのデータ番号を表し、MはデータセットXmに含まれるxiのデータ数を表す。
Figure 2021179906
ただし、αi(x)、β(x)は次式(3)、(4)で表される。
Figure 2021179906
Figure 2021179906
<周辺の所定範囲内のサンプリング点の勾配の取得方法>
周辺勾配値取得部162は、勾配値算出部161がK近傍交叉カーネル回帰モデルの複数のサンプリング点の各々について勾配値∂f(x)/∂xを算出する場合には、サンプリング点からK近傍距離の範囲内にある1又は複数のサンプリング点について勾配値算出部161によって算出された1又は複数の勾配値∂f(x)/∂xを取得する。サンプリング点からK近傍距離の範囲内には複数のサンプリング点があると考えられるため、ここでは複数の勾配値∂f(x)/∂xが取得される。
ここで、勾配値算出部161によって算出される勾配値∂f(xh)/∂xhが次式(5)で表されるとする。
Figure 2021179906
このような場合に、周辺勾配値取得部162は、K近傍距離の範囲(h−km〜h+km)内にある複数のサンプリング点について次の(6)で表される複数の勾配値を取得する。
Figure 2021179906
また、周辺勾配値取得部162は、図4に示す手法によって周辺の所定範囲内のサンプリング点の勾配値∂f(x)/∂xを取得してもよい。このような手法は、勾配値算出部161がK近傍交叉カーネル回帰モデル以外の非線形回帰モデルについての複数のサンプリング点の各々について勾配値∂f(x)/∂xを算出する場合に行えばよいが、K近傍交叉カーネル回帰モデルの複数のサンプリング点の各々について勾配値∂f(x)/∂xを算出する場合に行ってもよい。
図4は、周辺の所定範囲内のサンプリング点の勾配の取得方法を示す図である。図4(A)、(B)には、横軸x1、縦軸x2とした場合に、あるサンプリング点を白丸(○)で示し、周辺にあるサンプリング点を黒丸(●)で示す。
ここでは、サンプリング点の周囲の所定数のサンプリング点が入る範囲を所定範囲とする。一例として所定数が5の場合の取得方法を示す。図4(A)に示すように、白丸で示すサンプリング点の周囲のサンプリング点の密度が比較的低い場合には、所定範囲は比較的広くなり、図4(B)に示すように、白丸で示すサンプリング点の周囲のサンプリング点の密度が比較的高い場合には、所定範囲は比較的狭くなる。所定範囲は、白丸のサンプリング点を中心とする円の範囲である。図4(A)では周辺のサンプリング点は5つであり、図4(B)では6つである。図4(B)に示すように、周囲のサンプリング点の数は5つよりも多くなる場合がある。
<影響度の算出方法>
影響度算出部163は、各サンプリング点についての勾配値(式(5)参照)と、K近傍距離の範囲内にある複数のサンプリング点についての勾配値((6)参照)とを取得した場合には、次式(7)に従って影響度Sjを算出する。影響度Sjは、勾配値(式(5)参照)と、K近傍距離の範囲内にある複数のサンプリング点についての勾配値((6)参照)との二乗平均平方根として算出される。
Figure 2021179906
また、影響度算出部163は、周辺勾配値取得部162によって図4に示す手法によって周辺の所定範囲内のサンプリング点の勾配値が取得された場合には、次式(8)に従って、各サンプリング点(図4(A),(B)の白丸)の勾配値と、各サンプリング点の周辺の所定範囲内のサンプリング点(図4(A),(B)の黒丸)の勾配値∂f(x)/∂xとの二乗平均平方根として影響度Sjを算出する。
Figure 2021179906
<影響度を用いた場合の効果>
ここで、図5及び図6を用いて影響度の効果について説明する。図5は、データx1、x2の分布の一例を示す図である。図5(A)に示す点はデータx1を示す。また、図5(A)の推定値yを破線で示し、すべてのデータx1における推定値yの勾配値∂y/∂x1を一点鎖線で示す。すべてのデータx1における推定値yの勾配値∂y/∂x1は、推定値yを表す関数の全体の微分値である。
また、図5(B)に示す点はデータx2を示す。また、図5(B)の推定値yを破線で示し、すべてのデータx2における推定値yの勾配値∂y/∂x2を一点鎖線で示す。すべてのデータx2における推定値yの勾配値∂y/∂x2は、推定値yを表す関数の全体の微分値である。推定値yは、図5(A)に示す推定値yと同一である。
ここで、推定値yが次式(9)で表されることとし、推定値yについての影響度を求める。
Figure 2021179906
式(9)において、x2よりもx1の影響を大きくするために、重みw1=0.95、w2=0.05とする。aは平均が0であり、分散が0.2である。
図6は、データx1、x2について求めた影響度を示す図である。図6(A)には、K近傍交叉カーネル回帰モデル(ガウスカーネル回帰モデル)の各サンプリング点についての勾配値∂f(x)/∂xと、サンプリング点からK近傍距離の範囲内の複数のサンプリング点についての複数の勾配値∂f(x)/∂xとから算出された影響度Sを示す。図6(A)において、横軸はデータx1、x2、縦軸は影響度Sを示す。K近傍距離は30とした。図6において、実線はデータx1の影響度を示し、破線はデータx2の影響度を示す。
また、図6(B)には、比較用に、推定値yを表す関数の全体の微分値を用いて求めた影響度を示す。図6(B)において、横軸はデータx1、x2、縦軸は影響度Sを示す。図6(B)において、実線はデータx1の影響度を示し、破線はデータx2の影響度を示す。
図6(A)では、データx1の影響度Sはデータx2の影響度Sよりも大きく、適切に算出されていることが分かる。一方、図6(B)では、データx1の影響度がデータx2の影響度よりも小さくなっている部分があり、適切に算出されていないことが分かる。
次に、図7及び図8を用いて影響度の効果について説明する。図7は、データx1の分布の一例を示す図である。図7(A)に示す点はデータx1を示す。また、図7(A)の推定値yを破線で示し、すべてのデータx1における推定値yの勾配値∂y/∂x1を実線で示す。すべてのデータx1における推定値yの勾配値∂y/∂x1は、推定値yを表す関数の全体の微分値である。なお、ここでは示さないが、データx2についても分布が得られていることとする。
ここで、推定値yは次式(10)で表される。式(10)で示される推定値yは、周波数が比較的高い高周波関数である。以下では推定値yについての影響度を求める。
Figure 2021179906
式(10)において、x2よりもx1の影響を大きくするために、重みw1=0.95、w2=0.05とする。aは平均が0であり、分散が0.1である。
図8は、データx1、x2について求めた影響度を示す図である。図8(A)には、K近傍交叉カーネル回帰モデル(ガウスカーネル回帰モデル)の各サンプリング点についての勾配値∂f(x)/∂xと、サンプリング点からK近傍距離の範囲内の複数のサンプリング点についての複数の勾配値∂f(x)/∂xとから算出された影響度Sを示す。図8(A)において、横軸はデータx1、x2、縦軸は影響度Sを示す。K近傍距離は30とした。図8において、実線はデータx1の影響度を示し、破線はデータx2の影響度を示す。
また、図8(B)には、比較用に、推定値yを表す関数の全体の微分値を用いて求めた影響度を示す。図8(B)において、横軸はデータx1、x2、縦軸は影響度Sを示す。図8(B)において、実線はデータx1の影響度を示し、破線はデータx2の影響度を示す。
図8(A)では、データx1の影響度Sはデータx2の影響度Sよりも大きく、適切に算出されていることが分かる。一方、図8(B)では、データx1の影響度がデータx2の影響度よりも小さくなる部分が5箇所あり、適切に算出されていないことが分かる。例えば、振動の激しい非線形回帰モデルを作った場合、勾配は大きく変動するため、影響度も大きく変動する。実施形態の影響度算出プログラムによる手法では、影響度Sの変動を抑制できるとともにデータx1、x2の影響度の反転も生じていない。
次に、図9及び図10を用いて影響度の効果について説明する。図9は、データx1の分布の一例を示す図である。図9(A)に示す点はデータx1を示す。また、図9(A)の推定値yを破線で示し、すべてのデータx1における推定値yの勾配値∂y/∂x1を実線で示す。すべてのデータx1における推定値yの勾配値∂y/∂x1は、推定値yを表す関数の全体の微分値である。なお、ここでは示さないが、データx2についても分布が得られていることとする。
ここで、推定値yは次式(11)で表される。式(11)で示される推定値yは、データx1、x2のノイズの影響が比較的高い関数である。以下では推定値yについての影響度を求める。
Figure 2021179906
式(11)において、x2よりもx1の影響を大きくするために、重みw1=0.7、w2=0.3とする。aは平均が0であり、分散が0.1である。
図10は、データx1、x2について求めた影響度を示す図である。図10(A)には、K近傍交叉カーネル回帰モデル(ガウスカーネル回帰モデル)の各サンプリング点についての勾配値∂f(x)/∂xと、サンプリング点からK近傍距離の範囲内の複数のサンプリング点についての複数の勾配値∂f(x)/∂xとから算出された影響度Sを示す。図10(A)において、横軸はデータx1、x2、縦軸は影響度Sを示す。K近傍距離は100とした。図10において、実線はデータx1の影響度を示し、破線はデータx2の影響度を示す。
また、図10(B)には、比較用に、推定値yを表す関数の全体の微分値を用いて求めた影響度を示す。図10(B)において、横軸はデータx1、x2、縦軸は影響度Sを示す。図10(B)において、実線はデータx1の影響度を示し、破線はデータx2の影響度を示す。
図10(A)では、データx1の影響度Sはデータx2の影響度Sよりも大きく、適切に算出されていることが分かる。一方、図10(B)では、データx1の影響度がデータx2の影響度よりも小さくなる部分が2箇所あり、適切に算出されていないことが分かる。例えば、ノイズの影響の大きい非線形回帰モデルを作った場合、勾配は大きく変動するため、影響度も大きく変動する。実施形態の影響度算出プログラムによる手法では、影響度Sの変動を抑制できるとともにデータx1、x2の影響度の反転が生じていない。
次に、図11及び図12を用いて影響度の効果について説明する。図11は、データx1の分布の一例を示す図である。図11(A)に示す点はデータx1を示す。また、図11(A)の推定値yを破線で示し、すべてのデータx1における推定値yの勾配値∂y/∂x1を実線で示す。すべてのデータx1における推定値yの勾配値∂y/∂x1は、推定値yを表す関数の全体の微分値である。なお、ここでは示さないが、データx2についても分布が得られていることとする。
ここで、推定値yは次式(12)で表される。式(12)で示される推定値yは、データx1、x2のノイズの影響が比較的低い関数である。以下では推定値yについての影響度を求める。
Figure 2021179906
式(12)において、x2よりもx1の影響を大きくするために、重みw1=0.95、w2=0.05とする。aは平均が0であり、分散が0.1である。
図12は、データx1、x2について求めた影響度を示す図である。図12(A)には、K近傍交叉カーネル回帰モデル(ガウスカーネル回帰モデル)の各サンプリング点についての勾配値∂f(x)/∂xと、サンプリング点からK近傍距離の範囲内の複数のサンプリング点についての複数の勾配値∂f(x)/∂xとから算出された影響度Sを示す。図12(A)において、横軸はデータx1、x2、縦軸は影響度Sを示す。K近傍距離は100とした。図12において、実線はデータx1の影響度を示し、破線はデータx2の影響度を示す。
また、図12(B)には、比較用に、推定値yを表す関数の全体の微分値を用いて求めた影響度を示す。図12(B)において、横軸はデータx1、x2、縦軸は影響度Sを示す。図12(B)において、実線はデータx1の影響度を示し、破線はデータx2の影響度を示す。
図12(A)では、データx1の影響度Sはデータx2の影響度Sよりも大きく、適切に算出されていることが分かる。また、図12(B)においても、データx1の影響度Sはデータx2の影響度Sよりも大きく、適切に算出されている。ただし、実施形態の影響度算出プログラムで計算した図12(A)の方が全体にわたってより均等にデータx1の影響度Sはデータx2の影響度Sよりも大きい。このため、例えば、振動の比較的少ない非線形回帰モデルを作った場合、勾配は大きく変動せず、影響度も大きく変動しないが、このような非線形回帰モデルにおいても、実施形態の影響度算出プログラムによる手法では、影響度Sの変動を抑制できるとともにデータx1、x2の影響度の反転が生じない適切な影響度Sを算出することができる。
図13は、分析サーバ100が実行する処理を示すフローチャートである。前提条件として、カーネル回帰モデル生成部142A1がK近傍交叉カーネル回帰モデルを生成していることとする。
処理がスタートすると、勾配値算出部161は、非線形回帰モデルの複数のサンプリング点について勾配値を算出する(ステップS1)。
次に、周辺勾配値取得部162は、各サンプリング点の周辺の所定範囲内のサンプリング点の勾配値を取得する(ステップS2)。
次に、影響度算出部163は、複数のサンプリング点の各々について、各サンプリング点における勾配値と、各サンプリング点の周辺の所定範囲内のサンプリング点の勾配値との二乗平均平方根を影響度として算出する(ステップS3)。以上で一連の処理が終了する。
以上のように、実施形態によれば、勾配値(式(5)参照)と、K近傍距離の範囲内にある複数のサンプリング点についての勾配値((6)参照)との二乗平均平方根として影響度Sを算出するので、非線形回帰モデルに応じて適切な影響度を算出することができる。
したがって、影響度を適切に算出できる影響度算出プログラム、影響度算出装置、影響度算出方法を提供することができる。
なお、以上では、カーネル回帰モデル生成部142A1がカーネル回帰モデルを生成する形態について説明したが、カーネル回帰モデル生成部142A1の代わりにカーネル回帰モデル以外の非線形回帰モデルを生成する生成部を用いてもよい。
また、以上では、勾配値の算出にガウスカーネル回帰モデルとしてのK近傍交叉カーネル回帰モデルを用いる形態について説明したが、eバギングのカーネル回帰モデルを用いる場合には、式(1)〜(4)の代わりに次式(13)〜(16)を用いればよい。
eバギングのカーネル回帰モデルは、次式(13)で表される。
Figure 2021179906
勾配値∂f(x)/∂xは、次式(14)に従って算出すればよい。
Figure 2021179906
ただし、αi(x)、β(x)は次式(3)、(4)で表される。
Figure 2021179906
Figure 2021179906
また、ガウスカーネル回帰モデルとしてのK近傍交叉カーネル回帰モデルは、式(1)〜(4)の代わりに次式(17)〜(20)を用いて表すことができる。
ガウスカーネル回帰モデルとしてのK近傍交叉カーネル回帰モデルは、次式(17)、(18)で表すことができる。
Figure 2021179906
式(17)におけるαiは、次式(18)で表すことができる。
Figure 2021179906
式(17)、(18)で与えられるガウスカーネル回帰モデルにおけるカーネル関数k(x,xi)を次式(19)で表されるガウスカーネルとすると、勾配値は式(20)で与えられる。
Figure 2021179906
Figure 2021179906
ただし、β(x)は次の通りである。
Figure 2021179906
以上、本発明の例示的な実施形態の影響度算出プログラム、影響度算出装置、影響度算出方法について説明したが、本発明は、具体的に開示された実施形態に限定されるものではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。
以上の実施形態に関し、さらに以下の付記を開示する。
(付記1)
非線形回帰モデルの複数のサンプリング点について勾配値を算出し、
前記複数のサンプリング点の各々について、各サンプリング点における勾配値と、各サンプリング点の周辺の所定範囲内のサンプリング点の勾配値との二乗平均平方根を影響度として算出する
処理をコンピュータに実行させる、影響度算出プログラム。
(付記2)
前記処理は、各サンプリング点の周辺の前記所定範囲内のサンプリング点の勾配値を取得する処理をさらに含み、
前記二乗平均平方根を影響度として算出する処理は、前記複数のサンプリング点の各々について、前記勾配値を算出することによって算出された前記勾配値と、前記取得することによって取得された当該サンプリング点の周辺の前記所定範囲内のサンプリング点の勾配値との二乗平均平方根を影響度として算出する処理である、付記1に記載の影響度算出プログラム。
(付記3)
前記所定範囲は、各サンプリング点の周囲において所定数のサンプリング点が含まれる範囲である、付記1又は2に記載の影響度算出プログラム。
(付記4)
前記非線形回帰モデルは、K近傍交叉カーネル回帰モデルであり、
前記所定範囲は、各サンプリング点からK近傍距離で表される範囲である、付記1又は2に記載の影響度算出プログラム。
(付記5)
非線形回帰モデルの複数のサンプリング点について勾配値を算出する勾配値算出部と、
前記複数のサンプリング点の各々について、各サンプリング点における勾配値と、各サンプリング点の周辺の所定範囲内のサンプリング点の勾配値との二乗平均平方根を影響度として算出する影響度算出部と
を含む、影響度算出装置。
(付記6)
非線形回帰モデルの複数のサンプリング点について勾配値を算出し、
前記複数のサンプリング点の各々について、各サンプリング点における勾配値と、各サンプリング点の周辺の所定範囲内のサンプリング点の勾配値との二乗平均平方根を影響度として算出する
処理をコンピュータが実行する影響度算出方法。
100 分析サーバ
140 学習部
142A 回帰モデリング部
142A1 カーネル回帰モデル生成部
161 勾配値算出部
162 周辺勾配値取得部
163 影響度算出部

Claims (6)

  1. 非線形回帰モデルの複数のサンプリング点について勾配値を算出し、
    前記複数のサンプリング点の各々について、各サンプリング点における勾配値と、各サンプリング点の周辺の所定範囲内のサンプリング点の勾配値との二乗平均平方根を影響度として算出する
    処理をコンピュータに実行させる、影響度算出プログラム。
  2. 前記処理は、各サンプリング点の周辺の前記所定範囲内のサンプリング点の勾配値を取得する処理をさらに含み、
    前記二乗平均平方根を影響度として算出する処理は、前記複数のサンプリング点の各々について、前記勾配値を算出することによって算出された前記勾配値と、前記取得することによって取得された当該サンプリング点の周辺の前記所定範囲内のサンプリング点の勾配値との二乗平均平方根を影響度として算出する処理である、請求項1に記載の影響度算出プログラム。
  3. 前記所定範囲は、各サンプリング点の周囲において所定数のサンプリング点が含まれる範囲である、請求項1又は2に記載の影響度算出プログラム。
  4. 前記非線形回帰モデルは、K近傍交叉カーネル回帰モデルであり、
    前記所定範囲は、各サンプリング点からK近傍距離で表される範囲である、請求項1又は2に記載の影響度算出プログラム。
  5. 非線形回帰モデルの複数のサンプリング点について勾配値を算出する勾配値算出部と、
    前記複数のサンプリング点の各々について、各サンプリング点における勾配値と、各サンプリング点の周辺の所定範囲内のサンプリング点の勾配値との二乗平均平方根を影響度として算出する影響度算出部と
    を含む、影響度算出装置。
  6. 非線形回帰モデルの複数のサンプリング点について勾配値を算出し、
    前記複数のサンプリング点の各々について、各サンプリング点における勾配値と、各サンプリング点の周辺の所定範囲内のサンプリング点の勾配値との二乗平均平方根を影響度として算出する
    処理をコンピュータが実行する影響度算出方法。
JP2020085979A 2020-05-15 2020-05-15 影響度算出プログラム、影響度算出装置、影響度算出方法 Withdrawn JP2021179906A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2020085979A JP2021179906A (ja) 2020-05-15 2020-05-15 影響度算出プログラム、影響度算出装置、影響度算出方法
EP21164861.3A EP3910564A1 (en) 2020-05-15 2021-03-25 Impact calculation program, impact calculation device, and impact calculation method
US17/220,398 US20210357478A1 (en) 2020-05-15 2021-04-01 Non-transitory computer-readable storage medium, impact calculation device, and impact calculation method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020085979A JP2021179906A (ja) 2020-05-15 2020-05-15 影響度算出プログラム、影響度算出装置、影響度算出方法

Publications (1)

Publication Number Publication Date
JP2021179906A true JP2021179906A (ja) 2021-11-18

Family

ID=75223159

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020085979A Withdrawn JP2021179906A (ja) 2020-05-15 2020-05-15 影響度算出プログラム、影響度算出装置、影響度算出方法

Country Status (3)

Country Link
US (1) US20210357478A1 (ja)
EP (1) EP3910564A1 (ja)
JP (1) JP2021179906A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114485916B (zh) * 2022-01-12 2023-01-17 广州声博士声学技术有限公司 一种环境噪声监测方法、系统、计算机设备和存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150219530A1 (en) * 2013-12-23 2015-08-06 Exxonmobil Research And Engineering Company Systems and methods for event detection and diagnosis
US10373512B2 (en) * 2014-12-12 2019-08-06 William Marsh Rice University Mathematical language processing: automatic grading and feedback for open response mathematical questions
WO2017095413A1 (en) * 2015-12-03 2017-06-08 Hewlett Packard Enterprise Development Lp Incremental automatic update of ranked neighbor lists based on k-th nearest neighbors
CN109564199A (zh) 2016-08-03 2019-04-02 株式会社岛津制作所 分析数据处理方法和分析数据处理装置
US10911807B2 (en) * 2018-01-19 2021-02-02 Microsoft Technology Licensing, Llc Optimization of an automation setting through selective feedback
US20190272470A1 (en) * 2018-03-05 2019-09-05 Microsoft Technology Licensing, Llc Rule-Based Classification for Detected Anomalies
US11163270B2 (en) * 2019-07-10 2021-11-02 Lear Corporation Vehicle occupant data collection and processing with artificial intelligence

Also Published As

Publication number Publication date
EP3910564A1 (en) 2021-11-17
US20210357478A1 (en) 2021-11-18

Similar Documents

Publication Publication Date Title
US7565262B2 (en) Bayesian sensor estimation for machine condition monitoring
US10379001B2 (en) Detecting apparatus, detection method, and program
JP5984153B2 (ja) 情報処理装置、プログラム、及び情報処理方法
JP2022037241A (ja) 異常検出システム、異常検出方法、異常検出プログラム及び学習済モデル生成方法
Onchis et al. Stable and explainable deep learning damage prediction for prismatic cantilever steel beam
Li et al. Multi-sensor data-driven remaining useful life prediction of semi-observable systems
Li et al. Damage detection of bridges using response of vehicle considering road surface roughness
US9495330B2 (en) Anomaly detection method, program, and system
Thatoi et al. Review of techniques for fault diagnosis in damaged structure and engineering system
WO2010047917A2 (en) Method and apparatus for creating state estimation models in machine condition monitoring
US20200184373A1 (en) Recurrent Gaussian Mixture Model For Sensor State Estimation In Condition Monitoring
JP6187977B2 (ja) 解析装置、解析方法及びプログラム
CN113239022B (zh) 医疗诊断缺失数据补全方法及补全装置、电子设备、介质
JPWO2019235614A1 (ja) 関係性分析装置、関係性分析方法およびプログラム
JP5771317B1 (ja) 異常診断装置及び異常診断方法
JP7238378B2 (ja) 異常検出装置、異常検出プログラム、及び、異常検出方法
Chen et al. Operational damage identification scheme utilizing de-noised frequency response functions and artificial neural network
JP2021179906A (ja) 影響度算出プログラム、影響度算出装置、影響度算出方法
JPWO2019235603A1 (ja) 関係性分析装置、関係性分析方法およびプログラム
Algburi et al. A new synergy of singular spectrum analysis with a conscious algorithm to detect faults in industrial robotics
CN117171657A (zh) 风力发电设备故障诊断方法、装置、电子设备及存储介质
US20220391203A1 (en) Source Code Analysis Apparatus and Source Code Analysis Method
JP2021033711A (ja) 異常検知装置、異常検知方法、及びプログラム
WO2019234832A1 (ja) 診断装置、診断方法、及びコンピュータ読み取り可能な記録媒体
Xie et al. How much of the chemical space has been explored? selecting the right exploration measure for drug discovery

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230209

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20231113