JP4495691B2 - 影響因子推定装置及び影響因子推定プログラム - Google Patents
影響因子推定装置及び影響因子推定プログラム Download PDFInfo
- Publication number
- JP4495691B2 JP4495691B2 JP2006135297A JP2006135297A JP4495691B2 JP 4495691 B2 JP4495691 B2 JP 4495691B2 JP 2006135297 A JP2006135297 A JP 2006135297A JP 2006135297 A JP2006135297 A JP 2006135297A JP 4495691 B2 JP4495691 B2 JP 4495691B2
- Authority
- JP
- Japan
- Prior art keywords
- processing device
- value
- influence factor
- selection
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000005259 measurement Methods 0.000 claims description 643
- 238000012545 processing Methods 0.000 claims description 594
- 238000004364 calculation method Methods 0.000 claims description 474
- 239000013598 vector Substances 0.000 claims description 352
- 239000011159 matrix material Substances 0.000 claims description 226
- 230000006835 compression Effects 0.000 claims description 117
- 238000007906 compression Methods 0.000 claims description 117
- 238000000354 decomposition reaction Methods 0.000 claims description 109
- 238000000034 method Methods 0.000 claims description 50
- 230000000694 effects Effects 0.000 claims description 17
- 230000006870 function Effects 0.000 claims description 7
- 238000000137 annealing Methods 0.000 claims description 5
- 238000002986 genetic algorithm method Methods 0.000 claims description 4
- 230000008859 change Effects 0.000 description 45
- 238000010586 diagram Methods 0.000 description 27
- 230000008569 process Effects 0.000 description 21
- 238000004891 communication Methods 0.000 description 7
- 238000012937 correction Methods 0.000 description 6
- 230000003247 decreasing effect Effects 0.000 description 5
- 238000007616 round robin method Methods 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 238000000611 regression analysis Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000003646 Spearman's rank correlation coefficient Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000003292 diminished effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000556 factor analysis Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Landscapes
- Indication And Recording Devices For Special Purposes And Tariff Metering Devices (AREA)
- Complex Calculations (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
しかし、どのような影響因子が測定対象の状態に影響を与えるかは、必ずしも明確ではない。
そこで、測定対象の状態に影響を与える可能性のある影響因子をすべて測定し、重回帰分析などにより、そのなかから実際に測定対象の状態に影響を与えている影響因子を抽出することが行われる。
また、構築する予測モデルには、特異値分解による主成分分析や、マハラノビス距離を用いるものがある。
しかし、測定対象の状態に影響を与える可能性がある影響因子の数が多数である場合、膨大な量の仮説を設定し、その1つ1つを検定しなければならず、コンピュータなどの処理装置を用いても、非常に多くの時間がかかる。
例えば、測定対象の状態に影響を与える可能性がある影響因子の数が30個ある場合、そのなかで真に測定対象の状態に影響を与える影響因子の組み合わせを推定するには、230≒10億通りの仮説を検定しなければならない。
この発明は、例えば、上記のような課題を解決するためになされたものであり、コンピュータなどの処理装置を用いて、実用的な処理時間内に、多数の影響因子のなかから、真に測定対象の状態に影響を与える影響因子を推定することを目的とする。
情報を記憶する記憶装置と、
情報を処理する処理装置と、
情報を出力する出力装置と、
上記処理装置を用いて、測定対象の状態を測定した値を測定値yとし、複数の測定値yを上記記憶装置に記憶する測定値記憶部と、
上記処理装置を用いて、上記測定対象の状態に影響を与える可能性のある複数の影響因子Fを示す情報を、影響因子情報として、上記記憶装置に記憶する影響因子情報記憶部と、
上記処理装置を用いて、上記影響因子情報記憶部が記憶した影響因子情報によって示される上記複数の影響因子Fを測定した値を、複数の影響因子測定値xとし、上記測定値記憶部が記憶した複数の測定値yそれぞれに対応する上記複数の影響因子測定値xを、上記複数の測定値yそれぞれに対応する複数の影響因子測定値ベクトルXの成分として、上記記憶装置に記憶する影響因子測定値記憶部と、
上記処理装置を用いて、上記影響因子情報記憶部が記憶した影響因子情報によって示される上記複数の影響因子Fのなかから、複数の影響因子を選択して、複数の選択因子F’とし、上記処理装置を用いて、選択した上記複数の選択因子F’を示す情報を、選択因子情報Sとして、上記記憶装置に記憶する影響因子選択部と、
上記処理装置を用いて、上記影響因子選択部が選択した複数の選択因子F’を示す選択因子情報Sを上記記憶装置から取得し、上記処理装置を用いて、上記影響因子測定値記憶部が記憶した複数の影響因子測定値xのうち、取得した上記選択因子情報Sによって示される複数の選択因子F’についての複数の影響因子測定値xを上記記憶装置から取得し、上記処理装置を用いて、上記複数の測定値yに対応する複数の影響因子測定値xのうち、取得した複数の影響因子測定値xを成分とする複数のベクトルを、上記複数の測定値yに対応する複数の選択因子測定値ベクトルX’とし、上記複数の選択因子測定値ベクトルX’を行ベクトルとする行列を、パターン行列Pとし、上記パターン行列Pを特異値分解して、複数の特異値σとスコア値行列Uとを算出し、上記処理装置を用いて、算出した上記複数の特異値σを上記記憶装置に記憶し、上記処理装置を用いて、算出した上記スコア値行列Uの複数の行ベクトルを、上記複数の行ベクトルに対応する上記パターン行列Pの行ベクトルである上記複数の選択因子測定値ベクトルX’が対応する上記複数の測定値に対応する複数のスコア値ベクトルQとし、上記複数のスコア値ベクトルQの複数の成分を、上記複数の測定値yに対応する複数のスコア値uとして、上記記憶装置に記憶する特異値分解部と、
上記処理装置を用いて、上記特異値分解部が算出した複数の特異値σを、上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数の特異値σに基づいて、上記特異値分解部が算出した複数のスコア値uのうちから、複数のスコア値uを選択し、選択した上記複数のスコア値uを上記記憶装置から取得し、上記処理装置を用いて、上記複数の測定値yに対応する複数のスコア値uのうち、取得した上記複数のスコア値uを、上記複数の測定値yに対応する複数の圧縮スコア値ベクトルQ’の成分として、上記記憶装置に記憶するスコア値圧縮部と、
上記処理装置を用いて、上記測定値記憶部が記憶した複数の測定値yを上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数の測定値yが所定の条件を満たすか否かを判断し、上記処理装置を用いて、取得した上記複数の測定値yのうち、上記所定の条件を満たすと判断した測定値yに対応する上記複数の圧縮スコア値ベクトルQ’の成分として上記スコア値圧縮部が記憶した複数のスコア値uを上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数のスコア値uを成分とする上記複数の圧縮スコア値ベクトルQ’のバラツキの度合いを示す値を算出して、特徴度Cとし、上記処理装置を用いて、算出した特徴度Cを、上記記憶装置に記憶する特徴度算出部と、
上記処理装置を用いて、上記特徴度算出部が算出した特徴度Cを上記記憶装置から取得し、上記処理装置を用いて、取得した上記特徴度Cに基づいて、上記特徴度算出部が取得した複数のスコア値uを成分とする複数の圧縮スコア値ベクトルQ’のバラツキが小さいか否かを判断し、上記特徴度算出部が取得した複数のスコア値uを成分とする複数の圧縮スコア値ベクトルQ’のバラツキが小さいと判断した場合に、上記処理装置を用いて、上記測定値記憶部が記憶した複数の測定値yが所定の条件を満たすか否かを、上記複数の測定値yに対応する複数の圧縮スコア値ベクトルQ’の成分として上記スコア値圧縮部が記憶した複数のスコア値uに基づいて判別する判別式を算出し、算出した上記判別式のパラメータを、上記記憶装置に記憶する判別式算出部と、
上記処理装置を用いて、上記測定値記憶部が記憶した複数の測定値yを上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数の測定値yが上記所定の条件を満たすか否かを判断し、上記処理装置を用いて、上記判別式算出部が記憶したパラメータを上記記憶装置から取得し、上記処理装置を用いて、上記複数の測定値yに対応して、上記スコア値圧縮部が記憶した複数のスコア値uを上記記憶装置から取得し、上記処理装置を用いて、取得した上記パラメータによって示される判別式に取得した上記複数のスコア値uを代入して、上記複数のスコア値uに対応する複数の測定値yが所定の条件を満たすか否かを判別し、上記処理装置を用いて、上記複数の測定値yに基づく判断結果と、上記判別式に基づく判別結果とを比較して、上記判別式に基づく判別結果が正しいか否かを判断し、上記処理装置を用いて、上記判別式に基づく判別結果が正しいか否かの判断結果に基づいて、上記判別式の判別精度を示す値を算出して、判別度とし、上記処理装置を用いて、算出した上記判別度を上記記憶装置に記憶する判別度算出部と、
上記処理装置を用いて、上記判別度算出部が算出した判別度を上記記憶装置から取得し、上記処理装置を用いて、取得した上記判別度に基づいて上記判別式の判別精度が高いか否かを判断し、上記判別式の判別精度が高いと判断した場合に、上記処理装置を用いて、上記影響因子選択部が選択した複数の選択因子F’を示す選択因子情報Sを上記記憶装置から取得し、上記処理装置を用いて、取得した上記選択因子情報Sを、強影響因子情報として、上記記憶装置に記憶する強影響因子選択部と、
上記処理装置を用いて、上記強影響因子選択部が記憶した強影響因子情報を上記記憶装置から取得し、上記処理装置を用いて、上記影響因子情報記憶部が記憶した影響因子情報のうち、取得した上記強影響因子情報によって示される影響因子についての影響因子情報を、上記記憶装置から取得し、上記処理装置を用いて、取得した上記影響因子情報に基づいて、上記強影響因子情報によって示される影響因子についての情報を上記出力装置に出力する強影響因子出力部と、
を有し、
上記測定対象の状態に強い影響を与える影響因子を推定することを特徴とする。
上記処理装置を用いて、取得した上記複数のスコア値uを成分とする複数の圧縮スコア値ベクトルQ’を近似する近似式を算出し、
上記処理装置を用いて、算出した上記近似式と、上記複数の圧縮スコア値ベクトルQ’との間の近似誤差を算出し、
上記処理装置を用いて、算出した上記近似誤差を合計して、特徴度Cとすることを特徴とする。
上記処理装置を用いて、上記近似式として、取得した上記複数のスコア値uを成分とする複数の圧縮スコア値ベクトルQ’の回帰式を算出し、
上記処理装置を用いて、上記近似誤差として、算出した上記回帰式と、上記複数の圧縮スコア値ベクトルQ’との間の回帰誤差の二乗を算出することを特徴とする。
上記処理装置を用いて、取得した上記特徴度Cを所定の値と比較し、上記特徴度Cが所定の値より小さい場合に、上記処理装置を用いて、上記特徴度算出部が取得した複数のスコア値uを成分とする複数の圧縮スコア値ベクトルQ’のバラツキが小さいと判断することを特徴とする。
上記処理装置を用いて、上記測定値記憶部が記憶した複数の測定値yを上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数の測定値yが所定の条件を満たすか否かを判断し、上記処理装置を用いて、取得した上記複数の測定値yのうち、上記所定の条件を満たすと判断した測定値yに対応する上記複数の圧縮スコア値ベクトルQ’の成分として上記スコア値圧縮部が記憶した複数のスコア値uを上記記憶装置から取得し、取得した上記複数のスコア値uを成分とする複数の圧縮スコア値ベクトルQ’を、基準ベクトル群Gとし、上記処理装置を用いて、上記判別式として、上記基準ベクトル群Gに対するマハラノビス距離を計算する計算式を算出することを特徴とする。
上記処理装置を用いて、取得した上記パラメータによって示される判別式に、取得した上記複数のスコア値uを代入して、上記判別式の値を算出し、上記処理装置を用いて、算出した上記判別式の値を所定の値と比較して、上記複数のスコア値uを成分とする複数の圧縮スコア値ベクトルQ’に対応する複数の測定値yが所定の条件を満たすか否かを判別することを特徴とする。
上記処理装置を用いて、上記判別度として、上記判別式に基づく判別結果が正しいか否かの判断結果のうち、上記判別式に基づく判別結果が正しいと判断した割合を計算することを特徴とする。
上記処理装置を用いて、上記複数の影響因子Fのなかから選択する複数の選択因子F’の数を生成して、選択因子数とし、上記処理装置を用いて、上記複数の影響因子Fのなかから、生成した上記選択因子数の選択因子F’を選択することを特徴とする。
上記処理装置を用いて、上記測定値記憶部が記憶した複数の測定値yを上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数の測定値yに対応する複数の影響因子測定値ベクトルXの成分として上記影響因子測定値記憶部が記憶した複数の影響因子測定値xを上記記憶装置から取得し、上記処理装置を用いて、上記複数の影響因子Fそれぞれについて、取得した上記複数の測定値yと、上記複数の測定値yに対応する上記複数の影響因子測定値xとの間の相関の強さを示す値を算出して、上記複数の影響因子Fに対応する複数の影響因子重み付けWとし、上記処理装置を用いて、算出した上記複数の影響因子重み付けWを記憶装置に記憶する重み付け算出部を有し、
上記影響因子選択部は、
上記処理装置を用いて、上記重み付け算出部が算出した複数の影響因子重み付けWを上記記憶装置から取得し、上記処理装置を用いて、取得した上記影響因子重み付けWに基づいて、上記複数の影響因子Fを複数の影響因子グループに分類し、上記処理装置を用いて、分類した上記複数の影響因子グループそれぞれのなかから選択する選択因子F’の数をそれぞれ生成して、グループ選択因子数とし、上記処理装置を用いて、上記複数の影響因子グループそれぞれのなかから、生成した上記グループ選択因子数の選択因子F’を選択することを特徴とする。
上記処理装置を用いて、上記判別度算出部が算出した判別度を上記記憶装置から取得し、上記処理装置を用いて、取得した上記判別度に基づいて、大規模組み合わせ計算法により、上記判別度が大きくなるよう、上記複数の影響因子Fのなかから複数の選択因子F’を選択することを特徴とする。
上記大規模組み合わせ計算法として、焼きなまし法及び遺伝的アルゴリズム法及びタブーサーチ法の少なくともいずれかを用いることを特徴とする。
上記処理装置を用いて、取得した上記判別度を算出する際に用いた複数の選択因子F‘を示す選択因子情報Sを上記記憶装置から取得し、上記処理装置を用いて、取得した上記選択因子情報Sによって示される複数の選択因子F’と比較して、選択する選択因子F‘の数が等しく、一部の選択因子F’が共通する複数の選択因子F’を選択することを特徴とする。
上記複数の影響因子Fそれぞれについて、上記複数の測定値yと、上記複数の測定値yに対応する上記複数の影響因子測定値xとの間のピアソンの積率相関係数の二乗を算出し、上記複数の影響因子Fに対応する複数の影響因子重み付けWとすることを特徴とする。
上記処理装置を用いて、取得した上記選択因子情報Sを上記記憶装置に記憶し、上記処理装置を用いて、取得した上記選択因子情報Sによって示される複数の選択因子F’と、以前に記憶した選択因子情報Sによって示される複数の選択因子F’とを比較して、選択した選択因子F’の数が等しく、一部の選択因子F’が共通している場合に、上記処理装置を用いて、以前に記憶した上記選択因子情報Sによって示される複数の選択因子F’についてのパターン行列Pを特異値分解して算出した複数の特異値σと複数のスコア値uとを上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数の特異値σと上記複数のスコア値uとに基づいて、取得した上記選択因子情報Sによって示される複数の選択因子F’についてのパターン行列Pを特異値分解することを特徴とする。
情報を記憶する記憶装置と、情報を処理する処理装置と、情報を出力する出力装置とを有するコンピュータを、
上記処理装置を用いて、測定対象の状態を測定した値を測定値yとし、複数の測定値yを上記記憶装置に記憶する測定値記憶部と、
上記処理装置を用いて、上記測定対象の状態に影響を与える可能性のある複数の影響因子Fを示す情報を、影響因子情報として、上記記憶装置に記憶する影響因子情報記憶部と、
上記処理装置を用いて、上記影響因子情報記憶部が記憶した影響因子情報によって示される上記複数の影響因子Fを測定した値を、複数の影響因子測定値xとし、上記測定値記憶部が記憶した複数の測定値yそれぞれに対応する上記複数の影響因子測定値xを、上記複数の測定値yそれぞれに対応する複数の影響因子測定値ベクトルXの成分として、上記記憶装置に記憶する影響因子測定値記憶部と、
上記処理装置を用いて、上記影響因子情報記憶部が記憶した影響因子情報によって示される上記複数の影響因子Fのなかから、複数の影響因子を選択して、複数の選択因子F’とし、上記処理装置を用いて、選択した上記複数の選択因子F’を示す情報を、選択因子情報Sとして、上記記憶装置に記憶する影響因子選択部と、
上記処理装置を用いて、上記影響因子選択部が選択した複数の選択因子F’を示す選択因子情報Sを上記記憶装置から取得し、上記処理装置を用いて、上記影響因子測定値記憶部が記憶した複数の影響因子測定値xのうち、取得した上記選択因子情報Sによって示される複数の選択因子F’についての複数の影響因子測定値xを上記記憶装置から取得し、上記処理装置を用いて、上記複数の測定値yに対応する複数の影響因子測定値xのうち、取得した複数の影響因子測定値xを成分とする複数のベクトルを、上記複数の測定値yに対応する複数の選択因子測定値ベクトルX’とし、上記複数の選択因子測定値ベクトルX’を行ベクトルとする行列を、パターン行列Pとし、上記パターン行列Pを特異値分解して、複数の特異値σとスコア値行列Uとを算出し、上記処理装置を用いて、算出した上記複数の特異値σを上記記憶装置に記憶し、上記処理装置を用いて、算出した上記スコア値行列Uの複数の行ベクトルを、上記複数の行ベクトルに対応する上記パターン行列Pの行ベクトルである上記複数の選択因子測定値ベクトルX’が対応する上記複数の測定値に対応する複数のスコア値ベクトルQとし、上記複数のスコア値ベクトルQの複数の成分を、上記複数の測定値yに対応する複数のスコア値uとして、上記記憶装置に記憶する特異値分解部と、
上記処理装置を用いて、上記特異値分解部が算出した複数の特異値σを、上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数の特異値σに基づいて、上記特異値分解部が算出した複数のスコア値uのうちから、複数のスコア値uを選択し、選択した上記複数のスコア値uを上記記憶装置から取得し、上記処理装置を用いて、上記複数の測定値yに対応する複数のスコア値uのうち、取得した上記複数のスコア値uを、上記複数の測定値yに対応する複数の圧縮スコア値ベクトルQ’の成分として、上記記憶装置に記憶するスコア値圧縮部と、
上記処理装置を用いて、上記測定値記憶部が記憶した複数の測定値yを上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数の測定値yが所定の条件を満たすか否かを判断し、上記処理装置を用いて、取得した上記複数の測定値yのうち、上記所定の条件を満たすと判断した測定値yに対応する上記複数の圧縮スコア値ベクトルQ’の成分として上記スコア値圧縮部が記憶した複数のスコア値uを上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数のスコア値uを成分とする上記複数の圧縮スコア値ベクトルQ’のバラツキの度合いを示す値を算出して、特徴度Cとし、上記処理装置を用いて、算出した特徴度Cを、上記記憶装置に記憶する特徴度算出部と、
上記処理装置を用いて、上記特徴度算出部が算出した特徴度Cを上記記憶装置から取得し、上記処理装置を用いて、取得した上記特徴度Cに基づいて、上記特徴度算出部が取得した複数のスコア値uを成分とする複数の圧縮スコア値ベクトルQ’のバラツキが小さいか否かを判断し、上記特徴度算出部が取得した複数のスコア値uを成分とする複数の圧縮スコア値ベクトルQ’のバラツキが小さいと判断した場合に、上記処理装置を用いて、上記測定値記憶部が記憶した複数の測定値yが所定の条件を満たすか否かを、上記複数の測定値yに対応して上記スコア値圧縮部が記憶した複数のスコア値uに基づいて判別する判別式を算出し、算出した上記判別式のパラメータを、上記記憶装置に記憶する判別式算出部と、
上記処理装置を用いて、上記測定値記憶部が記憶した複数の測定値yを上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数の測定値yが上記所定の条件を満たすか否かを判断し、上記処理装置を用いて、上記判別式算出部が記憶したパラメータを上記記憶装置から取得し、上記処理装置を用いて、上記複数の測定値yに対応して、上記スコア値圧縮部が記憶した複数のスコア値uを上記記憶装置から取得し、上記処理装置を用いて、取得した上記パラメータによって示される判別式に取得した上記複数のスコア値uを代入して、上記複数のスコア値uに対応する複数の測定値yが所定の条件を満たすか否かを判別し、上記処理装置を用いて、上記複数の測定値yに基づく判断結果と、上記判別式に基づく判別結果とを比較して、上記判別式に基づく判別結果が正しいか否かを判断し、上記処理装置を用いて、上記判別式に基づく判別結果が正しいか否かの判断結果に基づいて、上記判別式の判別精度を示す値を算出して、判別度とし、上記処理装置を用いて、算出した上記判別度を上記記憶装置に記憶する判別度算出部と、
上記処理装置を用いて、上記判別度算出部が算出した判別度を上記記憶装置から取得し、上記処理装置を用いて、取得した上記判別度に基づいて上記判別式の判別精度が高いか否かを判断し、上記判別式の判別精度が高いと判断した場合に、上記処理装置を用いて、上記影響因子選択部が選択した複数の選択因子F’を示す選択因子情報Sを上記記憶装置から取得し、上記処理装置を用いて、取得した上記選択因子情報Sを、強影響因子情報として、上記記憶装置に記憶する強影響因子選択部と、
上記処理装置を用いて、上記強影響因子選択部が記憶した強影響因子情報を上記記憶装置から取得し、上記処理装置を用いて、上記影響因子情報記憶部が記憶した影響因子情報のうち、取得した上記強影響因子情報によって示される影響因子についての影響因子情報を、上記記憶装置から取得し、上記処理装置を用いて、取得した上記影響因子情報に基づいて、上記強影響因子情報によって示される影響因子についての情報を上記出力装置に出力する強影響因子出力部と、
を有し、
上記測定対象の状態に強い影響を与える影響因子を推定する影響因子推定装置として機能させることを特徴とする。
実施の形態1を、図1〜図14を用いて説明する。
影響因子推定装置100は、相関要因導出装置とも呼ばれる。
図1において、影響因子推定装置100は、システムユニット910、CRT(Cathode・Ray・Tube)やLCD(液晶)などの表示画面を有する表示装置901、キーボード902(Key・Board:K/B)、マウス903、FDD904(Flexible・Disk・ Drive)、コンパクトディスク装置905(CDD)、プリンタ装置906、スキャナ装置907などのハードウェア資源を備え、これらはケーブルや信号線で接続されている。
システムユニット910は、コンピュータであり、ファクシミリ機932、電話器931とケーブルで接続され、また、ローカルエリアネットワーク942(LAN)、ゲートウェイ941を介してインターネット940に接続されている。
図2において、影響因子推定装置100は、プログラムを実行するCPU911(Central・Processing・Unit、中央処理装置、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、プロセッサともいう)を備えている。CPU911は、バス912を介してROM913、RAM914、通信ボード915、表示装置901、キーボード902、マウス903、FDD904、CDD905、プリンタ装置906、スキャナ装置907、磁気ディスク装置920と接続され、これらのハードウェアデバイスを制御する。磁気ディスク装置920の代わりに、光ディスク装置、メモリカード読み書き装置などの記憶装置でもよい。
RAM914は、揮発性メモリの一例である。ROM913、FDD904、CDD905、磁気ディスク装置920の記憶媒体は、不揮発性メモリの一例である。これらは、記憶装置あるいは記憶部の一例である。
通信ボード915、キーボード902、スキャナ装置907、FDD904などは、入力部、入力装置の一例である。
また、通信ボード915、表示装置901、プリンタ装置906などは、出力部、出力装置の一例である。
磁気ディスク装置920には、オペレーティングシステム921(OS)、ウィンドウシステム922、プログラム群923、ファイル群924が記憶されている。プログラム群923のプログラムは、CPU911、オペレーティングシステム921、ウィンドウシステム922により実行される。
ファイル群924には、以下に述べる実施の形態の説明において、「〜の判定結果」、「〜の計算結果」、「〜の処理結果」として説明する情報やデータや信号値や変数値やパラメータが、「〜ファイル」や「〜データベース」の各項目として記憶されている。「〜ファイル」や「〜データベース」は、ディスクやメモリなどの記録媒体に記憶される。ディスクやメモリになどの記憶媒体に記憶された情報やデータや信号値や変数値やパラメータは、読み書き回路を介してCPU911によりメインメモリやキャッシュメモリに読み出され、抽出・検索・参照・比較・演算・計算・処理・出力・印刷・表示などのCPU911の動作に用いられる。抽出・検索・参照・比較・演算・計算・処理・出力・印刷・表示・抽出のCPU911の動作の間、情報やデータや信号値や変数値やパラメータは、メインメモリやキャッシュメモリやバッファメモリに一時的に記憶される。
また、以下に述べる実施の形態の説明において説明するフローチャートの矢印の部分は主としてデータや信号の入出力を示し、データや信号値は、RAM914のメモリ、FDD904のフレキシブルディスク、CDD905のコンパクトディスク、磁気ディスク装置920の磁気ディスク、その他光ディスク、ミニディスク、DVD(Digital・Versatile・Disc)等の記録媒体に記録される。また、データや信号は、バス912や信号線やケーブルその他の伝送媒体によりオンライン伝送される。
影響因子情報とは、測定対象の状態に影響を与える可能性のある多数の影響因子Fを示す情報である。
例えば、測定対象の状態に影響を与える可能性のある影響因子として、温度、湿度、天候、セルモータ発進回数、走行距離、ライト点灯時間、設定ギア状況などがあるとすると、F1=「温度」、F2=「湿度」、F3=「天候」、…といったデータが、影響因子情報となる。
影響因子情報記憶部121は、CPU911などの処理装置を用いて、影響因子情報入力部111が入力した影響因子情報の通知を受けて、影響因子情報を取得し、取得した影響因子情報を、磁気ディスク装置920などの記憶装置に書き込むことにより、影響因子情報を記憶する。
影響因子情報記憶部121は、例えば、m個の文字列の配列として、影響因子情報を記憶する。あるいは、文字列を記憶するフィールド(またはレコード)m個を有するファイルとして、影響因子情報を記憶する。
測定値yとは、測定対象の状態を測定した値である。例えば、バッテリーの内部抵抗を測定した値をkΩ(キロオーム)単位で表した数値である。
測定値yは、同一の測定対象の状態を、異なる時刻に複数回測定して得た値でもよいし、複数の同種の測定対象の状態を、同一の時刻あるいは異なる時刻に測定して得た値でもよい。
ここで、測定値yの数をn個とし、i番目の測定値yを、測定値yi(ただし、iは、1〜nの整数)と表わすこととする。
測定値記憶部123は、例えば、n個の倍精度浮動小数点数の配列として、測定値yを記憶する。あるいは、倍精度浮動小数点数を記憶するレコード(あるいはフィールド)n個を有するファイルとして、測定値yを記憶する。
影響因子測定値xとは、影響因子情報記憶部121が記憶した影響因子情報によって示される多数の影響因子Fを測定した値である。
このように、影響因子測定値xは、測定対象によって異なり、また、測定時刻によっても異なる。
影響因子測定値xは、測定対象の状態に影響を与えるデータであるため、測定対象の状態を測定した測定値yと対応づける必要がある。
すなわち、測定対象の状態を測定して測定値yを得たのと同時刻に、同一の測定対象を測定して影響因子測定値xを得れば、測定値yと影響因子測定値xとは対応づけられる。
しかし、例えば、前日の最高気温が測定値yに影響を与える影響因子である場合もあり、必ずしも同時刻に測定したものでなくとも、影響因子測定値xと、測定値yとが対応づけられる場合がある。
また、影響因子測定値xが時刻によって変わらないのであれば、同一の測定対象を測定して得た測定値yと影響因子測定値xとは、常に対応づけることができる。
また、1つの測定値yに対応する影響因子測定値を、影響因子Fの順に並べた組を、影響因子測定値ベクトルXという。例えば、i番目の測定値yiに対応する影響因子測定値の組(xi1,xi2,…,xim)を、影響因子測定値ベクトルXiと表わす。
なお、j番目の影響因子Fjについての影響因子測定値x1j,x2j,…,xnjのことを総称して、xjと表わす場合もある。
影響因子測定値記憶部122は、全部でm×n個(mは、影響因子Fの数。nは、測定値yの数)の影響因子測定値を記憶する。
影響因子測定値記憶部122は、例えば、m×n個の倍精度浮動小数点数の(二次元)配列として、影響因子測定値xを記憶する。あるいは、倍精度浮動小数点数を記憶するm個のフィールドを有するn個のレコードを持つファイルとして、影響因子測定値を記憶する。
例えば、m×n個の倍精度浮動小数点数の二次元配列をして影響因子測定値xを記憶する場合であれば、添え字i及びjから、どの影響因子Fを測定したものであるか、どの測定値yに対応するものであるかが判別できる。したがって、添え字i及びjに対応するアドレス(またはファイル内の位置)に、影響因子測定値xを記憶することにより、影響因子測定値xが、どの影響因子Fを測定したものであるか、どの測定値yに対応するものであるかを記憶することができる。
「内部抵抗値」は、測定値yの一例である。
「温度」「湿度」「天候」…は、影響因子Fの一例であり、「ID番号」が示す測定値yに対応して、それぞれの影響因子Fを測定した影響因子測定値xがある。
したがって、予測の精度を高くするためには、少しでも測定値yに影響を与える可能性がある影響因子Fすべてについて、影響因子測定値xを測定するほうがよい。
したがって、最小限の影響因子Fを測定するだけで、最大限の精度を持つ予測結果を得たい。
これにより、最大限の予測精度を維持したまま、コストを下げることが可能となる。
影響因子重み付けWとは、影響因子情報記憶部121が記憶した影響因子情報によって示される影響因子Fのそれぞれについて、後述する影響因子選択部132がその影響因子Fを選択する確率を示す値である。
重み付け算出部131は、それぞれの影響因子Fに対応して、影響因子重み付けWを算出する。重み付け算出部131は、m個の影響因子Fに対応して、m個の影響因子重み付けWを算出する。
ここで、j番目の影響因子Fjに対応する影響因子重み付けWを、影響因子重み付けWjと表わすこととする。
重み付け算出部131は、また、CPU911などの処理装置を用いて、影響因子測定値記憶部122が記憶したm×n個の影響因子測定値xを、磁気ディスク装置920などの記憶装置から取得する。
重み付け算出部131は、それぞれの影響因子Fに対応して、相関の強さを示す値を算出する。重み付け算出部131は、m個の影響因子Fに対応して、m個の相関の強さを示す値を算出する。
ピアソンの積率相関係数とは、測定値yの分散をVar(y)、j番目の影響因子Fjについての影響因子測定値xの分散をVar(xj)、測定値yと、j番目の影響因子Fjについて測定値yに対応する影響因子測定値xとの共分散をCov(xj,y)とすると、式Cov(xj,y)/√{Var(xj)・Var(y)}を計算することにより求められる値である。
まず、測定値平均値算出部311は、CPU911などの処理装置を用いて、測定値記憶部123が記憶したn個の測定値yを、磁気ディスク装置920などの記憶装置から取得する。
次に、測定値平均値算出部311は、CPU911などの処理装置を用いて、取得した測定値yの合計を計算して、測定値合計Σ(y)とする。
そして、測定値平均値算出部311は、CPU911などの処理装置を用いて、計算した測定値合計Σ(y)を、測定値yの数nで割った値Σ(y)/nを計算し、測定値平均値Ave(y)とする。
測定値平均値算出部311は、CPU911などの処理装置を用いて、計算した測定値平均値Ave(y)を、磁気ディスク装置920などの記憶装置に記憶する。
まず、測定値二乗平均値算出部312は、CPU911などの処理装置を用いて、測定値記憶部123が記憶したn個の測定値yを、磁気ディスク装置920などの記憶装置から取得する。
次に、測定値二乗平均値算出部312は、CPU911などの処理装置を用いて、取得した測定値yの二乗を計算して、測定値二乗y2とする。
そして、測定値二乗平均値算出部312は、CPU911などの処理装置を用いて、計算したn個の測定値二乗y2の合計を計算し、測定値二乗合計Σ(y2)とする。
測定値二乗平均値算出部312は、CPU911などの処理装置を用いて、計算した測定値二乗合計Σ(y2)を、測定値yの数nで割った値Σ(y2)/nを計算し、測定値二乗平均値Ave(y2)とする。
測定値二乗平均値算出部312は、CPU911などの処理装置を用いて、計算した測定値二乗平均値Ave(y2)を、磁気ディスク装置920などの記憶装置に記憶する。
まず、影響因子測定値平均値算出部313は、CPU911などの処理装置を用いて、影響因子測定値記憶部122が記憶したm×n個の影響因子測定値xを、磁気ディスク装置920などの記憶装置から取得する。
次に、影響因子測定値平均値算出部313は、CPU911などの処理装置を用いて、m個の影響因子Fそれぞれについて、その影響因子Fについてのn個の影響因子測定値xの合計を計算して、影響因子測定値合計Σ(xj)(jは、1〜mの整数)とする。
影響因子測定値平均値算出部313は、m個の影響因子Fに対応して、m個の影響因子測定値合計Σ(xj)を計算する。
影響因子測定値平均値算出部313は、m個の影響因子Fに対応して、m個の影響因子測定値平均値Ave(xj)を計算する。
まず、影響因子測定値二乗平均値算出部314は、CPU911などの処理装置を用いて、影響因子測定値記憶部122が記憶したm×n個の影響因子測定値xを、磁気ディスク装置920などの記憶装置から取得する。
次に、影響因子測定値二乗平均値算出部314は、CPU911などの処理装置を用いて、m×n個の影響因子測定値xの二乗を計算して、影響因子測定値二乗x2を計算する。
影響因子測定値二乗平均値算出部314は、m×n個の影響因子測定値xに対応して、m×n個の影響因子測定値二乗x2を計算する。
影響因子測定値二乗平均値算出部314は、1つの影響因子Fに対応するn個の影響因子測定値二乗x2を合計し、m個の影響因子Fに対応して、m個の影響因子測定値二乗合計Σ(xj 2)を計算する。
影響因子測定値二乗平均値算出部314は、m個の影響因子Fに対応して、m個の影響因子測定値二乗平均値Ave(xj 2)を計算する。
まず、測定値分散算出部315は、CPU911などの処理装置を用いて、測定値平均値算出部311が算出した測定値平均値Ave(y)を、磁気ディスク装置920などの記憶装置から取得する。
次に、測定値分散算出部315は、CPU911などの処理装置を用いて、測定値二乗平均値算出部312が算出した測定値二乗平均値Ave(y2)を、磁気ディスク装置920などの記憶装置から取得する。
そして、測定値分散算出部315は、CPU911などの処理装置を用いて、取得した測定値平均値Ave(y)の二乗を計算し、測定値平均値二乗Ave(y)2とする。
測定値分散算出部315は、CPU911などの処理装置を用いて、取得した測定値二乗平均値Ave(y2)から、測定値平均値二乗Ave(y)2を減算し、測定値分散Var(y)とする。
測定値分散算出部315は、CPU911などの処理装置を用いて、計算した測定値分散Var(y)を、磁気ディスク装置920などの記憶装置に記憶する。
まず、影響因子測定値分散算出部316は、CPU911などの処理装置を用いて、影響因子測定値平均値算出部313が算出したm個の影響因子測定値平均値Ave(xj)(jは、1〜mの整数)を、磁気ディスク装置920などの記憶装置から取得する。
次に、影響因子測定値分散算出部316は、CPU911などの処理装置を用いて、影響因子測定値二乗平均値算出部314が算出したm個の影響因子測定値二乗平均値Ave(xj 2)を、磁気ディスク装置920などの記憶装置から取得する。
そして、影響因子測定値分散算出部316は、CPU911などの処理装置を用いて、取得したm個の影響因子測定値平均値Ave(xj)の二乗を計算し、影響因子測定値平均値二乗Ave(xj)2(jは、1〜mの整数)とする。
影響因子測定値分散算出部316は、m個の影響因子Fに対応して、m個の影響因子平均値二乗Ave(xj)2を計算する。
影響因子測定値分散算出部316は、m個の影響因子Fに対応して、m個の影響因子測定値分散Var(xj)を計算する。
まず、測定値共分散算出部317は、CPU911などの処理装置を用いて、測定値記憶部123が記憶したn個の測定値yを、磁気ディスク装置920などの記憶装置から取得する。
測定値共分散算出部317は、CPU911などの処理装置を用いて、影響因子測定値記憶部122が記憶したm×n個の影響因子測定値xを、磁気ディスク装置920などの記憶装置から取得する。
測定値共分散算出部317は、CPU911などの処理装置を用いて、測定値平均値算出部311が算出した測定値平均値Ave(y)を、磁気ディスク装置920などの記憶装置から取得する。
測定値共分散算出部317は、CPU911などの処理装置を用いて、影響因子測定値平均値算出部313が算出したm個の影響因子測定値平均値Ave(xj)(jは、1〜mの整数)を、磁気ディスク装置920などの記憶装置から取得する。
測定値共分散算出部317は、n個の測定値yそれぞれから測定値平均値Ave(y)を減算し、n個の測定値yに対応するn個の測定値偏差Δyを計算する。
測定値共分散算出部317は、j番目の影響因子Fjに対応するn個の影響因子測定値xjから、その影響因子Fjに対応する影響因子測定値平均値Ave(xj)を減算して、n個の影響因子測定値偏差Δxを計算する。測定値共分散算出部317は、m個の影響因子Fに対応して、全部でm×n個の影響因子測定値偏差Δxを計算する。
測定値共分散算出部317は、ある測定値yに対応する測定値偏差Δyと、その測定値yに対応するm個の影響因子測定値偏差Δxとの積をとり、m個の偏差積ΔxΔyを計算する。測定値共分散算出部317は、n個の測定値に対応して、全部でm×n個の偏差積ΔxΔyを計算する。
測定値共分散算出部317は、j番目の影響因子Fjに対応するn個の偏差積ΔxΔyを合計して、偏差積合計Σ(ΔxΔy)を計算する。測定値共分散算出部317は、m個の影響因子Fに対応して、m個の偏差積合計Σ(ΔxΔy)を計算する。
測定値共分散算出部317は、m個の影響因子Fに対応して、m個の測定値共分散Cov(xj,y)を計算する。
まず、測定値相関係数算出部318は、CPU911などの処理装置を用いて、測定値分散算出部315が算出した測定値分散Var(y)を、磁気ディスク装置920などの記憶装置から取得する。
測定値相関係数算出部318は、CPU911などの処理装置を用いて、影響因子測定値分散算出部316が算出したm個の影響因子測定値分散Var(xj)(jは、1〜mの整数)を、磁気ディスク装置920などの記憶装置から取得する。
測定値相関係数算出部318は、CPU911などの処理装置を用いて、測定値共分散算出部317が算出したm個の測定値共分散Cov(xj,y)(jは、1〜mの整数)を、磁気ディスク装置920などの記憶装置から取得する。
測定値相関係数算出部318は、m個の影響因子Fに対応して、m個の測定値共分散二乗Cov(xj,y)2を計算する。
測定値相関係数算出部318は、j番目の影響因子Fjに対応する測定値共分散二乗Cov(xj,y)2を、測定値分散Var(y)で除し、更に、その影響因子Fjに対応する測定値分散Var(xj)で除して、ピアソンの積率相関係数の二乗を計算する。測定値相関係数算出部318は、m個の影響因子Fに対応して、m個のピアソンの積率相関係数の二乗を計算する。
あるいは、i番目の測定値yiと、j番目の影響因子Fjについて測定値yiに対応する影響因子測定値xijとの間の関係が、式yi=f(xij)(fは、影響因子Fごとに異なる関数)で近似できる場合には、例えば、測定値yiと測定値平均値Ave(y)との差の二乗和ST=Σ{yi−Ave(y)}2で、予測値f(xij)と測定値平均値Ave(y)との差の二乗和SR=Σ{f(xij)−Ave(y)}2で割った値SR/STを計算して、相関の強さを示す値としてもよい。
影響因子選択部132は、CPU911などの処理装置を用いて、選択した選択因子F’を示す情報を、選択因子情報Sとして、磁気ディスク装置920などの記憶装置に記憶する。
選択因子F’とは、影響因子情報記憶部121が記憶した影響因子情報によって示されるすべての影響因子Fのなかから選択した1つ以上の影響因子である。
影響因子選択部132が選択した影響因子だけで、測定対象の状態(測定値y)のほとんどが説明できれば、他の影響因子による影響は薄く、無視してよいと考えることができる。
影響因子選択部132は、例えば、mビッドのデータとして、選択因子情報Sを記憶する。このデータは、例えば、j番目のビッドが「1」のとき、j番目の影響因子Fjを選択することを示し、j番目のビッドが「0」のとき、j番目の影響因子Fjを選択しないことを示す。
そこで、すべての組み合わせを試すのではなく、一部の組み合わせだけを試して、最適な選択因子F’の組み合わせを見つける方式である。すべての組み合わせを試していないので、最も最適な組み合わせ(大域的最適解)ではないかもしれないが、少なくとも、妥当性の高い組み合わせを、実用的な時間内に見つけることができる。
これら各方式の詳細については、ここでは説明しないが、いずれも、ランダムに選択した組み合わせの初期値から探索を開始し、その評価値に基づいて、次に探索を行う組み合わせを確率的に選択する方式である。
例えば、初期値の近傍で、評価値が改善する方向に、探索を進めていく。初期値の近傍で、評価値が最適になる組み合わせを見つけたら、まったく異なる組み合わせをランダムに選択して初期値として、探索を繰り返す。
影響因子選択部132は、CPU911などの処理装置を用いて、生成したj番目の乱数Rjと、j番目の影響因子Fjに対応する影響因子重み付けWjとを比較し、Rj<Wjであるか否かを判断する。
影響因子選択部132は、Rj<Wjであると判断した場合、CPU911などの処理装置を用いて、j番目の影響因子Fjを選択する。すなわち、影響因子選択部132は、例えば、選択因子情報Sのjビッド目を「1」にする。
影響因子選択部132は、Rj<Wjでないと判断した場合、CPU911などの処理装置を用いて、j番目の影響因子Fjを選択しない。すなわち、影響因子選択部132は、例えば、選択因子情報Sのjビッド目を「0」にする。
例えば、最初の選択因子F’1に、ある影響因子Fを1つ追加した選択因子を、次の選択因子F’2として選択する。
あるいは、逆に、最初の選択因子F’1から、ある影響因子Fを1つ削除した選択因子を、次の選択因子F’2として選択する。
すなわち、最初の選択因子情報Sと比較して、1ビッド違いの選択因子情報を、次の選択因子情報Sとする。
あるいは、影響因子選択部132は、最初の選択因子F’1に、ある影響因子Fを1つ追加あるいは削除した選択因子のなかから、ランダムに選択したいくつかの選択因子を順番に選択して、次の選択因子F’2としてもよい。
その場合、j番目の影響因子Fjに対応する影響因子重み付けWjが大きい場合には、その影響因子Fjが追加されやすく、削除されにくいようにしてもよい。逆に、影響因子重み付けWjが小さい場合には、対応する影響因子Fjが削除されやすく、追加されにくいようにしてもよい。
次に、影響因子選択部132は、CPU911などの処理装置を用いて、(擬似)乱数R(0≦R<Σ(Wj’))を生成し、磁気ディスク装置920などの記憶装置に記憶する。
影響因子選択部132は、CPU911などの処理装置を用いて、整数jを1として、磁気ディスク装置920などの記憶装置に記憶する。
影響因子選択部132は、CPU911などの処理装置を用いて、乱数Rから、選択確率Wj’を減算し、その値を、新たな乱数Rとして、磁気ディスク装置920などの記憶装置に記憶する。影響因子選択部132は、乱数Rが0以上か否かを判断し、R≧0であると判断した場合、整数jに1を加えて、選択確率Wj’の減算を繰り返す。
影響因子選択部132は、R<0と判断した場合、選択因子情報Sのjビッド目を反転し、新たな選択因子情報Sとして、磁気ディスク装置920などの記憶装置に記憶する。 これにより、j番目の選択因子Fjに対応する影響因子重み付けWjの値に基づいて、選択因子Fjの追加されやすさ及び削除されやすさを変化させることができる。
影響因子選択部132は、CPU911などの処理装置を用いて、最大の特徴度Cが基礎とした選択因子が、最初の選択因子F’1であるか、次の選択因子F’2であるかを判断する。
すなわち、特徴度が改善した方向で、更に、探索を進める。
影響因子選択部132は、更に、選択因子F’1,F’2とは無関係に、新たな選択因子をランダムに選択し、最初に選択した選択因子F’1とする。
すなわち、とりあえずの局所的最適解が求まったものとし、別の局所的最適解を求めて探索を続ける。
例えば、影響因子選択部132は、総当り法により、すべての組み合わせにかかる影響因子F’を、順次選択してもよい。
その場合、影響因子選択部132は、影響因子重み付けWを利用しないので、重み付け算出部131はなくてもよい。
特異値分解とは、ある行列PをP=U・S・VTを満たす3つの行列U,S,VTの積に分解することをいう。
ここで、行列Pがm列n行であるとする。行列Uは、k列n行の行列で、UT・U=Ik(行列UTは、行列Uの転置行列(行と列とを入れ替えた行列)。Ikは、k列k行の単位行列)である。行列Sは、k列k行の正方対角行列である。行列VTは、行列V(k列m行)の転置行列で、VT・V=Ikである。ただし、kは、行列Pの特異値の数で、1≦k≦mの整数である。
行列Sの第i列、第j行の成分をSijとすると、行列Sは対角行列であるから、i≠jのとき、Sij=0である。また、Sii=σiは、行列Pの特異値であり、i<jのとき、σi>σj>0である。
CPU911などの処理装置を有するコンピュータにより、特異値分解を計算する計算方法については、既知の方法があるので、ここでは説明しない。
行ベクトルXと測定値yとの間に相関があれば、行ベクトルXを一次変換した行ベクトルQと、測定値yとの間にも相関がある。
また、スコア値ベクトルQの成分をスコア値uと呼ぶこととする。スコア値ベクトルQは、k次元ベクトルであるから、1つのスコア値ベクトルQにつき、スコア値uがk個ある。i番目の測定値yiに対応するスコア値ベクトルQiのb番目の成分を、スコア値uibと表わす。また、スコア値ベクトルQのb番目の成分を総称して、スコア値ubと表わすこともある。なお、スコア値uibは、スコア値行列Uのi行b列の成分である。
影響因子測定値ベクトルXの成分(影響因子測定値x)は、m個あるのに対し、スコア値ベクトルQの成分(スコア値u)は、k個(k≦m)であるから、磁気ディスク装置920などの記憶装置に必要となる記憶領域の容量は、k/m倍に削減できる。
すなわち、m’個の選択因子F’についての影響因子測定値xからなる行ベクトルを、選択因子測定値ベクトルX’とし、i番目の測定値yiに対応する影響因子測定値ベクトルXi’をi行目とする行列を、パターン行列Pとすれば、パターン行列Pを特異値分解して得たスコア値行列Uの列数kは、k≦m’となる。したがって、1つの測定値yについて、m’個の影響因子測定値xを記憶する代わりに、k個のスコア値uを記憶すればよいので、磁気ディスク装置920などの記憶装置に必要となる記憶領域の容量は、k/m’倍に削減できる。
したがって、1≦k’<kである適当なk’を選び、1つの測定値yに対応するk個のスコア値uのうち、1番目〜k’番目のスコア値uだけを抜き出して、行ベクトルQ’とし、k’+1番目〜k番目のスコア値uの影響を無視しても、近似的に、行ベクトルQ’と影響因子測定値ベクトルXとの間に一次変換の関係があるものとして扱うことができる。
ここで、スコア値ベクトルQの成分(k個のスコア値u)のうち、k’番目までのスコア値uを抜き出して生成した行ベクトルQ’を、圧縮スコア値ベクトルQ’と呼ぶこととする。圧縮スコア値ベクトルQ’は、k’個のスコア値uを成分とするk’次元の行ベクトルである。
その場合、磁気ディスク装置920などの記憶装置に必要となる記憶領域の容量は、更に、k’/k倍に削減できる。
したがって、測定しなければならない影響因子Fの数が減り、影響因子測定値xを記憶しておく磁気ディスク装置920などの記憶装置の記憶容量を節約できる。
そこで、この実施の形態の影響因子推定装置100は、特異値分解によって得た圧縮スコア値ベクトルQ’に基づいて、対応する測定値yが所定の条件を満たすか否かを判別する判別式を求め、求めた判別式の判別精度に基づいて、測定対象の状態(測定値y)に強い影響を与える影響因子Fを推定することにより、圧縮スコア値ベクトルQ’に変換したあとでも測定値yの予測精度を維持できる影響因子Fを、測定対象の状態(測定値y)に強い影響を与える影響因子Fとして推定する。
スコア値圧縮部136は、CPU911などの処理装置を用いて、特異値分解部133が算出したスコア値ベクトルQの成分であるスコア値uのうち、k’番目までの成分を抜き出して、圧縮スコア値ベクトルQ’を生成する。
まず、選択因子測定値取得部331は、CPU911などの処理装置を用いて、影響因子選択部132が選択した選択因子F’を示す選択因子情報Sを、磁気ディスク装置920などの記憶装置から取得する。
選択因子情報Sは、例えば、mビッド(mは、影響因子Fjの数)のデータであり、jビッド目が「1」の場合、j番目の影響因子Fjを選択することを示し、jビッド目が「0」の場合、j番目の影響因子Fjを選択しないことを示す。
例えば、選択因子情報Sが「1011…01」であれば、影響因子F1,F3,F4,…,Fmを選択し、影響因子F2,…,Fm−1を選択しないことを示す。
このとき、選択因子測定値取得部331は、選択因子情報Sの対応するビッドが「1」である影響因子Fについての影響因子測定値xだけを取得する。
したがって、選択因子情報Sによって示される選択因子F’の数がm’個であれば、選択因子測定値取得部331は、影響因子測定値記憶部122が記憶したm×n個の影響因子測定値xのうち、m’×n個の影響因子測定値xを取得する。
すなわち、選択因子測定値取得部331は、i番目の測定値yiに対応するm’個の影響因子測定値xを、対応する影響因子Fの順に並べたものを選択因子測定値ベクトルXi’とし、選択因子測定値ベクトルXi’のj’番目の成分を、i行j’列の成分とする行列を、パターン行列Pとする。
選択因子測定値取得部331は、影響因子測定値記憶部122が記憶した影響因子測定値xのなかから、影響因子選択部132が生成した選択因子情報Sによって示される選択因子F’についての影響因子測定値xを取得して、パターン行列Pとする。
選択因子測定値ベクトルX’は、選択因子測定値取得部331が生成したパターン行列Pの1行であり、測定値yと対応している。
すなわち、特異値算出部332は、CPU911などの処理装置を用いて、選択因子測定値取得部331が取得したパターン行列P(の成分)を、磁気ディスク装置920などの記憶装置から取得する。
特異値算出部332は、CPU911などの処理装置を用いて、取得したパターン行列Pの特異値σを計算する。
なお、CPU911などの処理装置を有するコンピュータが、特異値σを計算する計算方式については、既存の方式があるので、ここでは詳しく説明しない。
特異値算出部332は、CPU911などの処理装置を用いて、k個の特異値σをすべて算出し、大きい順に並べて、σ1,σ2,…,σkとする。
特異値算出部332は、例えば、k個の倍精度浮動小数点数の配列として、特異値を記憶する。あるいは、倍精度浮動小数点数を記憶するk個のフィールド(あるいはレコード)を持つファイルとして、特異値を記憶する。
すなわち、スコア値算出部333は、CPU911などの処理装置を用いて、選択因子測定値取得部331が取得したパターン行列P(の成分)を、磁気ディスク装置920などの記憶装置から取得する。
スコア値算出部333は、CPU911などの処理装置を用いて、特異値算出部332が算出したk個の特異値σを、磁気ディスク装置920などの記憶装置から取得する。
なお、CPU911などの処理装置を有するコンピュータが、スコア値uを計算する計算方式については、既存の方式があるので、ここでは詳しく説明しない。
スコア値行列Uは、k列n行の行列であるから、スコア値算出部333は、k×n個のスコア値uを算出する。
スコア値算出部333は、例えば、k×n個の倍精度浮動小数点数の(二次元)配列として、スコア値uを記憶する。あるいは、倍精度浮動小数点数を記憶するフィールドk個を有するレコードn個を持つファイルとして、スコア値uを記憶する。
特異値算出部332は、パターン行列Pのk個の特異値σ1,σ2,σ3,…,σkを算出する。
スコア値算出部333は、特異値算出部332が算出したk個の特異値σ1,σ2,σ3,…,σkに基づいて、m’列n行のパターン行列Pを特異値分解し、k列n行のスコア値行列U(の成分であるスコア値u)を算出する。
スコア値ベクトルQは、スコア値算出部333が算出したスコア値行列Uの1行であり、測定値yと対応している。
圧縮次元k’とは、1つの測定値yに対応する選択因子測定値ベクトルX’を、いくつのスコア値uで近似するかを示す数である。
例えば、選択因子測定値ベクトルX’にスコア値ベクトルQの第一成分u1の寄与率が50%、第二成分u2の寄与率が30%である場合、圧縮次元k’を2にすれば、80%の寄与率で選択因子測定値ベクトルX’を近似できる。
ここで、b番目の成分ubの寄与率とは、特異値σの合計に対する、b番目の特異値σbの割合をいう。
そこで、この実施の形態における影響因子推定装置100では、寄与率の合計が、あらかじめ定めた寄与率閾値t(ただし、0<t<1)よりも大きくなる最小のk’を求め、圧縮次元とする。
次に、圧縮次元算出部334は、CPU911などの処理装置を用いて、取得したk個の特異値σの合計を計算し、特異値合計Σ(σ)とする。
圧縮次元算出部334は、計算した特異値合計Σ(σ)を、磁気ディスク装置920などの記憶装置に記憶する。
なお、圧縮次元算出部334は、特異値σ1,σ2,…,σkを、添え字の小さいものから(特異値が大きいものから)順に足していき、その途中経過Σ(σi)=σ1+σ2+…+σi(iは、1〜kの整数)を、磁気ディスク装置920などの記憶装置に記憶しておく。
圧縮次元算出部334は、CPU911などの処理装置を用いて、計算した特異値合計Σ(σ)と、寄与率閾値tとの積t×Σ(σ)を計算し、特異値合計閾値Tとする。
圧縮次元算出部334は、CPU911などの処理装置を用いて、計算した特異値合計閾値Tを、磁気ディスク装置920などの記憶装置に記憶する。
圧縮次元算出部334は、CPU911などの処理装置を用いて、特異値合計閾値Tと、途中経過Σ(σi)とを比較する。
圧縮次元算出部334は、CPU911などの処理装置を用いて、途中経過Σ(σi)が、特異値合計閾値Tよりも大きい最小のiを見つけ、圧縮次元k’とする。
圧縮次元算出部334は、CPU911などの処理装置を用いて、圧縮次元k’を、磁気ディスク装置920などの記憶装置に記憶する。
まず、圧縮スコア値算出部335は、CPU911などの処理装置を用いて、圧縮次元算出部334が算出した圧縮次元k’を、磁気ディスク装置920などの記憶装置から取得する。
次に、圧縮スコア値算出部335は、CPU911などの処理装置を用いて、スコア値算出部333が算出したスコア値uを、磁気ディスク装置920などの記憶装置から取得する。
このとき、圧縮スコア値算出部335は、ある測定値yに対応するスコア値ベクトルQの成分であるk個のスコア値uのうち、1番目からk’番目までのスコア値u(k’個)を取得する。
すなわち、圧縮スコア値算出部335は、スコア値算出部333が算出したk×n個のスコア値uのうち、k’×n個のスコア値を取得する。
すなわち、圧縮スコア値算出部335は、ある測定値yに対応して取得したk’個のスコア値を成分とするベクトルを、圧縮スコア値ベクトルQ’とし、n個の圧縮スコア値ベクトルQ’を記憶する。すなわち、圧縮スコア値算出部335は、k’×n個のスコア値を記憶する。
圧縮スコア値算出部335は、例えば、k’×n個の倍精度浮動小数点数の(二次元)配列として、スコア値uを記憶する。あるいは、倍精度浮動小数点数を記憶するフィールドk’個を有するレコードn個を持つファイルとして、スコア値uを記憶する。
圧縮次元算出部334は、特異値算出部332が算出したk個の特異値σ1,σ2,σ3,…,σkに基づいて、圧縮次元k’を算出する。
圧縮スコア値算出部335は、圧縮次元算出部334が算出した圧縮次元k’に基づいて、スコア値算出部333が算出したk列n行のスコア値行列Uを圧縮し、k’列n行の圧縮スコア値行列U’とする。
例えば、圧縮次元k’が「3」であれば、圧縮スコア値算出部335は、スコア値行列Uの1列目〜3列目までを取り出して、圧縮スコア値行列U’とする。
圧縮スコア値ベクトルQ’は、圧縮スコア値算出部335が算出した圧縮スコア値行列U’の1行であり、測定値yと対応している。
特徴度Cとは、所定の条件を満たす測定値yについて、測定値yに対応する圧縮スコア値ベクトルQ’のバラツキの度合いを示す値である。
例えば、圧縮スコア値ベクトルQ’が、ほぼ一点に集中していれば、圧縮スコア値ベクトルQ’のバラツキが小さいといえる。
また、圧縮スコア値ベクトルQ’が、直線状に分布していれば、一点に集中している場合ほどではないが、圧縮スコア値ベクトルQ’のバラツキが小さいといえる。
特徴度Cは、このように、圧縮スコア値ベクトルQ’の分布状態を示す値である。
まず、圧縮スコア値ベクトル取得部391は、CPU911などの処理装置を用いて、測定値記憶部123が記憶したn個の測定値yを、磁気ディスク装置920などの記憶装置から取得する。
圧縮スコア値ベクトル取得部391は、CPU911などの処理装置を用いて、取得したn個の測定値yそれぞれについて、所定の条件を満たすか否かを判断する。
圧縮スコア値ベクトル取得部391が圧縮スコア値ベクトルQ‘を取得する条件には、例えば、測定値yが所定の閾値以下である場合、逆に、測定値yが所定の閾値以上である場合、または、測定値yが第一の閾値と第二の閾値の間にある場合などがある。
これらの条件は、測定値yの予測において、利用者が判別したい条件である。例えば、測定値yがある閾値を超えた場合に、部品交換などの対応をしなければならないのであれば、それを取得の条件とする。
これらの条件は、あらかじめ定めておき、圧縮スコア値ベクトル取得部391が、あらかじめ定められた条件にしたがって、その条件を満たすかを判断してもよい。
あるいは、条件だけはあらかじめ定めておくが、比較の対象となる閾値は可変できるようにしておき、影響因子推定装置100が、CPU911などの処理装置を用いて、キーボード902などの入力装置から入力してもよい。
あるいは、いくつかの条件のなかから、圧縮スコア値ベクトルQ’の取得条件を選べるようにしておき、そのなかから選んだ条件で、圧縮スコア値ベクトルQ’を取得することとしてもよい。
例えば、圧縮スコア値ベクトル取得部391は、測定値y1,y4,…が所定の条件を満たし、測定値y2,y3,…が所定の条件を満たさないと判断した場合、CPU911などの処理装置を用いて、圧縮スコア値ベクトルQ1’,Q4’,…の成分であるスコア値u11,u12,…,u1k’、u41,u42,…,u4k’、…を、磁気ディスク装置920などの記憶装置から取得する。
圧縮スコア値ベクトル取得部391は、所定の条件を満たすと判断した測定値yがn’個あるとすると、n’個の測定値yに対応するn’個の圧縮スコア値ベクトルQ’の成分であるk’×n’個のスコア値uを、磁気ディスク装置920などの記憶装置から取得する。
圧縮スコア値ベクトル取得部391は、例えば、n’×k’個の倍精度浮動小数点数の(二次元)配列として、取得した圧縮スコア値ベクトルQ’を記憶する。あるいは、倍精度浮動小数点数を記憶するフィールドk’個を有するレコードn’個を持つファイルとして、取得した圧縮スコア値ベクトルQ’を記憶する。
ここで、回帰式とは、ある程度の広がりを持って分布する圧縮スコア値ベクトルQ’の分布を近似する方程式である。
圧縮スコア値ベクトルQ’の圧縮次元がk’である場合、圧縮スコア値ベクトルQ’に対応するk’次空間における点を、k’次空間における回帰式が表わす超平面(または超曲面)上の点で近似する。
圧縮スコア値ベクトルQ’は、k’個のスコア値uを成分としてもつ。ここで、圧縮スコア値ベクトルQ‘の第一成分であるスコア値u1を説明変数、第二成分であるスコア値u2を目的変数とし、u2=au1+b+ε(ただし、a,bは、回帰式のパラメータ。εは、回帰誤差)について、εの二乗の合計が最も小さくなる直線の方程式l:U2=a・u1+b(ただし、U2は、スコア値u2の予測値であって、u2=U2+ε)を回帰式として、回帰式のパラメータa,bを求める。
ここで、スコア値uiの平均値をAve(ui)、分散をVar(ui)、スコア値u1とスコア値u2との共分散をCov(u1,u2)とすると、回帰式lは、l:U2=Cov(u1,u2)/Var(u1)・{u1−Ave(u1)}+Ave(u2)であることが知られている。
したがって、a=Cov(u1,u2)/Var(u1)、b=Ave(u2)―Ave(u1)・Cov(u1,u2)/Var(u1)を計算することにより、回帰式のパラメータを算出することができる。
まず、基準スコア値平均値算出部341は、CPU911などの処理装置を用いて、圧縮スコア値ベクトル取得部391が取得したn’個の圧縮スコア値ベクトルQ’の成分であるk’×n’個のスコア値uを、磁気ディスク装置920などの記憶装置から取得する。
次に、基準スコア値平均値算出部341は、CPU911などの処理装置を用いて、取得した圧縮スコア値ベクトルQ’の各成分それぞれについて、スコア値uの合計を計算し、基準スコア値合計Σ(ub)(bは、1〜k’の整数)とする。
圧縮スコア値ベクトル取得部391が取得した圧縮スコア値ベクトルQ’の数がn’個だとすると、基準スコア値平均値算出部341は、n’個の圧縮スコア値ベクトルQ’の各成分について、n’個のスコア値uを合計する。
圧縮スコア値ベクトルQ’は、k’次元のベクトルなので、基準スコア値平均値算出部341は、各成分ごとに基準スコア値合計Σ(ub)を計算し、圧縮スコア値ベクトルQ’のk’個の成分に対応して、k’個の基準スコア値合計Σ(ub)を計算する。
基準スコア値平均値算出部341は、圧縮スコア値ベクトルQ’のk’個の成分に対応して、k’個の基準スコア値平均値Ave(ub)を計算する。
基準スコア値平均値算出部341は、例えば、k’個の倍精度浮動小数点数の配列として、基準スコア値平均値Ave(ub)を記憶する。あるいは、倍精度浮動少数点数を記憶するフィールド(あるいはレコード)k’個を持つファイルとして、基準スコア値平均値Ave(ub)を記憶する。
まず、基準スコア値分散算出部342は、CPU911などの処理装置を用いて、圧縮スコア値ベクトル取得部391が取得したn’個の圧縮スコア値ベクトルQ’の成分であるk’×n’個のスコア値uを、磁気ディスク装置920などの記憶装置から取得する。
基準スコア値分散算出部342は、CPU911などの処理装置を用いて、基準スコア値平均値算出部341が計算したk’個の基準スコア値平均値Ave(ub)を、磁気ディスク装置920などの記憶装置から取得する。
基準スコア値分散算出部342は、圧縮スコア値ベクトルQ’のk’個の成分に対応して、k’個の基準スコア値分散Var(ub)を計算する。
基準スコア値分散算出部342は、例えば、k’個の倍精度浮動小数点数の配列として、基準スコア値分散Var(ub)を記憶する。あるいは、倍精度浮動少数点数を記憶するフィールド(あるいはレコード)k’個を持つファイルとして、基準スコア値分散Var(ub)を記憶する。
まず、基準スコア値共分散算出部343は、CPU911などの処理装置を用いて、圧縮スコア値ベクトル取得部391が取得したn’個の圧縮スコア値ベクトルQ’の成分であるk’×n’個のスコア値uを、磁気ディスク装置920などの記憶装置から取得する。
基準スコア値共分散算出部343は、CPU911などの処理装置を用いて、基準スコア値平均値算出部341が計算したk’個の基準スコア値平均値Ave(ub)を、磁気ディスク装置920などの記憶装置から取得する。
基準スコア値共分散算出部343は、CPU911などの処理装置を用いて、取得したスコア値uと、取得したk’個の基準スコア値平均値Ave(ub)とに基づいて、圧縮スコア値ベクトルQ’の2つの成分の間の共分散を計算し、基準スコア値共分散Cov(ub1,ub2)(b1は、1〜k’−1の整数。b2は、b1+1〜k’の整数)とする。
圧縮スコア値ベクトルQ’はk’次元ベクトルなので、k’個の成分を有する。そのなかから2つを選ぶ組み合わせは、{k’・(k’−1)/2}通りある。したがって、基準スコア値共分散算出部343は、{k’・(k’−1)/2}個の基準スコア値共分散Cov(ub1,ub2)を計算する。
基準スコア値共分散算出部343は、CPU911などの処理装置を用いて、ある圧縮スコア値ベクトルQ’に対応するk’個のスコア値偏差Δuのなかから、2つのスコア値偏差Δuを選んで、スコア値偏差Δuの積を計算し、スコア値偏差積Δub1Δub2(b1は、1〜k’−1の整数。b2は、b1+1〜k’の整数)とする。
1つの圧縮スコア値ベクトルQ’に対応するk’個のスコア値偏差Δuのなかから2つのスコア値偏差を選ぶ組み合わせは{k’・(k’−1)/2}通りなので、基準スコア値共分散算出部343は、1つの測定値yにつき、{k’・(k’−1)/2}個のスコア値偏差積Δub1Δub2を計算する。
また、圧縮スコア値ベクトル取得部391が取得した圧縮スコア値ベクトルQ’はn’個あるので、基準スコア値共分散算出部343は、n’個の圧縮スコア値ベクトルQ’に対応して、全部で、{k’・(k’−1)/2}×n’個のスコア値偏差積Δub1Δub2を計算する。
基準ベクトル群Gに属する圧縮スコア値ベクトルQ’の数はn’個であるから、同じ2つの成分について計算したスコア値偏差積Δub1Δub2もn’個ある。基準スコア値共分散算出部343は、n’個のスコア値偏差積Δub1Δub2を合計して、スコア値偏差積合計Σ(Δub1Δub2)を計算する。
また、圧縮スコア値ベクトルQ’のk’個の成分から、2つの成分を選ぶ組み合わせは{k’・(k’−1)/2}通りなので、基準スコア値共分散算出部343は、{k’・(k’−1)/2}個のスコア値偏差積合計Σ(Δub1Δub2)を計算する。
基準スコア値共分散算出部343は、CPU911などの処理装置を用いて、計算したスコア値偏差積合計Σ(Δub1Δub2)を、圧縮スコア値ベクトル取得部391が取得した圧縮スコア値ベクトルQ’の数n’で除して、基準スコア値共分散Cov(ub1,ub2)を求める。
基準スコア値共分散算出部343は、例えば、k’×k’個の倍精度浮動小数点数の(二次元)配列として、基準スコア値共分散Cov(ub1,ub2)を記憶する。
すなわち、回帰誤差算出部393は、CPU911などの処理装置を用いて、回帰式算出部392が算出した回帰式のパラメータを、磁気ディスク装置920などの記憶装置から取得する。
次に、回帰誤差算出部393は、CPU911などの処理装置を用いて、圧縮スコア値ベクトル取得部391が取得したn’個の圧縮スコア値ベクトルQ’の成分であるk’×n’個のスコア値uを、磁気ディスク装置920などの記憶装置から取得する。
例えば、上記説明した圧縮次元k’が2の場合の例であれば、回帰式として、直線の方程式l:U2=a・u1+b(ただし、u2=U2+ε)を用いるので、回帰誤差εは、ε=a・u1+b−u2を計算することにより、算出することができる。
なお、回帰誤差の二乗ε2は、近似誤差の一例である。特徴度算出部134は、近似誤差として、例えば、回帰誤差の絶対値を用いてもよい。
回帰誤差合計算出部394は、CPU911などの処理装置を用いて、算出した特徴度Cを、磁気ディスク装置920などの記憶装置に記憶する。
逆に、所定の条件を満たす測定値yに対応する圧縮スコア値ベクトルQ’のバラツキが大きい場合、圧縮スコア値ベクトルQ’が与えられたとき、それに対応する測定値yが所定の条件を満たすか否かを予測しにくい可能性が高い。
判別度算出部138は、CPU911などの処理装置を用いて、判別結果が正しいか否かを判定し、判別式算出部137が算出した判別式の判別精度を示す値を算出して、判別度とする。
まず、判別式算出部137について説明する。
判別式算出部137は、バラツキ判定部371、分散共分散行列逆行列算出部344、判別式パラメータ算出部372を有する。
まず、バラツキ判定部371は、CPU911などの処理装置を用いて、特徴度算出部134が算出した特徴度Cを、磁気ディスク装置920などの記憶装置から取得する。
次に、バラツキ判定部371は、CPU911などの処理装置を用いて、取得した特徴度Cを所定の値と比較する。
特徴度Cが所定の値より小さい場合、バラツキ判定部371は、特徴度算出部134が取得した圧縮スコア値ベクトルQ’のバラツキが小さく、特徴度Cが良好であると判断する。
特徴度Cが所定の値以上である場合、バラツキ判定部371は、特徴度算出部134が取得した圧縮スコア値ベクトルQ’のバラツキが大きく、特徴度Cが良好ではないと判断する。
バラツキ判定部371は、特徴度Cが良好でないと判断した場合、影響因子選択部132に通知する。これにより、影響因子推定装置100は、判別式の算出、判別度の算出など以下の処理を中止し、次の選択因子F’についての処理を始める。
ここで、判別式とは、スコア値uを変数とする関数であって、判別式に、スコア値uの値を代入することによって得た判別式の値によって、対応する測定値yが所定の条件を満たすかどうかを判別するものをいう。
例えば、測定値yが所定の条件を満たすとき、判別式の値が0以上となり、測定値yが所定の条件を満たさないとき、判別式の値が0未満となるように、判別式のパラメータを設定しておけば、測定値yが不明であっても、判別式にスコア値uの値を代入することにより、判別式の値を求めれば、測定値yが所定の条件を満たすかどうかを判別できる。
ここで、基準ベクトル群Gとは、所定の条件を満たす測定値yに対応する圧縮スコア値ベクトルQ’のグループである。したがって、基準ベクトル群Gに属する圧縮スコア値ベクトルQ’は、特徴度算出部134が取得した圧縮スコア値ベクトルと等しい。
ベクトル群Gの重心(ベクトルの各成分の平均値を成分とするベクトル)をμ、各成分の分散共分散行列をΣとすると、ベクトル群Gに対するベクトルQ’のマハラノビス距離Dは、D2=(ΔQ’)Σ−1(ΔQ’)Tで求められる。
ここで、ΔQ’は、ベクトルQ’から重心ベクトルμを減算した偏差ベクトル(行ベクトル)、(ΔQ’)Tは、行ベクトルであるΔQ’を転置して列ベクトルにしたものである。また、Σ−1は、分散共分散行列Σの逆行列である。
なお、分散共分散行列Σとは、ベクトル群Gの各成分の分散を対角成分とし、ベクトル群Gの2つの成分の共分散をその他の成分とする対称行列である。ベクトル群Gがk’次元のベクトルの群である場合、分散共分散行列Σは、k’列k’行の行列となる。
ここで、分散共分散行列Σは、圧縮スコア値ベクトルQ’のb番目の成分についての基準スコア値分散Var(ub)をb列b行の成分とし、圧縮スコア値ベクトルQ’のb1番目の成分とb2番目の成分との組み合わせについての基準スコア値共分散Cov(ub1,ub2)を、b1列b2行の成分とする行列である。
なお、Cov(ub1,ub2)=Cov(ub2,ub1)であるから、基準スコア値共分散算出部343は、b1<b2の場合についてのみCov(ub1,ub2)を計算すればよい。
分散共分散行列逆行列算出部344は、CPU911などの処理装置を用いて、基準スコア値共分散算出部343が算出した{k’・(k’−1)/2}個の基準スコア値共分散Cov(ub1,ub2)を、磁気ディスク装置920などの記憶装置から取得する。
分散共分散行列逆行列算出部344は、CPU911などの処理装置を用いて、取得した基準スコア値分散Var(ub)と、取得した基準スコア値共分散Cov(ub1,ub2)とから、分散共分散行列Σを生成する。
分散共分散行列逆行列算出部344は、例えば、k’×k’個の倍精度浮動小数点数の(二次元)配列として、分散共分散行列Σを記憶する。このとき、分散共分散行列逆行列算出部344は、基準スコア値共分散算出部343が算出した基準スコア値共分散Cov(ub1,ub2)を記憶したk’×k’個の倍精度浮動小数点数の配列に、値を書き加えることにより、分散共分散行列Σを生成し、記憶してもよい。
CPU911などの処理装置を有するコンピュータが、逆行列を算出する計算方式は、既存の方式があるので、ここでは説明を省略する。
分散共分散行列逆行列算出部344は、例えば、k’×k’個の倍精度浮動小数点数の(二次元)配列として、逆行列Σ−1の成分を記憶する。
判別式パラメータ算出部372は、また、CPU911などの処理装置を用いて、特徴度算出部134の基準スコア値平均値算出部341が算出した基準スコア値平均値Ave(ub)を、磁気ディスク装置920などの記憶装置から取得する。
判別式パラメータ算出部372は、CPU911などの処理装置を用いて、取得した分散共分散行列の逆行列Σ−1及び取得した基準スコア値平均値Ave(ub)から、基準ベクトル群Gに対するマハラノビス距離を求めるためのパラメータを算出し、判別式のパラメータとする。
判別式パラメータ算出部372は、CPU911などの処理装置を用いて、算出した判別式のパラメータを、磁気ディスク装置920などの記憶装置に記憶する。
判別度算出部138は、条件判断部381、判別結果判断部382、判別結果比較部383、正解率算出部384を有する。
まず、条件判断部381は、CPU911などの処理装置を用いて、測定値記憶部123が記憶したn個の測定値yを取得する。
次に、条件判断部381は、CPU911などの処理装置を用いて、取得したn個の測定値yそれぞれについて、所定の条件を満たすか否かを判断する。
次に、条件判断部381は、CPU911などの処理装置を用いて、判断したn個の判断結果を、磁気ディスク装置920などの記憶装置に記憶する。
なお、圧縮スコア値ベクトル取得部391が圧縮スコア値ベクトルQ’を取得する際に判断した結果を磁気ディスク装置920などの記憶装置に記憶しておき、条件判断部381は、その判断結果を磁気ディスク装置920などの記憶装置から取得することとしてもよい。
まず、判別結果判断部382は、CPU911などの処理装置を用いて、判別式算出部137(の判別式パラメータ算出部372)が算出した判別式のパラメータを、磁気ディスク装置920などの記憶装置から取得する。
次に、判別結果判断部382は、CPU911などの処理装置を用いて、スコア値圧縮部136が算出したk’×n個のスコア値uを、磁気ディスク装置920などの記憶装置から取得する。
次に、判別結果判断部382は、CPU911などの処理装置を用いて、測定値記憶部123が記憶したn個の測定値yそれぞれについて、対応する圧縮スコア値ベクトルQ’の成分sであるスコア値uを、取得したパラメータによって示される判別式に代入して、基準ベクトル群Gに対する圧縮スコア値ベクトルQ’のマハラノビス距離の二乗を算出する。
判別結果判断部382は、圧縮スコア値ベクトルQ’の1つの成分に対応するn個のスコア値uから、その成分に対応する基準スコア値平均値Ave(ub)を減算し、n個のスコア値偏差Δuを計算する。
圧縮スコア値ベクトルQ’の成分はk’個あるから、判別結果判断部382は、全部でk’×n個のスコア値偏差Δuを計算する。
圧縮スコア値ベクトルQ’は、n個の測定値yと対応してn個あるので、判別結果判断部382は、n個の圧縮スコア値ベクトルQ’に対応して、n個のマハラノビス距離の二乗D2を計算する。
すなわち、基準ベクトル群Gに対する圧縮スコア値ベクトルQ’のマハラノビス距離の二乗D2が所定の閾値より小さければ、その圧縮スコア値ベクトルQ’は、基準ベクトル具Gに属すると考えられるので、対応する測定値yは、所定の条件を満たしているはずである。
逆に、基準ベクトル群Gに対する圧縮スコア値ベクトルQ’のマハラノビス距離の二乗D2が所定の閾値より大きければ、その圧縮スコア値ベクトルQ’は、基準ベクトル具Gに属さないと考えられるので、対応する測定値yは、所定の条件を満たしていないはずである。
このように、判別結果判断部382は、測定値記憶部123が記憶した測定値yを参照することなく、判別式と、圧縮スコア値ベクトルQ’の成分であるスコア値uとに基づいて、測定値yが所定の条件を満たすか否かを判別する。
判別結果判断部382は、CPU911などの処理装置を用いて、判別したn個の判別結果を、磁気ディスク装置920などの記憶装置に記憶する。
まず、判別結果比較部383は、CPU911などの処理装置を用いて、条件判断部381が判断したn個の判断結果を、磁気ディスク装置920などの記憶装置から取得する。
次に、判別結果比較部383は、CPU911などの処理装置を用いて、判別結果判断部382が判別したn個の判別結果を、磁気ディスク装置920などの記憶装置から取得する。
次に、判別結果比較部383は、CPU911などの処理装置を用いて、測定値記憶部123が記憶したn個の測定値yそれぞれについて、対応する判断結果と、対応する判別結果とを比較して、判別結果が正しいか否かを判断する。
次に、判別結果比較部383は、CPU911などの処理装置を用いて、判別結果が正しいか否かについてのn個の判断結果を、磁気ディスク装置920などの記憶装置に記憶する。
ここで、判別結果の正解率とは、判別結果判断部382が判別した判別結果の数(n個)に対して、それが正しい場合の数の比率である。
まず、正解率算出部384は、CPU911などの処理装置を用いて、判別結果比較部383が判断したn個の判断結果を、磁気ディスク装置920などの記憶装置から取得する。
次に、正解率算出部384は、CPU911などの処理装置を用いて、取得したn個の判断結果のうち、判別結果が正しいと判断した判断結果の数を数えて、正解数pとする。
次に、正解率算出部384は、CPU911などの処理装置を用いて、正解数pを判断結果の数nで割り、正解率n/pを計算し、判別度とする。
次に、正解率算出部384は、CPU911などの処理装置を用いて、算出した判別度を、磁気ディスク装置920などの記憶装置に記憶する。
この例では、内部抵抗値が0〜2kΩの範囲内にあるか否かを所定の条件として、測定値yがその条件を満たすか否かを判断すべきものとする。
図中、点線で示した楕円体は、マハラノビス距離の二乗D2が所定の閾値と等しくなる点の集合であり、圧縮スコア値ベクトルQ’に対応する点が楕円体の内部であれば、対応する測定値yが所定の条件を満たすと、判別される。
この例では、点線で示した楕円体の内部に含まれる13個の点に対応する圧縮スコア値ベクトルQ’について、対応する測定値yが所定の条件を満たすものと判別する。
このうち、実際に、対応する測定値yが所定の条件を満たしているものは、9個である。
また、点線で示した楕円体の外部にある20個の点に対応する圧縮スコア値ベクトルQ’については、対応する測定値yが所定の条件を満たさないものと判別する。
このうち、実際に、対応する測定値yが所定の条件を満たしていないものは、17個である。
したがって、この例では、全部で33個の測定値yのうち、26個について正しく判別できたので、判別度算出部138が算出する判別度は、26/33=0.787…である。
例えば、ある部品が寿命かどうかを判別したい場合、寿命がきているものを誤って寿命がきていないと判別してしまうと致命的となりうる。一方、寿命がきていないものを誤って寿命がきていると判別してしまうコストは、逆の場合と比べて低い。
したがって、その場合、間違えた方向によって異なる重み付けを持つ判別度を、判別度算出部138が算出することが好ましい。
例えば、基準ベクトル群G以外のベクトル群からのマハラノビス距離も算出して、基準ベクトル群Gからのマハラノビス距離と比較して、近いほうの群に属するものと判別する判別方式に基づく判別式であってもよい。
圧縮スコア値ベクトルQ’により、測定値yが明確に分かれる場合には、判別度が大きく、測定値yが明確に分かれない場合には、判別度が小さくなる。
また、判別度が小さい場合には、一般的に、圧縮スコア値ベクトルQ’のバラツキが大きいので、特徴度Cが大きくなり、逆に、判別度が大きい場合には、特徴度Cが小さくなる傾向がある。特徴度Cと判別度との間には、点線の楕円で示すような負の相関がある。
この実施の形態では、特徴度Cが所定の閾値より小さい場合だけ判別度を算出し、特徴度Cが所定の閾値より大きい場合には、判別度を算出せずに次の選択因子を試すことにしているので、計算時間を短縮することができる。
強影響因子選択部135は、CPU911などの処理装置を用いて、判別度算出部138が算出した判別度を、磁気ディスク装置920などの記憶装置から取得する。
強影響因子選択部135は、CPU911などの処理装置を用いて、取得した判別度に基づいて、判別式算出部137が算出した判別式の判別精度が高いか否かを判断する。
この例では、判別度が大きいほど、判別式算出部137が算出した判別式の判別精度が高いことを示しているので、強影響因子選択部135は、特徴度算出部134が算出した判別度が最も大きい場合に、判別式算出部137が算出した判別式の判別精度が最も高いと判断する。
強影響因子選択部135は、CPU911などの処理装置を用いて、判別式算出部137が算出した判別式の判別精度が高いと判断した場合に、影響因子選択部132が選択した選択因子F’を示す選択因子情報Sを、磁気ディスク装置920などの記憶装置から取得する。
強影響因子選択部135は、CPU911などの処理装置を用いて、取得した選択因子情報Sを、強影響因子情報として、磁気ディスク装置920などの記憶装置に記憶する。
例えば、強影響因子選択部135は、判別度算出部138が算出した判別度のうち、最も値が大きいものを最善判別度として、磁気ディスク装置920などの記憶装置に記憶しておく。また、最善判別度に対応する選択因子情報Sを最善選択因子情報Sbestとして、磁気ディスク装置920などの記憶装置に記憶しておく。
影響因子選択部132が新たな選択因子F’を選択し、判別度算出部138が新たな判別度を算出すると、強影響因子選択部135は、CPU911などの処理装置を用いて、判別度算出部138が新たに算出した判別度と、記憶している最善判別度とを比較して、どちらが大きいかを判断する。
最善判別度のほうが大きい場合には、強影響因子選択部135は、何もしない。
新たな判別度のほうが大きい場合には、強影響因子選択部135は、CPU911などの処理装置を用いて、新しい判別度を、最善判別度として、磁気ディスク装置920などの記憶装置に記憶する。また、それに対応する選択因子情報Sを、強影響因子情報Sbestとして、磁気ディスク装置920などの記憶装置に記憶する。
これにより、強影響因子選択部135は、常に、それまでに計算したなかで最大の判別度に対応する選択因子F’を示す選択因子情報Sを記憶する。
強影響因子出力部145は、CPU911などの処理装置を用いて、強影響因子選択部135が選択した強影響因子情報Sbestを、磁気ディスク装置920などの記憶装置から取得する。
強影響因子出力部145は、CPU911などの処理装置を用いて、取得した強影響因子情報Sbestから、選択された影響因子がどれかを判別する。
強影響因子出力部145は、CPU911などの処理装置を用いて、影響因子情報記憶部121が記憶した影響因子情報のうち、選択されたと判別した影響因子についての情報(例えば、影響因子の名前)を、磁気ディスク装置920などの記憶装置から取得する。
強影響因子出力部145は、CPU911などの処理装置を用いて、取得した影響因子についての情報を、CRTなどの表示装置901やその他の出力装置に出力する。
重み付け算出部131は、算出したm個の影響因子重み付けWを、磁気ディスク装置920などの記憶装置を用いて、記憶する。
なお、影響因子選択部132は、CPU911などの処理装置を用いて、S11で重み付け算出部131が算出したm個の影響因子重み付けWを、磁気ディスク装置920などの記憶装置から取得し、取得した影響因子重み付けWに基づいて、選択因子F’を選択する。
影響因子選択部132は、CPU911などの処理装置を用いて、生成した選択因子情報Sを、磁気ディスク装置920などの記憶装置に記憶する。
なお、特異値分解部133は、CPU911などの処理装置を用いて、S12で影響因子選択部132が生成した選択因子情報Sを、磁気ディスク装置920などの記憶装置から取得し、所得した選択因子情報Sによって示される選択因子F’についての選択因子測定値x(m’×n個)だけを取得する。
特異値分解部133は、CPU911などの処理装置を用いて、パターン行列Pを特異値分解する。ここで、パターン行列Pは、取得した影響因子測定値xを成分とするm’次元の選択因子測定値ベクトルX’を行ベクトルとするm’列n行の行列である。
特異値分解部133は、CPU911などの処理装置を用いて、パターン行列Pの特異値σ(k個)を算出する。
特異値分解部133は、CPU911などの処理装置を用いて、パターン行列Pを特異値分解して得られるk列n行のスコア値行列U(の成分u)を算出する。
特異値分解部133は、CPU911などの処理装置を用いて、k個の特異値σと、スコア値行列U(の成分であるk×n個のスコア値u)を、磁気ディスク装置920などの記憶装置に記憶する。
スコア値圧縮部136は、CPU911などの処理装置を用いて、取得した特異値σに基づいて、圧縮次元k’を算出する。
スコア値圧縮部136は、CPU911などの処理装置を用いて、特異値分解部133が算出したスコア値uを、磁気ディスク装置920などの記憶装置から取得する。
このとき、スコア値圧縮部136は、スコア値行列Uの行ベクトルであるスコア値ベクトルQの1番目〜k’番目の成分であるスコア値u(k’×n個)だけを取得する。
スコア値圧縮部136は、CPU911などの処理装置を用いて、取得したスコア値uを成分とする圧縮スコア値ベクトルQ’を生成し、n個の圧縮スコア値ベクトルQ’(の成分であるk’×n個のスコア値u)を、磁気ディスク装置920などの記憶装置に記憶する。
特徴度算出部134は、CPU911などの処理装置を用いて、n個の測定値yそれぞれについて、測定値yが所定の条件を満たすか否かを判断する。
特徴度算出部134は、CPU911などの処理装置を用いて、S14でスコア値圧縮部136が算出したn個の圧縮スコア値ベクトルQ’のうち、対応する測定値yが所定の条件を満たす圧縮スコア値ベクトルQ’の成分であるスコア値uを、磁気ディスク装置920などの記憶装置から取得する。
特徴度算出部134は、CPU911などの処理装置を用いて、対応する測定値yが所定の条件を満たす圧縮スコア値ベクトルQ’のバラツキの度合いを示す値を算出し、特徴度Cとして、磁気ディスク装置920などの記憶装置に記憶する。
バラツキが小さい場合には、S17へ進む。
バラツキが大きい場合には、S22へ進む。
判別度算出部138は、CPU911などの処理装置を用いて、S14でスコア値圧縮部136が算出した圧縮スコア値ベクトルQ’の成分であるスコア値uを、磁気ディスク装置920などの記憶装置から取得する。
判別度算出部138は、CPU911などの処理装置を用いて、取得したスコア値uを、取得したパラメータによって示される判別式に代入し、判別式の値を計算する。
判別度算出部138は、CPU911などの処理装置を用いて、計算した判別式の値から、対応する測定値yが所定の条件を満たすか否かを判別する。
判別度算出部138は、CPU911などの処理装置を用いて、測定値記憶部123が記憶した測定値yを、磁気ディスク装置920などの記憶装置から取得する。
判別度算出部138は、CPU911などの処理装置を用いて、取得した測定値yが所定の条件を満たすか否かを判断する。
判別度算出部138は、CPU911などの処理装置を用いて、判別した判別結果が正しいか否かを判断する。
判別度算出部138は、CPU911などの処理装置を用いて、判別した判別結果のうち、正しい判別結果を得た数の割合(正解率)を計算し、判別度として、磁気ディスク装置920などの記憶装置に記憶する。
強影響因子選択部135は、CPU911などの処理装置を用いて、あらかじめ記憶した最善判別度を、磁気ディスク装置920などの記憶装置から取得する。
なお、最善判別度には、初期値として「0」を記憶しておくこととする。
強影響因子選択部135は、CPU911などの処理装置を用いて、取得した判別度と、最善判別度とを比較し、どちらが大きいか判断する。
判別度のほうが最善判別度よりも大きいと判断した場合には、S20へ進む。
判別度が最善判別度以下であると判断した場合には、S21へ進む。
強影響因子選択部135は、CPU911などの処理装置を用いて、S12(またはS22)で影響因子選択部132が生成した選択因子情報Sを、磁気ディスク装置920などの記憶装置から取得する。
強影響因子選択部135は、CPU911などの処理装置を用いて、取得した選択因子情報Sを、強影響因子情報Sbestとして、磁気ディスク装置920などの記憶装置に記憶する。
例えば、あらかじめキーボード902などの入力装置から入力した計算時間が経過した場合に、選択終了条件を満たしたと判断する。
あるいは、キーボード902などの入力装置から計算を終了せよという指令を入力した場合に、選択終了条件を満たしたと判断する。
あるいは、これ以上計算を続けても、最善判別度が改善する見込みがないと判断した場合に、選択終了条件を満たしたと判断する。例えば、最善判別度が、判別度の理論上の最大値(正解率なら、1)とほぼ等しい場合や、所定の回数以上選択を繰り返して、最善判別度が改善しなかった場合などがある。
選択終了条件を満たしていないと判断した場合、S22へ進む。
選択終了条件を満たしていると判断した場合、S23へ進む。
なお、影響因子選択部132は、CPU911などの処理装置を用いて、S11で重み付け算出部131が算出したm個の影響因子重み付けWを、磁気ディスク装置920などの記憶装置から取得する。また、影響因子選択部132は、CPU911などの処理装置を用いて、S15で特徴度算出部134が算出した特徴度Cを、磁気ディスク装置920などの記憶装置から取得する。
影響因子選択部132は、取得したm個の影響因子重み付けWと、特徴度Cとに基づいて、選択因子情報Sを修正する。
例えば、判別度が前々回と比較して改善した場合には、前回の修正と同じ方向性の修正を、選択因子情報Sに加える。逆に、判別度が前々回と比較して悪くなった場合には、前回の修正と逆の方向の修正を、選択因子情報Sに加える。あるいは、何回か修正して、判別度があまり改善しない場合には、まったく新しい選択因子情報Sを生成する。
影響因子選択部132は、CPU911などの処理装置を用いて、修正した選択因子情報Sを、磁気ディスク装置920などの記憶装置に記憶する。
その後、S13に戻り、新たに選択した選択因子F’に基づいて、特異値分解、特徴度算出などの処理を繰り返す。
強影響因子出力部145は、CPU911などの処理装置を用いて、影響因子情報記憶部121が記憶した影響因子情報のうち、取得した強影響因子情報Sbestによって示される影響因子についての情報を、磁気ディスク装置920などの記憶装置から取得する。
強影響因子出力部145は、CPU911などの処理装置を用いて、取得した影響因子についての情報(例えば、影響因子の名前)を、CRTなどの表示装置901やその他の出力装置に出力する。
ここで説明した影響因子推定装置100は、例えば、劣化要因分析、つまり劣化寿命に影響を及ぼす外的要因を見つけることができる。
従来、この手の問題は、一般に重回帰分析で仮説検定を行いその仮説を採用するか、棄却するかを決めていたが、ここで説明した影響因子推定装置100によれば、仮説を設定する必要がなく、仮説を自動的に導出することができる。
すなわち、影響因子推定装置100は、主成分分析における寄与率から主成分次元を導出し、導出した主成分次元におけるデータのバラツキから、その相関度合いを特定する。
また、影響因子推定装置100は、マハラノビス距離を求め、求めたマハラノビス距離におけるデータのバラツキから、その相関度合いを特定する。
実施の形態2を、図15〜図18を用いて説明する。
この実施の形態における影響因子推定装置100の外観・ハードウェア構成・ブロック構成は、実施の形態1において図1〜図3を用いて説明したものと同様なので、ここでは説明を省略する。
影響因子選択部132は、影響因子分類部321、選択因子数生成部322、強相関因子選択部323、弱相関因子選択部324、選択因子情報生成部325、局所解判断部326を有する。
強相関因子群及び弱相関因子群は、影響因子グループの一例である。
なお、この例では2つのグループに分類するが、3つ以上のグループに分類してもよい。
例えば、影響因子分類部321は、CPU911などの処理装置を用いて、影響因子重み付けWを所定の値と比較し、影響因子重み付けWが所定の値以上であれば、対応する影響因子Fを強相関因子群に分類し、影響因子重み付けWが所定の値未満であれば、対応する影響因子Fを弱相関因子群に分類する。
影響因子分類部321は、CPU911などの処理装置を用いて、影響因子Fの分類についての情報を、磁気ディスク装置920などの記憶装置に記憶する。
選択因子数生成部322が生成する選択因子数には、影響因子選択部132が選択する選択因子F’のうち、強相関因子群から選択する選択因子F’の数である強相関選択因子数と、弱相関因子群から選択する選択因子F’の数である弱相関選択因子数とがある。
強創刊選択因子数及び弱相関選択因子数は、グループ選択因子数の一例である。
選択因子数生成部322は、CPU911などの処理装置を用いて、1以上、影響因子分類部321が強相関因子群に分類した影響因子Fの数以下の整数を、ランダムに生成し、強相関選択因子数とする。
同様に、選択因子数生成部322は、CPU911などの処理装置を用いて、0以上、影響因子分類部321が弱相関因子群に分類した影響因子Fの数以下の整数を、ランダムに生成し、弱相関選択因子数とする。
選択因子数生成部322は、CPU911などの処理装置を用いて、生成した選択因子数を、磁気ディスク装置920などの記憶装置に記憶する。
まず、強相関因子選択部323は、CPU911などの処理装置を用いて、影響因子分類部321が分類した影響因子Fの分類についての情報を、磁気ディスク装置920などの記憶装置から取得する。
次に、強相関因子選択部323は、CPU911などの処理装置を用いて、選択因子数生成部322が生成した強相関選択因子数を、磁気ディスク装置920などの記憶装置から取得する。
次に、強相関因子選択部323は、CPU911などの処理装置を用いて、取得した影響因子Fの分類についての情報を分析し、どの影響因子Fが強相関影響因子群に分類されたかを取得する。
次に、強相関因子選択部323は、CPU911などの処理装置を用いて、強相関影響因子群に分類された影響因子Fのなかから、影響因子を1つ選択し、選択因子F’とする。強相関因子選択部323は、CPU911などの処理装置を用いて、これを取得した強相関選択因子数の回数繰り返す。
強相関因子選択部323は、CPU911などの処理装置を用いて、選択した選択因子F’についての情報を、磁気ディスク装置920などの記憶装置に記憶する。
まず、弱相関因子選択部324は、CPU911などの処理装置を用いて、影響因子分類部321が分類した影響因子Fの分類についての情報を、磁気ディスク装置920などの記憶装置から取得する。
次に、弱相関因子選択部324は、CPU911などの処理装置を用いて、選択因子数生成部322が生成した弱相関選択因子数を、磁気ディスク装置920などの記憶装置から取得する。
次に、弱相関因子選択部324は、CPU911などの処理装置を用いて、取得した影響因子Fの分類についての情報を分析し、どの影響因子Fが弱相関影響因子群に分類されたかを取得する。
次に、弱相関因子選択部324は、CPU911などの処理装置を用いて、弱相関影響因子群に分類された影響因子Fのなかから、影響因子を1つ選択し、選択因子F’とする。弱相関因子選択部324は、CPU911などの処理装置を用いて、これを取得した弱相関選択因子数の回数繰り返す。
弱相関因子選択部324は、CPU911などの処理装置を用いて、選択した選択因子F’についての情報を、磁気ディスク装置920などの記憶装置に記憶する。
まず、選択因子情報生成部325は、CPU911などの処理装置を用いて、強相関因子選択部323が選択した選択因子F’についての情報を、磁気ディスク装置920などの記憶装置から取得する。
次に、選択因子情報生成部325は、CPU911などの処理装置を用いて、弱相関因子選択部324が選択した選択因子F’についての情報を、磁気ディスク装置920などの記憶装置から取得する。
選択因子情報生成部325は、CPU911などの処理装置を用いて、取得した情報から、強相関因子選択部323が選択した選択因子F’及び弱相関因子選択部324が選択kした選択因子F’を示す選択因子情報Sを生成する。
選択因子情報生成部325は、CPU911などの処理装置を用いて、生成した選択因子情報Sを、磁気ディスク装置920などの記憶装置に記憶する。
ここで、局所解とは、選択因子F’を少しずつ変化させて判別度を求め、近傍において判別度が最大になる場合をいう。
影響因子推定装置100は、判別度が最大になる選択因子F’を探索しようとしているが、すべての場合について判別度を求めようとすると、計算時間がかかりすぎて答えを得ることができない。
そこで、いろいろな場合を試しながら、近傍において判別度が最大となる場合を、暫定的な答え(局所解)とする。
次に、局所解判断部326は、CPU911などの処理装置を用いて、取得した判別度が局所解に到達したか否かを判断する。例えば、局所解判断部326は、CPU911などの処理装置を用いて、取得した判別度を、判別度算出部138がそれまでに算出した判別度と比較し、判別度が改善したか否かを判断する。判別度が改善していないと判断した場合、局所解判断部326は、判別度が改善しなかった回数を数え、所定の回数以上判別度が改善しなかった場合に、局所解に到達したと判断する。あるいは、近傍の探索がすべて終了した場合に、局所解に到達したと判断する。
局所解判断部326は、CPU911などの処理装置を用いて、判断結果を、磁気ディスク装置920などの記憶装置に記憶する。
図16は、この実施の形態における影響因子選択部132による影響因子選択処理の流れの一例を示すフローチャート図である。
影響因子分類部321は、CPU911などの処理装置を用いて、取得した影響因子重み付けWに基づいて、影響因子Fを、強相関因子群と弱相関因子群とに分類する。
影響因子分類部321は、CPU911などの処理装置を用いて、分類した分類結果を示す情報を、磁気ディスク装置920などの記憶装置に記憶する。
選択因子数生成部322は、CPU911などの処理装置を用いて、生成した強相関因子数及び弱相関因子数を、磁気ディスク装置920などの記憶装置に記憶する。
強相関因子選択部323は、CPU911などの処理装置を用いて、取得した情報を分析し、どの影響因子Fが強相関因子群に分類されたかを取得する。
強相関因子選択部323は、CPU911などの処理装置を用いて、S32で選択因子数生成部322が生成した強相関因子数を、磁気ディスク装置920などの記憶装置から取得する。
強相関因子選択部323は、CPU911などの処理装置を用いて、強相関因子群に分類された影響因子Fのなかから、取得した強相関因子数の影響因子をランダムに選択する。
強相関因子選択部323は、CPU911などの処理装置を用いて、選択した影響因子を示す情報を、磁気ディスク装置920などの記憶装置に記憶する。
弱相関因子選択部324は、CPU911などの処理装置を用いて、取得した情報を分析し、どの影響因子Fが弱相関因子群に分類されたかを取得する。
弱相関因子選択部324は、CPU911などの処理装置を用いて、S32で選択因子数生成部322が生成した弱相関因子数を、磁気ディスク装置920などの記憶装置から取得する。
弱相関因子選択部324は、CPU911などの処理装置を用いて、弱相関因子群に分類された影響因子Fのなかから、取得した弱相関因子数の影響因子をランダムに選択する。
弱相関因子選択部324は、CPU911などの処理装置を用いて、選択した影響因子を示す情報を、磁気ディスク装置920などの記憶装置に記憶する。
選択因子情報生成部325は、CPU911などの処理装置を用いて、S34で弱相関因子選択部324が選択した影響因子を示す情報を、磁気ディスク装置920などの記憶装置から取得する。
選択因子情報生成部325は、CPU911などの処理装置を用いて、取得した情報から、強相関因子選択部323または弱相関因子選択部324が選択した選択因子F’を示す選択因子情報Sを生成する。
選択因子情報生成部325は、CPU911などの処理装置を用いて、生成した選択因子情報Sを、磁気ディスク装置920などの記憶装置に記憶する。
なお、特徴度算出部134が算出した特徴度Cが大きいため判別度算出部138が判別度を算出しなかった場合は、局所解判断部326は、最も判別精度が悪いことを示す判別度を取得したものとして、以下の処理を行う。
局所解判断部326は、CPU911などの処理装置を用いて、取得した判別度に基づいて、局所解に到達したか否かを判断する。
局所解に到達したと判断した場合には、S32に戻る。
局所解に到達していないと判断した場合には、S38へ進む。
弱相関因子選択部324は、CPU911などの処理装置を用いて、取得した情報によって示される前回選択した影響因子のなかから、今回は選択しない影響因子を1つランダムに選び、今回選択する影響因子から除く。
弱相関因子選択部324は、CPU911などの処理装置を用いて、取得した情報によって示される前回選択した影響因子以外の影響因子であって、S31で弱相関因子群に分類された影響因子のなかから、今回選択する影響因子を1つランダムに選択し、今回選択する影響因子に加える。
他の影響因子の選択状況は変えず、弱相関因子選択部324は、CPU911などの処理装置を用いて、選択した影響因子を示す情報を、磁気ディスク装置920などの記憶装置に記憶する。
その後、S35に戻る。
図17は、この実施の形態における特異値分解部133の内部ブロックの構成の一例を示す詳細ブロック構成図である。
特異値分解部133は、選択因子情報記憶部362、選択因子情報比較部363、変更影響因子測定値取得部364、特異値行列記憶部365、列変更特異値行列算出部366を有する。
まず、選択因子情報記憶部362は、CPU911などの処理装置を用いて、影響因子選択部132が選択した選択因子F’を示す選択因子情報Sを、磁気ディスク装置920などの記憶装置から取得する。
次に、選択因子情報記憶部362は、CPU911などの処理装置を用いて、取得した選択因子情報Sを、磁気ディスク装置920などの記憶装置に記憶する。
まず、選択因子情報比較部363は、CPU911などの処理装置を用いて、影響因子選択部132が選択した選択因子F’を示す情報を、磁気ディスク装置920などの記憶装置から取得する。
次に、選択因子情報比較部363は、CPU911などの処理装置を用いて、選択因子情報記憶部362が記憶した過去の選択因子情報を、磁気ディスク装置920などの記憶装置から取得する。
選択因子情報比較部363は、CPU911などの処理装置を用いて、取得した選択因子情報Sと、取得した過去の選択因子情報とを比較して、異なる選択因子を検出する。
選択因子情報比較部363は、CPU911などの処理装置を用いて、検出した異なる選択因子についての情報を、磁気ディスク装置920などの記憶装置に記憶する。
なお、選択因子情報記憶部362が過去の選択因子情報を複数記憶している場合には、今回の選択因子情報Sとの差が最も小さいものを選んで、それとの差異を検出してもよい。
例えば、選択因子情報Sがmビッド(mは、影響因子Fの数)のデータであり、j番目(jは、1〜mの整数)が、影響因子Fjの選択状態を示すものであれば、選択因子情報比較部363は、CPU911などの処理装置を用いて、2つの選択因子情報の排他的論理和をとることにより、選択状態が変更になった影響因子を求めることができる。あるいは、選択因子情報比較部363は、CPU911などの処理装置を用いて、一方の選択因子情報の1の補数と、他方の選択因子情報との論理積をとることにより、追加選択された影響因子あるいは選択が解除された影響因子を求めることができる。
まず、変更影響因子測定値取得部364は、CPU911などの処理装置を用いて、選択因子情報比較部363が検出した異なる選択因子についての情報を、磁気ディスク装置920などの記憶装置から取得する。
次に、変更影響因子測定値取得部364は、CPU911などの処理装置を用いて、取得した情報から、異なる選択因子を取得する。
変更影響因子測定値取得部364は、CPU911などの処理装置を用いて、取得した異なる選択因子について、影響因子測定値記憶部122が記憶した影響因子測定値xを、磁気ディスク装置920などの記憶装置から取得する。
変更影響因子測定値取得部364は、CPU911などの処理装置を用いて、取得した影響因子測定値xを、磁気ディスク装置920などの記憶装置に記憶する。
なお、ここでいう特異値行列には、パターン行列Pを特異値分解して得た特異値σを対角成分とする特異値行列のみならず、スコア値行列U(左特異値行列)及び行列V(右特異値行列)の3つの行列すべてを含むものとする。
特異値行列記憶部365は、CPU911などの処理装置を用いて、列変更特異値行列算出部366が算出した特異値行列の成分(特異値σ、スコア値uなど)を、磁気ディスク装置920などの記憶装置に記憶する。
この実施の形態では、影響因子選択部132が、以前の選択因子と比較して、影響因子を1つだけ入れ替えた選択因子を選択する。したがって、列変更特異値行列算出部366が特異値分解するパターン行列Pは、以前に特異値分解したパターン行列と比較して、1列だけ異なり、他の列は等しいパターン行列である。
このように、一列だけ異なるパターン行列を特異値分解する場合、以前に特異値分解して得た特異値行列を用いることにより、非常に高速に特異値分解できることが知られている(例えば、非特許文献1)。
そこで、列変更特異値行列算出部366は、CPU911などの処理装置を用いて、以前に特異値分解して得た特異値行列と、パターン行列Pの成分が異なる列の成分である影響因子測定値xとに基づいて、パターン行列Pを高速に特異値分解する。
次に、列変更特異値行列算出部366は、CPU911などの処理装置を用いて、変更影響因子測定値取得部364が取得した影響因子測定値xを、磁気ディスク装置920などの記憶装置から取得する。
列変更特異値行列算出部366は、CPU911などの処理装置を用いて、取得したと特異値行列と、取得した影響因子測定値xとに基づいて、高速に特異値分解を行い、特異値行列を算出する。
列変更特異値行列算出部366は、CPU911などの処理装置を用いて、算出した特異値行列の成分(特異値σ、スコア値uなど)を、磁気ディスク装置920などの記憶装置を用いて記憶する。
したがって、影響因子選択部132は、以前に選択した選択因子と比較して、1つだけ影響因子を追加した選択因子を選択してもよいし、1つだけ影響因子を減らした選択因子を選択してもよい。また、1つだけ増減させるのではなく、複数の影響因子を増減させてもよい。その場合であっても、列変更特異値行列算出部366は、高速に特異値分解することができる。
図18は、この実施の形態における特異値分解部133による特異値分解処理の流れの一例を示すフローチャート図である。
選択因子情報比較部363は、CPU911などの処理装置を用いて、選択因子情報記憶部362が記憶した過去の選択因子情報を、磁気ディスク装置920などの記憶装置から取得する。
選択因子情報比較部363は、CPU911などの処理装置を用いて、取得した選択因子情報を比較し、選択変更(追加選択または選択解除)された影響因子を求める。
選択因子情報比較部363は、CPU911などの処理装置を用いて、求めた影響因子を示す情報を、磁気ディスク装置920などの記憶装置に記憶する。
選択因子情報記憶部362は、CPU911などの処理装置を用いて、取得した選択因子情報を、磁気ディスク装置920などの記憶装置に記憶する。
変更影響因子測定値取得部364は、CPU911などの処理装置を用いて、取得した情報に基づいて、選択変更された影響因子の数を算出する。
変更影響因子測定値取得部364は、CPU911などの処理装置を用いて、算出した選択変更された影響因子の数を、所定の数と比較して、選択変更された影響因子の数が多いか少ないかを判断する。
選択変更された影響因子の数が多い場合、新たに特異値分解したほうが速いので、S46へ進む。
選択変更された影響因子の数が少ない場合、過去の特異値分解結果を使って特異値分解したほうが速いので、S44へ進む。
変更影響因子測定値取得部364は、CPU911などの処理装置を用いて、求めた選択因子について、影響因子測定値記憶部122が記憶した影響因子測定値xを、磁気ディスク装置920などの記憶装置から取得する。
変更影響因子測定値取得部364は、CPU911などの処理装置を用いて、取得した影響因子測定値xを、磁気ディスク装置920などの記憶装置に記憶する。
列変更特異値行列算出部366は、CPU911などの処理装置を用いて、S44で変更影響因子測定値取得部364が取得した影響因子測定値xを、磁気ディスク装置920などの記憶装置から取得する。
列変更特異値行列算出部366は、CPU911などの処理装置を用いて、取得した特異値行列の成分と影響因子測定値xとに基づいて、パターン行列Pを特異値分解する。
列変更特異値行列算出部366は、CPU911などの処理装置を用いて、特異値分解して得た特異値行列の成分を、磁気ディスク装置920などの記憶装置に記憶する。
その後、S48へ進む。
変更影響因子測定値取得部364は、CPU911などの処理装置を用いて、取得した選択因子情報によって示される選択因子を求める。
変更影響因子測定値取得部364は、CPU911などの処理装置を用いて、求めた選択因子について、影響因子測定値記憶部122が記憶した影響因子測定値xを、磁気ディスク装置920などの記憶装置から取得する。
変更影響因子測定値取得部364は、CPU911などの処理装置を用いて、取得した影響因子測定値xを、磁気ディスク装置920などの記憶装置に記憶する。
列変更特異値行列算出部366は、CPU911などの処理装置を用いて、取得した影響因子測定値xを成分とするパターン行列Pを、通常の方式で特異値分解する。
列変更特異値行列算出部366は、CPU911などの処理装置を用いて、特異値分解して得た特異値行列の成分を、磁気ディスク装置920などの記憶装置に記憶する。
特異値行列記憶部365は、CPU911などの処理装置を用いて、取得した特異値行列の成分を、磁気ディスク装置920などの記憶装置に記憶する。
Claims (15)
- 情報を記憶する記憶装置と、
情報を処理する処理装置と、
情報を出力する出力装置と、
上記処理装置を用いて、測定対象の状態を測定した値を測定値yとし、複数の測定値yを上記記憶装置に記憶する測定値記憶部と、
上記処理装置を用いて、上記測定対象の状態に影響を与える可能性のある複数の影響因子Fを示す情報を、影響因子情報として、上記記憶装置に記憶する影響因子情報記憶部と、
上記処理装置を用いて、上記影響因子情報記憶部が記憶した影響因子情報によって示される上記複数の影響因子Fを測定した値を、複数の影響因子測定値xとし、上記測定値記憶部が記憶した複数の測定値yそれぞれに対応する上記複数の影響因子測定値xを、上記複数の測定値yそれぞれに対応する複数の影響因子測定値ベクトルXの成分として、上記記憶装置に記憶する影響因子測定値記憶部と、
上記処理装置を用いて、上記影響因子情報記憶部が記憶した影響因子情報によって示される上記複数の影響因子Fのなかから、複数の影響因子を選択して、複数の選択因子F’とし、上記処理装置を用いて、選択した上記複数の選択因子F’を示す情報を、選択因子情報Sとして、上記記憶装置に記憶する影響因子選択部と、
上記処理装置を用いて、上記影響因子選択部が選択した複数の選択因子F’を示す選択因子情報Sを上記記憶装置から取得し、上記処理装置を用いて、上記影響因子測定値記憶部が記憶した複数の影響因子測定値xのうち、取得した上記選択因子情報Sによって示される複数の選択因子F’についての複数の影響因子測定値xを上記記憶装置から取得し、上記処理装置を用いて、上記複数の測定値yに対応する複数の影響因子測定値xのうち、取得した複数の影響因子測定値xを成分とする複数のベクトルを、上記複数の測定値yに対応する複数の選択因子測定値ベクトルX’とし、上記複数の選択因子測定値ベクトルX’を行ベクトルとする行列を、パターン行列Pとし、上記パターン行列Pを特異値分解して、複数の特異値σと、P=U・S・V T (ただし、Sはσを対角成分とする対角行列。)を満たすスコア値行列Uとを算出し、上記処理装置を用いて、算出した上記複数の特異値σを上記記憶装置に記憶し、上記処理装置を用いて、算出した上記スコア値行列Uの複数の行ベクトルを、上記複数の行ベクトルに対応する上記パターン行列Pの行ベクトルである上記複数の選択因子測定値ベクトルX’が対応する上記複数の測定値に対応する複数のスコア値ベクトルQとし、上記複数のスコア値ベクトルQの複数の成分を、上記複数の測定値yに対応する複数のスコア値uとして、上記記憶装置に記憶する特異値分解部と、
上記処理装置を用いて、上記特異値分解部が算出した複数の特異値σを、上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数の特異値σに基づいて、上記特異値分解部が算出した複数のスコア値uのうちから、複数のスコア値uを選択し、選択した上記複数のスコア値uを上記記憶装置から取得し、上記処理装置を用いて、上記複数の測定値yに対応する複数のスコア値uのうち、取得した上記複数のスコア値uを、上記複数の測定値yに対応する複数の圧縮スコア値ベクトルQ’の成分として、上記記憶装置に記憶するスコア値圧縮部と、
上記処理装置を用いて、上記測定値記憶部が記憶した複数の測定値yを上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数の測定値yが所定の条件を満たすか否かを判断し、上記処理装置を用いて、取得した上記複数の測定値yのうち、上記所定の条件を満たすと判断した測定値yに対応する上記複数の圧縮スコア値ベクトルQ’の成分として上記スコア値圧縮部が記憶した複数のスコア値uを上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数のスコア値uを成分とする上記複数の圧縮スコア値ベクトルQ’のバラツキの度合いを示す値を算出して、特徴度Cとし、上記処理装置を用いて、算出した特徴度Cを、上記記憶装置に記憶する特徴度算出部と、
上記処理装置を用いて、上記特徴度算出部が算出した特徴度Cを上記記憶装置から取得し、上記処理装置を用いて、取得した上記特徴度Cに基づいて、上記特徴度算出部が取得した複数のスコア値uを成分とする複数の圧縮スコア値ベクトルQ’のバラツキが小さいか否かを判断し、上記特徴度算出部が取得した複数のスコア値uを成分とする複数の圧縮スコア値ベクトルQ’のバラツキが小さいと判断した場合に、上記処理装置を用いて、上記測定値記憶部が記憶した複数の測定値yが所定の条件を満たすか否かを、上記複数の測定値yに対応する複数の圧縮スコア値ベクトルQ’の成分として上記スコア値圧縮部が記憶した複数のスコア値uに基づいて判別する判別式を算出し、算出した上記判別式のパラメータを、上記記憶装置に記憶する判別式算出部と、
上記処理装置を用いて、上記測定値記憶部が記憶した複数の測定値yを上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数の測定値yが上記所定の条件を満たすか否かを判断し、上記処理装置を用いて、上記判別式算出部が記憶したパラメータを上記記憶装置から取得し、上記処理装置を用いて、上記複数の測定値yに対応して、上記スコア値圧縮部が記憶した複数のスコア値uを上記記憶装置から取得し、上記処理装置を用いて、取得した上記パラメータによって示される判別式に取得した上記複数のスコア値uを代入して、上記複数のスコア値uに対応する複数の測定値yが所定の条件を満たすか否かを判別し、上記処理装置を用いて、上記複数の測定値yに基づく判断結果と、上記判別式に基づく判別結果とを比較して、上記判別式に基づく判別結果が正しいか否かを判断し、上記処理装置を用いて、上記判別式に基づく判別結果が正しいか否かの判断結果に基づいて、上記判別式の判別精度を示す値を算出して、判別度とし、上記処理装置を用いて、算出した上記判別度を上記記憶装置に記憶する判別度算出部と、
上記処理装置を用いて、上記判別度算出部が算出した判別度を上記記憶装置から取得し、上記処理装置を用いて、取得した上記判別度に基づいて上記判別式の判別精度が高いか否かを判断し、上記判別式の判別精度が高いと判断した場合に、上記処理装置を用いて、上記影響因子選択部が選択した複数の選択因子F’を示す選択因子情報Sを上記記憶装置から取得し、上記処理装置を用いて、取得した上記選択因子情報Sを、強影響因子情報として、上記記憶装置に記憶する強影響因子選択部と、
上記処理装置を用いて、上記強影響因子選択部が記憶した強影響因子情報を上記記憶装置から取得し、上記処理装置を用いて、上記影響因子情報記憶部が記憶した影響因子情報のうち、取得した上記強影響因子情報によって示される影響因子についての影響因子情報を、上記記憶装置から取得し、上記処理装置を用いて、取得した上記影響因子情報に基づいて、上記強影響因子情報によって示される影響因子についての情報を上記出力装置に出力する強影響因子出力部と、
を有し、
上記測定対象の状態に強い影響を与える影響因子を推定することを特徴とする影響因子推定装置。 - 上記特徴度算出部は、
上記処理装置を用いて、取得した上記複数のスコア値uを成分とする複数の圧縮スコア値ベクトルQ’を近似する近似式を算出し、
上記処理装置を用いて、算出した上記近似式と、上記複数の圧縮スコア値ベクトルQ’との間の近似誤差を算出し、
上記処理装置を用いて、算出した上記近似誤差を合計して、特徴度Cとする
ことを特徴とする請求項1に記載の影響因子推定装置。 - 上記特徴度算出部は、
上記処理装置を用いて、上記近似式として、取得した上記複数のスコア値uを成分とする複数の圧縮スコア値ベクトルQ’の回帰式を算出し、
上記処理装置を用いて、上記近似誤差として、算出した上記回帰式と、上記複数の圧縮スコア値ベクトルQ’との間の回帰誤差の二乗を算出する
ことを特徴とする請求項2に記載の影響因子推定装置。 - 上記判別式算出部は、
上記処理装置を用いて、取得した上記特徴度Cを所定の値と比較し、上記特徴度Cが所定の値より小さい場合に、上記処理装置を用いて、上記特徴度算出部が取得した複数のスコア値uを成分とする複数の圧縮スコア値ベクトルQ’のバラツキが小さいと判断する
ことを特徴とする請求項1に記載の影響因子推定装置。 - 上記判別式算出部は、
上記処理装置を用いて、上記測定値記憶部が記憶した複数の測定値yを上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数の測定値yが所定の条件を満たすか否かを判断し、上記処理装置を用いて、取得した上記複数の測定値yのうち、上記所定の条件を満たすと判断した測定値yに対応する上記複数の圧縮スコア値ベクトルQ’の成分として上記スコア値圧縮部が記憶した複数のスコア値uを上記記憶装置から取得し、取得した上記複数のスコア値uを成分とする複数の圧縮スコア値ベクトルQ’を、基準ベクトル群Gとし、上記処理装置を用いて、上記判別式として、上記基準ベクトル群Gに対するマハラノビス距離を計算する計算式を算出する
ことを特徴とする請求項1に記載の影響因子推定装置。 - 上記判別度算出部は、
上記処理装置を用いて、取得した上記パラメータによって示される判別式に、取得した上記複数のスコア値uを代入して、上記判別式の値を算出し、上記処理装置を用いて、算出した上記判別式の値を所定の値と比較して、上記複数のスコア値uを成分とする複数の圧縮スコア値ベクトルQ’に対応する複数の測定値yが所定の条件を満たすか否かを判別する
ことを特徴とする請求項1に記載の影響因子推定装置。 - 上記判別度算出部は、
上記処理装置を用いて、上記判別度として、上記判別式に基づく判別結果が正しいか否かの判断結果のうち、上記判別式に基づく判別結果が正しいと判断した割合を計算する
ことを特徴とする請求項1に記載の影響因子推定装置。 - 上記影響因子選択部は、
上記処理装置を用いて、上記複数の影響因子Fのなかから選択する複数の選択因子F’の数を生成して、選択因子数とし、上記処理装置を用いて、上記複数の影響因子Fのなかから、生成した上記選択因子数の選択因子F’を選択する
ことを特徴とする請求項1に記載の影響因子推定装置。 - 上記影響因子推定装置は、更に、
上記処理装置を用いて、上記測定値記憶部が記憶した複数の測定値yを上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数の測定値yに対応する複数の影響因子測定値ベクトルXの成分として上記影響因子測定値記憶部が記憶した複数の影響因子測定値xを上記記憶装置から取得し、上記処理装置を用いて、上記複数の影響因子Fそれぞれについて、取得した上記複数の測定値yと、上記複数の測定値yに対応する上記複数の影響因子測定値xとの間の相関の強さを示す値を算出して、上記複数の影響因子Fに対応する複数の影響因子重み付けWとし、上記処理装置を用いて、算出した上記複数の影響因子重み付けWを記憶装置に記憶する重み付け算出部
を有し、
上記影響因子選択部は、
上記処理装置を用いて、上記重み付け算出部が算出した複数の影響因子重み付けWを上記記憶装置から取得し、上記処理装置を用いて、取得した上記影響因子重み付けWに基づいて、上記複数の影響因子Fを複数の影響因子グループに分類し、上記処理装置を用いて、分類した上記複数の影響因子グループそれぞれのなかから選択する選択因子F’の数をそれぞれ生成して、グループ選択因子数とし、上記処理装置を用いて、上記複数の影響因子グループそれぞれのなかから、生成した上記グループ選択因子数の選択因子F’を選択する
ことを特徴とする請求項1に記載の影響因子推定装置。 - 上記影響因子選択部は、更に、
上記処理装置を用いて、上記判別度算出部が算出した判別度を上記記憶装置から取得し、上記処理装置を用いて、取得した上記判別度に基づいて、大規模組み合わせ計算法により、上記判別度が大きくなるよう、上記複数の影響因子Fのなかから複数の選択因子F’を選択する
ことを特徴とする請求項1に記載の影響因子推定装置。 - 上記影響因子選択部は、
上記大規模組み合わせ計算法として、焼きなまし法及び遺伝的アルゴリズム法及びタブーサーチ法の少なくともいずれかを用いる
ことを特徴とする請求項10に記載の影響因子推定装置。 - 上記影響因子選択部は、
上記処理装置を用いて、取得した上記判別度を算出する際に用いた複数の選択因子F‘を示す選択因子情報Sを上記記憶装置から取得し、上記処理装置を用いて、取得した上記選択因子情報Sによって示される複数の選択因子F’と比較して、選択する選択因子F‘の数が等しく、一部の選択因子F’が共通する複数の選択因子F’を選択する
ことを特徴とする請求項10に記載の影響因子推定装置。 - 上記重み付け算出部は、
上記複数の影響因子Fそれぞれについて、上記複数の測定値yと、上記複数の測定値yに対応する上記複数の影響因子測定値xとの間のピアソンの積率相関係数の二乗を算出し、上記複数の影響因子Fに対応する複数の影響因子重み付けWとする
ことを特徴とする請求項9に記載の影響因子推定装置。 - 上記特異値分解部は、
上記処理装置を用いて、取得した上記選択因子情報Sを上記記憶装置に記憶し、上記処理装置を用いて、取得した上記選択因子情報Sによって示される複数の選択因子F’と、以前に記憶した選択因子情報Sによって示される複数の選択因子F’とを比較して、選択した選択因子F’の数が等しく、一部の選択因子F’が共通している場合に、上記処理装置を用いて、以前に記憶した上記選択因子情報Sによって示される複数の選択因子F’についてのパターン行列Pを特異値分解して算出した複数の特異値σと複数のスコア値uとを上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数の特異値σと上記複数のスコア値uとに基づいて、取得した上記選択因子情報Sによって示される複数の選択因子F’についてのパターン行列Pを特異値分解する
ことを特徴とする請求項1に記載の影響因子推定装置。 - 情報を記憶する記憶装置と、情報を処理する処理装置と、情報を出力する出力装置とを有するコンピュータを、
上記処理装置を用いて、測定対象の状態を測定した値を測定値yとし、複数の測定値yを上記記憶装置に記憶する測定値記憶部と、
上記処理装置を用いて、上記測定対象の状態に影響を与える可能性のある複数の影響因子Fを示す情報を、影響因子情報として、上記記憶装置に記憶する影響因子情報記憶部と、
上記処理装置を用いて、上記影響因子情報記憶部が記憶した影響因子情報によって示される上記複数の影響因子Fを測定した値を、複数の影響因子測定値xとし、上記測定値記憶部が記憶した複数の測定値yそれぞれに対応する上記複数の影響因子測定値xを、上記複数の測定値yそれぞれに対応する複数の影響因子測定値ベクトルXの成分として、上記記憶装置に記憶する影響因子測定値記憶部と、
上記処理装置を用いて、上記影響因子情報記憶部が記憶した影響因子情報によって示される上記複数の影響因子Fのなかから、複数の影響因子を選択して、複数の選択因子F’とし、上記処理装置を用いて、選択した上記複数の選択因子F’を示す情報を、選択因子情報Sとして、上記記憶装置に記憶する影響因子選択部と、
上記処理装置を用いて、上記影響因子選択部が選択した複数の選択因子F’を示す選択因子情報Sを上記記憶装置から取得し、上記処理装置を用いて、上記影響因子測定値記憶部が記憶した複数の影響因子測定値xのうち、取得した上記選択因子情報Sによって示される複数の選択因子F’についての複数の影響因子測定値xを上記記憶装置から取得し、上記処理装置を用いて、上記複数の測定値yに対応する複数の影響因子測定値xのうち、取得した複数の影響因子測定値xを成分とする複数のベクトルを、上記複数の測定値yに対応する複数の選択因子測定値ベクトルX’とし、上記複数の選択因子測定値ベクトルX’を行ベクトルとする行列を、パターン行列Pとし、上記パターン行列Pを特異値分解して、複数の特異値σと、P=U・S・V T (ただし、Sはσを対角成分とする対角行列。)を満たすスコア値行列Uとを算出し、上記処理装置を用いて、算出した上記複数の特異値σを上記記憶装置に記憶し、上記処理装置を用いて、算出した上記スコア値行列Uの複数の行ベクトルを、上記複数の行ベクトルに対応する上記パターン行列Pの行ベクトルである上記複数の選択因子測定値ベクトルX’が対応する上記複数の測定値に対応する複数のスコア値ベクトルQとし、上記複数のスコア値ベクトルQの複数の成分を、上記複数の測定値yに対応する複数のスコア値uとして、上記記憶装置に記憶する特異値分解部と、
上記処理装置を用いて、上記特異値分解部が算出した複数の特異値σを、上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数の特異値σに基づいて、上記特異値分解部が算出した複数のスコア値uのうちから、複数のスコア値uを選択し、選択した上記複数のスコア値uを上記記憶装置から取得し、上記処理装置を用いて、上記複数の測定値yに対応する複数のスコア値uのうち、取得した上記複数のスコア値uを、上記複数の測定値yに対応する複数の圧縮スコア値ベクトルQ’の成分として、上記記憶装置に記憶するスコア値圧縮部と、
上記処理装置を用いて、上記測定値記憶部が記憶した複数の測定値yを上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数の測定値yが所定の条件を満たすか否かを判断し、上記処理装置を用いて、取得した上記複数の測定値yのうち、上記所定の条件を満たすと判断した測定値yに対応する上記複数の圧縮スコア値ベクトルQ’の成分として上記スコア値圧縮部が記憶した複数のスコア値uを上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数のスコア値uを成分とする上記複数の圧縮スコア値ベクトルQ’のバラツキの度合いを示す値を算出して、特徴度Cとし、上記処理装置を用いて、算出した特徴度Cを、上記記憶装置に記憶する特徴度算出部と、
上記処理装置を用いて、上記特徴度算出部が算出した特徴度Cを上記記憶装置から取得し、上記処理装置を用いて、取得した上記特徴度Cに基づいて、上記特徴度算出部が取得した複数のスコア値uを成分とする複数の圧縮スコア値ベクトルQ’のバラツキが小さいか否かを判断し、上記特徴度算出部が取得した複数のスコア値uを成分とする複数の圧縮スコア値ベクトルQ’のバラツキが小さいと判断した場合に、上記処理装置を用いて、上記測定値記憶部が記憶した複数の測定値yが所定の条件を満たすか否かを、上記複数の測定値yに対応して上記スコア値圧縮部が記憶した複数のスコア値uに基づいて判別する判別式を算出し、算出した上記判別式のパラメータを、上記記憶装置に記憶する判別式算出部と、
上記処理装置を用いて、上記測定値記憶部が記憶した複数の測定値yを上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数の測定値yが上記所定の条件を満たすか否かを判断し、上記処理装置を用いて、上記判別式算出部が記憶したパラメータを上記記憶装置から取得し、上記処理装置を用いて、上記複数の測定値yに対応して、上記スコア値圧縮部が記憶した複数のスコア値uを上記記憶装置から取得し、上記処理装置を用いて、取得した上記パラメータによって示される判別式に取得した上記複数のスコア値uを代入して、上記複数のスコア値uに対応する複数の測定値yが所定の条件を満たすか否かを判別し、上記処理装置を用いて、上記複数の測定値yに基づく判断結果と、上記判別式に基づく判別結果とを比較して、上記判別式に基づく判別結果が正しいか否かを判断し、上記処理装置を用いて、上記判別式に基づく判別結果が正しいか否かの判断結果に基づいて、上記判別式の判別精度を示す値を算出して、判別度とし、上記処理装置を用いて、算出した上記判別度を上記記憶装置に記憶する判別度算出部と、
上記処理装置を用いて、上記判別度算出部が算出した判別度を上記記憶装置から取得し、上記処理装置を用いて、取得した上記判別度に基づいて上記判別式の判別精度が高いか否かを判断し、上記判別式の判別精度が高いと判断した場合に、上記処理装置を用いて、上記影響因子選択部が選択した複数の選択因子F’を示す選択因子情報Sを上記記憶装置から取得し、上記処理装置を用いて、取得した上記選択因子情報Sを、強影響因子情報として、上記記憶装置に記憶する強影響因子選択部と、
上記処理装置を用いて、上記強影響因子選択部が記憶した強影響因子情報を上記記憶装置から取得し、上記処理装置を用いて、上記影響因子情報記憶部が記憶した影響因子情報のうち、取得した上記強影響因子情報によって示される影響因子についての影響因子情報を、上記記憶装置から取得し、上記処理装置を用いて、取得した上記影響因子情報に基づいて、上記強影響因子情報によって示される影響因子についての情報を上記出力装置に出力する強影響因子出力部と、
を有し、
上記測定対象の状態に強い影響を与える影響因子を推定する影響因子推定装置として機能させることを特徴とする影響因子推定プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006135297A JP4495691B2 (ja) | 2006-05-15 | 2006-05-15 | 影響因子推定装置及び影響因子推定プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006135297A JP4495691B2 (ja) | 2006-05-15 | 2006-05-15 | 影響因子推定装置及び影響因子推定プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007305048A JP2007305048A (ja) | 2007-11-22 |
JP4495691B2 true JP4495691B2 (ja) | 2010-07-07 |
Family
ID=38838896
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006135297A Expired - Fee Related JP4495691B2 (ja) | 2006-05-15 | 2006-05-15 | 影響因子推定装置及び影響因子推定プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4495691B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220390263A1 (en) * | 2021-05-31 | 2022-12-08 | Mitsubishi Heavy Industries, Ltd. | Disturbance estimation device, disturbance estimation method, and program |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5967017B2 (ja) * | 2013-05-31 | 2016-08-10 | Jfeスチール株式会社 | 影響因子抽出方法およびプログラム |
JP7384081B2 (ja) * | 2020-03-18 | 2023-11-21 | 株式会社デンソー | 情報処理装置、データ分解方法、及びデータ分解プログラム |
JP7567055B2 (ja) | 2021-06-16 | 2024-10-15 | 日立Astemo株式会社 | 設計支援方法、設計支援システム |
CN118094357B (zh) * | 2024-04-22 | 2024-07-12 | 武汉泰沃滋信息技术有限公司 | 基于属性解耦和因子分析的车辆动态称重方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002202983A (ja) * | 2000-12-28 | 2002-07-19 | Matsushita Electric Ind Co Ltd | 分類への帰属度計算基準作成方法及び装置 |
JP2003030222A (ja) * | 2001-07-05 | 2003-01-31 | Internatl Business Mach Corp <Ibm> | 大規模データベースにおける主要クラスタおよびアウトライア・クラスタの検索、検出および同定のための方法、システム、記録媒体、およびサーバ |
JP2003316764A (ja) * | 2002-04-18 | 2003-11-07 | Mitsubishi Electric Research Laboratories Inc | 加算的特異値分解方法 |
JP2005294782A (ja) * | 2004-03-31 | 2005-10-20 | Takeshi Awaji | 半導体超伝導素子 |
JP2006011724A (ja) * | 2004-06-24 | 2006-01-12 | Ishihara Sangyo Kaisha Ltd | データ解析方法及びそのシステム |
-
2006
- 2006-05-15 JP JP2006135297A patent/JP4495691B2/ja not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002202983A (ja) * | 2000-12-28 | 2002-07-19 | Matsushita Electric Ind Co Ltd | 分類への帰属度計算基準作成方法及び装置 |
JP2003030222A (ja) * | 2001-07-05 | 2003-01-31 | Internatl Business Mach Corp <Ibm> | 大規模データベースにおける主要クラスタおよびアウトライア・クラスタの検索、検出および同定のための方法、システム、記録媒体、およびサーバ |
JP2003316764A (ja) * | 2002-04-18 | 2003-11-07 | Mitsubishi Electric Research Laboratories Inc | 加算的特異値分解方法 |
JP2005294782A (ja) * | 2004-03-31 | 2005-10-20 | Takeshi Awaji | 半導体超伝導素子 |
JP2006011724A (ja) * | 2004-06-24 | 2006-01-12 | Ishihara Sangyo Kaisha Ltd | データ解析方法及びそのシステム |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220390263A1 (en) * | 2021-05-31 | 2022-12-08 | Mitsubishi Heavy Industries, Ltd. | Disturbance estimation device, disturbance estimation method, and program |
JP7565869B2 (ja) | 2021-05-31 | 2024-10-11 | 三菱重工業株式会社 | 外乱推定装置、外乱推定方法およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2007305048A (ja) | 2007-11-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113222700B (zh) | 基于会话的推荐方法及装置 | |
US20180082215A1 (en) | Information processing apparatus and information processing method | |
Sun et al. | Quantifying variable interactions in continuous optimization problems | |
JP2015082259A (ja) | 時系列データ予測装置、時系列データ予測方法、及びプログラム | |
CN111639798A (zh) | 智能的预测模型选择方法及装置 | |
JP4495691B2 (ja) | 影響因子推定装置及び影響因子推定プログラム | |
CN115412301B (zh) | 一种网络安全的预测分析方法及系统 | |
CN112382354B (zh) | 一种Cr12MoV材料硬度预测方法及装置 | |
Deutsch et al. | Ties matter: Meta-evaluating modern metrics with pairwise accuracy and tie calibration | |
CN116185817A (zh) | 一种软件缺陷预测规则的筛选方法及系统 | |
CN116186603A (zh) | 异常用户的识别方法及装置、计算机存储介质、电子设备 | |
CN111898637A (zh) | 一种基于ReliefF-DDC特征选择算法 | |
Widyawati et al. | Comparison Analysis of Classification Model Performance in Lung Cancer Prediction Using Decision Tree, Naive Bayes, and Support Vector Machine | |
US20220327394A1 (en) | Learning support apparatus, learning support methods, and computer-readable recording medium | |
JP5684084B2 (ja) | 誤分類検出装置、方法、及びプログラム | |
CN117763316A (zh) | 一种基于机器学习的高维数据降维方法及降维系统 | |
CN112634268A (zh) | 一种视频质量评价方法、装置及电子设备 | |
JP7231829B2 (ja) | 機械学習プログラム、機械学習方法および機械学習装置 | |
CN111782805A (zh) | 一种文本标签分类方法及系统 | |
US20090099821A1 (en) | Model-diversity technique for improved proactive fault monitoring | |
Nikolikj et al. | Sensitivity Analysis of RF+ clust for Leave-one-problem-out Performance Prediction | |
CN116612814A (zh) | 基于回归模型的基因样本污染批量检测方法、装置、设备及介质 | |
Kohns et al. | Decoupling shrinkage and selection for the Bayesian quantile regression | |
CN115730152A (zh) | 基于用户画像分析的大数据处理方法及大数据处理系统 | |
CN114912341A (zh) | 一种通信设备修理备件消耗量的组合预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081226 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100209 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100223 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100318 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100406 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100409 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130416 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |