JP4495691B2 - 影響因子推定装置及び影響因子推定プログラム - Google Patents

影響因子推定装置及び影響因子推定プログラム Download PDF

Info

Publication number
JP4495691B2
JP4495691B2 JP2006135297A JP2006135297A JP4495691B2 JP 4495691 B2 JP4495691 B2 JP 4495691B2 JP 2006135297 A JP2006135297 A JP 2006135297A JP 2006135297 A JP2006135297 A JP 2006135297A JP 4495691 B2 JP4495691 B2 JP 4495691B2
Authority
JP
Japan
Prior art keywords
processing device
value
influence factor
selection
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006135297A
Other languages
English (en)
Other versions
JP2007305048A (ja
Inventor
陽一 福地
規郎 平井
貴義 福島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Mitsubishi Electric Information Systems Corp
Original Assignee
Mitsubishi Electric Corp
Mitsubishi Electric Information Systems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp, Mitsubishi Electric Information Systems Corp filed Critical Mitsubishi Electric Corp
Priority to JP2006135297A priority Critical patent/JP4495691B2/ja
Publication of JP2007305048A publication Critical patent/JP2007305048A/ja
Application granted granted Critical
Publication of JP4495691B2 publication Critical patent/JP4495691B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Indication And Recording Devices For Special Purposes And Tariff Metering Devices (AREA)
  • Complex Calculations (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

この発明は、測定対象の状態に影響を与える可能性のある影響因子のなかから、測定対象の状態に強い影響を与える影響因子を推定する影響因子推定装置に関する。
測定対象の状態に影響を与える影響因子(要因)と、測定対象の状態とを測定し、蓄積したデータから測定対象の状態を予測するモデルを構築し、影響因子を測定した値を構築したモデルに当てはめることにより、測定対象の状態を予測することが行われている。
しかし、どのような影響因子が測定対象の状態に影響を与えるかは、必ずしも明確ではない。
そこで、測定対象の状態に影響を与える可能性のある影響因子をすべて測定し、重回帰分析などにより、そのなかから実際に測定対象の状態に影響を与えている影響因子を抽出することが行われる。
また、構築する予測モデルには、特異値分解による主成分分析や、マハラノビス距離を用いるものがある。
特開2005−284782号公報 特開2001−290508号公報 特開2003−114713号公報 特開2004−132921号公報 特開2004−227279号公報 特開2005−128808号公報 Matthew Brand"Incremental Singular Value Decomposition of Uncertain Data with Missing Values",Proceedings of the 2002 European Conferenece on Computer Vision,Springer Lecture Notes in Computer Science volume 2350
重回帰分析による解析には、仮説を設定し、設定した仮説を採用するか棄却するかの検定が不可欠である。
しかし、測定対象の状態に影響を与える可能性がある影響因子の数が多数である場合、膨大な量の仮説を設定し、その1つ1つを検定しなければならず、コンピュータなどの処理装置を用いても、非常に多くの時間がかかる。
例えば、測定対象の状態に影響を与える可能性がある影響因子の数が30個ある場合、そのなかで真に測定対象の状態に影響を与える影響因子の組み合わせを推定するには、230≒10億通りの仮説を検定しなければならない。
この発明は、例えば、上記のような課題を解決するためになされたものであり、コンピュータなどの処理装置を用いて、実用的な処理時間内に、多数の影響因子のなかから、真に測定対象の状態に影響を与える影響因子を推定することを目的とする。
この発明にかかる影響因子推定装置は、
情報を記憶する記憶装置と、
情報を処理する処理装置と、
情報を出力する出力装置と、
上記処理装置を用いて、測定対象の状態を測定した値を測定値yとし、複数の測定値yを上記記憶装置に記憶する測定値記憶部と、
上記処理装置を用いて、上記測定対象の状態に影響を与える可能性のある複数の影響因子Fを示す情報を、影響因子情報として、上記記憶装置に記憶する影響因子情報記憶部と、
上記処理装置を用いて、上記影響因子情報記憶部が記憶した影響因子情報によって示される上記複数の影響因子Fを測定した値を、複数の影響因子測定値xとし、上記測定値記憶部が記憶した複数の測定値yそれぞれに対応する上記複数の影響因子測定値xを、上記複数の測定値yそれぞれに対応する複数の影響因子測定値ベクトルXの成分として、上記記憶装置に記憶する影響因子測定値記憶部と、
上記処理装置を用いて、上記影響因子情報記憶部が記憶した影響因子情報によって示される上記複数の影響因子Fのなかから、複数の影響因子を選択して、複数の選択因子F’とし、上記処理装置を用いて、選択した上記複数の選択因子F’を示す情報を、選択因子情報Sとして、上記記憶装置に記憶する影響因子選択部と、
上記処理装置を用いて、上記影響因子選択部が選択した複数の選択因子F’を示す選択因子情報Sを上記記憶装置から取得し、上記処理装置を用いて、上記影響因子測定値記憶部が記憶した複数の影響因子測定値xのうち、取得した上記選択因子情報Sによって示される複数の選択因子F’についての複数の影響因子測定値xを上記記憶装置から取得し、上記処理装置を用いて、上記複数の測定値yに対応する複数の影響因子測定値xのうち、取得した複数の影響因子測定値xを成分とする複数のベクトルを、上記複数の測定値yに対応する複数の選択因子測定値ベクトルX’とし、上記複数の選択因子測定値ベクトルX’を行ベクトルとする行列を、パターン行列Pとし、上記パターン行列Pを特異値分解して、複数の特異値σとスコア値行列Uとを算出し、上記処理装置を用いて、算出した上記複数の特異値σを上記記憶装置に記憶し、上記処理装置を用いて、算出した上記スコア値行列Uの複数の行ベクトルを、上記複数の行ベクトルに対応する上記パターン行列Pの行ベクトルである上記複数の選択因子測定値ベクトルX’が対応する上記複数の測定値に対応する複数のスコア値ベクトルQとし、上記複数のスコア値ベクトルQの複数の成分を、上記複数の測定値yに対応する複数のスコア値uとして、上記記憶装置に記憶する特異値分解部と、
上記処理装置を用いて、上記特異値分解部が算出した複数の特異値σを、上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数の特異値σに基づいて、上記特異値分解部が算出した複数のスコア値uのうちから、複数のスコア値uを選択し、選択した上記複数のスコア値uを上記記憶装置から取得し、上記処理装置を用いて、上記複数の測定値yに対応する複数のスコア値uのうち、取得した上記複数のスコア値uを、上記複数の測定値yに対応する複数の圧縮スコア値ベクトルQ’の成分として、上記記憶装置に記憶するスコア値圧縮部と、
上記処理装置を用いて、上記測定値記憶部が記憶した複数の測定値yを上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数の測定値yが所定の条件を満たすか否かを判断し、上記処理装置を用いて、取得した上記複数の測定値yのうち、上記所定の条件を満たすと判断した測定値yに対応する上記複数の圧縮スコア値ベクトルQ’の成分として上記スコア値圧縮部が記憶した複数のスコア値uを上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数のスコア値uを成分とする上記複数の圧縮スコア値ベクトルQ’のバラツキの度合いを示す値を算出して、特徴度Cとし、上記処理装置を用いて、算出した特徴度Cを、上記記憶装置に記憶する特徴度算出部と、
上記処理装置を用いて、上記特徴度算出部が算出した特徴度Cを上記記憶装置から取得し、上記処理装置を用いて、取得した上記特徴度Cに基づいて、上記特徴度算出部が取得した複数のスコア値uを成分とする複数の圧縮スコア値ベクトルQ’のバラツキが小さいか否かを判断し、上記特徴度算出部が取得した複数のスコア値uを成分とする複数の圧縮スコア値ベクトルQ’のバラツキが小さいと判断した場合に、上記処理装置を用いて、上記測定値記憶部が記憶した複数の測定値yが所定の条件を満たすか否かを、上記複数の測定値yに対応する複数の圧縮スコア値ベクトルQ’の成分として上記スコア値圧縮部が記憶した複数のスコア値uに基づいて判別する判別式を算出し、算出した上記判別式のパラメータを、上記記憶装置に記憶する判別式算出部と、
上記処理装置を用いて、上記測定値記憶部が記憶した複数の測定値yを上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数の測定値yが上記所定の条件を満たすか否かを判断し、上記処理装置を用いて、上記判別式算出部が記憶したパラメータを上記記憶装置から取得し、上記処理装置を用いて、上記複数の測定値yに対応して、上記スコア値圧縮部が記憶した複数のスコア値uを上記記憶装置から取得し、上記処理装置を用いて、取得した上記パラメータによって示される判別式に取得した上記複数のスコア値uを代入して、上記複数のスコア値uに対応する複数の測定値yが所定の条件を満たすか否かを判別し、上記処理装置を用いて、上記複数の測定値yに基づく判断結果と、上記判別式に基づく判別結果とを比較して、上記判別式に基づく判別結果が正しいか否かを判断し、上記処理装置を用いて、上記判別式に基づく判別結果が正しいか否かの判断結果に基づいて、上記判別式の判別精度を示す値を算出して、判別度とし、上記処理装置を用いて、算出した上記判別度を上記記憶装置に記憶する判別度算出部と、
上記処理装置を用いて、上記判別度算出部が算出した判別度を上記記憶装置から取得し、上記処理装置を用いて、取得した上記判別度に基づいて上記判別式の判別精度が高いか否かを判断し、上記判別式の判別精度が高いと判断した場合に、上記処理装置を用いて、上記影響因子選択部が選択した複数の選択因子F’を示す選択因子情報Sを上記記憶装置から取得し、上記処理装置を用いて、取得した上記選択因子情報Sを、強影響因子情報として、上記記憶装置に記憶する強影響因子選択部と、
上記処理装置を用いて、上記強影響因子選択部が記憶した強影響因子情報を上記記憶装置から取得し、上記処理装置を用いて、上記影響因子情報記憶部が記憶した影響因子情報のうち、取得した上記強影響因子情報によって示される影響因子についての影響因子情報を、上記記憶装置から取得し、上記処理装置を用いて、取得した上記影響因子情報に基づいて、上記強影響因子情報によって示される影響因子についての情報を上記出力装置に出力する強影響因子出力部と、
を有し、
上記測定対象の状態に強い影響を与える影響因子を推定することを特徴とする。
また、上記特徴度算出部は、
上記処理装置を用いて、取得した上記複数のスコア値uを成分とする複数の圧縮スコア値ベクトルQ’を近似する近似式を算出し、
上記処理装置を用いて、算出した上記近似式と、上記複数の圧縮スコア値ベクトルQ’との間の近似誤差を算出し、
上記処理装置を用いて、算出した上記近似誤差を合計して、特徴度Cとすることを特徴とする。
また、上記特徴度算出部は、
上記処理装置を用いて、上記近似式として、取得した上記複数のスコア値uを成分とする複数の圧縮スコア値ベクトルQ’の回帰式を算出し、
上記処理装置を用いて、上記近似誤差として、算出した上記回帰式と、上記複数の圧縮スコア値ベクトルQ’との間の回帰誤差の二乗を算出することを特徴とする。
また、上記判別式算出部は、
上記処理装置を用いて、取得した上記特徴度Cを所定の値と比較し、上記特徴度Cが所定の値より小さい場合に、上記処理装置を用いて、上記特徴度算出部が取得した複数のスコア値uを成分とする複数の圧縮スコア値ベクトルQ’のバラツキが小さいと判断することを特徴とする。
また、上記判別式算出部は、
上記処理装置を用いて、上記測定値記憶部が記憶した複数の測定値yを上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数の測定値yが所定の条件を満たすか否かを判断し、上記処理装置を用いて、取得した上記複数の測定値yのうち、上記所定の条件を満たすと判断した測定値yに対応する上記複数の圧縮スコア値ベクトルQ’の成分として上記スコア値圧縮部が記憶した複数のスコア値uを上記記憶装置から取得し、取得した上記複数のスコア値uを成分とする複数の圧縮スコア値ベクトルQ’を、基準ベクトル群Gとし、上記処理装置を用いて、上記判別式として、上記基準ベクトル群Gに対するマハラノビス距離を計算する計算式を算出することを特徴とする。
また、上記判別度算出部は、
上記処理装置を用いて、取得した上記パラメータによって示される判別式に、取得した上記複数のスコア値uを代入して、上記判別式の値を算出し、上記処理装置を用いて、算出した上記判別式の値を所定の値と比較して、上記複数のスコア値uを成分とする複数の圧縮スコア値ベクトルQ’に対応する複数の測定値yが所定の条件を満たすか否かを判別することを特徴とする。
また、上記判別度算出部は、
上記処理装置を用いて、上記判別度として、上記判別式に基づく判別結果が正しいか否かの判断結果のうち、上記判別式に基づく判別結果が正しいと判断した割合を計算することを特徴とする。
また、上記影響因子選択部は、
上記処理装置を用いて、上記複数の影響因子Fのなかから選択する複数の選択因子F’の数を生成して、選択因子数とし、上記処理装置を用いて、上記複数の影響因子Fのなかから、生成した上記選択因子数の選択因子F’を選択することを特徴とする。
また、上記影響因子推定装置は、更に、
上記処理装置を用いて、上記測定値記憶部が記憶した複数の測定値yを上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数の測定値yに対応する複数の影響因子測定値ベクトルXの成分として上記影響因子測定値記憶部が記憶した複数の影響因子測定値xを上記記憶装置から取得し、上記処理装置を用いて、上記複数の影響因子Fそれぞれについて、取得した上記複数の測定値yと、上記複数の測定値yに対応する上記複数の影響因子測定値xとの間の相関の強さを示す値を算出して、上記複数の影響因子Fに対応する複数の影響因子重み付けWとし、上記処理装置を用いて、算出した上記複数の影響因子重み付けWを記憶装置に記憶する重み付け算出部を有し、
上記影響因子選択部は、
上記処理装置を用いて、上記重み付け算出部が算出した複数の影響因子重み付けWを上記記憶装置から取得し、上記処理装置を用いて、取得した上記影響因子重み付けWに基づいて、上記複数の影響因子Fを複数の影響因子グループに分類し、上記処理装置を用いて、分類した上記複数の影響因子グループそれぞれのなかから選択する選択因子F’の数をそれぞれ生成して、グループ選択因子数とし、上記処理装置を用いて、上記複数の影響因子グループそれぞれのなかから、生成した上記グループ選択因子数の選択因子F’を選択することを特徴とする。
また、上記影響因子選択部は、更に、
上記処理装置を用いて、上記判別度算出部が算出した判別度を上記記憶装置から取得し、上記処理装置を用いて、取得した上記判別度に基づいて、大規模組み合わせ計算法により、上記判別度が大きくなるよう、上記複数の影響因子Fのなかから複数の選択因子F’を選択することを特徴とする。
また、上記影響因子選択部は、
上記大規模組み合わせ計算法として、焼きなまし法及び遺伝的アルゴリズム法及びタブーサーチ法の少なくともいずれかを用いることを特徴とする。
また、上記影響因子選択部は、
上記処理装置を用いて、取得した上記判別度を算出する際に用いた複数の選択因子F‘を示す選択因子情報Sを上記記憶装置から取得し、上記処理装置を用いて、取得した上記選択因子情報Sによって示される複数の選択因子F’と比較して、選択する選択因子F‘の数が等しく、一部の選択因子F’が共通する複数の選択因子F’を選択することを特徴とする。
また、上記重み付け算出部は、
上記複数の影響因子Fそれぞれについて、上記複数の測定値yと、上記複数の測定値yに対応する上記複数の影響因子測定値xとの間のピアソンの積率相関係数の二乗を算出し、上記複数の影響因子Fに対応する複数の影響因子重み付けWとすることを特徴とする。
また、上記特異値分解部は、
上記処理装置を用いて、取得した上記選択因子情報Sを上記記憶装置に記憶し、上記処理装置を用いて、取得した上記選択因子情報Sによって示される複数の選択因子F’と、以前に記憶した選択因子情報Sによって示される複数の選択因子F’とを比較して、選択した選択因子F’の数が等しく、一部の選択因子F’が共通している場合に、上記処理装置を用いて、以前に記憶した上記選択因子情報Sによって示される複数の選択因子F’についてのパターン行列Pを特異値分解して算出した複数の特異値σと複数のスコア値uとを上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数の特異値σと上記複数のスコア値uとに基づいて、取得した上記選択因子情報Sによって示される複数の選択因子F’についてのパターン行列Pを特異値分解することを特徴とする。
この発明にかかる影響因子推定プログラムは、
情報を記憶する記憶装置と、情報を処理する処理装置と、情報を出力する出力装置とを有するコンピュータを、
上記処理装置を用いて、測定対象の状態を測定した値を測定値yとし、複数の測定値yを上記記憶装置に記憶する測定値記憶部と、
上記処理装置を用いて、上記測定対象の状態に影響を与える可能性のある複数の影響因子Fを示す情報を、影響因子情報として、上記記憶装置に記憶する影響因子情報記憶部と、
上記処理装置を用いて、上記影響因子情報記憶部が記憶した影響因子情報によって示される上記複数の影響因子Fを測定した値を、複数の影響因子測定値xとし、上記測定値記憶部が記憶した複数の測定値yそれぞれに対応する上記複数の影響因子測定値xを、上記複数の測定値yそれぞれに対応する複数の影響因子測定値ベクトルXの成分として、上記記憶装置に記憶する影響因子測定値記憶部と、
上記処理装置を用いて、上記影響因子情報記憶部が記憶した影響因子情報によって示される上記複数の影響因子Fのなかから、複数の影響因子を選択して、複数の選択因子F’とし、上記処理装置を用いて、選択した上記複数の選択因子F’を示す情報を、選択因子情報Sとして、上記記憶装置に記憶する影響因子選択部と、
上記処理装置を用いて、上記影響因子選択部が選択した複数の選択因子F’を示す選択因子情報Sを上記記憶装置から取得し、上記処理装置を用いて、上記影響因子測定値記憶部が記憶した複数の影響因子測定値xのうち、取得した上記選択因子情報Sによって示される複数の選択因子F’についての複数の影響因子測定値xを上記記憶装置から取得し、上記処理装置を用いて、上記複数の測定値yに対応する複数の影響因子測定値xのうち、取得した複数の影響因子測定値xを成分とする複数のベクトルを、上記複数の測定値yに対応する複数の選択因子測定値ベクトルX’とし、上記複数の選択因子測定値ベクトルX’を行ベクトルとする行列を、パターン行列Pとし、上記パターン行列Pを特異値分解して、複数の特異値σとスコア値行列Uとを算出し、上記処理装置を用いて、算出した上記複数の特異値σを上記記憶装置に記憶し、上記処理装置を用いて、算出した上記スコア値行列Uの複数の行ベクトルを、上記複数の行ベクトルに対応する上記パターン行列Pの行ベクトルである上記複数の選択因子測定値ベクトルX’が対応する上記複数の測定値に対応する複数のスコア値ベクトルQとし、上記複数のスコア値ベクトルQの複数の成分を、上記複数の測定値yに対応する複数のスコア値uとして、上記記憶装置に記憶する特異値分解部と、
上記処理装置を用いて、上記特異値分解部が算出した複数の特異値σを、上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数の特異値σに基づいて、上記特異値分解部が算出した複数のスコア値uのうちから、複数のスコア値uを選択し、選択した上記複数のスコア値uを上記記憶装置から取得し、上記処理装置を用いて、上記複数の測定値yに対応する複数のスコア値uのうち、取得した上記複数のスコア値uを、上記複数の測定値yに対応する複数の圧縮スコア値ベクトルQ’の成分として、上記記憶装置に記憶するスコア値圧縮部と、
上記処理装置を用いて、上記測定値記憶部が記憶した複数の測定値yを上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数の測定値yが所定の条件を満たすか否かを判断し、上記処理装置を用いて、取得した上記複数の測定値yのうち、上記所定の条件を満たすと判断した測定値yに対応する上記複数の圧縮スコア値ベクトルQ’の成分として上記スコア値圧縮部が記憶した複数のスコア値uを上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数のスコア値uを成分とする上記複数の圧縮スコア値ベクトルQ’のバラツキの度合いを示す値を算出して、特徴度Cとし、上記処理装置を用いて、算出した特徴度Cを、上記記憶装置に記憶する特徴度算出部と、
上記処理装置を用いて、上記特徴度算出部が算出した特徴度Cを上記記憶装置から取得し、上記処理装置を用いて、取得した上記特徴度Cに基づいて、上記特徴度算出部が取得した複数のスコア値uを成分とする複数の圧縮スコア値ベクトルQ’のバラツキが小さいか否かを判断し、上記特徴度算出部が取得した複数のスコア値uを成分とする複数の圧縮スコア値ベクトルQ’のバラツキが小さいと判断した場合に、上記処理装置を用いて、上記測定値記憶部が記憶した複数の測定値yが所定の条件を満たすか否かを、上記複数の測定値yに対応して上記スコア値圧縮部が記憶した複数のスコア値uに基づいて判別する判別式を算出し、算出した上記判別式のパラメータを、上記記憶装置に記憶する判別式算出部と、
上記処理装置を用いて、上記測定値記憶部が記憶した複数の測定値yを上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数の測定値yが上記所定の条件を満たすか否かを判断し、上記処理装置を用いて、上記判別式算出部が記憶したパラメータを上記記憶装置から取得し、上記処理装置を用いて、上記複数の測定値yに対応して、上記スコア値圧縮部が記憶した複数のスコア値uを上記記憶装置から取得し、上記処理装置を用いて、取得した上記パラメータによって示される判別式に取得した上記複数のスコア値uを代入して、上記複数のスコア値uに対応する複数の測定値yが所定の条件を満たすか否かを判別し、上記処理装置を用いて、上記複数の測定値yに基づく判断結果と、上記判別式に基づく判別結果とを比較して、上記判別式に基づく判別結果が正しいか否かを判断し、上記処理装置を用いて、上記判別式に基づく判別結果が正しいか否かの判断結果に基づいて、上記判別式の判別精度を示す値を算出して、判別度とし、上記処理装置を用いて、算出した上記判別度を上記記憶装置に記憶する判別度算出部と、
上記処理装置を用いて、上記判別度算出部が算出した判別度を上記記憶装置から取得し、上記処理装置を用いて、取得した上記判別度に基づいて上記判別式の判別精度が高いか否かを判断し、上記判別式の判別精度が高いと判断した場合に、上記処理装置を用いて、上記影響因子選択部が選択した複数の選択因子F’を示す選択因子情報Sを上記記憶装置から取得し、上記処理装置を用いて、取得した上記選択因子情報Sを、強影響因子情報として、上記記憶装置に記憶する強影響因子選択部と、
上記処理装置を用いて、上記強影響因子選択部が記憶した強影響因子情報を上記記憶装置から取得し、上記処理装置を用いて、上記影響因子情報記憶部が記憶した影響因子情報のうち、取得した上記強影響因子情報によって示される影響因子についての影響因子情報を、上記記憶装置から取得し、上記処理装置を用いて、取得した上記影響因子情報に基づいて、上記強影響因子情報によって示される影響因子についての情報を上記出力装置に出力する強影響因子出力部と、
を有し、
上記測定対象の状態に強い影響を与える影響因子を推定する影響因子推定装置として機能させることを特徴とする。
この発明にかかる影響因子推定装置によれば、例えば、特異値分解部が特異値分解して得た圧縮スコア値ベクトルQ’に基づいて、測定値yとの相関が強いか否かを判断し、測定対象の状態に強い影響を与える影響因子を推定するので、影響因子測定値を特異値分解したスコア値に基づいて測定対象の状態を予測する際に、測定対象の状態に強い影響を与える影響因子を推定することができるという効果を奏する。
実施の形態1.
実施の形態1を、図1〜図14を用いて説明する。
影響因子推定装置100は、測定対象の状態に影響を与える可能性のある多数の影響因子のなかから、測定対象の状態に強い影響を与える影響因子を推定する装置である。
影響因子推定装置100は、相関要因導出装置とも呼ばれる。
図1は、この実施の形態における影響因子推定装置100の外観の一例を示す図である。
図1において、影響因子推定装置100は、システムユニット910、CRT(Cathode・Ray・Tube)やLCD(液晶)などの表示画面を有する表示装置901、キーボード902(Key・Board:K/B)、マウス903、FDD904(Flexible・Disk・ Drive)、コンパクトディスク装置905(CDD)、プリンタ装置906、スキャナ装置907などのハードウェア資源を備え、これらはケーブルや信号線で接続されている。
システムユニット910は、コンピュータであり、ファクシミリ機932、電話器931とケーブルで接続され、また、ローカルエリアネットワーク942(LAN)、ゲートウェイ941を介してインターネット940に接続されている。
図2は、この実施の形態における影響因子推定装置100のハードウェア資源の一例を示す図である。
図2において、影響因子推定装置100は、プログラムを実行するCPU911(Central・Processing・Unit、中央処理装置、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、プロセッサともいう)を備えている。CPU911は、バス912を介してROM913、RAM914、通信ボード915、表示装置901、キーボード902、マウス903、FDD904、CDD905、プリンタ装置906、スキャナ装置907、磁気ディスク装置920と接続され、これらのハードウェアデバイスを制御する。磁気ディスク装置920の代わりに、光ディスク装置、メモリカード読み書き装置などの記憶装置でもよい。
RAM914は、揮発性メモリの一例である。ROM913、FDD904、CDD905、磁気ディスク装置920の記憶媒体は、不揮発性メモリの一例である。これらは、記憶装置あるいは記憶部の一例である。
通信ボード915、キーボード902、スキャナ装置907、FDD904などは、入力部、入力装置の一例である。
また、通信ボード915、表示装置901、プリンタ装置906などは、出力部、出力装置の一例である。
通信ボード915は、ファクシミリ機932、電話器931、LAN942等に接続されている。通信ボード915は、LAN942に限らず、インターネット940、ISDN等のWAN(ワイドエリアネットワーク)などに接続されていても構わない。インターネット940或いはISDN等のWANに接続されている場合、ゲートウェイ941は不用となる。
磁気ディスク装置920には、オペレーティングシステム921(OS)、ウィンドウシステム922、プログラム群923、ファイル群924が記憶されている。プログラム群923のプログラムは、CPU911、オペレーティングシステム921、ウィンドウシステム922により実行される。
上記プログラム群923には、以下に述べる実施の形態の説明において「〜部」、「〜手段」として説明する機能を実行するプログラムが記憶されている。プログラムは、CPU911により読み出され実行される。
ファイル群924には、以下に述べる実施の形態の説明において、「〜の判定結果」、「〜の計算結果」、「〜の処理結果」として説明する情報やデータや信号値や変数値やパラメータが、「〜ファイル」や「〜データベース」の各項目として記憶されている。「〜ファイル」や「〜データベース」は、ディスクやメモリなどの記録媒体に記憶される。ディスクやメモリになどの記憶媒体に記憶された情報やデータや信号値や変数値やパラメータは、読み書き回路を介してCPU911によりメインメモリやキャッシュメモリに読み出され、抽出・検索・参照・比較・演算・計算・処理・出力・印刷・表示などのCPU911の動作に用いられる。抽出・検索・参照・比較・演算・計算・処理・出力・印刷・表示・抽出のCPU911の動作の間、情報やデータや信号値や変数値やパラメータは、メインメモリやキャッシュメモリやバッファメモリに一時的に記憶される。
また、以下に述べる実施の形態の説明において説明するフローチャートの矢印の部分は主としてデータや信号の入出力を示し、データや信号値は、RAM914のメモリ、FDD904のフレキシブルディスク、CDD905のコンパクトディスク、磁気ディスク装置920の磁気ディスク、その他光ディスク、ミニディスク、DVD(Digital・Versatile・Disc)等の記録媒体に記録される。また、データや信号は、バス912や信号線やケーブルその他の伝送媒体によりオンライン伝送される。
また、以下に述べる実施の形態の説明において「〜部」、「〜手段」として説明するものは、「〜回路」、「〜装置」、「〜機器」、「手段」であってもよく、また、「〜ステップ」、「〜手順」、「〜処理」であってもよい。すなわち、「〜部」、「〜手段」として説明するものは、ROM913に記憶されたファームウェアで実現されていても構わない。或いは、ソフトウェアのみ、或いは、素子・デバイス・基板・配線などのハードウェアのみ、或いは、ソフトウェアとハードウェアとの組み合わせ、さらには、ファームウェアとの組み合わせで実施されても構わない。ファームウェアとソフトウェアは、プログラムとして、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、DVD等の記録媒体に記憶される。プログラムはCPU911により読み出され、CPU911により実行される。すなわち、プログラムは、以下に述べる「〜部」、「〜手段」としてコンピュータを機能させるものである。あるいは、以下に述べる「〜部」、「〜手段」の手順や方法をコンピュータに実行させるものである。
図3は、この実施の形態における影響因子推定装置100の機能ブロックの構成の一例を示すブロック構成図である。
影響因子推定装置100は、影響因子情報入力部111、影響因子測定値入力部112、測定値入力部113、影響因子情報記憶部121、影響因子測定値記憶部122、測定値記憶部123、重み付け算出部131、影響因子選択部132、特異値分解部133、スコア値圧縮部136、特徴度算出部134、判別式算出部137、判別度算出部138、強影響因子選択部135、強影響因子出力部145を有する。
影響因子情報入力部111は、CPU911などの処理装置を用いて、キーボード902などの入力装置から、影響因子情報を入力する。
影響因子情報とは、測定対象の状態に影響を与える可能性のある多数の影響因子Fを示す情報である。
ここで、影響因子情報が示す影響因子Fの数をm個とし、j番目の影響因子Fを、影響因子F(ただし、jは、1〜mの整数)と表わすこととする。
例えば、測定対象の状態に影響を与える可能性のある影響因子として、温度、湿度、天候、セルモータ発進回数、走行距離、ライト点灯時間、設定ギア状況などがあるとすると、F=「温度」、F=「湿度」、F=「天候」、…といったデータが、影響因子情報となる。
影響因子情報入力部111は、CPU911などの処理装置を用いて、入力した影響因子情報を、影響因子情報記憶部121に通知する。
なお、影響因子情報は、FDなどの記憶媒体に記憶しておいて、影響因子情報を記憶したFDを、FDD904などの入力装置に挿入し、影響因子情報入力部111が、CPU911などの処理装置を用いて、FDD904などの入力装置から影響因子情報を入力してもよい。
影響因子情報記憶部121は、CPU911などの処理装置を用いて、磁気ディスク装置920などの記憶装置に、影響因子情報を記憶する。
影響因子情報記憶部121は、CPU911などの処理装置を用いて、影響因子情報入力部111が入力した影響因子情報の通知を受けて、影響因子情報を取得し、取得した影響因子情報を、磁気ディスク装置920などの記憶装置に書き込むことにより、影響因子情報を記憶する。
影響因子情報記憶部121は、例えば、m個の文字列の配列として、影響因子情報を記憶する。あるいは、文字列を記憶するフィールド(またはレコード)m個を有するファイルとして、影響因子情報を記憶する。
測定値入力部113は、CPU911などの処理装置を用いて、キーボード902などの入力装置から多数の測定値yを入力する。
測定値yとは、測定対象の状態を測定した値である。例えば、バッテリーの内部抵抗を測定した値をkΩ(キロオーム)単位で表した数値である。
測定値yは、同一の測定対象の状態を、異なる時刻に複数回測定して得た値でもよいし、複数の同種の測定対象の状態を、同一の時刻あるいは異なる時刻に測定して得た値でもよい。
ここで、測定値yの数をn個とし、i番目の測定値yを、測定値y(ただし、iは、1〜nの整数)と表わすこととする。
測定値入力部113は、CPU911などの処理装置を用いて、入力した測定値yを、測定値記憶部123に通知する。
なお、測定値yは、CDなどの記憶媒体に記憶しておいて、測定値を記憶したCDを、CDD905などの入力装置に挿入し、測定値入力部113が、CPU911などの処理装置を用いて、CDD905などの入力装置から測定値yを入力してもよい。
測定値記憶部123は、CPU911などの処理装置を用いて、測定値入力部113が入力した測定値yの通知を受けて、測定値yを取得し、取得した測定値yを磁気ディスク装置920などの記憶装置に記憶する。
測定値記憶部123は、例えば、n個の倍精度浮動小数点数の配列として、測定値yを記憶する。あるいは、倍精度浮動小数点数を記憶するレコード(あるいはフィールド)n個を有するファイルとして、測定値yを記憶する。
影響因子測定値入力部112は、CPU911などの処理装置を用いて、キーボード902などの入力装置から、影響因子測定値xを入力する。
影響因子測定値xとは、影響因子情報記憶部121が記憶した影響因子情報によって示される多数の影響因子Fを測定した値である。
例えば、影響因子F=「温度」、影響因子F=「湿度」であれば、例えば温度計などにより測定して得た値である。あるいは、気象庁が発表した気象情報を受信して、影響因子測定値xとしてもよい。
影響因子測定値xは、各測定対象ごとに異なる。また、測定対象が移動しないものであれば、「緯度」「経度」のような位置情報は1つの測定対象について不変であるが、例えば、影響因子F=「温度」のように、測定対象が同一でも、測定した時刻によって異なる場合もある。
このように、影響因子測定値xは、測定対象によって異なり、また、測定時刻によっても異なる。
影響因子測定値xは、測定対象の状態に影響を与えるデータであるため、測定対象の状態を測定した測定値yと対応づける必要がある。
すなわち、測定対象の状態を測定して測定値yを得たのと同時刻に、同一の測定対象を測定して影響因子測定値xを得れば、測定値yと影響因子測定値xとは対応づけられる。
しかし、例えば、前日の最高気温が測定値yに影響を与える影響因子である場合もあり、必ずしも同時刻に測定したものでなくとも、影響因子測定値xと、測定値yとが対応づけられる場合がある。
また、影響因子測定値xが時刻によって変わらないのであれば、同一の測定対象を測定して得た測定値yと影響因子測定値xとは、常に対応づけることができる。
ここで、影響因子Fjを測定した影響因子測定値xであって、i番目の測定値yに対応するものを、影響因子測定値xij(ただし、jは、1〜mの整数。また、iは、1〜nの整数。nは、測定値yの数)と表わすこととする。
また、1つの測定値yに対応する影響因子測定値を、影響因子Fの順に並べた組を、影響因子測定値ベクトルXという。例えば、i番目の測定値yに対応する影響因子測定値の組(xi1,xi2,…,xim)を、影響因子測定値ベクトルXと表わす。
なお、j番目の影響因子Fについての影響因子測定値x1j,x2j,…,xnjのことを総称して、xと表わす場合もある。
影響因子測定値入力部112は、CPU911などの処理装置を用いて、入力した影響因子測定値xが、どの影響因子Fを測定したものであるか、どの測定値yと対応づけられるものであるかを示す情報を、マウス903などの入力装置を用いて入力する。
影響因子測定値入力部112は、CPU911などの処理装置を用いて、入力した影響因子測定値x、その影響因子測定値xがどの影響因子Fを測定したものであるかを示す情報(例えば、影響因子Fの添え字jの値)、その影響因子測定値xがどの測定値yに対応するものであるかを示す情報(例えば、測定値yの添え字iの値)を、影響因子測定値記憶部122に通知する。
なお、影響因子測定値xは、影響因子Fを測定する測定装置が測定し、LAN942などを介して、影響因子推定装置100に対して、送信してもよい。その場合、影響因子測定値入力部112は、CPU911などの処理装置を用いて、通信ボード915などの入力装置から、影響因子測定値xを入力する。
影響因子測定値記憶部122は、CPU911などの処理装置を用いて、影響因子測定値入力部112が入力した影響因子測定値xの通知を受けて、影響因子測定値xを取得し、取得した影響因子測定値xを、磁気ディスク装置920などの記憶装置に書き込むことにより、影響因子測定値xを記憶する。
影響因子測定値記憶部122は、全部でm×n個(mは、影響因子Fの数。nは、測定値yの数)の影響因子測定値を記憶する。
影響因子測定値記憶部122は、例えば、m×n個の倍精度浮動小数点数の(二次元)配列として、影響因子測定値xを記憶する。あるいは、倍精度浮動小数点数を記憶するm個のフィールドを有するn個のレコードを持つファイルとして、影響因子測定値を記憶する。
影響因子測定値記憶部122は、CPU911などの処理装置を用いて、影響因子測定値xが、どの影響因子Fを測定したものであるか、また、どの測定値yに対応するものであるかを、記憶する。
例えば、m×n個の倍精度浮動小数点数の二次元配列をして影響因子測定値xを記憶する場合であれば、添え字i及びjから、どの影響因子Fを測定したものであるか、どの測定値yに対応するものであるかが判別できる。したがって、添え字i及びjに対応するアドレス(またはファイル内の位置)に、影響因子測定値xを記憶することにより、影響因子測定値xが、どの影響因子Fを測定したものであるか、どの測定値yに対応するものであるかを記憶することができる。
図4は、この実施の形態における影響因子情報入力部111、影響因子測定値入力部112、測定値入力部113が入力し、影響因子情報記憶部121、影響因子測定値記憶部122、測定値記憶部123が記憶する影響因子情報、影響因子測定値、測定値を模式的に表わした図である。
「内部抵抗値」は、測定値yの一例である。
「温度」「湿度」「天候」…は、影響因子Fの一例であり、「ID番号」が示す測定値yに対応して、それぞれの影響因子Fを測定した影響因子測定値xがある。
測定値yは、影響因子Fの影響を受けて変化する。そこで、過去に測定した測定値yと影響因子測定値xとの間の関係を見出せれば、測定対象の状態を測定せずに、影響因子測定値xから、測定値yを予測することができる。
しかし、多数ある影響因子Fのなかで、どの影響因子Fが測定値yに大きな影響を与えるかは、必ずしも明らかでない。
したがって、予測の精度を高くするためには、少しでも測定値yに影響を与える可能性がある影響因子Fすべてについて、影響因子測定値xを測定するほうがよい。
ところが、このような影響因子Fをすべて測定することは、人件費・測定装置の維持費などのコストがかかる。
したがって、最小限の影響因子Fを測定するだけで、最大限の精度を持つ予測結果を得たい。
この実施の形態の影響因子推定装置100は、どの影響因子Fが測定値yに強い影響を与えるかを推定することにより、測定値yに対する影響が少ない影響因子Fを、今後、測定しないで済ませることができるようにするものである。
これにより、最大限の予測精度を維持したまま、コストを下げることが可能となる。
図3に戻り、影響因子推定装置100の機能ブロックの説明を続ける。
重み付け算出部131は、CPU911などの処理装置を用いて、影響因子重み付けWを算出する。
影響因子重み付けWとは、影響因子情報記憶部121が記憶した影響因子情報によって示される影響因子Fのそれぞれについて、後述する影響因子選択部132がその影響因子Fを選択する確率を示す値である。
重み付け算出部131は、それぞれの影響因子Fに対応して、影響因子重み付けWを算出する。重み付け算出部131は、m個の影響因子Fに対応して、m個の影響因子重み付けWを算出する。
ここで、j番目の影響因子Fに対応する影響因子重み付けWを、影響因子重み付けWと表わすこととする。
重み付け算出部131は、CPU911などの処理装置を用いて、測定値記憶部123が記憶したn個の測定値yを、磁気ディスク装置920などの記憶装置から取得する。
重み付け算出部131は、また、CPU911などの処理装置を用いて、影響因子測定値記憶部122が記憶したm×n個の影響因子測定値xを、磁気ディスク装置920などの記憶装置から取得する。
重み付け算出部131は、CPU911などの処理装置を用いて、測定値yと、それに対応する影響因子測定値xとの間の相関の強さを示す値を算出する。
重み付け算出部131は、それぞれの影響因子Fに対応して、相関の強さを示す値を算出する。重み付け算出部131は、m個の影響因子Fに対応して、m個の相関の強さを示す値を算出する。
重み付け算出部131は、CPU911などの処理装置を用いて、算出したm個の相関の強さを示す値を、影響因子重み付けWとして、磁気ディスク装置920などの記憶装置に記憶する。
例えば、i番目の測定値yと、j番目の影響因子Fについて測定値yに対応する影響因子測定値xijとの間の関係が、一次式y=A・xij+B(A,Bは、影響因子Fによって異なる係数)で近似できる場合であれば、相関の強さを示す値として、ピアソンの積率相関係数を用いることができる。ただし、ピアソンの積率相関係数は、正の相関がある(A>0)場合と、負の相関がある(A<0)場合とで符号が異なるので、ここでは、ピアソンの積率相関係数の二乗を、相関の強さを示す値として用いることとする。
ピアソンの積率相関係数とは、測定値yの分散をVar(y)、j番目の影響因子Fについての影響因子測定値xの分散をVar(x)、測定値yと、j番目の影響因子Fjについて測定値yに対応する影響因子測定値xとの共分散をCov(x,y)とすると、式Cov(x,y)/√{Var(x)・Var(y)}を計算することにより求められる値である。
図5は、この実施の形態における重み付け算出部131の内部ブロックの構成の一例を示す詳細ブロック構成図である。
重み付け算出部131は、測定値平均値算出部311、測定値二乗平均値算出部312、影響因子測定値平均値算出部313、影響因子測定値二乗平均値算出部314、測定値分散算出部315、影響因子測定値分散算出部316、測定値共分散算出部317、測定値相関係数算出部318を有する。
測定値平均値算出部311は、CPU911などの処理装置を用いて、測定値yの平均値を算出する。
まず、測定値平均値算出部311は、CPU911などの処理装置を用いて、測定値記憶部123が記憶したn個の測定値yを、磁気ディスク装置920などの記憶装置から取得する。
次に、測定値平均値算出部311は、CPU911などの処理装置を用いて、取得した測定値yの合計を計算して、測定値合計Σ(y)とする。
そして、測定値平均値算出部311は、CPU911などの処理装置を用いて、計算した測定値合計Σ(y)を、測定値yの数nで割った値Σ(y)/nを計算し、測定値平均値Ave(y)とする。
測定値平均値算出部311は、CPU911などの処理装置を用いて、計算した測定値平均値Ave(y)を、磁気ディスク装置920などの記憶装置に記憶する。
測定値二乗平均値算出部312は、CPU911などの処理装置を用いて、測定値yの二乗の平均値を算出する。
まず、測定値二乗平均値算出部312は、CPU911などの処理装置を用いて、測定値記憶部123が記憶したn個の測定値yを、磁気ディスク装置920などの記憶装置から取得する。
次に、測定値二乗平均値算出部312は、CPU911などの処理装置を用いて、取得した測定値yの二乗を計算して、測定値二乗yとする。
そして、測定値二乗平均値算出部312は、CPU911などの処理装置を用いて、計算したn個の測定値二乗yの合計を計算し、測定値二乗合計Σ(y)とする。
測定値二乗平均値算出部312は、CPU911などの処理装置を用いて、計算した測定値二乗合計Σ(y)を、測定値yの数nで割った値Σ(y)/nを計算し、測定値二乗平均値Ave(y)とする。
測定値二乗平均値算出部312は、CPU911などの処理装置を用いて、計算した測定値二乗平均値Ave(y)を、磁気ディスク装置920などの記憶装置に記憶する。
影響因子測定値平均値算出部313は、CPU911などの処理装置を用いて、m個の影響因子Fそれぞれについて、その影響因子Fについての影響因子測定値xの平均値を算出する。
まず、影響因子測定値平均値算出部313は、CPU911などの処理装置を用いて、影響因子測定値記憶部122が記憶したm×n個の影響因子測定値xを、磁気ディスク装置920などの記憶装置から取得する。
次に、影響因子測定値平均値算出部313は、CPU911などの処理装置を用いて、m個の影響因子Fそれぞれについて、その影響因子Fについてのn個の影響因子測定値xの合計を計算して、影響因子測定値合計Σ(x)(jは、1〜mの整数)とする。
影響因子測定値平均値算出部313は、m個の影響因子Fに対応して、m個の影響因子測定値合計Σ(x)を計算する。
影響因子測定値平均値算出部313は、CPU911などの処理装置を用いて、計算したm個の影響因子測定値合計Σ(x)を、測定値yの数nで割った値Σ(x)/nを計算し、影響因子測定値平均値Ave(x)(jは、1〜mの整数)とする。
影響因子測定値平均値算出部313は、m個の影響因子Fに対応して、m個の影響因子測定値平均値Ave(x)を計算する。
影響因子測定値平均値算出部313は、CPU911などの処理装置を用いて、計算したm個の影響因子測定値平均値Ave(x)を、磁気ディスク装置920などの記憶装置に記憶する。
影響因子測定値二乗平均値算出部314は、CPU911などの処理装置を用いて、m個の影響因子Fそれぞれについて、その影響因子Fについての影響因子測定値xの二乗の平均値を算出する。
まず、影響因子測定値二乗平均値算出部314は、CPU911などの処理装置を用いて、影響因子測定値記憶部122が記憶したm×n個の影響因子測定値xを、磁気ディスク装置920などの記憶装置から取得する。
次に、影響因子測定値二乗平均値算出部314は、CPU911などの処理装置を用いて、m×n個の影響因子測定値xの二乗を計算して、影響因子測定値二乗xを計算する。
影響因子測定値二乗平均値算出部314は、m×n個の影響因子測定値xに対応して、m×n個の影響因子測定値二乗xを計算する。
影響因子測定値二乗平均値算出部314は、CPU911などの処理装置を用いて、m子の影響因子Fそれぞれについて、計算した影響因子測定値二乗xの合計を計算して、影響因子測定値二乗合計Σ(x )(jは、1〜mの整数)を計算する。
影響因子測定値二乗平均値算出部314は、1つの影響因子Fに対応するn個の影響因子測定値二乗xを合計し、m個の影響因子Fに対応して、m個の影響因子測定値二乗合計Σ(x )を計算する。
影響因子測定値二乗平均値算出部314は、CPU911などの処理装置を用いて、計算したm個の影響因子測定値二乗合計Σ(x )を、測定値yの数nで割った値Σ(x )/nを計算し、影響因子測定値二乗平均値Ave(x )とする。
影響因子測定値二乗平均値算出部314は、m個の影響因子Fに対応して、m個の影響因子測定値二乗平均値Ave(x )を計算する。
影響因子測定値二乗平均値算出部314は、CPU911などの処理装置を用いて、計算したm個の影響因子測定値二乗平均値Ave(x )を、磁気ディスク装置920などの記憶装置に記憶する。
測定値分散算出部315は、CPU911などの処理装置を用いて、測定値yの分散を算出する。
まず、測定値分散算出部315は、CPU911などの処理装置を用いて、測定値平均値算出部311が算出した測定値平均値Ave(y)を、磁気ディスク装置920などの記憶装置から取得する。
次に、測定値分散算出部315は、CPU911などの処理装置を用いて、測定値二乗平均値算出部312が算出した測定値二乗平均値Ave(y)を、磁気ディスク装置920などの記憶装置から取得する。
そして、測定値分散算出部315は、CPU911などの処理装置を用いて、取得した測定値平均値Ave(y)の二乗を計算し、測定値平均値二乗Ave(y)とする。
測定値分散算出部315は、CPU911などの処理装置を用いて、取得した測定値二乗平均値Ave(y)から、測定値平均値二乗Ave(y)を減算し、測定値分散Var(y)とする。
測定値分散算出部315は、CPU911などの処理装置を用いて、計算した測定値分散Var(y)を、磁気ディスク装置920などの記憶装置に記憶する。
影響因子測定値分散算出部316は、m個の影響因子Fそれぞれについて、その影響因子Fについての影響因子測定値xの分散を算出する。
まず、影響因子測定値分散算出部316は、CPU911などの処理装置を用いて、影響因子測定値平均値算出部313が算出したm個の影響因子測定値平均値Ave(x)(jは、1〜mの整数)を、磁気ディスク装置920などの記憶装置から取得する。
次に、影響因子測定値分散算出部316は、CPU911などの処理装置を用いて、影響因子測定値二乗平均値算出部314が算出したm個の影響因子測定値二乗平均値Ave(x )を、磁気ディスク装置920などの記憶装置から取得する。
そして、影響因子測定値分散算出部316は、CPU911などの処理装置を用いて、取得したm個の影響因子測定値平均値Ave(x)の二乗を計算し、影響因子測定値平均値二乗Ave(x(jは、1〜mの整数)とする。
影響因子測定値分散算出部316は、m個の影響因子Fに対応して、m個の影響因子平均値二乗Ave(xを計算する。
影響因子測定値分散算出部316は、CPU911などの処理装置を用いて、m個の影響因子Fそれぞれについて、その影響因子Fに対応する影響因子測定値二乗平均値Ave(x )から、その影響因子Fに対応する影響因子測定値平均値二乗Ave(xを減算し、影響因子測定値分散Var(x)(jは、1〜mの整数)とする。
影響因子測定値分散算出部316は、m個の影響因子Fに対応して、m個の影響因子測定値分散Var(x)を計算する。
影響因子測定値分散算出部316は、CPU911などの処理装置を用いて、計算したm個の影響因子測定値分散Var(x)を、磁気ディスク装置920などの記憶装置に記憶する。
測定値共分散算出部317は、CPU911などの処理装置を用いて、m個の影響因子Fそれぞれについて、影響因子測定値xと測定値yとの間の共分散を算出する。
まず、測定値共分散算出部317は、CPU911などの処理装置を用いて、測定値記憶部123が記憶したn個の測定値yを、磁気ディスク装置920などの記憶装置から取得する。
測定値共分散算出部317は、CPU911などの処理装置を用いて、影響因子測定値記憶部122が記憶したm×n個の影響因子測定値xを、磁気ディスク装置920などの記憶装置から取得する。
測定値共分散算出部317は、CPU911などの処理装置を用いて、測定値平均値算出部311が算出した測定値平均値Ave(y)を、磁気ディスク装置920などの記憶装置から取得する。
測定値共分散算出部317は、CPU911などの処理装置を用いて、影響因子測定値平均値算出部313が算出したm個の影響因子測定値平均値Ave(x)(jは、1〜mの整数)を、磁気ディスク装置920などの記憶装置から取得する。
次に、測定値共分散算出部317は、CPU911などの処理装置を用いて、取得したn個の測定値yから、取得した測定値平均値Ave(y)を減算して、測定値偏差Δyとする。
測定値共分散算出部317は、n個の測定値yそれぞれから測定値平均値Ave(y)を減算し、n個の測定値yに対応するn個の測定値偏差Δyを計算する。
そして、測定値共分散算出部317は、CPU911などの処理装置を用いて、取得したm×n個の影響因子測定値xから、取得したm個の影響因子測定値平均値Ave(x)を減算して、影響因子測定値偏差Δxとする。
測定値共分散算出部317は、j番目の影響因子Fに対応するn個の影響因子測定値xから、その影響因子Fに対応する影響因子測定値平均値Ave(x)を減算して、n個の影響因子測定値偏差Δxを計算する。測定値共分散算出部317は、m個の影響因子Fに対応して、全部でm×n個の影響因子測定値偏差Δxを計算する。
測定値共分散算出部317は、CPU911などの処理装置を用いて、計算したm×n個の影響因子測定値偏差Δxと、計算したn個の測定値偏差Δyとの積を計算し、偏差積ΔxΔyとする。
測定値共分散算出部317は、ある測定値yに対応する測定値偏差Δyと、その測定値yに対応するm個の影響因子測定値偏差Δxとの積をとり、m個の偏差積ΔxΔyを計算する。測定値共分散算出部317は、n個の測定値に対応して、全部でm×n個の偏差積ΔxΔyを計算する。
測定値共分散算出部317は、CPU911などの処理装置を用いて、m個の影響因子Fそれぞれについて、計算したm×n個の偏差積ΔxΔyのうち、その影響因子Fに対応するn個の偏差積の合計を計算し、偏差積合計Σ(ΔxΔy)とする。
測定値共分散算出部317は、j番目の影響因子Fに対応するn個の偏差積ΔxΔyを合計して、偏差積合計Σ(ΔxΔy)を計算する。測定値共分散算出部317は、m個の影響因子Fに対応して、m個の偏差積合計Σ(ΔxΔy)を計算する。
測定値共分散算出部317は、CPU911などの処理装置を用いて、m個の影響因子Fそれぞれについて、計算したm個の偏差積合計Σ(ΔxΔy)を測定値yの数nで割った値を計算し、測定値共分散Cov(x,y)(jは、1〜mの整数)とする。
測定値共分散算出部317は、m個の影響因子Fに対応して、m個の測定値共分散Cov(x,y)を計算する。
測定値共分散算出部317は、CPU911などの処理装置を用いて、計算したm個の測定値共分散Cov(x,y)を、磁気ディスク装置920などの記憶装置に記憶する。
測定値相関係数算出部318は、CPU911などの処理装置を用いて、m個の影響因子Fそれぞれについて、影響因子測定値xと測定値yとの間のピアソンの積率相関係数の二乗を算出する。
まず、測定値相関係数算出部318は、CPU911などの処理装置を用いて、測定値分散算出部315が算出した測定値分散Var(y)を、磁気ディスク装置920などの記憶装置から取得する。
測定値相関係数算出部318は、CPU911などの処理装置を用いて、影響因子測定値分散算出部316が算出したm個の影響因子測定値分散Var(x)(jは、1〜mの整数)を、磁気ディスク装置920などの記憶装置から取得する。
測定値相関係数算出部318は、CPU911などの処理装置を用いて、測定値共分散算出部317が算出したm個の測定値共分散Cov(x,y)(jは、1〜mの整数)を、磁気ディスク装置920などの記憶装置から取得する。
次に、測定値相関係数算出部318は、CPU911などの処理装置を用いて、m個の影響因子Fそれぞれについて、取得した測定値共分散Cov(x,y)の二乗を計算し、測定値共分散二乗Cov(x,y)とする。
測定値相関係数算出部318は、m個の影響因子Fに対応して、m個の測定値共分散二乗Cov(x,y)を計算する。
そして、測定値相関係数算出部318は、CPU911などの処理装置を用いて、m個の影響因子Fそれぞれについて、計算したm個の測定値共分散二乗Cov(x,y)を、取得した測定値分散Var(y)で除算し、除算した結果を更に、取得したm個の影響因子測定値分散Var(x)で除算して、ピアソンの積率相関係数の二乗を求める。
測定値相関係数算出部318は、j番目の影響因子Fに対応する測定値共分散二乗Cov(x,y)を、測定値分散Var(y)で除し、更に、その影響因子Fに対応する測定値分散Var(x)で除して、ピアソンの積率相関係数の二乗を計算する。測定値相関係数算出部318は、m個の影響因子Fに対応して、m個のピアソンの積率相関係数の二乗を計算する。
測定値相関係数算出部318は、CPU911などの処理装置を用いて、計算したm個のピアソンの積率相関係数の二乗を、影響因子重み付けWとして、磁気ディスク装置920などの記憶装置に記憶する。
なお、ここで示したビアソンの積率相関係数の計算手順は、一例に過ぎず、他の手順によって計算してもよい。
また、ピアソンの積率相関係数は、相関の強さを示す値の一例に過ぎない。例えば、測定値が順位尺度である場合には、スピアマンの順位相関係数やケンドールの順位相関係数などの順位相関係数(の二乗)を計算して、相関の強さを示す値としてもよい。
あるいは、i番目の測定値yと、j番目の影響因子Fについて測定値yに対応する影響因子測定値xijとの間の関係が、式y=f(xij)(fは、影響因子Fごとに異なる関数)で近似できる場合には、例えば、測定値yと測定値平均値Ave(y)との差の二乗和S=Σ{y−Ave(y)}で、予測値f(xij)と測定値平均値Ave(y)との差の二乗和S=Σ{f(xij)−Ave(y)}で割った値S/Sを計算して、相関の強さを示す値としてもよい。
図3に戻り、影響因子推定装置100の機能ブロックの説明を続ける。
影響因子選択部132は、CPU911などの処理装置を用いて、m個の影響因子Fのなかからm’個の選択因子F’(m’は、1≦m’≦mの整数)を選択する。
影響因子選択部132は、CPU911などの処理装置を用いて、選択した選択因子F’を示す情報を、選択因子情報Sとして、磁気ディスク装置920などの記憶装置に記憶する。
選択因子F’とは、影響因子情報記憶部121が記憶した影響因子情報によって示されるすべての影響因子Fのなかから選択した1つ以上の影響因子である。
影響因子選択部132は、測定対象の状態に強い影響を与える影響因子を推定するため、影響因子情報記憶部121が記憶した影響因子情報によって示されるすべての影響因子Fのなかから、いくつかの影響因子を選択する。
影響因子選択部132が選択した影響因子だけで、測定対象の状態(測定値y)のほとんどが説明できれば、他の影響因子による影響は薄く、無視してよいと考えることができる。
影響因子選択部132は、CPU911などの処理装置を用いて、選択因子F’を示す選択因子情報Sを生成し、磁気ディスク装置920などの記憶装置に書き込むことにより、選択因子情報Sを記憶する。
影響因子選択部132は、例えば、mビッドのデータとして、選択因子情報Sを記憶する。このデータは、例えば、j番目のビッドが「1」のとき、j番目の影響因子Fを選択することを示し、j番目のビッドが「0」のとき、j番目の影響因子Fを選択しないことを示す。
影響因子選択部132が、選択因子F’を選択する方式には、例えば、次のようなやり方がある。
総当り法:m個の影響因子Fのなかから選択できる選択因子F’の組み合わせすべてを試す方式である。m個の影響因子Fjのなかから選択できる選択因子F’の組み合わせは、(2−1)通りあるので、CPU911などの処理装置を用いて、総当り法により最適な選択因子F’の組み合わせを見つけるには、(2−1)に比例した計算時間が必要となる。したがって、影響因子Fの数mが比較的小さい場合に有効である。
分岐限定法:総当り法の改良であり、明らかに試しても意味がない組み合わせを試さないことにより、計算時間を短縮する方式である。総当り法に比べ、計算時間が短くて済むが、その効果は限られたものなので、やはり影響因子Fの数mが比較的小さい場合に有効である。
大規模組み合わせ計算法:影響因子Fの数mが多い場合、すべての組み合わせを試していると、実用的な時間内に計算が終わらない。
そこで、すべての組み合わせを試すのではなく、一部の組み合わせだけを試して、最適な選択因子F’の組み合わせを見つける方式である。すべての組み合わせを試していないので、最も最適な組み合わせ(大域的最適解)ではないかもしれないが、少なくとも、妥当性の高い組み合わせを、実用的な時間内に見つけることができる。
大規模組み合わせ計算法には、例えば、焼きなまし(Simulated Annealing)法、遺伝的アルゴリズム(Genetic Algorithm)法、タブーサーチ(Tabu Search)法などがある。
これら各方式の詳細については、ここでは説明しないが、いずれも、ランダムに選択した組み合わせの初期値から探索を開始し、その評価値に基づいて、次に探索を行う組み合わせを確率的に選択する方式である。
例えば、初期値の近傍で、評価値が改善する方向に、探索を進めていく。初期値の近傍で、評価値が最適になる組み合わせを見つけたら、まったく異なる組み合わせをランダムに選択して初期値として、探索を繰り返す。
これにより、すべての組み合わせを試さずに、妥当性の高い組み合わせを実用的な時間内に見つけることができる。したがって、影響因子Fの数mが大きい場合に有効である。
重み付き大規模組み合わせ計算法:大規模組み合わせ計算法の改良であり、評価値を改善する可能性の高い組み合わせがあらかじめわかっている場合に、ランダムに組み合わせを選択する際、その組み合わせを選択する確率を高くすることによって、大規模組み合わせ計算法より短時間に、最適解を見つけることを目指すものである。
この実施の形態では、影響因子選択部132は、重み付き大規模組み合わせ計算法によって、選択因子F’を選択するものとして以下説明するが、他の方式によってもかまわない。
影響因子選択部132は、CPU911などの処理装置を用いて、重み付け算出部131が算出したm個の影響因子重み付けWを、磁気ディスク装置920などの記憶装置から取得する。
影響因子選択部132は、CPU911などの処理装置を用いて、すべての影響因子Fのなかから、選択因子F’をランダムに選択する。
影響因子選択部132は、選択因子F’の選択に際して、取得した影響因子重み付けWの値が大きいものほど選択する確率が高くなるように構成されている。
例えば、影響因子重み付けWが0≦W≦1の倍精度浮動小数点数である場合、影響因子選択部132は、例えば、以下のようにして、選択因子F’を選択する。
影響因子選択部132は、CPU911などの処理装置を用いて、m個の(擬似)乱数R(jは、1〜mの整数。0≦R<2)を生成する。
影響因子選択部132は、CPU911などの処理装置を用いて、生成したj番目の乱数Rと、j番目の影響因子Fに対応する影響因子重み付けWとを比較し、R<Wであるか否かを判断する。
影響因子選択部132は、R<Wであると判断した場合、CPU911などの処理装置を用いて、j番目の影響因子Fを選択する。すなわち、影響因子選択部132は、例えば、選択因子情報Sのjビッド目を「1」にする。
影響因子選択部132は、R<Wでないと判断した場合、CPU911などの処理装置を用いて、j番目の影響因子Fを選択しない。すなわち、影響因子選択部132は、例えば、選択因子情報Sのjビッド目を「0」にする。
影響因子選択部132は、例えばこのようにして、選択因子F’をランダムに選択し、CPU911などの処理装置を用いて、選択した選択因子F’を示す選択因子情報Sを、磁気ディスク装置920などの記憶装置に記憶する。
影響因子選択部132が選択した選択因子F’に基づいて、後述する特徴度算出部134が特徴度Cを算出し、磁気ディスク装置920などの記憶装置に記憶する。
次に、影響因子選択部132は、CPU911などの処理装置を用いて、最初に選択した選択因子F’(以下、F’と表わす)に近い選択因子F’(以下、F’と表わす)を選択する。
例えば、最初の選択因子F’に、ある影響因子Fを1つ追加した選択因子を、次の選択因子F’として選択する。
あるいは、逆に、最初の選択因子F’から、ある影響因子Fを1つ削除した選択因子を、次の選択因子F’として選択する。
すなわち、最初の選択因子情報Sと比較して、1ビッド違いの選択因子情報を、次の選択因子情報Sとする。
影響因子選択部132は、例えばこのようにして、次の選択因子F’を選択し、CPU911などの処理装置を用いて、選択した選択因子F’を示す選択因子情報Sを、磁気ディスク装置920などの記憶装置に記憶する。
なお、影響因子選択部132は、最初の選択因子F’に、影響因子Fを1つ追加あるいは削除した選択因子を順番にすべて選択して、次の選択因子F’としてよい。
あるいは、影響因子選択部132は、最初の選択因子F’に、ある影響因子Fを1つ追加あるいは削除した選択因子のなかから、ランダムに選択したいくつかの選択因子を順番に選択して、次の選択因子F’としてもよい。
その場合、j番目の影響因子Fに対応する影響因子重み付けWが大きい場合には、その影響因子Fが追加されやすく、削除されにくいようにしてもよい。逆に、影響因子重み付けWが小さい場合には、対応する影響因子Fが削除されやすく、追加されにくいようにしてもよい。
例えば、影響因子選択部132は、CPU911などの処理装置を用いて、選択因子情報Sのjビッド目(jは、1〜mの整数)が「1」であるか「0」であるかを判断し、「1」である場合は、選択因子重み付けWを、選択確率W’とし、「0」である場合は、選択因子重み付けWを1から減算した値1−Wを、選択確率W’とし、選択確率W’の合計を計算して、選択確率合計Σ(W’)とし、磁気ディスク装置920などの記憶装置に記憶する。
次に、影響因子選択部132は、CPU911などの処理装置を用いて、(擬似)乱数R(0≦R<Σ(W’))を生成し、磁気ディスク装置920などの記憶装置に記憶する。
影響因子選択部132は、CPU911などの処理装置を用いて、整数jを1として、磁気ディスク装置920などの記憶装置に記憶する。
影響因子選択部132は、CPU911などの処理装置を用いて、乱数Rから、選択確率W’を減算し、その値を、新たな乱数Rとして、磁気ディスク装置920などの記憶装置に記憶する。影響因子選択部132は、乱数Rが0以上か否かを判断し、R≧0であると判断した場合、整数jに1を加えて、選択確率W’の減算を繰り返す。
影響因子選択部132は、R<0と判断した場合、選択因子情報Sのjビッド目を反転し、新たな選択因子情報Sとして、磁気ディスク装置920などの記憶装置に記憶する。 これにより、j番目の選択因子Fに対応する影響因子重み付けWの値に基づいて、選択因子Fの追加されやすさ及び削除されやすさを変化させることができる。
なお、ここに示した選択因子情報Sの生成方式は一例にすぎず、他の方式で生成してもかまわない。
影響因子選択部132が選択した選択因子F’に基づいて、後述する特徴度算出部134が、特徴度Cを算出して磁気ディスク装置920などの記憶装置に記憶する。
次に、影響因子選択部132は、CPU911などの処理装置を用いて、最初の選択因子F’に基づく特徴度Cと、次の選択因子F’に基づく特徴度Cとを、磁気ディスク装置920などの記憶装置から取得する。
影響因子選択部132は、CPU911などの処理装置を用いて、取得した特徴度のなかで特徴度Cが最大であるものを見つける。
影響因子選択部132は、CPU911などの処理装置を用いて、最大の特徴度Cが基礎とした選択因子が、最初の選択因子F’であるか、次の選択因子F’であるかを判断する。
影響因子選択部132は、次の選択因子F’に基づく特徴度Cが最大である場合には、次の選択因子F’を、最初の選択因子F’として、更に、その次の選択因子F’を選択する。
すなわち、特徴度が改善した方向で、更に、探索を進める。
影響因子選択部132は、最初の選択因子F’に基づく特徴度Cが最大である場合には、CPU911などの処理装置を用いて、最初に選択した選択因子F’を最適解の候補とし、磁気ディスク装置920などの記憶装置に記憶する。
影響因子選択部132は、更に、選択因子F’,F’とは無関係に、新たな選択因子をランダムに選択し、最初に選択した選択因子F’とする。
すなわち、とりあえずの局所的最適解が求まったものとし、別の局所的最適解を求めて探索を続ける。
なお、この実施の形態では、重み付き大規模組み合わせ計算法による方式を説明したが、上述した通り、他の方式でもかまわない。
例えば、影響因子選択部132は、総当り法により、すべての組み合わせにかかる影響因子F’を、順次選択してもよい。
その場合、影響因子選択部132は、影響因子重み付けWを利用しないので、重み付け算出部131はなくてもよい。
また、重み付け大規模組み合わせ計算法による方式を用いる場合には、その基礎となる大規模組み合わせ計算法として、焼きなまし法、遺伝的アルゴリズム、タブーサーチ法のいずれを用いてもかまわないし、その他の大規模組み合わせ計算法を用いてもかまわない。
特異値分解部133は、CPU911などの処理装置を用いて、選択因子F’に対応する影響因子測定値xを成分とするパターン行列Pを特異値分解する。
特異値分解とは、ある行列PをP=U・S・Vを満たす3つの行列U,S,Vの積に分解することをいう。
ここで、行列Pがm列n行であるとする。行列Uは、k列n行の行列で、U・U=I(行列Uは、行列Uの転置行列(行と列とを入れ替えた行列)。Iは、k列k行の単位行列)である。行列Sは、k列k行の正方対角行列である。行列Vは、行列V(k列m行)の転置行列で、V・V=Iである。ただし、kは、行列Pの特異値の数で、1≦k≦mの整数である。
行列Sの第i列、第j行の成分をSijとすると、行列Sは対角行列であるから、i≠jのとき、Sij=0である。また、Sii=σは、行列Pの特異値であり、i<jのとき、σ>σ>0である。
CPU911などの処理装置を有するコンピュータにより、特異値分解を計算する計算方法については、既知の方法があるので、ここでは説明しない。
ここで、行列Pを、n個のm次元行ベクトルXの集合として考えることとする。また、行列Uを、n個のk次元の行ベクトルQの集合として考えることとする。すると、行列Pの行ベクトルXと行列Uの行ベクトルQとの間には、(S・Vによる)一次変換の関係がある。
いま、i番目の測定値yに対応する影響因子測定値のm個の組(xi1,xi2,…,xim)を、m次元行ベクトルXとする。i番目の測定値yに対応する行ベクトルXをi行目とする行列を、パターン行列Pとする。
行ベクトルXと測定値yとの間に相関があれば、行ベクトルXを一次変換した行ベクトルQと、測定値yとの間にも相関がある。
ここで、パターン行列Pを特異値分解して得た行列Uを、スコア値行列Uと呼び、スコア値行列Uの行ベクトルを、スコア値ベクトルQと呼ぶこととする。スコア値行列Uのi行目であるスコア値ベクトルQを、スコア値ベクトルQと表わす。スコア値ベクトルQは、i番目の測定値yに対応する。
また、スコア値ベクトルQの成分をスコア値uと呼ぶこととする。スコア値ベクトルQは、k次元ベクトルであるから、1つのスコア値ベクトルQにつき、スコア値uがk個ある。i番目の測定値yに対応するスコア値ベクトルQのb番目の成分を、スコア値uibと表わす。また、スコア値ベクトルQのb番目の成分を総称して、スコア値uと表わすこともある。なお、スコア値uibは、スコア値行列Uのi行b列の成分である。
スコア値ベクトルQと測定値yとの間に相関があれば、影響因子測定値ベクトルX(の成分)を記憶しておく代わりに、スコア値ベクトルQ(の成分)を記憶しておいても、測定値yの予測に対する貢献は変わらない。
影響因子測定値ベクトルXの成分(影響因子測定値x)は、m個あるのに対し、スコア値ベクトルQの成分(スコア値u)は、k個(k≦m)であるから、磁気ディスク装置920などの記憶装置に必要となる記憶領域の容量は、k/m倍に削減できる。
m個の影響因子Fのなかから、測定値yに対する影響が強いm’個の影響因子Fについてのみ影響因子測定値xを記憶しておくこととした場合も同様である。
すなわち、m’個の選択因子F’についての影響因子測定値xからなる行ベクトルを、選択因子測定値ベクトルX’とし、i番目の測定値yに対応する影響因子測定値ベクトルX’をi行目とする行列を、パターン行列Pとすれば、パターン行列Pを特異値分解して得たスコア値行列Uの列数kは、k≦m’となる。したがって、1つの測定値yについて、m’個の影響因子測定値xを記憶する代わりに、k個のスコア値uを記憶すればよいので、磁気ディスク装置920などの記憶装置に必要となる記憶領域の容量は、k/m’倍に削減できる。
上述したように、スコア値ベクトルQと影響因子測定値ベクトルXとの間には一次変換の関係がある。ここで、影響因子測定値xの値に対するスコア値uの影響度は、行列Sの成分である特異値σによって異なる。i番目の特異値σと、j番目の特異値σとの間には、σ>σ(ただし、i<j)という関係があるので、影響因子測定値xの値に対するi番目のスコア値uの影響度は、影響因子測定値xの値に対するj番目のスコア値uの影響度よりも大きい。
したがって、1≦k’<kである適当なk’を選び、1つの測定値yに対応するk個のスコア値uのうち、1番目〜k’番目のスコア値uだけを抜き出して、行ベクトルQ’とし、k’+1番目〜k番目のスコア値uの影響を無視しても、近似的に、行ベクトルQ’と影響因子測定値ベクトルXとの間に一次変換の関係があるものとして扱うことができる。
ここで、スコア値ベクトルQの成分(k個のスコア値u)のうち、k’番目までのスコア値uを抜き出して生成した行ベクトルQ’を、圧縮スコア値ベクトルQ’と呼ぶこととする。圧縮スコア値ベクトルQ’は、k’個のスコア値uを成分とするk’次元の行ベクトルである。
影響因子測定値ベクトルX(または選択因子測定値ベクトルX’)から測定値yを予測した場合の予測値は、圧縮スコア値ベクトルQ’から測定値yを予測した場合の予測値で近似できる。したがって、スコア値ベクトルQのk個の成分を記憶しておく代わりに、圧縮スコア値ベクトルQ’のk’個の成分を記憶しておくこととしても、測定値yの予測に対する貢献は、ほとんど変わらない。
その場合、磁気ディスク装置920などの記憶装置に必要となる記憶領域の容量は、更に、k’/k倍に削減できる。
膨大な量のデータを収集し、それを分析する必要がある場合、記憶容量を節約することは重要である。
この実施の形態における影響因子推定装置100によって、ある影響因子Fが、測定対象の状態(測定値y)に強い影響を与えると推定された場合、それ以降、そのような推定を受けた影響因子Fだけを測定することにしても、測定値yの予測精度は落ちないと考えられる。
したがって、測定しなければならない影響因子Fの数が減り、影響因子測定値xを記憶しておく磁気ディスク装置920などの記憶装置の記憶容量を節約できる。
また、影響因子測定値xを特異値分解して、k個(あるいはk’個)のスコア値uに変換して記憶しておくこととすれば、磁気ディスク装置920などの記憶装置に必要となる記憶領域の容量を、更に節約できる。
しかし、特異値分解によって得たスコア値をk’次元まで圧縮すると、影響因子測定値xの近似になってしまうので、必ずしも、測定値yの予測精度を維持できるとは限らない。
そこで、この実施の形態の影響因子推定装置100は、特異値分解によって得た圧縮スコア値ベクトルQ’に基づいて、対応する測定値yが所定の条件を満たすか否かを判別する判別式を求め、求めた判別式の判別精度に基づいて、測定対象の状態(測定値y)に強い影響を与える影響因子Fを推定することにより、圧縮スコア値ベクトルQ’に変換したあとでも測定値yの予測精度を維持できる影響因子Fを、測定対象の状態(測定値y)に強い影響を与える影響因子Fとして推定する。
そのため、特異値分解部133は、影響因子測定値xを成分とするパターン行列Pを特異値分解して、スコア値ベクトルQの成分であるスコア値uと、パターン行列Pの特異値σとを算出する。
スコア値圧縮部136は、CPU911などの処理装置を用いて、特異値分解部133が算出した特異値σに基づいて、圧縮次元k’を算出する。
スコア値圧縮部136は、CPU911などの処理装置を用いて、特異値分解部133が算出したスコア値ベクトルQの成分であるスコア値uのうち、k’番目までの成分を抜き出して、圧縮スコア値ベクトルQ’を生成する。
図6は、この実施の形態における特異値分解部133及びスコア値圧縮部136の内部ブロックの構成の一例を示す詳細ブロック構成図である。
特異値分解部133は、選択因子測定値取得部331、特異値算出部332、スコア値算出部333を有する。
選択因子測定値取得部331は、CPU911などの処理装置を用いて、影響因子測定値記憶部122が記憶した影響因子測定値xのなかから、影響因子選択部132が選択した選択因子F’についての影響因子測定値xを取得して、パターン行列Pを生成する。
まず、選択因子測定値取得部331は、CPU911などの処理装置を用いて、影響因子選択部132が選択した選択因子F’を示す選択因子情報Sを、磁気ディスク装置920などの記憶装置から取得する。
選択因子情報Sは、例えば、mビッド(mは、影響因子Fjの数)のデータであり、jビッド目が「1」の場合、j番目の影響因子Fを選択することを示し、jビッド目が「0」の場合、j番目の影響因子Fを選択しないことを示す。
例えば、選択因子情報Sが「1011…01」であれば、影響因子F,F,F,…,Fを選択し、影響因子F,…,Fm−1を選択しないことを示す。
次に、選択因子測定値取得部331は、CPU911などの処理装置を用いて、影響因子測定値記憶部122が記憶した影響因子測定値xを、磁気ディスク装置920などの記憶装置から取得する。
このとき、選択因子測定値取得部331は、選択因子情報Sの対応するビッドが「1」である影響因子Fについての影響因子測定値xだけを取得する。
したがって、選択因子情報Sによって示される選択因子F’の数がm’個であれば、選択因子測定値取得部331は、影響因子測定値記憶部122が記憶したm×n個の影響因子測定値xのうち、m’×n個の影響因子測定値xを取得する。
そして、選択因子測定値取得部331は、CPU911などの処理装置を用いて、取得した影響因子測定値xを、パターン行列Pとして、磁気ディスク装置920などの記憶装置に記憶する。
すなわち、選択因子測定値取得部331は、i番目の測定値yに対応するm’個の影響因子測定値xを、対応する影響因子Fの順に並べたものを選択因子測定値ベクトルX’とし、選択因子測定値ベクトルX’のj’番目の成分を、i行j’列の成分とする行列を、パターン行列Pとする。
例えば、影響因子選択部132が選択した選択因子F’が、F,F,F,…,Fである場合、選択因子測定値取得部331は、i番目の測定値yに対応する影響因子測定値xとして、影響因子測定値記憶部122から影響因子測定値xi1,xi2,xi4,…,ximを取得し、選択因子測定値ベクトルX’=(xi1,xi2,xi4,…,xim)をi行目の行ベクトルとする行列を、パターン行列Pとする。
図7は、この実施の形態における選択因子測定値取得部331の動作を模式的に表わした図である。
選択因子測定値取得部331は、影響因子測定値記憶部122が記憶した影響因子測定値xのなかから、影響因子選択部132が生成した選択因子情報Sによって示される選択因子F’についての影響因子測定値xを取得して、パターン行列Pとする。
選択因子測定値ベクトルX’は、選択因子測定値取得部331が生成したパターン行列Pの1行であり、測定値yと対応している。
図6に戻り、特異値分解部133及びスコア値圧縮部136の内部ブロックの説明を続ける。
影響因子選択部132は、パターン行列Pとして、その成分である影響因子測定値xを磁気ディスク装置920などの記憶装置に記憶する。例えば、影響因子選択部132が選択した選択因子F’の数がm’個であれば、選択因子測定値取得部331は、m’×n個の倍精度浮動小数点数の(二次元)配列として、影響因子測定値xを記憶する。あるいは、倍精度浮動小数点数を記憶するフィールドm’個を有するレコードn個を持つファイルとして、影響因子測定値xを記憶する。
特異値算出部332は、パターン行列Pの特異値σを算出する。
すなわち、特異値算出部332は、CPU911などの処理装置を用いて、選択因子測定値取得部331が取得したパターン行列P(の成分)を、磁気ディスク装置920などの記憶装置から取得する。
特異値算出部332は、CPU911などの処理装置を用いて、取得したパターン行列Pの特異値σを計算する。
なお、CPU911などの処理装置を有するコンピュータが、特異値σを計算する計算方式については、既存の方式があるので、ここでは詳しく説明しない。
ここで、パターン行列Pの特異値が全部でk個あるものとする。
特異値算出部332は、CPU911などの処理装置を用いて、k個の特異値σをすべて算出し、大きい順に並べて、σ,σ,…,σとする。
特異値算出部332は、CPU911などの処理装置を用いて、算出したk個の特異値σを、磁気ディスク装置920などの記憶装置に記憶する。
特異値算出部332は、例えば、k個の倍精度浮動小数点数の配列として、特異値を記憶する。あるいは、倍精度浮動小数点数を記憶するk個のフィールド(あるいはレコード)を持つファイルとして、特異値を記憶する。
スコア値算出部333は、パターン行列Pを特異値分解したスコア値行列Uの成分であるスコア値uを算出する。
すなわち、スコア値算出部333は、CPU911などの処理装置を用いて、選択因子測定値取得部331が取得したパターン行列P(の成分)を、磁気ディスク装置920などの記憶装置から取得する。
スコア値算出部333は、CPU911などの処理装置を用いて、特異値算出部332が算出したk個の特異値σを、磁気ディスク装置920などの記憶装置から取得する。
スコア値算出部333は、CPU911などの処理装置を用いて、取得したパターン行列P(の成分)と、取得したk個の特異値σとに基づいて、スコア値uを算出する。
なお、CPU911などの処理装置を有するコンピュータが、スコア値uを計算する計算方式については、既存の方式があるので、ここでは詳しく説明しない。
スコア値行列Uは、k列n行の行列であるから、スコア値算出部333は、k×n個のスコア値uを算出する。
スコア値算出部333は、CPU911などの処理装置を用いて、算出したk×n個のスコア値uを、磁気ディスク装置920などの記憶装置に記憶する。
スコア値算出部333は、例えば、k×n個の倍精度浮動小数点数の(二次元)配列として、スコア値uを記憶する。あるいは、倍精度浮動小数点数を記憶するフィールドk個を有するレコードn個を持つファイルとして、スコア値uを記憶する。
図8は、この実施の形態における特異値算出部332及びスコア値算出部333の動作を模式的に表わした図である。
特異値算出部332は、パターン行列Pのk個の特異値σ,σ,σ,…,σを算出する。
スコア値算出部333は、特異値算出部332が算出したk個の特異値σ,σ,σ,…,σに基づいて、m’列n行のパターン行列Pを特異値分解し、k列n行のスコア値行列U(の成分であるスコア値u)を算出する。
スコア値ベクトルQは、スコア値算出部333が算出したスコア値行列Uの1行であり、測定値yと対応している。
図6に戻り、特異値分解部133及びスコア値圧縮部136の内部ブロックの説明を続ける。
スコア値圧縮部136は、圧縮次元算出部334、圧縮スコア値算出部335を有する。
圧縮次元算出部334は、CPU911などの処理装置を用いて、圧縮次元k’を算出する。
圧縮次元k’とは、1つの測定値yに対応する選択因子測定値ベクトルX’を、いくつのスコア値uで近似するかを示す数である。
例えば、選択因子測定値ベクトルX’にスコア値ベクトルQの第一成分uの寄与率が50%、第二成分uの寄与率が30%である場合、圧縮次元k’を2にすれば、80%の寄与率で選択因子測定値ベクトルX’を近似できる。
ここで、b番目の成分uの寄与率とは、特異値σの合計に対する、b番目の特異値σの割合をいう。
圧縮次元k’が大きければ、寄与率の合計が大きくなるので、近似の精度が高くなるが、記憶領域の節約効果は薄くなる。逆に、圧縮次元k’が小さければ、記憶領域は節約できるが、近似の精度が低くなり、測定値yの予測精度が悪くなる。
そこで、この実施の形態における影響因子推定装置100では、寄与率の合計が、あらかじめ定めた寄与率閾値t(ただし、0<t<1)よりも大きくなる最小のk’を求め、圧縮次元とする。
まず、圧縮次元算出部334は、CPU911などの処理装置を用いて、特異値算出部332が算出したk個の特異値σを、磁気ディスク装置920などの記憶装置から取得する。
次に、圧縮次元算出部334は、CPU911などの処理装置を用いて、取得したk個の特異値σの合計を計算し、特異値合計Σ(σ)とする。
圧縮次元算出部334は、計算した特異値合計Σ(σ)を、磁気ディスク装置920などの記憶装置に記憶する。
なお、圧縮次元算出部334は、特異値σ,σ,…,σを、添え字の小さいものから(特異値が大きいものから)順に足していき、その途中経過Σ(σ)=σ+σ+…+σ(iは、1〜kの整数)を、磁気ディスク装置920などの記憶装置に記憶しておく。
圧縮次元算出部334は、CPU911などの処理装置を用いて、計算した特異値合計Σ(σ)と、寄与率閾値tとを、磁気ディスク装置920などの記憶装置から取得する。
圧縮次元算出部334は、CPU911などの処理装置を用いて、計算した特異値合計Σ(σ)と、寄与率閾値tとの積t×Σ(σ)を計算し、特異値合計閾値Tとする。
圧縮次元算出部334は、CPU911などの処理装置を用いて、計算した特異値合計閾値Tを、磁気ディスク装置920などの記憶装置に記憶する。
圧縮次元算出部334は、計算した特異値合計閾値Tと、計算した途中経過Σ(σ)(iは、1〜kの整数)とを、磁気ディスク装置920などの記憶装置から取得する。
圧縮次元算出部334は、CPU911などの処理装置を用いて、特異値合計閾値Tと、途中経過Σ(σ)とを比較する。
圧縮次元算出部334は、CPU911などの処理装置を用いて、途中経過Σ(σ)が、特異値合計閾値Tよりも大きい最小のiを見つけ、圧縮次元k’とする。
圧縮次元算出部334は、CPU911などの処理装置を用いて、圧縮次元k’を、磁気ディスク装置920などの記憶装置に記憶する。
圧縮スコア値算出部335は、CPU911などの処理装置を用いて、スコア値算出部333が算出したn個のk次元ベクトルであるスコア値ベクトルQを、n個のk’次元ベクトルである圧縮スコア値ベクトルQ’に圧縮する。
まず、圧縮スコア値算出部335は、CPU911などの処理装置を用いて、圧縮次元算出部334が算出した圧縮次元k’を、磁気ディスク装置920などの記憶装置から取得する。
次に、圧縮スコア値算出部335は、CPU911などの処理装置を用いて、スコア値算出部333が算出したスコア値uを、磁気ディスク装置920などの記憶装置から取得する。
このとき、圧縮スコア値算出部335は、ある測定値yに対応するスコア値ベクトルQの成分であるk個のスコア値uのうち、1番目からk’番目までのスコア値u(k’個)を取得する。
すなわち、圧縮スコア値算出部335は、スコア値算出部333が算出したk×n個のスコア値uのうち、k’×n個のスコア値を取得する。
圧縮スコア値算出部335は、CPU911などの処理装置を用いて、取得したスコア値uを、磁気ディスク装置920などの記憶装置に記憶する。
すなわち、圧縮スコア値算出部335は、ある測定値yに対応して取得したk’個のスコア値を成分とするベクトルを、圧縮スコア値ベクトルQ’とし、n個の圧縮スコア値ベクトルQ’を記憶する。すなわち、圧縮スコア値算出部335は、k’×n個のスコア値を記憶する。
圧縮スコア値算出部335は、例えば、k’×n個の倍精度浮動小数点数の(二次元)配列として、スコア値uを記憶する。あるいは、倍精度浮動小数点数を記憶するフィールドk’個を有するレコードn個を持つファイルとして、スコア値uを記憶する。
図9は、この実施の形態における圧縮次元算出部334及び圧縮スコア値算出部335の動作を模式的に表わした図である。
圧縮次元算出部334は、特異値算出部332が算出したk個の特異値σ,σ,σ,…,σに基づいて、圧縮次元k’を算出する。
圧縮スコア値算出部335は、圧縮次元算出部334が算出した圧縮次元k’に基づいて、スコア値算出部333が算出したk列n行のスコア値行列Uを圧縮し、k’列n行の圧縮スコア値行列U’とする。
例えば、圧縮次元k’が「3」であれば、圧縮スコア値算出部335は、スコア値行列Uの1列目〜3列目までを取り出して、圧縮スコア値行列U’とする。
圧縮スコア値ベクトルQ’は、圧縮スコア値算出部335が算出した圧縮スコア値行列U’の1行であり、測定値yと対応している。
なお、スコア値算出部333が、圧縮次元算出部334が算出した圧縮次元k’を取得し、スコア値ベクトルQの1番目からk’番目までの成分であるスコア値uだけを計算することとしてもよい。その場合、圧縮スコア値算出部335は、なくてもよい。
図3に戻り、影響因子推定装置100の機能ブロックの説明を続ける。
特徴度算出部134は、CPU911などの処理装置を用いて、特徴度Cを算出する。
特徴度Cとは、所定の条件を満たす測定値yについて、測定値yに対応する圧縮スコア値ベクトルQ’のバラツキの度合いを示す値である。
例えば、圧縮スコア値ベクトルQ’が、ほぼ一点に集中していれば、圧縮スコア値ベクトルQ’のバラツキが小さいといえる。
また、圧縮スコア値ベクトルQ’が、直線状に分布していれば、一点に集中している場合ほどではないが、圧縮スコア値ベクトルQ’のバラツキが小さいといえる。
特徴度Cは、このように、圧縮スコア値ベクトルQ’の分布状態を示す値である。
図10は、この実施の形態における特徴度算出部134の内部ブロックの構成の一例を示す詳細ブロック構成図である。
特徴度算出部134は、圧縮スコア値ベクトル取得部391、基準スコア値平均値算出部341、基準スコア値分散算出部342、基準スコア値共分散算出部343、回帰式算出部392、回帰誤差算出部393、回帰誤差合計算出部394を有する。
圧縮スコア値ベクトル取得部391は、CPU911などの処理装置を用いて、所定の条件を満たす測定値yに対応する圧縮スコア値ベクトルQ’を取得する。
まず、圧縮スコア値ベクトル取得部391は、CPU911などの処理装置を用いて、測定値記憶部123が記憶したn個の測定値yを、磁気ディスク装置920などの記憶装置から取得する。
圧縮スコア値ベクトル取得部391は、CPU911などの処理装置を用いて、取得したn個の測定値yそれぞれについて、所定の条件を満たすか否かを判断する。
圧縮スコア値ベクトル取得部391が圧縮スコア値ベクトルQ‘を取得する条件には、例えば、測定値yが所定の閾値以下である場合、逆に、測定値yが所定の閾値以上である場合、または、測定値yが第一の閾値と第二の閾値の間にある場合などがある。
これらの条件は、測定値yの予測において、利用者が判別したい条件である。例えば、測定値yがある閾値を超えた場合に、部品交換などの対応をしなければならないのであれば、それを取得の条件とする。
これらの条件は、あらかじめ定めておき、圧縮スコア値ベクトル取得部391が、あらかじめ定められた条件にしたがって、その条件を満たすかを判断してもよい。
あるいは、条件だけはあらかじめ定めておくが、比較の対象となる閾値は可変できるようにしておき、影響因子推定装置100が、CPU911などの処理装置を用いて、キーボード902などの入力装置から入力してもよい。
あるいは、いくつかの条件のなかから、圧縮スコア値ベクトルQ’の取得条件を選べるようにしておき、そのなかから選んだ条件で、圧縮スコア値ベクトルQ’を取得することとしてもよい。
次に、圧縮スコア値ベクトル取得部391は、CPU911などの処理装置を用いて、スコア値圧縮部136が算出した圧縮スコア値ベクトルQ’のなかから、所定の条件を満たすと判断した測定値yに対応する圧縮スコア値ベクトルQ’の成分であるスコア値uを、磁気ディスク装置920などの記憶装置から取得する。
例えば、圧縮スコア値ベクトル取得部391は、測定値y,y,…が所定の条件を満たし、測定値y,y,…が所定の条件を満たさないと判断した場合、CPU911などの処理装置を用いて、圧縮スコア値ベクトルQ’,Q’,…の成分であるスコア値u11,u12,…,u1k’、u41,u42,…,u4k’、…を、磁気ディスク装置920などの記憶装置から取得する。
圧縮スコア値ベクトル取得部391は、所定の条件を満たすと判断した測定値yがn’個あるとすると、n’個の測定値yに対応するn’個の圧縮スコア値ベクトルQ’の成分であるk’×n’個のスコア値uを、磁気ディスク装置920などの記憶装置から取得する。
そして、圧縮スコア値ベクトル取得部391は、CPU911などの処理装置を用いて、取得したn’個の圧縮スコア値ベクトルQ’(の成分であるスコア値u)を、磁気ディスク装置920などの記憶装置に記憶する。
圧縮スコア値ベクトル取得部391は、例えば、n’×k’個の倍精度浮動小数点数の(二次元)配列として、取得した圧縮スコア値ベクトルQ’を記憶する。あるいは、倍精度浮動小数点数を記憶するフィールドk’個を有するレコードn’個を持つファイルとして、取得した圧縮スコア値ベクトルQ’を記憶する。
回帰式算出部392は、CPU911などの処理装置を用いて、圧縮スコア値ベクトル取得部391が取得した圧縮スコア値ベクトルQ’の回帰式を算出する。
ここで、回帰式とは、ある程度の広がりを持って分布する圧縮スコア値ベクトルQ’の分布を近似する方程式である。
圧縮スコア値ベクトルQ’の圧縮次元がk’である場合、圧縮スコア値ベクトルQ’に対応するk’次空間における点を、k’次空間における回帰式が表わす超平面(または超曲面)上の点で近似する。
一例として、圧縮次元k’が2である場合について説明する。なお、圧縮次元k’は3以上でもよい。
圧縮スコア値ベクトルQ’は、k’個のスコア値uを成分としてもつ。ここで、圧縮スコア値ベクトルQ‘の第一成分であるスコア値uを説明変数、第二成分であるスコア値uを目的変数とし、u=au+b+ε(ただし、a,bは、回帰式のパラメータ。εは、回帰誤差)について、εの二乗の合計が最も小さくなる直線の方程式l:U=a・u+b(ただし、Uは、スコア値uの予測値であって、u=U+ε)を回帰式として、回帰式のパラメータa,bを求める。
ここで、スコア値uの平均値をAve(u)、分散をVar(u)、スコア値uとスコア値uとの共分散をCov(u,u)とすると、回帰式lは、l:U=Cov(u,u)/Var(u)・{u−Ave(u)}+Ave(u)であることが知られている。
したがって、a=Cov(u,u)/Var(u)、b=Ave(u)―Ave(u)・Cov(u,u)/Var(u)を計算することにより、回帰式のパラメータを算出することができる。
そのため、基準スコア値平均値算出部341・基準スコア値分散算出部342・基準スコア値共分散算出部343が、スコア値uの平均値、分散、共分散を計算する。
基準スコア値平均値算出部341は、CPU911などの処理装置を用いて、圧縮スコア値ベクトル取得部391が取得したn’個の圧縮スコア値ベクトルQ’の各成分ごとに、スコア値uの平均値を算出する。
まず、基準スコア値平均値算出部341は、CPU911などの処理装置を用いて、圧縮スコア値ベクトル取得部391が取得したn’個の圧縮スコア値ベクトルQ’の成分であるk’×n’個のスコア値uを、磁気ディスク装置920などの記憶装置から取得する。
次に、基準スコア値平均値算出部341は、CPU911などの処理装置を用いて、取得した圧縮スコア値ベクトルQ’の各成分それぞれについて、スコア値uの合計を計算し、基準スコア値合計Σ(u)(bは、1〜k’の整数)とする。
圧縮スコア値ベクトル取得部391が取得した圧縮スコア値ベクトルQ’の数がn’個だとすると、基準スコア値平均値算出部341は、n’個の圧縮スコア値ベクトルQ’の各成分について、n’個のスコア値uを合計する。
圧縮スコア値ベクトルQ’は、k’次元のベクトルなので、基準スコア値平均値算出部341は、各成分ごとに基準スコア値合計Σ(u)を計算し、圧縮スコア値ベクトルQ’のk’個の成分に対応して、k’個の基準スコア値合計Σ(u)を計算する。
そして、基準スコア値平均値算出部341は、CPU911などの処理装置を用いて、圧縮スコア値ベクトルQ’の各成分それぞれについて、計算したk’個の基準スコア値合計Σ(u)を、圧縮スコア値ベクトル取得部391が取得した圧縮スコア値ベクトルQ’の数n’で割り、基準スコア値平均値Ave(u)(bは、1〜k’の整数)とする。
基準スコア値平均値算出部341は、圧縮スコア値ベクトルQ’のk’個の成分に対応して、k’個の基準スコア値平均値Ave(u)を計算する。
基準スコア値平均値算出部341は、CPU911などの処理装置を用いて、計算したk’個の基準スコア値平均値Ave(u)を、磁気ディスク装置920などの記憶装置に記憶する。
基準スコア値平均値算出部341は、例えば、k’個の倍精度浮動小数点数の配列として、基準スコア値平均値Ave(u)を記憶する。あるいは、倍精度浮動少数点数を記憶するフィールド(あるいはレコード)k’個を持つファイルとして、基準スコア値平均値Ave(u)を記憶する。
基準スコア値分散算出部342は、CPU911などの処理装置を用いて、圧縮スコア値ベクトル取得部391が取得した圧縮スコア値ベクトルQ’の各成分それぞれについて、スコア値uの分散を算出する。
まず、基準スコア値分散算出部342は、CPU911などの処理装置を用いて、圧縮スコア値ベクトル取得部391が取得したn’個の圧縮スコア値ベクトルQ’の成分であるk’×n’個のスコア値uを、磁気ディスク装置920などの記憶装置から取得する。
基準スコア値分散算出部342は、CPU911などの処理装置を用いて、基準スコア値平均値算出部341が計算したk’個の基準スコア値平均値Ave(u)を、磁気ディスク装置920などの記憶装置から取得する。
基準スコア値分散算出部342は、CPU911などの処理装置を用いて、圧縮スコア値ベクトルQ’のk’個の成分それぞれについて、取得したスコア値uと、取得した基準スコア値平均値Ave(u)とに基づいて、スコア値uの分散を計算し、基準スコア値分散Var(u)(bは、1〜k’の整数)とする。
基準スコア値分散算出部342は、圧縮スコア値ベクトルQ’のk’個の成分に対応して、k’個の基準スコア値分散Var(u)を計算する。
例えば、基準スコア値分散算出部342は、CPU911などの処理装置を用いて、ある成分に対応するスコア値uから、その成分に対応する基準スコア値平均値Ave(u)を減算してスコア値偏差Δuとし、スコア値偏差Δuを二乗して、スコア値偏差二乗(Δu)とし、1つの成分に対応するn’個のスコア値偏差二乗(Δu)を合計して、スコア値偏差二乗合計Σ{(Δu)}とし、スコア値偏差二乗合計Σ{(Δu)}を、基準ベクトル群Gに属する圧縮スコア値ベクトルQ’の数n’で除して、基準スコア値分散Var(u)を求める。
基準スコア値分散算出部342は、CPU911などの処理装置を用いて、計算したk’個の基準スコア値分散Var(u)を、磁気ディスク装置920などの記憶装置に記憶する。
基準スコア値分散算出部342は、例えば、k’個の倍精度浮動小数点数の配列として、基準スコア値分散Var(u)を記憶する。あるいは、倍精度浮動少数点数を記憶するフィールド(あるいはレコード)k’個を持つファイルとして、基準スコア値分散Var(u)を記憶する。
基準スコア値共分散算出部343は、CPU911などの処理装置を用いて、圧縮スコア値ベクトル取得部391が取得した圧縮スコア値ベクトルQ’のある成分と、他の成分との間の共分散を算出する。
まず、基準スコア値共分散算出部343は、CPU911などの処理装置を用いて、圧縮スコア値ベクトル取得部391が取得したn’個の圧縮スコア値ベクトルQ’の成分であるk’×n’個のスコア値uを、磁気ディスク装置920などの記憶装置から取得する。
基準スコア値共分散算出部343は、CPU911などの処理装置を用いて、基準スコア値平均値算出部341が計算したk’個の基準スコア値平均値Ave(u)を、磁気ディスク装置920などの記憶装置から取得する。
基準スコア値共分散算出部343は、CPU911などの処理装置を用いて、取得したスコア値uと、取得したk’個の基準スコア値平均値Ave(u)とに基づいて、圧縮スコア値ベクトルQ’の2つの成分の間の共分散を計算し、基準スコア値共分散Cov(ub1,ub2)(bは、1〜k’−1の整数。bは、b+1〜k’の整数)とする。
圧縮スコア値ベクトルQ’はk’次元ベクトルなので、k’個の成分を有する。そのなかから2つを選ぶ組み合わせは、{k’・(k’−1)/2}通りある。したがって、基準スコア値共分散算出部343は、{k’・(k’−1)/2}個の基準スコア値共分散Cov(ub1,ub2)を計算する。
例えば、基準スコア値共分散算出部343は、CPU911などの処理装置を用いて、ある成分に対応するスコア値uから、その成分に対応する基準スコア値平均値Ave(u)を減算し、スコア値偏差Δuとする。なお、スコア値偏差Δuは、基準スコア値分散算出部342が計算したものを、磁気ディスク装置920などの記憶装置に記憶しておき、基準スコア値共分散算出部343が取得してもよい。
基準スコア値共分散算出部343は、CPU911などの処理装置を用いて、ある圧縮スコア値ベクトルQ’に対応するk’個のスコア値偏差Δuのなかから、2つのスコア値偏差Δuを選んで、スコア値偏差Δuの積を計算し、スコア値偏差積Δub1Δub2(bは、1〜k’−1の整数。bは、b+1〜k’の整数)とする。
1つの圧縮スコア値ベクトルQ’に対応するk’個のスコア値偏差Δuのなかから2つのスコア値偏差を選ぶ組み合わせは{k’・(k’−1)/2}通りなので、基準スコア値共分散算出部343は、1つの測定値yにつき、{k’・(k’−1)/2}個のスコア値偏差積Δub1Δub2を計算する。
また、圧縮スコア値ベクトル取得部391が取得した圧縮スコア値ベクトルQ’はn’個あるので、基準スコア値共分散算出部343は、n’個の圧縮スコア値ベクトルQ’に対応して、全部で、{k’・(k’−1)/2}×n’個のスコア値偏差積Δub1Δub2を計算する。
基準スコア値共分散算出部343は、CPU911などの処理装置を用いて、圧縮スコア値ベクトルQ’の同じ2つの成分について計算したスコア値偏差積Δub1Δub2を合計し、スコア値偏差積合計Σ(Δub1Δub2)とする。
基準ベクトル群Gに属する圧縮スコア値ベクトルQ’の数はn’個であるから、同じ2つの成分について計算したスコア値偏差積Δub1Δub2もn’個ある。基準スコア値共分散算出部343は、n’個のスコア値偏差積Δub1Δub2を合計して、スコア値偏差積合計Σ(Δub1Δub2)を計算する。
また、圧縮スコア値ベクトルQ’のk’個の成分から、2つの成分を選ぶ組み合わせは{k’・(k’−1)/2}通りなので、基準スコア値共分散算出部343は、{k’・(k’−1)/2}個のスコア値偏差積合計Σ(Δub1Δub2)を計算する。
基準スコア値共分散算出部343は、CPU911などの処理装置を用いて、計算したスコア値偏差積合計Σ(Δub1Δub2)を、圧縮スコア値ベクトル取得部391が取得した圧縮スコア値ベクトルQ’の数n’で除して、基準スコア値共分散Cov(ub1,ub2)を求める。
基準スコア値共分散算出部343は、CPU911などの処理装置を用いて、計算した{k’・(k’−1)/2}個の基準スコア値共分散Cov(ub1,ub2)を、磁気ディスク装置920などの記憶装置に記憶する。
基準スコア値共分散算出部343は、例えば、k’×k’個の倍精度浮動小数点数の(二次元)配列として、基準スコア値共分散Cov(ub1,ub2)を記憶する。
回帰式算出部392は、CPU911などの処理装置を用いて、基準スコア値平均値算出部341が算出した基準スコア値平均値Ave(u)・基準スコア値分散算出部342が算出した基準スコア値分散Var(u)・基準スコア値共分散算出部343が算出した基準スコア値共分散Cov(ub1,ub2)を、磁気ディスク装置920などの記憶装置から取得する。
回帰式算出部392は、CPU911などの処理装置を用いて、取得した基準スコア値平均値Ave(u)・基準スコア値分散Var(u)・基準スコア値共分散Cov(ub1,ub2)に基づいて、回帰式のパラメータを算出する。
回帰式算出部392は、CPU911などの処理装置を用いて、算出した回帰式のパラメータを、磁気ディスク装置920などの記憶装置に記憶する。
回帰誤差算出部393は、CPU911などの処理装置を用いて、回帰式算出部392が算出した回帰式と、圧縮スコア値ベクトルQ’との間の回帰誤差の二乗εを算出する。
すなわち、回帰誤差算出部393は、CPU911などの処理装置を用いて、回帰式算出部392が算出した回帰式のパラメータを、磁気ディスク装置920などの記憶装置から取得する。
次に、回帰誤差算出部393は、CPU911などの処理装置を用いて、圧縮スコア値ベクトル取得部391が取得したn’個の圧縮スコア値ベクトルQ’の成分であるk’×n’個のスコア値uを、磁気ディスク装置920などの記憶装置から取得する。
次に、回帰誤差算出部393は、CPU911などの処理装置を用いて、取得した回帰式のパラメータと、取得したスコア値uとに基づいて、回帰誤差の二乗εを算出する。
例えば、上記説明した圧縮次元k’が2の場合の例であれば、回帰式として、直線の方程式l:U=a・u+b(ただし、u=U+ε)を用いるので、回帰誤差εは、ε=a・u+b−uを計算することにより、算出することができる。
回帰誤差算出部393は、全部でn’個(圧縮スコア値ベクトル取得部391が取得した圧縮スコア値ベクトルQ’の数と等しい)の回帰誤差の二乗εを算出する。
なお、回帰誤差の二乗εは、近似誤差の一例である。特徴度算出部134は、近似誤差として、例えば、回帰誤差の絶対値を用いてもよい。
回帰誤差合計算出部394は、CPU911などの処理装置を用いて、回帰誤差算出部393が算出した回帰誤差の二乗εを合計して、特徴度Cとする。
回帰誤差合計算出部394は、CPU911などの処理装置を用いて、算出した特徴度Cを、磁気ディスク装置920などの記憶装置に記憶する。
図3に戻り、影響因子推定装置100の機能ブロックの説明を続ける。
判別式算出部137は、特徴度算出部134が算出した特徴度Cが良好な場合に、CPU911などの処理装置を用いて、圧縮スコア値ベクトルQ’の成分であるスコア値uに基づいて対応する測定値yが所定の条件を満たすか否かを判別する判別式を算出する。
ここで、特徴度Cが良好とは、所定の条件を満たす測定値yに対応する圧縮スコア値ベクトルQ’のバラツキが小さいことを示す場合をいう。
所定の条件を満たす測定値yに対応する圧縮スコア値ベクトルQ’のバラツキが小さい場合、圧縮スコア値ベクトルQ’が与えられたとき、それに対応する測定値yが所定の条件を満たすか否かを容易に予測できる可能性が高い。
逆に、所定の条件を満たす測定値yに対応する圧縮スコア値ベクトルQ’のバラツキが大きい場合、圧縮スコア値ベクトルQ’が与えられたとき、それに対応する測定値yが所定の条件を満たすか否かを予測しにくい可能性が高い。
したがって、所定の条件を満たし測定値yに対応する圧縮スコア値ベクトルQ’のバラツキが大きいことが、特徴度Cからわかる場合には、以下の計算を省略することにより、処理の高速化を図る。
判別度算出部138は、CPU911などの処理装置を用いて、判別式算出部137が算出した判別式に、スコア値圧縮部136が算出した圧縮スコア値ベクトルQ’の成分であるスコア値uを代入して、対応する測定値yが所定の条件を満たすか否かを判別する。
判別度算出部138は、CPU911などの処理装置を用いて、判別結果が正しいか否かを判定し、判別式算出部137が算出した判別式の判別精度を示す値を算出して、判別度とする。
図11は、この実施の形態における判別式算出部137及び判別度算出部138の内部ブロックの構成の一例を示す詳細ブロック図である。
まず、判別式算出部137について説明する。
判別式算出部137は、バラツキ判定部371、分散共分散行列逆行列算出部344、判別式パラメータ算出部372を有する。
バラツキ判定部371は、CPU911などの処理装置を用いて、特徴度算出部134が算出した特徴度Cが良好であるか否かを判定する。
まず、バラツキ判定部371は、CPU911などの処理装置を用いて、特徴度算出部134が算出した特徴度Cを、磁気ディスク装置920などの記憶装置から取得する。
次に、バラツキ判定部371は、CPU911などの処理装置を用いて、取得した特徴度Cを所定の値と比較する。
特徴度Cが所定の値より小さい場合、バラツキ判定部371は、特徴度算出部134が取得した圧縮スコア値ベクトルQ’のバラツキが小さく、特徴度Cが良好であると判断する。
特徴度Cが所定の値以上である場合、バラツキ判定部371は、特徴度算出部134が取得した圧縮スコア値ベクトルQ’のバラツキが大きく、特徴度Cが良好ではないと判断する。
バラツキ判定部371は、特徴度Cが良好でないと判断した場合、影響因子選択部132に通知する。これにより、影響因子推定装置100は、判別式の算出、判別度の算出など以下の処理を中止し、次の選択因子F’についての処理を始める。
判別式パラメータ算出部372は、特徴度Cが良好であるとバラツキ判定部371が判定した場合に、CPU911などの処理装置を用いて、測定値yに対応する圧縮スコア値ベクトルQ’の成分であるスコア値uから、測定値yが所定の条件を満たすかどうかを判別するための判別式のパラメータを算出する。
ここで、判別式とは、スコア値uを変数とする関数であって、判別式に、スコア値uの値を代入することによって得た判別式の値によって、対応する測定値yが所定の条件を満たすかどうかを判別するものをいう。
例えば、測定値yが所定の条件を満たすとき、判別式の値が0以上となり、測定値yが所定の条件を満たさないとき、判別式の値が0未満となるように、判別式のパラメータを設定しておけば、測定値yが不明であっても、判別式にスコア値uの値を代入することにより、判別式の値を求めれば、測定値yが所定の条件を満たすかどうかを判別できる。
この実施の形態では、判別式として、基準ベクトル群Gからのマハラノビス距離の二乗を用いることとする。
ここで、基準ベクトル群Gとは、所定の条件を満たす測定値yに対応する圧縮スコア値ベクトルQ’のグループである。したがって、基準ベクトル群Gに属する圧縮スコア値ベクトルQ’は、特徴度算出部134が取得した圧縮スコア値ベクトルと等しい。
マハラノビス距離とは、あるベクトル群があったときに、そのベクトル群の重心と、そのベクトル群に含まれるベクトルあるいはそのベクトル群に含まれないベクトルとの間の距離を示す値である。ただし、通常のユークリッド距離と異なり、データの相関が強い方向の距離は短く、データの相関が弱い方向の距離は長くなるよう補正が加えられている。そのため、マハラノビス距離を所定の閾値と比較することにより、あるベクトルが、そのベクトル群に含まれるか否かを判別することができる。
ベクトル群Gの重心(ベクトルの各成分の平均値を成分とするベクトル)をμ、各成分の分散共分散行列をΣとすると、ベクトル群Gに対するベクトルQ’のマハラノビス距離Dは、D=(ΔQ’)Σ−1(ΔQ’)で求められる。
ここで、ΔQ’は、ベクトルQ’から重心ベクトルμを減算した偏差ベクトル(行ベクトル)、(ΔQ’)は、行ベクトルであるΔQ’を転置して列ベクトルにしたものである。また、Σ−1は、分散共分散行列Σの逆行列である。
なお、分散共分散行列Σとは、ベクトル群Gの各成分の分散を対角成分とし、ベクトル群Gの2つの成分の共分散をその他の成分とする対称行列である。ベクトル群Gがk’次元のベクトルの群である場合、分散共分散行列Σは、k’列k’行の行列となる。
分散共分散行列逆行列算出部344は、判別式算出のため、CPU911などの処理装置を用いて、特徴度算出部134が取得した圧縮スコア値ベクトルQ’の分散共分散行列Σの逆行列Σ−1を計算する。
ここで、分散共分散行列Σは、圧縮スコア値ベクトルQ’のb番目の成分についての基準スコア値分散Var(u)をb列b行の成分とし、圧縮スコア値ベクトルQ’のb番目の成分とb番目の成分との組み合わせについての基準スコア値共分散Cov(ub1,ub2)を、b列b行の成分とする行列である。
ここで、基準スコア値分散Var(u)及び基準スコア値共分散Cov(ub1,ub2)は、特徴度算出部134が特徴度Cを算出する際に、基準スコア値分散算出部342及び基準スコア値共分散算出部343が算出して、磁気ディスク装置920などの記憶装置に記憶しているので、判別式算出部137はこれを利用して、分散共分散行列を得る。
なお、Cov(ub1,ub2)=Cov(ub2,ub1)であるから、基準スコア値共分散算出部343は、b<bの場合についてのみCov(ub1,ub2)を計算すればよい。
分散共分散行列逆行列算出部344は、CPU911などの処理装置を用いて、特徴度算出部134の基準スコア値分散算出部342が算出したk’個の基準スコア値分散Var(u)を、磁気ディスク装置920などの記憶装置から取得する。
分散共分散行列逆行列算出部344は、CPU911などの処理装置を用いて、基準スコア値共分散算出部343が算出した{k’・(k’−1)/2}個の基準スコア値共分散Cov(ub1,ub2)を、磁気ディスク装置920などの記憶装置から取得する。
分散共分散行列逆行列算出部344は、CPU911などの処理装置を用いて、取得した基準スコア値分散Var(u)と、取得した基準スコア値共分散Cov(ub1,ub2)とから、分散共分散行列Σを生成する。
分散共分散行列逆行列算出部344は、CPU911などの処理装置を用いて、生成した分散共分散行列Σを、磁気ディスク装置920などの記憶装置に記憶する。
分散共分散行列逆行列算出部344は、例えば、k’×k’個の倍精度浮動小数点数の(二次元)配列として、分散共分散行列Σを記憶する。このとき、分散共分散行列逆行列算出部344は、基準スコア値共分散算出部343が算出した基準スコア値共分散Cov(ub1,ub2)を記憶したk’×k’個の倍精度浮動小数点数の配列に、値を書き加えることにより、分散共分散行列Σを生成し、記憶してもよい。
次に、分散共分散行列逆行列算出部344は、CPU911などの処理装置を用いて、生成した分散共分散行列Σの逆行列Σ−1を算出する。
CPU911などの処理装置を有するコンピュータが、逆行列を算出する計算方式は、既存の方式があるので、ここでは説明を省略する。
分散共分散行列逆行列算出部344は、CPU911などの処理装置を用いて、算出した逆行列Σ−1(の成分)を、磁気ディスク装置920などの記憶装置に記憶する。
分散共分散行列逆行列算出部344は、例えば、k’×k’個の倍精度浮動小数点数の(二次元)配列として、逆行列Σ−1の成分を記憶する。
判別式パラメータ算出部372は、CPU911などの処理装置を用いて、分散共分散行列逆行列算出部344が算出した分散共分散行列の逆行列Σ−1の成分を、磁気ディスク装置920などの記憶装置から取得する。
判別式パラメータ算出部372は、また、CPU911などの処理装置を用いて、特徴度算出部134の基準スコア値平均値算出部341が算出した基準スコア値平均値Ave(u)を、磁気ディスク装置920などの記憶装置から取得する。
判別式パラメータ算出部372は、CPU911などの処理装置を用いて、取得した分散共分散行列の逆行列Σ−1及び取得した基準スコア値平均値Ave(u)から、基準ベクトル群Gに対するマハラノビス距離を求めるためのパラメータを算出し、判別式のパラメータとする。
判別式パラメータ算出部372は、CPU911などの処理装置を用いて、算出した判別式のパラメータを、磁気ディスク装置920などの記憶装置に記憶する。
次に、判別度算出部138について説明する。
判別度算出部138は、条件判断部381、判別結果判断部382、判別結果比較部383、正解率算出部384を有する。
条件判断部381は、CPU911などの処理装置を用いて、測定値記憶部123が記憶した測定値yが、所定の条件を満たすか否かを判断する。
まず、条件判断部381は、CPU911などの処理装置を用いて、測定値記憶部123が記憶したn個の測定値yを取得する。
次に、条件判断部381は、CPU911などの処理装置を用いて、取得したn個の測定値yそれぞれについて、所定の条件を満たすか否かを判断する。
次に、条件判断部381は、CPU911などの処理装置を用いて、判断したn個の判断結果を、磁気ディスク装置920などの記憶装置に記憶する。
なお、圧縮スコア値ベクトル取得部391が圧縮スコア値ベクトルQ’を取得する際に判断した結果を磁気ディスク装置920などの記憶装置に記憶しておき、条件判断部381は、その判断結果を磁気ディスク装置920などの記憶装置から取得することとしてもよい。
判別結果判断部382は、CPU911などの処理装置を用いて、判別式算出部137が算出した判別式と、測定値記憶部123が記憶した測定値yに対応して、スコア値圧縮部136が算出した圧縮スコア値ベクトルQ’の成分であるスコア値uとに基づいて、測定値yが所定の条件を満たすか否かを判別する。
まず、判別結果判断部382は、CPU911などの処理装置を用いて、判別式算出部137(の判別式パラメータ算出部372)が算出した判別式のパラメータを、磁気ディスク装置920などの記憶装置から取得する。
次に、判別結果判断部382は、CPU911などの処理装置を用いて、スコア値圧縮部136が算出したk’×n個のスコア値uを、磁気ディスク装置920などの記憶装置から取得する。
次に、判別結果判断部382は、CPU911などの処理装置を用いて、測定値記憶部123が記憶したn個の測定値yそれぞれについて、対応する圧縮スコア値ベクトルQ’の成分sであるスコア値uを、取得したパラメータによって示される判別式に代入して、基準ベクトル群Gに対する圧縮スコア値ベクトルQ’のマハラノビス距離の二乗を算出する。
すなわち、判別結果判断部382は、CPU911などの処理装置を用いて、取得したスコア値uから、スコア値uに対応する基準スコア値平均値Ave(u)(判別式のパラメータの一部)を減算し、スコア値偏差Δuとする。
判別結果判断部382は、圧縮スコア値ベクトルQ’の1つの成分に対応するn個のスコア値uから、その成分に対応する基準スコア値平均値Ave(u)を減算し、n個のスコア値偏差Δuを計算する。
圧縮スコア値ベクトルQ’の成分はk’個あるから、判別結果判断部382は、全部でk’×n個のスコア値偏差Δuを計算する。
判別結果判断部382は、CPU911などの処理装置を用いて、計算したスコア値偏差Δuと、逆行列Σ−1(判別式のパラメータの一部)とに基づいて、圧縮スコア値ベクトルQ’それぞれについて、マハラノビス距離の二乗Dを計算する。
圧縮スコア値ベクトルQ’は、n個の測定値yと対応してn個あるので、判別結果判断部382は、n個の圧縮スコア値ベクトルQ’に対応して、n個のマハラノビス距離の二乗Dを計算する。
判別結果判断部382は、CPU911などの処理装置を用いて、n個の圧縮スコア値ベクトルQ’それぞれについて、計算したマハラノビス距離の二乗Dの平方根を、所定の閾値(判別式のパラメータの一部)と比較して、測定値yが所定の条件を満たすか否かを判別する。
すなわち、基準ベクトル群Gに対する圧縮スコア値ベクトルQ’のマハラノビス距離の二乗Dが所定の閾値より小さければ、その圧縮スコア値ベクトルQ’は、基準ベクトル具Gに属すると考えられるので、対応する測定値yは、所定の条件を満たしているはずである。
逆に、基準ベクトル群Gに対する圧縮スコア値ベクトルQ’のマハラノビス距離の二乗Dが所定の閾値より大きければ、その圧縮スコア値ベクトルQ’は、基準ベクトル具Gに属さないと考えられるので、対応する測定値yは、所定の条件を満たしていないはずである。
このように、判別結果判断部382は、測定値記憶部123が記憶した測定値yを参照することなく、判別式と、圧縮スコア値ベクトルQ’の成分であるスコア値uとに基づいて、測定値yが所定の条件を満たすか否かを判別する。
判別結果判断部382は、CPU911などの処理装置を用いて、判別したn個の判別結果を、磁気ディスク装置920などの記憶装置に記憶する。
判別結果比較部383は、CPU911などの処理装置を用いて、条件判断部381が判断した判断結果と、判別結果判断部382が判別した判別結果とを比較して、判別結果が正しいか否かを判断する。
まず、判別結果比較部383は、CPU911などの処理装置を用いて、条件判断部381が判断したn個の判断結果を、磁気ディスク装置920などの記憶装置から取得する。
次に、判別結果比較部383は、CPU911などの処理装置を用いて、判別結果判断部382が判別したn個の判別結果を、磁気ディスク装置920などの記憶装置から取得する。
次に、判別結果比較部383は、CPU911などの処理装置を用いて、測定値記憶部123が記憶したn個の測定値yそれぞれについて、対応する判断結果と、対応する判別結果とを比較して、判別結果が正しいか否かを判断する。
次に、判別結果比較部383は、CPU911などの処理装置を用いて、判別結果が正しいか否かについてのn個の判断結果を、磁気ディスク装置920などの記憶装置に記憶する。
正解率算出部384は、CPU911などの処理装置を用いて、判別結果の正解率を算出する。
ここで、判別結果の正解率とは、判別結果判断部382が判別した判別結果の数(n個)に対して、それが正しい場合の数の比率である。
まず、正解率算出部384は、CPU911などの処理装置を用いて、判別結果比較部383が判断したn個の判断結果を、磁気ディスク装置920などの記憶装置から取得する。
次に、正解率算出部384は、CPU911などの処理装置を用いて、取得したn個の判断結果のうち、判別結果が正しいと判断した判断結果の数を数えて、正解数pとする。
次に、正解率算出部384は、CPU911などの処理装置を用いて、正解数pを判断結果の数nで割り、正解率n/pを計算し、判別度とする。
次に、正解率算出部384は、CPU911などの処理装置を用いて、算出した判別度を、磁気ディスク装置920などの記憶装置に記憶する。
図12は、この実施の形態における判別式算出部137及び判別度算出部138の動作を模式的に表わした図である。
この例では、内部抵抗値が0〜2kΩの範囲内にあるか否かを所定の条件として、測定値yがその条件を満たすか否かを判断すべきものとする。
判別式算出部137は、スコア値圧縮部136が算出したスコア値uを成分とする圧縮スコア値ベクトルQ’のうち、対応する測定値yが所定の条件を満たすものを、基準ベクトル群Gとし、基準ベクトル群Gに対する圧縮スコア値ベクトルQ’のマハラノビス距離の二乗Dを計算するためのパラメータと、判別の閾値とを算出して、判別式のパラメータとする。
図中、点線で示した楕円体は、マハラノビス距離の二乗Dが所定の閾値と等しくなる点の集合であり、圧縮スコア値ベクトルQ’に対応する点が楕円体の内部であれば、対応する測定値yが所定の条件を満たすと、判別される。
判別度算出部138は、判別式算出部137が算出した判別式のパラメータに基づいて、スコア値圧縮部136が算出したスコア値uを成分とするn個の圧縮スコア値ベクトルQ’それぞれについて、判別式に基づく判別結果を算出する。
この例では、点線で示した楕円体の内部に含まれる13個の点に対応する圧縮スコア値ベクトルQ’について、対応する測定値yが所定の条件を満たすものと判別する。
このうち、実際に、対応する測定値yが所定の条件を満たしているものは、9個である。
また、点線で示した楕円体の外部にある20個の点に対応する圧縮スコア値ベクトルQ’については、対応する測定値yが所定の条件を満たさないものと判別する。
このうち、実際に、対応する測定値yが所定の条件を満たしていないものは、17個である。
したがって、この例では、全部で33個の測定値yのうち、26個について正しく判別できたので、判別度算出部138が算出する判別度は、26/33=0.787…である。
なお、正解率は、判別式算出部137が算出した判別式の判別精度を示す判別度の一例であり、他の指標を用いてもよい。
例えば、ある部品が寿命かどうかを判別したい場合、寿命がきているものを誤って寿命がきていないと判別してしまうと致命的となりうる。一方、寿命がきていないものを誤って寿命がきていると判別してしまうコストは、逆の場合と比べて低い。
したがって、その場合、間違えた方向によって異なる重み付けを持つ判別度を、判別度算出部138が算出することが好ましい。
また、基準ベクトル群Gに対するマハラノビス距離の二乗は、判別式の一例であり、他の指標を用いてもよい。
例えば、基準ベクトル群G以外のベクトル群からのマハラノビス距離も算出して、基準ベクトル群Gからのマハラノビス距離と比較して、近いほうの群に属するものと判別する判別方式に基づく判別式であってもよい。
図13は、この実施の形態における特徴度算出部134が算出する特徴度Cと、判別度算出部138が算出する判別度との関係を模式的に表わした図である。
圧縮スコア値ベクトルQ’により、測定値yが明確に分かれる場合には、判別度が大きく、測定値yが明確に分かれない場合には、判別度が小さくなる。
また、判別度が小さい場合には、一般的に、圧縮スコア値ベクトルQ’のバラツキが大きいので、特徴度Cが大きくなり、逆に、判別度が大きい場合には、特徴度Cが小さくなる傾向がある。特徴度Cと判別度との間には、点線の楕円で示すような負の相関がある。
この実施の形態では、特徴度Cが所定の閾値より小さい場合だけ判別度を算出し、特徴度Cが所定の閾値より大きい場合には、判別度を算出せずに次の選択因子を試すことにしているので、計算時間を短縮することができる。
図3に戻り、影響因子推定装置100の機能ブロックの説明を続ける。
強影響因子選択部135は、CPU911などの処理装置を用いて、判別度算出部138が算出した判別度に基づいて、判別式算出部137が算出した判別式の判別精度が高いか否かを判断し、判別精度が高い場合に、選択因子情報Sを、強影響因子情報として記憶する。
強影響因子選択部135は、CPU911などの処理装置を用いて、判別度算出部138が算出した判別度を、磁気ディスク装置920などの記憶装置から取得する。
強影響因子選択部135は、CPU911などの処理装置を用いて、取得した判別度に基づいて、判別式算出部137が算出した判別式の判別精度が高いか否かを判断する。
この例では、判別度が大きいほど、判別式算出部137が算出した判別式の判別精度が高いことを示しているので、強影響因子選択部135は、特徴度算出部134が算出した判別度が最も大きい場合に、判別式算出部137が算出した判別式の判別精度が最も高いと判断する。
強影響因子選択部135は、CPU911などの処理装置を用いて、判別式算出部137が算出した判別式の判別精度が高いと判断した場合に、影響因子選択部132が選択した選択因子F’を示す選択因子情報Sを、磁気ディスク装置920などの記憶装置から取得する。
強影響因子選択部135は、CPU911などの処理装置を用いて、取得した選択因子情報Sを、強影響因子情報として、磁気ディスク装置920などの記憶装置に記憶する。
例えば、強影響因子選択部135は、判別度算出部138が算出した判別度のうち、最も値が大きいものを最善判別度として、磁気ディスク装置920などの記憶装置に記憶しておく。また、最善判別度に対応する選択因子情報Sを最善選択因子情報Sbestとして、磁気ディスク装置920などの記憶装置に記憶しておく。
影響因子選択部132が新たな選択因子F’を選択し、判別度算出部138が新たな判別度を算出すると、強影響因子選択部135は、CPU911などの処理装置を用いて、判別度算出部138が新たに算出した判別度と、記憶している最善判別度とを比較して、どちらが大きいかを判断する。
最善判別度のほうが大きい場合には、強影響因子選択部135は、何もしない。
新たな判別度のほうが大きい場合には、強影響因子選択部135は、CPU911などの処理装置を用いて、新しい判別度を、最善判別度として、磁気ディスク装置920などの記憶装置に記憶する。また、それに対応する選択因子情報Sを、強影響因子情報Sbestとして、磁気ディスク装置920などの記憶装置に記憶する。
これにより、強影響因子選択部135は、常に、それまでに計算したなかで最大の判別度に対応する選択因子F’を示す選択因子情報Sを記憶する。
強影響因子出力部145は、強影響因子選択部135が選択した強影響因子情報によって示される影響因子についての情報を出力する。
強影響因子出力部145は、CPU911などの処理装置を用いて、強影響因子選択部135が選択した強影響因子情報Sbestを、磁気ディスク装置920などの記憶装置から取得する。
強影響因子出力部145は、CPU911などの処理装置を用いて、取得した強影響因子情報Sbestから、選択された影響因子がどれかを判別する。
強影響因子出力部145は、CPU911などの処理装置を用いて、影響因子情報記憶部121が記憶した影響因子情報のうち、選択されたと判別した影響因子についての情報(例えば、影響因子の名前)を、磁気ディスク装置920などの記憶装置から取得する。
強影響因子出力部145は、CPU911などの処理装置を用いて、取得した影響因子についての情報を、CRTなどの表示装置901やその他の出力装置に出力する。
これにより、測定対象の状態(測定値y)に強い影響を与えると、影響因子推定装置100が推定した影響因子についての情報が、CRTなどの表示装置901やその他の出力装置に出力される。
図14は、この実施の形態における影響因子推定装置100が、測定対象の状態(測定値y)に強い影響を与える影響因子を推定する影響因子推定処理の流れの一例を示すフローチャート図である。
S11において、重み付け算出部131は、CPU911などの処理装置を用いて、m個の影響因子Fそれぞれについて、影響因子重み付けWを算出する。
重み付け算出部131は、算出したm個の影響因子重み付けWを、磁気ディスク装置920などの記憶装置を用いて、記憶する。
S12において、影響因子選択部132は、CPU911などの処理装置を用いて、m個の影響因子Fのなかから、m’個の影響因子(1≦m’≦m)を選択し、選択した影響因子(選択因子F’)を示す選択因子情報Sを生成する。
なお、影響因子選択部132は、CPU911などの処理装置を用いて、S11で重み付け算出部131が算出したm個の影響因子重み付けWを、磁気ディスク装置920などの記憶装置から取得し、取得した影響因子重み付けWに基づいて、選択因子F’を選択する。
影響因子選択部132は、CPU911などの処理装置を用いて、生成した選択因子情報Sを、磁気ディスク装置920などの記憶装置に記憶する。
S13において、特異値分解部133は、CPU911などの処理装置を用いて、影響因子測定値記憶部122が記憶した影響因子測定値xを、磁気ディスク装置920などの記憶装置から取得する。
なお、特異値分解部133は、CPU911などの処理装置を用いて、S12で影響因子選択部132が生成した選択因子情報Sを、磁気ディスク装置920などの記憶装置から取得し、所得した選択因子情報Sによって示される選択因子F’についての選択因子測定値x(m’×n個)だけを取得する。
特異値分解部133は、CPU911などの処理装置を用いて、パターン行列Pを特異値分解する。ここで、パターン行列Pは、取得した影響因子測定値xを成分とするm’次元の選択因子測定値ベクトルX’を行ベクトルとするm’列n行の行列である。
特異値分解部133は、CPU911などの処理装置を用いて、パターン行列Pの特異値σ(k個)を算出する。
特異値分解部133は、CPU911などの処理装置を用いて、パターン行列Pを特異値分解して得られるk列n行のスコア値行列U(の成分u)を算出する。
特異値分解部133は、CPU911などの処理装置を用いて、k個の特異値σと、スコア値行列U(の成分であるk×n個のスコア値u)を、磁気ディスク装置920などの記憶装置に記憶する。
S14において、スコア値圧縮部136は、CPU911などの処理装置を用いて、特異値分解部133が算出したk個の特異値σを、磁気ディスク装置920などの記憶装置から取得する。
スコア値圧縮部136は、CPU911などの処理装置を用いて、取得した特異値σに基づいて、圧縮次元k’を算出する。
スコア値圧縮部136は、CPU911などの処理装置を用いて、特異値分解部133が算出したスコア値uを、磁気ディスク装置920などの記憶装置から取得する。
このとき、スコア値圧縮部136は、スコア値行列Uの行ベクトルであるスコア値ベクトルQの1番目〜k’番目の成分であるスコア値u(k’×n個)だけを取得する。
スコア値圧縮部136は、CPU911などの処理装置を用いて、取得したスコア値uを成分とする圧縮スコア値ベクトルQ’を生成し、n個の圧縮スコア値ベクトルQ’(の成分であるk’×n個のスコア値u)を、磁気ディスク装置920などの記憶装置に記憶する。
S15において、特徴度算出部134は、CPU911などの処理装置を用いて、測定値記憶部123が記憶したn個の測定値yを、磁気ディスク装置920などの記憶装置から取得する。
特徴度算出部134は、CPU911などの処理装置を用いて、n個の測定値yそれぞれについて、測定値yが所定の条件を満たすか否かを判断する。
特徴度算出部134は、CPU911などの処理装置を用いて、S14でスコア値圧縮部136が算出したn個の圧縮スコア値ベクトルQ’のうち、対応する測定値yが所定の条件を満たす圧縮スコア値ベクトルQ’の成分であるスコア値uを、磁気ディスク装置920などの記憶装置から取得する。
特徴度算出部134は、CPU911などの処理装置を用いて、対応する測定値yが所定の条件を満たす圧縮スコア値ベクトルQ’のバラツキの度合いを示す値を算出し、特徴度Cとして、磁気ディスク装置920などの記憶装置に記憶する。
S16において、判別式算出部137は、CPU911などの処理装置を用いて、S15で特徴度算出部134が算出した特徴度Cに基づいて、対応する測定値yが所定の条件を満たす圧縮スコア値ベクトルQ’のバラツキが小さいか否かを判断する。
バラツキが小さい場合には、S17へ進む。
バラツキが大きい場合には、S22へ進む。
S17において、判別式算出部137は、CPU911などの処理装置を用いて、測定値yが所定の条件を満たすか否かを、対応する圧縮スコア値ベクトルQ’の成分であるスコア値uから判別する判別式を算出し、算出した判別式のパラメータを、磁気ディスク装置920などの記憶装置に記憶する。
S18において、判別度算出部138は、CPU911などの処理装置を用いて、S17で判別式算出部137が算出した判別式のパラメータを、磁気ディスク装置920などの記憶装置から取得する。
判別度算出部138は、CPU911などの処理装置を用いて、S14でスコア値圧縮部136が算出した圧縮スコア値ベクトルQ’の成分であるスコア値uを、磁気ディスク装置920などの記憶装置から取得する。
判別度算出部138は、CPU911などの処理装置を用いて、取得したスコア値uを、取得したパラメータによって示される判別式に代入し、判別式の値を計算する。
判別度算出部138は、CPU911などの処理装置を用いて、計算した判別式の値から、対応する測定値yが所定の条件を満たすか否かを判別する。
判別度算出部138は、CPU911などの処理装置を用いて、測定値記憶部123が記憶した測定値yを、磁気ディスク装置920などの記憶装置から取得する。
判別度算出部138は、CPU911などの処理装置を用いて、取得した測定値yが所定の条件を満たすか否かを判断する。
判別度算出部138は、CPU911などの処理装置を用いて、判別した判別結果が正しいか否かを判断する。
判別度算出部138は、CPU911などの処理装置を用いて、判別した判別結果のうち、正しい判別結果を得た数の割合(正解率)を計算し、判別度として、磁気ディスク装置920などの記憶装置に記憶する。
S19において、強影響因子選択部135は、CPU911などの処理装置を用いて、S18で判別度算出部138が算出した判別度を、磁気ディスク装置920などの記憶装置から取得する。
強影響因子選択部135は、CPU911などの処理装置を用いて、あらかじめ記憶した最善判別度を、磁気ディスク装置920などの記憶装置から取得する。
なお、最善判別度には、初期値として「0」を記憶しておくこととする。
強影響因子選択部135は、CPU911などの処理装置を用いて、取得した判別度と、最善判別度とを比較し、どちらが大きいか判断する。
判別度のほうが最善判別度よりも大きいと判断した場合には、S20へ進む。
判別度が最善判別度以下であると判断した場合には、S21へ進む。
S20において、強影響因子選択部135は、CPU911などの処理装置を用いて、S19で取得した判別度を、最善判別度として、磁気ディスク装置920などの記憶装置に記憶する。
強影響因子選択部135は、CPU911などの処理装置を用いて、S12(またはS22)で影響因子選択部132が生成した選択因子情報Sを、磁気ディスク装置920などの記憶装置から取得する。
強影響因子選択部135は、CPU911などの処理装置を用いて、取得した選択因子情報Sを、強影響因子情報Sbestとして、磁気ディスク装置920などの記憶装置に記憶する。
S21において、影響因子選択部132は、CPU911などの処理装置を用いて、選択終了条件を満たしたか否かを判断する。
例えば、あらかじめキーボード902などの入力装置から入力した計算時間が経過した場合に、選択終了条件を満たしたと判断する。
あるいは、キーボード902などの入力装置から計算を終了せよという指令を入力した場合に、選択終了条件を満たしたと判断する。
あるいは、これ以上計算を続けても、最善判別度が改善する見込みがないと判断した場合に、選択終了条件を満たしたと判断する。例えば、最善判別度が、判別度の理論上の最大値(正解率なら、1)とほぼ等しい場合や、所定の回数以上選択を繰り返して、最善判別度が改善しなかった場合などがある。
選択終了条件を満たしていないと判断した場合、S22へ進む。
選択終了条件を満たしていると判断した場合、S23へ進む。
S22において、影響因子選択部132は、CPU911などの処理装置を用いて、選択因子情報Sを修正する。
なお、影響因子選択部132は、CPU911などの処理装置を用いて、S11で重み付け算出部131が算出したm個の影響因子重み付けWを、磁気ディスク装置920などの記憶装置から取得する。また、影響因子選択部132は、CPU911などの処理装置を用いて、S15で特徴度算出部134が算出した特徴度Cを、磁気ディスク装置920などの記憶装置から取得する。
影響因子選択部132は、取得したm個の影響因子重み付けWと、特徴度Cとに基づいて、選択因子情報Sを修正する。
例えば、判別度が前々回と比較して改善した場合には、前回の修正と同じ方向性の修正を、選択因子情報Sに加える。逆に、判別度が前々回と比較して悪くなった場合には、前回の修正と逆の方向の修正を、選択因子情報Sに加える。あるいは、何回か修正して、判別度があまり改善しない場合には、まったく新しい選択因子情報Sを生成する。
影響因子選択部132は、CPU911などの処理装置を用いて、修正した選択因子情報Sを、磁気ディスク装置920などの記憶装置に記憶する。
その後、S13に戻り、新たに選択した選択因子F’に基づいて、特異値分解、特徴度算出などの処理を繰り返す。
S23において、強影響因子出力部145は、CPU911などの処理装置を用いて、S20で強影響因子選択部135が記憶した強影響因子情報Sbestを、磁気ディスク装置920などの記憶装置から取得する。
強影響因子出力部145は、CPU911などの処理装置を用いて、影響因子情報記憶部121が記憶した影響因子情報のうち、取得した強影響因子情報Sbestによって示される影響因子についての情報を、磁気ディスク装置920などの記憶装置から取得する。
強影響因子出力部145は、CPU911などの処理装置を用いて、取得した影響因子についての情報(例えば、影響因子の名前)を、CRTなどの表示装置901やその他の出力装置に出力する。
なお、強影響因子出力部145は、選択終了条件を満たしていると判断する前に、強影響因子についての情報を、CRTなどの表示装置901やその他の出力装置に出力してもよい。これにより、例えば、出力された情報を見た利用者が、処理を続行するか中断するかを判断できる。
また、この例では、判別度が最もよい影響因子の組み合わせを求めることとしているが、判別度がよいいくつかの影響因子の組み合わせを求める構成としてもよい。例えば、判別度がよいものから順に、影響因子の組み合わせを所定の数求めてもよいし、数を制限せずに、最もよい判別度と比較して判別度が所定の範囲内である影響因子の組み合わせを求めてもよい。
この実施の形態における影響因子推定装置100によれば、特異値分解部133が特異値分解して得た圧縮スコア値ベクトルQ’に基づいて、測定値yが所定の条件を満たすか否かを判別する判別式を算出し、判別式の判別精度を示す判別値に基づいて、測定対象の状態に強い影響を与える影響因子を推定するので、影響因子測定値を特異値分解したスコア値に基づいて測定対象の状態を予測する際に、測定対象の状態に強い影響を与える影響因子を推定することができるという効果を奏する。
この実施の形態における影響因子推定装置100によれば、特徴度算出部134が、所定の条件を満たす測定値yに対応する圧縮スコア値ベクトルQ’のバラツキの度合いを示す特徴度Cを算出し、所定の条件を満たす測定値yに対応する圧縮スコア値ベクトルQ’のバラツキが小さい場合に、判別式算出部137が判別式を算出し、所定の条件を満たす測定値yに対応する圧縮スコア値ベクトルQ’のバラツキが大きく、判別式の判別精度が悪いと予測できる場合には、判別式・判別度の算出をしないので、計算時間を短縮することができるという効果を奏する。
この実施の形態における影響因子推定装置100によれば、特徴度算出部134が、対応する測定値yが所定の条件を満たす圧縮スコア値ベクトルQ’の近似式を算出し、算出した近似式の近似誤差の合計を計算して特徴度Cとするので、特徴度Cが圧縮スコア値ベクトルQ’のバラツキの度合いを示すという効果を奏する。
この実施の形態における影響因子推定装置100によれば、特徴度算出部134が、対応する測定値yが所定の条件を満たす圧縮スコア値ベクトルQ’の回帰式を近似式として算出し、算出した回帰式の回帰誤差の二乗の合計を計算して特徴度Cとするので、対応する測定値yが所定の条件を満たす圧縮スコア値ベクトルQ’が超平面(または超曲面)上に分布している場合に、バラツキが小さいと判断できるという効果を奏する。
この実施の形態における影響因子推定装置100によれば、判別式算出部137が、特徴度Cを所定の値と比較し、所定の値より特徴度Cが小さい場合に、対応する測定値yが所定の条件を満たす圧縮スコア値ベクトルQ’のバラツキが小さいと判断するので、判断が容易であり、計算速度を高速化できるという効果を奏する。
この実施の形態における影響因子推定装置100によれば、判別式算出部137が、対応する測定値yが所定の条件を満たす圧縮スコア値ベクトルQ’を基準ベクトル群Gとし、基準ベクトル群Gに対する圧縮スコア値ベクトルQ’のマハラノビス距離を計算する計算式を、判別式として用いるので、圧縮スコア値ベクトルQ’の各成分の間に相関がある場合であっても、各成分間の相関に影響されずに判別ができるという効果を奏する。
この実施の形態における影響因子推定装置100によれば、判別度算出部138が、判別式算出部137が算出した判別式に、スコア値圧縮部136が算出したスコア値uを代入して、判別式の値を計算し、計算した判別式の値を所定の値と比較して、対応する測定値yが所定の条件を満たすか否かを判断するので、判別式が正しく判別できるか否かを判断することができるという効果を奏する。
この実施の形態における影響因子推定装置100によれば、判別度算出部138が、判別式の判別結果の正解率を計算して、判別度とするので、判別式の判別精度が高いほど判別度が高くなるという効果を奏する。
この実施の形態における影響因子推定装置100によれば、重み付け算出部131が、測定値yと、測定値yに対応する影響因子測定値xとの間の相関の強さを示す値を算出して、影響因子重み付けWとし、影響因子選択部132が、影響因子重み付けWが大きい影響因子ほど、選択する確率が高くなるようにして、影響因子Fのなかから選択因子F’を選択するので、最適な選択因子F’を速く見つけることができるという効果を奏する。
この実施の形態における影響因子推定装置100によれば、影響因子選択部132が、大規模組み合わせ計算法により、影響因子Fのなかから選択因子F’を選択するので、影響因子Fの数mが多い場合であっても、判別度が大きくなる選択因子F’の組み合わせを速く見つけることができるという効果を奏する。
この実施の形態における影響因子推定装置100によれば、影響因子選択部132が、大規模組み合わせ計算法として、焼きなまし法及び遺伝的アルゴリズム法及びタブーサーチ法を用いるので、影響因子Fの数mが大きい場合であっても、判別度が大きくなる選択因子F’の組み合わせを速く見つけることができるという効果を奏する。
この実施の形態における影響因子推定装置100によれば、重み付け算出部131が、測定値yと、測定値yに対応する影響因子測定値xとの間のピアソンの積率相関係数の二乗を計算し、影響因子重み付けWとするので、測定値yと影響因子測定値xとの間に直線相関がある場合に、影響因子Fを選択する確率を高くすることができ、最適な選択因子F’を速く見つけることができるという効果を奏する。
この実施の形態における影響因子推定装置100は、コンピュータを上記説明した影響因子推定装置100として機能させる影響因子推定プログラムを、コンピュータに実行させることにより実現することができる。
この実施の形態における影響因子推定プログラムによれば、特異値分解部133が特異値分解して得た圧縮スコア値ベクトルQ’に基づいて、測定値yとの相関が強いか否かを判断し、測定対象の状態に強い影響を与える影響因子を推定するので、影響因子測定値を特異値分解したスコア値に基づいて測定対象の状態を予測する際に、測定対象の状態に強い影響を与える影響因子を推定することができるという効果を奏する。
ここで説明した影響因子推定装置100(相関要因導出装置ともいう)は、データの集合体が特徴をもったものかどうかを判断するものである。
ここで説明した影響因子推定装置100は、例えば、劣化要因分析、つまり劣化寿命に影響を及ぼす外的要因を見つけることができる。
従来、この手の問題は、一般に重回帰分析で仮説検定を行いその仮説を採用するか、棄却するかを決めていたが、ここで説明した影響因子推定装置100によれば、仮説を設定する必要がなく、仮説を自動的に導出することができる。
また、ここで説明した影響因子推定装置100は、特徴空間の広がりを特定するものである。
すなわち、影響因子推定装置100は、主成分分析における寄与率から主成分次元を導出し、導出した主成分次元におけるデータのバラツキから、その相関度合いを特定する。
また、影響因子推定装置100は、マハラノビス距離を求め、求めたマハラノビス距離におけるデータのバラツキから、その相関度合いを特定する。
また、ここで説明した影響因子推定装置100は、要因パラメータの組合せを自動的に算出し、その組み合わせにおける相関度合いを自動的に導出して、要因の相関度合いが高いものを順序付けて出力することができる。
実施の形態2.
実施の形態2を、図15〜図18を用いて説明する。
この実施の形態における影響因子推定装置100の外観・ハードウェア構成・ブロック構成は、実施の形態1において図1〜図3を用いて説明したものと同様なので、ここでは説明を省略する。
この実施の形態では、影響因子選択部132が影響因子Fのなかから選択因子F’を選択する別の方式について説明する。
図15は、この実施の形態における影響因子選択部132の内部ブロック構成の一例を示すブロック構成図である。
影響因子選択部132は、影響因子分類部321、選択因子数生成部322、強相関因子選択部323、弱相関因子選択部324、選択因子情報生成部325、局所解判断部326を有する。
影響因子分類部321は、CPU911などの処理装置を用いて、重み付け算出部131が算出した影響因子重み付けWに基づいて、影響因子Fを、強相関因子群と弱相関因子群との2つのグループに分類する。
強相関因子群及び弱相関因子群は、影響因子グループの一例である。
なお、この例では2つのグループに分類するが、3つ以上のグループに分類してもよい。
例えば、影響因子分類部321は、CPU911などの処理装置を用いて、影響因子重み付けWを所定の値と比較し、影響因子重み付けWが所定の値以上であれば、対応する影響因子Fを強相関因子群に分類し、影響因子重み付けWが所定の値未満であれば、対応する影響因子Fを弱相関因子群に分類する。
影響因子分類部321は、CPU911などの処理装置を用いて、影響因子Fの分類についての情報を、磁気ディスク装置920などの記憶装置に記憶する。
選択因子数生成部322は、CPU911などの処理装置を用いて、影響因子選択部132が選択する選択因子F’の数を生成し、選択因子数とする。
選択因子数生成部322が生成する選択因子数には、影響因子選択部132が選択する選択因子F’のうち、強相関因子群から選択する選択因子F’の数である強相関選択因子数と、弱相関因子群から選択する選択因子F’の数である弱相関選択因子数とがある。
強創刊選択因子数及び弱相関選択因子数は、グループ選択因子数の一例である。
選択因子数生成部322は、CPU911などの処理装置を用いて、1以上、影響因子分類部321が強相関因子群に分類した影響因子Fの数以下の整数を、ランダムに生成し、強相関選択因子数とする。
同様に、選択因子数生成部322は、CPU911などの処理装置を用いて、0以上、影響因子分類部321が弱相関因子群に分類した影響因子Fの数以下の整数を、ランダムに生成し、弱相関選択因子数とする。
選択因子数生成部322は、CPU911などの処理装置を用いて、生成した選択因子数を、磁気ディスク装置920などの記憶装置に記憶する。
強相関因子選択部323は、CPU911などの処理装置を用いて、影響因子分類部321が強相関因子群に分類した影響因子Fのなかから、選択因子数生成部322が生成した強相関選択因子数の影響因子Fを選択して、選択因子F’とする。
まず、強相関因子選択部323は、CPU911などの処理装置を用いて、影響因子分類部321が分類した影響因子Fの分類についての情報を、磁気ディスク装置920などの記憶装置から取得する。
次に、強相関因子選択部323は、CPU911などの処理装置を用いて、選択因子数生成部322が生成した強相関選択因子数を、磁気ディスク装置920などの記憶装置から取得する。
次に、強相関因子選択部323は、CPU911などの処理装置を用いて、取得した影響因子Fの分類についての情報を分析し、どの影響因子Fが強相関影響因子群に分類されたかを取得する。
次に、強相関因子選択部323は、CPU911などの処理装置を用いて、強相関影響因子群に分類された影響因子Fのなかから、影響因子を1つ選択し、選択因子F’とする。強相関因子選択部323は、CPU911などの処理装置を用いて、これを取得した強相関選択因子数の回数繰り返す。
強相関因子選択部323は、CPU911などの処理装置を用いて、選択した選択因子F’についての情報を、磁気ディスク装置920などの記憶装置に記憶する。
弱相関因子選択部324は、CPU911などの処理装置を用いて、影響因子分類部321が弱相関因子群に分類した影響因子Fのなかから、選択因子数生成部322が生成した弱相関選択因子数の影響因子Fを選択して、選択因子F’とする。
まず、弱相関因子選択部324は、CPU911などの処理装置を用いて、影響因子分類部321が分類した影響因子Fの分類についての情報を、磁気ディスク装置920などの記憶装置から取得する。
次に、弱相関因子選択部324は、CPU911などの処理装置を用いて、選択因子数生成部322が生成した弱相関選択因子数を、磁気ディスク装置920などの記憶装置から取得する。
次に、弱相関因子選択部324は、CPU911などの処理装置を用いて、取得した影響因子Fの分類についての情報を分析し、どの影響因子Fが弱相関影響因子群に分類されたかを取得する。
次に、弱相関因子選択部324は、CPU911などの処理装置を用いて、弱相関影響因子群に分類された影響因子Fのなかから、影響因子を1つ選択し、選択因子F’とする。弱相関因子選択部324は、CPU911などの処理装置を用いて、これを取得した弱相関選択因子数の回数繰り返す。
弱相関因子選択部324は、CPU911などの処理装置を用いて、選択した選択因子F’についての情報を、磁気ディスク装置920などの記憶装置に記憶する。
選択因子情報生成部325は、CPU911などの処理装置を用いて、強相関因子選択部323が選択した選択因子F’と、弱相関因子選択部324が選択した選択因子F’とを示す選択因子情報Sを生成する。
まず、選択因子情報生成部325は、CPU911などの処理装置を用いて、強相関因子選択部323が選択した選択因子F’についての情報を、磁気ディスク装置920などの記憶装置から取得する。
次に、選択因子情報生成部325は、CPU911などの処理装置を用いて、弱相関因子選択部324が選択した選択因子F’についての情報を、磁気ディスク装置920などの記憶装置から取得する。
選択因子情報生成部325は、CPU911などの処理装置を用いて、取得した情報から、強相関因子選択部323が選択した選択因子F’及び弱相関因子選択部324が選択kした選択因子F’を示す選択因子情報Sを生成する。
選択因子情報生成部325は、CPU911などの処理装置を用いて、生成した選択因子情報Sを、磁気ディスク装置920などの記憶装置に記憶する。
局所解判断部326は、CPU911などの処理装置を用いて、判別度算出部138が算出した判別度から、局所解に到達したか否かを判断する。
ここで、局所解とは、選択因子F’を少しずつ変化させて判別度を求め、近傍において判別度が最大になる場合をいう。
影響因子推定装置100は、判別度が最大になる選択因子F’を探索しようとしているが、すべての場合について判別度を求めようとすると、計算時間がかかりすぎて答えを得ることができない。
そこで、いろいろな場合を試しながら、近傍において判別度が最大となる場合を、暫定的な答え(局所解)とする。
まず、局所解判断部326は、CPU911などの処理装置を用いて、判別度算出部138が算出した判別度を、磁気ディスク装置920などの記憶装置から取得する。
次に、局所解判断部326は、CPU911などの処理装置を用いて、取得した判別度が局所解に到達したか否かを判断する。例えば、局所解判断部326は、CPU911などの処理装置を用いて、取得した判別度を、判別度算出部138がそれまでに算出した判別度と比較し、判別度が改善したか否かを判断する。判別度が改善していないと判断した場合、局所解判断部326は、判別度が改善しなかった回数を数え、所定の回数以上判別度が改善しなかった場合に、局所解に到達したと判断する。あるいは、近傍の探索がすべて終了した場合に、局所解に到達したと判断する。
局所解判断部326は、CPU911などの処理装置を用いて、判断結果を、磁気ディスク装置920などの記憶装置に記憶する。
次に、影響因子選択部132の動作について説明する。
図16は、この実施の形態における影響因子選択部132による影響因子選択処理の流れの一例を示すフローチャート図である。
S31において、影響因子分類部321は、CPU911などの処理装置を用いて、重み付け算出部131が算出した影響因子重み付けWを、磁気ディスク装置920などの記憶装置から取得する。
影響因子分類部321は、CPU911などの処理装置を用いて、取得した影響因子重み付けWに基づいて、影響因子Fを、強相関因子群と弱相関因子群とに分類する。
影響因子分類部321は、CPU911などの処理装置を用いて、分類した分類結果を示す情報を、磁気ディスク装置920などの記憶装置に記憶する。
S32において、選択因子数生成部322は、CPU911などの処理装置を用いて、強相関因子数及び弱相関因子数をランダムに生成する。
選択因子数生成部322は、CPU911などの処理装置を用いて、生成した強相関因子数及び弱相関因子数を、磁気ディスク装置920などの記憶装置に記憶する。
S33において、強相関因子選択部323は、CPU911などの処理装置を用いて、S31で影響因子分類部321が分類した分類結果についての情報を、磁気ディスク装置920などの記憶装置から取得する。
強相関因子選択部323は、CPU911などの処理装置を用いて、取得した情報を分析し、どの影響因子Fが強相関因子群に分類されたかを取得する。
強相関因子選択部323は、CPU911などの処理装置を用いて、S32で選択因子数生成部322が生成した強相関因子数を、磁気ディスク装置920などの記憶装置から取得する。
強相関因子選択部323は、CPU911などの処理装置を用いて、強相関因子群に分類された影響因子Fのなかから、取得した強相関因子数の影響因子をランダムに選択する。
強相関因子選択部323は、CPU911などの処理装置を用いて、選択した影響因子を示す情報を、磁気ディスク装置920などの記憶装置に記憶する。
S34において、弱相関因子選択部324は、CPU911などの処理装置を用いて、S31で影響因子分類部321が分類した分類結果についての情報を、磁気ディスク装置920などの記憶装置から取得する。
弱相関因子選択部324は、CPU911などの処理装置を用いて、取得した情報を分析し、どの影響因子Fが弱相関因子群に分類されたかを取得する。
弱相関因子選択部324は、CPU911などの処理装置を用いて、S32で選択因子数生成部322が生成した弱相関因子数を、磁気ディスク装置920などの記憶装置から取得する。
弱相関因子選択部324は、CPU911などの処理装置を用いて、弱相関因子群に分類された影響因子Fのなかから、取得した弱相関因子数の影響因子をランダムに選択する。
弱相関因子選択部324は、CPU911などの処理装置を用いて、選択した影響因子を示す情報を、磁気ディスク装置920などの記憶装置に記憶する。
S35において、選択因子情報生成部325は、CPU911などの処理装置を用いて、S33で強相関因子選択部323が選択した影響因子を示す情報を、磁気ディスク装置920などの記憶装置から取得する。
選択因子情報生成部325は、CPU911などの処理装置を用いて、S34で弱相関因子選択部324が選択した影響因子を示す情報を、磁気ディスク装置920などの記憶装置から取得する。
選択因子情報生成部325は、CPU911などの処理装置を用いて、取得した情報から、強相関因子選択部323または弱相関因子選択部324が選択した選択因子F’を示す選択因子情報Sを生成する。
選択因子情報生成部325は、CPU911などの処理装置を用いて、生成した選択因子情報Sを、磁気ディスク装置920などの記憶装置に記憶する。
S36において、影響因子選択部132が選択した選択因子F’に基づいて、特異値分解部133による特異値分解処理、スコア値圧縮部136によるスコア値圧縮処理、特徴度算出部134による特徴度算出処理、判別式算出部137による判別式算出処理、判別度算出部138による判別度算出処理などを行う。
S37において、局所解判断部326が、CPU911などの処理装置を用いて、S36で判別度算出部138が算出した判別度を、磁気ディスク装置920などの記憶装置から取得する。
なお、特徴度算出部134が算出した特徴度Cが大きいため判別度算出部138が判別度を算出しなかった場合は、局所解判断部326は、最も判別精度が悪いことを示す判別度を取得したものとして、以下の処理を行う。
局所解判断部326は、CPU911などの処理装置を用いて、取得した判別度に基づいて、局所解に到達したか否かを判断する。
局所解に到達したと判断した場合には、S32に戻る。
局所解に到達していないと判断した場合には、S38へ進む。
S38において、弱相関因子選択部324が、CPU911などの処理装置を用いて、S34(またはS38)で前回選択した影響因子を示す情報を、磁気ディスク装置920などの記憶装置から取得する。
弱相関因子選択部324は、CPU911などの処理装置を用いて、取得した情報によって示される前回選択した影響因子のなかから、今回は選択しない影響因子を1つランダムに選び、今回選択する影響因子から除く。
弱相関因子選択部324は、CPU911などの処理装置を用いて、取得した情報によって示される前回選択した影響因子以外の影響因子であって、S31で弱相関因子群に分類された影響因子のなかから、今回選択する影響因子を1つランダムに選択し、今回選択する影響因子に加える。
他の影響因子の選択状況は変えず、弱相関因子選択部324は、CPU911などの処理装置を用いて、選択した影響因子を示す情報を、磁気ディスク装置920などの記憶装置に記憶する。
その後、S35に戻る。
この実施の形態における影響因子選択部132は、局所解に達していない場合、選択因子F’のうち、測定値yとの相関が弱い影響因子を1つ入れ替えることにより、近傍の探索を行う。また、局所解に達した場合は、選択因子の総数を変化させて、すべての影響因子のなかから、新しく選択因子F’を選択する。
次に、この実施の形態における特異値分解部133について説明する。
図17は、この実施の形態における特異値分解部133の内部ブロックの構成の一例を示す詳細ブロック構成図である。
特異値分解部133は、選択因子情報記憶部362、選択因子情報比較部363、変更影響因子測定値取得部364、特異値行列記憶部365、列変更特異値行列算出部366を有する。
選択因子情報記憶部362は、CPU911などの処理装置を用いて、影響因子選択部132が選択した選択因子F’を示す選択因子情報Sの履歴を、磁気ディスク装置920などの記憶装置に記憶する。
まず、選択因子情報記憶部362は、CPU911などの処理装置を用いて、影響因子選択部132が選択した選択因子F’を示す選択因子情報Sを、磁気ディスク装置920などの記憶装置から取得する。
次に、選択因子情報記憶部362は、CPU911などの処理装置を用いて、取得した選択因子情報Sを、磁気ディスク装置920などの記憶装置に記憶する。
選択因子情報比較部363は、CPU911などの処理装置を用いて、選択因子情報取得部361が取得した選択因子情報Sと、選択因子情報記憶部362が記憶した過去の選択因子情報Sとを比較して、どこが異なるかを検出する。例えば、選択されていた影響因子が選択されなくなったり、逆に、選択されていなかった影響因子が選択されたりした場合に、どこが変わったかを検出する。
まず、選択因子情報比較部363は、CPU911などの処理装置を用いて、影響因子選択部132が選択した選択因子F’を示す情報を、磁気ディスク装置920などの記憶装置から取得する。
次に、選択因子情報比較部363は、CPU911などの処理装置を用いて、選択因子情報記憶部362が記憶した過去の選択因子情報を、磁気ディスク装置920などの記憶装置から取得する。
選択因子情報比較部363は、CPU911などの処理装置を用いて、取得した選択因子情報Sと、取得した過去の選択因子情報とを比較して、異なる選択因子を検出する。
選択因子情報比較部363は、CPU911などの処理装置を用いて、検出した異なる選択因子についての情報を、磁気ディスク装置920などの記憶装置に記憶する。
なお、選択因子情報記憶部362が過去の選択因子情報を複数記憶している場合には、今回の選択因子情報Sとの差が最も小さいものを選んで、それとの差異を検出してもよい。
例えば、選択因子情報Sがmビッド(mは、影響因子Fの数)のデータであり、j番目(jは、1〜mの整数)が、影響因子Fの選択状態を示すものであれば、選択因子情報比較部363は、CPU911などの処理装置を用いて、2つの選択因子情報の排他的論理和をとることにより、選択状態が変更になった影響因子を求めることができる。あるいは、選択因子情報比較部363は、CPU911などの処理装置を用いて、一方の選択因子情報の1の補数と、他方の選択因子情報との論理積をとることにより、追加選択された影響因子あるいは選択が解除された影響因子を求めることができる。
変更影響因子測定値取得部364は、CPU911などの処理装置を用いて、選択因子情報比較部363が検出した異なる選択因子について、影響因子測定値記憶部122が記憶した影響因子測定値xを、磁気ディスク装置920などの記憶装置から取得する。
まず、変更影響因子測定値取得部364は、CPU911などの処理装置を用いて、選択因子情報比較部363が検出した異なる選択因子についての情報を、磁気ディスク装置920などの記憶装置から取得する。
次に、変更影響因子測定値取得部364は、CPU911などの処理装置を用いて、取得した情報から、異なる選択因子を取得する。
変更影響因子測定値取得部364は、CPU911などの処理装置を用いて、取得した異なる選択因子について、影響因子測定値記憶部122が記憶した影響因子測定値xを、磁気ディスク装置920などの記憶装置から取得する。
変更影響因子測定値取得部364は、CPU911などの処理装置を用いて、取得した影響因子測定値xを、磁気ディスク装置920などの記憶装置に記憶する。
特異値行列記憶部365は、CPU911などの処理装置を用いて、列変更特異値行列算出部366が算出した特異値行列を、磁気ディスク装置920などの記憶装置に記憶する。
なお、ここでいう特異値行列には、パターン行列Pを特異値分解して得た特異値σを対角成分とする特異値行列のみならず、スコア値行列U(左特異値行列)及び行列V(右特異値行列)の3つの行列すべてを含むものとする。
特異値行列記憶部365は、CPU911などの処理装置を用いて、列変更特異値行列算出部366が算出した特異値行列の成分(特異値σ、スコア値uなど)を、磁気ディスク装置920などの記憶装置に記憶する。
列変更特異値行列算出部366は、CPU911などの処理装置を用いて、パターン行列Pを特異値分解して、P=U・S・Vを満たす特異値行列(U、S、V)を算出する。
この実施の形態では、影響因子選択部132が、以前の選択因子と比較して、影響因子を1つだけ入れ替えた選択因子を選択する。したがって、列変更特異値行列算出部366が特異値分解するパターン行列Pは、以前に特異値分解したパターン行列と比較して、1列だけ異なり、他の列は等しいパターン行列である。
このように、一列だけ異なるパターン行列を特異値分解する場合、以前に特異値分解して得た特異値行列を用いることにより、非常に高速に特異値分解できることが知られている(例えば、非特許文献1)。
そこで、列変更特異値行列算出部366は、CPU911などの処理装置を用いて、以前に特異値分解して得た特異値行列と、パターン行列Pの成分が異なる列の成分である影響因子測定値xとに基づいて、パターン行列Pを高速に特異値分解する。
まず、列変更特異値行列算出部366は、CPU911などの処理装置を用いて、特異値行列記憶部365が記憶した特異値行列の成分を、磁気ディスク装置920などの記憶装置から取得する。
次に、列変更特異値行列算出部366は、CPU911などの処理装置を用いて、変更影響因子測定値取得部364が取得した影響因子測定値xを、磁気ディスク装置920などの記憶装置から取得する。
列変更特異値行列算出部366は、CPU911などの処理装置を用いて、取得したと特異値行列と、取得した影響因子測定値xとに基づいて、高速に特異値分解を行い、特異値行列を算出する。
列変更特異値行列算出部366は、CPU911などの処理装置を用いて、算出した特異値行列の成分(特異値σ、スコア値uなど)を、磁気ディスク装置920などの記憶装置を用いて記憶する。
なお、列変更特異値行列算出部366は、以前に近いパターン行列を特異値分解したことがない場合(例えば、一番最初に特異値分解をする場合や、局所解に達したため、選択因子を選びなおした場合など)には、通常の方式で特異値分解することとしてもよい。
このように、影響因子選択部132が以前に選択した選択因子と比較して、影響因子を1つ入れ替えた選択因子を選択するので、特異値分解部133は、以前に特異値分解したパターン行列と比較して、1列だけ異なるパターン行列を特異値分解すればよく、特異値行列を、高速に算出することができる。
なお、以前に特異値分解したパターン行列と比較して、1列だけ増えたパターン行列、1列だけ減ったパターン行列、1行だけ増えたパターン行列、1行だけ減ったパターン行列などであっても、同様に高速に特異値分解することができる。また、増減する行または列は、1行・1列に限らず、複数行・複数列であってもよい。
したがって、影響因子選択部132は、以前に選択した選択因子と比較して、1つだけ影響因子を追加した選択因子を選択してもよいし、1つだけ影響因子を減らした選択因子を選択してもよい。また、1つだけ増減させるのではなく、複数の影響因子を増減させてもよい。その場合であっても、列変更特異値行列算出部366は、高速に特異値分解することができる。
次に、特異値分解部133の動作について説明する。
図18は、この実施の形態における特異値分解部133による特異値分解処理の流れの一例を示すフローチャート図である。
S41において、選択因子情報比較部363は、CPU911などの処理装置を用いて、影響因子選択部132が選択した選択因子を示す選択因子情報を、磁気ディスク装置920などの記憶装置から取得する。
選択因子情報比較部363は、CPU911などの処理装置を用いて、選択因子情報記憶部362が記憶した過去の選択因子情報を、磁気ディスク装置920などの記憶装置から取得する。
選択因子情報比較部363は、CPU911などの処理装置を用いて、取得した選択因子情報を比較し、選択変更(追加選択または選択解除)された影響因子を求める。
選択因子情報比較部363は、CPU911などの処理装置を用いて、求めた影響因子を示す情報を、磁気ディスク装置920などの記憶装置に記憶する。
S42において、選択因子情報記憶部362は、CPU911などの処理装置を用いて、影響因子選択部132が選択した選択因子を示す選択因子情報を、磁気ディスク装置920などの記憶装置から取得する。
選択因子情報記憶部362は、CPU911などの処理装置を用いて、取得した選択因子情報を、磁気ディスク装置920などの記憶装置に記憶する。
S43において、変更影響因子測定値取得部364は、CPU911などの処理装置を用いて、S41で選択因子情報比較部363が求めた選択変更された影響因子を示す情報を取得する。
変更影響因子測定値取得部364は、CPU911などの処理装置を用いて、取得した情報に基づいて、選択変更された影響因子の数を算出する。
変更影響因子測定値取得部364は、CPU911などの処理装置を用いて、算出した選択変更された影響因子の数を、所定の数と比較して、選択変更された影響因子の数が多いか少ないかを判断する。
選択変更された影響因子の数が多い場合、新たに特異値分解したほうが速いので、S46へ進む。
選択変更された影響因子の数が少ない場合、過去の特異値分解結果を使って特異値分解したほうが速いので、S44へ進む。
S44において、変更影響因子測定値取得部364は、CPU911などの処理装置を用いて、S43で取得した情報に基づいて、選択変更された選択因子を求める。
変更影響因子測定値取得部364は、CPU911などの処理装置を用いて、求めた選択因子について、影響因子測定値記憶部122が記憶した影響因子測定値xを、磁気ディスク装置920などの記憶装置から取得する。
変更影響因子測定値取得部364は、CPU911などの処理装置を用いて、取得した影響因子測定値xを、磁気ディスク装置920などの記憶装置に記憶する。
S45において、列変更特異値行列算出部366は、CPU911などの処理装置を用いて、特異値行列記憶部365が記憶した過去の特異値分解の結果である特異値行列の成分を、磁気ディスク装置920などの記憶装置から取得する。
列変更特異値行列算出部366は、CPU911などの処理装置を用いて、S44で変更影響因子測定値取得部364が取得した影響因子測定値xを、磁気ディスク装置920などの記憶装置から取得する。
列変更特異値行列算出部366は、CPU911などの処理装置を用いて、取得した特異値行列の成分と影響因子測定値xとに基づいて、パターン行列Pを特異値分解する。
列変更特異値行列算出部366は、CPU911などの処理装置を用いて、特異値分解して得た特異値行列の成分を、磁気ディスク装置920などの記憶装置に記憶する。
その後、S48へ進む。
S46において、変更影響因子測定値取得部364は、CPU911などの処理装置を用いて、影響因子選択部132が選択した選択因子を示す選択因子情報を、磁気ディスク装置920などの記憶装置から取得する。
変更影響因子測定値取得部364は、CPU911などの処理装置を用いて、取得した選択因子情報によって示される選択因子を求める。
変更影響因子測定値取得部364は、CPU911などの処理装置を用いて、求めた選択因子について、影響因子測定値記憶部122が記憶した影響因子測定値xを、磁気ディスク装置920などの記憶装置から取得する。
変更影響因子測定値取得部364は、CPU911などの処理装置を用いて、取得した影響因子測定値xを、磁気ディスク装置920などの記憶装置に記憶する。
S47において、列変更特異値行列算出部366は、CPU911などの処理装置を用いて、S46で変更影響因子測定値取得部364が取得した影響因子測定値xを、磁気ディスク装置920などの記憶装置から取得する。
列変更特異値行列算出部366は、CPU911などの処理装置を用いて、取得した影響因子測定値xを成分とするパターン行列Pを、通常の方式で特異値分解する。
列変更特異値行列算出部366は、CPU911などの処理装置を用いて、特異値分解して得た特異値行列の成分を、磁気ディスク装置920などの記憶装置に記憶する。
S48において、特異値行列記憶部365は、CPU911などの処理装置を用いて、S45またはS47で列変更特異値行列算出部366が求めた特異値行列の成分を、磁気ディスク装置920などの記憶装置から取得する。
特異値行列記憶部365は、CPU911などの処理装置を用いて、取得した特異値行列の成分を、磁気ディスク装置920などの記憶装置に記憶する。
このように、特異値分解部133は、過去の特異値分解の結果を利用することにより、高速に特異値分解をする。
この実施の形態における影響因子推定装置100によれば、影響因子選択部132が生成した選択因子数の影響因子を、選択因子として選択するので、複数回の選択において選択因子の数が変化せず、そのため、特異値分解部133における特異値分解処理を高速に行うことができるという効果を奏する。
この実施の形態における影響因子推定装置100によれば、重み付け算出部131が算出した影響因子重み付けWに基づいて、影響因子選択部132が影響因子を強相関因子群と弱相関因子群とに分け、それぞれのグループのなかから選択する影響因子の数を生成し、生成した数の影響因子を、それぞれのグループのなかから選択するので、複数回の選択において、各グループ内での選択因子の数が変化せず、そのため、効率よく近傍の探索ができるという効果を奏する。
この実施の形態における影響因子推定装置100によれば、影響因子選択部132が、過去に判別度を算出した際に用いた選択因子と比較して、選択する選択因子の数が等しく、一部の選択因子が共通する選択因子を選択するので、特異値分解部133における特異値分解処理を高速に行うことができるという効果を奏する。
この実施の形態における影響因子推定装置100によれば、特異値分解部133が、過去に特異値分解したパターン行列と比較して、列の数が等しく、一部の列が共通するパターン行列を特異値分解する場合に、過去に特異値分解した結果である特異値行列を利用するので、特異値分解処理を高速に行うことができるという効果を奏する。
実施の形態1における影響因子推定装置100の外観の一例を示す図。 実施の形態1における影響因子推定装置100のハードウェア資源の一例を示す図。 実施の形態1における影響因子推定装置100の機能ブロックの構成の一例を示すブロック構成図。 実施の形態1における影響因子情報入力部111、影響因子測定値入力部112、測定値入力部113が入力し、影響因子情報記憶部121、影響因子測定値記憶部122、測定値記憶部123が記憶する影響因子情報、影響因子測定値、測定値を模式的に表わした図。 実施の形態1における重み付け算出部131の内部ブロックの構成の一例を示す詳細ブロック構成図。 実施の形態1における特異値分解部133及びスコア値圧縮部136の内部ブロックの構成の一例を示す詳細ブロック構成図。 実施の形態1における選択因子測定値取得部331の動作を模式的に表わした図。 実施の形態1における特異値算出部332及びスコア値算出部333の動作を模式的に表わした図。 実施の形態1における圧縮次元算出部334及び圧縮スコア値算出部335の動作を模式的に表わした図。 実施の形態1における特徴度算出部134の内部ブロックの構成の一例を示す詳細ブロック構成図。 実施の形態1における判別式算出部137及び判別度算出部138の内部ブロックの構成の一例を示す詳細ブロック図。 実施の形態1における判別式算出部137及び判別度算出部138の動作を模式的に表わした図。 実施の形態1における圧縮スコア値ベクトルQ’と測定値yの分布と、判別度算出部138が算出する判別度との関係を模式的に表わした図。 実施の形態1における影響因子推定装置100が、測定対象の状態(測定値y)に強い影響を与える影響因子を推定する影響因子推定処理の流れの一例を示すフローチャート図。 実施の形態2における影響因子選択部132の内部ブロック構成の一例を示すブロック構成図。 実施の形態2における影響因子選択部132による影響因子選択処理の流れの一例を示すフローチャート図。 実施の形態2における特異値分解部133の内部ブロックの構成の一例を示す詳細ブロック構成図。 実施の形態2における特異値分解部133による特異値分解処理の流れの一例を示すフローチャート図。
符号の説明
100 影響因子推定装置、111 影響因子情報入力部、112 影響因子測定値入力部、113 測定値入力部、121 影響因子情報記憶部、122 影響因子測定値記憶部、123 測定値記憶部、131 重み付け算出部、132 影響因子選択部、133 特異値分解部、134 特徴度算出部、135 強影響因子選択部、136 スコア値圧縮部、137 判別式算出部、138 判別度算出部、145 強影響因子出力部、311 測定値平均値算出部、312 測定値二乗平均値算出部、313 影響因子測定値平均値算出部、314 影響因子測定値二乗平均値算出部、315 測定値分散算出部、316 影響因子測定値分散算出部、317 測定値共分散算出部、318 測定値相関係数算出部、321 影響因子分類部、322 選択因子数生成部、323 強相関因子選択部、324 弱相関因子選択部、325 選択因子情報生成部、326 局所解判断部、331 選択因子測定値取得部、332 特異値算出部、333 スコア値算出部、334 圧縮次元算出部、335 圧縮スコア値算出部、340 基準ベクトル群選択部、341 基準スコア値平均値算出部、342 基準スコア値分散算出部、343 基準スコア値共分散算出部、344 分散共分散行列逆行列算出部、345 マハラノビス距離算出部、346 類似度平均値算出部、347 類似度分散算出部、348 類似度共分散算出部、349 類似度相関係数算出部、362 選択因子情報記憶部、363 選択因子情報比較部、364 変更影響因子測定値取得部、365 特異値行列記憶部、366 列変更特異値行列算出部、371 バラツキ判定部、372 判別式パラメータ算出部、381 条件判断部、382 判別結果判断部、383 判別結果比較部、384 正解率算出部、391 圧縮スコア値ベクトル取得部、392 回帰式算出部、393 回帰誤差算出部、394 回帰誤差合計算出部、901 表示装置、902 キーボード、903 マウス、904 FDD、905 CDD、906 プリンタ装置、907 スキャナ装置、910 システムユニット、911 CPU、912 バス、913 ROM、914 RAM、915 通信ボード、920 磁気ディスク装置、921 OS、922 ウィンドウシステム、923 プログラム群、924 ファイル群、931 電話器、932 ファクシミリ機、940 インターネット、941 ゲートウェイ、942 LAN。

Claims (15)

  1. 情報を記憶する記憶装置と、
    情報を処理する処理装置と、
    情報を出力する出力装置と、
    上記処理装置を用いて、測定対象の状態を測定した値を測定値yとし、複数の測定値yを上記記憶装置に記憶する測定値記憶部と、
    上記処理装置を用いて、上記測定対象の状態に影響を与える可能性のある複数の影響因子Fを示す情報を、影響因子情報として、上記記憶装置に記憶する影響因子情報記憶部と、
    上記処理装置を用いて、上記影響因子情報記憶部が記憶した影響因子情報によって示される上記複数の影響因子Fを測定した値を、複数の影響因子測定値xとし、上記測定値記憶部が記憶した複数の測定値yそれぞれに対応する上記複数の影響因子測定値xを、上記複数の測定値yそれぞれに対応する複数の影響因子測定値ベクトルXの成分として、上記記憶装置に記憶する影響因子測定値記憶部と、
    上記処理装置を用いて、上記影響因子情報記憶部が記憶した影響因子情報によって示される上記複数の影響因子Fのなかから、複数の影響因子を選択して、複数の選択因子F’とし、上記処理装置を用いて、選択した上記複数の選択因子F’を示す情報を、選択因子情報Sとして、上記記憶装置に記憶する影響因子選択部と、
    上記処理装置を用いて、上記影響因子選択部が選択した複数の選択因子F’を示す選択因子情報Sを上記記憶装置から取得し、上記処理装置を用いて、上記影響因子測定値記憶部が記憶した複数の影響因子測定値xのうち、取得した上記選択因子情報Sによって示される複数の選択因子F’についての複数の影響因子測定値xを上記記憶装置から取得し、上記処理装置を用いて、上記複数の測定値yに対応する複数の影響因子測定値xのうち、取得した複数の影響因子測定値xを成分とする複数のベクトルを、上記複数の測定値yに対応する複数の選択因子測定値ベクトルX’とし、上記複数の選択因子測定値ベクトルX’を行ベクトルとする行列を、パターン行列Pとし、上記パターン行列Pを特異値分解して、複数の特異値σと、P=U・S・V (ただし、Sはσを対角成分とする対角行列。)を満たすスコア値行列Uとを算出し、上記処理装置を用いて、算出した上記複数の特異値σを上記記憶装置に記憶し、上記処理装置を用いて、算出した上記スコア値行列Uの複数の行ベクトルを、上記複数の行ベクトルに対応する上記パターン行列Pの行ベクトルである上記複数の選択因子測定値ベクトルX’が対応する上記複数の測定値に対応する複数のスコア値ベクトルQとし、上記複数のスコア値ベクトルQの複数の成分を、上記複数の測定値yに対応する複数のスコア値uとして、上記記憶装置に記憶する特異値分解部と、
    上記処理装置を用いて、上記特異値分解部が算出した複数の特異値σを、上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数の特異値σに基づいて、上記特異値分解部が算出した複数のスコア値uのうちから、複数のスコア値uを選択し、選択した上記複数のスコア値uを上記記憶装置から取得し、上記処理装置を用いて、上記複数の測定値yに対応する複数のスコア値uのうち、取得した上記複数のスコア値uを、上記複数の測定値yに対応する複数の圧縮スコア値ベクトルQ’の成分として、上記記憶装置に記憶するスコア値圧縮部と、
    上記処理装置を用いて、上記測定値記憶部が記憶した複数の測定値yを上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数の測定値yが所定の条件を満たすか否かを判断し、上記処理装置を用いて、取得した上記複数の測定値yのうち、上記所定の条件を満たすと判断した測定値yに対応する上記複数の圧縮スコア値ベクトルQ’の成分として上記スコア値圧縮部が記憶した複数のスコア値uを上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数のスコア値uを成分とする上記複数の圧縮スコア値ベクトルQ’のバラツキの度合いを示す値を算出して、特徴度Cとし、上記処理装置を用いて、算出した特徴度Cを、上記記憶装置に記憶する特徴度算出部と、
    上記処理装置を用いて、上記特徴度算出部が算出した特徴度Cを上記記憶装置から取得し、上記処理装置を用いて、取得した上記特徴度Cに基づいて、上記特徴度算出部が取得した複数のスコア値uを成分とする複数の圧縮スコア値ベクトルQ’のバラツキが小さいか否かを判断し、上記特徴度算出部が取得した複数のスコア値uを成分とする複数の圧縮スコア値ベクトルQ’のバラツキが小さいと判断した場合に、上記処理装置を用いて、上記測定値記憶部が記憶した複数の測定値yが所定の条件を満たすか否かを、上記複数の測定値yに対応する複数の圧縮スコア値ベクトルQ’の成分として上記スコア値圧縮部が記憶した複数のスコア値uに基づいて判別する判別式を算出し、算出した上記判別式のパラメータを、上記記憶装置に記憶する判別式算出部と、
    上記処理装置を用いて、上記測定値記憶部が記憶した複数の測定値yを上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数の測定値yが上記所定の条件を満たすか否かを判断し、上記処理装置を用いて、上記判別式算出部が記憶したパラメータを上記記憶装置から取得し、上記処理装置を用いて、上記複数の測定値yに対応して、上記スコア値圧縮部が記憶した複数のスコア値uを上記記憶装置から取得し、上記処理装置を用いて、取得した上記パラメータによって示される判別式に取得した上記複数のスコア値uを代入して、上記複数のスコア値uに対応する複数の測定値yが所定の条件を満たすか否かを判別し、上記処理装置を用いて、上記複数の測定値yに基づく判断結果と、上記判別式に基づく判別結果とを比較して、上記判別式に基づく判別結果が正しいか否かを判断し、上記処理装置を用いて、上記判別式に基づく判別結果が正しいか否かの判断結果に基づいて、上記判別式の判別精度を示す値を算出して、判別度とし、上記処理装置を用いて、算出した上記判別度を上記記憶装置に記憶する判別度算出部と、
    上記処理装置を用いて、上記判別度算出部が算出した判別度を上記記憶装置から取得し、上記処理装置を用いて、取得した上記判別度に基づいて上記判別式の判別精度が高いか否かを判断し、上記判別式の判別精度が高いと判断した場合に、上記処理装置を用いて、上記影響因子選択部が選択した複数の選択因子F’を示す選択因子情報Sを上記記憶装置から取得し、上記処理装置を用いて、取得した上記選択因子情報Sを、強影響因子情報として、上記記憶装置に記憶する強影響因子選択部と、
    上記処理装置を用いて、上記強影響因子選択部が記憶した強影響因子情報を上記記憶装置から取得し、上記処理装置を用いて、上記影響因子情報記憶部が記憶した影響因子情報のうち、取得した上記強影響因子情報によって示される影響因子についての影響因子情報を、上記記憶装置から取得し、上記処理装置を用いて、取得した上記影響因子情報に基づいて、上記強影響因子情報によって示される影響因子についての情報を上記出力装置に出力する強影響因子出力部と、
    を有し、
    上記測定対象の状態に強い影響を与える影響因子を推定することを特徴とする影響因子推定装置。
  2. 上記特徴度算出部は、
    上記処理装置を用いて、取得した上記複数のスコア値uを成分とする複数の圧縮スコア値ベクトルQ’を近似する近似式を算出し、
    上記処理装置を用いて、算出した上記近似式と、上記複数の圧縮スコア値ベクトルQ’との間の近似誤差を算出し、
    上記処理装置を用いて、算出した上記近似誤差を合計して、特徴度Cとする
    ことを特徴とする請求項1に記載の影響因子推定装置。
  3. 上記特徴度算出部は、
    上記処理装置を用いて、上記近似式として、取得した上記複数のスコア値uを成分とする複数の圧縮スコア値ベクトルQ’の回帰式を算出し、
    上記処理装置を用いて、上記近似誤差として、算出した上記回帰式と、上記複数の圧縮スコア値ベクトルQ’との間の回帰誤差の二乗を算出する
    ことを特徴とする請求項2に記載の影響因子推定装置。
  4. 上記判別式算出部は、
    上記処理装置を用いて、取得した上記特徴度Cを所定の値と比較し、上記特徴度Cが所定の値より小さい場合に、上記処理装置を用いて、上記特徴度算出部が取得した複数のスコア値uを成分とする複数の圧縮スコア値ベクトルQ’のバラツキが小さいと判断する
    ことを特徴とする請求項1に記載の影響因子推定装置。
  5. 上記判別式算出部は、
    上記処理装置を用いて、上記測定値記憶部が記憶した複数の測定値yを上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数の測定値yが所定の条件を満たすか否かを判断し、上記処理装置を用いて、取得した上記複数の測定値yのうち、上記所定の条件を満たすと判断した測定値yに対応する上記複数の圧縮スコア値ベクトルQ’の成分として上記スコア値圧縮部が記憶した複数のスコア値uを上記記憶装置から取得し、取得した上記複数のスコア値uを成分とする複数の圧縮スコア値ベクトルQ’を、基準ベクトル群Gとし、上記処理装置を用いて、上記判別式として、上記基準ベクトル群Gに対するマハラノビス距離を計算する計算式を算出する
    ことを特徴とする請求項1に記載の影響因子推定装置。
  6. 上記判別度算出部は、
    上記処理装置を用いて、取得した上記パラメータによって示される判別式に、取得した上記複数のスコア値uを代入して、上記判別式の値を算出し、上記処理装置を用いて、算出した上記判別式の値を所定の値と比較して、上記複数のスコア値uを成分とする複数の圧縮スコア値ベクトルQ’に対応する複数の測定値yが所定の条件を満たすか否かを判別する
    ことを特徴とする請求項1に記載の影響因子推定装置。
  7. 上記判別度算出部は、
    上記処理装置を用いて、上記判別度として、上記判別式に基づく判別結果が正しいか否かの判断結果のうち、上記判別式に基づく判別結果が正しいと判断した割合を計算する
    ことを特徴とする請求項1に記載の影響因子推定装置。
  8. 上記影響因子選択部は、
    上記処理装置を用いて、上記複数の影響因子Fのなかから選択する複数の選択因子F’の数を生成して、選択因子数とし、上記処理装置を用いて、上記複数の影響因子Fのなかから、生成した上記選択因子数の選択因子F’を選択する
    ことを特徴とする請求項1に記載の影響因子推定装置。
  9. 上記影響因子推定装置は、更に、
    上記処理装置を用いて、上記測定値記憶部が記憶した複数の測定値yを上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数の測定値yに対応する複数の影響因子測定値ベクトルXの成分として上記影響因子測定値記憶部が記憶した複数の影響因子測定値xを上記記憶装置から取得し、上記処理装置を用いて、上記複数の影響因子Fそれぞれについて、取得した上記複数の測定値yと、上記複数の測定値yに対応する上記複数の影響因子測定値xとの間の相関の強さを示す値を算出して、上記複数の影響因子Fに対応する複数の影響因子重み付けWとし、上記処理装置を用いて、算出した上記複数の影響因子重み付けWを記憶装置に記憶する重み付け算出部
    を有し、
    上記影響因子選択部は、
    上記処理装置を用いて、上記重み付け算出部が算出した複数の影響因子重み付けWを上記記憶装置から取得し、上記処理装置を用いて、取得した上記影響因子重み付けWに基づいて、上記複数の影響因子Fを複数の影響因子グループに分類し、上記処理装置を用いて、分類した上記複数の影響因子グループそれぞれのなかから選択する選択因子F’の数をそれぞれ生成して、グループ選択因子数とし、上記処理装置を用いて、上記複数の影響因子グループそれぞれのなかから、生成した上記グループ選択因子数の選択因子F’を選択する
    ことを特徴とする請求項1に記載の影響因子推定装置。
  10. 上記影響因子選択部は、更に、
    上記処理装置を用いて、上記判別度算出部が算出した判別度を上記記憶装置から取得し、上記処理装置を用いて、取得した上記判別度に基づいて、大規模組み合わせ計算法により、上記判別度が大きくなるよう、上記複数の影響因子Fのなかから複数の選択因子F’を選択する
    ことを特徴とする請求項1に記載の影響因子推定装置。
  11. 上記影響因子選択部は、
    上記大規模組み合わせ計算法として、焼きなまし法及び遺伝的アルゴリズム法及びタブーサーチ法の少なくともいずれかを用いる
    ことを特徴とする請求項10に記載の影響因子推定装置。
  12. 上記影響因子選択部は、
    上記処理装置を用いて、取得した上記判別度を算出する際に用いた複数の選択因子F‘を示す選択因子情報Sを上記記憶装置から取得し、上記処理装置を用いて、取得した上記選択因子情報Sによって示される複数の選択因子F’と比較して、選択する選択因子F‘の数が等しく、一部の選択因子F’が共通する複数の選択因子F’を選択する
    ことを特徴とする請求項10に記載の影響因子推定装置。
  13. 上記重み付け算出部は、
    上記複数の影響因子Fそれぞれについて、上記複数の測定値yと、上記複数の測定値yに対応する上記複数の影響因子測定値xとの間のピアソンの積率相関係数の二乗を算出し、上記複数の影響因子Fに対応する複数の影響因子重み付けWとする
    ことを特徴とする請求項9に記載の影響因子推定装置。
  14. 上記特異値分解部は、
    上記処理装置を用いて、取得した上記選択因子情報Sを上記記憶装置に記憶し、上記処理装置を用いて、取得した上記選択因子情報Sによって示される複数の選択因子F’と、以前に記憶した選択因子情報Sによって示される複数の選択因子F’とを比較して、選択した選択因子F’の数が等しく、一部の選択因子F’が共通している場合に、上記処理装置を用いて、以前に記憶した上記選択因子情報Sによって示される複数の選択因子F’についてのパターン行列Pを特異値分解して算出した複数の特異値σと複数のスコア値uとを上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数の特異値σと上記複数のスコア値uとに基づいて、取得した上記選択因子情報Sによって示される複数の選択因子F’についてのパターン行列Pを特異値分解する
    ことを特徴とする請求項1に記載の影響因子推定装置。
  15. 情報を記憶する記憶装置と、情報を処理する処理装置と、情報を出力する出力装置とを有するコンピュータを、
    上記処理装置を用いて、測定対象の状態を測定した値を測定値yとし、複数の測定値yを上記記憶装置に記憶する測定値記憶部と、
    上記処理装置を用いて、上記測定対象の状態に影響を与える可能性のある複数の影響因子Fを示す情報を、影響因子情報として、上記記憶装置に記憶する影響因子情報記憶部と、
    上記処理装置を用いて、上記影響因子情報記憶部が記憶した影響因子情報によって示される上記複数の影響因子Fを測定した値を、複数の影響因子測定値xとし、上記測定値記憶部が記憶した複数の測定値yそれぞれに対応する上記複数の影響因子測定値xを、上記複数の測定値yそれぞれに対応する複数の影響因子測定値ベクトルXの成分として、上記記憶装置に記憶する影響因子測定値記憶部と、
    上記処理装置を用いて、上記影響因子情報記憶部が記憶した影響因子情報によって示される上記複数の影響因子Fのなかから、複数の影響因子を選択して、複数の選択因子F’とし、上記処理装置を用いて、選択した上記複数の選択因子F’を示す情報を、選択因子情報Sとして、上記記憶装置に記憶する影響因子選択部と、
    上記処理装置を用いて、上記影響因子選択部が選択した複数の選択因子F’を示す選択因子情報Sを上記記憶装置から取得し、上記処理装置を用いて、上記影響因子測定値記憶部が記憶した複数の影響因子測定値xのうち、取得した上記選択因子情報Sによって示される複数の選択因子F’についての複数の影響因子測定値xを上記記憶装置から取得し、上記処理装置を用いて、上記複数の測定値yに対応する複数の影響因子測定値xのうち、取得した複数の影響因子測定値xを成分とする複数のベクトルを、上記複数の測定値yに対応する複数の選択因子測定値ベクトルX’とし、上記複数の選択因子測定値ベクトルX’を行ベクトルとする行列を、パターン行列Pとし、上記パターン行列Pを特異値分解して、複数の特異値σと、P=U・S・V (ただし、Sはσを対角成分とする対角行列。)を満たすスコア値行列Uとを算出し、上記処理装置を用いて、算出した上記複数の特異値σを上記記憶装置に記憶し、上記処理装置を用いて、算出した上記スコア値行列Uの複数の行ベクトルを、上記複数の行ベクトルに対応する上記パターン行列Pの行ベクトルである上記複数の選択因子測定値ベクトルX’が対応する上記複数の測定値に対応する複数のスコア値ベクトルQとし、上記複数のスコア値ベクトルQの複数の成分を、上記複数の測定値yに対応する複数のスコア値uとして、上記記憶装置に記憶する特異値分解部と、
    上記処理装置を用いて、上記特異値分解部が算出した複数の特異値σを、上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数の特異値σに基づいて、上記特異値分解部が算出した複数のスコア値uのうちから、複数のスコア値uを選択し、選択した上記複数のスコア値uを上記記憶装置から取得し、上記処理装置を用いて、上記複数の測定値yに対応する複数のスコア値uのうち、取得した上記複数のスコア値uを、上記複数の測定値yに対応する複数の圧縮スコア値ベクトルQ’の成分として、上記記憶装置に記憶するスコア値圧縮部と、
    上記処理装置を用いて、上記測定値記憶部が記憶した複数の測定値yを上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数の測定値yが所定の条件を満たすか否かを判断し、上記処理装置を用いて、取得した上記複数の測定値yのうち、上記所定の条件を満たすと判断した測定値yに対応する上記複数の圧縮スコア値ベクトルQ’の成分として上記スコア値圧縮部が記憶した複数のスコア値uを上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数のスコア値uを成分とする上記複数の圧縮スコア値ベクトルQ’のバラツキの度合いを示す値を算出して、特徴度Cとし、上記処理装置を用いて、算出した特徴度Cを、上記記憶装置に記憶する特徴度算出部と、
    上記処理装置を用いて、上記特徴度算出部が算出した特徴度Cを上記記憶装置から取得し、上記処理装置を用いて、取得した上記特徴度Cに基づいて、上記特徴度算出部が取得した複数のスコア値uを成分とする複数の圧縮スコア値ベクトルQ’のバラツキが小さいか否かを判断し、上記特徴度算出部が取得した複数のスコア値uを成分とする複数の圧縮スコア値ベクトルQ’のバラツキが小さいと判断した場合に、上記処理装置を用いて、上記測定値記憶部が記憶した複数の測定値yが所定の条件を満たすか否かを、上記複数の測定値yに対応して上記スコア値圧縮部が記憶した複数のスコア値uに基づいて判別する判別式を算出し、算出した上記判別式のパラメータを、上記記憶装置に記憶する判別式算出部と、
    上記処理装置を用いて、上記測定値記憶部が記憶した複数の測定値yを上記記憶装置から取得し、上記処理装置を用いて、取得した上記複数の測定値yが上記所定の条件を満たすか否かを判断し、上記処理装置を用いて、上記判別式算出部が記憶したパラメータを上記記憶装置から取得し、上記処理装置を用いて、上記複数の測定値yに対応して、上記スコア値圧縮部が記憶した複数のスコア値uを上記記憶装置から取得し、上記処理装置を用いて、取得した上記パラメータによって示される判別式に取得した上記複数のスコア値uを代入して、上記複数のスコア値uに対応する複数の測定値yが所定の条件を満たすか否かを判別し、上記処理装置を用いて、上記複数の測定値yに基づく判断結果と、上記判別式に基づく判別結果とを比較して、上記判別式に基づく判別結果が正しいか否かを判断し、上記処理装置を用いて、上記判別式に基づく判別結果が正しいか否かの判断結果に基づいて、上記判別式の判別精度を示す値を算出して、判別度とし、上記処理装置を用いて、算出した上記判別度を上記記憶装置に記憶する判別度算出部と、
    上記処理装置を用いて、上記判別度算出部が算出した判別度を上記記憶装置から取得し、上記処理装置を用いて、取得した上記判別度に基づいて上記判別式の判別精度が高いか否かを判断し、上記判別式の判別精度が高いと判断した場合に、上記処理装置を用いて、上記影響因子選択部が選択した複数の選択因子F’を示す選択因子情報Sを上記記憶装置から取得し、上記処理装置を用いて、取得した上記選択因子情報Sを、強影響因子情報として、上記記憶装置に記憶する強影響因子選択部と、
    上記処理装置を用いて、上記強影響因子選択部が記憶した強影響因子情報を上記記憶装置から取得し、上記処理装置を用いて、上記影響因子情報記憶部が記憶した影響因子情報のうち、取得した上記強影響因子情報によって示される影響因子についての影響因子情報を、上記記憶装置から取得し、上記処理装置を用いて、取得した上記影響因子情報に基づいて、上記強影響因子情報によって示される影響因子についての情報を上記出力装置に出力する強影響因子出力部と、
    を有し、
    上記測定対象の状態に強い影響を与える影響因子を推定する影響因子推定装置として機能させることを特徴とする影響因子推定プログラム。
JP2006135297A 2006-05-15 2006-05-15 影響因子推定装置及び影響因子推定プログラム Expired - Fee Related JP4495691B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006135297A JP4495691B2 (ja) 2006-05-15 2006-05-15 影響因子推定装置及び影響因子推定プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006135297A JP4495691B2 (ja) 2006-05-15 2006-05-15 影響因子推定装置及び影響因子推定プログラム

Publications (2)

Publication Number Publication Date
JP2007305048A JP2007305048A (ja) 2007-11-22
JP4495691B2 true JP4495691B2 (ja) 2010-07-07

Family

ID=38838896

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006135297A Expired - Fee Related JP4495691B2 (ja) 2006-05-15 2006-05-15 影響因子推定装置及び影響因子推定プログラム

Country Status (1)

Country Link
JP (1) JP4495691B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220390263A1 (en) * 2021-05-31 2022-12-08 Mitsubishi Heavy Industries, Ltd. Disturbance estimation device, disturbance estimation method, and program

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5967017B2 (ja) * 2013-05-31 2016-08-10 Jfeスチール株式会社 影響因子抽出方法およびプログラム
JP7384081B2 (ja) * 2020-03-18 2023-11-21 株式会社デンソー 情報処理装置、データ分解方法、及びデータ分解プログラム
JP7567055B2 (ja) 2021-06-16 2024-10-15 日立Astemo株式会社 設計支援方法、設計支援システム
CN118094357B (zh) * 2024-04-22 2024-07-12 武汉泰沃滋信息技术有限公司 基于属性解耦和因子分析的车辆动态称重方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002202983A (ja) * 2000-12-28 2002-07-19 Matsushita Electric Ind Co Ltd 分類への帰属度計算基準作成方法及び装置
JP2003030222A (ja) * 2001-07-05 2003-01-31 Internatl Business Mach Corp <Ibm> 大規模データベースにおける主要クラスタおよびアウトライア・クラスタの検索、検出および同定のための方法、システム、記録媒体、およびサーバ
JP2003316764A (ja) * 2002-04-18 2003-11-07 Mitsubishi Electric Research Laboratories Inc 加算的特異値分解方法
JP2005294782A (ja) * 2004-03-31 2005-10-20 Takeshi Awaji 半導体超伝導素子
JP2006011724A (ja) * 2004-06-24 2006-01-12 Ishihara Sangyo Kaisha Ltd データ解析方法及びそのシステム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002202983A (ja) * 2000-12-28 2002-07-19 Matsushita Electric Ind Co Ltd 分類への帰属度計算基準作成方法及び装置
JP2003030222A (ja) * 2001-07-05 2003-01-31 Internatl Business Mach Corp <Ibm> 大規模データベースにおける主要クラスタおよびアウトライア・クラスタの検索、検出および同定のための方法、システム、記録媒体、およびサーバ
JP2003316764A (ja) * 2002-04-18 2003-11-07 Mitsubishi Electric Research Laboratories Inc 加算的特異値分解方法
JP2005294782A (ja) * 2004-03-31 2005-10-20 Takeshi Awaji 半導体超伝導素子
JP2006011724A (ja) * 2004-06-24 2006-01-12 Ishihara Sangyo Kaisha Ltd データ解析方法及びそのシステム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220390263A1 (en) * 2021-05-31 2022-12-08 Mitsubishi Heavy Industries, Ltd. Disturbance estimation device, disturbance estimation method, and program
JP7565869B2 (ja) 2021-05-31 2024-10-11 三菱重工業株式会社 外乱推定装置、外乱推定方法およびプログラム

Also Published As

Publication number Publication date
JP2007305048A (ja) 2007-11-22

Similar Documents

Publication Publication Date Title
CN113222700B (zh) 基于会话的推荐方法及装置
US20180082215A1 (en) Information processing apparatus and information processing method
Sun et al. Quantifying variable interactions in continuous optimization problems
JP2015082259A (ja) 時系列データ予測装置、時系列データ予測方法、及びプログラム
CN111639798A (zh) 智能的预测模型选择方法及装置
JP4495691B2 (ja) 影響因子推定装置及び影響因子推定プログラム
CN115412301B (zh) 一种网络安全的预测分析方法及系统
CN112382354B (zh) 一种Cr12MoV材料硬度预测方法及装置
Deutsch et al. Ties matter: Meta-evaluating modern metrics with pairwise accuracy and tie calibration
CN116185817A (zh) 一种软件缺陷预测规则的筛选方法及系统
CN116186603A (zh) 异常用户的识别方法及装置、计算机存储介质、电子设备
CN111898637A (zh) 一种基于ReliefF-DDC特征选择算法
Widyawati et al. Comparison Analysis of Classification Model Performance in Lung Cancer Prediction Using Decision Tree, Naive Bayes, and Support Vector Machine
US20220327394A1 (en) Learning support apparatus, learning support methods, and computer-readable recording medium
JP5684084B2 (ja) 誤分類検出装置、方法、及びプログラム
CN117763316A (zh) 一种基于机器学习的高维数据降维方法及降维系统
CN112634268A (zh) 一种视频质量评价方法、装置及电子设备
JP7231829B2 (ja) 機械学習プログラム、機械学習方法および機械学習装置
CN111782805A (zh) 一种文本标签分类方法及系统
US20090099821A1 (en) Model-diversity technique for improved proactive fault monitoring
Nikolikj et al. Sensitivity Analysis of RF+ clust for Leave-one-problem-out Performance Prediction
CN116612814A (zh) 基于回归模型的基因样本污染批量检测方法、装置、设备及介质
Kohns et al. Decoupling shrinkage and selection for the Bayesian quantile regression
CN115730152A (zh) 基于用户画像分析的大数据处理方法及大数据处理系统
CN114912341A (zh) 一种通信设备修理备件消耗量的组合预测方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081226

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100223

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100318

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100406

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100409

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130416

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees