以下、本発明にかかる実施の一形態を図面に基づいて説明する。なお、各図において同一の符号を付した構成は、同一の構成であることを示し、適宜、その説明を省略する。また、本明細書において、総称する場合には添え字を省略した参照符号で示し、個別の構成を指す場合には添え字を付した参照符号で示す。
(第1実施形態)
図1は、第1実施形態における出力値予測装置の構成を示すブロック図である。図1において、出力値予測装置Sは、演算制御部1と、入力部2と、提示部3と、記憶部4とを備えて構成される。
入力部2は、予め与えられたデータから本発明の手法によって出力値を予測する出力値予測プログラムを起動するコマンド等の各種コマンド、および、出力値を予想する上で必要な各種データを出力値予測装置Sに入力する機器であり、例えば、キーボードやマウス等である。提示部3は、入力部2から入力されたコマンドやデータ、および、本出力値予測装置Sによって予測された出力値(予測値)を提示(出力)する機器であり、例えばCRTディスプレイ、LCD、有機ELディスプレイおよびプラズマディスプレイ等の表示装置やプリンタ等の印刷装置等である。
記憶部4は、機能的に、所定の出力とこの出力に関わる数値化可能な要因とから成り過去に取得された複数の過去実績データおよび出力値を予測したい予測対象データを記憶する実測データ記憶部41と、予測対象データから過去実績データに基づいて予測値を演算する出力値予測演算処理過程で生じる中間データを記憶する中間データ記憶部42と、予測対象データから過去実績データに基づいて予測(演算)された出力値(予測値)を記憶する予測値記憶部43と、予測値のばらつきを記憶するばらつき記憶部44とを備え、出力値予測プログラム等の各種プログラム、および、各種プログラムの実行に必要なデータやその実行中に生じるデータ等の各種データを記憶する装置である。記憶部4は、例えば、演算制御部1の所謂ワーキングメモリとなるRAM(Random Access Memory)等の揮発性の記憶素子、ROM(Read Only Memory)や書換え可能なEEPROM(Electrically Erasable Programmable Read Only Memory)等の不揮発性の記憶素子、および、各種プログラムや各種データを格納しておくハードディスク等を備えて構成される。
演算制御部1は、例えば、マイクロプロセッサおよびその周辺回路等を備えて構成され、機能的に、距離算出部11と、類似度算出部12と、パラメータ算出部13と、予測値算出部14と、ばらつき算出部15と、信頼性指標算出部16とを備え、制御プログラムに従い入力部2、提示部3および記憶部4を当該機能に応じてそれぞれ制御する。
距離算出部11は、予測対象データと過去実績データとの所定の距離を、予測対象データの要因および過去実績データの要因に基づいて、複数の過去実績データのそれぞれについて算出するものである。
類似度算出部12は、予測対象データと前記過去実績データとの間におけるデータ間の類似度を、距離算出部11で算出された複数の距離に基づいて、前記複数の過去実績データのそれぞれについて算出するものである。
パラメータ算出部13は、所定の出力を出力変数とすると共に前記所定の出力に関わる数値化可能な要因の一部または全部を入力変数とした際に、入力変数を用いて出力変数yと入力変数Zとの第1関係を表す第1モデル;y=f(Z、Θ)を生成した場合に、入力変数の入力値を第1モデルに与えることによって得られる値と入力変数の入力値に対応する出力変数の出力値との差に基づく誤差パラメータαを、過去実績データの入力変数および出力変数に基づいて複数の過去実績データのそれぞれについて算出するものである。本実施形態では、誤差パラメータαは、入力変数の入力値を第1モデルに与えることによって得られる値と入力変数の入力値に対応する出力変数の出力値との差である。
予測値算出部14は、入力変数Zおよび誤差パラメータαを用いて出力変数yと入力変数Zとの第2関係を表す第2モデル;y=f(Z、Θ、α)を生成し、予測対象データの要因のうちの入力変数に対応する要因の値および誤差パラメータαの値を第2モデルに与えることによって予測対象データの出力値を予測値として、パラメータ算出部13によって算出された複数の誤差パラメータαのそれぞれについて算出するものである。
ばらつき算出部15は、類似度算出部12によって算出された複数の類似度および予測値算出部14によって算出された複数の予測値に基づいて、予測対象データの出力値のばらつきを算出するものである。
信頼性指標算出部16は、予測値算出部14で算出された予測値に対する信頼性指標を複数の観点から複数求めるものである。信頼性指標は、信頼の度合いを表す指標である。信頼性指標算出部16は、機能的に、前記複数の信頼性指標の1つとして、所定の条件的類似度に基づいて条件的信頼性指標を求める条件的信頼性指標算出部161と、前記複数の信頼性指標の1つとして、所定の日数的類似度に基づいて日数的信頼性指標を求める日数的信頼性指標算出部162とを備えて構成される。前記所定の条件的類似度は、過去実績データにおけるデータ項目のうちの出力値に影響を与える所定のデータ項目のデータである条件的データと、予測値を求めるために予め与えられる所与のデータとの類似性の度合いを示す指標であり、例えば、前記条件的データと前記所与のデータとの類似度である。前記所定の日数的類似度は、予測値算出部14で生成された第2モデル(予測モデル)を求める場合に用いられた過去実績データを取得した取得日と前記所与のデータ(予測対象データX0)における予測日との類似性の度合いを示す指標であり、例えば、予測値算出部14で生成された第2モデル(予測モデル)を求める場合に用いられた過去実績データを取得した取得日と前記所与のデータ(予測対象データX0)における予測日との類似度である。
これら演算制御部1、入力部2、提示部3および記憶部4は、信号を相互に交換できるようにバス5でそれぞれ接続される。
このような演算制御部1、入力部2、提示部3、記憶部4およびバス5は、例えば、コンピュータ、より具体的にはノート型やディスクトップ型等のパーソナルコンピュータ等によって構成可能である。
なお、必要に応じて出力値予測装置Sは、外部記憶部をさらに備えてもよい。外部記憶部は、例えば、フレキシブルディスク、CD−ROM(Compact Disc Read Only Memory)、CD−R(Compact Disc Recordable)、DVD−R(Digital Versatile DiscRecordable)およびブルーレイディスク(Blu-ray Disc、登録商標)等の記録媒体との間でデータを読み込みおよび/または書き込みを行う装置であり、例えば、フレキシブルディスクドライブ、CD−ROMドライブ、CD−Rドライブ、DVD−Rドライブおよびブルーレイディスクドライブ等である。Aおよび/またはBは、AおよびBのうちの少なくとも一方を意味する。
ここで、出力値予測プログラム等が格納されていない場合には、出力値予測プログラム等を記録した記録媒体から前記外部記憶部を介して出力値予測プログラムが記憶部4にインストールされるように、出力値予測装置Sが構成されてもよい。あるいは、過去実績データや出力値を予測するためのデータ等のデータが外部記憶部を介して記録媒体に記録されるように、出力値予測装置Sが構成されてもよい。
次に、この本実施形態の出力値予測装置Sの動作について説明する。図2は、第1実施形態における出力値予測装置の動作を示すフローチャートである。図3は、第1実施形態の出力値予測装置における実測データ記憶部に記憶されるデータを示す図である。図4は、予測対象データと各過去実績データとのユークリッド距離を説明するための図である。図5は、第1実施形態の出力値予測装置における中間データ記憶部に記憶されるデータを示す図である。図6は、第1実施形態の出力値予測装置における予測値記憶部に記憶されるデータを示す図である。図7は、第1実施形態の出力値予測装置における、予測値のばらつきの算出手順を説明するための図である。図7(A)は、類似度wと出力の予測値y0との関係を示し、その横軸は、類似度wであり、その縦軸は、予測値y0である。図7(B)は、予測値y0のヒストグラムを示し、その横軸は、重み付き度数Fwであり、その縦軸は、予測値y0である。図7(C)は、予測値y0の確率密度分布を示し、その横軸は、確率密度P(y0)であり、その縦軸は、予測値y0である。
出力値予測装置Sは、例えば、ユーザの操作によって入力部2から起動コマンドを受け付けると、出力値予測プログラムを実行する。この出力予測プログラムの実行によって、演算制御部1に距離算出部11、類似度算出部12、パラメータ算出部13、予測値算出部14、ばらつき算出部15および信頼性指標算出部16が機能的に構成される。そして、出力値予測装置Sは、以下の動作によって、過去実績データに基づいて予測対象データから出力値(予測値)を予測する。
この出力値の予測に当たって、出力値予測装置Sの記憶部4における実測データ記憶部41には、例えば、図3に示す表形式(テーブル形式)で過去実績データ(X、y)および予測対象データx0nが予め記憶されている。ここで、所定の出力yは、M個の要素(出力要素)yjの集合であり、すなわち、y={yj|j=1、2、・・・、M}であり、前記所定の出力yに関与する要因Xは、N個の要素(要因要素)xjiの集合であり、すなわち、X={xji|i=1、2、・・・、N}である。
この図3に示す実測データテーブル51は、実測された出力値yjを登録する出力フィールド511、および、前記所定の出力yに関与する要因Xのデータxjiを登録するデータフィールド512の各フィールドを備えて構成され、過去実績データ(X、y)ごとにレコードを備え、さらに、予測対象データX0のレコードを備えている。なお、予測対象データX0には、過去実績データ(X、y)と識別可能に区別するために、0が第1添え字(添え字の左側)として付され、過去実績データ(X、y)には、M個のデータをそれぞれ識別可能に区別するために、1〜Mがそれぞれ第1添え字として付されている。そして、予測対象データX0および過去実績データ(X、y)には、前記所定の出力yに関わる要因XにおけるN個の要素である第1ないし第Nデータ項目をそれぞれ識別可能に区別するために、1〜Nがそれぞれ第2添え字(添え字の右側)として付されている。X0=[x01、x02、・・・、x0N]であり、Xji=[xj1、xj2、・・・、xjN]である。例えば、y3は、過去実績データ(X、y)における第3番目の出力値を表しており、また例えば、x23は、過去実績データ(X、y)における第2番目の第3データ項目の値を表しており、また例えば、x04は、予測対象データX0における第4データ項目の値を表している。
このように前記所定の出力yに関与する要因Xは、複数Nの要素(データ項目、要因要素)を備えて構成されており、このため、データフィールド512は、要素の個数Nに応じたデータ項目サブフィールドを備えている。図3に示す例では、前記所定の出力yは、少なくともN個の要素(第1ないし第Nデータ項目)が関与している。このため、データ項目サブフィールドは、要因Xの各要素xjiにそれぞれ対応する第1ないし第Nデータ項目の各データxj1〜xjNをそれぞれ登録するデータ項目サブフィールド5121〜512Nを備えている。また、過去実績データ(X、y)は、過去に異なる条件で、例えば、過去の互いに異なる時刻(時点)tjで実測等によって取得されたデータであり、図3に示す例では、M個のデータから構成されている。前記第1ないし第Nデータ項目の中には、当該データを取得した取得日のデータ項目が含まれる。なお、後述の第2実施形態では、前記第1ないし第Nデータ項目の中には、当該データを取得した取得日および取得時刻の各データ項目が含まれる。予測対象データX0は、前記所定の出力yにおける値y0を予測したい対象のデータx0iであり、例えば、予測時点t0までに実測されたデータx0iや、操作入力の値x0iや、操業日時x0iや、シミュレーションのために用意したデータx0i等である。
ここで、出力値予測装置Sは、予測対象データX0のデータ値x0iの全部Zまたは一部Zを用いて過去実績データ(X、y)に基づいて出力値(予測値)y0を予測し、この予測値y0のばらつきを求めるものである。
このような過去実績データ(X、y)および予測対象データX0が実測データ記憶部41に記憶されている場合において、出力値予測装置Sは、図2に示すように、まず、過去実績データ(X,y)と予測対象データX0との関連性を評価するために、両データ間の距離を演算制御部1の距離算出部11によって算出し、この算出した距離を記憶部4の中間データ記憶部42に記憶する(S11)。前記距離は、両データ間の関連性を表すように定義され、例えば、ユークリッド距離や、重み付きユークリッド距離や、正規化ユークリッド距離等が用いられる。この距離を算出するために用いられるデータxは、前記所定の出力yに関与する要因Xの全部xまたは一部xであり、また前記所定の出力yに関与する要因Xの全部または一部である前記Zと、一致していてもよく、また不一致であってもよく、また一部一致(一部不一致)であってもよい。
より具体的には、本実施形態では、距離算出部11は、図4に示すように、データ項目空間における予測対象データX0(◆)と過去実績データX(○)とのユークリッド距離dを各過去実績データ(X、y)について算出する。例えば、本実施形態では、ユークリッド距離dを求めるために用いられるデータxは、前記所定の出力yに関与する要因Xの全部であり、データ項目空間は、データ項目がN個であることから、N次元空間となる。また、前記ユークリッド距離dは、本実施形態では、重み付き距離が採用されており、例えば、式1−1によって求められる。式1−1では、予測対象データX0と第j番目の過去実績データXとの重み付きユークリッド距離djは、ユークリッド距離dを求めるために用いられるデータxにおいて、第j番目の過去実績データ(X、y)における第iデータ項目xjiと予測対象データX0における第iデータ項目x0iとの差の2乗に、第iデータ項目の重みai(距離に関する重みai、ai≧0)の2乗を乗算したものを、第1データ項目から第Nデータ項目まで和を取り、その結果の平方根を求めることによって、算出される。
また例えば、前記ユークリッド距離dは、式1−2によって求められてもよい。式1−2では、予測対象データX0と第j番目の過去実績データXとの重み付きユークリッド距離djは、ユークリッド距離dを求めるために用いられるデータxにおいて、第j番目の過去実績データ(X、y)における第iデータ項目xjiと予測対象データX0における第iデータ項目x0iとの差に、第iデータ項目の重みaiを乗算したものの絶対値を、第1データ項目から第Nデータ項目まで和を取ることによって、算出される。
また例えば、前記ユークリッド距離dは、式1−3によって求められてもよい。式1−3では、予測対象データX0と第j番目の過去実績データXとの重み付きユークリッド距離djは、ユークリッド距離dを求めるために用いられるデータxにおいて、第j番目の過去実績データ(X、y)における第iデータ項目xjiと予測対象データX0における第iデータ項目x0iとの差に、第iデータ項目の重みaiを乗算したものの絶対値の第1から第iまでの集合の中から最大値を選択することによって、算出される。
ここで、重みa
iは、ユークリッド距離dを求めるに当たって、第1ないし第Nデータ項目の中で第iデータ項目の重要度(重要性の度合い)を表すパラメータであり、要因要素(第iデータ項目x
i)が所定の出力yにおけるばらつきの大きさに寄与する程度を表すものである。例えば、要因要素(第iデータ項目x
i)がそれぞれ標準化もしくは正規化されている場合には、この重みa
iは、所定の出力yに影響を与える程度が大きいデータ項目ほど大きくなり、所定の出力yに影響を与える程度が小さいデータ項目ほど小さくなるように、設定される。この重みa
iは、公知の手法を用いて決定することができ、例えば、特許第3943841号明細書に開示されているように重回帰分析によって求めることができ、また例えば、特許第3912215号明細書に開示されているように、各データ項目をその統計値(例えば平均値や標準偏差)によって正規化しておくことによって求めることができる。
そして、距離算出部11は、この算出した各距離djを記憶部4の中間データ記憶部42に記憶する。
次に、出力値予測装置Sは、予測対象データX0とどの程度似ているかを評価するために、両データx間の類似度(類似性の度合い)wを、第1ないし第M過去実績データ(X、y)のそれぞれについて、演算制御部1の類似度算出部12によって算出し、この算出した各類似度wを記憶部4の中間データ記憶部42に記憶する(S12)。類似度wjは、例えば、前記重み付きユークリッド距離djが小さいほど類似度が大きく、かつ、正の値を取るように、定義される。
より具体的には、類似度算出部12は、例えば、類似度wjを式2−1によって算出する。また例えば、類似度算出部12は、類似度wjを式2−2によって算出する。また例えば、類似度算出部12は、例えば、類似度wjを式2−3によって算出する。
ここで、類似度w
jは、予測対象データX
0に対する第j番目の過去実績データXの類似度であり、c
1は、0以上の実数の調整パラメータであり、c
2は、実数(負の値でもよい)の調整パラメータであり、g、rは、正の実数の調整パラメータである。
そして、類似度算出部12は、この算出した各類似度wjを記憶部4の中間データ記憶部42に記憶する。
なお、類似度wの上限値および/またはその下限値が設けられ、式2−1ないし式2−3のいずれか1つの式によって算出された類似度wjが前記上限値を超える場合には、類似度wjが前記上限値に置き換えられ、および/または、式2−1ないし式2−3のいずれか1つの式によって算出された類似度wjが前記下限値を超える場合には、類似度wjが前記下限値に置き換えられるように類似度算出部12が構成されてもよい。このように構成されることによって、特定の過去実績データXだけが、過剰に類似度が大きくなったり、逆に小さくなったりすることを防ぐことが可能となる。特定の過去実績データXだけが、その類似度が過大になってしまうと、仮に、そのデータ計測値にたまたま誤差があった場合に、その誤差に引っ張られて、間違ったばらつきの予測を行ってしまうことになる。このため、上述のように、上限値を設定することは、誤差に強くなる効果を奏する。
また例えば、予め所定の閾値が設けられ、式2−1ないし式2−3のいずれか1つの式によって算出された類似度wjが前記閾値以下である場合には、類似度wjが0に置き換えられるように、類似度算出部12が構成されてもよい。あるいは、式2−1ないし式2−3のいずれか1つの式によって算出された類似度wjが小さい順に並べられ、小さい方から予め設定された所定数(または所定割合)までの類似度wjが0に置き換えられるように、類似度算出部12が構成されてもよい。このように構成されることによって、予測値y0を求めるに当たって、予測対象データX0にあまり類似しない過去実績データXを必要以上に考慮することを防ぐことが可能となる。また、予測対象データX0にあまり類似しない過去実績データXが除外され、以下に説明する演算処理が不要となり、その結果、演算処理量の軽減(演算処理時間の短縮)が可能となる。
また、類似度wjを算出する場合において、予測対象データX0と時間的に近い過去実績データXほど、その類似度wjを大きくさせる(高くさせる)評価項目が類似度wjの演算に入っていることが好ましい。この類似度wjを大きくさせる評価項目は、例えば、ユークリッド距離dを求めるために用いられるデータxの中に1または複数含まれていてもよく、また例えば、類似度wを算出する前記式2−1ないし式2−3の中に含まれていてもよい。より具体的には、前記式2−1ないし式2−3に補正項exp(−(wday×△dayj)2)が乗じられる。ここで、wdayは、調整パラメータとしての重みであり、△dayjは、時刻tjに取得された第j過去実績データXjと予測対象データX0との操業日数差である。このように構成することによって、例えば、設備や操業の変動、あるいは、経時変化等によって、出力値のばらつきが予測される系(例えば製造プラントや製造プロセス等)の特性が変化した場合に、ロバストな予測を行うことが可能となる。
次に、出力値予測装置Sは、不確定要素を表す誤差パラメータαを、第1ないし第M過去実績データ(X、y)のそれぞれについて、演算制御部1のパラメータ算出部13によって算出し、この算出した各誤差パラメータαを記憶部4の中間データ記憶部42に記憶する(S13)。
より具体的には、パラメータ算出部13は、出力値yを予測する予測モデル(第2モデル)をM個の過去実績データ(X、y)に基づいて求め、この求めたモデルを用いることによって、第1ないし第M過去実績データ(X、y)のそれぞれについて、各誤差パラメータαを求める。
この予測モデルは、例えば、式3の関数fによって表現される。この場合において、パラメータ算出部13は、関数式3の係数ΘをM個の過去実績データ(X、y)に基づいて求め、この求めた関数式3を用いることによって、第1ないし第M過去実績データ(X、y)のそれぞれについて、各誤差パラメータαを求める。
ここで、Zは、例えば操業条件(製造条件)の各条件や製造工程の各工程における各測定項目等の、前記所定の出力yに関わる数値化可能な要因Xのうちの出力値y
0を予測するために用いられる要因であり、複数L個の要素zを備えて構成される(Z
j=[z
j1、z
j2、・・・、z
jL])。Zは、例えば、前記所定の出力yに関与する要因Xにおける複数Nの要因要素x
jiであるデータ項目(X
j=[x
j1、x
j2、・・・、x
jN])の一部または全部によって構成される。なお、このZは、さらに、前記データ項目X以外の要素を含んでいてもよい。また、上述したように、この出力値y
0を予測するために用いられる要因Zは、ユークリッド距離dを求めるために用いられるデータxと、一致していてもよく、また不一致であってもよく、また一部一致(一部不一致)であってもよい。このZは、関数fの式3を決定する際に予め設定される。Θは、関数式3の係数等の所定の調整パラメータであり、M個の過去実績データ(X、y)に基づいて同定計算によって求められる。この同定には、最小二乗法、最尤推定法、部分最小二乗法、二次計画法およびPSO(Particle Swarm Optimization)等の、前記所定の出力yの実績値y
jとその予測値y
0との誤差が所定の評価関数の下(所定の制約条件の範囲内)で最小(または最大)となるように決定する方法が用いられる。あるいは、Θは、所定の物理法則を用いることによって求められてもよい。α
jは、不確定要素を表す誤差パラメータであり、ΘおよびZだけでは出力yを表現しきれない要因(ばらつきの要因)を表すものであり、ΘおよびZを用いて出力yを予測した場合における予測値y
0と実績値y
jとの誤差に相当する。
予測値y0を重回帰式によって予測する場合には、関数式3は、例えば、式4−1を用いることができ、第j番目の過去実績データ(Xj、yj)における誤差パラメータαjは、式4−2によって与えられる。この式4−1によって表現されるモデルは、不確定要素(ばらつきの要因)が加法的に存在する場合に有効である。
また例えば、予測値y0を重回帰式によって予測する場合には、関数式3は、例えば、式5−1を用いることができ、第j番目の過去実績データ(Xj、yj)における誤差パラメータαjは、式5−2によって与えられる。この式5−1によって表現されるモデルは、不確定要素が乗法的に存在する場合に有効である。
また例えば、予測値y0を重回帰式によって予測する場合には、関数式3は、例えば、式6−1を用いることができ、第j番目の過去実績データ(Xj、yj)における誤差パラメータαjは、式6−2によって与えられる。この式6−1によって表現されるモデルは、zj1の影響係数に不確定要素が存在する場合に有効である。
また例えば、予測値y0を重回帰式によって予測する場合には、関数式3は、例えば、式7−1を用いることができ、第j番目の過去実績データ(Xj、yj)における誤差パラメータαjは、式7−2(式7−2−1、式7−2−2)によって与えられる。
なお、上述では、関数fを表す数式が用いられたが、関数fを表すテーブル、収束計算アルゴリズム、if−thenルール、ファジィ推論、ニューラルネットワークおよびJIT(Just in Time)モデル等を含む演算プログラムが用いられてもよい。ここで、誤差パラメータαjがZj、Θおよびyjから逆算で求めることができない場合には、例えば二分探索法や絨毯爆撃法やPSO(Particle Swarm Method)等で、誤差パラメータαjの値を種々の値に振ってその出力値がyjに一致するような誤差パラメータαjを求めればよい。
そして、パラメータ算出部13は、この算出した各誤差パラメータαを記憶部4の中間データ記憶部42に記憶する。
このような各処理S11〜S13によって算出された重み付きユークリッド距離dj、類似度wjおよび誤差パラメータαjは、例えば、図5に示すように表形式(テーブル形式)によって中間データ記憶部42に記憶される。この図5に示す中間データテーブル52は、実測された出力値yjを登録する出力フィールド521、類似度wjの算出に用いられたデータ項目のデータxを登録する類似度計算用データフィールド522、予測値y0の算出に用いられたデータ項目のデータzを登録する出力予測用データフィールド523、当該過去実績データXの重み付きユークリッド距離djを登録する重み付き距離フィールド524、当該過去実績データXの類似度wjを登録する類似度フィールド525、および、当該過去実績データXの誤差パラメータαjを登録する誤差パラメータフィールド526の各フィールドを備えて構成され、第1ないし第M過去実績データ(X、y)ごとにレコードを備え、さらに、予測対象データX0のレコードを備えている。そして、類似度計算用データフィールド522は、類似度wjの算出に用いられた各データ項目xに応じたデータ項目サブフィールド5221〜522Nを備えている。同様に、出力予測用データフィールド523は、予測値y0の算出に用いられた各データ項目zに応じたデータ項目サブフィールド5231〜523Lを備えている。
次に、出力値予測装置Sは、演算制御部1の予測値算出部14によって、処理S13で求めた予測モデルを用いて、予測対象データX0における第1ないし第Nデータ項目の各データ値x01〜x0Nに基づいて予測値y0を、処理S13で求めた各誤差パラメータαjのそれぞれについて算出し、この算出した各予測値y0を記憶部4の予測値記憶部43に記憶する(S14)。ここで、この処理S14において、予測モデルは、誤差パラメータαjが処理S13で求めた各誤差パラメータαjのそれぞれに変更される。例えば、上述の関数fの式3によって予測モデルが表現される場合では、処理S13で求められた係数Θであって、処理S13で求めた各誤差パラメータαjのそれぞれに変更される関数fの式3に、予測対象データX0における第1ないし第Nデータ項目のうちの予測値y0の算出に用いられた第1ないし第Lデータ項目の各データ値x01〜x0LをZとして用いることによって、予測値算出部14は、前記予測値y0を、処理S13で求めた各誤差パラメータαjのそれぞれについて算出する。前記予測値y0は、各誤差パラメータαjがM個であるから、予測値y01〜y0MのM個となる。
なお、処理S14においても、処理S13と同様に、関数fを表すテーブル、収束計算アルゴリズム、if−thenルール、ファジィ推論、ニューラルネットワークおよびJITモデル等を含む演算プログラムが用いられてもよい。
このような処理S14によって算出された各予測値y01〜y0Mは、例えば、図6に示すように表形式(テーブル形式)によって予測値記憶部43に記憶される。この図6に示す予測値データテーブル53は、処理S14によって算出された予測値y0jを登録する予測値フィールド531、予測値y0jの算出に用いられた第1ないし第Lデータ項目の各データ値x01〜x0Lを登録する出力予測用データフィールド532、処理S13によって算出された誤差パラメータαを登録する誤差パラメータフィールド533、および、当該パラメータフィールド533の誤差パラメータの算出に用いられた過去実績データ(X、y)における類似度wjを登録する類似度フィールド534の各フィールドを備えて構成され、第1ないし第M誤差パラメータαjごとにレコードを備えている。ここで、各処理S14によって算出された各予測値y01〜y0Mは、図6に示すように、当該予測値y0に対応する類似度wjも、互いに対応するように予測値記憶部43に記憶されている。
次に、出力値予測装置Sは、演算制御部1のばらつき算出部15によって、処理S14で求めた各予測値y01〜y0Mを用いて、予測値y0jのばらつきを算出し、この算出した予測値y0jのばらつきを記憶部4のばらつき記憶部44に記憶する(S15)。
本実施形態では、類似した条件では類似した結果になるという経験則に基づき、予測対象データX0のデータz0と第j番目の過去実績データXのデータxjとの類似性が高ければ(類似度wjが大きければ)、予測対象データX0の誤差パラメータα0も類似性が高くなると考えられる。このため、予測対象データX0の予測値y0は、類似度wjで、誤差パラメータαjを用いて予測した予測値y0jになると考えられる。
このような考えに基づいて、より具体的には、ばらつき算出部15は、図7(A)に示すように、縦軸に予測値y0をとると共に横軸に類似度wをとって、まず、M個の各過去実績データ(X、y)からそれぞれ算出されたM個の各誤差パラメータαj(j=1〜M)にそれぞれ対応するM個の各予測値y0jに対し、その類似度wjを対応させる。次に、ばらつき算出部15は、図7(A)の縦軸y0の少なくとも各予測値を含む範囲y0jを有限個の複数の区間(クラス、等級)に分割し、各区間に含まれる予測値y0jの類似度wjを全て足し合わせることによって重み付き度数Fwを生成し、図7(B)に示すように、予測値y0のばらつきを表すヒストグラムを生成する。
すなわち、式8に示すように、予測値y0jが第k番目の区間(Yk以上Yk+1未満の区間)に含まれるjの集合をSkとする場合(Sk={j|Yk≦y0j<Yk+1})に、集合Skに含まれるjについて類似度wjを全て足し合わせたものが第k番目の区間における重み付き度数Fwとなる。
このように予測値y0のばらつきがヒストグラムによって示され、予測値y0の出現頻度を容易に知ることが可能となる。
このように図7(B)に示すヒストグラムが予測値y0のばらつきとされてもよいが、本実施形態では、さらに、ばらつき算出部15は、図7(B)に示すヒストグラムの面積が1となるように正規化する。この正規化されたヒストグラムが予測対象データX0における予測値y0の確率密度分布(経験的な確率密度分布)とされ、予測値y0のばらつきとされる。さらに、ばらつき算出部15は、面積を1に維持したまま図7(B)に示すヒストグラムを、図7(C)に示すように曲線で表してもよい。この曲線が予測対象データX0における予測値y0の確率密度分布とされ、予測値y0のばらつきとされる。
なお、前記正規化は、例えば、図7(A)の縦軸y0を有限個の区間に分割する際に、均等な幅h=|Yk+1−Yk|に分割されるとした場合に、式9によって実行される。
また、この図7(B)に示すヒストグラムから図7(C)に示す曲線を求める際には、例えば対数正規分布やワイブル分布等の、既知の確率密度分布が利用されてもよい。
図8は、図7(B)に示すヒストグラムから図7(C)に示す確率密度分布曲線を求める手法を説明するための図である。図8(A)は、ヒストグラムの各中心点を折れ線で結んだ様子を示し、図8(B)は、図8(A)の累積確率密度分布を示し、図8(C)は、図8(B)に示す累積確率密度分布を平滑化した様子を示し、そして、図8(D)は、平滑化した確率密度分布(確率密度分布曲線)を示す。
まず、図8(A)に示すように、図7(B)に示す正規化したヒストグラムにおいて、各度数の中心位置(y0方向の中心)を折れ線で結ぶ。なお、各両端において、端部から区間の幅hの半分(h/2)だけ離れた点も0として前記折れ線に結ばれる。この折れ線で囲まれた面積も1とされている。
次に、図8(B)に示すように、図8(A)から式10−1によって累積確率密度分布SwNが求められる。
次に、図8(C)に示すように、図8(B)の折れ線の累積確率密度分布SwNが例えば式10−2を用いることによって平滑化される。
そして、図8(D)に示すように、図8(C)に示す平滑化された累積確率密度分布から例えば式10−3を用いることによって、平滑化された確率密度分布(確率密度分布曲線)が求められる。
このように予測値y0のばらつきが確率密度分布によって示され、予測値y0の出現確率を容易に知ることが可能となる。
また、前記重み付き度数Fwを算出する場合において、M個の過去実績データ(X、y)のうちの類似度wjが高い順(大きい順)に並べられ、大きい方から予め設定された所定数(所定割合)までの過去実績データ(X、y)が抽出され、この抽出された過去実績データのみを用いることによって前記重み付き度数Fwが求められてもよい。類似度wjの低い過去実績データ(X、y)を予め除去することによって、前記重み付き度数Fwを算出するための演算処理量の軽減(演算処理時間の短縮)が可能となる。また、上述した式2(式2−1〜式2−3)によって類似度wjを算出する場合では、予測対象データX0との類似度wjが低い過去実績データ(X、y)についても、類似度wjが0になることがないため、前記重み付き度数Fwに影響を与えることになる。このため、図7(B)に示す重み付き度数Fwの幅は、M個の予測値y0jの幅に一致し、関数fが式4である場合には、その幅は、予測対象データX0の条件によらずに常に一定となる。その結果、図7(C)に示す確率密度分布の裾野が必要以上に広がってしまう場合がある。しかしながら、上述のように、類似度wjの小さい過去実績データ(X、y)を除外することによって、確率密度分布の裾野が過剰に拡がることが防止され、予測対象データX0における予測値y0の分布形状の特徴が顕著に表現される。
次に、出力値予測装置Sは、演算制御部1の信頼性指標算出部16によって、予測値y0に対する信頼の度合いを表す指標である信頼性指標Rを複数の観点から複数算出し、この算出した信頼性指標Rを記憶部4に記憶する(S16)。例えば、複数の信頼性指標Rの一つとして、信頼性指標算出部16は、条件的信頼性指標算出部161によって条件的信頼性指標を算出し、そして、複数の信頼性指標Rの一つとして、日数的信頼性指標算出部162によって日数的信頼性指標を算出する。
より具体的には、例えば、条件的信頼性指標算出部161は、条件的類似度wの平均値を信頼性指標R(条件的信頼性指標RC)として算出する。これは、条件的類似度の平均値が大きいということは、それだけ、過去実績データ(X、y)の中に、予測対象データX0に条件的に類似したデータが多く含まれること意味し、そのような過去実績データ(X、y)に基づいて求められた予測値y0の信頼性も高いと考えられるからである。条件的類似度wは、条件的データと予測対象データX0との類似度であり、その平均値(条件的信頼性指標RC)は、例えば、式11によって定義される。前記条件的データは、過去実績データ(X、y)におけるデータ項目のうちの出力値y(予測値y0)に影響を与える所定のデータ項目のデータであり、この条件的データは、例えば、予測モデルの生成に用いられたデータ項目のデータの全部または一部であってよく、また例えば、データ項目の中には、非線形であるために前記予測モデルに組み込むことが難しいデータ項目もあることから、この条件的データは、予測モデルの生成に用いられたデータ項目のデータの全部または一部に、予測モデルの生成に用いられたデータ項目以外のデータ項目のデータが追加されてよい。
また例えば、条件的信頼性指標算出部161は、条件的類似度wの平均値の関数を条件的信頼性指標RCとしてもよい。前記式11によって条件的信頼性指標RCが定義されてもよいが、この式11による値は、0≦wj≦1である場合には0≦RC≦1となるが、条件的類似度wjにこのような範囲の制限がない場合には、一般に、0以上であって、上限がない。ユーザは、条件的類似度wの平均値の大小で信頼性の程度を過去の経験から相対的に判断することもできるが、このような経験的な判断となるので、条件的信頼性指標RCは、0≦RC≦1となるような条件的類似度wの平均値の関数とされる。このような条件的類似度の平均値の関数(条件的信頼性指標RC(RCa〜RCc))は、例えば、式12−1〜式12−3のいずれか1つによって定義される。
ここで、c
1は、正の実数の調整パラメータであり、c
2は、実数(負の値でもよい)の調整パラメータである。
このように信頼性指標R、ここでは条件的信頼性指標RCを所定の数値範囲内に収まるように変換するので、適切に提示部3に提示することが可能となる。
また例えば、日数的信頼性指標算出部162は、日数的類似度wDの平均値を信頼性指標R(日数的信頼性指標RD)として算出する。これは、日数的類似度wDの平均値が大きいということは、それだけ、過去実績データ(X、y)の中に、予測対象データX0に日数的に類似したデータ(直近のデータ)が多く含まれること意味し、そのような過去実績データ(X、y)に基づいて求められた予測値y0の信頼性も高いと考えられるからである。日数的類似度wDは、前記予測モデルを求める場合に用いられた過去実績データ(X,y)を取得した取得日δj(j=1〜M)と予測対象データy0における予測日δ0との類似度であり、例えば、式13−2によって定義され、その平均値(日数的信頼性指標RD)は、式13−1によって定義される。
また例えば、日数的信頼性指標算出部162は、日数的類似度wDの平均値の関数を日数的信頼性指標RDとしてもよい。前記式13−1によって日数的信頼性指標RDが定義されてもよいが、この式13−1による値は、0≦wDj≦1である場合には0≦RD≦1となるが、日数的類似度wDjにこのような範囲の制限がない場合には、一般に、0以上であって、上限がない。ユーザは、日数的類似度wDの平均値の大小で信頼性の程度を過去の経験から相対的に判断することもできるが、このような経験的な判断となるので、日数的信頼性指標RDは、0≦RD≦1となるような日数的類似度wDの平均値の関数とされる。このような日数的類似度wDの平均値の関数(日数的信頼性指標RD(RDa〜RDc))は、例えば、式14−1〜式14−3のいずれか1つによって定義される。
ここで、c
1は、正の実数の調整パラメータであり、c
2は、実数(負の値でもよい)の調整パラメータである。
このように信頼性指標R、ここでは日数的信頼性指標RDを所定の数値範囲内に収まるようにスケーリングするので、適切に提示部3に提示することが可能となる。このように日数的信頼性指標算出部162は、信頼性指標Rを所定の数値範囲内に収まるようにスケーリングするスケーリング部の一例としても機能する。以下の例でも同様である。
また例えば、条件的信頼性指標算出部161(または日数的信頼性指標算出部162)は、上述の条件的類似度wと日数的類似度wDとの積の平均値を信頼性指標R(条件的日数的信頼性指標RCD)として算出する。これは、条件的類似度wと日数的類似度wDの積の平均値が大きいということは、それだけ、過去実績データ(X、y)の中に、予測対象データX0に条件的にも日数的にも類似したデータが多く含まれること意味し、そのような過去実績データ(X、y)に基づいて求められた予測値y0の信頼性も高いと考えられるからである。このような条件的類似度wと日数的類似度wDとの積の平均値(条件的日数的信頼性指標RCD)は、式15によって定義される。
また例えば、条件的信頼性指標算出部161(または日数的信頼性指標算出部162)は、上述の式11に対する式12(式12−1〜式12−3)や上述の式13−1に対する式14(式14−1〜式14−3)と同様の事情により、上述の条件的類似度wと日数的類似度wDとの積の平均値の関数を条件的日数的信頼性指標RCDとしてもよい。このような条件的日数的信頼性指標RCDは、例えば、式15を式12や式14のように表すことによって定義される。
また例えば、条件的信頼性指標算出部161(または日数的信頼性指標算出部162)は、前記条件的類似度wが上位一定量以内となる過去実績データ(X、y)を抽出し、この抽出された過去実績データ(X、y)に対する日数的類似度wDの平均値を信頼性指標R(上位条件日数的信頼性指標RD1)として算出する。上位一定量以内の条件的類似度wとは、例えば、上位から所定の個数までの条件的類似度w(例えば上位100個以内の条件的類似度w等)や上位から所定の割合までの前記条件的類似度w(例えば上位3割以内の条件的類似度w等)である。これは、この平均値が大きいということは、それだけ、予測対象データX0に条件的に類似した過去実績データ(X、y)の中に、予測対象データX0に日数的に類似したデータが多く含まれること意味し、そのような過去実績データ(X、y)に基づいて求められた予測値y0の信頼性も高いと考えられるからである。このような上位条件日数的信頼性指標RD1は、例えば、式16によって定義される。
ここで、Ω
cは、条件的類似度wが上位一定量以内となる過去実績データ(X、y)の集合であり、条件的類似度wが大きい方から抽出する過去実績データ(X、y)の個数をNcとし、条件的類似度wが大きい方からNc個目の条件的類似度の値をωとすると、Ω
cは、{j|w
j≧ω}である(Ω
c={j|w
j≧ω})。
また例えば、条件的信頼性指標算出部161(または日数的信頼性指標算出部162)は、上述の式11に対する式12(式12−1〜式12−3)や上述の式13−1に対する式14(式14−1〜式14−3)と同様の事情により、前記条件的類似度wが上位一定量以内となる過去実績データ(X、y)に対する日数的類似度wDの平均値の関数を上位条件日数的信頼性指標RD1としてもよい。このような上位条件日数的信頼性指標RD1は、例えば、式16を式12や式14のように表すことによって定義される。
また例えば、日数的信頼性指標算出部162(または条件的信頼性指標算出部161)は、前記日数的類似度wDが上位一定量以内となる過去実績データ(X、y)を抽出し、この抽出された過去実績データ(X、y)に対する条件的類似度wの平均値を信頼性指標R(上位日数条件的信頼性指標RC1)として算出する。上位一定量以内の日数的類似度wDとは、例えば、上位から所定の個数までの日数的類似度wD(例えば上位100個以内の日数的類似度wD等)や上位から所定の割合までの前記日数的類似度wD(例えば上位3割以内の日数的類似度wD等)である。これは、この平均値が大きいということは、それだけ、予測対象データX0に日数的に類似した過去実績データ(X、y)の中に、予測対象データX0に条件的に類似したデータが多く含まれること意味し、そのような過去実績データ(X、y)に基づいて求められた予測値y0の信頼性も高いと考えられるからである。このような上位日数条件的信頼性指標RC1は、例えば、式17によって定義される。
ここで、Ω
Dは、日数的類似度w
Dが上位一定量以内となる過去実績データ(X、y)の集合であり、日数的類似度w
Dが大きい方から抽出する過去実績データ(X、y)の個数をN
Dとし、日数的類似度w
Dが大きい方からN
D個目の条件的類似度の値をωとすると、Ω
Dは、{j|w
Dj≧ω}である(Ω
D={j|w
Dj≧ω})。
また例えば、日数的信頼性指標算出部162(または条件的信頼性指標算出部161)は、上述の式11に対する式12(式12−1〜式12−3)や上述の式13−1に対する式14(式14−1〜式14−3)と同様の事情により、前記日数的類似度wDが上位一定量以内となる過去実績データ(X、y)に対する条件的類似度wの平均値の関数を上位日数条件的信頼性指標RC1としてもよい。このような上位日数条件的信頼性指標RC1は、例えば、式17を式12や式14のように表すことによって定義される。
また例えば、条件的信頼性指標算出部161(または日数的信頼性指標算出部162)は、前記条件的類似度wまたは前記条件的類似度wと日数的類似度wDの積が所定の閾値以上となる過去実績データ(X、y)の個数を信頼性指標R(閾値以上信頼性指標RN)として算出する。これは、この個数が大きいということは、それだけ、過去実績データ(X、y)の中に、予測対象データX0に条件的に類似したデータまたは条件的にも日数的にも類似したデータが多いこと意味し、そのような過去実績データ(X、y)に基づいて求められた予測値y0の信頼性も高いと考えられるからである。このような閾値以上信頼性指標RNは、例えば、式18によって定義される。
ここで、Mは、過去実績データ(X、y)の総数である。
また例えば、条件的信頼性指標算出部161(または日数的信頼性指標算出部162)は、上述の式11に対する式12(式12−1〜式12−3)や上述の式13−1に対する式14(式14−1〜式14−3)と同様の事情により、前記条件的類似度wまたは前記条件的類似度wと日数的類似度wDの積が所定の閾値以上となる過去実績データ(X、y)の個数の関数を閾値以上信頼性指標RNとしてもよい。このような閾値以上信頼性指標RN(RNa〜RNc)は、例えば、式19−1〜式19−3によって定義される。
ここで、c
1は、正の実数の調整パラメータであり、c
2は、実数(負の値でもよい)の調整パラメータである。
そして、出力値予測装置Sは、演算制御部1によって、処理S15でばらつき算出部15によって算出された予測値y0のばらつき、および、処理S16で信頼性指標算出部16によって算出された複数の信頼性指標Rを提示部3に提示し(S17)、処理が終了される。ここで、図7(B)または図7(C)を見ると分かるように、予測値y0のばらつきには、予測値y0も含まれ、提示部3には、予測値y0も提示されている。なお、演算制御部1は、予測値y0のばらつきを上記のように表示するだけでなく、予測値y0のばらつきの中における所定の予測値y0、例えば、確率密度分布P(y0)の最も大きい予測値y0の値も提示部3に提示してもよい。
本実施形態では、このように第1実施形態の出力値予測装置Sが動作することによって、M個の過去実績データ(X、y)から算出されたM個の誤差パラメータαj(j=1〜M)を用いることで、予測対象データX0の予測値y0jがM通り算出され、そして、予測対象データX0との類似度wjに従って予測値y0jに対する重み付き度数Fwが算出される。さらに、重み付き度数Fwから確率密度分布P(y0)が算出される。このため、予測値y0のばらつきにおける分布の態様にかかわらず、過去実績データ(X、y)と予測対象データX0との類似性が考慮された予測対象データX0における予測値y0のばらつきが高精度に求められる。したがって、出力値予測装置Sは、予測値y0のばらつきを提示することができる。そして、予測値y0のばらつきが提示部3に提示されるので、ユーザは、予測値y0のばらつきを知ることができ、予測値y0に基づいて操作や判断等を行う場合に予測値y0のばらつきも考慮することが可能となる。
そして、以上、説明したように、第1実施形態における出力値予測装置Sでは、予測モデルに予測対象データX0を用いることによって予測値y0のばらつきが求められ、この予測値y0のばらつきに対する複数の信頼性指標Rが求められ、そして、これら求められた予測値y0のばらつきおよび複数の信頼性指標Rが提示される。このように本実施形態における出力値予測装置Sは、予測値y0に対し、複数の観点から複数の信頼性指標Rを求め、この求めた複数の信頼性指標Rを提示することができる。このため、ユーザは、これら提示された複数の信頼性指標Rを参照することによって、この求められた予測値y0のばらつきに対し、複数の観点から評価することができ、予測値y0に基づく今後の行動の決定をこれら複数の観点から合理的に判断することが可能となる。
そして、第1実施形態の出力値予測装置Sでは、複数の信頼性指標Rとして、条件的信頼性指標RCおよび日数的信頼性指標RDを提示することができる。このため、ユーザは、条件的信頼性指標RCを参照することによって予測対象データX0と過去実績データ(X、y)との条件的な類似性を判断することができ、予測値y0のばらつきをこの観点から評価することができ、そして、日数的信頼性指標RDを参照することによって予測対象データX0と過去実績データ(X、y)との日数的な類似性を判断することができ、予測値y0のばらつきをこの観点から評価することができる。このようにユーザは、予測対象データX0が過去によくあったケース(事例)であるか否かの点と、最近もよくあるケースであるか否かの点(以前は多かったが最近は少ないケースであるか否かの点)とを個別に(分離して)解釈することが可能である。このため、予測値y0に基づく今後の行動の決定をこれら条件的な観点と日数的な観点とから合理的に判断することが可能となる。前記決定を例えば条件変化によるリスクや例えば日数的な経時変化によるリスクを考慮した上で判断することが可能となる。
ここで、本実施形態では、条件的信頼性指標RCとしては、上述の式11または式12の条件的信頼性指標RC、上述の式15等の条件的日数的信頼性指標RCDおよび上述の式18または式19の閾値以上信頼性指標RNが挙げられる。また、日数的信頼性指標RDとしては、上述の式13または式14の日数的信頼性指標RD、上述の式16等の上位条件日数的信頼性指標RD1、および、上述の式17等の上位日数条件的信頼性指標RC1が挙げられる。特に、前記条件的信頼性指標RCおよび条件的日数的信頼性指標RCDを提示部3に提示するだけで、予測値y0に基づく今後の行動の決定を条件的な観点と日数的な観点とから合理的に判断することができる。あるいは、前記閾値以上信頼性指標RNおよび条件的日数的信頼性指標RCDを提示部3に提示するだけで、予測値y0に基づく今後の行動の決定を条件的な観点と日数的な観点とから合理的に判断することができる。これは、前記条件的信頼性指標RCや前記閾値以上信頼性指標RNの値が大きい場合に、条件的日数的信頼性指標RCDが小さい場合には、予測対象データX0と日数的に類似した条件が最近は少ないことを意味するからである。
なお、上述の第1実施形態では、誤差パラメータαを求めてから予測値y0を求めたが、似たような条件であれば、すなわち、データ項目が似ていれば、似たような出力yが得られるという経験則が成り立つ場合には、予測対象データX0の予測値y0を次の式20による重み付き平均によって求めてもよい。
また、上記式20のように予測対象データX0の予測値y0を1点で予測するのではなく、分布(確率密度分布)として予測する場合には、上述の式3に代え、次の式21を用い、上述した以降の演算工程を実行し、y0jの重み付きの度数分布を求めることによって、分布(確率密度分布)を求めてもよい。
次に、別の実施形態について説明する。
(第2実施形態)
本実施形態の出力値予測装置Sは、種々の場合に適用可能であり、例えば、次の場合にも適用することができる。すなわち、例えば、鉄鋼製品の製造や化学製品の製造のように、比較的大規模な製造プラントで様々な製造プロセスを経て製造される製品では、例えば投入量、操作入力量および時間経過等に応じて、各製造プロセスにおける出力値や製品に直結する最終プロセスの出力値が刻々と変化することが多い。例えば、鉄鋼製品の製造プロセスにおいて、トピードカー内の溶銑温度と経過時間との関係、取鍋内の溶鋼温度と経過時間との関係、転炉吹錬における溶鋼中炭素濃度と吹込酸素積算値との関係、および、転炉吹錬における溶鋼温度と吹込酸素積算値との関係等が挙げられる。
図9は、物体の温度降下量と経過時間との関係を示す図である。大気中に放置された物体の温度降下量(初期温度からの偏差)yと経過時間(温度を測定した時間)tとの関係を各過去実績データについて○でプロットした場合に、図9に示す結果であったと仮定する。ここで、所定の時刻t0における温度降下量y(t0)を予測する際に、時刻t0付近の過去実績データ(X、y)を用いることによって確率密度分布を求める場合には、次の問題が生じ得る。すなわち、第1に、過去実績データ(X、y)が少ない(あるいは存在しない)時間領域では、活用可能なデータが非常に少なく、活用されるデータが過去実績データ(X、y)の一部でしかない。このため、予測対象データの温度降下量y(t0)の分布を高精度に予測することが困難である。そして、第2に、予測対象データと類似度の大きい過去実績データ(X、y)が前記所定の時刻t0付近にあるとは限らず、時刻t0から離れた処に予測対象データX0と類似度の大きい過去実績データ(X、y)があった場合に、その過去実績データ(X、y)が活用されない。
そこで、このような問題に対し、図9に細破線によって過去実績データ(X、y)の一部について示すように、各過去実績データ(X、y)における温度降下量yの経過温度tとの関係を表す予測モデルを構築し、各過去実績データ(X、y)を所定の時刻t0に投影することによって(すなわち、構築した予測モデル;yj(t)=f(Zj、Θ、αj、t)の時刻t0における温度降下量y(t0)を求めることによって)、所定の時刻t0から離れた過去実績データ(X、y)も予測値y(t0)における確率密度分布の推定に活用することができ、予測対象データの予測値y(t0)のばらつきをより高精度に求めることが可能となる。すなわち、このケースに第1実施形態の出力値予測装置Sを用いることによって、予測対象データの予測値y(t0)のばらつきをより高精度に求めることが可能となる。すなわち、第1実施形態の出力値予測装置Sでは、予測モデルは、過去実績データ(X、y)に基づいて求められる任意のモデルであったが、第1実施形態の出力値予測装置Saでは、予測モデルは、過去実績データ(X、y)に基づいて求められ、所定の基準時点からの経過時間を入力変数に含むモデルである。なお、図9には、予測モデル;yj(t)=f(Zj、Θ、αj、t)が太破線によって示されている。
ここで、予測値y0を予測する場合に、例えば物理法則や経験則等によって、この予測値y0へ与える影響の仕方(入力の変化に対する出力の変化の仕方、入力に対する出力の傾向)が分かっている要因zと、この予測値y0へ与える影響の仕方が分かっていない要因zとが存在すると考えられるが、第1実施形態における誤差パラメータは、予測値y0へ与える影響の仕方が分かっている要因Zの一部を含む要因Zに起因するものとして扱われている。このため、第1実施形態では、予測値y0に用いる過去実績データXに出力yの傾向が異なる過去実績データXが含まれていたとしても排除することがでず、好ましくないこの過去実績データXも含めてばらつきを求めることになる。そこで、第2実施形態の出力予測装置Saでは、注目すべきは、前記第1モデルfが、予め既知の所定の関係を用いて導かれる出力変数yと入力変数Zとの第1関係であり、入力変数Zの入力値zは、予測値y0に影響を与える要因zから予測値y0へ与える影響の仕方が分かっている要因zを抽出し、この抽出した要因zを第1モデルfに与えることによって得られる値が、誤差パラメータαの基準であることである。前記予め既知の所定の関係は、例えば、予め既知の物理法則、予め既知の経験則、予め統計的に求められた関係および実験データを説明するための予め求められた実験式等のうちの少なくとも1つを挙げることができる。予め既知とは、予測値y0を求める演算処理中に求められてもよく、要は、当該所定の関係を使用する前に求められていればよい。このように構成することによって、誤差パラメータαは、予め設定された所定の基準(基準点または基準線)からの差となり、前記所定の基準は、予測値y0に影響を与える要因zから抽出された所定の予測可能な要因zから生成され、より高精度に求められる。
以下、第2実施形態について、より具体的に説明するが、本実施形態の出力値予測装置Saは、さらに、上述した、大気中に放置された物体の温度降下量yと経過時間tとの関係について適用された場合について説明する。
本実施形態における出力値予測装置Saは、前記基本態様の出力値予測装置Sにおいて、パラメータを算出するパラメータ算出処理(S13)、予測値y0を算出する予測値算出処理(S14)および複数の信頼性指標Rの算出処理(S16)が以下のように処理を実行する点を除き、上述の第1実施形態における出力値予測装置Sと同様であるので、主に、この異なる点についてより詳細に説明する。
本実施形態では、信頼性指標算出部16は、第1実施形態で説明した条件的信頼性指標RC、第1実施形態で説明した日数的信頼性指標RD、および、予測時刻的信頼性指標RTのうちの少なくとも2つが算出され、これら算出された少なくとも2つの信頼性指標Rが提示部3に提示される。このため、演算制御部1の信頼性指標算出部16は、条件的信頼性指標算出部161および日数的信頼性指標算出部162に加えて、さらに、図1に破線で示すように、複数の信頼性指標Rの1つとして、所定の予測時刻的類似度に基づいて予測時刻的信頼性指標RTを算出する予測時刻的信頼性指標算出部163を備えている。前記所定の予測時刻的類似度は、予測値算出部14で生成された第2モデル(予測モデル)を求める場合に用いられた過去実績データを取得した取得時刻と前記所与のデータ(予測対象データX0)におけるにおける予測時刻との類似性の度合いを示す指標であり、例えば、例えば、予測値算出部14で生成された第2モデル(予測モデル)を求める場合に用いられた過去実績データを取得した取得時刻と前記所与のデータ(予測対象データX0)における予測時刻との類似度である。
図10は、第2実施形態における予測時刻の誤差パラメータの算出方法を説明するための図である。図10(A)は、過去実績データの基準線での誤差パラメータαj(tj)を示し、図10(B)は、予測対象データの基準線での誤差パラメータα(t0)を示す。図11は、第2実施形態の出力値予測装置における実測データ記憶部に記憶されるデータを示す図である。図12は、第2実施形態の出力値予測装置における中間データ記憶部に記憶されるデータを示す図である。図13は、第2実施形態の出力値予測装置における予測値のばらつきの算出手順を説明するための図である。図13(A)は、所定の時刻t0における予測値y(t0)を示し、図13(B)は、類似度wと出力の予測値y(t0)との関係を示し、その横軸は、類似度wであり、その縦軸は、予測値y(t0)である。
第2実施形態の出力値予測装置Saでは、記憶部4の実測データ記憶部41には、前記第1実施形態と同様に、表形式(テーブル形式)で過去実績データXおよび予測対象データX0が予め記憶されている。そして、第2実施形態では、過去実績データXおよび予測対象データX0は、温度降下量y、当該温度降下量yを測定した実測時刻t、および、温度降下量yに関与する要因データxを備えて構成される。温度降下量yは、前記所定の出力yに対応し、実測時刻tは、前記所定の出力yに関与する要因Xにおける要素(要因要素)xの1つと見ることができる。すなわち、前記所定の出力yに関与する要因Xには、少なくとも時間tを要素として含んでいる。実測時刻tの原点は、温度降下量y=0の時刻、すなわち、物体の初期温度の時刻(物体の温度の測定を開始した時刻)である。
そして、過去実績データ((X、t)、y)に基づいて予測対象データ(X0、t0)から出力値(予測値)y0の予測が開始されると、処理S11では、第1実施形態と同様に、距離算出部11は、本実施形態では、第1ないし第Nデータ項目空間において、過去実績データ(X、t)と予測対象データ(X0、t0)との間の距離djを算出し、この算出した距離djを記憶部4の中間データ記憶部42に記憶する。
次に、処理S12では、前記基本態様と同様に、類似度算出部12は、予測対象データ(X0、t0)と過去実績データ(X、t)との間における類似度wjを、第1ないし第M過去実績データ(X、t)のそれぞれについて算出し、この算出した各類似度wjを記憶部4の中間データ記憶部42に記憶する。
次に、処理S13では、本実施形態では、第1実施形態の式3に代えて、式22−1を用いることによって、パラメータ算出部13は、基準からの誤差を表す誤差パラメータαjを、第1ないし第M過去実績データ((X、t)、y)のそれぞれについて、算出し、この算出した各誤差パラメータαjを記憶部4の中間データ記憶部42に記憶する。なお、式22−1は、式21−2であってもよい。
ここで、y
j(t)は、実測時刻tによける温度降下量であり、ZおよびΘは、前記基本態様の式3と同様である。
本実施形態では、関数fが、所定の基準(基準値)を算出するための関数であって、誤差パラメータαj(t)が、この関数fによって与えられる(算出される)所定の基準(基準点または基準線)からの差である。そして、この関数fは、この予測値y(t0)へ与える影響の仕方(入力の変化に対する出力の変化の仕方、入力に対する出力の傾向)が分かっている要因zを入力変数Zとして備えており、例えば物理法則や経験則あるいは統計的な手法等によって与えられる。この関数fによって与えられる前記所定の基準値は、例えば、平均値、中央値、上限値および下限値等である。また、誤差パラメータαj(t)は、この予測値y(t0)へ与える影響の仕方が分かっていない要因に起因するものと扱われる。なお、予測値y0に影響を与える要因zから所定の予測可能な要因zを抽出した残余の要因は、この予測値y(t0)へ与える影響の仕方が分かっていない要因のみであることが好ましいが、設計者が要因zが予測可能である要因か否かを判別することができないために、予測可能な要因zが含まれていてもよい。すなわち、予測値y(t0)に関わる数値化可能な要因は、例えば物理法則や経験則あるいは統計的な手法等によって出力(予測値y(t0))へ与える影響の仕方が例えば主観的に分かっている第1要因と残余の第2要因とに分離され、第1要因にかかる予測値y(t0)へ与える影響を前記基準として前記物理法則や経験則あるいは統計的な手法等を用いることで比較的精度よく算出するとともに、予測値y(t0)のばらつきを前記基準からのばらつきとして捉え、より高精度に予測値y(t0)のばらつきを算出しようとするものである。言い換えれば、誤差パラメータαj(t)は、第1要因にかかるモデルにおけるモデル化に考慮されなかった第2要因に起因するパラメータである。
そして、関数fのΘは、第1実施形態で説明したように求めることができる既知のモデルパラメータであり、各過去実績データ((X、t)、y)からyj(tj)、Zjおよびtjも既知であるから、この処理S13において、誤差パラメータαj(t)が求められる。より具体的には、式22−1の場合では、図10(A)に示すように、第j番目の過去実績データ((Zj、tj)、yj(tj))(点Bj)と、基準線j;f(Zj、Θ、t)上の時刻tjにおける基準値(点Aj)との差として、式23で表されるように、誤差パラメータαj(t)が求められる。
なお、上述した本実施形態と第1実施形態との相違から分かるように、式22−1や式22−2は、関数fと誤差パラメータαj(t)とを合わせて改めて1つの関数f’と見なすことによって、yj(t)=f’(Zj、Θ、αj、t)となって第1実施形態の式3に対応する式となる。
このような各処理S11〜S13によって算出された重み付きユークリッド距離dj、類似度wjおよび誤差パラメータαjは、例えば、図11に示すように表形式(テーブル形式)によって中間データ記憶部42に記憶される。この図11に示す中間データテーブル52Aは、第1実施形態における図5に示す中間データテーブル52に相当し、この図5に示す中間データテーブル52と同様に、出力フィールド521、類似度計算用データフィールド522、出力予測用データフィールド523、重み付き距離フィールド524、類似度フィールド525および誤差パラメータフィールド526の各フィールドを備え、さらに、当該誤差パラメータαj(t)の基準となる、関数fによって与えられる基準線;f(Zj、Θ、t)を登録する基準線フィールド527、および、当該過去実績データ((X、t)、y)の時刻(実測時刻)tを登録する時間フィールド528を備えて構成され、過去実績データ((X、t)、y)ごとにレコードを備え、さらに、予測対象データX0のレコードを備えている。
次に、処理S14では、予測時刻t0を用い、他は、第1実施形態と同様に処理することによって、予測値算出部14は、前記処理S13で求めた予測モデルを用いて、予測対象データ(X0、t0)における予測時刻t0および第1ないし第Lデータ項目の各データ値z01〜z0Lに基づいて予測値y0(t0)を、前記処理S13で求めた各誤差パラメータαj(t)のそれぞれについて算出し、この算出した各予測値y01(t0)〜y0M(t0)をその類似度w1〜wMと対応付けて記憶部4の予測値記憶部43に記憶する。
ここで、注目すべきは、本実施形態では、過去実績データ((X、t)、y)における入力変数Xに対応する入力値xを第1モデルfに与えられることによって得られる値と入力変数Xの入力値xに対応する出力変数の出力値yとの差を、過去実績データ((X、t)、y)を得た時刻tにおける誤差パラメータα(αj(tj))として求め、この求めた差αj(tj)を予め与えられた所定の変換関係で予測対象データ(x0、y0)を予測したい予測時刻t0の値(αj(t0)に変換することによって誤差パラメータαとすることである。すなわち、図10(A)に示すように、前記処理S13で求めた実測時刻tjにおける誤差パラメータαj(tj)(;線分AjBj)に基づいて、予測時刻t0における誤差パラメータαj(t0)(;線分CjDj)が求められ、図10(B)に示すように、この予測時刻t0における誤差パラメータαj(t0)(;線分CjDj=線分EjFj)が各予測値y01(t0)〜y0M(t0)の算出に用いられる。したがって、各予測値y0j(t0)は、式25−1のように表される。なお、基準値からの差を加法的に表現する式22−1ではなく、基準からの差を乗法的に表現する式22−2が用いられる場合には、式25−1の代わりに式25−2となる。
この実測時刻tjにおける誤差パラメータαj(tj)に基づく予測時刻t0における誤差パラメータαj(t0)の演算は、前記基準の演算に用いた関数式fやそのプログラム、あるいは、定性的な知見や簡易モデル等の予め与えられた所定の変換関係が使用される。例えば、式24−1や式24−2等を使用することができる。
ここで、式24−1は、誤差パラメータαj(t)が時間に依存することなく一定であり、前記処理S13で求めた実測時刻tjにおける誤差パラメータαj(tj)が全時刻tにおける誤差パラメータαj(t)であることを示している。また、式24−2は、誤差パラメータαj(t)が関数fの出力値と比例関係にあることを示している。
また、式25−1は、各過去実績データ((X、t)、y)における基準線からの差(ばらつき)が予測時刻t0に写像され、これが予測時刻t0における基準線からの差に写像されていることを表している。すなわち、図10(A)に示すように、過去実績データデータ((X、t)、y)における基準線j;f(Zj、Θ、t)において、実測時刻tjにおける線分AjBjが予測時刻t0へ線分CjDjとして写像され、過去実績データ((X、t)、y)における基準線についてのこの線分CjDjが、図10(B)に示すように、予測データ(X0、t0)における基準線についての線分EjFjとして写像される。
なお、図10には、実測時刻tiの場合も示されており、実測時刻tiにおける誤差パラメータαi(ti)(;線分AiBi)に基づいて求められた予測時刻t0における誤差パラメータαj(t0)(;線分CjDj)が図示され、また、この誤差パラメータαj(t0)(;線分CiDi=線分EiFi)が予測時刻t0における基準値からの誤差パラメータαとされている様子も図示されている。
なお、処理S14においても、処理S13と同様に、式25−1または式25−2を表すテーブル、収束計算アルゴリズム、if−thenルール、ファジィ推論、ニューラルネットワークおよびJITモデル等を含む演算プログラムが用いられてもよい。
このような処理S14によって算出された各予測値y01(t0)〜y0M(t0)は、例えば、図12に示すように表形式(テーブル形式)によって予測値記憶部43に記憶される。この図12に示す予測値データテーブル53Aは、第1実施形態における図6に示す予測値データテーブル53に相当し、この図6に示す予測値データテーブル53と同様に、予測値フィールド531、出力予測用データフィールド532、誤差パラメータフィールド533および類似度フィールド534の各フィールドを備えて構成され、誤差パラメータαjごとにレコードを備えている。さらに、図12に示す予想値データテーブル53は、予測時刻t0を登録する予測時刻フィールド535を備えている。また、誤差パラメータフィールド533は、実測時刻tjにおける誤差パラメータα(tj)を登録するサブフィールド5331と予測時刻t0における誤差パラメータα(t0)を登録するサブフィールド5332と分かれている。
次に、処理S15では、第1実施形態と同様に、ばらつき算出部15は、前記処理S14で求めた各予測値y01(t0)〜y0M(t0)を用いて、予測値y0(t0)のばらつきを算出し、この算出した予測値y0(t0)のばらつきを記憶部4のばらつき記憶部44に記憶する。より具体的には、ばらつき算出部15は、図13(B)に示すように、縦軸に予測値y(t0)をとると共に横軸に類似度wをとって、まず、M個の各過去実績データ((X、t)、y)からそれぞれ算出されたM個の各誤差パラメータαj(j=1〜M)にそれぞれ対応するM個の各予測値y0j(t0)に対し、その類似度wjを対応させる。次に、ばらつき算出部15は、図13(B)の縦軸y(t0)の少なくとも各予測値y0j(t0)を含む範囲を有限個の複数の区間(クラス、等級)に分割し、各区間に含まれる予測値y0j(t0)の類似度wjを全て足し合わせることによって重み付き度数Fwを生成し、予測値y0(t0)のばらつきを表すヒストグラムを生成する。このヒストグラムが予測値y0(t0)のばらつきとされてもよいが、本実施形態では、さらに、ばらつき算出部15は、このヒストグラムの面積が1となるように正規化する。この正規化されたヒストグラムが予測対象データ(x0、t0)における予測値y0(t0)の確率密度分布(経験的な確率密度分布)とされ、予測値y0(t0)のばらつきとされる。あるいは、ばらつき算出部15は、さらに、面積を1に維持したままこのヒストグラムから上述と同様に前記曲線を求める。この曲線が予測対象データ(x0、t0)における予測値y0(t0)の確率密度分布とされ、予測値y0(t0)のばらつきとされる。
次に、処理S16では、第1実施形態と同様に、信頼性指標算出部16は、予測値y0に対する信頼性指標Rを複数の観点から複数算出し、この算出した信頼性指標Rを記憶部4に記憶する。より具体的には、信頼性指標算出部16は、第1実施形態と同様に、条件的信頼性指標算出部161によって、上述の条件的信頼性指標RC(関数を含む)、条件的日数的信頼性指標RCD(関数を含む)、上位条件日数的信頼性指標RD1(関数を含む)および閾値以上信頼性指標RN(関数を含む)のうちの1または複数を算出し、そして、第1実施形態と同様に、日数的信頼性指標算出部162によって、上述の日数的信頼性指標RD(関数を含む)および上位日数条件的信頼性指標RC1(関数を含む)のうちの1または複数を算出する。そして、本実施形態では、さらに、信頼性指標算出部16には、図1に破線で示す予測時刻的信頼性指標算出部163によって、予測時刻的信頼性指標RTを算出する。
例えば、予測時刻的信頼性指標算出部163は、予測時刻的類似度wTの平均値を信頼性指標R(予測時刻的信頼性指標RT)として算出する。これは、予測時刻的類似度wTの平均値が大きいということは、それだけ、過去実績データ(X、y)の中に、予測対象データX0に予測時刻に類似したデータ(経過時間が似ているデータ)が多く含まれること意味し、そのような過去実績データ(X、y)に基づいて求められた予測値y0の信頼性も高いと考えられるからである。予測時刻的類似度wTは、前記予測モデルを求める場合に用いられた過去実績データ(X,y)を取得した取得時刻tj(j=1〜M)と予測対象データy0における予測時刻t0との類似度であり、例えば、式26−2によって定義され、その平均値(予測時刻的信頼性指RT)は、式26−1によって定義される。
また例えば、予測時刻的信頼性指標算出部163は、予測時刻的類似度wTの平均値の関数を予測時刻的信頼性指標RTとしてもよい。前記式26−1によって予測時刻的信頼性指標RTが定義されてもよいが、この式26−1による値は、0≦wTj≦1である場合には0≦RT≦1となるが、予測時刻的類似度wTjにこのような範囲の制限がない場合には、一般に、0以上であって、上限がない。ユーザは、予測時刻的類似度wTの平均値の大小で信頼性の程度を過去の経験から相対的に判断することもできるが、このような経験的な判断となるので、予測時刻的信頼性指標RTは、0≦RT≦1となるような予測時刻的類似度wTの平均値の関数とされる。このような予測時刻的類似度wTの平均値の関数(予測時刻的信頼性指標RT(RTa〜RTc))は、例えば、式27−1〜式27−3のいずれか1つによって定義される。
ここで、c
1は、正の実数の調整パラメータであり、c
2は、実数(負の値でもよい)の調整パラメータである。
このように信頼性指標R、ここでは予測時刻的信頼性指標RTを所定の数値範囲内に収まるようにスケーリングするので、適切に提示部3に提示することが可能となる。このように予測時刻的信頼性指標算出部163は、信頼性指標Rを所定の数値範囲内に収まるようにスケーリングするスケーリング部の一例としても機能する。以下の例でも同様である。
また例えば、予測時刻的信頼性指標算出部163は、上述の条件的類似度wと予測時刻的類似度wTとの積の平均値を信頼性指標R(条件的予測時刻的信頼性指標RCT)として算出する。これは、条件的類似度wと予測時刻的類似度wTの積の平均値が大きいということは、それだけ、過去実績データ(X、y)の中に、予測対象データX0に条件的にも予測時刻的にも類似したデータが多く含まれること意味し、そのような過去実績データ(X、y)に基づいて求められた予測値y0の信頼性も高いと考えられるからである。このような条件的類似度wと予測時刻的類似度wTとの積の平均値(条件的予測時刻的信頼性指標RCT)は、式28によって定義される。
また例えば、予測時刻的信頼性指標算出部163は、上述の式11に対する式12(式12−1〜式12−3)や上述の式13−1に対する式14(式14−1〜式14−3)と同様の事情により、上述の条件的類似度wと予測時刻的類似度wTとの積の平均値の関数を条件的予測時刻的信頼性指標RCTとしてもよい。このような条件的予測時刻的信頼性指標RCTは、例えば、式28を式12や式14のように表すことによって定義される。
また例えば、予測時刻的信頼性指標算出部163は、上述の条件的類似度wと日数的類似度wDと予測時刻的類似度wTとの積の平均値を信頼性指標R(条件的日数的予測時刻的信頼性指標RCDT)として算出する。これは、条件的類似度wと日数的類似度wDと予測時刻的類似度wTの積の平均値が大きいということは、それだけ、過去実績データ(X、y)の中に、予測対象データX0に条件的にも日数的にもさらに予測時刻的にも類似したデータが多く含まれること意味し、そのような過去実績データ(X、y)に基づいて求められた予測値y0の信頼性も高いと考えられるからである。このような条件的類似度wと日数的類似度wDと予測時刻的類似度wTとの積の平均値(条件的予測時刻的信頼性指標RCT)は、式29によって定義される。
また例えば、予測時刻的信頼性指標算出部163は、上述の式11に対する式12(式12−1〜式12−3)や上述の式13−1に対する式14(式14−1〜式14−3)と同様の事情により、上述の条件的類似度wと日数的類似度wDと予測時刻的類似度wTとの積の平均値の関数を条件的日数的予測時刻的信頼性指標RCDTとしてもよい。このような条件的日数的予測時刻的信頼性指標RCDTは、例えば、式29を式12や式14のように表すことによって定義される。
また例えば、予測時刻的信頼性指標算出部163は、前記条件的類似度wが上位一定量以内となる過去実績データ(X、y)を抽出し、この抽出された過去実績データ(X、y)に対する予測時刻的類似度wTの平均値を信頼性指標R(上位条件予測時刻的信頼性指標RT1)として算出する。上位一定量以内の条件的類似度wとは、例えば、上位から所定の個数までの条件的類似度w(例えば上位100個以内の条件的類似度w等)や上位から所定の割合までの前記条件的類似度w(例えば上位3割以内の条件的類似度w等)である。これは、この平均値が大きいということは、それだけ、予測対象データX0に条件的に類似した過去実績データ(X、y)の中に、予測対象データX0に予測時刻的に類似したデータが多く含まれること意味し、そのような過去実績データ(X、y)に基づいて求められた予測値y0の信頼性も高いと考えられるからである。このような上位条件予測時刻的信頼性指標RT1は、例えば、式30によって定義される。
ここで、Ω
cは、条件的類似度wが上位一定量以内となる過去実績データ(X、y)の集合であり、条件的類似度wが大きい方から抽出する過去実績データ(X、y)の個数をNcとし、条件的類似度wが大きい方からNc個目の条件的類似度の値をωとすると、Ω
cは、{j|w
j≧ω}である(Ω
c={j|w
j≧ω})。
また例えば、予測時刻的信頼性指標算出部163は、上述の式11に対する式12(式12−1〜式12−3)や上述の式13−1に対する式14(式14−1〜式14−3)と同様の事情により、前記条件的類似度wが上位一定量以内となる過去実績データ(X、y)に対する予測時刻的類似度wTの平均値の関数を上位条件予測時刻的信頼性指標RT1としてもよい。このような上位条件予測時刻的信頼性指標RT1は、例えば、式30を式12や式14のように表すことによって定義される。
また例えば、予測時刻的信頼性指標算出部163は、前記予測時刻的類似度wTが上位一定量以内となる過去実績データ(X、y)を抽出し、この抽出された過去実績データ(X、y)に対する条件的類似度wの平均値を信頼性指標R(上位予測時刻条件的信頼性指標RC2)として算出する。上位一定量以内の予測時刻的類似度wTとは、例えば、上位から所定の個数までの予測時刻的類似度wT(例えば上位100個以内の予測時刻的類似度wT等)や上位から所定の割合までの前記予測時刻的類似度wT(例えば上位3割以内の予測時刻的類似度wT等)である。これは、この平均値が大きいということは、それだけ、予測対象データX0に予測時刻的に類似した過去実績データ(X、y)の中に、予測対象データX0に条件的に類似したデータが多く含まれること意味し、そのような過去実績データ(X、y)に基づいて求められた予測値y0の信頼性も高いと考えられるからである。このような上位予測時刻条件的信頼性指標RC2は、例えば、式31によって定義される。
ここで、Ω
Tは、予測時刻的類似度w
Tが上位一定量以内となる過去実績データ(X、y)の集合であり、予測時刻的類似度w
Tが大きい方から抽出する過去実績データ(X、y)の個数をN
Tとし、予測時刻的類似度w
Tが大きい方からN
T個目の条件的類似度の値をωとすると、Ω
Tは、{j|w
Tj≧ω}である(Ω
T={j|w
Tj≧ω})。
また例えば、予測時刻的信頼性指標算出部163は、上述の式11に対する式12(式12−1〜式12−3)や上述の式13−1に対する式14(式14−1〜式14−3)と同様の事情により、前記予測時刻的類似度wTが上位一定量以内となる過去実績データ(X、y)に対する条件的類似度wの平均値の関数を上位予測時刻条件的信頼性指標RC2としてもよい。このような上位予測時刻条件的信頼性指標RC2は、例えば、式31を式12や式14のように表すことによって定義される。
そして、出力値予測装置Saは、演算制御部1によって、処理S15でばらつき算出部15によって算出された予測値y0のばらつき、および、処理S16で信頼性指標算出部16によって算出された複数の信頼性指標Rを提示部3に提示し(S17)、処理が終了される。
本実施形態では、このように第2実施形態の出力値予測装置Saが動作することによって、予測値y0に影響を与える要因から所定の予測可能な要因を抽出することによって所定の基準が生成されることによって、予測値y0のばらつきにおける分布の態様にかかわらず、時間経過に従って出力が時々刻々と変化するプロセスにおける出力の予測値y0を求めることが可能となり、そして、この予測値y0のばらつきを求めることが可能となる。また、第2実施形態の出力値予測装置Saでは、過去実績データ((X、t)、y)が少ない(あるいは存在しない)時間領域でも、予測値y0を求めることが可能となり、予測値y0のばらつきも求めることが可能となる。また、第2実施形態の出力値予測装置Saでは、所定の時刻t0から離れた過去実績データ((X、t)、y)も予測値y0(t0)におけるばらつきの推定に活用することができ、予測対象データの予測値y0(t0)のばらつきをより高精度に求めることが可能となる。そして、第2実施形態の出力値予測装置Saでは、前記誤差パラメータαjは、過去実績データ((X、t)、y)を得た時刻tjにおける誤差パラメータα(tj)が所定の変換関係によって予測対象データ(x0、y0)を予測したい予測時刻t0の値に変換され、誤差パラメータαjとされるので、より適切に誤差パラメータが求められる。
そして、以上、説明したように、第2実施形態における出力値予測装置Saでは、予測モデルに予測対象データX0を用いることによって予測値y0のばらつきが求められ、この予測値y0のばらつきに対する複数の信頼性指標Rが求められ、そして、これら求められた予測値y0のばらつきおよび複数の信頼性指標Rが提示される。このように本実施形態における出力値予測装置Saは、予測値y0に対し、複数の観点から複数の信頼性指標Rを求め、この求めた複数の信頼性指標Rを提示することができる。このため、ユーザは、これら提示された複数の信頼性指標Rを参照することによって、この求められた予測値y0のばらつきに対し、複数の観点から評価することができ、予測値y0に基づく今後の行動の決定をこれら複数の観点から合理的に判断することが可能となる。
そして、第2実施形態の出力値予測装置Saでは、複数の信頼性指標Rとして、条件的信頼性指標RC、日数的信頼性指標RDおよび予測時刻的信頼性指標RTのうちの少なくとも2つを提示することができる。このため、ユーザは、条件的信頼性指標RCが提示される場合には、この条件的信頼性指標RCを参照することによって予測対象データX0と過去実績データ(X、y)との条件的な類似性を判断することができ、予測値y0のばらつきをこの観点から評価することができ、日数的信頼性指標RDが提示される場合には、この日数的信頼性指標RDを参照することによって予測対象データX0と過去実績データ(X、y)との日数的な類似性を判断することができ、予測値y0のばらつきをこの観点から評価することができ、そして、予測時刻的信頼性指標RTが提示される場合には、この予測時刻的信頼性指標RTを参照することによって予測対象データX0と過去実績データ(X、y)との予測時刻的な類似性を判断することができ、予測値y0のばらつきをこの観点から評価することができる。このようにユーザは、予測対象データX0が過去によくあったケース(事例)であるか否かの点と、最近もよくあるケースであるか否かの点(以前は多かったが最近は少ないケースであるか否かの点)と、よくある予測時刻のケースであるか否かの点とを個別に(分離して)解釈することが可能である。このため、予測値y0に基づく今後の行動の決定を提示部3に提示された複数の信頼性指標Rに応じた条件的な観点や日数的な観点や予測時刻的な観点から合理的に判断することが可能となる。前記決定を例えば条件変化によるリスクや例えば日数的な経時変化によるリスクや例えばプロセスの経過時間変化によるリスクを考慮した上で判断することが可能となる。
特に、プロセスの経過時間や操作入力量の積算値の大きさに応じて出力が時々刻々と変化するもの、例えば、トピードカー内の溶銑温度や、取鍋内の溶鋼温度や、転炉吹錬における溶鋼中炭素濃度、転炉吹錬における溶鋼温度や、溶銑の燐濃度や、溶鋼の燐濃度等では、過去にあまりないような搬送時間や、処理時間や操作入力量の積算値に対する値を予測する場合と、過去によくあった搬送時間や、処理時間や操作入力量の積算値に対する値を予測する場合とでは、予測値が持つ信頼性の程度が異なり、リスクを考慮したユーザ(オペレータ)の操作も通常異なる。このため、予測時刻的な類似性の観点から見た、予測時刻的信頼性指標RTの提示は、有効である。
ここで、本実施形態では、条件的信頼性指標RCとしては、上述の式11または式12の条件的信頼性指標RC、上述の式15等の条件的日数的信頼性指標RCD、上述の式18または式19の閾値以上信頼性指標RN、上述の式28等の条件的予測時刻的信頼性指標RCT、および、上述の式29等の条件的日数的予測時刻的信頼性指標RCDTが挙げられる。また、日数的信頼性指標RDとしては、上述の式13または式14の日数的信頼性指標RD、上述の式16等の上位条件日数的信頼性指標RD1、および、上述の式17等の上位日数条件的信頼性指標RC1が挙げられる。特に、前記条件的信頼性指標RCおよび条件的日数的信頼性指標RCDを提示部3に提示するだけで、予測値y0に基づく今後の行動の決定を条件的な観点と日数的な観点とから合理的に判断することができる。あるいは、前記閾値以上信頼性指標RNおよび条件的日数的信頼性指標RCDを提示部3に提示するだけで、予測値y0に基づく今後の行動の決定を条件的な観点と日数的な観点とから合理的に判断することができる。これは、前記条件的信頼性指標RCや前記閾値以上信頼性指標RNの値が大きい場合に、条件的日数的信頼性指標RCDが小さい場合には、予測対象データX0と日数的に類似した条件が最近は少ないことを意味するからである。また、予測時刻的信頼性指標RTとしては、上述の式26または式27の予測時刻的信頼性指標RT、上述の式30等の上位条件予測時刻的信頼性指標RT1および上述の式31等の上位予測時刻条件的信頼性指標RC2が挙げられる。特に、前記条件的信頼性指標RCおよび条件的予測時刻的信頼性指標RCTを提示部3に提示するだけで、予測値y0に基づく今後の行動の決定を条件的な観点と予測時刻的な観点とから合理的に判断することができる。あるいは、前記閾値以上信頼性指標RNおよび条件的予測時刻的信頼性指標RCTを提示部3に提示するだけで、予測値y0に基づく今後の行動の決定を条件的な観点と予測時刻的な観点とから合理的に判断することができる。これは、前記条件的信頼性指標RCや前記閾値以上信頼性指標RNの値が大きい場合に、条件的予測時刻的信頼性指標RCTが小さい場合には、予測対象データX0と予測時刻的に類似した条件が最近は少ないことを意味するからである。
また、第2実施形態の出力値予測装置Saでは、図10から分かるように、互いに異なる複数の時刻tにおける予測値y0(t)を求めることができ、予測値y0(t)のばらつきも求めることが可能である。したがって、各時刻tにおける予測値y0(t)のばらつきを比較することによって、最もリスクの少ない処理終了タイミングを決定することが可能となる。例えば、鉄鋼製品の製造プロセスの加熱炉において、鋼材が単に目標通りに加熱されたか否かだけではなく、温度外れの確率も考慮した上で、リスクの小さいタイミングで加熱処理を終了させることが可能となる。また例えば、転炉吹錬では、溶鋼温度や溶鋼中成分が目標から外れる確率を考慮した上で、リスクの少ないタイミングで吹錬を終了させることが可能となる。この転炉吹錬の場合では、図14の横軸が吹錬吹込酸素量の積算値とされる。
また、高精度に求めるためには比較的演算処理量が通常多くなるが、第2実施形態の出力値予測装置Saでは、出力(予測値y(t0))に関わる数値化可能な要因Zが、出力(予測値y(t0))へ与える影響の仕方が主観的に分かっている第1要因zと残余の第2要因zとに分離されているので、基準とされる第1要因zにかかる出力のみより高精度に演算すればよく、またこの結果を保存することによって、第1要因zにかかる前記演算を以後実行する必要がない。このため、予測値y(t0)のばらつきは、比較的少ない演算処理量で求めることが可能であり、より簡易な計算機によって演算可能となる。さらに、基準線からの誤差パラメータαj(t)を所定の時間間隔で予め演算して保存しておくことによって、より少ない演算処理量で、またさらにより簡易な計算機によって、予測値y(t0)のばらつきを求めることが可能となる。
次に、別の実施形態について説明する。
(第3実施形態)
鉄鋼製品の製造プロセスにおける、転炉吹錬終了後、転炉から取鍋に溶鋼が移され、溶鋼処理を経て、連鋳設備まで溶鋼が搬送されるプロセスでは、連鋳設備でスムーズに鋳造するために、取鍋が連鋳設備に到着した際に溶鋼温度が凝固温度より若干高めであることが好ましい。溶鋼温度が下がり過ぎると溶鋼が凝固してしまい好ましくなく、溶鋼温度が高いままだと鋳造速度を減速せざるを得ず好ましくない。各チャージによって、溶鋼成分、溶鋼量、取鍋の種類、取鍋の初期状態(耐火物の溶損状況、取鍋内部の温度分布(冷え具合))、転炉から受鋼する際に取鍋内にあらかじめ入れて置く合金量・合金種類などによって、温度降下量がばらつく。そのため、時々刻々と変化する溶鋼温度を確定的に一点で予測することは、困難である。したがって、当該チャージの取鍋内溶鋼温度のばらつきを精度よく推定することは、重要である。
第3実施形態は、所定の出力が転炉出鋼工程から溶鋼処理工程を経て連鋳工程に至るプロセスにおける取鍋内の溶鋼温度とされ、第2実施形態の出力値予測装置Saを適用したものであり、第3実施形態における出力値予測装置Sbは、転炉から取鍋に移された溶鋼が溶鋼処理設備に搬送されるまでにおいて、溶鋼の温度降下量について、確率密度分布を推定するものである。したがって、第3実施形態における出力値予測装置Sbは、第2実施形態の出力値予測装置Saにおいて、距離を算出する距離算出処理(S11)、パラメータを算出するパラメータ算出処理(S13)および予測値を算出する予測値算出処理(S14)が以下のように処理を実行する点を除き、第2実施形態における出力値予測装置Sと同様であるので、同様の点の説明を省略する。
図14は、第3実施形態の出力値予測装置における予測値記憶部に記憶されるデータを示す図である。図15は、第3実施形態の出力値予測装置における各予測値の確率密度分布を示す図である。図15の横軸は、分(min)単位で表す経過時間tであり、それらの縦軸は、度(℃)単位で表す温度降下量y(t)である。
第3実施形態の出力値予測装置Sbでは、記憶部4の実測データ記憶部41には、第1実施形態と同様に、表形式(テーブル形式)で過去実績データ((X、t)、y)および予測対象データ(X0、y0)が予め記憶されている。そして、第3実施形態では、過去実績データ((X、t)、y)および予測対象データ(X0、y0)は、温度降下量y、当該温度降下量yを測定した実測時刻t、および、温度降下量yに関与する要因データxを備えて構成される。温度降下量yは、前記所定の出力yに対応し、実測時刻tは、前記所定の出力yに関与する要因Xにおける要素(要因要素)xの1つと見ることができる。実測時刻tの原点は、温度降下量y=0の時刻、すなわち、物体の初期温度の時刻(物体の温度の測定を開始した時刻)である。温度降下量yに関与する要因Xのうちの類似度を求めるために用いられる要因における各要素(データ項目)xjiは、取鍋の受鋼回数、脱酸剤の種類、溶鋼炭素濃度、取鍋の空鍋状態、出鋼温度、凝固温度および操業班等の各項目である。ここで、本実施形態では、取鍋の受鋼回数は、例えば受鋼回数の平方根とされるように、非線形関数で変換される。脱酸剤の種類は、脱酸の強さに応じて数値化される。取鍋の空鍋状態(溶鋼が入っていない状態)は、放置時間、保温時間および保温後の放置時間等が非線形関数で数値化される。操業班は、班ごとに識別子が与えられる。
そして、過去実績データ((X、t)、y)に基づいて予測対象データ(X0、t0)から出力値(予測値)y0の予測が開始されると、処理S11では、式32で定義される距離djを用い、他は、第2実施形態と同様に処理することによって、距離算出部11は、本実施形態では、第1ないし第Nデータ項目空間において、過去実績データ(X、t)と予測対象データ(X0、t0)との間の距離djを算出し、この算出した距離djを記憶部4の中間データ記憶部42に記憶する。
ここで、f
d(x
ji,x
0i)は、x
jiとx
0iとが同じ場合に0をとり、x
jiとx
0iとが異なる場合に1をとる関数である。そして、本実施形態では、a
i(i=1〜N)=1とされる。Nは、データ項目数である。また、k<Nである。
当該チャージの操業条件と各過去チャージの操業条件とを比較する場合、例えば操業班や設備の番号(複数ある設備のうちで処理に供した設備の番号)等のように、引き算をすることができないデータ項目、あるいは、引き算自体に意味をもたないデータ項目もあり、式32で定義される距離djは、このようなデータ項目が同じか否かに意味があるデータ項目の場合に有効である。
また、類似度wjを計算する際のデータ項目として、日時や年月日を加えても良い。プロセスによっては、経年変化や季節変動要因など、月日が経過するに従って特性が変わるものがある。このような場合、操業条件が同一でも月日が離れていると結果が異なる虞がある。月日をデータ項目として加えることによって、古いデータの類似度wjを小さくし、経年変化を考慮した予測をすることができる。なお、年月日は、基準日(例えば1900年1月1日)からの経過日数で表現すればよい。
次に、処理S12では、第2実施形態と同様に、類似度算出部12は、予測対象データ(X0、t0)と過去実績データ(X、t)との間における類似度wjを、第1ないし第M過去実績データ((X、t)、y)のそれぞれについて算出し、この算出した各類似度wjを記憶部4の中間データ記憶部42に記憶する。
ここで、類似度wjとして、式2−1〜式2−3の代わりに、ここでは、式33で定義される類似度が用いられる。
ここで、μは、距離d
j(j=1〜M)の平均値であり、σは、距離d
j(j=1〜M)の標準偏差である。また、本実施形態では、g=1とされる。そして、本実施形態では、予め設定された所定の閾値よりも小さい類似度w
jは、0とされる。類似度w
jの低い過去実績データ((X、t)、y)を予め除去することによって、例えば重み付き度数F
wを算出するための演算処理量等の以下の演算処理量の軽減(演算処理時間の短縮)が可能となる。
次に、処理S13では、前記基本態様の式3に代えて、式22−1を用いることによって、パラメータ算出部13は、基準からの誤差を表す誤差パラメータαjを、第1ないし第M過去実績データ((X、t)、y)のそれぞれについて、算出し、この算出した各誤差パラメータαjを記憶部4の中間データ記憶部42に記憶する。式22−1における基準線;f(Zj、Θ、tj)は、例えば、特開2007−167858号公報に開示の手法や、特開2007−186762号公報に開示の手法を用いることができる。なお、式22−1に代え、式22−2が用いられてもよい。
次に、処理S14では、予測時刻t0を用い、予測値算出部14は、前記処理S13で求めた予測モデルを用いて、予測対象データ(X0、t0)における予測時刻t0および第1ないし第Lデータ項目の各データ値z01〜z0Lに基づいて予測値y0(t0)を、前記処理S13で求めた各誤差パラメータαj(t)のそれぞれについて算出し、この算出した各予測値y01(t0)〜y0M(t0)をその類似度w1〜wMと対応付けて記憶部4の予測値記憶部43に記憶する。
ここで、本実施形態では、実測時刻tjにおける誤差パラメータαj(tj)に基づく予測時刻t0における誤差パラメータαj(t0)の演算は、次のように行われる。
第1演算態様では、基準値(基準線)が上限値(上限線)とされ、この基準値からのばらつきが取鍋耐火物の初期温度のばらつきに依存(起因)すると見なさせる場合には、誤差パラメータαj(tj)は、式34によって予測時刻t0に写像される。
ここで、T
mj(t)は、式22における基準;T
mj(t)=f(Z
j、Θ、t)であり、第j番目の過去実績データの時刻tにおける溶鋼温度の基準値(上限値)であり、T
rj(0)は、第j番目の過去実績データにおける取鍋耐火物の初期温度(時刻t=0における温度)である。
第2演算態様では、基準値(基準線)が上限値(上限線)とされ、この基準値からのばらつきが溶鋼初期温度のばらつきに依存(起因)すると見なさせる場合には、誤差パラメータαj(tj)は、式35によって予測時刻t0に写像される。
第3演算態様では、基準値(基準線)が上限値(上限線)とされ、この基準値からのばらつきが熱伝達率のばらつきに依存(起因)すると見なさせる場合には、誤差パラメータαj(tj)は、式36によって予測時刻t0に写像される。
第4演算態様では、基準値(基準線)が上限値(上限線)とされ、この基準値からのばらつきが複数の事象に依存(起因)すると見なさせる場合には、誤差パラメータαj(tj)は、各事象における前記ばらつきに与える影響の度合いを重みνkとして、式37−1または式37−2によって予測時刻t0に写像される。なお、各重みνkの和は、所定の一定値を満たし、例えば、式38で表すように1となる。
ここで、式37−1は、例えば、第1ないし第3演算態様の各態様で求められた予測時刻t0における各誤差パラメータαj(t0)をαjk(t0)として、これら各誤差パラメータαj(t0)の加重平均である。
式37−2は、例えば、予測時刻t0へ写像する前の誤差パラメータαj(tj)に重みνkで先に重み付けを行ったものを、第1ないし第3演算態様の各態様で予測時刻t0へ写像し、これら写像されたαjk(t0)の和である。
すなわち、前記所定の変換関係は、複数の関係であり、誤差パラメータαj(t0)は、前記複数の関係からそれぞれ得られた各変換結果を加重平均することによって算出される。あるいは、前記所定の変換関係は、複数の変換要因に基づいて過去実績データを取得した時刻tjでの誤差パラメータαj(tj)を予測対象データ(x0、y0)を予測したい予測時刻t0の値に変換する関係であり、誤差パラメータαj(t0)は、複数の変換要因のそれぞれについて得られた各変換結果を加重平均することによって算出される。
このような重みνkは、例えば、ばらつきに与える影響の度合いに応じて予め設定される。例えば、ばらつきに与える影響の度合いが大きくなるに従って(支配的なばらつき要因に相当するものほど)、その誤差パラメータ要素αjkに対応する重みνkも大きくされ、誤差パラメータαjkのうち、ばらつきに最も影響を与えるパラメータ要素αjkに対応する重みνkが最も大きくされる。また例えば、この重みνkは、均等であって、各誤差パラメータαjkに対応する各重みνkが互いに同一であってもよい。すなわち、単純平均されることになる。前記加重平均には、各重みが等しい場合として、単純平均も含まれる。
このような処理S14によって算出された各予測値y01(t0)〜y0M(t0)は、例えば、図14に示すように表形式(テーブル形式)によって予測値記憶部43に記憶される。この図14に示す予測値データテーブル53Bは、第2実施形態における図12に示す予測値データテーブル53Aに相当し、この図6に示す予測値データテーブル53と同様に、予測値フィールド531、出力予測用データフィールド532、誤差パラメータフィールド533および類似度フィールド534の各フィールドを備えて構成され、誤差パラメータαjごとにレコードを備えている。さらに、図14に示す予想値データテーブル53Bは、予測時刻t0を登録する予測時刻フィールド535を備えている。また、誤差パラメータフィールド533は、実測時刻tjにおける誤差パラメータα(tj)を登録するサブフィールド5331と各事象ごとに設けられ、各事象における誤差パラメータαjk(t)を登録するサブフィールド5332(53321〜5332k)と分かれている。
次に、処理S15では、基本態様と同様に、ばらつき算出部15は、前記処理S14で求めた各予測値y01(t0)〜y0M(t0)を用いて、予測値y0(t0)のばらつき(例えばヒストグラムや確率密度分布等)を算出し、この算出した予測値y0(t0)のばらつきを記憶部4のばらつき記憶部44に記憶する。
図15には、10分ごとに温度降下量の予測値y0(t0)の確率密度分布が示されている。すなわち、予測時点が10分ごととされている。そして、図15には、基準線(上限線)f(Z0、Θ、t0)も示されている。また、図15では、確率密度分布の横軸(図7(C)の横軸に対応する)は、見易くするために、スケールが拡大されている。
そして、次に、処理S16では、第1実施形態や第2実施形態と同様に、信頼性指標算出部16は、予測値y0に対する信頼性指標Rを複数の観点から複数算出し、この算出した信頼性指標Rを記憶部4に記憶する。
次に、処理S17では、出力値予測装置Sbは、演算制御部1によって、処理S15でばらつき算出部15によって算出された予測値y0のばらつき、および、処理S16で信頼性指標算出部16によって算出された複数の信頼性指標Rを提示部3に提示し、処理が終了される。
このように動作することによって、第3実施形態の出力値予測装置Sbでは、転炉出鋼工程から溶鋼処理工程を経て連鋳工程に至るプロセスにおいて、チャージの取鍋内溶鋼温度を予測し、この予測した取鍋内溶鋼温度のばらつきをより高精度に求めることが可能となる。
そして、本実施形態の出力値予測装置Sbは、第1実施形態や第2実施形態と同様に、予測値y0に対し、複数の観点から複数の信頼性指標Rを求め、この求めた複数の信頼性指標Rを提示することができる。このため、ユーザは、これら提示された複数の信頼性指標Rを参照することによって、この求められた予測値y0のばらつきに対し、複数の観点から評価することができ、予測値y0に基づく今後の行動の決定をこれら複数の観点から合理的に判断することが可能となる。
なお、上述の第3実施形態では、所定の出力は、転炉出鋼工程から溶鋼処理工程を経て連鋳工程に至るプロセスにおける、取鍋内の溶鋼温度とされたが、所定の出力は、転炉出鋼工程から溶鋼処理工程を経て連鋳工程に至るプロセスにおける、タンディッシュ内の溶鋼温度とされてもよい。このように構成されることによって、転炉出鋼工程から溶鋼処理工程を経て連鋳工程に至るプロセスにおける、タンディッシュ内の溶鋼温度を予測し、この予測した予測値のばらつきを求めることが可能となる。
また、上述の第3実施形態において、所定の出力は、転炉工程における、吹錬吹込み酸素の積算量に応じた溶鋼成分または溶鋼温度とされてもよい。このように構成されることによって、転炉工程における、吹錬吹込み酸素の積算量に応じた溶鋼成分または溶鋼温度を予測し、この予測した予測値のばらつきを求めることが可能となる。
また、上述の第3実施形態において、所定の出力は、鋼材の加熱炉工程における、加熱時間または加熱熱量の積算量に応じた鋼材の鋼材温度とされてもよい。このように構成されることによって、鋼材の加熱炉工程における、加熱時間または加熱熱量の積算量に応じた鋼材の鋼材温度を予測し、この予測した予測値のばらつきを求めることが可能となる。
また、上述の第1ないし第3実施形態において、過去実績データXは、所定の一定期間内に生じた全ての実測データであってもよいし、この実測データを、層別に、すなわち、例えば製品の成分組成等のような所定の観点から分類しておき、予測対象データと同じ分類に属する過去実績データであってもよい。
また、上述の第1ないし第3実施形態において、前記距離算出部11は、機能的に、重み算出部を備え、前記重み算出部で算出された第A重みを用いて予測対象データと過去実績データとの所定の距離を、予測対象データの要因および過去実績データの要因に基づいて、複数の過去実績データのそれぞれについて算出するように構成されてもよい。
この重み算出部は、前記要因が前記所定の出力におけるばらつきの大きさに寄与する程度を第A重みとして前記要因について算出するものである。より具体的には、この重み算出部は、前記所定の出力におけるばらつきの大きさを第A出力変数とすると共に前記要因に関する変数を第A入力変数とした際に、複数の過去実績データに基づいて第A入力変数と第A出力変数との関係を表す第Aモデルを生成し、この第Aモデルに基づいて第A重みを算出するものである。この第Aモデルは、例えば、2個の変量や3個以上の変量を持つ関数式(単回帰式や重回帰式等の回帰式)によって表され、第A入力変数および第A出力変数から回帰計算によって求められる。この回帰計算としては、例えば、最小二乗法や部分最小二乗法(PLS, Partial Least Square)等が挙げられる。
ここで、要因が所定の出力におけるばらつきの大きさに寄与する程度は、要因が所定の出力におけるばらつきの大きさに大きく寄与する場合では、大きな値となり、要因が所定の出力におけるばらつきの大きさにあまり寄与しない場合では、小さな値となる。すなわち、所定の出力のばらつきの範囲(範囲の広狭)が要因の値に比較的依存する場合は、要因が所定の出力におけるばらつきの大きさに大きく寄与する場合であって、要因が所定の出力におけるばらつきの大きさに与える影響の大きさは、大きな値となり、所定の出力のばらつきの範囲(範囲の広狭)が要因の値に比較的依存しない場合は、要因が所定の出力におけるばらつきの大きさにあまり寄与しない場合であって、要因が所定の出力におけるばらつきの大きさに与える影響の大きさは、小さな値となる。言い換えれば、要因によって所定の出力のばらつきに与えられる影響の大きさに従って、第A重みの大きさが決定される。
また、前記重み算出部は、複数の過去実績データの個数に応じた第B重みを算出し、この第B重みを用いて前記第Aモデルを生成するものであってもよい。このように構成することによって、前記要因に含まれる誤差が前記第A重みへ与える影響を低減することができ、より精度よく第Aモデルを生成することができ、ひいては、より精度よく第A重みを算出することが可能となる。
また、前記重み算出部は、前記要因が前記所定の出力におけるばらつきの大きさに寄与する程度および前記要因が前記所定の出力における絶対値の大きさに寄与する程度を第A重みとして前記要因について算出するものであってもよい。このように構成することによって、前記要因による前記所定の出力のばらつきへ与える影響と、前記要因による前記所定の出力の絶対値へ与える影響とを考慮して第A重みaiを求めることができ、予測値のばらつきの精度が向上する。
また、第1ないし第3実施形態では、誤差パラメータαは、複数の関係からそれぞれ得られた各変換結果を加重平均することによって、または、複数の変換要因のそれぞれについて得られた各変換結果を加重平均することによって算出されたが、誤差パラメータαは、前記求めた差が複数に分割されて写像され、その後、それらの合計を求めることによって算出されてもよい。このような構成によっても、所定の変換関係が複数の事象に起因している場合でも、より適切に誤差パラメータを求めることが可能となる。
すなわち、第1ないし第3ばらつき要因(誤差パラメータαの要因)における誤差パラメータαへの影響度合いを示す第1ないし第3重みをν1(t)、ν2(t)およびν3(t)とし、これら第1ないし第3重みν1(t)、ν2(t)、ν3(t)は、任意の時刻tについて、式39を満たすものとする。
ここで、時刻tjにおけるばらつきαj(tj)が、各ばらつき要因ν1(t)、ν2(t)、ν3(t)によるばらつきに分離された場合、それぞれ、ν1(tj)×αj(tj)、ν2(tj)×αj(tj)、ν3(tj)×αj(tj)となる。言い換えれば、時刻tjにおいて、ν1(tj):ν2(tj):ν3(tj)の割合でばらつき、それらの合計が、時刻tjにおけるばらつきαj(tj)になったと考える。これは、式40によって表される。
ここで、第3実施形態のように、鉄鋼製品の製造プロセスにおける、転炉吹錬終了後、転炉から取鍋に溶鋼が移され、溶鋼処理を経て、連鋳設備まで溶鋼が搬送されるプロセスの場合では、第1に、取鍋耐火物の初期温度のばらつきは、時刻tjにおいて、ν1(tj)×αj(tj)であるから、誤差パラメータαj1(t0)は、式41によって予測時刻t0に写像される。
第2に、溶鋼初期温度のばらつき(溶鋼温度の測定誤差)は、時刻tjにおいて、ν2(tj)×αj(tj)であるから、誤差パラメータαj2(t0)は、式42によって予測時刻t0に写像される。
第3に、熱伝達率のばらつき(溶鋼と取鍋耐火物の熱伝達率)のばらつきは、時刻tjにおいて、ν3(tj)×αj(tj)であるから、誤差パラメータαj3(t0)は、式43によって予測時刻t0に写像される。
ここで、上記式43は、写像したい時刻t0を(〜ty/tj)(〜tyは式43では〜がtyの上である)倍した時刻における基準線(上限線)の値と、写像したい時刻t0における基準線(上限線)の値の差が誤差パラメータαj3(t0)であることを示している。
そして、式44に示すように、これら式41ないし式43を合計することによって、時刻tjのばらつきαj(tj)を時刻t0に写像した値αj(t0)が求められる。
なお、上述でも例示したが、上述の実施形態において、x、XおよびZについて、さらに、具体的な一例を挙げると、次の通りである。なお、この例では、Xは、xとZとを合わせたものである。
所定の容器に収容された所定の物体における温度の場合では、xは、物体(例えば液体の状態)の体積、容器の使用回数、前記物体の凝固温度、測温時間等を挙げることができ、Zは、例えば、前記物体の初期温度、容器の初期温度、物体の比熱・密度・体積、容器の比熱・密度・体積、前記物体と容器との接触面積、熱伝達率計算値(例えば物性値等から求められる)等を挙げることができる。
取鍋内の溶鋼温度の場合では、xは、例えば、取鍋の受鋼回数、脱酸剤の種類、溶鋼炭素濃度、取鍋の空鍋状態、取鍋搬送時間、出鋼温度、凝固温度、各種合金量、鋼種、操業班、処理日(例えば基準日1900年1月1日からの経過日数)等を挙げることができ、Zは、例えば、取鍋の種類、溶鋼炭素濃度、脱酸剤の種類、空鍋時間、保熱時間、出鋼温度、取鍋の受鋼回数、各種合金量、溶鋼量、溶鋼比熱、溶鋼密度、溶鋼熱伝導率、取鍋耐火物温度、取鍋耐火物比熱、取鍋耐火物密度、取鍋耐火物熱伝導率、取鍋形状等を挙げることができる。
また、タンディッシュ内の溶鋼温度の場合では、xは、例えば、取鍋の受鋼回数、脱酸剤の種類、溶鋼炭素濃度、取鍋の空鍋状態、タンディッシュ使用回数、取鍋搬送時間、出鋼温度、凝固温度、各種合金量、鋼種、操業班、溶鋼処理種類、処理日(例えば基準日1900年1月1日からの経過日数)、溶鋼処理時間、溶鋼処理における昇温量、鋳造時間等を挙げることができ、Zは、例えば、取鍋の種類、溶鋼炭素濃度、脱酸剤の種類、空鍋時間、保熱時間、出鋼温度、取鍋の受鋼回数、各種合金量、溶鋼処理後溶鋼温度、溶鋼処理における各種操作量、溶鋼量、溶鋼比熱、溶鋼密度、溶鋼熱伝導率、取鍋耐火物温度、取鍋耐火物比熱、取鍋耐火物密度、取鍋耐火物熱伝導率、取鍋形状、タンディッシュ耐火物温度、タンディッシュ耐火物比熱、タンディッシュ耐火物密度、タンディッシュ耐火物熱伝導率、タンディッシュ形状、取鍋搬送時間、鋳造時間等を挙げることができる。
また、転炉吹錬における溶鋼温度および溶鋼成分の場合では、xは、例えば、出鋼量、溶銑温度、溶銑成分(C、Si、Mn、P、S等)、吹止目標温度、吹止目標成分(目標溶鋼成分、C、Mn、P、S等)、溶銑配合率、各種副原料投入量、合金投入量、スラグ塩基度、スラグ量、送酸速度、炉回数、ランス回数、ランス高さ、休炉時間、サブランス測定温度、サブランス測定成分、処理日(例えば基準日1900年1月1日からの経過日数)、転炉号数、操業班、前チャージ情報、送酸量積算値等を挙げることができ、Zは、例えば、主原料(溶銑、冷銑、スクラップ)投入量、溶銑温度、溶銑成分、各種副原料投入量、各種副原料組成、合金投入量、送酸量、吹止目標成分、サブランス測定温度、サブランス測定成分、前チャージ情報、送酸量積算値等である。
第1ないし第3実施形態で説明したように、出力値予測装置S、Sa、Sbは、操業プロセスや製造プロセスの各プロセスにおける出力値や製品に直結する最終プロセスの出力値をばらつきと併せて予測することが可能であり、ここで、操業プロセスや製造プロセスに出力値予測装置S、Sa、Sbを適用した出力値予測システムの一構成例について、説明する。
図16は、出力値予測システムの構成を示すブロック図である。図16において、出力値予測システムは、操業プロセス・製造プロセス201から実績データを収集する実績データ収集装置101と、実績データ収集装置101で収集した実績データを過去実績データとして記憶する過去操業データ記憶装置105と、実績データ収集装置101で収集した過去実績データに基づいて誤差パラメータαを算出するパラメータフィッティング演算装置102と、パラメータフィッティング演算装置102で算出した誤差パラメータαを記憶するパラメータ推定値記憶装置106と、操業プロセス・製造プロセス201から予測対象データを収集する予測対象データ操業条件収集装置104と、予測対象データと各過去実績データとの類似度を算出する類似度演算装置108と、予測対象データ操業条件収集装置104で収集した予測対象データから前記算出した誤差パラメータαに基づいて予測対象データの出力値(予測値)を予測する予測対象データ出力予測演算装置103と、予測対象データ出力予測演算装置103で予測した予測対象データの出力値(予測値)と類似度演算装置108で算出した類似度に基づいて予測対象データの予測値の確率密度分布を算出する出力予測値確率密度分布推定装置107と、予測対象データの予測値に対する複数の信頼性指標を算出する信頼性指標演算装置109と、出力予測値確率密度分布推定装置107で算出した予測対象データの予測値の確率密度分布および信頼性指標演算装置109で算出された複数の信頼性指標を表示する確率密度分布表示装置110とを備えて構成される。
図16に示す出力値予測システムと図1に示す出力値予測装置Sとを対比すると、類似度演算装置108は、距離算出部11、類似度算出部12および中間データ記憶部42と略同様の機能を有し、パラメータフィッティング演算装置102は、パラメータ算出部13と略同様の機能を有し、予測対象データ出力予測演算装置103は、予測値算出部14および予測値記憶部43と略同様の機能を有し、出力予測値確率密度分布推定装置107は、ばらつき算出部15およびばらつき記憶部44と略同様の機能を有し、信頼性指標演算装置109は、信頼性指標算出部16と同様の略機能を有し、過去操業データ記憶装置105は、実績データ記憶部41と略同様の機能を有し、そして、パラメータ推定値記憶装置106は、中間データ記憶部42と略同様の機能を有している。
このような構成の出力値予測システムは、プロセスの実施中において、予測対象データを収集すると、この予測対象データにおける予測値およびその確率密度分布を求めることができ、そして、これらを表示することができる。このため、オペレータ等のユーザは、この予測対象データにおける予測値およびその確率密度分布に基づいて適切にプロセスを調整し、その実施を行うことが可能となる。
なお、上述の第1ないし第3実施形態では、の例で各種の信頼性指標が算出されたが、予測モデルは、任意のモデルでよい。例えば、予測モデルは、特開平9−256021号公報に開示されたモデルや、特開2003−231908号公報に開示されたモデルや、特開平2007−167858号公報に開示されたモデルや、特開2009−241139号公報に開示されたモデル等のモデルであってもよい。
図17は、スケーリングを行った信頼性指標の一具体例を示す図である。図18は、スケーリングを行った信頼性指標の他の一具体例を示す図である。図17および図18の横軸は、いわゆるチャージに付された識別子としてのチャージ番号であり、これらの縦軸は、信頼性指標Rである。図17に示す(A)の折れ線は、式11による条件的信頼性指標RCであり、図17に示す(B)の折れ線は、上述の式13による日数的信頼性指標RDであり、図17に示す(C)の折れ線は、上述の式26による予測時刻的信頼性指標RTである。図18に示す(A)の折れ線は、式11による条件的信頼性指標RCであり、図18に示す(B)の折れ線は、上述の式16等の上位条件日数的信頼性指標RD1であり、図18に示す(C)の折れ線は、上述の式30等の上位条件予測時刻的信頼性指標RT1である。なお、上位一定量は、上位10パーセントの割合である。
また、上述の第1ないし第3実施形態において、演算制御部1は、機能的に、複数の予測値y0に対する各信頼性指標Rを相対的に相互に比較するために、複数の信頼性指標Rのそれぞれを所定の基準でスケーリング(標準化)する図略のスケーリング部(標準化部)をさらに備え、提示部3は、予測値y0(上記例では予測値y0のばらつき)と前記スケーリング部でスケーリングされた複数の信頼性指標Rとを提示するように構成されてもよい。このような構成することによって、複数の信頼性指標Rのそれぞれを所定の基準でスケーリング(標準化)するので、複数の信頼性指標Rを相互に比較することが可能となる。また、スケーリングによってスケーリング後の信頼性指標Rを所定の範囲内に納めることも可能となる。
例えば、図17や図18に示すように、前記所定の基準として、各チャージに対する予測値y0の信頼性指標Rの平均値が0であってその標準偏差が1となるように、各信頼性指標Rは、スケーリング(標準化)される。この図17および図18に示す例では、12個のチャージのそれぞれに対する信頼性指標Rの平均値が0であって、その標準偏差が1となるように、各信頼性指標Rがスケーリングされる。すなわち、12個のチャージのそれぞれについて、その信頼性指標Rから平均値を減算し、その結果を標準偏差で除算することによって、スケーリングが実行される(スケーリング後の信頼性指標R=(スケーリング前の信頼性指標R−平均値)/標準偏差)。なお、前記所定の基準は、これに限定されるものではなく、最小値からの差を最大値と最小値との差で規格化するように、各信頼性指標Rは、スケーリングされてもよい(スケーリング後の信頼性指標R=(スケーリング前の信頼性指標R−最小値)/(最大値−最小値)。このようにスケーリングすることによってスケーリング後の信頼性指標Rを0から1までの範囲内に収めることもできる。
そして、スケーリング後の信頼性指標Rの数値を提示部3に提示してもよいが、図17や図18のようなグラフを提示部3に提示することによって、過去の予測値y0に対して今回の予測値y0の信頼性が相対的に一目で把握することも可能となる。例えば、前回の予測値y0に対する実績結果が外れたとし、その場合における信頼性指標Rも低かったとする。この場合において、今回の予測値y0に対しても全信頼性指標Rが低くなれば、ユーザは、今回の予測値y0も外れる可能性が高いと判断することができる。逆に例えば、前記場合において、今回の予測値y0に対して全信頼性指標Rが高くなれば、ユーザは、今回の予測値y0は信頼できると判断することができる。
あるいは、スケーリングの信頼性指標Rの数値のみを提示部3に提示してもよい。これによって例えば信頼性指標Rの数値が0である場合には、上記所定の基準によるスケーリングでは、ユーザは、過去有限個の過去実績データの中で平均的な信頼度であると判断することができ、また例えば信頼性指標Rの数値が正の大きい値であれば、過去有限個の過去実績データの中で比較的高い信頼度であると判断することができ、また例えば信頼性指標Rの数値が大きな負の値であれば、過去有限個の過去実績データの中で比較的低い信頼度であると判断することができる。
例えば、図17では、チャージ番号3における各信頼性指標Rにおいて、式11による条件的信頼性指標RC(折れ線(A))は、比較的大きく、上述の式13による日数的信頼性指標RD(折れ線(B))および上述の式26による予測時刻的信頼性指標RT(折れ線(C))は、比較的小さい。すなわち、これによって、ユーザは、予測対象データX0に条件的に類似する過去実績データ(X、y)は、比較的多いが、最近では少なく、そして、予測時刻も特異であることが見て取れ、総合的な信頼性は、低いと判断することができる。
また例えば、図17では、チャージ番号12における各信頼性指標Rにおいて、式11による条件的信頼性指標RC(折れ線(A))、上述の式13による日数的信頼性指標RD(折れ線(B))および上述の式26による予測時刻的信頼性指標RT(折れ線(C))は、それぞれ、比較的大きい。すなわち、これによって、ユーザは、総合的な信頼性は、高いと判断することができる。
また例えば、図18では、チャージ番号3における各信頼性指標Rにおいて、式11による条件的信頼性指標RC(折れ線(A))は、比較的大きく、上述の式16等の上位条件日数的信頼性指標RD1(折れ線(B))および上述の式30等の上位条件予測時刻的信頼性指標RT1(折れ線(C))は、比較的小さい。すなわち、これによって、ユーザは、予測対象データX0に条件的に類似する過去実績データ(X、y)は、比較的多いが、上位10パーセントの過去実績データ(X、y)は、最近のデータではなく、そして、予測時刻も今回と異なるものであることが見て取れ、総合的な信頼性は、低いと判断することができる。ユーザが仮に「最近1ヶ月は、それ以前と同じ製造条件であっても出力(例えば温度)が下側にずれる傾向にある」という知見を持っているとした場合に、式11による条件的信頼性指標RC(折れ線(A))が比較的大きくても、上述の式16等の上位条件日数的信頼性指標RD1が比較的小さければ、予測値y0に対し実際の出力値が下側にずれるリスクがあり、このリスクを大きめに考えて、製造条件を修正判断することができる。
また例えば、図18では、チャージ番号12における各信頼性指標Rにおいて、式11による条件的信頼性指標RC(折れ線(A))、上述の式16等の上位条件日数的信頼性指標RD1(折れ線(B))および上述の式30等の上位条件予測時刻的信頼性指標RT1(折れ線(C))は、比較的大きい。すなわち、これによって、ユーザは、総合的な信頼性は、高いと判断することができる。
なお、上述の実施形態において、図7(B)に示すヒストグラムから図8に示す上述した手法によって確率密度分布曲線が求められたが、次の手法によって、図7(B)に示すヒストグラムから確率密度分布曲線が求められてもよい。
図19は、図7(B)に示すヒストグラムから確率密度分布曲線を求める他の手法を説明するための図である。
この手法では、図7(B)に示すヒストグラム、すなわち、図19(A)に示すヒストグラムにおいて、まず、図19(B)ないし図19(D)に示すように、各区間の確率密度FwN(k)に対し、確率密度の総和が当該区間の確率密度FwN(k)であって当該区間Yk〜Yk+1の確率密度をピークとする正規分布が作成される。
より具体的には、図19(B)にハッチングを施して示す当該区間の確率密度FwN(k)が、図19(C)に示すように当該区間の前後における同数の区間(図19(C)に示す例では前後2個ずつの区間)に拡がっているとみなす。そして、平滑化後の当該区間の確率密度〜FwN(k)およびこの前後に拡がった各区間の確率密度〜FwN(k−2)、〜FwN(k−1)、〜FwN(k+1)、〜FwN(k+2)は、図19(D)に示すように、当該区間の確率密度FwN(k)に、平滑化するための所定の係数λを乗算することによってそれぞれ求められる。なお、上記〜FwNは、図19中の上に〜を付したFwNと同一である(以下同じ)。また、この図19(D)における〜付きFwN(k+i、k+j)は、当該区間k+jに対し、k+i番目の区間における平滑化後の確率密度を表す。
前記所定の係数λは、その総和が1であれば、任意に決定されてよい。ここでは、前記所定の係数λは、正規分布となるとともに、その総和が1となるように設定されている。なお、ここでは、正規分布を用いたが二項分布等の他の分布であってよい。係数λの総和を1とすることによって、平滑化後の確率密度の総和が当該区間の確率密度FwN(k)と等しくなる。例えば、平滑化後(ここでは正規分布化後)の確率密度〜FwN(k−2)を求めるために、当該区間の確率密度FwN(k)に乗算する係数λ−2は、0.02とされ(λ−2=0.02、正規分布化後の確率密度〜FwN(k−2)=λ−2×FwN(k))、正規分布化後の確率密度〜FwN(k−1)を求めるために、当該区間の確率密度FwN(k)に乗算する係数λ−1は、0.22とされ(λ−1=0.22、正規分布化後の確率密度〜FwN(k−1)=λ−1×FwN(k))、正規分布化後の確率密度〜FwN(k)を求めるために、当該区間の確率密度FwN(k)に乗算する係数λ0は、0.52とされ(λ0=0.52、正規分布化後の確率密度〜FwN(k)=λ0×FwN(k))、正規分布化後の確率密度〜FwN(k+1)を求めるために、当該区間の確率密度FwN(k)に乗算する係数λ+1は、0.22とされ(λ+1=0.22、正規分布化後の確率密度〜FwN(k+1)=λ+1×FwN(k))、そして、正規分布化後の確率密度〜FwN(k+2)を求めるために、当該区間の確率密度FwN(k)に乗算する係数λ+2は、0.02とされる(λ+2=0.02、正規分布化後の確率密度〜FwN(k+2)=λ+2×FwN(k))。このように決定することによって係数λの総和は、λ−2+λ−1+λ0+λ+1+λ+2=1となる。このように当該区間の確率密度FwN(k)が正規分布状に拡げられる。
各区間の確率密度FwN(k)が正規分布状に拡げられると、次に、区間ごとに、正規分布化後の各確率密度が足し合わされ(式45)、図19(E)に示す平滑化された確率密度分布が得られる。そして、各区間の中心位置を曲線で結ぶことによって、平滑化された確率密度分布曲線が得られる。なお、本例では、平滑化後の確率密度が前後の区間に2つずつ拡がるので、分布全体としても両端が2区間ずつ拡がる。このため、各両端において、端部から区間の幅hの半分(h/2)だけ離れた点も0として前記曲線で結ばれる。
ここで、式45の右辺の〜F
wN(k+i、k+j)において、定義されていない値〜F
wN(k+i、k+j)は、0とする。
このような手法によって、図7(B)に示すヒストグラムからから確率密度分布曲線が求められてもよい。
本発明を表現するために、上述において図面を参照しながら実施形態を通して本発明を適切且つ十分に説明したが、当業者であれば上述の実施形態を変更および/または改良することは容易に為し得ることであると認識すべきである。したがって、当業者が実施する変更形態または改良形態が、請求の範囲に記載された請求項の権利範囲を離脱するレベルのものでない限り、当該変更形態または当該改良形態は、当該請求項の権利範囲に包括されると解釈される。