JP5546981B2 - Output value prediction method, apparatus, and program for the method - Google Patents
Output value prediction method, apparatus, and program for the method Download PDFInfo
- Publication number
- JP5546981B2 JP5546981B2 JP2010162909A JP2010162909A JP5546981B2 JP 5546981 B2 JP5546981 B2 JP 5546981B2 JP 2010162909 A JP2010162909 A JP 2010162909A JP 2010162909 A JP2010162909 A JP 2010162909A JP 5546981 B2 JP5546981 B2 JP 5546981B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- value
- prediction
- item
- performance data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Complex Calculations (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本発明は、与えられたデータから出力値を予測する出力値予測技術に関し、特に、すべてのデータ項目についてデータ値を持たないデータも利用することができる出力値予測技術に関する。 The present invention relates to an output value prediction technique for predicting an output value from given data, and more particularly to an output value prediction technique that can use data having no data value for all data items.
様々な分野において、今後の行動を決定する際に、将来の予測がしばしば行われる。特に、例えば鉄鋼製品の製造や化学製品の製造のように、比較的大規模な製造プラントで様々な製造プロセスを経て製造される製品では、例えば投入量、操作入力量および時間経過等に応じて、各製造プロセスにおける出力値や製品に直結する最終プロセスの出力値が刻々と変化することが多い。このため、その出力値を制御するために、出力値の予測は、重要である。このような予測は、例えば、過去の実績データを用いることによって行う手法が考案されており、例えば、特許文献1に提案されている。
In various fields, future predictions are often made when determining future actions. In particular, in products manufactured through various manufacturing processes in a relatively large-scale manufacturing plant, such as manufacturing of steel products and chemical products, for example, depending on input amount, operation input amount, time passage, etc. In many cases, the output value in each manufacturing process and the output value of the final process directly connected to the product change every moment. For this reason, in order to control the output value, the prediction of the output value is important. For example, a method of performing such prediction by using past performance data has been devised, and for example, proposed in
この特許文献1に開示の脱燐制御方法は、転炉または鍋に、銑鉄と各種副原料とを投入した状態で吹錬を実施する各チャージの吹錬終了時における燐濃度を目標範囲内に収めるための脱燐制御方法であって、新規に実施するチャージにおける吹錬条件を新規吹錬ベクトルと定義し、過去に実施された各チャージにおける吹錬条件実績をそれぞれ複数の実績吹錬ベクトルと定義し、該実績吹錬ベクトルの中から前記新規吹錬ベクトルに類似し、かつ、終点燐濃度が基準範囲に入っている実績吹錬ベクトルを選択し、この選択された実績吹錬ベクトルの各吹錬条件及び実績脱燐副原料投入量から、前記新規に実施するチャージの脱燐副原料投入量を推定する近似モデルを作成し、この作成した近似モデルを用いて前記新規に実施するチャージの脱燐副原料投入量を推定し、この推定された脱燐副原料投入量に基づいて、前記新規に実施するチャージの脱燐副原料の投入量を定めるものである。
In the dephosphorization control method disclosed in
この特許文献1に開示の脱燐制御方法では、前記近似モデルは、前記実績吹錬ベクトルの中から、前記新規吹錬ベクトルに類似しかつ基準範囲内の終点燐濃度を持つ実績吹錬ベクトルが選択され、この選択された実績吹錬ベクトルの各吹錬条件及び実績脱燐副原料投入量から、作成されている。したがって、過去の実績吹錬ベクトルの中に前記新規吹錬ベクトルと類似する実績吹錬ベクトルが充分にないと、近似モデルの精度が落ちてしまい、充分な予測精度が得られなくなってしまう。特に、少品種大量生産の場合には、大量の過去実績データの中から類似したデータを多数選択して使用することができるが、例えば特殊鋼等のように、近時の多品種少量生産の場合では、このような前記事情になりやすい。また、低コスト化や操業効率の向上化のために、すべてのデータ項目について、毎回、必ず計測していない事情もあり、このような前記事情になりやすい。
In the dephosphorization control method disclosed in
そこで、使用可能な過去の実績データを増やすために、データ値が欠落したデータ項目を含む実績データを使用することが考えられ、このために前記実績データにおける前記データ値を補完する必要がある。このようなデータ値を補完する手法は、例えば、特許文献2に提案されている。 Therefore, in order to increase the past performance data that can be used, it is conceivable to use performance data including data items with missing data values. For this purpose, it is necessary to supplement the data values in the performance data. A technique for complementing such data values is proposed in Patent Document 2, for example.
この特許文献2に開示の欠損データ補完方法は、データベースに蓄積されているサンプルデータ群の中から、一部の特徴の欠損が存在する欠損データを検出し、当該欠損データと欠損のない正常データとに分割する欠損検出分割処理ステップと、前記欠損データに類似する前記正常データを所定の類似尺度を用いて求め、その求めた前記正常データにおける前記欠損データの欠損特徴に対応する特徴のデータを補完データとして、前記欠損データの欠損特徴に代入して補完する補完処理ステップとを備えるものである。より具体的には、欠損データに対しマンハッタン距離が最小となる正常データが求められ、この求められた正常データにおける、当該欠損データの欠損特徴に対応する特徴の特徴値が求められ、この求められた正常データの特徴値が補完候補とされ、欠損データの欠損値に代入される。 This missing data complementing method disclosed in Patent Document 2 detects missing data in which some features are missing from the sample data group accumulated in the database, and the missing data and normal data without any missing data. Deficiency detection division processing step of dividing the data into the normal data similar to the deficient data using a predetermined similarity scale, and data of features corresponding to the deficient features of the deficient data in the obtained normal data Complement data includes a complement processing step of substituting and complementing the missing data in the missing data. More specifically, normal data that minimizes the Manhattan distance with respect to the missing data is obtained, and a feature value of the feature corresponding to the missing feature of the missing data in the obtained normal data is obtained. The feature value of normal data is set as a candidate for completion and substituted for the missing value of missing data.
ところで、前記特許文献2に開示の欠損データ補完方法を、過去の実績データを用いることによって出力値を予測する手法に用いる場合では、欠損データに対しマンハッタン距離が最小となる1つの正常データで欠損データの欠損値が補完されることになる。正常データと欠損データとの類似度が正常データの特徴値と欠損値との類似度に一致すればよいが、必ずしも一致するとは限らず、適正に欠損値が補完されない場合もあり、予測精度が低くなる場合もある。 By the way, when the missing data complementing method disclosed in Patent Document 2 is used for a method of predicting an output value by using past performance data, the missing data is missing with one normal data that minimizes the Manhattan distance. Missing values in the data will be complemented. The degree of similarity between normal data and missing data only needs to match the degree of similarity between the feature value and missing value of normal data, but this is not always the case and the missing value may not be properly complemented, and the prediction accuracy is It may be lower.
本発明は、上述の事情に鑑みて為された発明であり、その目的は、データ値が欠落したデータ項目を含む過去実績データを使用する場合に、より高い予測精度で出力の予測値を求めることができる出力値予測方法、出力値予測装置および出力値予測方法のプログラムを提供することである。 The present invention has been made in view of the above-described circumstances, and its object is to obtain a predicted value of output with higher prediction accuracy when using past performance data including data items with missing data values. The present invention provides an output value prediction method, an output value prediction device, and an output value prediction method program.
本発明者は、種々検討した結果、上記目的は、以下の本発明により達成されることを見出した。すなわち、本発明の一態様にかかる出力値予測方法は、出力値予測装置で用いられる出力値予測方法であって、前記出力値予測装置が、複数のデータ項目を備える複数の過去実績データの中の前記複数のデータ項目の中にデータ値を持たない未測定データ項目を含む一部項目未測定過去実績データを、前記過去実績データの中の前記複数のデータ項目の全てにデータ値を持つ複数の全項目測定過去実績データの個数に応じた個数に複写し、前記一部項目未測定過去実績データの前記複写した各複写一部項目未測定過去実績データのそれぞれについて、前記未測定データ項目のデータ値を、前記複数の全項目測定過去実績データにおける前記未測定データ項目に対応するデータ項目のデータ値で補う補完ステップと、前記出力値予測装置が、前記複数の全項目測定過去実績データおよび前記補完ステップでデータ値をそれぞれ補った前記複数の複写一部項目未測定過去実績データのそれぞれについて、重みを求める重み計算ステップと、前記出力値予測装置が、前記重み計算ステップで求めた前記複数の重みと、前記複数の全項目測定過去実績データと、前記補完ステップでデータ値をそれぞれ補った複数の複写一部項目未測定過去実績データとに基づいて、予測したい予測対象データに対する出力値を予測して予測値を求める出力値予測ステップとを備え、前記重み計算ステップは、前記複数の全項目測定過去実績データの各重みを所定の定数とするとともに、前記複数の複写一部項目未測定過去実績データの各重みを、前記所定の定数を前記複数の全項目測定過去実績データの個数で除算した値とすることを特徴とする。本発明の他の一態様にかかる出力値予測装置は、複数のデータ項目を備える複数の過去実績データの中の前記複数のデータ項目の中にデータ値を持たない未測定データ項目を含む一部項目未測定過去実績データを、前記過去実績データの中の前記複数のデータ項目の全てにデータ値を持つ複数の全項目測定過去実績データの個数に応じた個数に複写し、前記一部項目未測定過去実績データの前記複写した各複写一部項目未測定過去実績データのそれぞれについて、前記未測定データ項目のデータ値を、前記複数の全項目測定過去実績データにおける前記未測定データ項目に対応するデータ項目のデータ値で補う補完部と、前記複数の全項目測定過去実績データおよび前記補完ステップでデータ値をそれぞれ補った前記複数の複写一部項目未測定過去実績データのそれぞれについて、重みを求める重み計算部と、前記重み計算部で求めた前記複数の重みと、前記複数の全項目測定過去実績データと、前記補完部でデータ値をそれぞれ補った複数の複写一部項目未測定過去実績データとに基づいて、予測したい予測対象データに対する出力値を予測して予測値を求める出力値予測部とを備え、前記重み計算部は、前記複数の全項目測定過去実績データの各重みを所定の定数とするとともに、前記複数の複写一部項目未測定過去実績データの各重みを、前記所定の定数を前記複数の全項目測定過去実績データの個数で除算した値とすることを特徴とする。そして、本発明の他の一態様にかかる出力値予測プログラムは、複数のデータ項目を備える複数の過去実績データおよび予測対象データを記憶する記憶部を備えるコンピュータを、出力値を予測するために、前記複数のデータ項目を備える複数の過去実績データの中の前記複数のデータ項目の中にデータ値を持たない未測定データ項目を含む一部項目未測定過去実績データを前記記憶部から読出し、前記過去実績データの中の前記複数のデータ項目の全てにデータ値を持つ複数の全項目測定過去実績データの個数に応じた個数に複写し、前記一部項目未測定過去実績データの前記複写した各複写一部項目未測定過去実績データのそれぞれについて、前記未測定データ項目のデータ値を、前記複数の全項目測定過去実績データにおける前記未測定データ項目に対応するデータ項目のデータ値で補う補完手段と、前記複数の全項目測定過去実績データおよび前記補完手段でデータ値をそれぞれ補った前記複数の複写一部項目未測定過去実績データのそれぞれについて、重みを求める重み計算手段と、前記重み計算手段で求めた前記複数の重みと、前記複数の全項目測定過去実績データと、前記補完ステップでデータ値をそれぞれ補った複数の複写一部項目未測定過去実績データとに基づいて、予測したい前記予測対象データに対する出力値を予測して予測値を求める出力値予測手段として機能させる出力値予測プログラムであって、前記重み計算手段は、前記複数の全項目測定過去実績データの各重みを所定の定数とするとともに、前記複数の複写一部項目未測定過去実績データの各重みを、前記所定の定数を前記複数の全項目測定過去実績データの個数で除算した値とすることを特徴とする。
As a result of various studies, the present inventor has found that the above object is achieved by the present invention described below. That is, an output value prediction method according to an aspect of the present invention is an output value prediction method used in an output value prediction device, and the output value prediction device includes a plurality of past performance data including a plurality of data items. A plurality of data items that have data values in all of the plurality of data items in the past performance data. Are copied to the number corresponding to the number of past measured data of all items, and for each of the copied partial item unmeasured past actual data of the partial item unmeasured past actual data, the unmeasured data item a data value, a complementary step to compensate the data values of the data items corresponding to the unmeasured data item in the plurality of all items measured historical performance data, said output values predicting device, before For each of the plurality of all item measurement past performance data and each of the plurality of copy partial item unmeasured past performance data each supplemented with the data value in the complementing step, a weight calculation step for obtaining a weight, and the output value prediction device, wherein a plurality of weights calculated in the weight calculating step, wherein a plurality of all items measured historical performance data, based on the data value to a plurality of copying and some items unmeasured historical performance data supplemented respectively the complementary step, An output value prediction step that predicts an output value for the prediction target data to be predicted and obtains a prediction value, and the weight calculation step sets each weight of the plurality of all item measurement past performance data as a predetermined constant, Each weight of the plurality of copy partial item unmeasured past performance data, the predetermined constant is the number of the plurality of all item measurement past performance data In that said values and to Rukoto of division. An output value prediction apparatus according to another aspect of the present invention includes a part including an unmeasured data item having no data value among the plurality of data items in a plurality of past performance data including a plurality of data items. Item unmeasured past performance data is copied to a number corresponding to the number of all item measured past performance data having data values for all of the plurality of data items in the past performance data, For each copied partial item unmeasured past performance data of the measured past performance data, the data value of the unmeasured data item corresponds to the unmeasured data item in the plurality of all item measured past performance data a complementary part to supplement the data value of the data item, the plurality of copying some items measuring non supplemented each data value in the plurality of all items measured historical performance data and the complementary steps For each of the past performance data, and the weight calculator for determining a weight, a plurality of weights calculated by the weight calculator, a plurality of all items measured historical performance data, a plurality supplemented with data values respectively the complementary portion based in part for replication and item unmeasured historical performance data, and an output value prediction unit for obtaining the prediction value by predicting an output value for the predicted target data to be predicted, the weight calculation section, the plurality of all the items Each weight of the measured past performance data is set as a predetermined constant, and each weight of the plurality of copy partial item unmeasured past performance data is divided by the number of the plurality of all items measured past performance data. and wherein the value and be Rukoto. Then, another output value prediction program according to an aspect of the present invention, a computer having a storage unit for storing a plurality of historical performance data and the prediction target data comprising a plurality of data items, in order to predict the output value, said read plurality of the plurality comprising data item part item unmeasured historical performance data including the unmeasured data items that do not have a data value in said plurality of data items in the past record data from the storage unit, the Each of the plurality of data items in the past performance data is copied to the number corresponding to the number of all the item measurement past performance data having data values, and each of the copied items of the partial item unmeasured past performance data is copied. For each copy item unmeasured past performance data, the data value of the unmeasured data item is changed to the unmeasured data in the plurality of all item measurement past performance data. And complementary means for supplementing the data value of the data item corresponding to the data item, the plurality of all items measured historical performance data and the complementary means respectively the data value of the plurality of copying some items unmeasured historical performance data supplemented respectively A weight calculation means for obtaining a weight, the plurality of weights obtained by the weight calculation means, the plurality of all-item measurement past performance data, and a plurality of copy partial items each supplemented with a data value in the complementing step based on the unmeasured historical performance data, an output value prediction program to function as an output value predicting means for obtaining a predicted value by predicting an output value for the predicted target data to be predicted, the weight calculation means, Each weight of the plurality of all-item measured past performance data is set as a predetermined constant, and each of the plurality of copy partial item unmeasured past performance data And wherein the values and to Rukoto obtained by dividing said predetermined constant in the plurality of all items measuring the number of historical performance data.
このような構成の出力値予測方法、出力値予測装置および出力値予測プログラムでは、未測定データ項目のデータ値に、全項目測定過去実績データの全ての前記未測定データ項目に対応するデータ項目のデータ値が用いられる。このため、使用可能な過去実績データの個数がより増大するため、このような構成の出力値予測方法、出力値予測装置および出力値予測プログラムは、データ値が欠落したデータ項目を含む過去実績データを使用する場合に、より高い予測精度で出力値の予測値を求めることができる。 In the output value prediction method, the output value prediction apparatus, and the output value prediction program having such a configuration, the data value of the unmeasured data item includes data items corresponding to all the unmeasured data items of the all-item measurement past performance data. Data values are used. For this reason, since the number of usable past performance data further increases, the output value prediction method, the output value prediction device, and the output value prediction program having such a configuration include past performance data including data items with missing data values. When using, the predicted value of the output value can be obtained with higher prediction accuracy.
また、他の一態様では、上述の出力値予測方法において、前記出力値予測ステップは、入力変数と出力変数との関係を表す出力値予測モデルを前記重み計算ステップで求めた前記複数の重みを用いた重み付重回帰法によって求めるモデル計算ステップと、前記モデル計算ステップで求められた出力値予測モデルに、前記予測対象データを代入することによって前記予測値を求める予測値計算ステップとを備えることを特徴とする。
Further, in another aspect, in the output value prediction method described above, the output value prediction step, the plurality of weights the output value prediction model representing a relationship between the output variables and input variables obtained by the weight calculation step A model calculation step obtained by a weighted multiple regression method using, and a prediction value calculation step for obtaining the prediction value by substituting the prediction target data into the output value prediction model obtained in the model calculation step. characterized in that it obtain.
このような構成の出力値予測方法では、前記複数の全項目測定過去実績データの各重みは、所定の定数とされ、前記複数の複写一部項目未測定過去実績データの各重みは、前記所定の定数を前記複数の全項目測定過去実績データの個数で除算した値とされる。このようにデータ値を補う必要のない前記複数の全項目測定過去実績データとデータ値を補った前記複数の複写一部項目未測定過去実績データとは、差別化されるので、このような構成の出力値予測方法は、データ値が欠落したデータ項目を含む過去実績データを使用する場合に、より高い予測精度で出力値の予測値を求めることができる。 In the output value prediction method having such a configuration, each weight of the plurality of all-item measured past performance data is a predetermined constant, and each weight of the plurality of copy partial item unmeasured past performance data is the predetermined weight. Is a value obtained by dividing the constant by the number of all past item measurement data of the plurality of items. In this way, the plurality of all-item measured past performance data that do not need to be supplemented with data values and the plurality of copy partial item unmeasured past performance data supplemented with data values are differentiated. This output value prediction method can obtain a predicted value of an output value with higher prediction accuracy when using past performance data including a data item with a missing data value.
また、他の一態様では、上述の出力値予測方法において、前記出力値予測ステップは、前記複数の全項目測定過去実績データおよび前記補完ステップでデータ値をそれぞれ補った前記複数の複写一部項目未測定過去実績データのそれぞれについて、前記予測対象データとの差を表す類似度を求める類似度計算ステップと、前記重み計算ステップで求めた前記複数の重み、前記類似度計算ステップで求めた前記複数の類似度、および、前記複数の全項目測定過去実績データおよび前記補完ステップでデータ値をそれぞれ補った前記複数の複写一部項目未測定過去実績データにおける前記予測値に対応するデータ項目の各データ値に基づいて、前記予測値を求める予測値計算ステップとを備えることを特徴とする。そして、好ましくは、前記予測値計算ステップは、前記重み計算ステップで求めた前記複数の重みおよび前記類似度計算ステップで求めた前記複数の類似度で、前記複数の全項目測定過去実績データおよび前記補完ステップでデータ値をそれぞれ補った前記複数の複写一部項目未測定過去実績データにおける前記予測値に対応するデータ項目の各データ値を重み付けすることによって、前記予測値を求める。
Further, in another aspect, in the output value prediction method described above, the output value prediction step, said plurality of copying a part of the data value supplemented respectively in the previous SL multiple full items measured historical performance data and the complementary steps For each of the item unmeasured past performance data, a similarity calculation step for calculating a similarity indicating a difference from the prediction target data, the plurality of weights determined in the weight calculation step, and the similarity calculated in the similarity calculation step Each of the plurality of similarities, and the data items corresponding to the predicted values in the plurality of copy partial item unmeasured past performance data respectively supplemented with the plurality of all item measured past performance data and the data value in the complementing step. based on the data value, and wherein the obtaining Bei the predicted value calculation step of obtaining the predicted value. Preferably, the predicted value calculation step includes the plurality of all-item measurement past performance data and the plurality of weights obtained in the weight calculation step and the plurality of similarities obtained in the similarity calculation step. The predicted value is obtained by weighting each data value of the data item corresponding to the predicted value in the plurality of copy partial item unmeasured past performance data respectively supplemented with the data value in the complementing step.
このような構成の出力値予測方法では、前記複数の全項目測定過去実績データの各重みは、所定の定数とされ、前記複数の複写一部項目未測定過去実績データの各重みは、前記所定の定数を前記複数の全項目測定過去実績データの個数で除算した値とされる。このようにデータ値を補う必要のない前記複数の全項目測定過去実績データとデータ値を補った前記複数の複写一部項目未測定過去実績データとは、差別化されるので、このような構成の出力値予測方法は、データ値が欠落したデータ項目を含む過去実績データを使用する場合に、より高い予測精度で出力値の予測値を求めることができる。そして、このような構成の出力値予測方法では、前記複数の全項目測定過去実績データおよび前記補完ステップでデータ値をそれぞれ補った前記複数の複写一部項目未測定過去実績データのそれぞれについて、前記予測対象データとの類似度が求められ、前記重み計算ステップで求められた前記複数の重み、前記類似度計算ステップで求められた前記複数の類似度、および、前記複数の全項目測定過去実績データおよび前記補完ステップでデータ値をそれぞれ補った前記複数の複写一部項目未測定過去実績データにおける前記予測値に対応するデータ項目の各データ値に基づいて、前記予測値が求められる。このように前記予測値を求める場合に、前記類似度が用いられるので、このような構成の出力値予測方法は、データ値が欠落したデータ項目を含む過去実績データを使用する場合に、さらにより高い予測精度で出力値の予測値を求めることができる。 In the output value prediction method having such a configuration, each weight of the plurality of all-item measured past performance data is a predetermined constant, and each weight of the plurality of copy partial item unmeasured past performance data is the predetermined weight. Is a value obtained by dividing the constant by the number of all past item measurement data of the plurality of items. In this way, the plurality of all-item measured past performance data that do not need to be supplemented with data values and the plurality of copy partial item unmeasured past performance data supplemented with data values are differentiated. This output value prediction method can obtain a predicted value of an output value with higher prediction accuracy when using past performance data including a data item with a missing data value. In the output value prediction method having such a configuration, for each of the plurality of all item measurement past performance data and each of the plurality of copy partial item unmeasured past performance data each supplemented with a data value in the complementing step, Similarity with prediction target data is obtained, the plurality of weights obtained in the weight calculation step, the plurality of similarities obtained in the similarity calculation step, and the plurality of all-item measurement past performance data The predicted value is obtained based on each data value of the data item corresponding to the predicted value in the plurality of copy partial item unmeasured past performance data each supplemented with the data value in the complementing step. Since the similarity is used when the predicted value is obtained in this way, the output value predicting method having such a configuration is further improved when using past performance data including data items with missing data values. The predicted value of the output value can be obtained with high prediction accuracy.
また、他の一態様では、上述の出力値予測方法において、前記出力値予測ステップは、前記複数の全項目測定過去実績データおよび前記補完ステップでデータ値をそれぞれ補った前記複数の複写一部項目未測定過去実績データのそれぞれについて、入力変数と出力変数との関係を表す所与の出力値予測モデルに、前記入力変数に対応するデータ項目のデータ値を代入することによって、モデル予測値を求め、前記モデル予測値と前記出力変数に対応するデータ項目のデータ値との差を予測誤差として求める予測誤差計算ステップと、前記複数の全項目測定過去実績データおよび前記補完ステップでデータ値をそれぞれ補った前記複数の複写一部項目未測定過去実績データのそれぞれについて、前記予測対象データとの差を表す類似度を求める類似度計算ステップと、前記重み計算ステップで求めた前記複数の重み、前記類似度計算ステップで求めた前記複数の類似度、および、前記予測誤差計算ステップで求めた前記複数の予測誤差に基づいて、前記予測対象データの予測値における予測誤差を求める予測値予測誤差計算ステップと、前記所与の出力値予測モデルに前記予測対象データを代入することによって求められた値と前記予測値予測誤差計算ステップで求められた前記予測対象データの予測値における予測誤差との和を求めることで前記予測値を求める予測値計算ステップとを備えることを特徴とする。そして、好ましくは、前記予測値予測誤差計算ステップは、前記重み計算ステップで求めた前記複数の重みおよび前記類似度計算ステップで求めた前記複数の類似度で、前記予測誤差計算ステップで求めた前記複数の予測誤差を重み付けすることによって、前記予測対象データの予測値における予測誤差を求める。
According to another aspect, in the output value prediction method described above, the output value prediction step includes the plurality of all-item measurement past performance data and the plurality of copy partial items each supplemented with a data value in the complementing step. For each unmeasured past performance data, obtain the model predicted value by substituting the data value of the data item corresponding to the input variable into the given output value predictive model that represents the relationship between the input variable and the output variable. the prediction error calculating step of obtaining a difference between the model predicted value and the data value of the data item corresponding to the output variable as a prediction error, before Symbol plurality of all items measured historical performance data and the data values in the complementary step, respectively for each of the plurality of copying some items unmeasured historical performance data supplemented obtains a similarity that represents the difference between the predicted target data Based on the similarity calculation step, the plurality of weights obtained in the weight calculation step, the plurality of similarities obtained in the similarity calculation step, and the plurality of prediction errors obtained in the prediction error calculation step A prediction value prediction error calculation step for obtaining a prediction error in a prediction value of the prediction target data; a value obtained by substituting the prediction target data into the given output value prediction model; and a prediction value prediction error calculation to obtain Bei the predictive value calculating step by obtaining the sum of the prediction error in the prediction value of the prediction target data obtained in step obtains the predicted value and said. Preferably, in the prediction value prediction error calculation step, the plurality of weights obtained in the weight calculation step and the plurality of similarities obtained in the similarity calculation step are obtained in the prediction error calculation step. A prediction error in the prediction value of the prediction target data is obtained by weighting a plurality of prediction errors.
このような構成の出力値予測方法では、前記複数の全項目測定過去実績データの各重みは、所定の定数とされ、前記複数の複写一部項目未測定過去実績データの各重みは、前記所定の定数を前記複数の全項目測定過去実績データの個数で除算した値とされる。このようにデータ値を補う必要のない前記複数の全項目測定過去実績データとデータ値を補った前記複数の複写一部項目未測定過去実績データとは、差別化されるので、このような構成の出力値予測方法は、データ値が欠落したデータ項目を含む過去実績データを使用する場合に、より高い予測精度で出力値の予測値を求めることができる。そして、このような構成の出力値予測方法では、前記複数の全項目測定過去実績データおよび前記補完ステップでデータ値をそれぞれ補った前記複数の複写一部項目未測定過去実績データのそれぞれについて、前記予測対象データとの類似度が求められ、前記重み計算ステップで求められた前記複数の重み、前記類似度計算ステップで求められた前記複数の類似度、および、前記予測誤差計算ステップで求められた前記複数の予測誤差に基づいて、前記予測対象データの予測値における予測誤差が求められ、前記予測値が求められる。このように前記予測値を求める場合に、前記類似度が用いられるので、このような構成の出力値予測方法は、データ値が欠落したデータ項目を含む過去実績データを使用する場合に、さらにより高い予測精度で出力値の予測値を求めることができる。 In the output value prediction method having such a configuration, each weight of the plurality of all-item measured past performance data is a predetermined constant, and each weight of the plurality of copy partial item unmeasured past performance data is the predetermined weight. Is a value obtained by dividing the constant by the number of all past item measurement data of the plurality of items. In this way, the plurality of all-item measured past performance data that do not need to be supplemented with data values and the plurality of copy partial item unmeasured past performance data supplemented with data values are differentiated. This output value prediction method can obtain a predicted value of an output value with higher prediction accuracy when using past performance data including a data item with a missing data value. In the output value prediction method having such a configuration, for each of the plurality of all item measurement past performance data and each of the plurality of copy partial item unmeasured past performance data each supplemented with a data value in the complementing step, Similarity with the prediction target data is obtained, and the plurality of weights obtained in the weight calculation step, the plurality of similarities obtained in the similarity calculation step, and the prediction error calculation step Based on the plurality of prediction errors, a prediction error in a prediction value of the prediction target data is obtained, and the prediction value is obtained. Since the similarity is used when the predicted value is obtained in this way, the output value predicting method having such a configuration is further improved when using past performance data including data items with missing data values. The predicted value of the output value can be obtained with high prediction accuracy.
また、他の一態様では、上述の出力値予測方法において、前記出力値予測ステップは、前記複数の全項目測定過去実績データおよび前記補完ステップでデータ値をそれぞれ補った前記複数の複写一部項目未測定過去実績データのそれぞれについて、入力変数と出力変数との関係を表す所与の出力値予測モデルに、前記入力変数に対応するデータ項目のデータ値を代入することによって、モデル予測値を求め、前記モデル予測値と前記出力変数に対応するデータ項目のデータ値との差を予測誤差として求める予測誤差計算ステップと、前記複数の全項目測定過去実績データおよび前記補完ステップでデータ値をそれぞれ補った前記複数の複写一部項目未測定過去実績データのそれぞれについて、前記予測対象データとの差を表す類似度を求める類似度計算ステップと、前記補完ステップでデータ値をそれぞれ補った前記複数の複写一部項目未測定過去実績データのそれぞれについて、前記未測定データ項目の重みを表す影響度を求める影響度計算ステップと、前記重み計算ステップで求めた前記複数の重み、前記類似度計算ステップで求めた前記複数の類似度、前記影響度計算ステップで求めた前記複数の影響度、および、前記予測誤差計算ステップで求めた前記複数の予測誤差に基づいて、前記予測対象データの予測値における予測誤差を求める予測値予測誤差計算ステップと、前記所与の出力値予測モデルに前記予測対象データを代入することによって求められた値と前記予測値予測誤差計算ステップで求められた前記予測対象データの予測値における予測誤差との和を求めることで前記予測値を求める予測値計算ステップとを備えることを特徴とする。
According to another aspect, in the output value prediction method described above, the output value prediction step includes the plurality of all-item measurement past performance data and the plurality of copy partial items each supplemented with a data value in the complementing step. For each unmeasured past performance data, obtain the model predicted value by substituting the data value of the data item corresponding to the input variable into the given output value predictive model that represents the relationship between the input variable and the output variable. the prediction error calculating step of obtaining a difference between the model predicted value and the data value of the data item corresponding to the output variable as a prediction error, before Symbol plurality of all items measured historical performance data and the data values in the complementary step, respectively for each of the plurality of copying some items unmeasured historical performance data supplemented obtains a similarity that represents the difference between the predicted target data A similarity score calculation step, for each of the plurality of copying some items unmeasured historical performance data of the data value supplemented respectively the complementary step, the influence degree calculation step of obtaining the degree of influence representing the weight of the unmeasured data items The plurality of weights obtained in the weight calculation step, the plurality of similarities obtained in the similarity calculation step, the plurality of influences obtained in the influence degree calculation step, and obtained in the prediction error calculation step A prediction value prediction error calculating step for obtaining a prediction error in a prediction value of the prediction target data based on the plurality of prediction errors, and substituting the prediction target data into the given output value prediction model. And the prediction error in the prediction value of the prediction target data obtained in the prediction value prediction error calculation step. In wherein the obtaining Bei the predicted value calculation step of obtaining the predicted value.
このような構成の出力値予測方法では、前記影響度が用いられるので、補完された未測定データ項目が前記予測値に与える影響の度合いが考慮される。このため、このような構成の出力値予測方法は、データ値が欠落したデータ項目を含む過去実績データを使用する場合に、さらにより高い予測精度で出力値の予測値を求めることができる。 In the output value prediction method having such a configuration, since the degree of influence is used, the degree of influence of the complemented unmeasured data item on the predicted value is considered. For this reason, the output value prediction method having such a configuration can obtain a predicted value of an output value with higher prediction accuracy when using past performance data including a data item in which a data value is missing.
また、他の一態様では、これら上述の出力値予測方法において、前記出力値予測ステップは、前記複数の全項目測定過去実績データおよび前記補完ステップでデータ値をそれぞれ補った前記複数の複写一部項目未測定過去実績データのそれぞれについて、入力変数と出力変数との関係を表す所与の出力値予測モデルに、前記入力変数に対応するデータ項目のデータ値を代入することによって、モデル予測値を求め、前記モデル予測値と前記出力変数に対応するデータ項目のデータ値との差を予測誤差として求める予測誤差計算ステップと、前記複数の全項目測定過去実績データおよび前記補完ステップでデータ値をそれぞれ補った前記複数の複写一部項目未測定過去実績データのそれぞれについて、前記予測対象データとの差を表す類似度を求める類似度計算ステップと、前記重み計算ステップで求めた前記複数の重み、前記類似度計算ステップで求めた前記複数の類似度、および、前記予測誤差計算ステップで求めた前記複数の予測誤差に基づいて、前記予測対象データの予測値における予測誤差を求める予測値予測誤差計算ステップと、前記所与の出力値予測モデルに前記予測対象データを代入することによって求められた値と前記予測値予測誤差計算ステップで求められた前記予測対象データの予測値における予測誤差との和を求めることで前記予測値を求める予測値計算ステップとを備え、前記重み計算ステップは、前記複数の全項目測定過去実績データの各重みを所定の定数とするとともに、前記複数の複写一部項目未測定過去実績データの各重みを、前記未測定データ項目に補うべき値であると判断するための所定の条件を満たさない場合には、0とし、前記所定の条件を満たす場合には、前記所定の定数を、前記所定の条件を満たす前記複写一部項目未測定過去実績データの個数で除算した値とすることを特徴とする。 According to another aspect, in the above-described output value prediction methods, the output value prediction step includes the plurality of all-item measurement past performance data and the plurality of copies partially supplemented with data values in the complementing step, respectively. By substituting the data value of the data item corresponding to the input variable for a given output value prediction model that represents the relationship between the input variable and the output variable for each of the item unmeasured past performance data, the model predicted value is determined, the prediction error calculation step of obtaining a difference between the data values of the data items corresponding to the output variable and the model predictive value as the prediction error, the previous SL data values in a plurality of all items measured historical performance data and the complementary steps for each of said plurality of copying some items unmeasured historical performance data supplemented respectively, the similarity representing the difference between the predicted target data The plurality of weights obtained in the weight calculation step, the plurality of similarities obtained in the similarity calculation step, and the prediction errors obtained in the prediction error calculation step. Based on a prediction value prediction error calculation step for obtaining a prediction error in a prediction value of the prediction target data, and a value obtained by substituting the prediction target data into the given output value prediction model and the prediction value prediction A prediction value calculation step of obtaining the prediction value by obtaining a sum of a prediction error in the prediction value of the prediction target data obtained in the error calculation step, and the weight calculation step includes the plurality of all item measurement past Each weight of the performance data is set to a predetermined constant, and each weight of the plurality of copy partial item unmeasured past performance data is set to the unmeasured data. If the predetermined condition for determining that the value should be compensated for by the eyes is not satisfied, 0 is set. If the predetermined condition is satisfied, the predetermined constant is set to the copy number satisfying the predetermined condition. It is a value obtained by dividing the number of part item unmeasured past performance data.
このような構成の出力値予測方法は、前記所定の条件を満たさない複写一部項目未測定過去実績データが、前記予測値の算出から取り除かれるので、データ値として取り得ないデータ値によって未測定データ項目のデータ値が補われる可能性が低減される。このため、このような構成の出力値予測方法は、さらにより高い予測精度で出力値の予測値を求めることができる。 In the output value prediction method having such a configuration, the copy part item unmeasured past actual result data that does not satisfy the predetermined condition is removed from the calculation of the predicted value, so that the unmeasured data is obtained by the data value that cannot be taken as the data value. The possibility that the data value of the item is supplemented is reduced. For this reason, the output value prediction method having such a configuration can obtain the predicted value of the output value with higher prediction accuracy.
また、他の一態様では、これら上述の出力値予測方法において、複数のデータ項目を備える複数の過去実績データを、前記一部項目未測定過去実績データと前記全項目測定過去実績データとに分ける分離ステップをさらに備えることを特徴とする。 Moreover, in another one aspect | mode, in these above-mentioned output value prediction methods, several past performance data provided with several data items are divided into the said partial item unmeasured past performance data and the said all item measurement past performance data. It further comprises a separation step.
このような構成の出力値予測方法では、過去実績データに全項目測定過去実績データと一部項目未測定過去実績データとが混在している場合にでも、これらを分けることができ、補完ステップを適切に実行することができる。 With the output value prediction method having such a configuration, even when all past measured data and some past unmeasured past performance data are mixed in past performance data, these can be separated, and a supplementary step is performed. Can be implemented properly.
本発明にかかる出力値予測方法、出力値予測装置および出力値予測プログラムは、データ値が欠落したデータ項目を含む過去実績データを使用する場合に、より高い予測精度で出力値の予測値を求めることができる。 An output value prediction method, an output value prediction apparatus, and an output value prediction program according to the present invention obtain a predicted value of an output value with higher prediction accuracy when using past performance data including a data item having a missing data value. be able to.
以下、本発明にかかる実施の一形態を図面に基づいて説明する。なお、各図において同一の符号を付した構成は、同一の構成であることを示し、適宜、その説明を省略する。また、本明細書において、総称する場合には添え字を省略した参照符号で示し、個別の構成を指す場合には添え字を付した参照符号で示す。 Hereinafter, an embodiment according to the present invention will be described with reference to the drawings. In addition, the structure which attached | subjected the same code | symbol in each figure shows that it is the same structure, The description is abbreviate | omitted suitably. Further, in this specification, when referring generically, it is indicated by a reference symbol without a suffix, and when referring to an individual configuration, it is indicated by a reference symbol with a suffix.
(第1実施形態)
図1は、第1実施形態における出力値予測装置の構成を示すブロック図である。本実施形態における出力値予測装置Saは、過去実績データ(Xj、Y)に基づいて、予測したい予測対象データX0jに対する出力Ypを予測することによって前記予測対象データX0jの予測値yp0を求める装置である。より具体的には、出力値予測装置Saは、データ値を持たない未測定データ項目を含む一部項目未測定過去実績データ(Xj、Y)における前記未測定データ項目のデータ値を、複数の全項目測定過去実績データ(Xj、Y)における前記未測定データ項目に対応するデータ項目のデータ値で補い、これら複数の全項目測定過去実績データ(Xj、Y)および未測定データ項目のデータ値をそれぞれ補った複数の複写一部項目未測定過去実績データ(Xj、Y)に基づいて、予測したい予測対象データに対する出力Ypを予測して予測値yp0を求めるものである。
(First embodiment)
FIG. 1 is a block diagram illustrating a configuration of an output value prediction apparatus according to the first embodiment. The output value prediction apparatus Sa in the present embodiment predicts the output Y p for the prediction target data X 0j to be predicted based on the past performance data (X j , Y), thereby predicting the predicted value y of the prediction target data X 0j. This is a device for determining p0 . More specifically, the output value prediction device Sa sets a plurality of data values of the unmeasured data items in the partial unmeasured past performance data (X j , Y) including unmeasured data items that do not have data values. All item measured past performance data (X j , Y) is supplemented with the data value of the data item corresponding to the unmeasured data item, and the plurality of all item measured past performance data (X j , Y) and the unmeasured data item The predicted value y p0 is obtained by predicting the output Y p for the prediction target data to be predicted based on a plurality of copy partial item unmeasured past performance data (X j , Y) each supplementing the data value of .
過去実績データ(Xj、Y)は、複数のデータ項目を備え、これらデータ項目のデータ値は、過去に取得された値である。なお、数値実験では、ユーザが予め用意した値であってもよい。複数のデータ項目は、所定の出力Yとこの出力Yに関わる数値化可能な所定の要因Xjとから成る。全項目測定過去実績データは、前記複数のデータ項目の全てについてデータ値を持つ過去実績データ(Xj、Y)である。一部項目未測定過去実績データ(Xj、Y)は、前記複数のデータ項目の中にデータ値を持たない未測定データ項目を少なくとも含む過去実績データ(Xj、Y)である。 The past performance data (X j , Y) includes a plurality of data items, and the data values of these data items are values acquired in the past. In numerical experiments, a value prepared in advance by the user may be used. The plurality of data items are composed of a predetermined output Y and a predetermined factor X j that can be numerically related to the output Y. The all item measurement past result data is past result data (X j , Y) having data values for all of the plurality of data items. Partial item unmeasured past performance data (X j , Y) is past performance data (X j , Y) including at least an unmeasured data item having no data value among the plurality of data items.
このような出力値予測装置Saは、例えば、図1に示すように、補完部2a、モデル計算部3aおよび予測値計算部4aを備えて構成され、さらに、本実施形態では、分離部1、入力部5および出力部6を備えている。
For example, as shown in FIG. 1, the output value prediction apparatus Sa includes a
入力部5は、例えば、予め与えられたデータから本実施形態の手法によって出力Ypを予測する出力値予測プログラムを起動するコマンド等の各種コマンド、および、例えば過去実績データ(Xj、Y)や予測対象データX0j等の出力Ypを予想する上で必要な各種データを出力値予測装置Saに入力する機器であり、例えば、キーボードやマウス等である。出力部6は、入力部5から入力されたコマンドやデータ、および、本出力値予測装置Saによって予測された出力値(予測値)yp0を出力する機器であり、例えばCRTディスプレイ、LCD、有機ELディスプレイおよびプラズマディスプレイ等の表示装置やプリンタ等の印刷装置等である。
The
分離部1は、過去実績データ(Xj、Y)を格納して記憶するとともに、過去実績データ(Xj、Y)を全項目測定過去実績データ(Xj、Y)と一部項目未測定過去実績データ(Xj、Y)とに分け、それぞれを格納して記憶するものである。分離部1は、例えば、過去実績データ(Xj、Y)を格納して記憶する過去実績データデータベース部(過去実績データDB部)11と、過去実績データDB部11に記憶されている過去実績データ(Xj、Y)を全項目測定過去実績データ(Xj、Y)と一部項目未測定過去実績データ(Xj、Y)とに分けるデータ分離部12と、データ分離部12で分けられた一部項目未測定過去実績データ(Xj、Y)を格納して記憶する欠損データデータベース部(欠損データDB部)13と、データ分離部12で分けられた全項目測定過去実績データ(Xj、Y)を格納して記憶する全項目測定データデータベース部(全項目測定データDB部)14とを備えて構成される。
補完部2aは、一部項目未測定過去実績データ(Xj、Y)を出力値の予測に用いるべく、未測定データ項目のデータ値を全項目測定過去実績データ(Xj、Y)に基づいて補うものである。補完部2aは、一部項目未測定過去実績データ(Xj、Y)を、複数の全項目過去実績データ(Xj、Y)の個数に応じた個数に複写し、これら複写した複数の一部項目未測定過去実績データ(複写一部項目未測定過去実績データ)(Xj、Y)のそれぞれについて、その未測定データ項目のデータ値を、前記複数の全項目測定過去実績データ(Xj、Y)における前記未測定データ項目に対応するデータ項目のデータ値で補うデータ補完部21と、これら前記複数の全項目測定過去実績データ(Xj、Y)および前記複数の複写一部項目未測定過去実績データ(Xj、Y)の各データについて、その重み(データ重みt)を求めるデータ重み計算部22とを備えている。データ重み計算部22は、本実施形態では、前記複数の全項目測定過去実績データ(Xj、Y)の各データ重みtを所定の定数(例えば、1)とするとともに、前記複数の複写一部項目未測定過去実績データ(Xj、Y)の各データ重みtを、前記所定の定数を前記複数の全項目測定過去実績データの個数で除算した値(前記例では1/(全項目測定過去実績データの個数))とするものである。
The
モデル計算部3aは、分離部1に記憶されている過去実績データ(Xj、Y)に基づいて、予測対象データX0jの予測値yp0を求めるために必要なものを求めるものである。モデル計算部3aは、本実施形態では、入力変数Xjと出力変数Yとの関係を表す出力値予測モデルy=f(aj,Xj)を重み付重回帰法によって求めるものであり、例えば、補完部2aのデータ重み計算部22で求めた複数のデータ重みtに基づいて重み付重回帰法における重み(重回帰重み)Wを求める重み計算部31と、出力値予測モデルy=f(aj,Xj)の係数パラメータajを求めるパラメータ計算部32とを備えている。
Model calculation portion 3a, historical performance data (X j, Y) stored in the
予測値計算部4aは、モデル計算部3aで同定された出力値予測モデル(aj,Xj)に、予測対象データX0jを代入することによって予測対象データX0jの予測値yp0を求めるものである。
Prediction
このような構成の出力値予測装置Saは、例えば、コンピュータ、より具体的には、サーバコンピュータや、ノート型やディスクトップ型等のパーソナルコンピュータ等によって構成可能である。また、出力値予測装置Saは、分離部1、補完部2a、モデル計算部3a、予測値計算部4a、入力部5および出力部6が一体に構成されてもよく、また、別体で構成されてもよい。例えば、分離部1は、ハードディスク等を備えて構成され、補完部2a、モデル計算部3aおよび予測値計算部4aは、例えばCPU等のマイクロプロセッサ、RAM(Random Access Memory)やROM(Read Only Memory)等の記憶素子および周辺回路を備え、これらに機能的に構成され、これによって出力値予測装置Saは、1台のコンピュータで一体に構成される。また例えば、分離部1は、データベースサーバコンピュータを備えて構成され、補完部2a、モデル計算部3aおよび予測値計算部4aは、コンピュータを備えて構成され、これによって出力値予測装置Saは、2台のコンピュータで別体に構成される。
The output value prediction apparatus Sa having such a configuration can be configured by, for example, a computer, more specifically, a server computer, a personal computer such as a notebook computer or a desktop computer, or the like. In the output value prediction device Sa, the
なお、必要に応じて出力値予測装置Saは、外部記憶部をさらに備えてもよい。外部記憶部は、例えば、フレキシブルディスク、CD−ROM(Compact Disc Read Only Memory)、CD−R(Compact Disc Recordable)、DVD−R(Digital Versatile DiscRecordable)およびブルーレイディスク(Blu-ray Disc、登録商標)等の記録媒体との間でデータを読み込みおよび/または書き込みを行う装置であり、例えば、フレキシブルディスクドライブ、CD−ROMドライブ、CD−Rドライブ、DVD−Rドライブおよびブルーレイディスクドライブ等である。 Note that the output value prediction device Sa may further include an external storage unit as necessary. The external storage unit is, for example, a flexible disk, a CD-ROM (Compact Disc Read Only Memory), a CD-R (Compact Disc Recordable), a DVD-R (Digital Versatile Disc Recordable), and a Blu-ray Disc (registered trademark). For example, a flexible disk drive, a CD-ROM drive, a CD-R drive, a DVD-R drive, a Blu-ray disk drive, and the like are devices that read data from and / or write data to / from a recording medium.
ここで、出力値予測プログラム等が格納されていない場合には、出力値予測プログラム等を記録した記録媒体から前記外部記憶部を介して出力値予測プログラムをインストールするように、出力値予測装置Saが構成されてもよい。また、過去実績データ(Xj、Y)や出力値を予測するためのデータ等のデータを記録した記録媒体から前記外部記憶部を介して前記データを入力するように、出力値予測装置Saが構成されてもよい。 Here, when the output value prediction program or the like is not stored, the output value prediction device Sa is installed so as to install the output value prediction program from the recording medium on which the output value prediction program or the like is recorded via the external storage unit. May be configured. In addition, the output value predicting device Sa is configured to input the data via the external storage unit from a recording medium that records data such as past performance data (X j , Y) and data for predicting an output value. It may be configured.
次に、この出力値予測装置Saの動作について説明する。図2は、第1実施形態における出力値予測装置の動作を示すフローチャートである。図3は、第1実施形態における出力値予測装置の補完動作を示すフローチャートである。図4は、第1実施形態の出力値予測装置における予測対象データと過去実績データデータベース部に記憶される過去実績データとを説明するための図である。図5は、第1実施形態の出力値予測装置における全項目測定データデータベースに記憶される全項目測定過去実績データと欠損データデータベースに記憶される一部項目未測定過去実績データとを説明するための図である。 Next, the operation of the output value prediction apparatus Sa will be described. FIG. 2 is a flowchart showing the operation of the output value prediction apparatus in the first embodiment. FIG. 3 is a flowchart showing the complementing operation of the output value prediction apparatus according to the first embodiment. FIG. 4 is a diagram for explaining prediction target data and past performance data stored in the past performance data database unit in the output value prediction apparatus of the first embodiment. FIG. 5 is a diagram for explaining all item measurement past performance data stored in the all item measurement data database and some item unmeasured past performance data stored in the missing data database in the output value prediction apparatus of the first embodiment. FIG.
出力値予測装置Saは、例えば、ユーザの操作によって入力部5から起動コマンドを受け付けると、出力値予測プログラムを実行する。この出力予測プログラムの実行によって、コンピュータに補完部2a、モデル計算部3aおよび予測値計算部4aが機能的に構成される。そして、出力値予測装置Saは、以下の動作によって、過去実績データ(Xj、Y)に基づいて予測対象データXp0から出力値(予測値)yp0を予測する。
For example, when an output command is received from the
この出力Ypの予測に当たって、出力値予測装置Saの分離部1における過去実績データDB部11には、例えば、図4(A)に示すように表形式(テーブル形式)で過去実績データ(Xj、Y)が予め記憶され、入力部5から入力されることによって予測対象データXp0が図4(B)に示すように記憶されている。ここで、所定の出力Yは、N個の要素(出力要素)yjの集合であり、すなわち、Y={yj|j=1、2、・・・、N}であり、前記所定の出力Yに関与する要因Xは、N個の要素(要因要素)xjiの集合であり、すなわち、X={xji|j=1、2、・・・、N}である。
In the prediction of the output Y p, in the past
この図4(A)に示す過去実績データテーブル1000は、実測された出力値yjを登録する出力フィールド(第1番目のデータ項目)101、および、前記所定の出力Yに関与する要因Xのデータxjiを登録する要因データフィールド101の各フィールドを備えて構成され、過去実績データ(Xj、Y)ごとにレコードを備えている。すなわち、過去実績データテーブル1000には、N個のレコードがある。なお、予測対象データXp0には、過去実績データ(Xj、Y)と識別可能に区別するために、0が添え字として付されている。また、過去実績データ(Xj、Y)には、N個のデータをそれぞれ識別可能に区別するために、1〜Nがそれぞれ第1添え字として付されている。そして、予測対象データXp0および過去実績データ(Xj、Y)には、前記所定の出力Yに関わる要因Xにおけるn個の要素である第1ないし第nデータ項目をそれぞれ識別可能に区別するために、1〜nがそれぞれ第2添え字(添え字の右側)として付されている。予測対象データXp0は、Xp0=[x01、x02、・・・、x0N]であり、過去実績データ(Xj、Y)は、Xji=[xj1、xj2、・・・、xjn]である。例えば、y3は、過去実績データ(Xj、Y)における第3番目の出力値を表しており、また例えば、x23は、過去実績データ(Xj、Y)における第2番目の第3データ項目の値を表しており、また例えば、x04は、予測対象データXp0における第4データ項目の値を表している。
The past performance data table 1000 shown in FIG. 4A includes an output field (first data item) 101 for registering the actually measured output value y j and the factor X related to the predetermined output Y. Each field of the
このように前記所定の出力Yに関与する要因Xは、複数nの要素(データ項目、要因要素)を備えて構成されており、このため、要因データフィールド102は、要素の個数nに応じた要因データ項目サブフィールドを備えている。図4に示す例では、前記所定の出力Yは、少なくともn個の要素(第1ないし第nデータ項目)が関与している。このため、要因データ項目サブフィールドは、要因Xの各要素xjiにそれぞれ対応する第1ないし第nの各データxj1〜xjnをそれぞれ登録する要因データ項目サブフィールド(第2番目ないし第n+1番目のデータ項目)102−1〜102−nを備えている。また、過去実績データ(Xj、Y)は、過去に異なる条件で、例えば、過去の互いに異なる時刻(時点)tjで実測等によって取得されたデータであり、図4に示す例では、N個のデータから構成されている。予測対象データXp0は、予測したい対象のデータであり、例えば、予測時点t0までに実測されたデータ値x0iや、操作入力の値x0iや、操業日時x0iや、シミュレーションのために用意したデータ値x0i等である。
As described above, the factor X related to the predetermined output Y is configured to include a plurality of n elements (data items, factor elements). Therefore, the
そして、本実施形態では、過去実績データテーブル1000には、データ項目の中にデータ値を持たない未測定データ項目を含む過去実績データ(一部項目未測定過去実績データ)(Xj、Y)が存在している。図4(A)に示す例では、第1番目の過去実績データ(Xj、Y)が一部項目未測定過去実績データであり、その第1要因データ項目サブフィールド(第2番目のデータ項目)102−1は、そのデータ値が抜けており、そのデータ値を持っていない。 In the present embodiment, the past performance data table 1000 includes past performance data (partially unmeasured past performance data) (X j , Y) including unmeasured data items having no data value in the data items. Is present. In the example shown in FIG. 4A, the first past performance data (X j , Y) is unmeasured past performance data for some items, and the first factor data item subfield (second data item) ) 102-1 is missing its data value and does not have that data value.
このような過去実績データ(Xj、Y)が分離部1の過去実績データDB部11に記憶されている場合において、出力値予測装置Saは、図2に示すように、まず、分離部1のデータ分離部12によって、過去実績データ(Xj、Y)を、全項目測定過去実績データ(Xj、Y)と一部項目未測定過去実績データ(Xj、Y)とに分け、それぞれ、全項目測定データDB部14と欠損データDB部13とに格納する(S11)。
In the case where such past performance data (X j , Y) is stored in the past performance
例えば、分離部1のデータ分離部12は、過去実績データテーブル1000における各レコードのそれぞれについて、出力フィールド101および第1ないし第n要因データ項目サブフィールド102−1〜102−n(第1ないし第n+1番目のデータ項目)に値(データ値)が格納されているか否かを判断し、この判断の結果、出力フィールド101および第1ないし第n要因データ項目サブフィールド102−1〜102−nの全てに値(データ値)が格納されている場合には、当該レコードが全項目測定過去実績データ(Xj、Y)と判断し、一方、この判断の結果、出力フィールド101および第1ないし第n要因データ項目サブフィールド102−1〜102−nのいずれかに(少なくとも1つに)値(データ値)が格納されていない場合には、当該レコードが一部項目未測定過去実績データ(Xj、Y)と判断する。そして、データ分離部12は、全項目測定過去実績データ(Xj、Y)と判断されたレコードの過去実績データ(Xj、Y)を全項目測定データDB部14へ格納し、全項目測定データDB部14に記憶させ、一部項目未測定過去実績データ(Xj、Y)と判断されたレコードの過去実績データ(Xj、Y)を欠損データDB部13へ格納し、欠損データDB部13に記憶させる。
For example, the
例えば、図4(A)に示す例では、第1データ項目X1のデータ値が抜けている第1番目の過去実績データ(x1j、y1)が一部項目未測定過去実績データであり、図5(B)に示す一部項目未測定過去実績データテーブル1003に格納され、第2番目ないし第2番目の過去実績データ(x2j、y2)〜(xnj、yn)が全項目測定過去実績データであり、図5(A)に示す全項目測定過去実績データテーブル1002に格納される。この全項目測定過去実績データテーブル1002は、図4(A)に示す過去実績データテーブル1000と同様に、実測された出力値yjを登録する出力フィールド121、および、前記所定の出力Yに関与する要因Xのデータxjiを登録する要因データフィールド122(122−1〜122−n)の各フィールドを備え、さらに、データ重みtjを登録するデータ重みフィールド123を備え、全項目測定過去実績データ(Xj、Y)ごとにレコードを備えている。また、この一部項目未測定過去実績データテーブル1003は、図4(A)に示す過去実績データテーブル1000と同様に、実測された出力値yjを登録する出力フィールド131、および、前記所定の出力Yに関与する要因Xのデータxjiを登録する要因データフィールド132(132−1〜132−n)の各フィールドを備え、さらに、データ重みtjを登録するデータ重みフィールド123を備え、一部項目未測定過去実績データ(Xj、Y)の個数に全項目測定過去実績データ(Xj、Y)の個数を乗じた数のレコードを備えている。なお、このステップS11の段階では、データ重みtが次のステップS12で計算されるので、そのデータ値は、登録されていない。
For example, in the example shown in FIG. 4A, the first past performance data (x 1j , y 1 ) from which the data value of the first data item X 1 is missing is the unmeasured past performance data for some items. 5B, some item unmeasured past performance data table 1003 stores the second to second past performance data (x 2j , y 2 ) to (x nj , y n ). This is item measurement past result data, and is stored in the all item measurement past result data table 1002 shown in FIG. Similar to the past performance data table 1000 shown in FIG. 4A, this all-item measurement past performance data table 1002 is related to the
次に、出力値予測装置Saは、補完部2aによって、一部項目未測定過去実績データ(Xj、Y)における未測定データ項目のデータ値を、複数の全項目測定過去実績データ(Xj、Y)における前記未測定データ項目に対応するデータ項目のデータ値で補い、これら複数の全項目測定過去実績データ(Xj、Y)および未測定データ項目のデータ値をそれぞれ補った複数の複写一部項目未測定過去実績データ(Xj、Y)の各データのデータ重みtを計算する(S12)。
Next, the output value prediction apparatus Sa uses the
より具体的には、例えば、補完部2aのデータ補完部21は、図5(B)に示すように、一部項目未測定過去実績データ(Xj、Y)を、複数の全項目過去実績データ(Xj、Y)の個数に応じた個数に複写し、これら複写した複数の一部項目未測定過去実績データ(複写一部項目未測定過去実績データ)(Xj、Y)のそれぞれについて、その未測定データ項目のデータ値を、前記複数の全項目測定過去実績データ(Xj、Y)における前記未測定データ項目に対応するデータ項目のデータ値で補う。図5(B)では、複写された複数の一部項目未測定過去実績データ(Xj、Y)のそれぞれについて、第1データ項目X1の各データ値が全項目測定過去実績データ(X2、Y)〜(XN、Y)の第1データ項目のデータ値X21〜XN1でそれぞれ補われている。そして、補完部2aのデータ重み計算部22は、複数の全項目測定過去実績データ(Xj、Y)のそれぞれについて、データ重みtを所定の定数(例えば、1)とし、全項目測定過去実績データテーブル1002のデータ重みフィールド123に登録し、複数の一部項目未測定過去実績データ(Xj、Y)のそれぞれについて、データ重みtを前記所定の定数を前記複数の全項目測定過去実績データ(Xj、Y)の個数で除算した値(前記例では1/(全項目測定過去実績データの個数=N−1))とし、一部項目未測定過去実績データテーブル1003のデータ重みフィールド133に登録する。すなわち、図4および図5に示す例では、全項目測定過去実績データ(Xj、Y)の個数がN−1であることから、一部項目未測定過去実績データ(Xj、Y)のデータ重みtiは、式1で示される。
More specifically, for example, as shown in FIG. 5B, the
ここで、ti(k)は、複写された複数の一部項目未測定過去実績データ(Xj、Y)における第k番目の一部項目未測定過去実績データ(Xj、Y)のデータ重みtiである。 Here, t i (k) is copied a plurality of part items unmeasured historical performance data (X j, Y) k-th part items unmeasured historical performance data (X j, Y) in the data it is the weight t i.
そして、この例では、複写された複数の一部項目未測定過去実績データにおける各データ重みti(k)の和が前記所定の定数(この例では1)となるように、規定され、複写された複数の一部項目未測定過去実績データにおける全データ重みtiが、各全項目測定過去実績データ(Xj、Y)の各データ重みtと同等にされている。 In this example, the sum of the data weights t i (k) in the copied past unmeasured past item data is defined so as to be the predetermined constant (1 in this example). The total data weights t i in the plurality of past unmeasured past data of some items are made equal to the respective data weights t of the all past measured past data (X j , Y).
そして、本実施形態では、より高精度な予測値yp0を得るべく、一部項目未測定過去実績データ(Xj、Y)における未測定データ項目のデータ値として比較的高精度な推定値(比較的信頼性の高い推定値)がある場合には、全項目測定過去実績データで補うことに代え、この推定値で補うようにしている。 In this embodiment, in order to obtain a more accurate predicted value y p0 , a relatively high-precision estimated value (as a data value of an unmeasured data item in some item unmeasured past performance data (X j , Y)) ( If there is a comparatively highly reliable estimated value), it is supplemented with this estimated value instead of supplementing with all-item measured past performance data.
すなわち、ステップS12は、より詳細には、図3に示すフローに従って動作している。この図3において、補完部2aのデータ補完部21は、一部項目未測定過去実績データ(Xj、Y)に対し、まず、ステップS21において、高精度の推定値がない変数が欠落しているか否かを判断する。すなわち、未測定データ項目に対し、高精度な推定値が存在するか否かを判断する。この判断の結果、高精度な推定値がない変数が欠落している場合(未測定データ項目に対し高精度な推定値が存在しない場合)(Yes)には、上述したように、ステップS24で、一部項目未測定過去実績データ(Xj、Y)を、複数の全項目過去実績データ(Xj、Y)の個数に応じた個数に複写し、これら複写した複数の一部項目未測定過去実績データ(複写一部項目未測定過去実績データ)(Xj、Y)のそれぞれについて、その未測定データ項目のデータ値を、前記複数の全項目測定過去実績データ(Xj、Y)における前記未測定データ項目に対応するデータ項目のデータ値で補い、続いて、ステップS25で、データ重み計算部22は、上述したように、複数の複写一部項目未測定過去実績データのそれぞれに対し、式1に従ってデータ重みti(k)を計算し、続いて、ステップS23が実行される。
That is, step S12 operates according to the flow shown in FIG. 3 in more detail. In FIG. 3, the
一方、ステップS21における判断の結果、高精度な推定値がない変数が欠落していない場合(未測定データ項目に対し高精度な推定値が存在する場合)(No)には、補完部21は、一部項目未測定過去実績データ(Xj、Y)の未測定データ項目のデータ値を、前記推定値で補い、データ重み計算部22は、そのデータ重みtiを前記所定の定数(上記例では1)とする。
On the other hand, as a result of the determination in step S21, if there is no missing variable that does not have a highly accurate estimated value (when a highly accurate estimated value exists for an unmeasured data item) (No), the complementing
続いて、ステップS23では、全ての一部項目未測定過去実績データについて、補完処理およびデータ重み計算処理が終了したか否かを判断し、この判断の結果、全てについて終了している場合(Yes)には、本処理を終了し、一方、全てについて終了していない場合(No)には、ステップS21に戻る。 Subsequently, in step S23, it is determined whether or not the complementing process and the data weight calculation process have been completed for all unmeasured past performance data of some items. If the determination result indicates that all have been completed (Yes) ), The process ends. On the other hand, if all the processes are not completed (No), the process returns to step S21.
図2に戻って、次に、モデル計算部3aは、重み計算部31によって、補完部2aのデータ重み計算部22で求めた複数のデータ重みtに基づいて、出力値予測モデルy=f(aj,Xj)を重み付重回帰法によって求める場合における前記重み付重回帰法の重みWを計算し(ステップS13)、パラメータ計算部32によって、出力値予測モデルy=f(aj,Xj)の係数パラメータaiを求める(ステップS14)。そして、予測値計算部4aは、モデル計算部3aで同定された出力値予測モデル(aj,Xj)に、予測対象データX0jを代入することによって予測対象データX0jの予測値yp0を求める(ステップS15)。
Returning to FIG. 2, next, the model calculation unit 3a uses the
より具体的には、出力値予測モデルy=f(aj,Xj)は、例えば、係数パラメータajとする入力変数X=[x1、x2、・・・、xn]の線形多項式で表され、これを重み付重回帰法によって求める場合において、出力変数Y、入力変数Xおよびデータ重みtは、式2で表され、重みWは、式3で表される。そして、係数パラメータajは、式4によって表される。したがって、この式4によって表される係数パラメータajを用いた出力値予測モデルy=f(aj,Xj)に予測対象データX0jを代入することによって、式5で示すように、予測値yp0が求まる。
More specifically, the output value prediction model y = f (a j, X j) , for example, the input variable X = the coefficient parameter a j [x 1, x 2 , ···, x n] linear When expressed by a polynomial and obtained by a weighted multiple regression method, the output variable Y, the input variable X, and the data weight t are expressed by Expression 2, and the weight W is expressed by Expression 3. The coefficient parameter a j is expressed by Equation 4. Therefore, by substituting the prediction target data X 0j into the output value prediction model y = f (a j , X j ) using the coefficient parameter a j represented by this equation 4, as shown in
そして、このように求められた予測対象データX0jの予測値yp0が出力部6に出力される。
Then, the predicted value y p0 of the prediction target data X 0j obtained in this manner is output to the
このように本実施形態の出力値予測装置Sa、出力値予測装置Saによって実行される出力値予測方法および出力値予測装置Saに実装される出力値予測プログラムでは、未測定データ項目のデータ値に、全項目測定過去実績データ(Xj、Y)の全ての前記未測定データ項目に対応するデータ項目のデータ値が用いられる。このため、使用可能な過去実績データ(Xj、Y)の個数がより増大するため、このような構成の出力値予測装置Sa、前記出力値予測方法および前記出力値予測プログラムは、データ値が欠落したデータ項目を含む過去実績データ(Xj、Y)を使用する場合に、より高い予測精度で出力値の予測値を求めることができる。 As described above, in the output value prediction apparatus Sa of this embodiment, the output value prediction method executed by the output value prediction apparatus Sa, and the output value prediction program implemented in the output value prediction apparatus Sa, the data value of the unmeasured data item is set. The data values of the data items corresponding to all the unmeasured data items of the all item measurement past performance data (X j , Y) are used. For this reason, since the number of usable past performance data (X j , Y) further increases, the output value prediction device Sa, the output value prediction method, and the output value prediction program having such a configuration have data values. When past performance data (X j , Y) including missing data items is used, a predicted value of an output value can be obtained with higher prediction accuracy.
また、本実施形態の出力値予測装置Sa、前記出力値予測方法および前記出力値予測プログラムでは、前記複数の全項目測定過去実績データ(Xj、Y)の各データ重みtは、所定の定数(上述の例では1)とされ、前記複数の複写一部項目未測定過去実績データ(Xj、Y)の各データ重みは、前記所定の定数を前記複数の全項目測定過去実績データの個数で除算した値とされる。このようにデータ値を補う必要のない前記複数の全項目測定過去実績データ(Xj、Y)とデータ値を補った前記複数の複写一部項目未測定過去実績データ(Xj、Y)とは、データ重みtの値を互いに異なる値とすることによって差別化されるので、このような構成の出力値予測装置Sa、前記出力値予測方法および前記出力値予測プログラムは、データ値が欠落したデータ項目を含む過去実績データ(Xj、Y)を使用する場合に、より高い予測精度で出力値の予測値を求めることができる。 In the output value prediction apparatus Sa, the output value prediction method, and the output value prediction program of the present embodiment, each data weight t of the plurality of all-item measurement past performance data (X j , Y) is a predetermined constant. (1 in the above example), and each data weight of the plurality of copy partial item unmeasured past performance data (X j , Y) is the number of the plurality of all item measurement past performance data. The value divided by. In this way, the plurality of all-item measured past performance data (X j , Y) that do not need to be supplemented with data values, and the plurality of copy partial item unmeasured past performance data (X j , Y) supplemented with data values, Are differentiated by making the values of the data weights t different from each other, the output value prediction device Sa, the output value prediction method, and the output value prediction program having such a configuration lack data values. When using past performance data (X j , Y) including data items, the predicted value of the output value can be obtained with higher prediction accuracy.
次に、別の実施形態について説明する。
(第2実施形態)
図6は、第2実施形態における出力値予測装置の構成を示すブロック図である。図7は、第2実施形態における出力値予測装置の動作を示すフローチャートである。図8は、第2実施形態の出力値予測装置における予測対象データと過去実績データデータベース部に記憶される過去実績データとを説明するための図である。図9は、第2実施形態の出力値予測装置における全項目測定データデータベースに記憶される全項目測定過去実績データと欠損データデータベースに記憶される一部項目未測定過去実績データとを説明するための図である。
Next, another embodiment will be described.
(Second Embodiment)
FIG. 6 is a block diagram illustrating a configuration of an output value prediction apparatus according to the second embodiment. FIG. 7 is a flowchart showing the operation of the output value prediction apparatus in the second embodiment. FIG. 8 is a diagram for explaining prediction target data and past performance data stored in the past performance data database unit in the output value prediction apparatus of the second embodiment. FIG. 9 is a diagram for explaining all item measurement past performance data stored in the all item measurement data database and partial item unmeasured past performance data stored in the missing data database in the output value prediction apparatus of the second embodiment. FIG.
第1実施形態における出力値予測装置Saは、複数の全項目測定過去実績データ(Xj、Y)および複数の複写一部項目未測定過去実績データ(Xj、Y)に基づいて、出力値予測モデルy=f(aj,Xj)を同定し、この同定された出力値予測モデルy=f(aj,Xj)に予測対象データX0jを代入することによって予測対象データX0jの予測値yp0を求めたが、第2実施形態における出力値予測装置Sbは、複数の全項目測定過去実績データ(Xj、Y)および複数の複写一部項目未測定過去実績データ(Xj、Y)の各データ重みt、複数の全項目測定過去実績データ(Xj、Y)および複数の複写一部項目未測定過去実績データ(Xj、Y)の予測対象データX0jとの各類似度、および、複数の全項目測定過去実績データ(Xj、Y)および複数の複写一部項目未測定過去実績データ(Xj、Y)における前記予測値yp0に対応するデータ項目の各データ値(出力変数Yのデータ値)に基づいて、予測対象データX0jの予測値yp0を求めるものである。また、第2実施形態における出力値予測装置Sbは、いわゆるジャストインタイムモデリングである。 The output value prediction device Sa in the first embodiment outputs an output value based on a plurality of all-item measured past performance data (X j , Y) and a plurality of copy partial item unmeasured past performance data (X j , Y). predictive model y = f (a j, X j) identified, the identified output value prediction model y = f (a j, X j) prediction target data X 0j by substituting the predicted target data X 0j in of was calculated predicted value y p0, the output value prediction apparatus Sb of the second embodiment, a plurality of all items measured historical performance data (X j, Y) and a plurality of copying some items unmeasured historical performance data (X j , Y) with each data weight t, a plurality of all-item measured past performance data (X j , Y), and a plurality of copy partial item unmeasured past performance data (X j , Y) with prediction target data X 0j Each similarity and multiple items overmeasured Each data value (data value of output variable Y) of the data item corresponding to the predicted value yp0 in the past record data ( Xj , Y) and a plurality of copy partial item unmeasured past record data ( Xj , Y) based on, and requests the predicted value y p0 of the prediction target data X 0j. The output value prediction device Sb in the second embodiment is so-called just-in-time modeling.
このような第2実施形態の出力値予測装置Sbは、例えば、図6に示すように、補完部2a、モデル計算部3bおよび予測値計算部4bを備えて構成され、さらに、本実施形態では、分離部1、入力部5および出力部6を備えている。
Such an output value prediction device Sb of the second embodiment is configured to include, for example, a
この第2実施形態の出力値予測装置Sbにおける分離部1、補完部2a、入力部5および出力部6は、それぞれ、第1実施形態の出力値予測装置Saにおける分離部1、補完部2a、入力部5および出力部6と同様であるので、その説明を省略する。
The
モデル計算部3bは、分離部1に記憶されている過去実績データ(Xj、Y)に基づいて、予測対象データX0jの予測値yp0を求めるために必要なものを求めるものである。モデル計算部3bは、本実施形態では、前記複数の全項目測定過去実績データ(Xj、Y)および前記複数の複写一部項目未測定過去実績データ(Xj、Y)のそれぞれについて、予測対象データX0jとの距離diを求める距離計算部33と、前記複数の全項目測定過去実績データ(Xj、Y)および前記複数の複写一部項目未測定過去実績データ(Xj、Y)のそれぞれについて、距離計算部33で求められた距離diに基づいて予測対象データX0jとの類似度wiを求める類似度計算部34とを備えている。
予測値計算部4aは、前記複数の全項目測定過去実績データ(Xj、Y)および前記複数の複写一部項目未測定過去実績データ(Xj、Y)のそれぞれについて、補完部2aのデータ重み計算部22で求められたデータ重みt、モデル計算部3bの類似度計算部34で求められた類似度wi、複数の全項目測定過去実績データ(Xj、Y)および複数の複写一部項目未測定過去実績データ(Xj、Y)における前記予測値yp0に対応するデータ項目の各データ値(出力変数Yのデータ値)に基づいて、予測対象データX0jの予測値yp0を求めるものである。
The predicted
次に、この出力値予測装置Sbの動作について説明する。出力値予測装置Sbは、例えば、ユーザの操作によって入力部5から起動コマンドを受け付けると、出力値予測プログラムを実行する。この出力予測プログラムの実行によって、コンピュータに補完部2a、モデル計算部3bおよび予測値計算部4bが機能的に構成される。そして、出力値予測装置Sbは、以下の動作によって、過去実績データ(Xj、Y)に基づいて予測対象データXp0から出力値(予測値)yp0を予測する。
Next, the operation of the output value prediction device Sb will be described. For example, when an output command is received from the
この出力Ypの予測に当たって、出力値予測装置Sbの分離部1における過去実績データDB部11には、例えば、図8(A)に示すように表形式(テーブル形式)で過去実績データ(Xj、Y)が予め記憶され、入力部5から入力されることによって予測対象データXp0が図8(B)に示すように記憶されている。この図8(A)に示す過去実績データテーブル2000は、実測された出力値yjを登録する出力フィールド201、類似度変数zjiを登録する類似要因データフィールド202、過去実績データ(Xj、Y)の予測対象データX0jに対する距離diを登録する距離フィールド203、および、この距離diに基づいて求められた過去実績データ(Xj、Y)の予測対象データX0jに対する類似度wiを登録する類似度フィールド204を備えて構成され、過去実績データ(Xj、Y)ごとにレコードを備えている。類似要因データフィールド202は、類似要因Zの要素の個数mに応じた類似要因データ項目サブフィールド201−1〜201−mを備えている。
In the prediction of the output Y p, in the past
この類似度wi(距離di)を算出するために用いられる類似度変数zjiは、このデータ項目が類似していれば結果(出力)も類似すると経験的に分かっている変数であり、前記所定の出力Yに関与する要因Xの全部xまたは一部xであり、また前記所定の出力Yに関与する要因Xの全部または一部である前記Zと、一致していてもよく、また不一致であってもよく、また一部一致(一部不一致)であってもよい。 The similarity variable z ji used for calculating the similarity w i (distance d i ) is a variable that is empirically known that the result (output) is similar if this data item is similar, All or part x of the factor X related to the predetermined output Y, and may coincide with the Z which is the whole or part of the factor X related to the predetermined output Y, and They may be mismatched or partially matched (partially mismatched).
そして、本実施形態では、過去実績データテーブル2000には、第1ないし第n類似要因データ項目の中にデータ値を持たない未測定データ項目を含む過去実績データ(一部項目未測定過去実績データ)(Zj、Y)が存在している。図8(A)に示す例では、第1番目の過去実績データ(Zj、Y)が一部項目未測定過去実績データであり、その第1類似要因データ項目Z1は、そのデータ値が抜けており、そのデータ値を持っていない。このため、その距離diおよび類似度wiもそのデータ値が抜けており、そのデータ値を持っていない。 In the present embodiment, the past performance data table 2000 includes past performance data including unmeasured data items having no data values in the first to nth similar factor data items (partial item unmeasured past performance data). ) (Z j , Y). In the example shown in FIG. 8A, the first past performance data (Z j , Y) is part item unmeasured past performance data, and the data value of the first similarity factor data item Z 1 is Missing and does not have that data value. Therefore, the distance d i and the similarity w i are also missing data values, do not have that data value.
このような過去実績データ(Zj、Y)が分離部1の過去実績データDB部11に記憶されている場合において、出力値予測装置Sbは、図7に示すように、まず、分離部1のデータ分離部12によって、上述した図2に示すステップS11の処理と同様に、過去実績データ(Zj、Y)を、全項目測定過去実績データ(Zj、Y)と一部項目未測定過去実績データ(Zj、Y)とに分け、それぞれ、全項目測定データDB部14と欠損データDB部13とに格納する(S31)。
In the case where such past performance data (Z j , Y) is stored in the past performance
例えば、図8(A)に示す例では、第1類似要因データ項目Z1のデータ値が抜けている第1番目の過去実績データ(z1j、y1)が一部項目未測定過去実績データであり、図9(B)に示す一部項目未測定過去実績データテーブル2003に格納され、第2番目ないし第2番目の過去実績データ(z2j、y2)〜(znj、yn)が全項目測定過去実績データであり、図9(A)に示す全項目測定過去実績データテーブル2002に格納される。この全項目測定過去実績データテーブル2002は、図8(A)に示す過去実績データテーブル2000と同様に、実測された出力値yjを登録する出力フィールド221、類似度変数zjiを登録する類似要因データフィールド222(222−1〜222−m)、過去実績データ(Zj、Y)の予測対象データX0jに対する距離diを登録する距離フィールド223、および、この距離diに基づいて求められた過去実績データ(Zj、Y)の予測対象データX0jに対する類似度wiを登録する類似度フィールド224を備えて構成され、さらに、データ重みtjを登録するデータ重みフィールド225を備え、全項目測定過去実績データ(Xj、Y)ごとにレコードを備えている。また、この一部項目未測定過去実績データテーブル2003は、図8(A)に示す過去実績データテーブル2000と同様に、実測された出力値yjを登録する出力フィールド231、類似度変数zjiを登録する類似要因データフィールド232(232−1〜232−m)、過去実績データ(Zj、Y)の予測対象データX0jに対する距離diを登録する距離フィールド233、および、この距離diに基づいて求められた過去実績データ(Zj、Y)の予測対象データX0jに対する類似度wiを登録する類似度フィールド234を備えて構成され、さらに、データ重みtjを登録するデータ重みフィールド235を備え、一部項目未測定過去実績データ(Zj、Y)の個数に全項目測定過去実績データ(Zj、Y)の個数を乗じた数のレコードを備えている。なお、このステップS31の段階では、距離di、類似度wi、データ重みtが次のステップS32ないしステップS34で計算されるので、そのデータ値は、登録されていない。
For example, in the example shown in FIG. 8A, the first past performance data (z 1j , y 1 ) from which the data value of the first similar factor data item Z 1 is missing is partly unmeasured past performance data. The second to second past record data (z 2j , y 2 ) to (z nj , y n ) are stored in the partial item unmeasured past record data table 2003 shown in FIG. 9B. Is the all item measurement past result data, and is stored in the all item measurement past result data table 2002 shown in FIG. Similar to the past performance data table 2000 shown in FIG. 8A, the all-item measurement past performance data table 2002 is similar to the
次に、出力値予測装置Sbは、補完部2aによって、上述した図2に示すステップS12の処理と同様に、一部項目未測定過去実績データ(Zj、Y)における未測定データ項目のデータ値を、複数の全項目測定過去実績データ(Zj、Y)における前記未測定データ項目に対応するデータ項目のデータ値で補い、これら複数の全項目測定過去実績データ(Zj、Y)および未測定データ項目のデータ値をそれぞれ補った複数の複写一部項目未測定過去実績データ(Zj、Y)の各データのデータ重みtを計算する(S32)。
Next, the output value predicting device Sb uses the
次に、モデル計算部3bは、距離計算部33によって、前記複数の全項目測定過去実績データ(Zj、Y)および前記複数の複写一部項目未測定過去実績データ(Zj、Y)のそれぞれについて、予測対象データX0jとの距離diを計算する(ステップS33)。この距離diは、両データ間の関連性を表すように定義され、例えば、ユークリッド距離や、重み付きユークリッド距離や、正規化ユークリッド距離等が用いられる。本実施形態では、式6によって定義される重み付き距離diが用いられる。式6−1は、全項目測定過去実績データ(Zj、Y)に対し、その予測対象データX0jとの距離diを計算する場合に用いられ、式6−2は、複写一部項目未測定過去実績データ(Zj、Y)に対し、その予測対象データX0jとの距離diを計算する場合に用いられる。kは、第k番目の複写一部項目未測定過去実績データ(Zj、Y)であることを示す。なお、式6−1に代え、式6−3が用いられてもよい。
Next, the
ここで、hj(j=1〜m)は、重み付き距離diにおける重みであり、どの類似要因データ項目zjの近さを重要視するかを決める調整パラメータである。この重みhjは、公知の手法を用いて決定することができ、例えば、特許第3943841号明細書に開示されているように重回帰分析によって求めることができ、また例えば、特許第3912215号明細書に開示されているように、各データ項目をその統計値(例えば平均値や標準偏差)によって正規化しておくことによって求めることができる。 Here, h j (j = 1 to m) is a weight at the weighted distance d i , and is an adjustment parameter that determines which similarity factor data item z j is important. The weight h j can be determined by using a known method, and can be obtained by, for example, multiple regression analysis as disclosed in Japanese Patent No. 393441, and for example, Japanese Patent No. 3912215. As disclosed in the document, each data item can be obtained by normalizing it with its statistical value (for example, average value or standard deviation).
次に、モデル計算部3bは、類似度計算部34によって、前記複数の全項目測定過去実績データ(Zj、Y)および前記複数の複写一部項目未測定過去実績データ(Zj、Y)のそれぞれについて、距離計算部33で求められた距離diに基づいて予測対象データX0jとの類似度wiを求める(ステップS34)。この類似度wjは、両データがどの程度似ているかを表す指標であり、例えば、前記重み付きユークリッド距離djが小さいほど類似度wjが大きく、かつ、正の値を取るように、定義される。類似度wjは、例えば、式7のように定義される。式7−1は、全項目測定過去実績データ(Zj、Y)に対し、その予測対象データX0jとの類似度wiを計算する場合に用いられ、式7−2は、複写一部項目未測定過去実績データ(Zj、Y)に対し、その予測対象データX0jとの類似度wiを計算する場合に用いられる。kは、第k番目の複写一部項目未測定過去実績データ(Zj、Y)であることを示す。
Next, the
ここで、αは、調整パラメータである。 Here, α is an adjustment parameter.
そして、予測値計算部4bは、前記複数の全項目測定過去実績データ(Zj、Y)および前記複数の複写一部項目未測定過去実績データ(Zj、Y)のそれぞれについて、補完部2aのデータ重み計算部22で求められたデータ重みtj、モデル計算部3bの類似度計算部34で求められた類似度wi、複数の全項目測定過去実績データ(Xj、Y)および複数の複写一部項目未測定過去実績データ(Xj、Y)における前記予測値yp0に対応するデータ項目の各データ値(出力変数Yのデータ値yj)に基づいて、予測対象データX0jの予測値yp0を求める(ステップS35)。
The predicted
より具体的には、予測値計算部4bは、式8で示すように、前記複数の全項目測定過去実績データ(Zj、Y)および前記複数の複写一部項目未測定過去実績データ(Zj、Y)のそれぞれについての、補完部2aのデータ重み計算部22で求められた各データ重みtjおよびモデル計算部3bの類似度計算部34で求められた各類似度wiで、複数の全項目測定過去実績データ(Xj、Y)および複数の複写一部項目未測定過去実績データ(Xj、Y)における前記予測値yp0に対応するデータ項目の各データ値(出力変数Yのデータ値yj)を重み付けすることによって、予測対象データX0jの予測値yp0を求める。
More specifically, as shown in Expression 8, the predicted
そして、このように求められた予測対象データX0jの予測値yp0が出力部6に出力される。
Then, the predicted value y p0 of the prediction target data X 0j obtained in this manner is output to the
このように本実施形態の出力値予測装置Sb、出力値予測装置Sbによって実行される出力値予測方法および出力値予測装置Sbに実装される出力値予測プログラムでは、未測定データ項目のデータ値に、全項目測定過去実績データ(Zj、Y)の全ての前記未測定データ項目に対応するデータ項目のデータ値が用いられる。このため、使用可能な過去実績データ(Zj、Y)の個数がより増大するため、このような構成の出力値予測装置Sb、前記出力値予測方法および前記出力値予測プログラムは、データ値が欠落したデータ項目を含む過去実績データ(Zj、Y)を使用する場合に、より高い予測精度で出力値の予測値を求めることができる。 As described above, in the output value prediction device Sb, the output value prediction method executed by the output value prediction device Sb, and the output value prediction program implemented in the output value prediction device Sb, the data value of the unmeasured data item is set. , Data values of data items corresponding to all the unmeasured data items of all item measurement past performance data (Z j , Y) are used. For this reason, since the number of usable past performance data (Z j , Y) further increases, the output value prediction apparatus Sb, the output value prediction method, and the output value prediction program having such a configuration have data values. When past performance data (Z j , Y) including missing data items is used, a predicted value of an output value can be obtained with higher prediction accuracy.
また、本実施形態の出力値予測装置Sb、前記出力値予測方法および前記出力値予測プログラムでは、前記複数の全項目測定過去実績データ(Zj、Y)の各データ重みtjは、所定の定数(上述の例では1)とされ、前記複数の複写一部項目未測定過去実績データ(Zj、Y)の各データ重みtjは、前記所定の定数を前記複数の全項目測定過去実績データの個数で除算した値とされる。このようにデータ値を補う必要のない前記複数の全項目測定過去実績データ(Zj、Y)とデータ値を補った前記複数の複写一部項目未測定過去実績データ(Zj、Y)とは、データ重みtjの値を互いに異なる値とすることによって差別化されるので、このような構成の出力値予測装置Sb、前記出力値予測方法および前記出力値予測プログラムは、データ値が欠落したデータ項目を含む過去実績データ(Zj、Y)を使用する場合に、より高い予測精度で出力値の予測値を求めることができる。 In the output value prediction device Sb, the output value prediction method, and the output value prediction program of the present embodiment, each data weight t j of the plurality of all item measurement past performance data (Z j , Y) is a predetermined value. A constant (1 in the above example) is used, and each data weight t j of the plurality of copy partial item unmeasured past performance data (Z j , Y) is the predetermined constant as the plurality of all item measurement past performances. The value is divided by the number of data. In this way, the plurality of all-item measured past performance data (Z j , Y) that do not need to be supplemented with data values, and the plurality of copied partial item unmeasured past performance data (Z j , Y) supplemented with data values, Are differentiated by making the values of the data weights t j different from each other, the output value prediction device Sb, the output value prediction method, and the output value prediction program having such a configuration are missing data values. When the past performance data (Z j , Y) including the data item is used, the predicted value of the output value can be obtained with higher prediction accuracy.
そして、本実施形態の出力値予測装置Sb、前記出力値予測方法および前記出力値予測プログラムでは、予測値yp0を求める場合に、類似度wjが用いられるので、このような構成の出力値予測方法Sb、前記出力値予測方法および前記出力値予測プログラムは、データ値が欠落したデータ項目を含む過去実績データ(Zj、Y)を使用する場合に、さらにより高い予測精度で出力値の予測値を求めることができる。 In the output value prediction device Sb, the output value prediction method, and the output value prediction program of the present embodiment, the similarity value w j is used when obtaining the predicted value yp0. The prediction method Sb, the output value prediction method, and the output value prediction program, when using past performance data (Z j , Y) including data items with missing data values, output values with higher prediction accuracy. A predicted value can be obtained.
次に、別の実施形態について説明する。
(第3実施形態)
図10は、第3実施形態における出力値予測装置の構成を示すブロック図である。図11は、第3実施形態における出力値予測装置の動作を示すフローチャートである。図12は、第3実施形態の出力値予測装置における過去実績データデータベース部に記憶される過去実績データを説明するための図である。図13は、第3実施形態の出力値予測装置における全項目測定データデータベースに記憶される全項目測定過去実績データと欠損データデータベースに記憶される一部項目未測定過去実績データとを説明するための図である。図14は、第3実施形態における出力値予測装置の補完動作を説明するための図である。
Next, another embodiment will be described.
(Third embodiment)
FIG. 10 is a block diagram illustrating a configuration of an output value prediction apparatus according to the third embodiment. FIG. 11 is a flowchart showing the operation of the output value prediction apparatus in the third embodiment. FIG. 12 is a diagram for explaining past performance data stored in a past performance data database unit in the output value prediction apparatus of the third embodiment. FIG. 13 is a diagram for explaining all item measurement past performance data stored in the all item measurement data database and some item unmeasured past performance data stored in the missing data database in the output value prediction apparatus of the third embodiment. FIG. FIG. 14 is a diagram for explaining a complementary operation of the output value prediction apparatus according to the third embodiment.
第1実施形態における出力値予測装置Saは、複数の全項目測定過去実績データ(Xj、Y)および複数の複写一部項目未測定過去実績データ(Xj、Y)に基づいて、出力値予測モデルy=f(aj,Xj)を同定し、この同定された出力値予測モデルy=f(aj,Xj)に予測対象データX0jを代入することによって予測対象データX0jの予測値yp0を求めたが、第3実施形態における出力値予測装置Scは、所与の出力値予測モデルy=f(aj,Xj)によって予測対象データX0jの予測値yp0を求め、この求めた予測値yp0を仮の予測値(暫定的な予測値)yp0とし、この仮の予測値yp0に予測対象データX0jの予測誤差ypjを加算することによって、予測対象データX0jの最終的な予測値ypreを求めるものである。ここで、予測対象データX0jの予測誤差ypjは、所与の出力値予測モデルy=f(aj,Xj)によって過去実績データ(Xj、Y)の予測値(モデル予測値)ypjを求め、この求めた過去実績データ(Xj、Y)のモデル予測値ypjと過去実績データ(Xj、Y)における前記モデル予測値ypjに対応するデータ項目のデータ値(出力変数Yのデータ値yp)との差を過去実績データ(Xj、Y)の予測誤差△jとして求め、この過去実績データ(Xj、Y)の予測誤差△jおよび過去実績データ(Xj、Y)と予測対象データX0jとの類似度wjに基づいて求められる。 The output value prediction device Sa in the first embodiment outputs an output value based on a plurality of all-item measured past performance data (X j , Y) and a plurality of copy partial item unmeasured past performance data (X j , Y). predictive model y = f (a j, X j) identified, the identified output value prediction model y = f (a j, X j) prediction target data X 0j by substituting the predicted target data X 0j in Although calculated predicted value y p0, the output value prediction unit Sc in the third embodiment, the predicted value of the predicted target data X 0j by a given output value prediction model y = f (a j, X j) y p0 And the calculated predicted value y p0 as a temporary predicted value (provisional predicted value) y p0, and by adding the prediction error y pj of the prediction target data X 0j to the temporary predicted value y p0 , Final predicted value y of the prediction target data X0j Pre is obtained. Here, the prediction error y pj prediction target data X 0j is the predicted value of the past record data (X j, Y) by a given output value prediction model y = f (a j, X j) ( model predictive value) seeking y pj, the obtained historical performance data (X j, Y) model predicted value y pj and historical performance data (X j, Y) data values of the data items corresponding to the model prediction value y pj in (the output of variable Y data values y p) and the difference between the historical performance data (X j of, calculated as the prediction error △ j of Y), the prediction error △ j and historical performance data (X this past record data (X j, Y) j , Y) and the degree of similarity w j between the prediction target data X 0j .
前記所与の出力値予測モデルy=f(aj,Xj)は、重回帰法やPLS(Partial Least Square)回帰法等によって予め求められ、出力値予測装置Scに与えられてもよいが、本実施形態の出力値予測装置Scは、予測値(最終的な予測値)を求める前に、前記所与の出力値予測モデルy=f(aj,Xj)を、その時点での過去実績データ(Xj、Y)に基づいて、重み重回帰法によって求めている。 The given output value prediction model y = f (a j , X j ) may be obtained in advance by a multiple regression method, a PLS (Partial Least Square) regression method, or the like, and may be given to the output value prediction device Sc. The output value prediction device Sc of the present embodiment calculates the given output value prediction model y = f (a j , X j ) at that time point before calculating the prediction value (final prediction value). Based on past performance data (X j , Y), the weight multiple regression method is used.
このような第3実施形態の出力値予測装置Scは、例えば、図10に示すように、補完部2a、モデル計算部3c、予測値計算部4cおよびモデル予測誤差計算部7を備えて構成され、さらに、本実施形態では、分離部1、入力部5および出力部6を備えている。
Such an output value prediction device Sc of the third embodiment includes, for example, a
この第3実施形態の出力値予測装置Scにおける分離部1、補完部2a、入力部5および出力部6は、それぞれ、第1実施形態の出力値予測装置Saにおける分離部1、補完部2a、入力部5および出力部6と同様であるので、その説明を省略する。
The separating
モデル計算部3cは、分離部1に記憶されている過去実績データ(Xj、Y)に基づいて、予測対象データX0jの最終的な予測値ypreを求めるために必要なものを求めるものである。モデル計算部3cは、本実施形態では、前記複数の全項目測定過去実績データ(Xj、Y)および前記複数の複写一部項目未測定過去実績データ(Xj、Y)のそれぞれについて、予測対象データX0jとの距離djを求める距離計算部33と、前記複数の全項目測定過去実績データ(Xj、Y)および前記複数の複写一部項目未測定過去実績データ(Xj、Y)のそれぞれについて、距離計算部33で求められた距離djに基づいて予測対象データX0jとの類似度wjを求める類似度計算部34と、前記複数の全項目測定過去実績データ(Xj、Y)および前記複数の複写一部項目未測定過去実績データ(Xj、Y)のそれぞれについて、データ重み計算部22で求められたデータ重みtjおよび類似度計算部34で求められた類似度wjに基づいて、予測対象データX0jの予測誤差ypjを求める場合に用いられる、全項目測定過去実績データ(Xj、Y)および複写一部項目未測定過去実績データ(Xj、Y)における予測誤差△jの重み(予測誤差重み)ωjを求める予測誤差重み計算部35とを備えている。
The
モデル予測誤差計算部7は、過去実績データ(Xj、Y)(前記複数の全項目測定過去実績データ(Xj、Y)および前記複数の複写一部項目未測定過去実績データ(Xj、Y))のそれぞれについて、所与の出力値予測モデルy=f(aj,Xj)によって過去実績データ(Xj、Y)のモデル予測値ypjを求め、この求めた過去実績データ(Xj、Y)のモデル予測値ypjと過去実績データ(Xj、Y)における予測値ypjに対応するデータ項目のデータ値(出力変数Yのデータ値yp)との差を過去実績データ(Xj、Y)の予測誤差△jとして求めるものである。モデル予測誤差計算部7は、この所与の出力値予測モデルy=f(aj,Xj)を重み重回帰法によって求めるべく、その時点での過去実績データ(Xj、Y)(前記複数の全項目測定過去実績データ(Xj、Y)および前記複数の複写一部項目未測定過去実績データ(Xj、Y))に基づいて出力値予測モデルy=f(aj,Xj)の係数パラメータajを求めるパラメータ計算部71と、過去実績データ(Xj、Y)(前記複数の全項目測定過去実績データ(Xj、Y)および前記複数の複写一部項目未測定過去実績データ(Xj、Y))のそれぞれについて、パラメータ計算部71で同定された出力値予測モデルy=f(aj,Xj)によって過去実績データ(Xj、Y)のモデル予測値ypjを求めるモデル予測値計算部72と、この求めた過去実績データ(Xj、Y)のモデル予測値ypjと過去実績データ(Xj、Y)における前記モデル予測値ypjに対応するデータ項目のデータ値(出力変数Yのデータ値yp)との差を過去実績データ(Xj、Y)の予測誤差△jとして求めるモデル誤差計算部73とを備えて構成されている。
The model prediction
予測値計算部4cは、過去実績データ(Xj、Y)(前記複数の全項目測定過去実績データ(Xj、Y)および前記複数の複写一部項目未測定過去実績データ(Xj、Y))のそれぞれについての、データ重み計算部22で求めた各データ重みtj、類似度計算部34で求めた各類似度wjおよびモデル誤差計算部73で求めた過去実績データ(Xj、Y)の各予測誤差△jに基づいて、予測対象データX0jの最終的な予測値ypreにおける予測誤差△0を求め、パラメータ計算部71によって同定された出力値予測モデルy=f(aj,Xj)に予測対象データX0jを代入することによって求められた仮の予測値yp0と予測対象データX0jの最終的な予測値ypreにおける予測誤差△0との和を求めることで前記最終的な予測値ypreを求めるものである。より具体的には、予測値計算部4cは、データ重み計算部22で求めた各データ重みtjおよび類似度計算部34で求めた各類似度wjで、モデル誤差計算部73で求めた過去実績データ(Xj、Y)の各予測誤差△jを重み付けすることによって、予測対象データX0jの最終的な予測値ypreにおける予測誤差△0を求めるものである。
The predicted
次に、この出力値予測装置Scの動作について説明する。出力値予測装置Scは、例えば、ユーザの操作によって入力部5から起動コマンドを受け付けると、出力値予測プログラムを実行する。この出力予測プログラムの実行によって、コンピュータに補完部2a、モデル計算部3b、予測値計算部4bおよびモデル予測誤差計算部7が機能的に構成される。そして、出力値予測装置Scは、以下の動作によって、過去実績データ(Xj、Y)に基づいて予測対象データXp0から出力値(予測値)ypreを予測する。
Next, the operation of the output value prediction device Sc will be described. For example, when an output command is received from the
この出力Ypの予測に当たって、出力値予測装置Scの分離部1における過去実績データDB部11には、例えば、図12に示すように表形式(テーブル形式)で過去実績データ(Xj、Y)が予め記憶され、入力部5から入力されることによって予測対象データXp0が記憶されている。この図12に示す過去実績データテーブル3000は、実測された出力値yjを登録する出力フィールド301、前記所定の出力Yに関与する要因Xのデータxjiを登録する要因データフィールド302、過去実績データ(Xj、Y)のモデル予測値ypjを登録するモデル予測値フィールド303、過去実績データ(Xj、Y)の予測誤差△jを登録する予測誤差フィールド304と、類似度変数zjiを登録する類似要因データフィールド305、過去実績データ(Xj、Y)の予測対象データX0jに対する距離diを登録する距離フィールド306、および、この距離diに基づいて求められた過去実績データ(Xj、Y)の予測対象データX0jに対する類似度wiを登録する類似度フィールド307を備えて構成され、過去実績データ(Xj、Y)ごとにレコードを備えている。要因データフィールド302は、要因Xの要素の個数nに応じた要因データ項目サブフィールド302−1〜302−nを備えている。類似要因データフィールド305は、類似要因Zの要素の個数mに応じた類似要因データ項目サブフィールド305−1〜305−mを備えている。
In the prediction of the output Y p, in the past
そして、本実施形態では、過去実績データテーブル3000には、データ項目の中にデータ値を持たない未測定データ項目を含む過去実績データ(一部項目未測定過去実績データ)(Xj、Y)が存在している。図12に示す例では、第1および第2番目等の(N−L)個の過去実績データ(Xj、Y)が一部項目未測定過去実績データであり、第1番目の過去実績データ(Xj、Y)の出力フィールド(第1番目のデータ項目)301は、そのデータ値が抜けており、そのデータ値を持っておらず、第2要因データ項目サブフィールド(第3番目のデータ項目)302−2は、そのデータ値が抜けており、そのデータ値を持っておらず、第2番目の過去実績データ(Xj、Y)の第1および第2要因データ項目サブフィールド(第2および第3番目のデータ項目)302−1、302−2は、それらデータ値が抜けており、それらデータ値を持っていない。このため、過去実績データ(Xj、Y)のモデル予測値ypjや予測誤差△jもそのデータ値が抜けており、そのデータ値を持っていない。 In the present embodiment, the past performance data table 3000 includes past performance data (partially unmeasured past performance data) (X j , Y) including unmeasured data items having no data value in the data items. Is present. In the example shown in FIG. 12, the first and second (NL) pieces of past performance data (X j , Y) are unmeasured past performance data for some items, and the first past performance data. The output field (first data item) 301 of (X j , Y) is missing the data value, does not have the data value, and the second factor data item subfield (third data item). Item) 302-2 has a missing data value, does not have the data value, and the first and second factor data item subfields of the second past performance data (X j , Y) The second and third data items) 302-1 and 302-2 are missing their data values and do not have those data values. For this reason, the model predicted value y pj and the prediction error Δ j of the past performance data (X j , Y) are missing, and do not have the data value.
このような過去実績データ(Xj、Y)が分離部1の過去実績データDB部11に記憶されている場合において、出力値予測装置Scは、図11に示すように、まず、分離部1のデータ分離部12によって、上述した図2に示すステップS11の処理と同様に、過去実績データ(Xj、Y)を、全項目測定過去実績データ(Xj、Y)と一部項目未測定過去実績データ(Xj、Y)とに分け、それぞれ、全項目測定データDB部14と欠損データDB部13とに格納する(S41)。
In the case where such past performance data (X j , Y) is stored in the past performance
例えば、図11に示す例では、第1および第2番目等の(N−L)個の過去実績データ(Xj、Y)が一部項目未測定過去実績データであり、図13(B)に示す一部項目未測定過去実績データテーブル3002に格納され、残余のL個の過去実績データ(Xj、Y)が全項目測定過去実績データであり、図13(A)に示す全項目測定過去実績データテーブル3001に格納される。これら全項目測定過去実績データテーブル3001の各フィールド311〜317および一部項目未測定過去実績データテーブル302の各フィールド321〜327は、図12に示す過去実績データテーブル3000の各フィールド301〜307と同様である。なお、このステップS41の段階では、過去実績データ(Xj、Y)のモデル予測値ypj、予測誤差△j、距離diおよび類似度wiが以降のステップで計算されるので、そのデータ値は、登録されていない。
For example, in the example shown in FIG. 11, the (N−L) number of past performance data (X j , Y) such as the first and second, etc. are some item unmeasured past performance data, and FIG. Are stored in the unmeasured past performance data table 3002 for some items, and the remaining L past performance data (X j , Y) are all item measurement past performance data, and all item measurements shown in FIG. Stored in the past performance data table 3001. The
次に、出力値予測装置Scは、補完部2aによって、上述した図2に示すステップS12の処理と同様に、一部項目未測定過去実績データ(Xj、Y)における未測定データ項目のデータ値を、複数の全項目測定過去実績データ(Xj、Y)における前記未測定データ項目に対応するデータ項目のデータ値で補い、これら複数の全項目測定過去実績データ(Xj、Y)および未測定データ項目のデータ値をそれぞれ補った複数の複写一部項目未測定過去実績データ(Xj、Y)の各データのデータ重みtjを計算する(S42)。第1実施形態で説明したように、全項目測定過去実績データ(Xj、Y)の各データ重みtjは、互いに等しい所定の定数(例えば、1)とされ、一部項目未測定過去実績データ(Xj、Y)の各データ重みtjは、前記所定の定数を前記複数の全項目測定過去実績データ(Xj、Y)の個数で除算した値(前記例ではti(k)=1/(全項目測定過去実績データの個数=L、Σti(k)=1、Σはti(k)の1からLまでの和))とされる。図14には、ステップS42を実行した後における、全項目測定過去実績データ(Xj、Y)を登録する全項目測定過去実績データテーブル303(図14(A))、および、一部項目未測定過去実績データ(Xj、Y)を登録する一部項目未測定過去実績データテーブル3004(図14(B))が示されている。これら全項目測定過去実績データテーブル303および一部項目未測定過去実績データテーブル3004は、それぞれ、図12に示す過去実績データテーブル3000の各フィールド301〜307と同様の各フィールド331〜337;341〜347を備え、さらに、データ重みtjを登録するデータ重みフィールド338;348および予測誤差重みωjを登録する予測誤差重みフィールド339;349を備えている。なお、図14(B)には、第N番目の過去実績データ(第N−L番目の一部項目未測定過去実績データ)(Xj、Y)の第n要因データ項目サブフィールド342−nに、展開された補完データのデータ値が示されているが、他の補完部分も同様に補完されている。
Next, the output value prediction device Sc uses the
次に、モデル予測誤差計算部7は、パラメータ計算部71によって、その時点での過去実績データ(Xj、Y)に基づいて出力値予測モデルy=f(aj,Xj)の係数パラメータajを求めることによって、出力値予測モデルy=f(aj,Xj)を重み重回帰法によって同定し、モデル予測値計算部72によって、前記複数の全項目測定過去実績データ(Xj、Y)および前記複数の複写一部項目未測定過去実績データ(Xj、Y))のそれぞれについて、パラメータ計算部71で同定された出力値予測モデルy=f(aj,Xj)によって過去実績データ(Xj、Y)のモデル予測値ypjを求める(ステップS43)。
Next, the model prediction
次に、モデル予測誤差計算部7は、モデル誤差計算部73によって、モデル予測値計算部72で求めた過去実績データ(Xj、Y)のモデル予測値ypjと過去実績データ(Xj、Y)における前記モデル予測値ypjに対応するデータ項目のデータ値(出力変数Yのデータ値yp)との差を過去実績データ(Xj、Y)の予測誤差△j(=yj−ypj)として求める(ステップS44)。
Next, the model prediction
次に、モデル計算部3cは、距離計算部33によって、前記複数の全項目測定過去実績データ(Xj、Y)および前記複数の複写一部項目未測定過去実績データ(Xj、Y)のそれぞれについて、予測対象データX0jとの距離diを計算する(ステップS45)。この距離diは、本実施形態では、式6によって定義される重み付き距離diが用いられる。
Next, the
次に、モデル計算部3cは、類似度計算部34によって、前記複数の全項目測定過去実績データ(Xj、Y)および前記複数の複写一部項目未測定過去実績データ(Xj、Y)のそれぞれについて、距離計算部33で求められた距離diに基づいて予測対象データX0jとの類似度wiを計算する(ステップS46)。この類似度wjは、本実施形態では、式7のように定義される。
Next, the
次に、モデル計算部3cは、予測誤差重み計算部35によって、前記複数の全項目測定過去実績データ(Xj、Y)および前記複数の複写一部項目未測定過去実績データ(Xj、Y)のそれぞれについて、予測誤差重みωjを計算する(ステップS47)。
Next, the
この予測誤差重みωjは、式9に示すように、類似度wjとデータ重みtjとの積によって定義される。すなわち、複数の全項目測定過去実績データ(Xj、Y)のそれぞれについての予測誤差重みωjは、式9−1によって定義され、複数の複写一部項目未測定過去実績データ(Xj、Y)のそれぞれについての予測誤差重みωjは、式9−2によって定義される。 This prediction error weight ω j is defined by the product of the similarity w j and the data weight t j as shown in Equation 9. That is, the prediction error weight ω j for each of the plurality of all-item measured past performance data (X j , Y) is defined by Equation 9-1, and the plurality of copy partial item unmeasured past performance data (X j , The prediction error weight ω j for each of Y) is defined by Equation 9-2.
そして、予測値計算部4cは、過去実績データ(Xj、Y)(前記複数の全項目測定過去実績データ(Xj、Y)および前記複数の複写一部項目未測定過去実績データ(Xj、Y))のそれぞれについての、モデル誤差計算部73で求めた各モデル誤差△j、予測誤差重み計算部35で求めた各予測誤差重みωj、および、モデル誤差計算部73で求めた過去実績データ(Xj、Y)の各予測誤差△jに基づいて、予測対象データX0jの最終的な予測値ypreにおける予測誤差△0を求め(ステップS48)、パラメータ計算部71によって同定された出力値予測モデルy=f(aj,Xj)に予測対象データX0jを代入することによって求められた仮の予測値yp0と予測対象データX0jの最終的な予測値ypreにおける予測誤差△0との和を求めることで前記予測値ypreを求める。より具体的には、予測値計算部4cは、式10に示すように、予測誤差重み計算部35で求めた各予測誤差重みωjで、モデル誤差計算部73で求めた過去実績データ(Xj、Y)の各予測誤差△jを重み付けすることによって、予測対象データX0jの最終的な予測値ypreにおける予測誤差△0を求める。そして、予測値計算部4cは、式11に示すように、前記仮の予測値yp0と前記最終的な予測値ypreの予測誤差△0との和を求めることで前記最終的な予測値ypreを求める。
Then, the predicted
そして、このように求められた予測対象データX0jの最終的な予測値ypreが出力部6に出力される。
Then, the final predicted value y pre of the prediction target data X 0j obtained in this way is output to the
このように本実施形態の出力値予測装置Sc、出力値予測装置Scによって実行される出力値予測方法および出力値予測装置Scに実装される出力値予測プログラムでは、未測定データ項目のデータ値に、全項目測定過去実績データ(Zj、Y)の全ての前記未測定データ項目に対応するデータ項目のデータ値が用いられる。このため、使用可能な過去実績データ(Zj、Y)の個数がより増大するため、このような構成の出力値予測装置Sc、前記出力値予測方法および前記出力値予測プログラムは、データ値が欠落したデータ項目を含む過去実績データ(Zj、Y)を使用する場合に、より高い予測精度で出力値の予測値を求めることができる。 Thus, in the output value prediction device Sc of this embodiment, the output value prediction method executed by the output value prediction device Sc, and the output value prediction program implemented in the output value prediction device Sc, the data value of the unmeasured data item is set. , Data values of data items corresponding to all the unmeasured data items of all item measurement past performance data (Z j , Y) are used. For this reason, since the number of usable past performance data (Z j , Y) further increases, the output value prediction device Sc, the output value prediction method, and the output value prediction program having such a configuration have data values. When past performance data (Z j , Y) including missing data items is used, a predicted value of an output value can be obtained with higher prediction accuracy.
また、本実施形態の出力値予測装置Sc、前記出力値予測方法および前記出力値予測プログラムでは、前記複数の全項目測定過去実績データ(Zj、Y)の各データ重みtjは、所定の定数(上述の例では1)とされ、前記複数の複写一部項目未測定過去実績データ(Zj、Y)の各データ重みtjは、前記所定の定数を前記複数の全項目測定過去実績データの個数で除算した値とされる。このようにデータ値を補う必要のない前記複数の全項目測定過去実績データ(Zj、Y)とデータ値を補った前記複数の複写一部項目未測定過去実績データ(Zj、Y)とは、データ重みtjの値を互いに異なる値とすることによって差別化されるので、このような構成の出力値予測装置Sc、前記出力値予測方法および前記出力値予測プログラムは、データ値が欠落したデータ項目を含む過去実績データ(Zj、Y)を使用する場合に、より高い予測精度で出力値の予測値を求めることができる。 In the output value prediction device Sc, the output value prediction method, and the output value prediction program of the present embodiment, each data weight t j of the plurality of all-item measurement past performance data (Z j , Y) is a predetermined value. A constant (1 in the above example) is used, and each data weight t j of the plurality of copy partial item unmeasured past performance data (Z j , Y) is the predetermined constant as the plurality of all item measurement past performances. The value is divided by the number of data. In this way, the plurality of all-item measured past performance data (Z j , Y) that do not need to be supplemented with data values, and the plurality of copied partial item unmeasured past performance data (Z j , Y) supplemented with data values, Are differentiated by making the values of the data weights t j different from each other, the output value prediction device Sc, the output value prediction method, and the output value prediction program having such a configuration are missing data values. When the past performance data (Z j , Y) including the data item is used, the predicted value of the output value can be obtained with higher prediction accuracy.
そして、本実施形態の出力値予測装置Sc、前記出力値予測方法および前記出力値予測プログラムでは、複数の全項目測定過去実績データ(Zj、Y)および複数の複写一部項目未測定過去実績データ(Zj、Y)のそれぞれについて、予測対象データX0jとの類似度wjが求められ、前記各データ重みtj、前記各類似度wjおよび過去実績データ(Zj、Y)の予測誤差△jに基づいて、予測対象データX0jの最終的な予測値ypreにおける予測誤差△p0が求められ、前記最終的な予測値ypreが求められる。このように前記最終的な予測値ypreを求める場合に、前記類似度wjが用いられるので、本実施形態の出力値予測装置Sc、前記出力値予測方法および前記出力値予測プログラムは、データ値が欠落したデータ項目を含む過去実績データ(Zj、Y)を使用する場合に、さらにより高い予測精度で出力値の予測値を求めることができる。 In the output value prediction device Sc, the output value prediction method, and the output value prediction program of the present embodiment, a plurality of all item measurement past performance data (Z j , Y) and a plurality of copy partial item unmeasured past results For each of the data (Z j , Y), the similarity w j to the prediction target data X 0j is obtained, and the data weight t j , the similarity w j and the past performance data (Z j , Y) based on the prediction error △ j, the prediction error △ p0 is obtained in the final predicted value y pre prediction target data X 0j, the final prediction value y pre is calculated. Since the similarity w j is used when the final predicted value y pre is obtained in this way, the output value predicting device Sc, the output value predicting method, and the output value predicting program of the present embodiment are data When using past performance data (Z j , Y) including a data item whose value is missing, the predicted value of the output value can be obtained with even higher prediction accuracy.
なお、上述の実施形態では、過去実績データ(Xj、Y)の予測誤差△jは、過去実績データ(Xj、Y)のモデル予測値ypjと過去実績データ(Xj、Y)におけるモデル予測値ypjに対応するデータ項目のデータ値(出力変数Yのデータ値yp)との差とされたが、式12に示すように定義される場合には、式13に示すように定義されてもよい。
In the above embodiment, the prediction error △ j past actual data (X j, Y) is, in the past actual data (X j, Y) model predicted value y pj and historical performance data of the (X j, Y) data values of the data items corresponding to the model prediction value y pj have been the difference between (the data value y p of the output variable Y), if it is defined as shown in
次に、別の実施形態について説明する。
(第4実施形態)
第1ないし第3実施形態の出力値予測装置Sa〜Scでは、複数の全項目測定過去実績データ(Xj、Y)の各データ重みと複数の複写一部項目未測定過去実績データ(Xj、Y)の各データ重みとは、互いに異なる値とされ、それら両者の扱いを異ならせたが、補完される未測定データ項目の個数が異なっても同様に扱っていた。第4実施形態の出力値予測装置Sdは、補完される未測定データ項目の個数に応じてその扱いを異ならせるものである。
Next, another embodiment will be described.
(Fourth embodiment)
In the output value prediction devices Sa to Sc of the first to third embodiments, each data weight of a plurality of all item measured past performance data (X j , Y) and a plurality of copy partial item unmeasured past performance data (X j , Y) are different values from each other, and they are treated differently, but they are treated in the same way even if the number of unmeasured data items to be complemented is different. The output value predicting apparatus Sd of the fourth embodiment varies the handling according to the number of unmeasured data items to be complemented.
図15は、第4実施形態における出力値予測装置の構成を示すブロック図である。このような第4実施形態における出力値予測装置Sdは、例えば、図15に示すように、補完部2a、モデル計算部3d、予測値計算部4cおよびモデル予測誤差計算部7を備えて構成され、さらに、本実施形態では、分離部1、入力部5および出力部6を備えている。
FIG. 15 is a block diagram illustrating a configuration of an output value prediction apparatus according to the fourth embodiment. Such an output value prediction apparatus Sd in the fourth embodiment includes, for example, a
この第4実施形態の出力値予測装置Sdにおける分離部1、補完部2a、入力部5および出力部6は、それぞれ、第1実施形態の出力値予測装置Saにおける分離部1、補完部2a、入力部5および出力部6と同様であるので、その説明を省略する。そして、この第4実施形態の出力値予測装置Sdにおける予測値計算部4cは、第3実施形態の出力値予測装置Scにおける予測値計算部4cと同様であるので、その説明を省略する。
The
モデル計算部3dは、分離部1に記憶されている過去実績データ(Xj、Y)に基づいて、予測対象データX0jの最終的な予測値ypreを求めるために必要なものを求めるものである。モデル計算部3dは、本実施形態では、前記複数の全項目測定過去実績データ(Xj、Y)および前記複数の複写一部項目未測定過去実績データ(Xj、Y)のそれぞれについて、予測対象データX0jとの距離djを求める距離計算部33と、前記複数の全項目測定過去実績データ(Xj、Y)および前記複数の複写一部項目未測定過去実績データ(Xj、Y)のそれぞれについて、距離計算部33で求められた距離djに基づいて予測対象データX0jとの類似度wjを求める類似度計算部34と、前記複数の複写一部項目未測定過去実績データ(Xj、Y)のそれぞれについて、補完されたデータ項目が最終的な予測値ypreに与える影響の度合いを表す指標である補完影響度Qjを求める補完影響度計算部36と、データ重み計算部22で求められたデータ重みtj、類似度計算部34で求められた類似度wj、および、補完影響度計算部36で求められた補完影響度Qjに基づいて、予測対象データX0jの予測誤差ypjを求める場合に用いられる、全項目測定過去実績データ(Xj、Y)および複写一部項目未測定過去実績データ(Xj、Y)における予測誤差△jの重み(予測誤差重み)ωjを求める予測誤差重み計算部37とを備えている。
The
この補完影響度計算部36は、例えば、式14によって定義される補完される未測定データ項目ごとの未測定データ項目補完影響度qjを求め、そして、例えば、式15に示すように、この求めた未測定データ項目補完影響度qjを、補完された未測定データ項目の分を足し合わせることによって、補完影響度Qjを求め、そして、この求めた補完影響度Qjに基づいて補完影響度Qjによるデータ重みrjを求めるものである。式15は、第i番目の複写一部項目未測定過去実績データにおいて、データ項目Y、Xk、Xlが補完される場合の補完影響度Qjを表す式である。補完影響度Qjによるデータ重み(補完影響度データ重み)rjは、全項目測定過去実績データ(Xj、Y)では、例えば、1とされ、複写一部項目未測定過去実績データ(Xj、Y)では、調整パラメータをβとして、例えば、rj=1/exp(β×Qj)で定義される。
The complementary
ここで、式14では、各要因Xの要素jが予測誤差△jに与える影響は、出力値予測モデルy=f(aj,Xj)をその要素jで偏微分することによって求め(なお、未測定データ項目が残る場合には、その平均値とされる。例えば、出力変数Yの場合には、出力変数Yの平均値)、さらに、その未測定データ項目のばらつきの度合いを標準偏差で求めることによって定義されている。
Here, in
そして、予測誤差重み計算部37は、式16に示すように、類似度wjとデータ重みtjと補完影響度Qjとの積によって定義される予測誤差重みωjを求める。すなわち、複数の全項目測定過去実績データ(Xj、Y)のそれぞれについての予測誤差重みωjは、式16−1によって定義され、複数の複写一部項目未測定過去実績データ(Xj、Y)のそれぞれについての予測誤差重みωjは、式16−2によって定義される。
Then, as shown in Expression 16, the prediction error
このような第4実施形態における出力値予測装置Sdは、予測誤差重み計算部37が予測誤差重みωjを計算する前のいずれかにおいて、補完影響度計算部36による補完影響度Qjを計算するステップが実行される点を除き、図11を用いて説明した第3実施形態における出力値予測装置Scの動作と同様な動作を行う。
The output value predicting apparatus Sd in the fourth embodiment calculates the complementary influence degree Q j by the complementary influence
このような本実施形態における出力値予測装置Sd、出力値予測装置Sdによって実行される出力値予測方法および出力値予測装置Sdに実装される出力値予測プログラムは、第3実施形態における出力値予測装置Sc、出力値予測装置Scによって実行される出力値予測方法および出力値予測装置Scに実装される出力値予測プログラムと同様の作用効果を奏する。そして、本実施形態における出力値予測装置Sd、前記出力値予測方法および前記出力値予測プログラムでは、補完影響度Qjが用いられるので、補完の有無、補完された未測定データ項目の個数および補完された未測定データ項目の最終的な予測値ypreに与える影響の度合いが考慮される。このため、本実施形態における出力値予測装置Sd、前記出力値予測方法および前記出力値予測プログラムは、さらにより高い予測精度で出力値の予測値を求めることができる。 The output value prediction apparatus Sd in this embodiment, the output value prediction method executed by the output value prediction apparatus Sd, and the output value prediction program implemented in the output value prediction apparatus Sd are the output value prediction in the third embodiment. The same effect as the output value prediction method executed by the device Sc, the output value prediction device Sc, and the output value prediction program implemented in the output value prediction device Sc is achieved. In the output value predicting apparatus Sd, the output value predicting method, and the output value predicting program according to the present embodiment, the complementation influence degree Q j is used. The degree of influence of the determined unmeasured data item on the final predicted value y pre is taken into account. For this reason, the output value prediction device Sd, the output value prediction method, and the output value prediction program according to the present embodiment can obtain the predicted value of the output value with even higher prediction accuracy.
次に、別の実施形態について説明する。
(第5実施形態)
第1ないし第4実施形態における出力値予測装置Sa〜Sdでは、データ補完部21によって未測定データ項目のデータ値を補った複数の複写一部項目未測定過去実績データ(Xj、Y)の全てを用いたが、一部項目未測定過去実績データ(Xj、Y)における未測定データ項目を除く残余のデータ項目のデータ値では取り得ないデータ値(あり得ないデータ値)によって未測定データ項目のデータ値が補われる可能性がある。そこで、第5実施形態における出力値予測装置Seは、そのような取り得ないデータ値によって未測定データ項目のデータ値が補われた複写一部項目未測定過去実績データ(Xj、Y)を、予測値yp0または最終的な予測値ypreの算出から取り除くことによって、前記可能性を低減するものである。
Next, another embodiment will be described.
(Fifth embodiment)
In the output value prediction devices Sa to Sd in the first to fourth embodiments, a plurality of copy partial item unmeasured past performance data (X j , Y) in which the data value of the unmeasured data item is supplemented by the
図16は、第5実施形態における出力値予測装置の構成を示すブロック図である。このような第5実施形態における出力値予測装置Seは、例えば、図16に示すように、補完部2b、モデル計算部3c、予測値計算部4cおよびモデル予測誤差計算部7を備えて構成され、さらに、本実施形態では、分離部1、入力部5および出力部6を備えている。
FIG. 16 is a block diagram illustrating a configuration of an output value prediction apparatus according to the fifth embodiment. Such an output value prediction device Se in the fifth embodiment includes, for example, a
この第5実施形態の出力値予測装置Seにおける分離部1、入力部5および出力部6は、それぞれ、第1実施形態の出力値予測装置Saにおける分離部1、入力部5および出力部6と同様であるので、その説明を省略する。そして、この第5実施形態の出力値予測装置Seにおけるモデル計算部3c、予測値計算部4cおよびモデル予測誤差計算部7は、それぞれ、第3実施形態の出力値予測装置Scにおけるモデル計算部3c、予測値計算部4cおよびモデル予測誤差計算部7と同様であるので、その説明を省略する。
The
補完部2bは、一部項目未測定過去実績データ(Xj、Y)を出力値の予測に用いるべく、未測定データ項目のデータ値を全項目測定過去実績データ(Xj、Y)に基づいて補うものであって、前記取り得ないデータ値によって未測定データ項目のデータ値が補われた複写一部項目未測定過去実績データ(Xj、Y)を、予測値yp0または最終的な予測値ypreの算出から取り除くものである。補完部2bは、一部項目未測定過去実績データ(Xj、Y)を、複数の全項目過去実績データ(Xj、Y)の個数に応じた個数に複写し、これら複写した複数の一部項目未測定過去実績データ(複写一部項目未測定過去実績データ)(Xj、Y)のそれぞれについて、その未測定データ項目のデータ値を、前記複数の全項目測定過去実績データ(Xj、Y)における前記未測定データ項目に対応するデータ項目のデータ値で補うデータ補完部21と、前記取り得ないデータ値によって未測定データ項目のデータ値が補われた複写一部項目未測定過去実績データ(Xj、Y)を予測値yp0または最終的な予測値ypreの算出から取り除くべく、前記複数の全項目測定過去実績データ(Xj、Y)および複数の複写一部項目未測定過去実績データ(Xj、Y)に基づいて、未測定データ項目に補うべき値であると判断するための所定の条件として、未測定データ項目のデータ値が取り得る値△欠の範囲を求めるモデル誤差許容範囲計算部24と、これら前記複数の全項目測定過去実績データ(Xj、Y)および前記複数の複写一部項目未測定過去実績データ(Xj、Y)の各データについて、その重み(データ重みt)を求めるデータ重み計算部25とを備えている。
The
より具体的には、モデル誤差許容範囲計算部24は、類似度wi(距離di)を算出するために用いられる類似度変数zjiにおける、一部項目未測定過去実績データ(Xj、Y)と全項目測定過去実績データ(Xj、Y)間の距離Diを求める。
More specifically, the model error tolerance
この距離Diは、正規化した第i番目の一部項目未測定過去実績データ(Xj、Y)における類似度変数をzikとし、正規化した第l番目の全項目測定過去実績データ(Xj、Y)における類似度変数をzlkとする場合には、例えば、式17−1によって定義される。また例えば、この距離Diは、式17−2によって定義される。 The distance D i is a normalized variable of the l-th all items measured past results ( i.e. , the similarity variable in the i-th partial items unmeasured past results data (X j , Y) normalized). When the similarity variable in X j , Y) is z lk , it is defined by, for example, Expression 17-1. Further, for example, the distance D i is defined by Expression 17-2.
そして、モデル誤差許容範囲計算部24は、この距離Diが所定の閾値以下となる全項目測定過去実績データ(Xj、Y)を抽出し、この抽出した全項目測定過去実績データ(Xj、Y)の予測誤差△全を求め、その平均値〜△全とその標準偏差σ△全とに基づいて、未測定データ項目のデータ値が取り得る値△欠の範囲を求めるものである。この未測定データ項目のデータ値が取り得る値△欠の範囲は、例えば、式18によって定義される。
Then, the model error allowable
ここで、γは、調整パラメータである。 Here, γ is an adjustment parameter.
また、データ重み計算部25は、本実施形態では、前記複数の全項目測定過去実績データ(Xj、Y)の各データ重みtjを所定の定数(例えば、1)とするとともに、前記複数の複写一部項目未測定過去実績データ(Xj、Y)の各データ重みtjを、前記式18を満たさない場合には、0とし、前記式18を満たす場合には、前記所定の定数を前記式18を満たす前記複写一部項目未測定過去実績データの個数で除算した値(前記例では1/(前記式18を満たす前記複写一部項目未測定過去実績データの個数))とするものである。このように前記式18を満たさない場合に、その複写一部項目未測定過去実績データ(Xj、Y)の各データ重みtjを0とすることによって、前記取り得ないデータ値によって未測定データ項目のデータ値が補われた複写一部項目未測定過去実績データ(Xj、Y)が、予測値yp0または最終的な予測値ypreの算出から取り除かれ、前記可能性が低減される。
In the present embodiment, the data
このような第5実施形態における出力値予測装置Seは、大略、第3実施形態における出力値予測装置Scと同様に動作するが、前記未測定データ項目のデータ値が取り得る値△欠の範囲の算出に、モデル予測値Ypjおよび予測誤差△jが必要なことから、前記未測定データ項目のデータ値が取り得る値△欠の範囲の算出前に、モデル予測値Ypjおよび予測誤差△jの算出が実行される。すなわち、第5実施形態における出力値予測装置Seは、前記ステップS41、前記ステップS43、前記ステップS44、前記ステップS42、前記ステップS45、前記ステップS46、前記ステップS47および前記ステップS48の順に、各ステップが実行され、続いて、予測値計算部4cは、パラメータ計算部71によって同定された出力値予測モデルy=f(aj,Xj)に予測対象データX0jを代入することによって求められた仮の予測値yp0と予測対象データX0jの最終的な予測値ypreにおける予測誤差△0との和を求めることで前記予測値ypreを求め、そして、このように求められた予測対象データX0jの最終的な予測値ypreが出力部6に出力される。ここで、第5実施形態におけるステップS42では、データ重みtjは、データ重み計算部25によって、上述したように、求められる。
The output value predicting device Se in the fifth embodiment operates in substantially the same manner as the output value predicting device Sc in the third embodiment, but the value Δ missing range that the data value of the unmeasured data item can take. the calculation, since the model-predicted value Y pj and the prediction error △ j is needed, before the calculation of the range the unmeasured data data value of the item can take a value △ missing, the model predicted value Y pj and the prediction error △ Calculation of j is executed. That is, the output value predicting device Se in the fifth embodiment includes each step in the order of the step S41, the step S43, the step S44, the step S42, the step S45, the step S46, the step S47, and the step S48. Next, the predicted
このような本実施形態における出力値予測装置Se、出力値予測装置Seによって実行される出力値予測方法および出力値予測装置Seに実装される出力値予測プログラムは、第3実施形態における出力値予測装置Sc、出力値予測装置Scによって実行される出力値予測方法および出力値予測装置Scに実装される出力値予測プログラムと同様の作用効果を奏する。そして、本実施形態における出力値予測装置Se、前記出力値予測方法および前記出力値予測プログラムでは、前記取り得ないデータ値によって未測定データ項目のデータ値が補われた複写一部項目未測定過去実績データ(Xj、Y)が、予測値yp0または最終的な予測値ypreの算出から取り除かれるので、前記取り得ないデータ値によって未測定データ項目のデータ値が補われる可能性が低減される。このため、本実施形態における出力値予測装置Sd、前記出力値予測方法および前記出力値予測プログラムは、さらにより高い予測精度で出力値の予測値を求めることができる。 The output value prediction device Se in this embodiment, the output value prediction method executed by the output value prediction device Se, and the output value prediction program implemented in the output value prediction device Se are the output value prediction in the third embodiment. The same effect as the output value prediction method executed by the device Sc, the output value prediction device Sc, and the output value prediction program implemented in the output value prediction device Sc is achieved. In the output value predicting device Se, the output value predicting method, and the output value predicting program according to the present embodiment, the copy partial item unmeasured past performance in which the data value of the unmeasured data item is supplemented by the irretrievable data value. Since the data (X j , Y) is removed from the calculation of the predicted value y p0 or the final predicted value y pre , the possibility that the data value of the unmeasured data item is supplemented by the impossible data value is reduced. . For this reason, the output value prediction device Sd, the output value prediction method, and the output value prediction program according to the present embodiment can obtain the predicted value of the output value with even higher prediction accuracy.
第1ないし第5実施形態の出力値予測装置Sa〜Seは、種々の場合に適用可能であり、特に、次の場合に好適に適用される。例えば、鉄鋼製品の製造や化学製品の製造のように、比較的大規模な製造プラントで様々な製造プロセスを経て製造される製品では、例えば投入量、操作入力量および時間経過等に応じて、各製造プロセスにおける出力値や製品に直結する最終プロセスの出力値が刻々と変化することが多い。このような場合に、出力値に影響を与える要因を全て検出してその検出値を得ることは、時間、手間およびコストを要するため、しばしば、省略されることがある。例えば、転炉操業では、吹錬終了後の燐や炭素等の各成分濃度および温度を計測するケースでは、その計測が、しばしば、省略されることがある。このような場合に第1ないし第5実施形態の出力値予測装置Sa〜Seは、データ値が欠落した過去実績データを使用することができ、そして、このようなデータ値が欠落した過去実績データを使用した場合でも、より高い予測精度で予測値を求めることができるから、このような場合に好適に適用される。 The output value prediction devices Sa to Se of the first to fifth embodiments can be applied to various cases, and are particularly preferably applied to the following cases. For example, in products manufactured through various manufacturing processes in a relatively large-scale manufacturing plant, such as manufacturing of steel products and chemical products, for example, according to the input amount, operation input amount, time passage, etc. In many cases, the output value in each manufacturing process and the output value of the final process directly connected to the product change every moment. In such a case, detecting all the factors that affect the output value and obtaining the detected value is often omitted because it requires time, labor, and cost. For example, in the converter operation, in the case of measuring the concentration and temperature of each component such as phosphorus and carbon after completion of blowing, the measurement is often omitted. In such a case, the output value prediction devices Sa to Se of the first to fifth embodiments can use the past performance data lacking data values, and the past performance data lacking such data values. Even in the case where is used, it is possible to obtain a predicted value with higher prediction accuracy, and thus it is preferably applied to such a case.
本発明を表現するために、上述において図面を参照しながら実施形態を通して本発明を適切且つ十分に説明したが、当業者であれば上述の実施形態を変更および/または改良することは容易に為し得ることであると認識すべきである。したがって、当業者が実施する変更形態または改良形態が、請求の範囲に記載された請求項の権利範囲を離脱するレベルのものでない限り、当該変更形態または当該改良形態は、当該請求項の権利範囲に包括されると解釈される。 In order to express the present invention, the present invention has been properly and fully described through the embodiments with reference to the drawings. However, those skilled in the art can easily change and / or improve the above-described embodiments. It should be recognized that this is possible. Therefore, unless the modifications or improvements implemented by those skilled in the art are at a level that departs from the scope of the claims recited in the claims, the modifications or improvements are not covered by the claims. To be construed as inclusive.
Sa、Sb、Sc、Sd、Se 出力値予測装置
1 分離部
2a、2b 補完部
3a、3b、3c、3d モデル計算部
4a、4b、4c 予測値計算部
7 モデル予測誤差計算部
Sa, Sb, Sc, Sd, Se Output
Claims (11)
前記出力値予測装置が、複数のデータ項目を備える複数の過去実績データの中の前記複数のデータ項目の中にデータ値を持たない未測定データ項目を含む一部項目未測定過去実績データを、前記過去実績データの中の前記複数のデータ項目の全てにデータ値を持つ複数の全項目測定過去実績データの個数に応じた個数に複写し、前記一部項目未測定過去実績データの前記複写した各複写一部項目未測定過去実績データのそれぞれについて、前記未測定データ項目のデータ値を、前記複数の全項目測定過去実績データにおける前記未測定データ項目に対応するデータ項目のデータ値で補う補完ステップと、
前記出力値予測装置が、前記複数の全項目測定過去実績データおよび前記補完ステップでデータ値をそれぞれ補った前記複数の複写一部項目未測定過去実績データのそれぞれについて、重みを求める重み計算ステップと、
前記出力値予測装置が、前記重み計算ステップで求めた前記複数の重みと、前記複数の全項目測定過去実績データと、前記補完ステップでデータ値をそれぞれ補った複数の複写一部項目未測定過去実績データとに基づいて、予測したい予測対象データに対する出力値を予測して予測値を求める出力値予測ステップとを備え、
前記重み計算ステップは、前記複数の全項目測定過去実績データの各重みを所定の定数とするとともに、前記複数の複写一部項目未測定過去実績データの各重みを、前記所定の定数を前記複数の全項目測定過去実績データの個数で除算した値とすること
を特徴とする出力値予測方法。 An output value prediction method used in an output value prediction apparatus,
The output value prediction device includes a partial item unmeasured past performance data including an unmeasured data item having no data value in the plurality of data items in a plurality of past performance data including a plurality of data items. The plurality of data items in the past result data are copied to the number corresponding to the number of all the item measured past result data having data values, and the partial item unmeasured past result data is copied. For each copy partial item unmeasured past performance data, the data value of the unmeasured data item is supplemented with the data value of the data item corresponding to the unmeasured data item in the plurality of all item measured past performance data Steps,
A weight calculating step for obtaining a weight for each of the plurality of all-item measured past performance data and the plurality of copy partial item unmeasured past performance data each supplemented with a data value in the complementing step; ,
The output value predicting device includes the plurality of weights obtained in the weight calculation step, the plurality of all item measurement past performance data, and a plurality of copy partial items not measured past each supplemented with a data value in the complementing step. An output value prediction step for predicting an output value for the prediction target data to be predicted based on the actual data and obtaining a predicted value ,
In the weight calculation step, each weight of the plurality of all item measured past performance data is set to a predetermined constant, and each weight of the plurality of copy partial item unmeasured past performance data is set to the predetermined constant. output value prediction method to all items measured values and to Rukoto divided by the number of historical performance data and features.
入力変数と出力変数との関係を表す出力値予測モデルを前記重み計算ステップで求めた前記複数の重みを用いた重み付重回帰法によって求めるモデル計算ステップと、
前記モデル計算ステップで求められた出力値予測モデルに、前記予測対象データを代入することによって前記予測値を求める予測値計算ステップとを備えること
を特徴とする請求項1に記載の出力値予測方法。 The output value prediction step includes :
A model calculation step of obtaining the input and output variables and the weighted regression method the output value prediction model using the plurality of weights calculated by the weight calculating step which represents a relationship,
The output value prediction model which is obtained by the model calculation step, the output value prediction according to claim 1, wherein the obtaining Bei the predicted value calculation step of obtaining the prediction value by substituting the prediction target data Method.
前記複数の全項目測定過去実績データおよび前記補完ステップでデータ値をそれぞれ補った前記複数の複写一部項目未測定過去実績データのそれぞれについて、前記予測対象データとの差を表す類似度を求める類似度計算ステップと、
前記重み計算ステップで求めた前記複数の重み、前記類似度計算ステップで求めた前記複数の類似度、および、前記複数の全項目測定過去実績データおよび前記補完ステップでデータ値をそれぞれ補った前記複数の複写一部項目未測定過去実績データにおける前記予測値に対応するデータ項目の各データ値に基づいて、前記予測値を求める予測値計算ステップとを備えること
を特徴とする請求項1に記載の出力値予測方法。 The output value prediction step includes :
For each of the previous SL plurality of copying some items unmeasured historical performance data of the data value supplemented by a plurality of all items measured historical performance data and the complementary step, obtaining the degree of similarity that represents the difference between the predicted target data A similarity calculation step;
The plurality of weights obtained in the weight calculation step, the plurality of similarities obtained in the similarity calculation step, and the plurality of all-item measured past performance data and the plurality of data values supplemented in the complementing step, respectively. based of the respective data values of the data items corresponding to the predicted value in the copying part item unmeasured historical performance data, according to claim 1, wherein the obtaining Bei the predicted value calculation step of obtaining the predicted value Output value prediction method.
を特徴とする請求項3に記載の出力値予測方法。 The predicted value calculating step includes the plurality of weights obtained in the weight calculating step and the plurality of similarities obtained in the similarity calculating step, the plurality of all-item measured past performance data and the data value in the complementing step. 4. The predicted value is obtained by weighting each data value of a data item corresponding to the predicted value in the plurality of copy partial item unmeasured past performance data each supplementing each of the copy items. Output value prediction method.
前記複数の全項目測定過去実績データおよび前記補完ステップでデータ値をそれぞれ補った前記複数の複写一部項目未測定過去実績データのそれぞれについて、入力変数と出力変数との関係を表す所与の出力値予測モデルに、前記入力変数に対応するデータ項目のデータ値を代入することによって、モデル予測値を求め、前記モデル予測値と前記出力変数に対応するデータ項目のデータ値との差を予測誤差として求める予測誤差計算ステップと、
前記複数の全項目測定過去実績データおよび前記補完ステップでデータ値をそれぞれ補った前記複数の複写一部項目未測定過去実績データのそれぞれについて、前記予測対象データとの差を表す類似度を求める類似度計算ステップと、
前記重み計算ステップで求めた前記複数の重み、前記類似度計算ステップで求めた前記複数の類似度、および、前記予測誤差計算ステップで求めた前記複数の予測誤差に基づいて、前記予測対象データの予測値における予測誤差を求める予測値予測誤差計算ステップと、
前記所与の出力値予測モデルに前記予測対象データを代入することによって求められた値と前記予測値予測誤差計算ステップで求められた前記予測対象データの予測値における予測誤差との和を求めることで前記予測値を求める予測値計算ステップとを備えること
を特徴とする請求項1に記載の出力値予測方法。 The output value prediction step includes:
A given output representing a relationship between an input variable and an output variable for each of the plurality of all-item measured past performance data and each of the plurality of copied partial item unmeasured past performance data each supplemented with a data value in the complementing step A model prediction value is obtained by substituting the data value of the data item corresponding to the input variable into the value prediction model, and the difference between the model prediction value and the data value of the data item corresponding to the output variable is determined as a prediction error. A prediction error calculation step obtained as :
For each of the previous SL plurality of copying some items unmeasured historical performance data of the data value supplemented by a plurality of all items measured historical performance data and the complementary step, obtaining the degree of similarity that represents the difference between the predicted target data A similarity calculation step;
Based on the plurality of weights obtained in the weight calculation step, the plurality of similarities obtained in the similarity calculation step, and the plurality of prediction errors obtained in the prediction error calculation step, A prediction value prediction error calculation step for obtaining a prediction error in the prediction value;
Obtaining a sum of a value obtained by substituting the prediction target data into the given output value prediction model and a prediction error in a prediction value of the prediction target data obtained in the prediction value prediction error calculation step output value prediction method according to claim 1, wherein the obtaining Bei the predicted value calculation step of obtaining the predicted value in.
を特徴とする請求項5に記載の出力値予測方法。 The prediction value prediction error calculation step includes the plurality of weights obtained in the weight calculation step and the plurality of similarities obtained in the similarity calculation step, and the plurality of prediction errors obtained in the prediction error calculation step. The output value prediction method according to claim 5, wherein a prediction error in the prediction value of the prediction target data is obtained by weighting.
前記複数の全項目測定過去実績データおよび前記補完ステップでデータ値をそれぞれ補った前記複数の複写一部項目未測定過去実績データのそれぞれについて、入力変数と出力変数との関係を表す所与の出力値予測モデルに、前記入力変数に対応するデータ項目のデータ値を代入することによって、モデル予測値を求め、前記モデル予測値と前記出力変数に対応するデータ項目のデータ値との差を予測誤差として求める予測誤差計算ステップと、
前記複数の全項目測定過去実績データおよび前記補完ステップでデータ値をそれぞれ補った前記複数の複写一部項目未測定過去実績データのそれぞれについて、前記予測対象データとの差を表す類似度を求める類似度計算ステップと、
前記補完ステップでデータ値をそれぞれ補った前記複数の複写一部項目未測定過去実績データのそれぞれについて、前記未測定データ項目の重みを表す影響度を求める影響度計算ステップと、
前記重み計算ステップで求めた前記複数の重み、前記類似度計算ステップで求めた前記複数の類似度、前記影響度計算ステップで求めた前記複数の影響度、および、前記予測誤差計算ステップで求めた前記複数の予測誤差に基づいて、前記予測対象データの予測値における予測誤差を求める予測値予測誤差計算ステップと、
前記所与の出力値予測モデルに前記予測対象データを代入することによって求められた値と前記予測値予測誤差計算ステップで求められた前記予測対象データの予測値における予測誤差との和を求めることで前記予測値を求める予測値計算ステップとを備えること
を特徴とする請求項1に記載の出力値予測方法。 The output value prediction step includes:
A given output representing a relationship between an input variable and an output variable for each of the plurality of all-item measured past performance data and each of the plurality of copied partial item unmeasured past performance data each supplemented with a data value in the complementing step A model prediction value is obtained by substituting the data value of the data item corresponding to the input variable into the value prediction model, and the difference between the model prediction value and the data value of the data item corresponding to the output variable is determined as a prediction error. A prediction error calculation step obtained as :
For each of the previous SL plurality of copying some items unmeasured historical performance data of the data value supplemented by a plurality of all items measured historical performance data and the complementary step, obtaining the degree of similarity that represents the difference between the predicted target data A similarity calculation step;
For each of the plurality of copying some items unmeasured historical performance data of the data value supplemented respectively the complementary step, the influence degree calculation step of obtaining the degree of influence representing the weight of the unmeasured data item,
The plurality of weights obtained in the weight calculation step, the plurality of similarities obtained in the similarity calculation step, the plurality of influences obtained in the influence calculation step, and obtained in the prediction error calculation step Based on the plurality of prediction errors, a prediction value prediction error calculation step for obtaining a prediction error in a prediction value of the prediction target data;
Obtaining a sum of a value obtained by substituting the prediction target data into the given output value prediction model and a prediction error in a prediction value of the prediction target data obtained in the prediction value prediction error calculation step output value prediction method according to claim 1, wherein the obtaining Bei the predicted value calculation step of obtaining the predicted value in.
前記複数の全項目測定過去実績データおよび前記補完ステップでデータ値をそれぞれ補った前記複数の複写一部項目未測定過去実績データのそれぞれについて、入力変数と出力変数との関係を表す所与の出力値予測モデルに、前記入力変数に対応するデータ項目のデータ値を代入することによって、モデル予測値を求め、前記モデル予測値と前記出力変数に対応するデータ項目のデータ値との差を予測誤差として求める予測誤差計算ステップと、
前記複数の全項目測定過去実績データおよび前記補完ステップでデータ値をそれぞれ補った前記複数の複写一部項目未測定過去実績データのそれぞれについて、前記予測対象データとの差を表す類似度を求める類似度計算ステップと、
前記重み計算ステップで求めた前記複数の重み、前記類似度計算ステップで求めた前記複数の類似度、および、前記予測誤差計算ステップで求めた前記複数の予測誤差に基づいて、前記予測対象データの予測値における予測誤差を求める予測値予測誤差計算ステップと、
前記所与の出力値予測モデルに前記予測対象データを代入することによって求められた値と前記予測値予測誤差計算ステップで求められた前記予測対象データの予測値における予測誤差との和を求めることで前記予測値を求める予測値計算ステップとを備え、
前記重み計算ステップは、前記複数の全項目測定過去実績データの各重みを所定の定数とするとともに、前記複数の複写一部項目未測定過去実績データの各重みを、前記未測定データ項目に補うべき値であると判断するための所定の条件を満たさない場合には、0とし、前記所定の条件を満たす場合には、前記所定の定数を、前記所定の条件を満たす前記複写一部項目未測定過去実績データの個数で除算した値とすること
を特徴とする請求項1に記載の出力値予測方法。 The output value prediction step includes:
A given output representing a relationship between an input variable and an output variable for each of the plurality of all-item measured past performance data and each of the plurality of copied partial item unmeasured past performance data each supplemented with a data value in the complementing step A model prediction value is obtained by substituting the data value of the data item corresponding to the input variable into the value prediction model, and the difference between the model prediction value and the data value of the data item corresponding to the output variable is determined as a prediction error. A prediction error calculation step obtained as :
For each of the previous SL plurality of copying some items unmeasured historical performance data of the data value supplemented by a plurality of all items measured historical performance data and the complementary step, obtaining the degree of similarity that represents the difference between the predicted target data A similarity calculation step;
Based on the plurality of weights obtained in the weight calculation step, the plurality of similarities obtained in the similarity calculation step, and the plurality of prediction errors obtained in the prediction error calculation step, A prediction value prediction error calculation step for obtaining a prediction error in the prediction value;
Obtaining a sum of a value obtained by substituting the prediction target data into the given output value prediction model and a prediction error in a prediction value of the prediction target data obtained in the prediction value prediction error calculation step A predicted value calculation step for obtaining the predicted value at
The weight calculation step sets each weight of the plurality of all-item measured past performance data as a predetermined constant, and supplements each weight of the plurality of copy partial item unmeasured past performance data with the unmeasured data item. If the predetermined condition for determining the power value is not satisfied, it is set to 0. If the predetermined condition is satisfied, the predetermined constant is set to the copy partial item not satisfying the predetermined condition. The output value prediction method according to claim 1, wherein the output value is divided by the number of past measurement data.
を特徴とする請求項1ないし請求項8のいずれか1項に記載の出力値予測方法。 9. A separation step of dividing a plurality of past performance data having a plurality of data items into the partial unmeasured past performance data and the all-item measurement past performance data. The output value prediction method according to any one of the above.
前記複数の全項目測定過去実績データおよび前記補完ステップでデータ値をそれぞれ補った前記複数の複写一部項目未測定過去実績データのそれぞれについて、重みを求める重み計算部と、
前記重み計算部で求めた前記複数の重みと、前記複数の全項目測定過去実績データと、前記補完部でデータ値をそれぞれ補った複数の複写一部項目未測定過去実績データとに基づいて、予測したい予測対象データに対する出力値を予測して予測値を求める出力値予測部とを備え、
前記重み計算部は、前記複数の全項目測定過去実績データの各重みを所定の定数とするとともに、前記複数の複写一部項目未測定過去実績データの各重みを、前記所定の定数を前記複数の全項目測定過去実績データの個数で除算した値とすること
を特徴とする出力値予測装置。 In the past performance data, some item unmeasured past performance data including unmeasured data items having no data value in the plurality of data items in the plurality of past performance data including a plurality of data items. A plurality of all item measurement data having a data value in all of the plurality of data items are copied in accordance with the number of past performance data, and the copied part of the past measurement data is not measured. For each past performance data, a complementing unit that supplements the data value of the unmeasured data item with the data value of the data item corresponding to the unmeasured data item in the plurality of all-item measurement past performance data;
A weight calculation unit for obtaining a weight for each of the plurality of all item measurement past performance data and each of the plurality of copy partial item unmeasured past performance data each supplemented with a data value in the complementing step;
Wherein said plurality of weights calculated by the weight calculator, the plurality of all items measured historical performance data, based on the data value to a plurality of copying and some items unmeasured historical performance data supplemented respectively by the completion unit, An output value prediction unit that predicts an output value for prediction target data to be predicted and obtains a predicted value ;
The weight calculation unit sets each weight of the plurality of all item measured past performance data as a predetermined constant, and sets each weight of the plurality of copy partial item unmeasured past performance data as the plurality of predetermined constants. output value predicting device comprising a value and to Rukoto divided by the total entry number of measurements of the past record data.
前記複数のデータ項目を備える複数の過去実績データの中の前記複数のデータ項目の中にデータ値を持たない未測定データ項目を含む一部項目未測定過去実績データを前記記憶部から読出し、前記過去実績データの中の前記複数のデータ項目の全てにデータ値を持つ複数の全項目測定過去実績データの個数に応じた個数に複写し、前記一部項目未測定過去実績データの前記複写した各複写一部項目未測定過去実績データのそれぞれについて、前記未測定データ項目のデータ値を、前記複数の全項目測定過去実績データにおける前記未測定データ項目に対応するデータ項目のデータ値で補う補完手段と、
前記複数の全項目測定過去実績データおよび前記補完手段でデータ値をそれぞれ補った前記複数の複写一部項目未測定過去実績データのそれぞれについて、重みを求める重み計算手段と、
前記重み計算手段で求めた前記複数の重みと、前記複数の全項目測定過去実績データと、前記補完ステップでデータ値をそれぞれ補った複数の複写一部項目未測定過去実績データとに基づいて、予測したい前記予測対象データに対する出力値を予測して予測値を求める出力値予測手段として機能させる出力値予測プログラムであって、
前記重み計算手段は、前記複数の全項目測定過去実績データの各重みを所定の定数とするとともに、前記複数の複写一部項目未測定過去実績データの各重みを、前記所定の定数を前記複数の全項目測定過去実績データの個数で除算した値とすること
を特徴とする出力値予測プログラム。
A computer comprising a storage unit for storing a plurality of historical performance data and the prediction target data comprising a plurality of data items, in order to predict the output value,
Said read plurality of the plurality comprising data item part item unmeasured historical performance data including the unmeasured data items that do not have a data value in said plurality of data items in the past record data from the storage unit, the Each of the plurality of data items in the past performance data is copied to the number corresponding to the number of all the item measurement past performance data having data values, and each of the copied items of the partial item unmeasured past performance data is copied. Complement means for supplementing the data value of the unmeasured data item with the data value of the data item corresponding to the unmeasured data item in the plurality of all-item measured past performance data for each of the copied partial item unmeasured past performance data When,
Weight calculation means for obtaining a weight for each of the plurality of all item measurement past performance data and each of the plurality of copy partial item unmeasured past performance data each supplemented with a data value by the complementing means;
Wherein a plurality of weights calculated by the weight calculation means, wherein a plurality of all items measured historical performance data, based on the data value to a plurality of copying and some items unmeasured historical performance data supplemented respectively the complementary step, an output value prediction program to function as an output value predicting means for obtaining a predicted value by predicting an output value for the predicted target data to be predicted,
The weight calculating means sets each weight of the plurality of all-item measured past performance data to a predetermined constant, and sets each weight of the plurality of copy partial item unmeasured past performance data to the plurality of predetermined constants. output value predicting program for all items measured values and to Rukoto divided by the number of historical performance data and features.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010162909A JP5546981B2 (en) | 2010-07-20 | 2010-07-20 | Output value prediction method, apparatus, and program for the method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010162909A JP5546981B2 (en) | 2010-07-20 | 2010-07-20 | Output value prediction method, apparatus, and program for the method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012027537A JP2012027537A (en) | 2012-02-09 |
JP5546981B2 true JP5546981B2 (en) | 2014-07-09 |
Family
ID=45780423
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010162909A Expired - Fee Related JP5546981B2 (en) | 2010-07-20 | 2010-07-20 | Output value prediction method, apparatus, and program for the method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5546981B2 (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5861619B2 (en) * | 2012-11-22 | 2016-02-16 | 富士通株式会社 | Data interpolation apparatus, data interpolation program, and data interpolation method |
JP6107214B2 (en) * | 2013-02-20 | 2017-04-05 | 東洋紡株式会社 | Experiment support system, experiment support method, and experiment support program |
JP7139657B2 (en) * | 2018-03-30 | 2022-09-21 | 富士通株式会社 | Learning program, learning method and learning device |
JP6596605B1 (en) * | 2019-03-28 | 2019-10-23 | 株式会社博報堂Dyホールディングス | Estimation system, estimation method, and computer program |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002288437A (en) * | 2001-03-23 | 2002-10-04 | Sakura Bank Ltd | Weather derivative pricing system and its method |
JP4369816B2 (en) * | 2004-07-16 | 2009-11-25 | 財団法人河川情報センター | National Synthetic Radar Rainfall Information Provision System |
-
2010
- 2010-07-20 JP JP2010162909A patent/JP5546981B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2012027537A (en) | 2012-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Subramanian et al. | Overfitting in prediction models–is it a problem only in high dimensions? | |
JP5546981B2 (en) | Output value prediction method, apparatus, and program for the method | |
JP5901140B2 (en) | Methods, computer programs, and systems for interpolating sensor data for high system availability. | |
JP6566631B2 (en) | Prediction device, prediction method, and program | |
JP2018045559A (en) | Information processing device, information processing method, and program | |
JP5338492B2 (en) | Input variable selection support device | |
JP2018092445A5 (en) | ||
CN113168171B (en) | Abnormality detection device and abnormality detection method | |
JP7081728B1 (en) | Driving support equipment, driving support methods and programs | |
JP5206697B2 (en) | Continuous defect determination method, continuous defect determination device, and program | |
Uyan et al. | Industry 4.0 foundry data management and supervised machine learning in low-pressure die casting quality improvement | |
Pai et al. | Model-class selection using clustering and classification for structural identification and prediction | |
JP5271136B2 (en) | Output value prediction method, apparatus, and program for the method | |
JP5935570B2 (en) | Simulation program, simulation apparatus, and simulation method | |
JP6201556B2 (en) | Prediction model learning device, prediction model learning method, and computer program | |
WO2020170304A1 (en) | Learning device and method, prediction device and method, and computer-readable medium | |
CN111079832A (en) | Steel plate surface defect classification method with characteristic noise resistance | |
JP7248188B2 (en) | Abnormality diagnosis model construction method, abnormality diagnosis method, abnormality diagnosis model construction device, and abnormality diagnosis device | |
JP5826892B1 (en) | Change point detection apparatus, change point detection method, and computer program | |
US20120330618A1 (en) | Methods and Systems for Recording and Recalling Events | |
JP5220458B2 (en) | Output value prediction method, apparatus, and program for the method | |
JP6930195B2 (en) | Model identification device, prediction device, monitoring system, model identification method and prediction method | |
WO2021256215A1 (en) | Control device, high-level controller, control method, and control program | |
JP2009230209A (en) | Performance evaluation device for soft sensor | |
US11435357B2 (en) | System and method for discovery of gene-environment interactions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121001 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131225 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140107 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140307 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140430 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140514 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5546981 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |