JP5416811B2 - Prediction device, prediction method, and computer program - Google Patents

Prediction device, prediction method, and computer program Download PDF

Info

Publication number
JP5416811B2
JP5416811B2 JP2012144416A JP2012144416A JP5416811B2 JP 5416811 B2 JP5416811 B2 JP 5416811B2 JP 2012144416 A JP2012144416 A JP 2012144416A JP 2012144416 A JP2012144416 A JP 2012144416A JP 5416811 B2 JP5416811 B2 JP 5416811B2
Authority
JP
Japan
Prior art keywords
value
period
items
data
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012144416A
Other languages
Japanese (ja)
Other versions
JP2014010484A (en
Inventor
克彦 永倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yanmar Co Ltd
Original Assignee
Yanmar Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yanmar Co Ltd filed Critical Yanmar Co Ltd
Priority to JP2012144416A priority Critical patent/JP5416811B2/en
Priority to EP13810593.7A priority patent/EP2869249A1/en
Priority to US14/411,357 priority patent/US20150170169A1/en
Priority to PCT/JP2013/067386 priority patent/WO2014003001A1/en
Publication of JP2014010484A publication Critical patent/JP2014010484A/en
Application granted granted Critical
Publication of JP5416811B2 publication Critical patent/JP5416811B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、時系列的に変化する予測対象及び該予測対象に関する複数の項目について分析する方法に関し、特に、予測結果の精度を向上させることができる予測装置、予測方法、及び、コンピュータを予測装置として機能させるコンピュータプログラムに関する。   The present invention relates to a prediction object that changes in time series and a method for analyzing a plurality of items related to the prediction object, and in particular, a prediction device, a prediction method, and a computer that can improve the accuracy of prediction results. The present invention relates to a computer program that functions as a computer program.

製品の需要予測及び販売予測等の経済予測は、会社経営における方向性及び戦略を検証する上で、極めて重要である。そして、予測した需要を販売、在庫、生産、物流、開発等の各部門の計画にどのように結び付けるかが経営課題となっている。更に、需要予測、販売予測等の経済的な事象に対する予測に限らず、経時的に変化する事象についてそれまでの情報を用いて以降の事象について予測することは様々な分野で重要な課題である。   Economic forecasts such as product demand forecasts and sales forecasts are extremely important in examining the direction and strategy in company management. Then, how to connect the predicted demand to the plans of each department such as sales, inventory, production, distribution, and development is a management issue. Furthermore, not only forecasts for economic events such as demand forecasts and sales forecasts, but forecasting future events using information that has changed over time is an important issue in various fields. .

製品の需要台数、又は販売台数等の時系列的に推移する事象の以後の変化を予測するための方法として、種々の時系列分析方法が提案されている。このような分析方法としては、重回帰分析、T法等の多変量解析が挙げられる(例えば、特許文献1、非特許文献1)。更に、これらの分析方法に対して種々の応用案が提案されている(非特許文献2等)。   Various time-series analysis methods have been proposed as methods for predicting subsequent changes in time-series events such as the number of products demanded or the number of products sold. Examples of such an analysis method include multivariate analysis such as multiple regression analysis and T method (for example, Patent Document 1 and Non-Patent Document 1). Furthermore, various application proposals have been proposed for these analysis methods (Non-Patent Document 2, etc.).

特許第3141164号公報Japanese Patent No. 3141164

立林和夫編著、手島昌一、長谷川良子著、「入門MTシステム」、日科技連出版社、2008年12月Edited by Kazuo Tatebayashi, Shoichi Teshima, Ryoko Hasegawa, “Introductory MT System”, Nikka Giren Shuppansha, December 2008 増田雪也、「非線形成分を考慮したT法の研究」、第17回品質工学研究発表大会 論文集、p.422−425 2009年Yukiya Masuda, “Research of T Method Considering Nonlinear Components”, Proceedings of 17th Quality Engineering Research Conference, p. 422-425 2009

種々の時系列分析方法の内、T法を用いて分析する場合、解析に用いる項目をいかにして選択するかが課題であった。項目の選択については、非特許文献1に開示されている両側T法という手法が提案されている。しかしながら、発明者は、両側T法による項目選択では予測精度は不十分であるとし、非特許文献2の総合推定SN比が最大となる項目を選択する方法等を検討した。その結果、項目選択を行なう対象期間を、過去の事象の経時変化の傾向(トレンド)を考慮して選択しておくべきであるとの知見を得た。   Among various time series analysis methods, when the analysis is performed using the T method, how to select items used for the analysis is a problem. Regarding the selection of items, a method called a two-sided T method disclosed in Non-Patent Document 1 has been proposed. However, the inventor considered that the item selection by the two-sided T method is insufficient in prediction accuracy, and studied a method for selecting an item in which the total estimated SN ratio of Non-Patent Document 2 is maximized. As a result, we obtained the knowledge that the target period for item selection should be selected in consideration of the trend of the past events over time.

本発明は斯かる知見に基づいてなされたものであり、経時変化の傾向を反映させて予測精度を更に向上させる予測装置、予測方法及びコンピュータプログラムを提供することを目的とする。   The present invention has been made based on such knowledge, and an object of the present invention is to provide a prediction device, a prediction method, and a computer program that further improve the prediction accuracy by reflecting the tendency of change over time.

本発明に係る予測装置は、複数の要因が関連する事象に係る値、及び、該値に関連する前記複数の要因を複数の項目毎のデータとして前記値に対応付けて時系列に記録する記録手段と、該記録手段から前記値及び該値に対応する前記複数の項目毎のデータを読み出して演算を行なう演算手段とを備え、該演算手段が、前記複数の項目の前記値の変化に対する相関の強さを示す要因効果値に基づき、前記複数の項目から複数の項目を選択し、選択した項目のデータに基づき、予測対象期間における前記事象に係る値を予測する予測装置において、前記演算手段は、前記記録手段に記録されている値の記録期間中における経時変化傾向を特定する特定手段と、予測対象期間よりも所定期間前の対応期間における前記値の経時変化傾向に類似する直近の期間を、前記記録期間から選択する期間選択手段と、該期間選択手段が選択した選択期間における前記複数の項目毎のデータ、及び、該選択期間よりも所定期間後の値により求められる前記要因効果値に基づき、複数の項目を選択する項目選択手段と、前記対応期間における前記項目選択手段が選択した項目のデータから前記予測対象期間における予測値を算出する予測手段とを備えることを特徴とする。   The prediction device according to the present invention records a value related to an event related to a plurality of factors, and records the plurality of factors related to the value in time series in association with the values as data for a plurality of items. And means for reading out the value and the data for each of the plurality of items corresponding to the value from the recording means, the calculating means correlating the change of the values of the plurality of items. In the prediction device that selects a plurality of items from the plurality of items based on the factor effect value indicating the strength of the item, and predicts the value related to the event in the prediction target period based on the data of the selected item, the calculation A means for identifying a time-dependent change tendency during a recording period of the value recorded in the recording means, and a means similar to the time-dependent change tendency of the value in a corresponding period before the prediction target period. A period selection means for selecting the period from the recording period, data for each of the plurality of items in the selection period selected by the period selection means, and the factor obtained by a value after a predetermined period from the selection period An item selection unit that selects a plurality of items based on an effect value; and a prediction unit that calculates a predicted value in the prediction target period from data of the item selected by the item selection unit in the corresponding period. To do.

本発明に係る予測装置は、前記期間選択手段は、前記対応期間における値の経時変化の勾配を判別する判別手段と、該判別手段が判別した勾配で値が変化する第1期間を、前記記録期間から選定する手段と、前記対応期間における複数の項目毎のデータと、第1期間における複数の項目毎のデータとの類似性を表わす数値を算出する第1算出手段と、第1算出手段が算出した数値の変化傾向を表わす数値を算出する第2算出手段と、第2算出手段が算出した前記数値と閾値との比較に基づき、前記第1期間中の直近の類似性が高い第2期間を選択する選択手段とを備えることを特徴とする。   In the prediction apparatus according to the present invention, the period selection unit includes a determination unit that determines a gradient of a change with time in the corresponding period, and a first period in which the value changes with the gradient determined by the determination unit. Means for selecting from a period; first calculation means for calculating a numerical value representing similarity between the data for each of the plurality of items in the corresponding period; and the data for each of the plurality of items in the first period; Second calculation means for calculating a numerical value representing a change tendency of the calculated numerical value, and a second period having a high similarity in the first period based on a comparison between the numerical value calculated by the second calculation means and a threshold value And selecting means for selecting.

本発明に係る予測装置は、第1算出手段は、マハラノビスの汎距離を算出するようにしてあり、第2算出手段は、第1算出手段が算出したマハラノビスの汎距離のトレンドをトレンドモデルに基づき算出するようにしてあり、前記選択手段は、第2算出手段が算出したトレンドが所定値以下である期間を第2期間として選択するようにしてあることを特徴とする。   In the prediction apparatus according to the present invention, the first calculating means calculates the Mahalanobis generalized distance, and the second calculating means uses the Mahalanobis generalized distance trend calculated by the first calculating means based on the trend model. The selection means selects the period in which the trend calculated by the second calculation means is equal to or less than a predetermined value as the second period.

本発明に係る予測装置は、前記選択手段は、前記第2期間の長さを変えて選択するようにしてあり、長さ毎に、該第2期間における項目毎のデータの所定時間後の値に対する予測精度に係る値が最大になる長さを決定する決定手段を更に備え、前記期間選択手段は、前記決定手段が決定した長さの第2期間を選択するようにしてあることを特徴とする。   In the prediction apparatus according to the present invention, the selection unit selects the second period by changing the length, and the value after a predetermined time of the data for each item in the second period is selected for each length. Further comprising a determining means for determining a length that maximizes a value related to the prediction accuracy for, wherein the period selecting means selects a second period of the length determined by the determining means. To do.

本発明に係る予測方法は、複数の要因が関連する事象に係る値、及び、該値に関連する前記複数の要因を複数の項目毎のデータとして前記値に対応付けて時系列に記録する記録手段と、該記録手段から前記値及び該値に対応する前記複数の項目毎のデータを読み出して演算を行なう演算手段とを備える装置にて、該演算手段が、前記複数の項目の前記値の変化に対する相関の強さを示す要因効果値に基づき、前記複数の項目から複数の項目を選択し、選択した項目のデータに基づき、予測対象期間における前記事象に係る値を予測する予測方法において、前記演算手段は、前記記録手段に記録されている値の記録期間中における経時変化傾向を特定し、予測対象期間よりも所定期間前の対応期間における前記値の経時変化傾向に類似する直近の期間を、前記記録期間から選択し、選択した選択期間における前記複数の項目毎のデータ、及び、該選択期間よりも所定期間後の値により求められる前記要因効果値に基づき、複数の項目を選択し、前記対応期間における選択された複数の項目のデータから前記予測対象期間における予測値を算出することを特徴とする。   The prediction method according to the present invention records a value related to an event related to a plurality of factors, and records the plurality of factors related to the value in time series in association with the value as data for a plurality of items. Means for reading the value and the data for each of the plurality of items corresponding to the value from the recording means, and for calculating the value of the plurality of items. In a prediction method for selecting a plurality of items from the plurality of items based on a factor effect value indicating the strength of correlation to change, and predicting a value related to the event in a prediction target period based on data of the selected items The calculation means identifies a time-dependent change tendency of the value recorded in the recording means during the recording period, and is similar to the time-dependent change tendency of the value in a corresponding period before the prediction target period. A period is selected from the recording period, and a plurality of items are selected based on the data for each of the plurality of items in the selected selection period and the factor effect value obtained by a value after a predetermined period from the selection period. And the predicted value in the said prediction object period is calculated from the data of the some item selected in the said corresponding | compatible period, It is characterized by the above-mentioned.

本発明に係るコンピュータプログラムは、記録手段を備えるコンピュータに、前記記録手段に時系列に記録してある複数の要因が関連する事象に係る値、及び、該値に関連する前記複数の要因を複数の項目毎のデータを読み出し、前記複数の項目の前記値の変化に対する相関の強さを示す要因効果値に基づき、前記複数の項目から複数の項目を選択させ、選択された項目のデータに基づいて予測対象期間における前記事象に係る値を予測させるコンピュータプログラムにおいて、前記コンピュータに、前記記録手段に記録されている値の記録期間中における経時変化傾向を特定する特定手段、予測対象期間よりも所定期間前の対応期間における前記値の経時変化傾向に類似する直近の期間を、前記記録期間から選択する期間選択手段、選択した選択期間における前記複数の項目毎のデータ、及び、該選択期間よりも所定期間後の値により求められる前記要因効果値に基づき、複数の項目を選択する項目選択手段、及び、前記対応期間における選択された複数の項目のデータから前記予測対象期間における予測値を算出する予測手段の機能を実行させることを特徴とする。   A computer program according to the present invention includes a computer having recording means, a plurality of values related to an event related to a plurality of factors recorded in time series in the recording means, and a plurality of the factors related to the values. Based on the factor effect value indicating the strength of correlation with respect to the change in the value of the plurality of items, and selecting a plurality of items from the plurality of items, and based on the data of the selected item In the computer program for predicting the value related to the event in the prediction target period, the computer has a specifying means for specifying a tendency to change over time during the recording period of the value recorded in the recording means, than the prediction target period. A period selecting means for selecting a latest period similar to the time-dependent change trend of the value in the corresponding period before the predetermined period from the recording period; Item selection means for selecting a plurality of items based on the data for each of the plurality of items in the selection period and the factor effect value obtained by a value after a predetermined period from the selection period, and selection in the corresponding period The function of the prediction means which calculates the predicted value in the said prediction object period from the data of the some item made | formed is characterized.

本発明では、時系列データである事象に係る値及び該値に関連する複数の要因である複数の項目毎のデータが記録されている記録手段から、前記値及び項目毎のデータが読み出され、前記時系列の値の経時変化傾向が特定される。前記時系列の値の経時変化傾向に基づき、予測対象期間よりも所定期間前の対応期間、即ち予測時点の直前における経時変化傾向に類似し、且つ、予測対象期間に近い期間が選択される。選択された期間における前記複数の項目毎のデータ及び所定期間後の値との関係式が特定され、該値の変化に相関が強い複数の項目が選択され、対応期間における項目毎のデータの内、選択された項目のデータに基づき、前記予測対象期間における値が予測される。   In the present invention, the value and the data for each item are read out from the recording means in which the value relating to the event that is time-series data and the data for each of the plurality of items that are a plurality of factors related to the value are recorded. The time-dependent change tendency of the time series value is specified. Based on the time-dependent change tendency of the time series value, a corresponding period before the prediction target period, that is, a period similar to the time change tendency immediately before the prediction time point and close to the prediction target period is selected. A relational expression between the data for each of the plurality of items in the selected period and the value after the predetermined period is specified, and a plurality of items having a strong correlation with the change in the value are selected, and among the data for each item in the corresponding period Based on the data of the selected item, the value in the prediction target period is predicted.

本発明では、期間の選択に際し、予測対象期間よりも所定期間前の信号値の変化傾向と類似する期間が、値の変化傾向の勾配に基づき特定され、勾配が同一である期間の内、項目毎のデータの時系列的な傾向が類似する期間が選択される。特に、予測対象期間にでき得る限り近い、類似期間が選択されるから、予兆となる項目毎のデータの傾向を反映させた予測を行なうことが可能となる。   In the present invention, when selecting a period, a period similar to the change tendency of the signal value before the prediction target period is specified based on the slope of the change tendency of the value, and among the periods having the same slope, the item A period in which the time-series tendency of each data is similar is selected. In particular, since a similar period that is as close as possible to the prediction target period is selected, it is possible to perform a prediction that reflects the tendency of data for each item that is a sign.

本発明では、項目毎のデータの類似性を表わす数値としてマハラノビスの汎距離が用いられる。更に、項目毎のデータの時系列な推移を表わす数値としてマハラノビスの汎距離のトレンドが用いられる。これにより、比較的容易な手法にて客観的に類似する期間の選択が可能となり、予測精度を向上させることが可能となる。   In the present invention, Mahalanobis's general distance is used as a numerical value representing the similarity of data for each item. Further, the Mahalanobis pan-distance trend is used as a numerical value representing a time-series transition of data for each item. This makes it possible to select objectively similar periods using a relatively easy method, and to improve prediction accuracy.

本発明では、選択期間の長さを変えて予測精度が最も高くなる長さが選択される。これにより、予測精度の向上を図ることが可能となる。   In the present invention, the length with the highest prediction accuracy is selected by changing the length of the selection period. Thereby, it is possible to improve the prediction accuracy.

本発明では、解析に用いる項目の選択に際し、予測時点における信号値及び項目データの変化傾向が類似すると判断される期間から、当該信号期間にて項目選択を行なって項目と所定時間後の信号値との関係式を特定し、該関係式から予測を行なう。つまり、過去の事象から類似性が高い経時変化がなされた時期のデータに基づき予測が行なわれる。これにより、予測時点と異なる傾向の経時変化がなされている時系列データによる影響を排除し、予測精度を向上させることができる。   In the present invention, when selecting an item to be used for analysis, a signal value at a prediction time point and a signal value after a predetermined time are selected from the period in which the change tendency of the item data is determined to be similar in the signal period. Is specified, and prediction is performed from the relational expression. That is, the prediction is performed based on the data at the time when the temporal change with high similarity is made from the past event. As a result, it is possible to eliminate the influence due to the time-series data having a temporal change different from the prediction time point and improve the prediction accuracy.

T法で用いる信号値及び項目のデータの内容例を示す説明図である。It is explanatory drawing which shows the content example of the signal value and item data which are used by T method. T法で用いる各項目の比例定数β及びSN比η(2乗比)の一例を示す説明図である。It is explanatory drawing which shows an example of the proportionality constant (beta) and SN ratio (eta) (square ratio) of each item used by T method. 各メンバーの実際の信号値又は基準化した信号値の実値と、各メンバーについて求めた総合推定値を一覧形式で示した図である。It is the figure which showed the actual value of each member's actual signal value or the actual value of the standardized signal value, and the comprehensive estimated value calculated | required about each member in list format. T法における各項目の総合推定値のSN比を示す要因効果図である。It is a factor effect figure which shows the S / N ratio of the comprehensive estimated value of each item in T method. T法における各項目の要因効果に対する影響を示すグラフである。It is a graph which shows the influence with respect to the factor effect of each item in T method. 時間差モデルを概念的に示す説明図である。It is explanatory drawing which shows a time difference model notionally. 変換処理前後の信号値と項目毎のデータの値との関係を示すグラフである。It is a graph which shows the relationship between the signal value before and behind conversion processing, and the value of the data for every item. 最適な項目選択数を決定するための処理を概念的に示すグラフである。It is a graph which shows notionally the processing for determining the optimal number of item selection. 項目選択数と総合推定値のSN比との対応を示すグラフである。It is a graph which shows a response | compatibility with the number of item selections, and SN ratio of a comprehensive estimated value. 本実施の形態における予測装置の構成を示すブロック図である。It is a block diagram which shows the structure of the prediction apparatus in this Embodiment. 本実施の形態における予測装置による予測処理手順の一例を示すフローチャートである。It is a flowchart which shows an example of the prediction process procedure by the prediction apparatus in this Embodiment. 本実施の形態における予測装置による信号期間選択処理手順の一例を示すフローチャートである。It is a flowchart which shows an example of the signal period selection processing procedure by the prediction apparatus in this Embodiment. 本実施例における項目の内容を示す説明図である。It is explanatory drawing which shows the content of the item in a present Example. 本実施例にて予測に用いる信号値の内容例を示すグラフである。It is a graph which shows the example of the content of the signal value used for prediction in a present Example. 予測装置の制御部により求められた信号値のトレンドを示すグラフである。It is a graph which shows the trend of the signal value calculated | required by the control part of the prediction apparatus. 予測装置の制御部により選択された期間、並びに、当該期間におけるMDを示すグラフである。It is a graph which shows MD during the period selected by the control part of a prediction device, and the period concerned. 本実施例における予測装置の制御部による予測結果を示すグラフである。It is a graph which shows the prediction result by the control part of the prediction apparatus in a present Example. 信号期間を直近2年間とした場合の予測値を示すグラフである。It is a graph which shows the predicted value at the time of making a signal period into the latest 2 years. 信号期間を直近1年間とした場合の予測値を示すグラフである。It is a graph which shows the predicted value at the time of making a signal period into the latest one year. 信号期間の選択方法の違いによる総合推定値のSN比の比較を示すグラフである。It is a graph which shows the comparison of the SN ratio of the comprehensive estimated value by the difference in the selection method of a signal period.

以下、本発明の実施の形態を、図面に基づいて具体的に説明する。   Embodiments of the present invention will be specifically described below with reference to the drawings.

以下に開示する予測方法は、従前から利用されているMTシステム、特に、T法を用いた方法を基本に、信号(事象に係る値)の経時変化を予測するために「時間差モデル」という発明を加えて予測精度を向上させ、更に、過去の信号及び該信号に対応する項目(要因)から、予測に用いる「信号及び項目を適切に選択する方法」を加え、予測精度を向上させるものである。なお、以下の予測方法は、予測に用いるデータを記録している記録手段から各データを読み出すことができるコンピュータ(後述する予測装置1)などの演算手段により実施されるものである。
また以下は特に、「信号及び項目の選択方法」を開示するものである。ただし、T法及び時間差モデル等の既に先に開示している技術についても、これらは当該選択方法が前提とする技術及び発明であり、本発明の信号及び項目の選択方法の理解を助けるために必要であるから、以下に説明する。
The prediction method disclosed below is an invention called a “time difference model” for predicting changes over time of a signal (value related to an event) based on an MT system that has been used in the past, in particular, a method using the T method. Is added to improve the prediction accuracy, and from the past signals and items (factors) corresponding to the signals, a “method for appropriately selecting signals and items” used for prediction is added to improve the prediction accuracy. is there. In addition, the following prediction methods are implemented by calculation means, such as a computer (prediction apparatus 1 mentioned later) which can read each data from the recording means which has recorded the data used for prediction.
In particular, the following discloses a “signal and item selection method”. However, the techniques already disclosed above, such as the T method and the time difference model, are the techniques and inventions premised on the selection method, and are intended to assist in understanding the signal and item selection method of the present invention. Since it is necessary, it will be described below.

まず、T法の概要を説明する。図1は、T法で用いる信号値及び項目のデータの内容例を示す説明図である。図1において、メンバーとは、単位期間毎のデータであることを示すインデックスであり、1,2,…,lとして示している。データの値自体は、信号値Mとして記録される。「項目1」,「項目2」,…,「項目k」は、信号値Mに関連する要因となる項目であり、X11,X12,…,X1kは、メンバー1の信号値M1 に関連する各項目のデータを示している。例えば、メンバーが月毎の電気使用量である場合、月毎の電気使用量(W)が信号値Mであり、項目は「月」,「気温」,「風速」,「降水量(月平均)」,「日照時間(月平均)」,「最高気温(月平均)」,「最低気温(月平均)」…等の電気使用量の上下に関連するであろう変量である。この場合の項目のデータとは、各項目の値、例えば何月であるかのデータ,気温の月平均値,風速の月平均値等である。 First, an outline of the T method will be described. FIG. 1 is an explanatory diagram showing an example of the contents of signal values and item data used in the T method. In FIG. 1, a member is an index indicating data for each unit period, and is indicated as 1, 2,. The data value itself is recorded as a signal value M. "Item 1", "item 2", ..., "item k" is an item which is a factor associated with the signal value M, X 11, X 12, ..., X 1k is, the signal value M 1 of the member 1 The data of each item related to is shown. For example, if the member has monthly electricity usage, the monthly electricity usage (W) is the signal value M, and the items are “month”, “temperature”, “wind speed”, “precipitation (monthly average) ) ”,“ Sunshine hours (monthly average) ”,“ maximum temperature (monthly average) ”,“ minimum temperature (monthly average) ”, and so on. The item data in this case is the value of each item, for example, data indicating what month it is, the monthly average value of temperature, the monthly average value of wind speed, and the like.

なお、信号値M及び各項目のデータXは、実際の値を用いてもよいが、演算手段を用いて規準化しておいてから用いることが好ましい。規準化の方法は例えば、演算手段が、各項目のデータX(例えば月平均の気温)から、当該項目のデータの平均値(用いる全メンバーの月平均の気温の平均値)を減算しておくなどの方法がある。これにより、信号値に対する項目のデータの値のプロットした場合に(単位空間とよぶ)、原点を通る直線として予測式を表現することが可能となる。   Actual values may be used as the signal value M and the data X of each item, but it is preferable to use them after normalization using a calculation means. In the normalization method, for example, the calculation means subtracts the average value of the data of the item (the average value of the monthly average temperature of all members to be used) from the data X of each item (for example, the monthly average temperature). There are methods. Thus, when plotting the data value of the item against the signal value (referred to as a unit space), it is possible to express the prediction formula as a straight line passing through the origin.

予測方法は、演算手段により、各メンバーの信号値Mと、関連する多変数である項目のデータとの関係を特定する特定式を求め、予測対象である次の単位期間の項目のデータを予測し、その予測した項目のデータを特定式にあてはめて、予測するものである。しかしながら、項目のデータは多変量である。例えばメンバーが12個であって、項目の数が20(k=20)存在する場合がある。このような場合、次の信号値を予測するのに特定式を求めることが難しくなる。T法は、多数の項目夫々に対して、信号値の変動に対する要因効果の強さを示す値を評価し、要因効果を示す値を重み付けする。これにより、効果的な項目を選択することにより、全ての項目のデータを使用せずとも、選択された項目を使用することで十分に精度の高い予測等を行うことができるというものである。   In the prediction method, a calculation formula is used to obtain a specific expression for specifying the relationship between the signal value M of each member and the related multivariable item data, and the data of the next unit period item to be predicted is predicted. Then, the predicted item data is applied to a specific formula for prediction. However, the item data is multivariate. For example, there may be 12 members and there are 20 items (k = 20). In such a case, it is difficult to obtain a specific expression for predicting the next signal value. In the T method, for each of a large number of items, a value indicating the strength of the factor effect with respect to signal value fluctuation is evaluated, and a value indicating the factor effect is weighted. Thereby, by selecting effective items, it is possible to perform prediction with sufficiently high accuracy by using the selected items without using data of all items.

そこで、T法では、演算手段によって、信号値Mを持つメンバーを用いて、項目毎に比例定数βと、SN比η(2乗比)を下記の式1及び式2を適用して算出する。SN比とは、下記式2に示すような分散の逆数を用いて示される値であり、各項目に対する信号値の感度であり、各項目と信号値との相関の強さを示す。   Therefore, in the T method, the calculation means calculates the proportionality constant β and the SN ratio η (square ratio) for each item by applying the following formulas 1 and 2 using the member having the signal value M. . The S / N ratio is a value indicated by using the reciprocal of dispersion as shown in the following formula 2, is the sensitivity of the signal value for each item, and indicates the strength of correlation between each item and the signal value.

Figure 0005416811
Figure 0005416811

なお、上述の式1及び式2は、項目1についての比例定数β及びSN比η(2乗比)を求める式である。演算手段は、項目2から項目kについても項目1と同様の計算を行なう。図2は、T法で用いる各項目の比例定数β及びSN比η(2乗比)の一例を示す説明図である。図2では、上述の式1及び式2を各項目に適用することによって算出した項目毎の比例定数β及びSN比η(2乗比)を表形式で示している。   In addition, the above-mentioned Formula 1 and Formula 2 are formulas for obtaining the proportionality constant β and the SN ratio η (square ratio) for Item 1. The calculation means performs the same calculation as for item 1 for item 2 to item k. FIG. 2 is an explanatory diagram showing an example of the proportionality constant β and the SN ratio η (square ratio) of each item used in the T method. In FIG. 2, the proportionality constant β and SN ratio η (square ratio) for each item calculated by applying Equation 1 and Equation 2 described above to each item are shown in a table format.

次に、項目毎の比例定数β及びSN比η(2乗比)を用いて、各メンバーについて、演算手段によって項目毎の出力の推定値を求める。第i番目メンバーについて、項目1による出力の推定値は、下記の式3にて示すことができる。また、同様に、演算手段により、項目2から項目kによる出力の推定値を求める。   Next, using the proportionality constant β and the SN ratio η (square ratio) for each item, an estimated value of the output for each item is obtained for each member by the computing means. For the i-th member, the estimated output value of item 1 can be expressed by the following equation 3. Similarly, the estimated value of the output from item 2 to item k is obtained by the calculation means.

Figure 0005416811
Figure 0005416811

これにより、演算手段は、項目のデータと信号値の総合推定値との関係を示す予測式として、総合推定式(式4)を導出することができる。ただし、予測対象の信号値に対し、全ての項目(1〜k)を用いた総合推定式が最も予測精度が高いわけではない。そこで、予測対象への影響に対する寄与を高くし、予測精度を高めるべく、演算手段によって全ての項目のうちから適切な項目の組み合わせを選択する。   Thereby, the calculating means can derive the comprehensive estimation formula (Formula 4) as a prediction formula indicating the relationship between the item data and the total estimated value of the signal value. However, the comprehensive estimation formula using all items (1 to k) with respect to the signal value to be predicted does not have the highest prediction accuracy. Therefore, in order to increase the contribution to the influence on the prediction target and increase the prediction accuracy, an appropriate combination of items is selected from all items by the calculation means.

そこで、演算手段によって各項目の推定値についての推定精度であるSN比η1 ,η2 ,…,ηk (2乗比)を重み付け係数として用いた総合推定値を算出する。従って、第i番目のメンバーの総合推定値は、下記の式4にて示すことができる。 Therefore, the calculation means calculates an overall estimated value using the SN ratios η 1 , η 2 ,..., Η k (square ratio), which is the estimation accuracy for the estimated value of each item, as a weighting coefficient. Therefore, the total estimated value of the i-th member can be expressed by the following Equation 4.

Figure 0005416811
Figure 0005416811

図3は、各メンバーの実際の信号値又は基準化した信号値の実値と、各メンバーについて求めた総合推定値を一覧形式で示した図である。そして、図3に示したように得られた各メンバーの実値と総合推定値とを用い、演算手段は下記式5によって、各項目について、総合推定値のSN比η(db)を算出する。   FIG. 3 is a table showing the actual signal value of each member or the actual value of the standardized signal value and the total estimated value obtained for each member in a list format. Then, using the actual value and the total estimated value of each member obtained as shown in FIG. 3, the computing means calculates the SN ratio η (db) of the total estimated value for each item by the following equation 5. .

Figure 0005416811
Figure 0005416811

T法では、上述したように求めた各項目についての総合推定値を用いて更に、要因効果値という値を求め、要因効果値を元に項目を選択するなどの方法がとられている。図4は、T法における各項目の総合推定値のSN比を示す要因効果図であり、図5は、T法における各項目の要因効果に対する影響を示すグラフである。   In the T method, a method of obtaining a value called a factor effect value by using the total estimated value obtained for each item as described above, and selecting an item based on the factor effect value is used. FIG. 4 is a factor effect diagram showing the SN ratio of the overall estimated value of each item in the T method, and FIG. 5 is a graph showing the influence of each item on the factor effect in the T method.

図4は、横軸に選択の対象となる項目を示し、縦軸に総合推定値のSN比をとって、各項目についてのSN比を示している。また図4では、各項目について、左側にその項目のデータを含む各データに対する総合推定値のSN比、即ち信号値との相関の強さを示し、右側にその項目のデータを除いた各データに対する総合推定値のSN比を示している。図4に示す例では、項目は36個あり、選択の組み合わせは236−1通り存在する。演算手段は、これらの各組み合わせについて一又は複数の項目に対する予測対象のSN比を導出する。そして、演算手段は、対象となる当該項目を含む組み合わせのSN比の平均値と、当該項目を含まない組み合わせのSN比の平均値とを算出する。図4では、このようにして算出された当該項目のデータを含むSN比の平均値を左側に、当該項目を含まないSN比の平均値を右側に、項目毎に示したものである。 In FIG. 4, the horizontal axis indicates items to be selected, and the vertical axis indicates the SN ratio of each item by taking the SN ratio of the comprehensive estimated value. In FIG. 4, for each item, the SN ratio of the total estimated value for each data including the data of the item, that is, the strength of the correlation with the signal value is shown on the left side, and each data excluding the data of the item is shown on the right side. The SN ratio of the comprehensive estimated value with respect to is shown. In the example shown in FIG. 4, there are 36 items, and there are 2 36 −1 combinations of selections. The calculation means derives the SN ratio of the prediction target for one or a plurality of items for each of these combinations. And a calculating means calculates the average value of SN ratio of the combination containing the said item used as object, and the average value of S / N ratio of the combination which does not contain the said item. In FIG. 4, the average value of the SN ratio including the data of the item calculated in this way is shown on the left side, and the average value of the SN ratio not including the item is shown on the right side for each item.

図5は、横軸に選択の対象となる項目を示し、縦軸に要因効果値をとって、各項目についての要因効果値の度合いを示している。図5の縦軸の要因効果値は、図4における予測対象の相関の強さをdb単位で示した各項目の総合推定値のSN比について、右側の(項目を含まない)SN比に対する左側の(項目を含む)SN比の度合い、即ち、左側のSN比から右側のSN比を減じた値を示している。つまり、項目毎に、その項目を含む場合の、含まない場合に対するSN比への効果度を示している。したがって算出された要因効果値が正である項目は、その項目を使用することにより、総合推定値のSN比が上昇することを示している。両側T法と呼ばれる方法においては、このような要因効果値が正である項目のみを選択し、上述にしめしたようなT法による解析が行なわれる。   In FIG. 5, the horizontal axis indicates items to be selected, and the vertical axis indicates the factor effect value, and the degree of the factor effect value for each item is indicated. The factor effect value on the vertical axis in FIG. 5 is the left side of the SN ratio on the right side (excluding items) of the SN ratio of the overall estimated value of each item indicating the strength of the correlation of the prediction target in FIG. Of the SN ratio (including items), that is, a value obtained by subtracting the right SN ratio from the left SN ratio. That is, for each item, the degree of effect on the S / N ratio when the item is included is not shown. Therefore, an item for which the calculated factor effect value is positive indicates that the SN ratio of the comprehensive estimated value is increased by using the item. In a method called a two-sided T method, only items having such positive factor effect values are selected, and an analysis by the T method as described above is performed.

上述に示したようなT法(両側T法)を用いて予測を行なう場合には依然として、実際の予測精度が高まらない。そこで発明者はまず、上述のT法に、時間差モデルという考え方を適用し、信号値と項目のデータの値との非線形性を考慮した変換処理を行ない、更に、項目選択方法として、要因効果値の正負によって選択する方法ではなく、総合推定値のSN比を最大化する方法を用いることとした。   When prediction is performed using the T method (two-sided T method) as described above, the actual prediction accuracy still does not increase. Therefore, the inventor first applies the concept of a time difference model to the above-described T method, performs conversion processing in consideration of the nonlinearity between the signal value and the value of the item data, and further, as the item selection method, the factor effect value Instead of the method of selecting by positive / negative of the method, the method of maximizing the SN ratio of the comprehensive estimated value is used.

まず、時間差モデルについて説明する。
T法は元来、時系列データの予測のための方法ではない。時間軸の概念は特に無く、多数の要因が関連する事象の値に対し、いずれの要因が最も影響があるかを選択するための方法である。T法をそのまま予測方法に用いる場合、上述したように、各メンバーの項目毎のデータと信号値との関係を特定して、次のメンバーの信号値を予測するのである。したがって、次のメンバーの信号値を予測するには、次のメンバーの項目毎のデータを予測しなければならない。このときの各項目のデータの推定誤差が重なって、信号値の予測精度を悪化させることは容易に想定される。また、時系列に推移していくデータを元に、次の信号値を予測する場合、特に経済予測又は販売予測のような分野では、未来に起こる事象には、過去にその予兆があるはずである。そこで、発明者は、上述したような信号値と項目毎のデータとの対応付けを、同時期のメンバーではなく、所定時間ずらしたものどうしで対応付けることとした。具体的には、本実施の形態の予測方法を実施する演算手段は、ある期間における項目毎のデータに対し、所定期間後の信号値を対応づけ、これらの間で式1〜5の計算を行ない、結果得られた総合推定式を用い、現在(直近)の任意の期間の項目毎のデータに基づき、所定期間後の信号値を推定(予測)する。
First, the time difference model will be described.
The T method is not originally a method for prediction of time series data. There is no particular concept of the time axis, and it is a method for selecting which factor has the most influence on the value of an event related to a large number of factors. When the T method is used as it is for the prediction method, as described above, the relationship between the data for each item of each member and the signal value is specified, and the signal value of the next member is predicted. Therefore, in order to predict the signal value of the next member, data for each item of the next member must be predicted. It is easily assumed that the estimation error of the data of each item at this time overlaps and the prediction accuracy of the signal value is deteriorated. In addition, when predicting the next signal value based on time-series data, especially in fields such as economic forecasting or sales forecasting, there should be signs of future events. is there. Therefore, the inventor decided to associate the association between the signal value and the data for each item as described above not with the members of the same period but with the ones shifted by a predetermined time. Specifically, the computing means that implements the prediction method of the present embodiment associates the signal value after a predetermined period with the data for each item in a certain period, and calculates Equations 1 to 5 between them. Then, the signal value after a predetermined period is estimated (predicted) based on the data for each item in the current (most recent) period using the comprehensive estimation formula obtained as a result.

図6は、時間差モデルを概念的に示す説明図である。図6では、右から左へ向かって時間の経過を示している。図6の下部の各矩形は、単位期間毎の信号を示し、上部の各矩形は、信号と同時期の単位時間毎の各項目のデータを示す。例えば、単位期間とする1ヶ月毎の信号と、1ヶ月毎の項目のデータを示す。項目は、各信号に対して複数存在する。時間差モデルとは、同時期の信号と項目のデータとを対応付けるのではなく、信号値Mi に対し、所定期間前の項目のデータXi-t 1 ,Xi-t 2 ,…,Xi-t k (例えばt=4ヶ月)を対応付けるものである。本実施の形態の予測方法では、演算手段は、時間差モデルを適用した信号値及び項目のデータに、上述(式1〜式5)のM1 と各項目のデータX11,X12,…,X1kの関係に当てはめてT法を適用する。そして、予測対象期間の信号値は、所定期間前の項目のデータの値、即ち予測対象期間直近の対応期間(ここでは4ヶ月分)における各項目のデータの値を用いて式4に適用することで求められる。つまり、本実施の形態の予測方法における時間差モデルでは、演算手段は、複数項目のデータと所定期間後の信号値との関係を特定することにより、過去又は現在の項目のデータから、未来の信号値を予測することを可能とするものである。 FIG. 6 is an explanatory diagram conceptually showing the time difference model. FIG. 6 shows the passage of time from right to left. Each rectangle at the bottom of FIG. 6 represents a signal for each unit period, and each rectangle at the top represents data of each item for each unit time at the same time as the signal. For example, a signal for each month as a unit period and data of items for each month are shown. There are a plurality of items for each signal. The time difference model, rather than associating the data signal and the item for the same period, with respect to signal values M i, the data X it 1 of a predetermined period before entry, X it 2, ..., X it k ( e.g. t = 4 months). In the prediction method of the present embodiment, the calculation means applies the signal value and item data to which the time difference model is applied to M 1 in the above (Equation 1 to Equation 5) and the data X 11 , X 12 ,. The T method is applied by applying the relationship of X 1k . The signal value of the prediction target period is applied to Equation 4 using the value of the data of the item before the predetermined period, that is, the value of the data of each item in the corresponding period (here, four months) immediately before the prediction target period. Is required. In other words, in the time difference model in the prediction method of the present embodiment, the calculation means specifies the relationship between the data of a plurality of items and the signal value after a predetermined period, so that the future signal can be obtained from the past or current item data. It is possible to predict the value.

そして本実施の形態における予測方法では、信号値Xに対し、非線形性を考慮した変換処理が行なわれる。図7は、変換処理前後の信号値と項目毎のデータの値との関係を示すグラフである。図7の左側には変換処理前の、ある項目のデータに対する信号値の関係を示し、右側には、変換処理後の、ある項目のデータに対する信号値の関係が示されている。T法では、項目毎に、項目のデータと信号値との関係に対し、ゼロ点を通る直線が設定され、この直線からのずれに基づく重み付け(SN比として数値化)が行なわれる。つまり、図7の右側のような関係が前提とされている。直線に対するばらつきが少ない項目ほど、信号値の変化に対し寄与する項目であり、ばらつきが多い、即ち項目のデータの値の変化と信号値の変化とに相関がない項目ほど、信号値の変化に寄与しない項目である。しかしながら、全ての項目のデータが、信号値との関係において直線、即ち線形な関係を有しているとは限らないのは当然である。中には、図7の左側に示す用に、原点を通らないような2次関数で示される強い関係を示す項目がある。そこで、本実施の形態における予測方法では、演算手段は、項目のデータXij(i:メンバー数(1〜l)、j:項目数(1〜k))を、非線形の関係(2次関数)にある前提にて、線形的な関係を示すxijに線形変換しておく。 In the prediction method according to the present embodiment, the signal value X is subjected to conversion processing in consideration of nonlinearity. FIG. 7 is a graph showing the relationship between signal values before and after the conversion process and data values for each item. The left side of FIG. 7 shows the relationship of signal values to data of a certain item before conversion processing, and the right side shows the relationship of signal values to data of a certain item after conversion processing. In the T method, for each item, a straight line passing through the zero point is set for the relationship between the item data and the signal value, and weighting based on the deviation from this straight line (quantified as an SN ratio) is performed. That is, the relationship on the right side of FIG. 7 is assumed. Items with less variation with respect to a straight line are items that contribute to changes in the signal value.There are more variations, that is, items with no correlation between the change in the data value of the item and the change in the signal value, the change in the signal value. This item does not contribute. However, it is natural that the data of all items does not necessarily have a straight line, that is, a linear relationship in relation to the signal value. Among them, as shown on the left side of FIG. 7, there is an item indicating a strong relationship indicated by a quadratic function that does not pass through the origin. Therefore, in the prediction method according to the present embodiment, the calculation means uses the item data X ij (i: number of members (1 to 1), j: number of items (1 to k)) as a non-linear relationship (quadratic function). ) Is linearly converted into x ij indicating a linear relationship.

具体的には、演算手段は、項目のデータXij(1〜l)と信号値Mij(1〜l)との間の基準とする単位空間データとして、データXijと信号値Mijの平均値とを求める。演算手段は、信号値Mij及び項目データXijの夫々の値から単位空間における平均値を減じる規準化処理を行なう。そして、演算手段は、信号値Mijに対して変化する項目データXijの値を用いて、2次式等の多項式で近似する。次に、演算手段は、この近似された値を用いてXij(1〜l)の値をxijに変換する。信号値と項目データとの関係が線形的な場合は、項目データの値Xij(1〜l)がそのまま又は規準化したXij(1〜l)のデータが、式4に適用されるが、非線形の場合は変換後のxij(1〜l)の値を式4に適用される。 Specifically, the arithmetic means, as the unit space data as a reference between the items of data X ij (1 to L) and the signal value M ij (1 to L), the data X ij and the signal values M ij Find the average value. The calculation means performs a normalization process for subtracting the average value in the unit space from each value of the signal value M ij and the item data X ij . Then, the calculation means approximates with a polynomial such as a quadratic expression using the value of the item data X ij that changes with respect to the signal value M ij . Next, the computing means converts the value of X ij (1 to 1) into x ij using this approximated value. If the relationship between the signal value and the item data is linear, although data X ij where the item data value X ij (1 to L) is directly or normalized (1 to L) is applied to Equation 4 In the case of non-linearity, the value of x ij (1 to 1) after conversion is applied to Equation 4.

また、本実施の形態における予測方法では、項目選択の方法として、信号値及び項目毎のデータに対し、上述の時間差モデルを適用し、更に、非線形性を考慮した変換処理を行なった後の対応する項目毎のデータと信号値とに基づき、演算手段が、上述の総合推定値のSN比を算出し、総合推定値のSN比が最大となるような項目を選択する。図8は、最適な項目選択数を決定するための処理を概念的に示すグラフである。まず、時間差モデルを適用して線形変換処理を行なった信号値と項目毎のデータについて、式1〜式5を適用して各項目の総合推定値のSN比を算出する。そして図4及び図5について説明したように、演算手段が、総合推定値のSN比から、項目毎の要因効果値を算出する。図8に示すように、演算手段はまず、項目毎の要因効果値の最小値を初期的な閾値として設定する。演算手段は、要因効果値が閾値以上である項目を選択し、信号値(例えば1〜l全て)に対する総合推定値のSN比を算出する。閾値が初期値である場合、全項目が選択される。次に演算手段は、閾値に所定値を加算した値を次の閾値として設定し、同様にして要因効果値が閾値以上である項目を選択し、信号値に対する総合推定値のSN比を算出する。演算手段がこのような処理を、閾値が要因効果値の最大値以上、即ち図8のMAXとして示した横線に到達するまで繰り返すことにより、選択した複数の項目のデータに対する総合推定値のSN比を、項目数毎に算出することが可能である。なお、演算手段は、閾値の初期値を最大値MAX以上に設定し、閾値を所定値ずつ小さくし、各閾値以上の要因効果値である項目を選択して総合推定値のSN比を算出していくようにしてもよい。   In addition, in the prediction method according to the present embodiment, as a method of item selection, a response after applying the above-described time difference model to the signal value and the data for each item, and further performing a conversion process in consideration of nonlinearity Based on the data and signal value for each item to be calculated, the calculation means calculates the SN ratio of the comprehensive estimated value and selects an item that maximizes the SN ratio of the comprehensive estimated value. FIG. 8 is a graph conceptually showing a process for determining the optimum number of item selections. First, the S / N ratio of the comprehensive estimated value of each item is calculated by applying Equations 1 to 5 for the signal value and the data for each item that have been subjected to the linear transformation process using the time difference model. Then, as described with reference to FIGS. 4 and 5, the calculation means calculates a factor effect value for each item from the SN ratio of the comprehensive estimated value. As shown in FIG. 8, the computing means first sets the minimum value of the factor effect value for each item as an initial threshold value. The computing means selects an item whose factor effect value is equal to or greater than a threshold value, and calculates the SN ratio of the comprehensive estimated value with respect to the signal value (for example, all 1 to 1). If the threshold is the initial value, all items are selected. Next, the calculation means sets a value obtained by adding a predetermined value to the threshold value as the next threshold value, similarly selects an item whose factor effect value is equal to or greater than the threshold value, and calculates the SN ratio of the comprehensive estimated value with respect to the signal value. . The calculation means repeats such processing until the threshold reaches the maximum factor effect value, that is, until the horizontal line shown as MAX in FIG. 8 is reached, whereby the SN ratio of the overall estimated value for the data of the selected items is selected. Can be calculated for each number of items. The calculation means sets the initial value of the threshold value to the maximum value MAX or more, decreases the threshold value by a predetermined value, selects an item that is a factor effect value above each threshold value, and calculates the SN ratio of the comprehensive estimated value. You may make it go.

図9は、項目選択数と総合推定値のSN比との対応を示すグラフである。図8に示したような方法にて、項目を選択した場合の項目数に対する総合推定値のSN比を示す。図9中、黒丸で示す推移は、線形変換を行なった場合の総合推定値のSN比であり、黒四角で示す推移は、線形変換を行なわなかった場合の総合推定値のSN比である。図9に示すように、線形変換を行なった場合の方が、全体として総合推定値のSN比が高い。即ち、予測の精度が高い。また、SN比の値の内、白抜きの四角は、要因効果値が正の項目を選択するという両側T法を用いて項目を選択した場合の総合推定値のSN比である。白抜きの菱形は、全項目を選択した場合の総合推定値のSN比を示す。白丸は総合SN比が最大となる項目数を示している。図9に示すように、要因効果値が正の項目を選択する方法では、非線形変換を行なった場合には、総合推定値のSN比は最大とならない。当然であるが、図9に示すように、演算手段が図8に示した方法を実施することにより、総合推定値のSN比が最も高くなる項目を最適に選択することができる。   FIG. 9 is a graph showing the correspondence between the number of item selections and the SN ratio of the overall estimated value. The SN ratio of the comprehensive estimated value with respect to the number of items when an item is selected by the method shown in FIG. In FIG. 9, the transition indicated by the black circle is the SN ratio of the comprehensive estimated value when linear conversion is performed, and the transition indicated by the black square is the SN ratio of the comprehensive estimated value when linear conversion is not performed. As shown in FIG. 9, the SN ratio of the overall estimated value as a whole is higher when linear conversion is performed. That is, the accuracy of prediction is high. In addition, among the S / N ratio values, the white square is the S / N ratio of the overall estimated value when an item is selected using the two-sided T method in which an item having a positive factorial effect value is selected. Open diamonds indicate the SN ratio of the overall estimated value when all items are selected. White circles indicate the number of items with the maximum total SN ratio. As shown in FIG. 9, in the method of selecting an item having a positive factor effect value, the SN ratio of the comprehensive estimated value is not maximized when nonlinear conversion is performed. As a matter of course, as shown in FIG. 9, when the calculation means performs the method shown in FIG. 8, the item having the highest SN ratio of the total estimated value can be optimally selected.

本願発明者は上述したように、T法に、時間差モデルを適用し、信号値と項目のデータとの非線形性を考慮した変換処理を行なった上で総合推定値のSN比を算出し、当該SN比を最大化する項目の選択方法を適用することによって、予測精度を向上させることができるという知見を得た。更に本願発明者は、上述の時間差モデル等の方法に加え、総合推定値のSN比を最大化する項目を選択するに際し、記録されている信号期間(メンバー1〜l)から、予測に適した信号期間を選択することで予測精度を向上させることができるとの知見を得た。予測に適した信号期間は、演算手段が、信号トレンド及び項目の類似性トレンドを元に選択する。以下、予測精度を向上させることができる信号期間の選択方法について、具体的に開示する。   As described above, the inventor of the present application applies a time difference model to the T method, calculates the SN ratio of the overall estimated value after performing a conversion process considering the nonlinearity between the signal value and the item data, The present inventors have obtained the knowledge that the prediction accuracy can be improved by applying a method for selecting an item that maximizes the S / N ratio. Furthermore, in addition to the method such as the time difference model described above, the inventor of the present application is suitable for prediction from the recorded signal period (members 1 to 1) when selecting an item that maximizes the SN ratio of the overall estimated value. The knowledge that the prediction accuracy can be improved by selecting the signal period was obtained. The signal period suitable for the prediction is selected by the calculation means based on the signal trend and the item similarity trend. Hereinafter, a method of selecting a signal period that can improve the prediction accuracy will be specifically disclosed.

まず、上述に説明した方法を含む予測方法全体を実施する予測装置の構成について説明する。図10は、本実施の形態における予測装置1の構成を示すブロック図である。予測装置1は、パーソナルコンピュータ、サーバコンピュータ等のコンピュータを用いる。予測装置1は、制御部10、記録部11、一時記憶部12、入力部13、及び出力部14を備える。   First, the structure of the prediction apparatus which implements the whole prediction method including the method demonstrated above is demonstrated. FIG. 10 is a block diagram illustrating a configuration of the prediction device 1 according to the present embodiment. The prediction device 1 uses a computer such as a personal computer or a server computer. The prediction device 1 includes a control unit 10, a recording unit 11, a temporary storage unit 12, an input unit 13, and an output unit 14.

制御部10は、CPU(Central Processing Unit )を用いる。制御部10は、以下に説明する予測プログラム2に基づき、パーソナルコンピュータ又はサーバコンピュータを制御し、本実施の形態における予測装置1としての機能を発揮させる。なお制御部10は、上述した予測方法を実施する演算手段の機能を発揮する。   The control unit 10 uses a CPU (Central Processing Unit). The control part 10 controls a personal computer or a server computer based on the prediction program 2 demonstrated below, and exhibits the function as the prediction apparatus 1 in this Embodiment. In addition, the control part 10 exhibits the function of the calculating means which implements the prediction method mentioned above.

記録部11は、ROM(Read Only Memory)、ハードディスクドライブ等の不揮発性メモリを用いる。なお、記録部11は、外付けのハードディスクドライブ、光学ディスクドライブ、通信網を介して接続される他の記録装置であってもよい。即ち記録部11とは、制御部10からアクセス可能な1又は複数の情報記録媒体の総称である。   The recording unit 11 uses a nonvolatile memory such as a ROM (Read Only Memory) or a hard disk drive. The recording unit 11 may be an external hard disk drive, an optical disk drive, or another recording device connected via a communication network. That is, the recording unit 11 is a general term for one or a plurality of information recording media accessible from the control unit 10.

記録部11には、本実施の形態の予測方法を実現するための各種手順を含む予測プログラム2が記録されている。また、記録部11の記録領域の一部は、信号値及び該値に対応する複数の項目のデータを記録するデータベース(DB)110として用いられる。制御部10は、データベース110に対し、信号値及び複数の項目のデータの読み書きが可能である。データベース110は、例えば図3に示した形式にて各メンバーの信号値及び項目毎のデータを時系列に記録している。   The recording unit 11 records a prediction program 2 including various procedures for realizing the prediction method of the present embodiment. A part of the recording area of the recording unit 11 is used as a database (DB) 110 that records signal values and data of a plurality of items corresponding to the values. The control unit 10 can read and write signal values and data of a plurality of items with respect to the database 110. The database 110 records the signal value of each member and data for each item in time series, for example, in the format shown in FIG.

一時記憶部12は、DRAM(Dynamic Random Access Memory)又はSRAM(Static Random Access Memory )等の不揮発性メモリを用いる。一時記憶部12は、制御部10の処理によって発生した情報を一時的に記憶する。   The temporary storage unit 12 uses a nonvolatile memory such as DRAM (Dynamic Random Access Memory) or SRAM (Static Random Access Memory). The temporary storage unit 12 temporarily stores information generated by the processing of the control unit 10.

入力部13は、キーボード、マウス等を用い、ユーザの操作入力を受け付ける。   The input unit 13 receives a user operation input using a keyboard, a mouse, or the like.

出力部14は、液晶モニタなどの表示部、又はプリンタ等の印刷部を用い、制御部10による情報の処理結果を出力する。   The output unit 14 uses a display unit such as a liquid crystal monitor or a printing unit such as a printer, and outputs information processing results by the control unit 10.

このように構成される予測装置1にて、制御部10が予測プログラム2に基づく処理を実行することにより、未来の事象に係る信号値を予測する。   In the prediction apparatus 1 configured as described above, the control unit 10 executes a process based on the prediction program 2 to predict a signal value related to a future event.

図11は、本実施の形態における予測装置1による予測処理手順の一例を示すフローチャートである。   FIG. 11 is a flowchart illustrating an example of a prediction processing procedure performed by the prediction device 1 according to the present embodiment.

制御部10は、入力部13から、信号値及びこれに関連する複数の項目のデータについて入力を受け付け、受け付けた信号値及び項目毎のデータを記録部11のデータベース110に記録する(ステップS101)。なお、データベース110に記録する信号値及び項目毎のデータは、入力部13から入力されるもののみならず、通信網を介して他の装置から入力されてもよいし、他の情報記録媒体から入力されてもよい。   The control unit 10 receives an input from the input unit 13 regarding the signal value and data of a plurality of items related thereto, and records the received signal value and data for each item in the database 110 of the recording unit 11 (step S101). . The signal values and data for each item to be recorded in the database 110 may be input not only from the input unit 13 but also from other devices via a communication network, or from other information recording media. It may be entered.

制御部10は、記録部11のデータベース110に記録した信号値及び項目毎のデータに基づいて、時間差モデルを生成する(ステップS102)。ステップS102にて生成する時間差モデルとは、図6を参照して説明したように、項目毎のデータと、該項目のデータの所定期間後の信号値とを対応付けたものである。即ち、制御部10は、ステップS102において、時系列に記憶された信号値と、項目毎のデータとを、所定期間ずらして対応付ける。   The control unit 10 generates a time difference model based on the signal value recorded in the database 110 of the recording unit 11 and the data for each item (step S102). As described with reference to FIG. 6, the time difference model generated in step S102 is obtained by associating data for each item with a signal value after a predetermined period of the data of the item. That is, in step S102, the control unit 10 associates the signal values stored in time series with the data for each item while shifting by a predetermined period.

制御部10は、生成した時間差モデルにおいて対応する信号値と項目毎のデータとの関係に基づき、項目毎のデータを線形変換する(ステップS103)。制御部10は、線形変換後のデータを用いて、予測に用いる信号期間を選択する処理を行なう(ステップS104)。信号期間を選択する処理については、後述の図12のフローチャートを参照して詳細を説明する。   The control unit 10 linearly transforms the data for each item based on the relationship between the corresponding signal value and the data for each item in the generated time difference model (step S103). The control part 10 performs the process which selects the signal period used for prediction using the data after linear transformation (step S104). Details of the process of selecting the signal period will be described with reference to the flowchart of FIG.

制御部10は、ステップS104にて選択した信号期間における信号値と、時間差モデルにて対応する項目データとに基づき、前述の式1及び式2を用いて、項目毎の比例定数β及びSN比η(2乗比)を算出する(ステップS105)。   Based on the signal value in the signal period selected in step S104 and the corresponding item data in the time difference model, the control unit 10 uses the above-described Equation 1 and Equation 2 to calculate the proportionality constant β and SN ratio for each item. η (square ratio) is calculated (step S105).

制御部10は、式3を用いて項目毎の比例定数βとSN比η(2乗比)を用いて、選択された信号期間における各メンバーについて、式3により出力の推定値を算出する(ステップS106)。   The control unit 10 calculates the estimated value of the output by Expression 3 for each member in the selected signal period using the proportional constant β and the SN ratio η (square ratio) for each item using Expression 3. Step S106).

制御部10は、式4により、推定値についての推定精度であるSN比(2乗比)を重み付け係数として用いた総合推定値を算出する(ステップS107)。   The control unit 10 calculates an overall estimated value using the SN ratio (square ratio), which is the estimation accuracy of the estimated value, as a weighting coefficient by Equation 4 (step S107).

次に制御部10は、式5に基づき、信号値及び総合推定値に基づいて、各項目の総合推定値のSN比(db)を算出する(ステップS108)。   Next, based on Equation 5, the control unit 10 calculates the SN ratio (db) of the overall estimated value of each item based on the signal value and the overall estimated value (step S108).

制御部10は、各項目について、要因効果値を導出する(ステップS109)。要因効果値は、上述したように、各項目について、当該項目を除いた各項目のデータに対する総合推定値のSN比に対する、当該項目を含む各項目のデータに対する総合推定値のSN比の差分を求めることによって算出される。総合推定値のSN比とは、信号値に対する当該項目のデータの相関の強さであり、分散の逆数に比例する値の対数として示した値である。   The control unit 10 derives a factor effect value for each item (step S109). As described above, the factor effect value is the difference between the SN ratio of the overall estimated value for the data of each item including the item with respect to the SN ratio of the comprehensive estimated value for the data of each item excluding the item, as described above. It is calculated by obtaining. The SN ratio of the comprehensive estimated value is the strength of the correlation of the data of the item with respect to the signal value, and is a value expressed as a logarithm of a value proportional to the reciprocal of variance.

次に制御部10は、要因効果値が大きいものから順に選択した複数の項目のデータに対する総合推定値のSN比を、項目数毎に算出する(ステップS110)。ステップS110における処理の詳細は、上述にて図8を参照して説明したものである。   Next, the control unit 10 calculates the SN ratio of the comprehensive estimated value for the data of a plurality of items selected in descending order of the factor effect value for each number of items (step S110). Details of the processing in step S110 have been described above with reference to FIG.

制御部10は、項目数毎の総合推定値のSN比に基づき、当該SN比を最大にする項目数を決定する(ステップS111)。   The control unit 10 determines the number of items that maximizes the SN ratio based on the SN ratio of the comprehensive estimated value for each number of items (step S111).

制御部10は、ステップS111にて決定した項目数分の項目を選択する(ステップS112)。そして制御部10は、時間差モデルにおける予測対象期間に対応付けられている所定期間前の項目毎のデータ、即ち、予測対象期間の直近の対応期間における項目毎のデータの内、選択した項目のデータを式4に当てはめ、予測値を算出する(ステップS113)。式4におけるβ及びηは、ステップS105にて算出したもの(時間差モデル、線形変換、信号期間選択後のデータによって算出されたもの)を用いる。ステップS113にて予測値は、出力部14から出力されるか、記録部11に記録される。なお、信号値が規準化されている場合は、逆変換を行なって求めればよい。   The control unit 10 selects as many items as the number of items determined in step S111 (step S112). And the control part 10 is the data of the selected item among the data for every item before the predetermined period matched with the prediction object period in a time difference model, ie, the data for every item in the corresponding period nearest to a prediction object period. Is applied to Equation 4 to calculate a predicted value (step S113). Β and η in Equation 4 are those calculated in step S105 (calculated from data after time difference model, linear conversion, and signal period selection). In step S113, the predicted value is output from the output unit 14 or recorded in the recording unit 11. If the signal value is normalized, it can be obtained by performing inverse transformation.

図12は、本実施の形態における予測装置1による信号期間選択処理手順の一例を示すフローチャートである。以下に示す処理手順は、図11のステップS104における信号期間の選択処理の詳細に対応する。   FIG. 12 is a flowchart illustrating an example of a signal period selection processing procedure by the prediction device 1 according to the present embodiment. The processing procedure shown below corresponds to the details of the signal period selection processing in step S104 of FIG.

制御部10は、変動率の低減のため、信号値を規準化(平均値を減算)し、対数値をとる変換を行なう(ステップS41)。   In order to reduce the fluctuation rate, the control unit 10 normalizes the signal value (subtracts the average value) and performs conversion that takes a logarithmic value (step S41).

制御部10は、変換後の信号値に対し、全メンバー又は所定の期間(例えば10年分)におけるトレンドを計算する(ステップS42)。信号トレンドの計算は、例えば、状態空間モデルによるトレンド成分モデルを適用するなど、公知の種々の時系列データに対するトレンド計算の方法を用いることが可能である。   The control unit 10 calculates a trend for all members or a predetermined period (for example, 10 years) with respect to the converted signal value (step S42). For the calculation of the signal trend, it is possible to use a known trend calculation method for various time series data, such as applying a trend component model based on a state space model.

制御部10は、ステップS42にて計算したトレンドの内、予測対象期間の信号値に対応付けられる項目のデータと、時間差モデル適用前の同時期(対応期間)の信号値のトレンドを特定する(ステップS43)。ステップS43にて詳細には、制御部10は、前記対応期間におけるトレンドが、正の勾配であるか負の勾配であるかを判定する。   The control part 10 specifies the trend of the signal value of the item data matched with the signal value of a prediction object period, and the signal period of the same period (corresponding period) before application of a time difference model among the trends calculated in step S42 ( Step S43). Specifically, in step S43, the control unit 10 determines whether the trend in the corresponding period is a positive gradient or a negative gradient.

制御部10は、ステップS43で特定したトレンド(正の勾配か/負の勾配か)と同一のトレンド特性を有する区間における信号値及び項目毎のデータ(時間差モデル適用後)を選択する(ステップS44)。   The control unit 10 selects a signal value and data for each item (after applying the time difference model) in the section having the same trend characteristic as the trend (positive slope / negative slope) identified in step S43 (step S44). ).

制御部10は、選択した区間における項目のデータ(線形変換後)のマハラノビスの汎距離(以下、MD(Mahalanobis Distance)という)を算出する(ステップS45)。   The control unit 10 calculates the Mahalanobis general distance (hereinafter referred to as MD (Mahalanobis Distance)) of the item data (after linear conversion) in the selected section (step S45).

制御部10は、選択した区間におけるMDのトレンドを算出する(ステップS46)。   The control unit 10 calculates the MD trend in the selected section (step S46).

制御部10は、選択した区間を構成する複数の不連続な区間(信号トレンドが同一の区間)から、予測対象期間から近い区間を順に選択する(ステップS47)。制御部10は、選択した区間全体において、MDトレンドが所定値(例えば1.0)よりも大きいか否かを判断する(ステップS48)。制御部10は、ステップS48にて所定値よりも大きいと判断した場合(S48:YES)、処理をステップS47へ戻し、次に予測対象期間に近い他の区間を選択する。   The control unit 10 sequentially selects a section close to the prediction target period from a plurality of discontinuous sections (sections having the same signal trend) constituting the selected section (step S47). The control unit 10 determines whether or not the MD trend is larger than a predetermined value (for example, 1.0) in the entire selected section (step S48). If the control unit 10 determines that the value is larger than the predetermined value in step S48 (S48: YES), the control unit 10 returns the process to step S47, and then selects another section close to the prediction target period.

制御部10は、選択した区間全体においてMDトレンドが所定値よりも大きくない、即ち、一部MDトレンドが所定値以下の区間を含むと判断した場合(S48:NO)、当該区間の内、直近の予測対象期間分の長さを信号期間として選択し(ステップS49)、処理を終了する。   When the control unit 10 determines that the MD trend is not larger than the predetermined value in the entire selected section, that is, a part of the MD trend includes a section having a predetermined value or less (S48: NO), the control section 10 Is selected as a signal period (step S49), and the process ends.

制御部10が図12のフローチャートに示したように信号期間を選択することにより、予測対象期間の信号値(予測対象)に対応する項目のデータと同時期の信号値のトレンドの特性に近い様相を特性として持つ期間における項目データと所定期間後の信号値との関係から、予測が行なわれることになる。これにより、予測対象期間の所定期間前(現在)と似ていない予兆を見せている期間における項目データと信号値との関係による影響を低減することができ、予測の精度を向上させることができることが推察できる。   When the control unit 10 selects the signal period as shown in the flowchart of FIG. 12, the aspect close to the characteristic of the trend of the data value of the item corresponding to the signal value (prediction target) of the prediction target period and the signal value of the same period. Prediction is performed from the relationship between the item data in the period having the characteristic and the signal value after the predetermined period. Thereby, it is possible to reduce the influence of the relationship between the item data and the signal value in a period showing a sign that is not similar to (previously) a predetermined period before the prediction target period, and to improve the accuracy of the prediction. Can be guessed.

次に、予測装置1による予測方法を適用した具体的な実施例について説明する。   Next, a specific embodiment to which the prediction method by the prediction device 1 is applied will be described.

実施例として、本実施の形態の予測方法を建設機械の需要予測に適用した例を説明する。図13は、本実施例における項目の内容を示す説明図である。本実施例では、予測対象(信号値)を「建設機械の出荷台数」とし、予測対象に関連する項目を様々な経済指標とした。経済指標となる項目としては、図13に示すように、「月」、「日本 失業率(%)」、「国内銀行貸出金利(%)」等が設定されている。これらの各項目は、月度毎のデータがメンバーに対応付けられている。なお「1月」、「2月」等の月を示す項目は、メンバーとして対応付けられる各項目が何月度に対応するかを示す項目であり、当該月度の出荷台数を信号値とするメンバーでは、「1」が記録され、当該月度でない場合には「0」が記録される。例えば、2010年1月度のメンバーは、「1月」の項目のデータが「1」となり、他の月度の項目のデータ「2月」〜「12月」の項目のデータが「0」となる。実施例では、予測装置1が、経済指標に関する24項目(図13では一部省略又は詳細変更)及び月度に関する12項目の合計36項目に基づき、「建設機械の出荷台数」を予測する。   As an example, an example in which the prediction method of the present embodiment is applied to the demand prediction of a construction machine will be described. FIG. 13 is an explanatory diagram showing the contents of items in the present embodiment. In this example, the prediction target (signal value) was “the number of construction machines shipped”, and items related to the prediction target were various economic indicators. As an economic index item, as shown in FIG. 13, “month”, “Japan unemployment rate (%)”, “domestic bank lending interest rate (%)”, etc. are set. In each of these items, data for each month is associated with the member. In addition, items indicating months such as “January” and “February” are items indicating how many degrees each item associated as a member corresponds to. , “1” is recorded, and “0” is recorded when it is not the month. For example, for a member in January 2010, the data for the item “January” is “1”, and the data for the items for other months “February” to “December” is “0”. . In the embodiment, the prediction device 1 predicts “the number of construction machines shipped” based on a total of 36 items including 24 items related to economic indicators (partially omitted or changed in detail in FIG. 13) and 12 items related to monthly degrees.

図14は、本実施例にて予測に用いる信号値の内容例を示すグラフである。図14の横軸は、年月を時系列に示し、縦軸は、出荷台数を示す。なお図14における出荷台数は、2005年の年間平均の月度台数で規準化して示している。本実施例では、予測装置1を用い、図14に示す出荷台数の時系列データに対する図13に示した項目毎のデータに基づき、2010年1月〜12月の12ヶ月間の出荷台数を予測する。なお、後述にて、2010年1月〜12月の12ヶ月間の出荷台数の実績値を元に、予測装置1による予測値に対する評価を行なう。   FIG. 14 is a graph showing an example of the contents of signal values used for prediction in this embodiment. The horizontal axis in FIG. 14 indicates the year and month in time series, and the vertical axis indicates the number of units shipped. In FIG. 14, the number of units shipped is standardized by the monthly average number in 2005. In the present embodiment, the prediction unit 1 is used to predict the shipment quantity for 12 months from January to December 2010 based on the data for each item shown in FIG. 13 with respect to the time series data of the shipment quantity shown in FIG. To do. In addition, evaluation with respect to the predicted value by the prediction apparatus 1 is performed based on the actual value of the number of units shipped for 12 months from January to December 2010, which will be described later.

まず、予測装置1の制御部10は、図14に示したような時系列データの信号値及び各信号値に対する項目毎のデータについて、時間差モデルを適用した時系列データを生成する(S102)。本実施例では、予測期間は12ヶ月であるので、12ヶ月ずらした時間差モデルを適用する。   First, the control unit 10 of the prediction device 1 generates time-series data to which a time difference model is applied for the signal values of the time-series data and the data for each item for each signal value as shown in FIG. 14 (S102). In this embodiment, since the prediction period is 12 months, a time difference model shifted by 12 months is applied.

そして制御部10は、時間差モデルを適用した項目のデータに対して線形変換を行ない(S103)、また、信号値に対し、上述したように規準化及び対数値をとる変換処理を行なう(S41)。そして制御部10は、変換後の信号値のトレンドを求める(S42)。   Then, the control unit 10 performs linear conversion on the data of the item to which the time difference model is applied (S103), and performs conversion processing for normalizing and logarithmically converting the signal value as described above (S41). . And the control part 10 calculates | requires the trend of the signal value after conversion (S42).

図15は、予測装置1の制御部10により求められた信号値のトレンドを示すグラフである。図15に示すグラフは、図14の出荷台数のグラフに重ねて表示している。図15中、黒丸及び白丸にて信号トレンドを示している。白丸は信号トレンドの勾配がプラス(+)の区間であり、黒丸は信号トレンドの勾配がマイナス(−)の区間を示す。図15の横軸に、プラス区間とマイナス区間とを示している。   FIG. 15 is a graph showing a trend of signal values obtained by the control unit 10 of the prediction device 1. The graph shown in FIG. 15 is displayed so as to overlap the shipment number graph of FIG. In FIG. 15, the signal trend is indicated by black circles and white circles. A white circle indicates a section where the slope of the signal trend is plus (+), and a black circle indicates a section where the slope of the signal trend is minus (−). The abscissa in FIG. 15 shows a plus section and a minus section.

制御部10は、図15に示したような信号トレンドに基づき、予測対象期間に対応する項目のデータ、即ち2010年1月〜12月の12ヶ月間よりも所定期間(12ヶ月)前の2009年1月〜12月の内の直近における信号トレンドの勾配を判定する(S43)。制御部10は、S43の処理によって、勾配はプラスと判定する。   Based on the signal trend as shown in FIG. 15, the control unit 10 sets the data corresponding to the prediction target period, that is, 2009 before a predetermined period (12 months) from 12 months from January to December 2010. The slope of the signal trend in the latest period from January to December is determined (S43). The control unit 10 determines that the gradient is positive by the process of S43.

制御部10は、全期間又は所定の期間(10年など)から、信号トレンドの勾配がプラスの区間を特定する(S44)。図16は、予測装置1の制御部10により選択された期間、並びに、当該区間におけるMDを示すグラフである。図16は横軸に時間の経過を示し、縦軸にMDの値を示している。なお横軸の範囲は、図15と一部異なっている。制御部10は、特定した信号トレンドがプラスの区間における項目データを選択し(S44)、MDを算出する(S45)。算出されたMDは、図16の丸にて示されている。また、制御部10は、MDのトレンドを算出する(S46)。算出されたMDトレンドは、図16中の太線により示されている。   The control unit 10 identifies a section in which the slope of the signal trend is positive from the entire period or a predetermined period (such as 10 years) (S44). FIG. 16 is a graph showing the period selected by the control unit 10 of the prediction apparatus 1 and the MD in the section. In FIG. 16, the horizontal axis indicates the passage of time, and the vertical axis indicates the MD value. The range of the horizontal axis is partly different from FIG. The control unit 10 selects item data in a section in which the identified signal trend is positive (S44), and calculates MD (S45). The calculated MD is indicated by a circle in FIG. Further, the control unit 10 calculates the MD trend (S46). The calculated MD trend is indicated by a thick line in FIG.

図16に示すように、信号トレンドがプラスの区間は、3つの不連続な区間からなっている。制御部10は、3つの区間の内、直近の区間(2009年7月〜12月)をまず選択する(S47)。制御部10は、当該区間について算出されたMDトレンドを参照し、MDトレンドは所定値(1.0)より大きいと判断し(S48:YES)、当該区間を除外する。次に制御部10は、3つの区間の内、次に近い区間(2002年9月〜2007年2月)を選択する(S47)。当該区間について算出されたMDトレンドは、部分的に1.0よりも大きいものの、多くは1.0以下であるから(S48:NO)、当該区間の内、予測対象期間分の12か月分(2006年3月〜2007年2月)が信号期間として選択される(S49)。   As shown in FIG. 16, the section with a positive signal trend is composed of three discontinuous sections. The control unit 10 first selects the latest section (July to December 2009) among the three sections (S47). The control unit 10 refers to the MD trend calculated for the section, determines that the MD trend is greater than the predetermined value (1.0) (S48: YES), and excludes the section. Next, the control unit 10 selects the next closest section (September 2002 to February 2007) among the three sections (S47). Although the MD trend calculated for the section is partially larger than 1.0, most of the MD trend is 1.0 or less (S48: NO). (March 2006 to February 2007) is selected as the signal period (S49).

制御部10は、選択された信号期間(2006年3月〜2007年2月)における信号値及び項目毎のデータに基づき、両側T法を用いて項目毎の総合推定値のSN比を求め、SN比が最大となる項目数を選択する処理を行なう(S105〜S111)。そして、制御部10は、選択した項目数の項目を選択し(S112)、対応期間(2009年1月〜12月)における選択された項目のデータに基づき、予測値を算出する(S113)。   Based on the signal value and the data for each item in the selected signal period (March 2006 to February 2007), the control unit 10 obtains the SN ratio of the comprehensive estimated value for each item using the two-sided T method, Processing for selecting the number of items with the maximum S / N ratio is performed (S105 to S111). And the control part 10 selects the item of the number of selected items (S112), and calculates a predicted value based on the data of the selected item in a corresponding period (January to December, 2009) (S113).

図17は、本実施例における予測装置1の制御部10による予測結果を示すグラフである。図17の横軸は、時間の経過を示し、縦軸は出荷台数を示す。2005年1月〜2010年1月までの黒丸で示す値は、実際の値(規準化後)であり、図14に示したものと同一である。図17中の実線による波形は、信号トレンドを示す。図14中の矢印に示す区間が、選択された期間2006年3月〜2007年2月である。そして、図14中の2010年1月〜2010年12月の間の太線に示す値が、選択された期間におけるデータに基づき制御部10によって予測された値である。これに対し、白抜きの四角で示す値は、2010年1月〜2010年12月の実際の値(規準化後)である。図17に示すように、各予測値は、月毎に見れば、実際の値とは異なるものの、12ヶ月分の予測値として十分な精度で予測ができていることが分かる。   FIG. 17 is a graph showing a prediction result by the control unit 10 of the prediction device 1 in the present embodiment. The horizontal axis in FIG. 17 indicates the passage of time, and the vertical axis indicates the number of shipments. Values indicated by black circles from January 2005 to January 2010 are actual values (after normalization) and are the same as those shown in FIG. A waveform with a solid line in FIG. 17 indicates a signal trend. The section shown by the arrow in FIG. 14 is the selected period from March 2006 to February 2007. And the value shown in the thick line between January 2010 and December 2010 in FIG. 14 is a value predicted by the control unit 10 based on the data in the selected period. On the other hand, the values indicated by white squares are actual values (after normalization) from January 2010 to December 2010. As shown in FIG. 17, it can be seen that each predicted value can be predicted with sufficient accuracy as a predicted value for 12 months, although it differs from the actual value when viewed monthly.

比較として、図12のフローチャートに示したように信号トレンド及びMDトレンドに基づき、対象信号期間を選択せずに、直近から2年間又は1年間とした場合の予測精度について示す。図18は、信号期間を直近2年間とした場合の予測値、図19は、信号期間を直近1年間とした場合の予測値を示すグラフである。図18では、矢印で示すように、2008年1月〜2009年12月を信号期間とし、図19では、同様に2009年1月〜2009年12月を信号期間としている。図18及び図19では、予測値を白抜きの菱形にて示している。図17と、図18及び図19とを比較すると、本実施例における予測装置1による予測値が最も精度が高いことが分かる。   For comparison, based on the signal trend and the MD trend as shown in the flowchart of FIG. 12, the prediction accuracy when the target signal period is selected for the last two years or one year is shown. FIG. 18 is a graph showing a predicted value when the signal period is the latest two years, and FIG. 19 is a graph showing a predicted value when the signal period is the latest one year. In FIG. 18, as indicated by arrows, the period from January 2008 to December 2009 is the signal period, and in FIG. 19, the period from January 2009 to December 2009 is also the signal period. In FIG. 18 and FIG. 19, the predicted value is indicated by a white diamond. Comparing FIG. 17 with FIG. 18 and FIG. 19, it can be seen that the predicted value by the prediction device 1 in the present example has the highest accuracy.

図20は、信号期間の選択方法の違いによる総合推定値のSN比の比較を示すグラフである。図20は、横軸に選択する信号期間の長さ、縦軸に総合推定値のSN比を示す。図20中、黒丸にて、本実施例の予測装置1によって信号期間を選択した場合の総合推定値のSN比を示し、黒四角にて、直近の期間を用いた場合の総合推定値のSN比を示す。図20に示すように、信号期間を選択した12ヶ月間に基づき予測した場合が最も総合推定値のSN比が高く、総合推定式の精度が向上している。   FIG. 20 is a graph showing a comparison of the S / N ratio of the comprehensive estimated value due to the difference in the signal period selection method. FIG. 20 shows the length of the signal period to be selected on the horizontal axis, and the SN ratio of the comprehensive estimated value on the vertical axis. In FIG. 20, the black circle indicates the SN ratio of the total estimated value when the signal period is selected by the prediction apparatus 1 of the present embodiment, and the black square indicates the SN of the total estimated value when the latest period is used. Indicates the ratio. As shown in FIG. 20, when the signal period is predicted based on 12 months, the SN ratio of the total estimated value is the highest, and the accuracy of the comprehensive estimation formula is improved.

このように、信号トレンドを考慮した方法を適用することにより、予測装置1は高精度な出荷台数予測を実現することが可能である。   In this way, by applying a method that takes into account the signal trend, the prediction device 1 can realize highly accurate shipment number prediction.

なお、上述のように開示された本実施の形態はすべての点で例示であって、制限的なものではないと考えられるべきである。本発明の範囲は、上記した意味ではなく、特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。   It should be understood that the embodiment disclosed above is illustrative in all respects and not restrictive. The scope of the present invention is defined by the terms of the claims, rather than the meanings described above, and is intended to include any modifications within the scope and meaning equivalent to the terms of the claims.

1 予測装置
10 制御部(演算手段)
11 記録部(記録手段)
13 入力部
14 出力部
110 データベース
2 予測プログラム(コンピュータプログラム)
DESCRIPTION OF SYMBOLS 1 Prediction apparatus 10 Control part (calculation means)
11 Recording section (recording means)
13 Input unit 14 Output unit 110 Database 2 Prediction program (computer program)

Claims (6)

複数の要因が関連する事象に係る値、及び、該値に関連する前記複数の要因を複数の項目毎のデータとして前記値に対応付けて時系列に記録する記録手段と、該記録手段から前記値及び該値に対応する前記複数の項目毎のデータを読み出して演算を行なう演算手段とを備え、該演算手段が、前記複数の項目の前記値の変化に対する相関の強さを示す要因効果値に基づき、前記複数の項目から複数の項目を選択し、選択した項目のデータに基づき、予測対象期間における前記事象に係る値を予測する予測装置において、
前記演算手段は、
前記記録手段に記録されている値の記録期間中における経時変化傾向を特定する特定手段と、
予測対象期間よりも所定期間前の対応期間における前記値の経時変化傾向に類似する直近の期間を、前記記録期間から選択する期間選択手段と、
該期間選択手段が選択した選択期間における前記複数の項目毎のデータ、及び、該選択期間よりも所定期間後の値により求められる前記要因効果値に基づき、複数の項目を選択する項目選択手段と、
前記対応期間における前記項目選択手段が選択した項目のデータから前記予測対象期間における予測値を算出する予測手段と
を備えることを特徴とする予測装置。
A value relating to an event related to a plurality of factors, and a recording means for recording the plurality of factors related to the value in association with the value as data for a plurality of items in time series, from the recording means to the A factor and an effect value indicating a strength of correlation with respect to a change in the value of the plurality of items, the calculation unit including a value and data for each of the plurality of items corresponding to the value. In the prediction device that selects a plurality of items from the plurality of items, and predicts the value related to the event in the prediction target period based on the data of the selected items.
The computing means is
A specifying means for specifying a tendency to change over time during a recording period of the value recorded in the recording means;
A period selection means for selecting the most recent period similar to the temporal change tendency of the value in the corresponding period before the prediction target period from the recording period;
Item selection means for selecting a plurality of items based on the data for each of the plurality of items in the selection period selected by the period selection means and the factor effect value obtained by a value after a predetermined period from the selection period; ,
A prediction device comprising: prediction means for calculating a prediction value in the prediction target period from data of items selected by the item selection means in the corresponding period.
前記期間選択手段は、
前記対応期間における値の経時変化の勾配を判別する判別手段と、
該判別手段が判別した勾配で値が変化する第1期間を、前記記録期間から選定する手段と、
前記対応期間における複数の項目毎のデータと、第1期間における複数の項目毎のデータとの類似性を表わす数値を算出する第1算出手段と、
第1算出手段が算出した数値の変化傾向を表わす数値を算出する第2算出手段と、
第2算出手段が算出した前記数値と閾値との比較に基づき、前記第1期間中の直近の類似性が高い第2期間を選択する選択手段と
を備えることを特徴とする請求項1に記載の予測装置。
The period selection means includes
A discriminating means for discriminating a gradient of change over time of the value in the corresponding period;
Means for selecting, from the recording period, a first period whose value changes with the gradient determined by the determining means;
First calculation means for calculating a numerical value representing the similarity between the data for each of the plurality of items in the corresponding period and the data for each of the plurality of items in the first period;
Second calculating means for calculating a numerical value representing a change tendency of the numerical value calculated by the first calculating means;
The selection means which selects the 2nd period with the most recent similarity in the 1st period based on the comparison with the numerical value and the threshold which the 2nd calculation means computed. Prediction device.
第1算出手段は、マハラノビスの汎距離を算出するようにしてあり、
第2算出手段は、第1算出手段が算出したマハラノビスの汎距離のトレンドをトレンドモデルに基づき算出するようにしてあり、
前記選択手段は、第2算出手段が算出したトレンドが所定値以下である期間を第2期間として選択するようにしてあること
を特徴とする請求項2に記載の予測装置。
The first calculating means calculates the Mahalanobis general distance,
The second calculation means calculates the Mahalanobis pan-distance trend calculated by the first calculation means based on the trend model,
The prediction device according to claim 2, wherein the selection unit selects a period in which the trend calculated by the second calculation unit is equal to or less than a predetermined value as the second period.
前記選択手段は、前記第2期間の長さを変えて選択するようにしてあり、
長さ毎に、該第2期間における項目毎のデータの所定時間後の値に対する予測精度に係る値が最大になる長さを決定する決定手段を更に備え、
前記期間選択手段は、前記決定手段が決定した長さの第2期間を選択するようにしてあること
を特徴とする請求項2又は3に記載の予測装置。
The selection means is adapted to select by changing the length of the second period,
For each length, further comprising a determining means for determining a length that maximizes a value related to prediction accuracy with respect to a value after a predetermined time of data for each item in the second period;
The prediction apparatus according to claim 2, wherein the period selection unit is configured to select a second period having a length determined by the determination unit.
複数の要因が関連する事象に係る値、及び、該値に関連する前記複数の要因を複数の項目毎のデータとして前記値に対応付けて時系列に記録する記録手段と、該記録手段から前記値及び該値に対応する前記複数の項目毎のデータを読み出して演算を行なう演算手段とを備える装置にて、該演算手段が、前記複数の項目の前記値の変化に対する相関の強さを示す要因効果値に基づき、前記複数の項目から複数の項目を選択し、選択した項目のデータに基づき、予測対象期間における前記事象に係る値を予測する予測方法において、
前記演算手段は、
前記記録手段に記録されている値の記録期間中における経時変化傾向を特定し、
予測対象期間よりも所定期間前の対応期間における前記値の経時変化傾向に類似する直近の期間を、前記記録期間から選択し、
選択した選択期間における前記複数の項目毎のデータ、及び、該選択期間よりも所定期間後の値により求められる前記要因効果値に基づき、複数の項目を選択し、
前記対応期間における選択された複数の項目のデータから前記予測対象期間における予測値を算出する
ことを特徴とする予測方法。
A value relating to an event related to a plurality of factors, and a recording means for recording the plurality of factors related to the value in association with the value as data for a plurality of items in time series, from the recording means to the A calculation means that reads out data for each of the plurality of items corresponding to the value and performs calculation, and the calculation means indicates the strength of correlation with respect to the change in the value of the plurality of items. In the prediction method of selecting a plurality of items from the plurality of items based on the factor effect value, and predicting the value related to the event in the prediction target period based on the data of the selected item,
The computing means is
Identify the trend of change over time during the recording period of the value recorded in the recording means,
The most recent period similar to the time-dependent change trend of the value in the corresponding period before the prediction target period is selected from the recording period,
Based on the data for each of the plurality of items in the selected selection period, and the factor effect value obtained by a value after a predetermined period from the selection period, select a plurality of items,
A prediction method for calculating a predicted value in the prediction target period from data of a plurality of selected items in the corresponding period.
記録手段を備えるコンピュータに、前記記録手段に時系列に記録してある複数の要因が関連する事象に係る値、及び、該値に関連する前記複数の要因を複数の項目毎のデータを読み出し、前記複数の項目の前記値の変化に対する相関の強さを示す要因効果値に基づき、前記複数の項目から複数の項目を選択させ、選択された項目のデータに基づいて予測対象期間における前記事象に係る値を予測させるコンピュータプログラムにおいて、
前記コンピュータに、
前記記録手段に記録されている値の記録期間中における経時変化傾向を特定する特定手段、
予測対象期間よりも所定期間前の対応期間における前記値の経時変化傾向に類似する直近の期間を、前記記録期間から選択する期間選択手段、
選択した選択期間における前記複数の項目毎のデータ、及び、該選択期間よりも所定期間後の値により求められる前記要因効果値に基づき、複数の項目を選択する項目選択手段、及び、
前記対応期間における選択された複数の項目のデータから前記予測対象期間における予測値を算出する予測手段
の機能を実行させることを特徴とするコンピュータプログラム。
A computer having a recording unit, reading a value related to an event related to a plurality of factors recorded in time series in the recording unit, and reading data for each of the plurality of factors related to the value; Based on a factor effect value indicating the strength of correlation with respect to a change in the value of the plurality of items, the plurality of items are selected from the plurality of items, and the event in the prediction target period based on data of the selected items In a computer program for predicting a value related to
In the computer,
A specifying means for specifying a tendency to change over time during a recording period of a value recorded in the recording means;
A period selection means for selecting, from the recording period, the most recent period similar to the time-dependent change trend of the value in the corresponding period before the prediction target period;
Item selection means for selecting a plurality of items based on the data for each of the plurality of items in the selected selection period, and the factor effect value obtained by a value after a predetermined period from the selection period, and
A computer program for executing a function of a prediction means for calculating a predicted value in the prediction target period from data of a plurality of selected items in the corresponding period.
JP2012144416A 2012-06-27 2012-06-27 Prediction device, prediction method, and computer program Expired - Fee Related JP5416811B2 (en)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2012144416A JP5416811B2 (en) 2012-06-27 2012-06-27 Prediction device, prediction method, and computer program
EP13810593.7A EP2869249A1 (en) 2012-06-27 2013-06-25 Prediction device, prediction method, and computer programme
US14/411,357 US20150170169A1 (en) 2012-06-27 2013-06-25 Prediction device, prediction method, and computer readable medium
PCT/JP2013/067386 WO2014003001A1 (en) 2012-06-27 2013-06-25 Prediction device, prediction method, and computer programme

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012144416A JP5416811B2 (en) 2012-06-27 2012-06-27 Prediction device, prediction method, and computer program

Publications (2)

Publication Number Publication Date
JP2014010484A JP2014010484A (en) 2014-01-20
JP5416811B2 true JP5416811B2 (en) 2014-02-12

Family

ID=50107191

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012144416A Expired - Fee Related JP5416811B2 (en) 2012-06-27 2012-06-27 Prediction device, prediction method, and computer program

Country Status (1)

Country Link
JP (1) JP5416811B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5564604B1 (en) * 2013-06-14 2014-07-30 ヤンマー株式会社 Prediction device, prediction method, and computer program
JP5572738B1 (en) * 2013-06-14 2014-08-13 ヤンマー株式会社 Prediction device, prediction method, and computer program
US10510012B2 (en) * 2014-04-28 2019-12-17 Microsoft Technology Licensing Llc Real time interactive prediction
JP5826891B1 (en) * 2014-06-02 2015-12-02 ヤンマー株式会社 Prediction device, prediction method, and computer program
JP5826348B1 (en) * 2014-09-08 2015-12-02 ヤンマー株式会社 Prediction device, prediction method, and computer program

Also Published As

Publication number Publication date
JP2014010484A (en) 2014-01-20

Similar Documents

Publication Publication Date Title
JP5416809B2 (en) Prediction device, prediction method, and computer program
US20220222691A1 (en) Trust Rating Metric for Future Event Prediction of an Outcome
Chen et al. Inventory and shelf-space optimization for fresh produce with expiration date under freshness-and-stock-dependent demand rate
JP5068382B1 (en) Prediction device, prediction method, and prediction program
JP5416811B2 (en) Prediction device, prediction method, and computer program
Chanda et al. Optimisation of fuzzy EOQ model for advertising and price sensitive demand model under dynamic ceiling on potential adoption
JP5416810B2 (en) Prediction device, prediction method, and computer program
Aastveit et al. Quantifying time-varying forecast uncertainty and risk for the real price of oil
Keil Explaining the concentration-profitability paradox
WO2014003001A1 (en) Prediction device, prediction method, and computer programme
Białowolski Concepts of confidence in tendency survey research: An assessment with multi-group confirmatory factor analysis
JP5572738B1 (en) Prediction device, prediction method, and computer program
JP5564604B1 (en) Prediction device, prediction method, and computer program
Turner Casting doubt on the predictability of stock returns in real time: Bayesian model averaging using realistic priors
Tule et al. A composite index of leading indicators of unemployment in Nigeria
JP5680144B2 (en) Prediction device, prediction method, and computer program
JPWO2006095746A1 (en) Company evaluation support device
Chouard et al. Assessing the losses in euro area potential productivity due to the financial crisis
WO2014200086A1 (en) Prediction device, prediction method, and computer program
JP5826348B1 (en) Prediction device, prediction method, and computer program
JP5826891B1 (en) Prediction device, prediction method, and computer program
Oghlanian MARKET RESEARCH AND ECONOMIC ANALYSIS, EXPLORING THE DEMAND ESTIMATION.
et Stéphane A Large Canadian Database for Macroeconomic Analysis
Yano et al. What caused the ‘marginal-products-of-labour wage gap’in state-owned enterprises in China during the early-reform era? A reconsideration based on a case study in Henan
Ewing et al. Further evidence on the dynamic link between capacity utilization and inflation

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131112

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131115

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees