JP2010086398A - Device for analysis of time-series data - Google Patents

Device for analysis of time-series data Download PDF

Info

Publication number
JP2010086398A
JP2010086398A JP2008256418A JP2008256418A JP2010086398A JP 2010086398 A JP2010086398 A JP 2010086398A JP 2008256418 A JP2008256418 A JP 2008256418A JP 2008256418 A JP2008256418 A JP 2008256418A JP 2010086398 A JP2010086398 A JP 2010086398A
Authority
JP
Japan
Prior art keywords
data
segment
analysis
series data
time series
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008256418A
Other languages
Japanese (ja)
Other versions
JP4711355B2 (en
Inventor
Yukio Tanaka
幸雄 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SUWA TRUST KK
Original Assignee
SUWA TRUST KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SUWA TRUST KK filed Critical SUWA TRUST KK
Priority to JP2008256418A priority Critical patent/JP4711355B2/en
Publication of JP2010086398A publication Critical patent/JP2010086398A/en
Application granted granted Critical
Publication of JP4711355B2 publication Critical patent/JP4711355B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Complex Calculations (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To obtain consistent and detailed information both in a time domain and a frequency domain about a structure which time series contains with respect to arbitrary finite length data (real data) measured in a discrete manner by using only the arbitrary finite length data without using additional information. <P>SOLUTION: The analyzing device combines time series data by the maximum entropy method and a nonlinear least square method to calculate a parameter and a residual of a generalized trigonometric polynomial, and also composites power spectral density obtained from the parameter with power spectral density of the residual to calculate a reconstruction spectrum of the time series data. The analyzing device divides the time series data into segments so as not to exceed the number of preset maximum data, and also divides segment data of a nonuniform data structure into multiple uniform segment data to define each of the divided uniform segments as a basic segment. Then the analyzing device sets a storage area for a storing means and performs analysis processing, to those segments. <P>COPYRIGHT: (C)2010,JPO&INPIT

Description

本発明は時系列データの解析装置に関するものである。   The present invention relates to an apparatus for analyzing time series data.

本発明者は、先に、時系列データを高精度に解析可能な解析装置として、例えば特許文献1、特許文献2に示されるように、最大エントロピー法(MEM)を利用した時系列データの解析手法及びその解析手法を適用したコンピュータプログラムを実行する解析装置を提案している。尚、最大エントロピー法を利用した時系列データの解析手法は、例えば非特許文献1、非特許文献2にも記載されている。   The inventor previously analyzed time-series data using a maximum entropy method (MEM) as shown in Patent Document 1 and Patent Document 2, for example, as an analysis apparatus capable of analyzing time-series data with high accuracy. The analysis apparatus which executes the computer program which applied the method and its analysis method is proposed. Note that a method for analyzing time series data using the maximum entropy method is also described in Non-Patent Document 1 and Non-Patent Document 2, for example.

上述した解析手法は、解析対象の時系列データを一般化三角多項式により表現して解析を行うもので、概ね、時系列データに対して最大エントロピー法を適用して、高精度なパワースペクトル密度(PSD)を求め、その顕著なピークから、一般化三角多項式を解く初期値としての、項数と、各三角項の周期値を求める過程と、これらの初期値により、線形化された非線形最小自乗法を用いて、各三角項のパラメータを求めると共に、残差時系列データを求め、これらを加算して時系列データを再構成する過程とから構成されている。   The analysis method described above is to analyze the time series data to be analyzed by expressing it with a generalized trigonometric polynomial. Generally, the maximum entropy method is applied to the time series data, and the power spectral density ( PSD), and the number of terms as the initial value for solving the generalized trigonometric polynomial and the periodic value of each triangular term from the prominent peak, and the nonlinear minimum self-linearized by these initial values. The method includes a process of obtaining parameters of each triangular term by using multiplication, obtaining residual time series data, and adding these to reconstruct time series data.

この解析手法及びそれを適用した解析装置では、何らの数値モデルも想定せず、時系列データのみを用いて高精度の解析を行え、しかもその解析は、通常のパーソナルコンピュータ程度の演算能力でも十分に実用的であるという特徴を有している。
特開平5−216195号公報 特開平6−149863号公報 三宅浩次監修 高橋延昭・神山昭男・大友詔雄編、「生物リズムの構造 −MemCalcによる生物時系列データの解析−」、第1版、富士書院、1992年1月15日、p.19-39 常磐野和男・大友詔雄・田中幸雄著、「最大エントロピー法による時系列解析 …MemCalcの理論と実際…」、第1版、北海道大学図書刊行会、2002年6月25日、p.79-99
This analysis method and the analysis device to which it is applied do not assume any numerical model and can perform high-precision analysis using only time-series data, and the analysis is sufficient even with the computational capability of a normal personal computer. It is characterized by being practical.
JP-A-5-216195 JP-A-6-149863 Supervised by Koji Miyake, Nobuaki Takahashi, Akio Kamiyama, and Yasuo Otomo, “Biological Rhythm Structure: Analysis of Biological Time Series Data Using MemCalc”, 1st Edition, Fuji Shoin, January 15, 1992, p.19- 39 Kazuo Joban, Ikuo Otomo, Yukio Tanaka, “Time Series Analysis by Maximum Entropy Method… Theory and Practice of MemCalc…”, 1st Edition, Hokkaido University Library Publications, June 25, 2002, p.79- 99

ところで上述した解析装置で解析を行う場合には、演算速度、演算精度、記憶容量等の点でコンピュータの能力に限界があるため、長大な時系列データを一括して処理するのが困難であり、この場合には、長大な時系列データを分割して処理する必要がある。一方、時系列データには、観測期間内のデータ全体に渡ってデータ構造が均一に保たれるものの他、観測期間内でデータ構造が時々刻々と変化するものがあり、後者の場合には、観測期間内のデータ全体を一括して処理するのは困難である。   By the way, when the analysis is performed by the above-described analysis device, it is difficult to process a large amount of time-series data in a lump because the computer capacity is limited in terms of calculation speed, calculation accuracy, storage capacity, and the like. In this case, it is necessary to divide and process long time-series data. On the other hand, time-series data includes data whose data structure is kept uniform over the entire data in the observation period, as well as those whose data structure changes from moment to moment within the observation period. In the latter case, It is difficult to process all the data in the observation period at once.

本発明は、以上の点に鑑みて創案されたもので、即ち、解析対象の時系列データを、そのデータ点数やデータ構造に応じて適切にセグメント化して処理を行うことにより、解析する時系列データによらず、常に適切に高精度な解析を行えるようにすることを目的とするものである。   The present invention was devised in view of the above points, that is, time series data to be analyzed is analyzed by appropriately segmenting and processing the time series data to be analyzed according to the number of data points and the data structure. The purpose is to enable appropriate and accurate analysis at all times regardless of the data.

尚、本発明が対象とする時系列データとは、実在の時系列データ、即ち、ある限られた期間に観測されたある点数の有限長離散時系列のデータであり、理論上の存在である無限長のデータや連続データは対象としない。また本発明が対象とする時系列データは、上述したような通常の時系列データの他、例えば地層断面の距離に対する輝度変化等の、空間的に連続するデータも対象とするものである。   The time-series data targeted by the present invention is real time-series data, that is, data of a finite-length discrete time series with a certain number of points observed in a certain limited period, and is theoretically present. Infinite length data and continuous data are not included. The time-series data targeted by the present invention is not limited to normal time-series data as described above, but also includes data that is spatially continuous, such as a change in luminance with respect to the distance of the formation cross section.

上述した課題を解決するために、本発明では、解析対象の時系列データを解析するシーケンスを決定する解析シーケンス決定手段と、解析シーケンスに従い、最大エントロピー法及び非線形最小自乗法によりデータを解析して一般化三角多項式のパラメータと残差を求めるデータ解析手段と、データ解析手段により求めた解析結果を評価し、条件に適合する場合に記憶手段に記憶する解析結果評価手段と、上記パラメータから得られるパワースペクトル密度と最大エントロピー法を用いて求める残差のパワースペクトル密度を合成して時系列データの再構成スペクトルを求める再構成スペクトル計算手段と、この計算手段を利用して、上記記憶手段から取り出した上記パラメータと残差により、解析対象の時系列データに対応する一般化三角多項式を構成する解析結果構成手段とを備え、解析シーケンス決定手段は、解析対象の時系列データを、予め設定された最大データ点数を越えないようにセグメントに分割する分割処理過程と、各セグメントに対してデータ構造の均一性を評価する評価処理過程と、この評価に基づき、不均一のセグメントデータを均一の複数のセグメントに分割する分割処理過程と、分割された均一のセグメントの夫々を基本セグメントとして、それらに対して、記憶手段に記憶領域を設定する記憶領域設定処理過程を備えている時系列データの解析装置を提案する。   In order to solve the above-described problem, in the present invention, analysis sequence determination means for determining a sequence for analyzing time-series data to be analyzed, and analysis of data by a maximum entropy method and a nonlinear least square method according to the analysis sequence. Data analysis means for obtaining parameters and residuals of generalized trigonometric polynomials, analysis result evaluation means for evaluating the analysis results obtained by the data analysis means and storing them in the storage means when the conditions are met, and obtained from the above parameters A reconstructed spectrum calculating means for obtaining a reconstructed spectrum of time series data by synthesizing the power spectrum density and the residual power spectrum density obtained using the maximum entropy method, and taking out from the storage means using this calculating means Based on the above parameters and residuals, generalized triangles corresponding to the time series data to be analyzed An analysis result structuring unit that constitutes a term expression, and the analysis sequence determining unit divides the time series data to be analyzed into segments so as not to exceed a preset maximum number of data points, and each segment Based on the evaluation process for evaluating the uniformity of the data structure for the data, the division process for dividing the non-uniform segment data into a plurality of uniform segments, and the divided uniform segments. As a segment, we propose a time-series data analysis apparatus having a storage area setting process for setting a storage area in the storage means.

また本発明では、上記の解析装置において、セグメントが、解析対象の時系列データの全期間データに対応する、最上位レイヤーのセグメントから、順次2分割されて構成される、下位のレイヤーの夫々に含まれる2の累乗のセグメントと、最下位のレイヤーにおいて、データ構造が変化するセグメントを、データ構造の変化している個所において分割して順次形成されるサブレイヤーの各セグメントとから構成される時系列データの解析装置を提案する。   Further, in the present invention, in the above analysis device, each segment is divided into two sequentially from the segment of the highest layer corresponding to the whole period data of the time series data to be analyzed, and each of the lower layers is configured. When it is composed of a power-of-two segment included and segments of sub-layers that are sequentially formed by dividing a segment whose data structure changes in the lowest layer at a location where the data structure changes A data analysis device is proposed.

また本発明では、上記の解析装置において、データ構造の均一性は、下式による最大ラグ値までの最大エントロピー法のスペクトル密度の計算におけるバーグの係数Pmの、ラグ値に対する推移により評価する時系列データの解析装置を提案する。

Figure 2010086398
但し、Bm(f)はラグ値mにおけるスペクトル密度、Δtはサンプリング間隔、Pmとγm(k)はバーグの係数である。 In the present invention, in the above analysis apparatus, the uniformity of the data structure is a time series evaluated by the transition of the Burg coefficient Pm with respect to the lag value in the calculation of the spectral density of the maximum entropy method up to the maximum lag value by the following equation. A data analysis device is proposed.
Figure 2010086398
Where Bm (f) is the spectral density at the lag value m, Δt is the sampling interval, and Pm and γm (k) are Burg's coefficients.

また本発明では、上記の解析装置において、解析シーケンス決定手段には、不等間隔の時系列データを等間隔化処理する等間隔化処理過程を設けることを提案する。   Further, in the present invention, in the above analysis apparatus, it is proposed that the analysis sequence determination means is provided with an equal interval processing step for equal interval processing of unequal interval time series data.

また本発明では、上記の解析装置において、データ解析手段は、解析対象の時系列データから取り出したセグメントデータに対して、下式による最大ラグ値までの最大エントロピー法のスペクトル密度の計算におけるバーグの係数Pmの、ラグ値に対する推移を求める計算過程と、求めた推移から最大エントロピー法によるパワースペクトル密度の計算に用いるラグ値を決定するラグ値決定過程と、決定されたラグ値により上記パワースペクトル密度を求めるパワースペクトル密度計算過程と、求められたパワースペクトル密度から主要ピークの周波数と、そのパワーを抽出する抽出過程と、抽出された周波数とパワーとから非線形最小自乗法により当てはめ曲線のパラメータを求めるパラメータ導出過程と、求められた当てはめ曲線とセグメントデータとを比較して一致度を評価し、所定の一致度以上の場合には上記当てはめ曲線のパラメータをセグメントに対応する記憶手段に記憶して次の過程に移行し、所定の一致度に達しない場合には上記当てはめ曲線のパラメータを破棄して上記ラグ値を決定する過程に移行する評価過程とを備えている時系列データの解析装置を提案する。

Figure 2010086398
但し、Bm(f)はラグ値mにおけるスペクトル密度、Δtはサンプリング間隔、Pmとγm(k)はバーグの係数である。 Further, in the present invention, in the above analysis apparatus, the data analysis means, for the segment data extracted from the time-series data to be analyzed, determines the Burg's value in the calculation of the spectral density of the maximum entropy method up to the maximum lag value by the following equation. The calculation process for determining the transition of the coefficient Pm with respect to the lag value, the lag value determining process for determining the lag value used for calculating the power spectral density by the maximum entropy method from the determined transition, and the power spectral density based on the determined lag value Calculate the parameters of the fitting curve by the nonlinear least square method from the power spectral density calculation process to find the frequency of the main peak from the obtained power spectral density, the extraction process to extract the power, and the extracted frequency and power The parameter derivation process and the obtained fitting curve and segment The degree of coincidence is evaluated by comparing with the data, and if the degree of coincidence is equal to or higher than the predetermined coincidence, the parameters of the fitting curve are stored in the storage means corresponding to the segment, and the process proceeds to the next process, and the predetermined coincidence is reached. If not, an apparatus for analyzing time series data is provided that includes an evaluation process that discards the parameters of the fitting curve and shifts to a process of determining the lag value.
Figure 2010086398
Where Bm (f) is the spectral density at the lag value m, Δt is the sampling interval, and Pm and γm (k) are Burg's coefficients.

また本発明では、上記の解析装置において、データ解析手段におけるセグメントデータの解析は、最上位のレイヤーから最下位のレイヤーに向かって順次行うものとし、この際、上位のレイヤーのセグメントのセグメントデータは、セグメント当たりのデータ点数が予め設定された最大データ点数を越えないように、解析対象の時系列データのデータ点数をバンチング処理により低減してセグメントデータを構成する処理を行う構成とすると共に、各レイヤーの各セグメントに対応して一時記憶領域を構成し、上位側のセグメントに対して求められた多項式パラメータを下位の各レイヤーの各セグメントの一時記憶領域に記憶すると共に、上記多項式パラメータから構成される当てはめ曲線と、原時系列データの対応部分との差演算により求められる残差時系列データを次の下位レイヤーのセグメントデータとして設定する処理を行う時系列データの解析装置を提案する。   In the present invention, in the above analysis device, the analysis of the segment data in the data analysis means is performed sequentially from the highest layer to the lowest layer. At this time, the segment data of the upper layer segment is In addition, in order to prevent the number of data points per segment from exceeding the preset maximum number of data points, the processing is performed to reduce the number of data points of the time series data to be analyzed by bunching processing and configure segment data, A temporary storage area is configured corresponding to each segment of the layer, and the polynomial parameter obtained for the upper segment is stored in the temporary storage area of each segment of each lower layer, and is configured from the above polynomial parameter. By calculating the difference between the fitting curve and the corresponding part of the original time series data. The residual time series data that is to propose an analysis device of the time-series data to perform processing to set as the segment data of the next lower layer.

また本発明では、上記の解析装置において、解析結果評価手段は、セグメントデータに対してデータ解析手段により求められた当てはめ曲線と解析対象の時系列データの対応範囲を比較して残差曲線を求めてその解析を行う残差解析過程と、残差解析過程により解析された残差曲線と時系列データとを比較して一致度を評価し、所定の一致度以上の場合には当てはめ曲線のパラメータと残差を所定の記憶手段に記憶して次の過程に移行し、所定の一致度に達しない場合にはデータを破棄して、セグメントデータを次のレイヤーのセグメントに移行する評価過程とを備えている時系列データの解析装置を提案する。   In the present invention, in the above analysis apparatus, the analysis result evaluation means obtains a residual curve by comparing the corresponding range of the fitting curve obtained by the data analysis means with respect to the segment data and the time series data to be analyzed. The degree of agreement is evaluated by comparing the residual analysis process that performs the analysis with the residual curve analyzed by the residual analysis process and the time series data. And the residual is stored in a predetermined storage means, and the process proceeds to the next process.If the predetermined degree of coincidence is not reached, the data is discarded, and the evaluation process is performed to transfer the segment data to the next layer segment. We propose a time-series data analysis device.

また本発明では、上記の解析装置において、解析結果構成手段は、全ての記憶領域に記憶されている基本セグメントのパラメータと残差とから全データ領域を一括して再構成スペクトルを求めて記憶する一括解析結果構成手段と、各記憶領域に記憶されている基本セグメントのパラメータと残差とから、基本セグメント毎に再構成スペクトルを求めて記憶するセグメント解析結果構成手段とから構成すると共に、基本セグメント毎に頂位位相の周波数依存性を解析するための頂位位相推移計算手段を構成し、この頂位位相推移計算手段により計算した各基本セグメント毎の頂位位相の周波数依存をセグメント解析結果構成手段による再構成スペクトルと共に、基本セグメントの代表時刻の属性として記憶する時系列データの解析装置を提案する。   Also, in the present invention, in the above analysis apparatus, the analysis result configuration means obtains and stores a reconstructed spectrum for all data areas collectively from the parameters and residuals of the basic segments stored in all the storage areas. The basic analysis segment is composed of a batch analysis result configuration unit and a segment analysis result configuration unit that obtains and stores a reconstruction spectrum for each basic segment from the parameters and residuals of the basic segment stored in each storage area. Configure the top phase transition calculation means to analyze the frequency dependence of the top phase every time, and configure the segment analysis result for the frequency dependence of the top phase for each basic segment calculated by this top phase transition calculation means We propose a time series data analysis device that stores as a representative time attribute of the basic segment along with the reconstructed spectrum by means. .

また本発明では、上記の解析装置において、再構成スペクトル計算手段は、得られたパラメータからパワースペクトル密度を求める計算において、一般化三角多項式の夫々の項の夫々につき、δ函数の原型を用いて全周波数帯に裾の広がる夫々一つのスペクトルピークを構成することにより、パラメータから得られる各周波数に対応する孤立ピーク群を構成し、その重畳として時系列データの再構成スペクトルを求める構成とする時系列データの解析装置を提案する。δ函数の原型としては、例えば余弦函数に微弱な雑音を加えた時系列をラグ2にて最大エントロピー法のスペクトル密度の計算を行って得られたスペクトルを利用することができる。   Further, in the present invention, in the above analysis device, the reconstructed spectrum calculating means uses the prototype of the δ function for each of the terms of the generalized triangular polynomial in the calculation for obtaining the power spectral density from the obtained parameters. By configuring a single spectrum peak that spreads in the entire frequency band to form a group of isolated peaks corresponding to each frequency obtained from parameters, and obtaining a reconstructed spectrum of time series data as its superposition A data analysis device is proposed. As the prototype of the δ function, for example, a spectrum obtained by calculating the spectral density of the maximum entropy method using lag 2 for a time series obtained by adding weak noise to the cosine function can be used.

また本発明では、解析対象の時系列データを解析するシーケンスを決定する解析シーケンス決定手順と、解析シーケンスに従い、最大エントロピー法及び非線形最小自乗法によりデータを解析して一般化三角多項式のパラメータと残差を求めるデータ解析手順と、データ解析手順により求めた解析結果を評価し、条件に適合する場合に記憶手段に記憶する解析結果評価手順と、上記パラメータから得られるパワースペクトル密度と最大エントロピー法を用いて求める残差のパワースペクトル密度を合成して時系列データの再構成スペクトルを求める再構成スペクトル計算手順と、この計算手順を利用して、上記記憶手段から取り出した上記パラメータと残差により、解析対象の時系列データに対応する一般化三角多項式を構成する解析結果構成手順とを備え、解析シーケンス決定手順は、解析対象の時系列データを、予め設定された最大データ点数を越えないようにセグメントに分割する分割処理手順と、各セグメントに対してデータ構造の均一性を評価する評価処理手順と、この評価に基づき、不均一のセグメントデータを均一の複数のセグメントに分割する分割処理手順と、分割された均一のセグメントの夫々を基本セグメントとして、それらに対して、記憶手段に記憶領域を設定する記憶領域設定処理手順からなる各手順をコンピュータに実行させるための時系列データの解析プログラムを記録したコンピュータ読み取り可能な記録媒体を提案する。   In the present invention, the analysis sequence determination procedure for determining the sequence for analyzing the time series data to be analyzed, and the analysis of the data by the maximum entropy method and the nonlinear least square method according to the analysis sequence, the parameters of the generalized triangular polynomial and the remaining A data analysis procedure for obtaining the difference, an analysis result obtained by the data analysis procedure, an analysis result evaluation procedure stored in the storage means when the conditions are met, a power spectral density obtained from the above parameters, and a maximum entropy method The reconstructed spectrum calculation procedure for obtaining the reconstructed spectrum of the time series data by synthesizing the power spectrum density of the residual obtained using, and using the calculation procedure and the parameter and the residual extracted from the storage means, Analysis result structure that constitutes a generalized trigonometric polynomial corresponding to the time series data to be analyzed The analysis sequence determination procedure includes a division processing procedure for dividing the time-series data to be analyzed into segments so as not to exceed the preset maximum number of data points, and the uniformity of the data structure for each segment Based on this evaluation, based on this evaluation, a division processing procedure for dividing non-uniform segment data into a plurality of uniform segments, and each of the divided uniform segments as basic segments, A computer-readable recording medium recording a time-series data analysis program for causing a computer to execute each procedure including a storage area setting processing procedure for setting a storage area in a storage means is proposed.

また本発明では、上記の記録媒体において、セグメントは、解析対象の時系列データの全期間データに対応する、最上位レイヤーのセグメントから、順次2分割されて構成される、下位のレイヤーの夫々に含まれる2の累乗のセグメントと、最下位のレイヤーにおいて、データ構造が変化するセグメントを、データ構造の変化している個所において分割して順次形成されるサブレイヤーの各セグメントとから構成されることを特徴とする請求項8に記載の時系列データの解析プログラムを記録したコンピュータ読み取り可能な記録媒体を提案する。   Further, according to the present invention, in the recording medium, the segment is divided into two in order from the segment of the highest layer corresponding to the whole period data of the time-series data to be analyzed. It is composed of the power-of-two segments included and the sub-layer segments that are sequentially formed by dividing the segment whose data structure changes in the lowest layer at the location where the data structure changes. The computer-readable recording medium which recorded the analysis program of the time series data of Claim 8 characterized by these is proposed.

また本発明では、上記の記録媒体において、データ構造の均一性は、下式による最大ラグ値までの最大エントロピー法のスペクトル密度の計算におけるバーグの係数Pmの、ラグ値に対する推移により評価する時系列データの解析プログラムを記録したコンピュータ読み取り可能な記録媒体を提案する。

Figure 2010086398
但し、Bm(f)はラグ値mにおけるスペクトル密度、Δtはサンプリング間隔、Pmとγm(k)はバーグの係数である。 Further, in the present invention, in the above recording medium, the uniformity of the data structure is a time series evaluated by the transition of the Burg coefficient Pm with respect to the lag value in the calculation of the spectral density of the maximum entropy method up to the maximum lag value by the following equation. A computer-readable recording medium recording a data analysis program is proposed.
Figure 2010086398
Where Bm (f) is the spectral density at the lag value m, Δt is the sampling interval, and Pm and γm (k) are Burg's coefficients.

また本発明では、上記の記録媒体において、解析シーケンス決定手順には、不等間隔の時系列データを等間隔化処理する等間隔化処理過程を設けることを提案する。   In the present invention, it is proposed that in the recording medium described above, the analysis sequence determination procedure is provided with an equal interval processing step for equal interval processing of unequal interval time series data.

また本発明では、上記の記録媒体において、データ解析手順は、解析対象の時系列データから取り出したセグメントデータに対して、下式による最大ラグ値までの最大エントロピー法のスペクトル密度の計算におけるバーグの係数Pmの、ラグ値に対する推移を求める計算過程と、求めた推移から最大エントロピー法によるパワースペクトル密度の計算に用いるラグ値を決定するラグ値決定過程と、決定されたラグ値により上記パワースペクトル密度を求めるパワースペクトル密度計算過程と、求められたパワースペクトル密度から主要ピークの周波数と、そのパワーを抽出する抽出過程と、抽出された周波数とパワーとから非線形最小自乗法により当てはめ曲線のパラメータを求めるパラメータ導出過程と、求められた当てはめ曲線とセグメントデータとを比較して一致度を評価し、所定の一致度以上の場合には上記当てはめ曲線のパラメータをセグメントに対応する記憶手段に記憶して次の過程に移行し、所定の一致度に達しない場合には上記当てはめ曲線のパラメータを破棄して上記ラグ値を決定する過程に移行する評価過程とから構成される時系列データの解析プログラムを記録したコンピュータ読み取り可能な記録媒体を提案する。

Figure 2010086398
但し、Bm(f)はラグ値mにおけるスペクトル密度、Δtはサンプリング間隔、Pmとγm(k)はバーグの係数である。 In the present invention, in the recording medium described above, the data analysis procedure is performed on the segment data extracted from the time-series data to be analyzed, in the calculation of the spectral density of the maximum entropy method up to the maximum lag value according to the following equation. The calculation process for determining the transition of the coefficient Pm with respect to the lag value, the lag value determining process for determining the lag value used for calculating the power spectral density by the maximum entropy method from the determined transition, and the power spectral density based on the determined lag value Calculate the parameters of the fitting curve by the nonlinear least square method from the power spectral density calculation process to find the frequency of the main peak from the obtained power spectral density, the extraction process to extract the power, and the extracted frequency and power The parameter derivation process and the obtained fitting curve and segment The degree of coincidence is evaluated by comparing with the data, and if the degree of coincidence is equal to or higher than the predetermined coincidence, the parameters of the fitting curve are stored in the storage means corresponding to the segment, and the process proceeds to the next process, and the predetermined coincidence is reached. If not, a computer-readable recording medium recording a time-series data analysis program composed of an evaluation process in which the parameters of the fitting curve are discarded and the lag value is determined is proposed.
Figure 2010086398
Where Bm (f) is the spectral density at the lag value m, Δt is the sampling interval, and Pm and γm (k) are Burg's coefficients.

また本発明では、上記の記録媒体において、データ解析手順におけるセグメントデータの解析は、最上位のレイヤーから最下位のレイヤーに向かって順次行うものとし、この際、上位のレイヤーのセグメントのセグメントデータは、セグメント当たりのデータ点数が予め設定された最大データ点数を越えないように、解析対象の時系列データのデータ点数をバンチング処理により低減してセグメントデータを構成する処理を行う構成とすると共に、各レイヤーの各セグメントに対応して一時記憶領域を構成し、上位側のセグメントに対して求められた多項式パラメータを下位の各レイヤーの各セグメントの一時記憶領域に記憶すると共に、上記多項式パラメータから構成される当てはめ曲線と、原時系列データの対応部分との差演算により求められる残差時系列データを次の下位レイヤーのセグメントデータとして設定する処理とから構成される時系列データの解析プログラムを記録したコンピュータ読み取り可能な記録媒体を提案する。   In the present invention, in the recording medium, the segment data analysis in the data analysis procedure is performed sequentially from the highest layer to the lowest layer. At this time, the segment data of the upper layer segment is In addition, in order to prevent the number of data points per segment from exceeding the preset maximum number of data points, the processing is performed to reduce the number of data points of the time series data to be analyzed by bunching processing and configure segment data, A temporary storage area is configured corresponding to each segment of the layer, and the polynomial parameter obtained for the upper segment is stored in the temporary storage area of each segment of each lower layer, and is configured from the above polynomial parameter. By calculating the difference between the fitting curve and the corresponding part of the original time series data. The residual time series data suggest the following computer-readable recording medium storing an analysis program of time-series data consisting of a process of setting a lower layer of the segment data to be.

また本発明では、上記の記録媒体において、解析結果評価手順は、セグメントデータに対してデータ解析手順により求められた当てはめ曲線と解析対象の時系列データの対応範囲を比較して残差曲線を求めてその解析を行う残差解析過程と、残差解析過程により解析された残差曲線と時系列データとを比較して一致度を評価し、所定の一致度以上の場合には当てはめ曲線のパラメータと残差を所定の記憶手段に記憶して次の過程に移行し、所定の一致度に達しない場合にはデータを破棄して、セグメントデータを次のレイヤーのセグメントに移行する評価過程とから構成される時系列データの解析プログラムを記録したコンピュータ読み取り可能な記録媒体を提案する。   In the present invention, in the above recording medium, the analysis result evaluation procedure obtains a residual curve by comparing the corresponding range of the time series data to be analyzed with the fitting curve obtained by the data analysis procedure for the segment data. The degree of agreement is evaluated by comparing the residual analysis process that performs the analysis with the residual curve analyzed by the residual analysis process and the time series data. The residual is stored in a predetermined storage means, and the process proceeds to the next process. If the predetermined degree of coincidence is not reached, the data is discarded and the segment data is transferred to the next layer segment. A computer-readable recording medium on which a time-series data analysis program is recorded is proposed.

また本発明では、上記の構成において、解析結果構成手順は、全ての記憶領域に記憶されている基本セグメントのパラメータと残差とから全データ領域を一括して再構成スペクトルを求めて記憶する一括解析結果構成手順と、各記憶領域に記憶されている基本セグメントのパラメータと残差とから、基本セグメント毎に再構成スペクトルを求めて記憶するセグメント解析結果構成手順とから構成すると共に、基本セグメント毎に頂位位相の周波数依存性を解析するための頂位位相推移計算手順を構成し、この頂位位相推移計算手順により計算した各基本セグメント毎の頂位位相の周波数依存をセグメント解析結果構成手順による再構成スペクトルと共に、基本セグメントの代表時刻の属性として記憶する手順とから構成される時系列データの解析プログラムを記録したコンピュータ読み取り可能な記録媒体を提案する。   Further, in the present invention, in the above configuration, the analysis result configuration procedure is a batch in which all the data areas are collectively obtained from the parameters and residuals of the basic segments stored in all the storage areas and a reconstructed spectrum is obtained and stored. The analysis result configuration procedure and the segment analysis result configuration procedure for obtaining and storing the reconstructed spectrum for each basic segment from the parameters and residuals of the basic segment stored in each storage area. The top phase shift calculation procedure for analyzing the frequency dependence of the top phase is configured, and the frequency dependence of the top phase for each basic segment calculated by this top phase shift calculation procedure is configured as a segment analysis result configuration procedure Together with the reconstructed spectrum according to, and the procedure to store as the attribute of the representative time of the basic segment The analysis program proposes a computer-readable recording medium having recorded.

また本発明では、上記の構成において、再構成スペクトル計算手順は、得られたパラメータからパワースペクトル密度を求める計算において、一般化三角多項式の夫々の項の夫々につき、δ函数の原型を用いて全周波数帯に裾の広がる夫々一つのスペクトルピークを構成することにより、パラメータから得られる各周波数に対応する孤立ピーク群を構成し、その重畳として時系列データの再構成スペクトルを求める手順とした時系列データの解析プログラムを記録したコンピュータ読み取り可能な記録媒体を提案する。δ函数の原型としては、例えば余弦函数に微弱な雑音を加えた時系列をラグ2にて最大エントロピー法のスペクトル密度の計算を行って得られたスペクトルを利用することができる。   In the present invention, in the above configuration, the reconstruction spectrum calculation procedure is performed by using the prototype of the δ function for each of the terms of the generalized trigonometric polynomial in the calculation for obtaining the power spectral density from the obtained parameters. By configuring each spectrum peak that spreads in the frequency band, a group of isolated peaks corresponding to each frequency obtained from the parameters is formed, and the time series used as a procedure to obtain the reconstructed spectrum of the time series data as its superposition A computer-readable recording medium recording a data analysis program is proposed. As the prototype of the δ function, for example, a spectrum obtained by calculating the spectral density of the maximum entropy method using lag 2 for a time series obtained by adding weak noise to the cosine function can be used.

請求項1、11の発明によれば、解析シーケンス決定手段又は手順により、解析対象の時系列データを、その全体のデータ点数に応じて分割して解析装置の演算能力に適合させると共に、データ構造が変化している部分においてセグメントに分割することにより、セグメント中にデータ構造が変化している部分を無くすことにより、これらの均一なセグメントにつき、データ解析手段又は手順により高精度に解析を行うことができる。   According to the inventions of claims 1 and 11, the time sequence data to be analyzed is divided according to the total number of data points by the analysis sequence determination means or procedure, and is adapted to the calculation capability of the analysis device, and the data structure By dividing the segment where the data is changing into segments and eliminating the part where the data structure is changing in the segment, these uniform segments can be analyzed with high precision using data analysis means or procedures. Can do.

請求項2、12の発明によれば、セグメントは、解析シーケンス決定手段又は手順により、解析対象の時系列データの全期間データに対応する、最上位レイヤーのセグメントから、順次2分割されて構成される、下位のレイヤーの夫々に含まれる2の累乗のセグメントと、最下位のレイヤーにおいて、データ構造が変化するセグメントを、データ構造の変化している個所において分割して順次形成されるサブレイヤーの各セグメントとから構成するため、解析装置の演算能力と時系列データのデータ構造の両方に対応して、合理的に時系列データのセグメント化を行うことができ、自動化も容易である。   According to the second and twelfth aspects of the present invention, the segment is configured by being sequentially divided into two from the segment of the highest layer corresponding to the whole period data of the time series data to be analyzed by the analysis sequence determining means or procedure. Sub-layers that are sequentially formed by dividing the segment of the power of 2 included in each of the lower layers and the segment whose data structure changes in the lowermost layer at the location where the data structure changes. Since each segment is composed of segments, the time series data can be rationally segmented in accordance with both the computing capability of the analysis apparatus and the data structure of the time series data, and automation is easy.

請求項3、13の発明によれば、データ構造の均一性を容易に評価することができる。   According to the third and thirteenth aspects, the uniformity of the data structure can be easily evaluated.

請求項4、14の発明によれば、原時系列データが不等間隔の場合にも、等間隔化することにより、最大エントロピー法のスペクトル密度の計算を行うことができる。一方、非線形最小自乗法により当てはめ曲線のパラメータを求めるパラメータの導出においては、必要に応じて、等間隔化した時系列データか、不等間隔の原時系列データをそのまま使用することができる。   According to the inventions of claims 4 and 14, even when the original time series data is unequal, the spectral density of the maximum entropy method can be calculated by equalization. On the other hand, in the derivation of the parameters for obtaining the parameters of the fitting curve by the non-linear least square method, it is possible to use time-series data with equal intervals or original time-series data with unequal intervals as necessary.

請求項5、15の発明によれば、データ解析手段又は手順において、求められた当てはめ曲線とセグメントデータとを比較して一致度を評価し、所定の一致度以上の場合には上記当てはめ曲線のパラメータをセグメントに対応する記憶手段に記憶して次の過程に移行し、所定の一致度に達しない場合には上記当てはめ曲線のパラメータを破棄して上記ラグ値を決定する過程に移行する評価過程とを備えており、パラメータの導出と、その評価を繰り返すことにより、より高精度の当てはめ曲線を求めることができる。   According to the inventions of claims 5 and 15, in the data analysis means or procedure, the degree of coincidence is evaluated by comparing the obtained fitting curve with the segment data. An evaluation process in which the parameter is stored in the storage means corresponding to the segment and the process proceeds to the next process, and when the predetermined degree of coincidence is not reached, the parameter of the fitting curve is discarded and the process proceeds to a process of determining the lag value. By repeating the derivation of parameters and the evaluation thereof, a more accurate fitting curve can be obtained.

請求項6、16の発明によれば、解析対象の時系列データの全体のデータ点数を一括して処理するのには、解析装置の演算能力が足りない場合であっても、バンチング処理によりデータ点数を低減することにより、最上位のレイヤーのセグメントデータ、即ち、解析対象の時系列データの全体の一括した解析が可能であり、従って時系列データの全体に渡る長周期の解析が可能であると共に、上位のレイヤーの解析により得られた当てはめ曲線と、原時系列データの対応部分との差演算により求められる残差時系列データを次の下位レイヤーのセグメントデータとして設定して、順次解析を行うので、最下位又はサブレイヤーのセグメントデータにより、バンチング処理によるデータ点数の低減がない、そのままの時系列データに対しての解析を行うことができる。   According to the sixth and sixteenth aspects of the present invention, it is possible to process all the data points of the time-series data to be analyzed at once by the bunching process even when the analysis device has insufficient computing power. By reducing the number of points, the segment data of the highest layer, that is, the entire time-series data to be analyzed can be collectively analyzed, and therefore the long-period analysis over the entire time-series data is possible. At the same time, set the residual time series data obtained by calculating the difference between the fitting curve obtained by the analysis of the upper layer and the corresponding part of the original time series data as the segment data of the next lower layer, and analyze sequentially. As a result, the solution for the time-series data as it is without the reduction in the number of data points due to the bunching process due to the segment data of the lowest or sublayer. It can be carried out.

請求項7、17の発明によれば、解析結果評価手段又は手順において、得られた当てはめ曲線が、解析対象の時系列データの対応範囲と、所定の一致度に達しない場合にはデータを破棄して、セグメントデータを次のレイヤーのセグメントに移行して、処理に供されるので、上位のレイヤーにおいて一致度の高い当てはめ曲線が求まらない場合でも、不都合が生じず、下位のレイヤーにおいての処理により、一致度の高い当てはめ曲線を得ることができる。   According to the inventions of claims 7 and 17, in the analysis result evaluation means or procedure, when the obtained fitting curve does not reach the corresponding range of the time series data to be analyzed and a predetermined coincidence, the data is discarded. Since the segment data is transferred to the next layer segment for processing, even if a fitting curve with a high degree of coincidence is not found in the upper layer, there is no inconvenience, and the lower layer By the process, a fitting curve with a high degree of coincidence can be obtained.

請求項8、18の発明によれば、解析結果構成手段又は手順により、解析対象の時系列データを、一括した解析結果と、各セグメント毎の解析結果として出力することができる。   According to the eighth and eighteenth aspects of the present invention, time series data to be analyzed can be output as a batch analysis result and an analysis result for each segment by the analysis result configuration means or procedure.

請求項9、10、19、20の発明によれば、理論形式では有限離散値を扱うコンピュータで構成することができない線スペクトル列となる時系列データのスペクトルを、ピーク周波数から離れるに従って急減する連続関数、例えば余弦函数に微弱な雑音を加えた時系列をラグ2にて最大エントロピー法のスペクトル密度の計算を行って得られたスペクトルをδ函数の原型として利用して再構成することにより、コンピュータを利用して、理論と整合する時系列データの解析を行うことができる。   According to the ninth, tenth, nineteenth, and twentyth aspects of the present invention, the spectrum of the time series data, which is a line spectrum sequence that cannot be configured by a computer that handles finite discrete values in the theoretical format, continuously decreases as the distance from the peak frequency increases. By reconstructing a function, for example, a time series obtained by adding weak noise to a cosine function and calculating the spectral density of the maximum entropy method at lag 2 as the prototype of the δ function, Can be used to analyze time-series data consistent with theory.

次に本発明に係る時系列データの解析装置の最良の形態を、添付した図1〜図21を参照して説明する。
本発明に係る解析装置1は、上述した解析手法を適用するため、解析対象の時系列データ(以降、必要に応じて原時系列データと称する)を一般化三角多項式により表現して解析を行うように構成されており、概ね、原時系列データに対して最大エントロピー法を適用して、高精度なパワースペクトル密度(PSD)を求め、その顕著なピークから、一般化三角多項式を解く初期値としての、項数と、各三角項の周期値を求める過程と、これらの初期値により、線形化された非線形最小自乗法を用いて、各三角項のパラメータを求めると共に、残差時系列データを求め、これらを加算して時系列データを再構成する過程を実行するように構成されている。
Next, the best mode of the time-series data analysis apparatus according to the present invention will be described with reference to FIGS.
The analysis apparatus 1 according to the present invention performs analysis by expressing time series data to be analyzed (hereinafter referred to as original time series data as necessary) by a generalized triangular polynomial in order to apply the above-described analysis method. In general, the maximum entropy method is applied to the original time series data to obtain a highly accurate power spectral density (PSD), and the initial value for solving the generalized trigonometric polynomial from its prominent peaks The process of obtaining the number of terms and the period value of each triangular term, and using these initial values, the linearized nonlinear least squares method is used to obtain the parameters of each triangular term and the residual time series data And adding these to reconstruct time-series data.

即ち、本発明に係る解析装置1においては、原時系列データは、次式の一般化三角多項式で表現される。

Figure 2010086398
ここで、x(t)は原時系列データ、即ち、有限長離散時系列のデータを示し、Lは項数、ajは振幅、Tjは周期、φjは頂位位相、εx(t)は雑音成分を示しており、上述した一般化三角多項式のパラメータは、これらの項数(モード数)、各項の振幅aj、周期Tj及び頂位位相φjから成る。尚、頂位位相とは、そのモードの値が極大を示す時刻で、そのモードの周期ごとに現れる時刻のうちの一つを示している。 That is, in the analysis apparatus 1 according to the present invention, the original time series data is represented by the following generalized triangular polynomial.
Figure 2010086398
Where x (t) indicates original time series data, that is, finite length discrete time series data, L is the number of terms, aj is the amplitude, Tj is the period, φj is the top phase, and εx (t) is the noise The parameters of the generalized trigonometric polynomial described above are composed of the number of terms (number of modes), the amplitude aj of each term, the period Tj, and the top phase φj. Note that the top phase is a time at which the value of the mode has a maximum, and indicates one of the times that appear for each cycle of the mode.

図1は本発明に係る解析装置1の実施の形態を模式的に表した全体構成の説明図であり、図中矢印により処理の流れを模式的に表している。
図に示すように、この実施の形態に係る解析装置1は、原時系列データを解析するシーケンスを決定する解析シーケンス決定手段2と、この解析シーケンス決定手段2により決定された解析シーケンスに従い、最大エントロピー法及び非線形最小自乗法によりデータを解析して一般化三角多項式のパラメータと残差を求めるデータ解析手段3と、データ解析手段3により求めた解析結果を評価し、条件に適合する場合に、予め設定された記憶手段に記憶する解析結果評価手段4と、これらの解析シーケンス決定手段2と、データ解析手段3と、解析結果評価手段4を統合的に制御して、必要な繰り返し演算等を行わせるための制御手段5と、上記パラメータから得られるパワースペクトル密度と最大エントロピー法を用いて求める残差のパワースペクトル密度を合成して時系列データの再構成スペクトルを求める再構成スペクトル計算手段6と、頂位位相の推移を計算する頂位位相推移計算手段7と、出力するデータの準備等に係る計算を行う、その他計算手段8と、これらの各計算手段6〜8を用いて、出力するデータ解析手段3の解析結果を構成する解析結果構成手段9とから構成されている。
FIG. 1 is an explanatory diagram of an overall configuration schematically showing an embodiment of an analysis apparatus 1 according to the present invention, and a processing flow is schematically shown by arrows in the drawing.
As shown in the figure, the analysis apparatus 1 according to this embodiment includes an analysis sequence determination unit 2 that determines a sequence for analyzing original time series data, and a maximum according to the analysis sequence determined by the analysis sequence determination unit 2. When analyzing the data by the entropy method and the nonlinear least square method to obtain the parameters and residuals of the generalized trigonometric polynomial, the analysis result obtained by the data analysis means 3 is evaluated, and when the conditions are met, The analysis result evaluation means 4 stored in the preset storage means, the analysis sequence determination means 2, the data analysis means 3, and the analysis result evaluation means 4 are controlled in an integrated manner so that necessary repetitive calculations and the like are performed. The control means 5 for performing, the power spectral density obtained from the above parameters and the power of the residual obtained using the maximum entropy method Reconstructed spectrum calculating means 6 for obtaining a reconstructed spectrum of time series data by synthesizing spectrum density, top phase transition calculating means 7 for calculating the transition of the top phase, and calculation related to preparation of output data, etc. The other calculation means 8 to be performed and the analysis result construction means 9 that constitutes the analysis result of the data analysis means 3 to be output using these calculation means 6 to 8 are configured.

後述するように、解析シーケンス決定手段2は、解析シーケンスの一つとして、原時系列データの全期間データのデータ点数やデータ構造等に応じて、それを複数レイヤーに構成した、データ構造の均一な複数のセグメントに分割すると共に、分割された均一なセグメントの夫々を基本セグメントとして、それらに対応して記憶手段に記憶領域を設定する過程を有し、この分割されたセグメントに取り込まれた原時系列データについてデータ解析手段3において解析されるものである。そしてデータ解析手段3において各セグメントの原時系列データについて得られた解析結果は、対象とする時系列データ全体を一括する一括解析結果と、セグメント解析結果として構成されるものであり、このために上記解析結果構成手段9は、前者に対応する一括解析結果構成手段9aと、後者に対応するセグメント解析結果構成手段9bとから構成されている。   As will be described later, the analysis sequence determination means 2 has a uniform data structure that is configured as a plurality of layers according to the number of data points, the data structure, etc. of the whole period data of the original time series data as one of the analysis sequences And dividing each of the divided uniform segments into basic segments, and setting a storage area in the storage means corresponding to them, and the original captured in the divided segments. The time series data is analyzed by the data analysis means 3. The analysis results obtained for the original time-series data of each segment in the data analysis means 3 are configured as a batch analysis result for collecting the entire target time-series data and a segment analysis result. The analysis result configuring unit 9 includes a collective analysis result configuring unit 9a corresponding to the former and a segment analysis result configuring unit 9b corresponding to the latter.

図2は本発明に係る解析装置1から出力される解析結果を模式的に示すものであり、原時系列データの全期間に渡ってデータ構造が保たれる一括の解析結果10と、原時系列データの期間内でデータ構造が時々刻々と変動し、原時系列データの全期間を網羅する複数のセグメント毎に得られる解析結果11とから構成される。従って、前者の解析結果10は時間依存がなく、後者の解析結果11は時間依存を有するものである。   FIG. 2 schematically shows an analysis result output from the analysis apparatus 1 according to the present invention. The batch analysis result 10 in which the data structure is maintained over the entire period of the original time series data, and the original time The data structure fluctuates from time to time within the period of the series data, and is composed of analysis results 11 obtained for each of a plurality of segments covering the entire period of the original time series data. Therefore, the former analysis result 10 is not time-dependent, and the latter analysis result 11 is time-dependent.

解析結果10において、一般化三角多項式パラメータaは、上述した一般化三角多項式の項数、振幅、周期及び頂位位相であり、これらのパラメータaから、周期的に変動する曲線、即ち、多項式パラメータによる最適あてはめ曲線4と、そのスペクトル、即ち、多項式パラメータによる再構成スペクトル5が構成され、これに残差と残差のスペクトル6による残差成分を加算することにより、原時系列データが再構成される。   In the analysis result 10, the generalized trigonometric polynomial parameter a is the number of terms, amplitude, period, and top phase of the generalized trigonometric polynomial described above. From these parameters a, a periodically varying curve, that is, a polynomial parameter The optimal fitting curve 4 and its spectrum, that is, the reconstructed spectrum 5 by the polynomial parameter, are constructed, and the residual time and the residual component of the residual spectrum 6 are added to this, thereby reconstructing the original time series data Is done.

一方、解析結果11においては、一般化三角多項式パラメータeと、多項式パラメータによる再構成スペクトルfと、多項式パラメータによる頂位位相gとが夫々各セグメント毎に構成され、従って再構成スペクトルfと頂位位相gの時間変動が構成される。   On the other hand, in the analysis result 11, the generalized triangular polynomial parameter e, the reconstruction spectrum f based on the polynomial parameter, and the top phase g based on the polynomial parameter are configured for each segment. A time variation of the phase g is constructed.

次に解析装置1の、上述した各構成要素の動作を説明する。
まず図3、図4は解析シーケンス決定手段2における処理の流れを示す流れ図であり、図5は解析シーケンス決定手段2により決定されたレイヤーとセグメントの構成例を模式的に示すものである。
Next, the operation of each component described above of the analysis apparatus 1 will be described.
3 and 4 are flowcharts showing the flow of processing in the analysis sequence determination means 2, and FIG. 5 schematically shows a configuration example of layers and segments determined by the analysis sequence determination means 2.

まず解析装置1にステップS1において原時系列データが入力されると、解析シーケンス決定手段2は、まずステップS2において、一つのセグメントが配置されるレイヤーを設定する。この一つのセグメントが配置されるレイヤーは必ず設定されるものであるので、その設定時点はステップS2の時点でなくとも良い。   First, when original time series data is input to the analysis apparatus 1 in step S1, the analysis sequence determination means 2 first sets a layer in which one segment is arranged in step S2. Since the layer in which this one segment is arranged is always set, the setting time may not be the time of step S2.

次にステップS3では、入力された原時系列データの全期間のデータ点数が、予め設定されている最大データ点数を越えているか、否かを判定する。
この最大データ点数は、後述する基本セグメントに取り込んで解析が行われる最大データ点数であるが、一般に、各セグメントに取り込んで同時に解析するデータ点数が小さすぎるとデータの構造の抽出が困難となり、逆に大きすぎると過剰なデータ構造が抽出されてしまうため、最適なデータ点数とするのが高精度の解析結果を得るためには好ましい。一方、解析に最適なデータ点数は、取り込んだデータの周期性が強いか否かによっても異なり、また解析装置1を構成する演算手段の演算速度や演算精度等によってもデータ点数が制限される。
このようなことから、最大データ点数としては、それまでの多数の時系列データの解析により蓄積された知見等から得られた値が設定される。尚、この最大データ点数は、後述する各評価手段による評価の結果をフィードバックして変更可能とし、変更された最大データ点数に基づいてステップS3及びそれ以降の処理を行うようにすることもできる。また最大データ点数は、操作者により設定可能とすることもできる。
Next, in step S3, it is determined whether or not the total number of data points of the input original time series data exceeds the preset maximum number of data points.
This maximum number of data points is the maximum number of data points that can be analyzed by importing into the basic segment, which will be described later. Generally, if the number of data points that are imported into each segment and analyzed at the same time is too small, it will be difficult to extract the structure of the data. If it is too large, an excessive data structure is extracted. Therefore, it is preferable to obtain an optimal number of data points in order to obtain a highly accurate analysis result. On the other hand, the optimal number of data points for analysis differs depending on whether the periodicity of the acquired data is strong, and the number of data points is also limited by the calculation speed and calculation accuracy of the calculation means constituting the analysis apparatus 1.
For this reason, as the maximum number of data points, a value obtained from knowledge accumulated by analysis of a large number of time series data so far is set. Note that this maximum data score can be changed by feeding back the results of evaluation by each evaluation means to be described later, and step S3 and subsequent processing can be performed based on the changed maximum data score. The maximum number of data points can be set by the operator.

尚、不等間隔の原時系列データに対して、自動的に解析を行えるようにするために、不等間隔の原時系列データを、補間や補完等の手法を用いて等間隔化するステップを、ステップS3またはそれに先行して設けることができる。   Note that the step of equalizing the unequal-interval original time series data by using interpolation, interpolation, or the like in order to automatically analyze the unequal interval original time-series data. Can be provided at or before step S3.

ステップS3において、入力された時系列データの全体のデータ点数が、予め設定されている最大データ点数を越えていないと判定された場合には、一つのセグメントが配置された一つのレイヤーが設定された状態で、結合子Aを経て図4のステップS6に移行する。   If it is determined in step S3 that the total number of data points of the input time-series data does not exceed the preset maximum number of data points, one layer in which one segment is arranged is set. In this state, the process proceeds to step S6 in FIG.

一方、ステップS3において、入力された時系列データの全体のデータ点数が、予め設定されている最大データ点数を越えていると判定された場合には、ステップS4に移行し、そのステップS4において、それまでに設定された上位のレイヤーの下位にレイヤーを追加し、その下位のレイヤーには、上位のレイヤーのセグメント数の2倍のセグメントを配置して、ステップS5に移行する。   On the other hand, if it is determined in step S3 that the total number of data points of the input time-series data exceeds the preset maximum number of data points, the process proceeds to step S4. In step S4, A layer is added to the lower layer of the upper layer set so far, and a segment twice as many as the number of segments of the upper layer is arranged in the lower layer, and the process proceeds to step S5.

ステップS5では、入力された原時系列データの全期間データが、ステップS4において配置された全セグメントに等分されて取り込まれた場合の各セグメント毎のデータ点数が上記最大データ点数を越えているか、否かを判定する。   In step S5, whether the number of data points for each segment when the whole period data of the input original time series data is equally divided into all the segments arranged in step S4 exceeds the maximum number of data points. Determine whether or not.

ステップS5において、各セグメントのデータ点数が、上記最大データ点数を越えていると判定された場合には、ステップS4に移行して、更に下位のレイヤーが追加され、一方、各セグメントのデータ点数が、上記最大データ点数を越えていないと判定された場合には、結合子Aを経て図4のステップS6に移行する。   If it is determined in step S5 that the number of data points of each segment exceeds the maximum data point, the process proceeds to step S4, where a lower layer is added, while the number of data points of each segment is If it is determined that the maximum number of data points has not been exceeded, the process proceeds to step S6 in FIG.

以上の各ステップにおける処理を経て、原時系列データを、予め設定された最大データ点数を越えないようにセグメントに取り込むための、レイヤーとセグメントの構成が得られ、構成された単数又は順次配列された複数のセグメントが、原時系列データの全期間を網羅する。従って以上のステップの処理は、上述した分割処理過程に相当する。   Through the processing in each of the above steps, the structure of layers and segments for obtaining original time series data into a segment so as not to exceed the preset maximum number of data points is obtained, and the configured single or sequential Multiple segments cover the entire period of the original time series data. Therefore, the process of the above steps corresponds to the above-described division process.

次いでステップS6では、最下位のレイヤーのセグメントに原時系列データの対応部分が取り込まれ、セグメントデータが構成される。   Next, in step S6, the corresponding portion of the original time series data is taken into the segment of the lowest layer, and segment data is configured.

次いでステップS7では、セグメントデータに対して、次式の最大エントロピー法のスペクトル密度の計算を最小ラグ値から最大ラグ値まで行い、ラグ値に対するバーグの係数Pmの推移をステップS8において評価する。

Figure 2010086398
ここで、Bm(f)はラグ値mにおけるスペクトル密度、Δtはサンプリング間隔、Pmとγm(k)はバーグの係数である。 Next, in step S7, the spectral density of the maximum entropy method of the following equation is calculated for the segment data from the minimum lag value to the maximum lag value, and the transition of the Berg coefficient Pm with respect to the lag value is evaluated in step S8.
Figure 2010086398
Here, Bm (f) is the spectral density at the lag value m, Δt is the sampling interval, and Pm and γm (k) are Burg's coefficients.

後に例示するように、係数Pmは、ラグ値が増大するに従って単調減少する量であり、ホワイトノイズ的な時系列データでは、この減少は極めてゆるやかであるのに対して、三角関数波に一定量の雑音を重畳した時系列データや、その他の通常観測されるように周期性を有する成分を含む時系列データでは、係数Pmの減少はやや大きくなる。また、周期性を有する成分の他に雑音を含まないか、またはごくわずかに含む三角関数波として記述されるような極めて周期性の高い時系列データでは、係数Pmの減少は極めて急激におこり、最小ラグ値に対する係数Pmの値と、最大ラグ値(セグメントデータのデータ点数−1)に対する係数Pmの比は7〜10桁以上に達する。   As will be exemplified later, the coefficient Pm is an amount that monotonously decreases as the lag value increases. In white noise time-series data, this decrease is very gradual, whereas a constant amount in the trigonometric function wave. In the time-series data on which the noise is superimposed and other time-series data including a component having periodicity as normally observed, the decrease in the coefficient Pm is slightly large. In addition, in the time series data with extremely high periodicity, which is described as a trigonometric wave which contains no noise or very little in addition to the component having periodicity, the coefficient Pm decreases very rapidly, The ratio of the coefficient Pm to the minimum lag value and the coefficient Pm to the maximum lag value (number of data points of segment data −1) reaches 7 to 10 digits or more.

そして、セグメントデータの全期間に渡ってデータ構造が変化せず、均一な時系列データでは、係数Pmは最小のラグ値から増大する際に、最初急激に減少した後に、プラトー領域に至って最大ラグ値まで緩やかに漸減するのに対して、セグメントデータの期間内においてデータ構造が変化する不均一な時系列データでは、プラトー領域において、係数Pmの急激な変化が生じる。   The data structure does not change over the entire period of the segment data, and for uniform time-series data, the coefficient Pm first decreases rapidly when increasing from the minimum lag value, then reaches the plateau region and reaches the maximum lag. In the case of non-uniform time series data in which the data structure changes within the period of the segment data while gradually decreasing to a value, a rapid change of the coefficient Pm occurs in the plateau region.

そこでステップS8においては、セグメントデータの評価として、a:最小ラグ値に対する係数Pmの値と、最大ラグ値に対する係数Pmの比を算出し、その値を設定値と比較して、セグメントデータの周期性の強さを評価することと、b:プラトー領域における急激な値の変化を検出して、データ構造の変化を検出することが行われる。   Therefore, in step S8, as the evaluation of the segment data, a: the ratio of the coefficient Pm to the minimum lag value and the ratio of the coefficient Pm to the maximum lag value are calculated, and the value is compared with the set value to determine the cycle of the segment data. Evaluation of the strength of sex and b: detecting a sudden change in value in the plateau region to detect a change in data structure.

ステップS8においてデータ構造が均一であると判定された場合には、ステップS9に移行して、データ構造を評価したセグメントを基本セグメントとして設定し、次いでステップS10に移行して、全てのセグメントに対してセグメントデータのデータ構造の評価が完了したか否かを判定し、完了していない場合にはステップS6に移行して、次のセグメントに対しての上述した処理が行われる。   If it is determined in step S8 that the data structure is uniform, the process proceeds to step S9, the segment for which the data structure has been evaluated is set as a basic segment, and then the process proceeds to step S10 for all segments. Then, it is determined whether or not the evaluation of the data structure of the segment data is completed. If the evaluation is not completed, the process proceeds to step S6, and the above-described processing is performed for the next segment.

一方、ステップS8においてデータ構造が不均一であると判定された場合には、ステップS11に移行し、ステップS11においては、ステップS8において評価されたセグメントのレイヤーの下位にサブレイヤーを構成し、このサブレイヤーに、データ構造の変化している個所において2分割したセグメントを配置する。   On the other hand, if it is determined in step S8 that the data structure is non-uniform, the process proceeds to step S11. In step S11, a sublayer is configured below the segment layer evaluated in step S8. In the sublayer, a segment divided into two is arranged at a location where the data structure is changed.

次いでステップS6に移行して、ステップS11において構成されたサブレイヤーに配置された2つのセグメントに対して、上述と同様な処理が行われる。即ち、ステップS8において、サブレイヤーのセグメントのデータ構造が均一であると判定された場合には、このセグメントもステップS10において基本セグメントとして設定され、一方、データ構造が不均一であると判定された場合には、サブレイヤーの下位に更にサブレイヤーが構成され、このサブレイヤーに、データ構造の変化している個所において2分割したセグメントが配置され、更にステップS6に移行して上述と同様な処理が行われる。   Next, the process proceeds to step S6, and the same processing as described above is performed on the two segments arranged in the sublayer configured in step S11. That is, if it is determined in step S8 that the data structure of the sub-layer segment is uniform, this segment is also set as a basic segment in step S10, while the data structure is determined to be non-uniform. In this case, a sub-layer is further formed below the sub-layer, and a segment divided into two at the location where the data structure is changed is arranged in this sub-layer, and the process proceeds to step S6 and the same processing as described above. Is done.

こうしてステップS10において、サブレイヤーのセグメントを含む全てのセグメントに対してセグメントデータのデータ構造の評価が完了したか否かを判定し、完了と判定された場合には、ステップS12に移行し、ステップS9において基本セグメントとして設定された全てのセグメントに対応して、記憶手段に記憶領域を設定し、初期化がされて、解析シーケンスが完成する。   Thus, in step S10, it is determined whether or not the evaluation of the data structure of the segment data has been completed for all segments including the sublayer segment. If it is determined that the segment data has been completed, the process proceeds to step S12. Corresponding to all the segments set as basic segments in S9, storage areas are set in the storage means, initialization is performed, and the analysis sequence is completed.

図5は、ある解析対象の時系列データに対して、解析シーケンス決定手段2が決定したレイヤーとセグメントの構成を模式的に示すものであり、レイヤーは、時系列データの全期間データに対応する一つのセグメントが配置されるレイヤー0の下位に、レイヤーN(N:自然数)まで、N+1層のレイヤーが構成されており、また、レイヤーNのセグメント3に対応してサブレイヤー1が構成されている。こうしてレイヤーNの、セグメント3を除く全てのセグメントが基本セグメントとして設定され、またレイヤーNのセグメント3が分割された、サブレイヤー1の2つのセグメントが基本セグメントとして設定されている。そしてこれらの基本セグメントの全てに対応して記憶手段に記憶領域が設定されている。   FIG. 5 schematically shows the structure of layers and segments determined by the analysis sequence determination means 2 for certain time-series data to be analyzed, and the layers correspond to the entire period data of the time-series data. N + 1 layers are configured up to layer N (N: natural number) below layer 0 where one segment is arranged, and sublayer 1 is configured corresponding to segment 3 of layer N. Yes. In this way, all the segments of layer N except segment 3 are set as basic segments, and two segments of sub-layer 1 obtained by dividing segment 3 of segment N are set as basic segments. A storage area is set in the storage means corresponding to all of these basic segments.

データ解析手段3は、解析シーケンス決定手段2により上述したように決定されたレイヤーとセグメントの構成に基づき、セグメントに取り込まれた原時系列データ、即ち、セグメントデータの解析を行う。   The data analysis unit 3 analyzes the original time series data taken into the segment, that is, the segment data, based on the layer and segment configuration determined by the analysis sequence determination unit 2 as described above.

データ解析手段3によるセグメントデータの解析は、最上位のレイヤー0から最下位のレイヤーN及びサブレイヤー1に向かって順次同様な処理の流れで行われるが、この際、上位のレイヤーのセグメントのセグメントデータは、上述したようにセグメント当たりのデータ点数が予め設定された最大データ点数を越えないように、原時系列データのデータ点数をバンチング処理により低減してセグメントデータを構成して処理が行われる。例えばレイヤー0のセグメントには、バンチング処理により、原時系列データの全期間のデータ点数を1/2に低減したデータをセグメントデータとして取り込み、レイヤー1のセグメントには、原時系列データの全期間のデータ点数を1/2N−1に低減したデータをセグメントとして取り込む。 The analysis of the segment data by the data analysis means 3 is performed in the same processing flow sequentially from the highest layer 0 to the lowest layer N and the sublayer 1, but at this time, the segment of the upper layer segment As described above, the data is processed by configuring the segment data by reducing the number of data points of the original time series data by bunching processing so that the number of data points per segment does not exceed the preset maximum data number. . For example, for the segment of layer 0, data obtained by reducing the number of data points of the original time series data to ½ N by bunching processing is taken as segment data, and for the segment of layer 1, all of the original time series data is imported. Data in which the number of data points in the period is reduced to 1/2 N-1 is taken as a segment.

更に、上位のレイヤーにおける各セグメントの解析結果中、上位側のセグメントに対して求められたパラメータは、その上位のセグメントに対応する全ての基本セグメントの記憶領域に同様に順次記憶されて行く。一方、上記パラメータから構成される当てはめ曲線と、原時系列データの対応部分との差演算により求められる残差時系列データは次の下位レイヤーのセグメントデータとして設定して解析が行われる。   Further, in the analysis result of each segment in the upper layer, the parameters obtained for the upper segment are sequentially stored in the storage areas of all the basic segments corresponding to the upper segment. On the other hand, the residual time series data obtained by calculating the difference between the fitting curve composed of the above parameters and the corresponding portion of the original time series data is set and analyzed as segment data of the next lower layer.

そこで、データ解析手段3及び解析結果評価手段4における各セグメントの解析処理の流れを図6、図7の流れ図につき説明する。
まずステップS101では、セグメントに原時系列データの対応部分が取り込まれて、セグメントデータが構成される。この際、レイヤー0〜N−1のセグメントの場合には、上述したとおり、バンチング処理によるデータ点数の低減が行われる。
Therefore, the flow of analysis processing of each segment in the data analysis means 3 and the analysis result evaluation means 4 will be described with reference to the flowcharts of FIGS.
First, in step S101, the corresponding portion of the original time series data is taken into the segment to form segment data. At this time, in the case of segments of layers 0 to N-1, as described above, the number of data points is reduced by the bunching process.

次いでステップS102では、ステップS101において取り込まれたセグメントデータに対して、上述のステップS8と同様に最大エントロピー法のスペクトル密度(MEM-PSD)の計算を最小ラグ値から最大ラグ値まで行い、夫々のラグ値に対するバーグの係数Pmの推移を算出する。   Next, in step S102, the spectral density (MEM-PSD) of the maximum entropy method is calculated from the minimum lag value to the maximum lag value for the segment data captured in step S101, as in step S8 described above. Calculate the transition of Berg's coefficient Pm with respect to the lag value.

次いでステップS103では、上述のステップS9と同様に、ラグ値に対するバーグの係数Pmの推移を評価し、それに基づいて最大エントロピー法によるパワースペクトル密度の計算に用いるM個のラグ値を決定する。このラグ値は単数又は複数で良い。   Next, in step S103, as in step S9 described above, the transition of the Berg coefficient Pm with respect to the lag value is evaluated, and M lag values used for calculation of the power spectral density by the maximum entropy method are determined based on the transition. This lag value may be singular or plural.

このラグ値の決定は、例えば、a:周期性の強いデータ、即ち最小ラグ値に対する係数Pmの値と最大ラグ値に対する係数Pmの比が大きい場合には、ラグ値を50%以内とし、データ点数が多い場合には、より小さなラグ値とする、b:周期性の弱い場合には、ラグ値は50%以上で、時系列の構造を効率的に取り出すために75%までとし、データ点数が少ない場合には、より大きなラグ値とする、等のラグ値決定のための条件や、その他、数多くの時系列データにおける解析から得られた知見を知識ベースとして記憶しておき、上述したバーグの係数Pmの評価結果から知識ベースを用いて、単数又は複数のラグ値を自動的に決定する構成とすることができる。この他、解析装置1のインタラクティブな操作により人がラグ値の決定を行うようにすることができる。   This lag value is determined by, for example, a: data having strong periodicity, that is, when the ratio of the coefficient Pm to the minimum lag value and the coefficient Pm to the maximum lag value is large, the lag value is set to 50% or less. If the number of points is large, the lag value should be smaller. B: If the periodicity is weak, the lag value should be 50% or more, and up to 75% to efficiently extract the time-series structure. If there are few, the conditions for determining the lag value, such as a larger lag value, and other knowledge obtained from the analysis of many time-series data are stored as a knowledge base, and the above-mentioned Berg It is possible to adopt a configuration in which one or a plurality of lag values are automatically determined from the evaluation result of the coefficient Pm using a knowledge base. In addition, a person can determine the lag value by interactive operation of the analysis apparatus 1.

次いでステップS103で決定されたM個のラグ値の夫々につき、ステップS104において、上述した文献等に開示される最大エントロピー法によるパワースペクトル密度(MEM-PSD)の計算を行う。   Next, for each of the M lag values determined in step S103, in step S104, the power spectral density (MEM-PSD) is calculated by the maximum entropy method disclosed in the above-described literature.

次いでステップS105では、ステップS104において算出したM個のパワースペクトル密度の夫々から、適数の主要なピークと、そのパワーを抽出する。この主要なピーク及びそのパワーの抽出動作においても、ステップS103におけるラグ値の決定動作と同様に知識ベースを利用した自動的な抽出の他、解析装置1のインタラクティブな操作により人がラグ値の決定を行うようにすることもできる。   Next, in step S105, an appropriate number of main peaks and their powers are extracted from each of the M power spectral densities calculated in step S104. Also in the extraction operation of the main peak and its power, the person determines the lag value by interactive operation of the analysis apparatus 1 in addition to the automatic extraction using the knowledge base similarly to the determination operation of the lag value in step S103. It is also possible to perform.

次いでステップS106では、ステップS105で抽出した主要ピークの周波数の逆数を周期の初期値として、非線形最小自乗法により、複数の当てはめ曲線とそのパラメータが算出される。   Next, in step S106, a plurality of fitting curves and their parameters are calculated by the nonlinear least square method using the reciprocal of the main peak frequency extracted in step S105 as the initial value of the period.

次いでステップS107は、ステップS106で求められた当てはめ曲線のパラメータを、初期値と比較して一致度を評価する。この一致度の評価は、例えば、当てはめ曲線の各周期のモードのパワー(振幅の自乗の1/2)を、上記主要ピークのパワーで除した値により評価する。   Next, in step S107, the degree of coincidence is evaluated by comparing the parameters of the fitting curve obtained in step S106 with initial values. For example, the degree of coincidence is evaluated by a value obtained by dividing the power (1/2 of the square of the amplitude) of the mode of each cycle of the fitting curve by the power of the main peak.

このようにしてステップS107において、最も一致度の高い当てはめ曲線を最適当てはめ曲線として選択する。   In this way, in step S107, the fitting curve having the highest degree of coincidence is selected as the optimum fitting curve.

次いでステップS108では、ステップS107において選択された最適当てはめ曲線のパラメータの一致度が、予め設定された一致度以上であるか否かを判定し、設定された一致度以上でない場合には、ステップS111においてラグ値の再設定指示を行ってステップS103に移行し、また予め設定された一致度以上である場合には、ステップS109に移行して、ステップS107において選択された最適当てはめ曲線を、解析結果評価手段4により評価する。   Next, in step S108, it is determined whether or not the degree of coincidence of the parameters of the optimum fitting curve selected in step S107 is equal to or higher than a preset degree of coincidence. In step S103, the process proceeds to step S103. If the degree of coincidence is equal to or higher than the preset matching degree, the process proceeds to step S109, and the optimum fitting curve selected in step S107 is analyzed. Evaluation is performed by the evaluation means 4.

図6においてステップS109として示す解析結果評価手段4による評価は、図7の流れ図に示す流れで行われる。
まずステップS112では、ステップS107において選出されたパラメータにより、最適当てはめ曲線を再構成し、そのデータ期間に対応する原時系列データとの差の演算を行い、残差曲線を求める。また当てはめ曲線の再現性を評価する諸量、ここでは標準偏差と残差パワーの時間依存が求められる。
The evaluation by the analysis result evaluation means 4 shown as step S109 in FIG. 6 is performed according to the flow shown in the flowchart of FIG.
First, in step S112, an optimal fitting curve is reconstructed using the parameters selected in step S107, and a difference from the original time series data corresponding to the data period is calculated to obtain a residual curve. In addition, various quantities for evaluating the reproducibility of the fitting curve, here, the time dependence of the standard deviation and the residual power are required.

次いでステップS113においては、ステップS112において求めた当てはめ曲線の再現性を評価する諸量に基づいて、最適当てはめ曲線と、原時系列データの対応部分が十分に一致しているか否かを判定する。   Next, in step S113, it is determined whether or not the optimum fitting curve and the corresponding portion of the original time series data are sufficiently matched based on various amounts for evaluating the reproducibility of the fitting curve obtained in step S112.

ステップS113において十分に一致していると判定された場合には、ステップS114に移行し、求められたパラメータは、そのセグメントに対応する全ての基本セグメントの記憶領域に同様に順次記憶されて行く。一方、上記パラメータから構成される当てはめ曲線と、原時系列データの対応部分との差演算により求められる残差時系列データは次の下位のレイヤーのセグメントデータとして設定された後、ステップS109の処理が終了する。   If it is determined in step S113 that they are sufficiently matched, the process proceeds to step S114, and the obtained parameters are sequentially stored in the storage areas of all the basic segments corresponding to the segment. On the other hand, after the residual time series data obtained by calculating the difference between the fitting curve composed of the above parameters and the corresponding portion of the original time series data is set as the segment data of the next lower layer, the process of step S109 is performed. Ends.

一方、ステップS113において十分に一致していないと判定された場合には、ステップS115に移行し、セグメント解析結果は破棄し、そのセグメントデータを、そのまま次のレイヤーのセグメントに設定した後、ステップS109の処理が終了する。   On the other hand, if it is determined in step S113 that they do not match sufficiently, the process proceeds to step S115, the segment analysis result is discarded, and the segment data is set as it is to the segment of the next layer, and then step S109. This process ends.

このような処理を行うことにより、一括した解析処理では、十分に一致する当てはめ曲線が得られないセグメントデータは、順次、下位の2つのセグメントに分割されて設定され、次は分割された夫々のセグメントデータとして解析処理されるため、一括した解析処理では、データ構造の変動により十分に一致する当てはめ曲線が得られないセグメントデータであっても、最終的にはサブレイヤーの基本セグメントにおいて、十分に一致する当てはめ曲線を求めることができる。   By performing such processing, segment data for which a fitting curve that sufficiently matches cannot be obtained in the batch analysis processing is sequentially divided into two lower segments, and the next segment data is set. Since it is analyzed as segment data, even if it is segment data that does not provide a fitting curve that matches well due to fluctuations in the data structure in the batch analysis process, it will eventually be sufficient in the basic segment of the sublayer. A matching fit curve can be determined.

ステップS109の処理が終了すると、次にステップS110に移行して、全てのセグメントの解析が終了したか否かを判定し、終了していない場合には、ステップS101に移行して、次のセグメントの解析を行い、全てのセグメントの解析処理が終了している場合には、セグメント解析が終了する。   When the process of step S109 is completed, the process proceeds to step S110, where it is determined whether or not the analysis of all segments has been completed. If not, the process proceeds to step S101, and the next segment is determined. If all the segments have been analyzed, the segment analysis is completed.

次に、上述したとおり、一括解析結果構成手段9aは、再構成スペクトル計算手段6とその他計算手段8を利用して図2に示すような解析結果10を構成し、またセグメント解析結果構成手段9bは、再構成スペクトル計算手段6と、頂位位相推移計算手段7と、その他計算手段8を利用して図2に示すような解析結果11を構成するものであり、そこでこれらの計算手段6、7の動作を次に説明する。   Next, as described above, the collective analysis result configuration unit 9a uses the reconstructed spectrum calculation unit 6 and the other calculation unit 8 to configure the analysis result 10 as shown in FIG. 2, and the segment analysis result configuration unit 9b. Is to construct an analysis result 11 as shown in FIG. 2 using the reconstructed spectrum calculating means 6, the top phase shift calculating means 7, and the other calculating means 8, and these calculating means 6, Next, the operation of No. 7 will be described.

まず図8は一括解析結果構成手段9aにより利用されている場合の再構成スペクトル計算手段6の動作を説明する模式的流れ図であり、まずステップS201では、全ての記憶領域1〜記憶領域2Nに保存されている全てのパラメータ(振幅aj及び周期Tj)と残差時系列データεx(t)を取り出す。尚、取り出されたパラメータの個数は図中に示すように便宜的にL個としている。   First, FIG. 8 is a schematic flowchart for explaining the operation of the reconstructed spectrum calculating means 6 when it is used by the collective analysis result constituting means 9a. First, in step S201, all the storage areas 1 to 2N are stored. All parameters (amplitude aj and period Tj) and residual time series data εx (t) are extracted. The number of extracted parameters is set to L for convenience as shown in the figure.

次いで、ステップS202において、時系列データのエネルギーを保存するため、L個のパラメータ、即ち、夫々L個の振幅aj及び周期Tjの規格化を行う。この規格化は、解析シーケンス決定手段2よりサブレイヤーが構成されておらず、従って全ての基本セグメントのデータ期間が等しい長さの場合には、全てのモードの振幅ajの自乗を基本セグメントの個数2Nで除して、その平方根を新たな振幅ajとすることで規格化を行うことができる。一方、サブレイヤーが構成されており、従ってデータ期間の長さが異なる基本セグメントが含まれる場合には、全ての基本セグメントについて、対応する記憶域に記された全モードの振幅ajを自乗すると共に、この値に、モードの属する基本セグメントの長さと、全期間の長さの比を乗じ、得られた積の平方根を新たな振幅ajとすることで規格化を行うことができる。   Next, in step S202, in order to save the energy of the time-series data, L parameters, that is, L amplitudes aj and periods Tj are normalized. In this normalization, when no sub-layer is configured from the analysis sequence determination means 2, and when the data periods of all the basic segments have the same length, the square of the amplitude aj of all the modes is the number of basic segments. By dividing by 2N and making the square root a new amplitude aj, normalization can be performed. On the other hand, if a sub-layer is configured and therefore a basic segment with a different data period length is included, the amplitude aj of all modes recorded in the corresponding storage area is squared for all the basic segments. Then, normalization can be performed by multiplying this value by the ratio of the length of the basic segment to which the mode belongs and the length of the entire period and setting the square root of the obtained product as a new amplitude aj.

このようにして規格化されたL個のパラメータ(振幅aj及び周期Tj)の夫々により、ステップS203において、中心周波数1/Tjにピークをもつ孤立ピーク列Pj、即ち図に示される孤立ピーク列( P1 … Pj … PL )を構成する。   According to each of the L parameters (amplitude aj and period Tj) normalized in this manner, in step S203, an isolated peak train Pj having a peak at the center frequency 1 / Tj, that is, an isolated peak train (shown in the figure). P1 ... Pj ... PL).

この際、孤立ピーク列( P1 … Pj … PL )は、δ函数の原型を用いて全周波数帯に裾の広がる夫々一つのスペクトルピークを構成することにより、パラメータから得られる各周波数に対応する孤立ピーク群を構成する。このように、理論形式では有限離散値を扱うコンピュータで構成することができない線スペクトル列となる時系列データのスペクトルを、ピーク周波数から離れるに従って急減する連続関数、例えば余弦函数に微弱な雑音を加えた時系列をラグ2にて最大エントロピー法のスペクトル密度の計算を行って得られたスペクトルをδ函数の原型として利用して再構成することにより、コンピュータを利用して、理論と整合する原時系列データの再構成スペクトルを求めることができる。   In this case, the isolated peak sequence (P1 ... Pj ... PL) uses the prototype of the δ function to form one spectral peak that spreads in the entire frequency band, and thus the isolated peak corresponding to each frequency obtained from the parameters. Construct a peak group. In this way, the time series data spectrum, which is a line spectrum sequence that cannot be configured by a computer that handles finite discrete values in the theoretical form, adds a faint noise to a continuous function that rapidly decreases as it goes away from the peak frequency, such as a cosine function. By using the computer to reconstruct the spectrum obtained by calculating the spectral density of the maximum entropy method at lag 2 using lag 2 as the prototype of the δ function, A reconstructed spectrum of sequence data can be obtained.

一方、残差時系列データεx(t)については、ステップS204において、最大エントロピー法のスペクトル密度(MEM-PSD)の計算を行い、得られたスペクトル密度と、ステップS203で得られた孤立ピーク列をステップS205において重畳して合成することにより、再構成スペクトルが計算される。   On the other hand, for the residual time series data εx (t), the spectral density (MEM-PSD) of the maximum entropy method is calculated in step S204, and the obtained spectral density and the isolated peak sequence obtained in step S203 are calculated. Are superimposed and combined in step S205 to calculate a reconstructed spectrum.

次に図9はセグメント解析結果構成手段9bにより利用されている場合の再構成スペクトル計算手段6と頂位位相推移計算手段7の動作を説明する模式的流れ図である。   Next, FIG. 9 is a schematic flowchart for explaining the operations of the reconstructed spectrum calculating means 6 and the top phase transition calculating means 7 when used by the segment analysis result constituting means 9b.

まずステップS301では、基本セグメントに対応する記憶領域1〜2Nのいずれかが選択され、それに記憶されている、対応する基本セグメントの代表時刻、パラメータ、残差データが取り出される。最初は最も早い代表時刻の記憶領域1の記憶内容が取り出され、次いで後述する繰り返し処理により、順次、時間が経過した基本セグメントに対応する記憶領域の内容が取り出されて、全ての記憶領域の内容が取り出される。   First, in step S301, one of the storage areas 1 to 2N corresponding to the basic segment is selected, and the representative time, parameters, and residual data of the corresponding basic segment stored therein are extracted. First, the storage contents of the storage area 1 of the earliest representative time are taken out, and then the contents of the storage areas corresponding to the basic segments whose time has passed are sequentially taken out by the repetitive processing described later, and the contents of all the storage areas Is taken out.

取り出された記憶領域のデータ中、パラメータ(振幅aj及び周期Tj)と残差時系列データεx(t)は再構成スペクトル計算手段6に入力され、またパラメータ(周期Tj及び頂位位相φj)は頂位位相推移計算手段7に入力されて処理に供される。   Among the extracted data in the storage area, the parameters (amplitude aj and period Tj) and residual time series data εx (t) are input to the reconstruction spectrum calculation means 6, and the parameters (period Tj and top phase φj) are It is input to the top phase shift calculation means 7 and used for processing.

再構成スペクトル計算手段6に入力されたパラメータ(振幅aj及び周期Tj)は、一括解析結果構成手段9aにより利用されている場合の上述したステップS202の振幅の規格化の処理は行われず、ステップS203と同様に、ステップS302において、中心周波数1/Tjにピークをもつ孤立ピーク列Pj、即ち図に示される孤立ピーク列( P1 … Pj … PL )を構成する。   The parameters (amplitude aj and period Tj) input to the reconstructed spectrum calculation unit 6 are not subjected to the above-described amplitude normalization process in step S202 when used by the collective analysis result configuration unit 9a, and step S203 is performed. Similarly to step S302, an isolated peak train Pj having a peak at the center frequency 1 / Tj, that is, an isolated peak train (P1... Pj... PL) shown in FIG.

一方、残差時系列データεx(t)については、ステップS303において、最大エントロピー法のスペクトル密度(MEM-PSD)の計算を行い、得られたスペクトル密度と、ステップS302で得られた孤立ピーク列をステップS304において合成することにより、再構成スペクトルが計算される。   On the other hand, for the residual time series data εx (t), the spectral density (MEM-PSD) of the maximum entropy method is calculated in step S303, and the obtained spectral density and the isolated peak sequence obtained in step S302 Are synthesized in step S304, a reconstructed spectrum is calculated.

一方、頂位位相推移計算手段7に入力されたパラメータ(周期Tj及び頂位位相φj)は、ステップS305において解析されて、周波数と頂位位相との対応関係から、基本セグメントの代表時刻に対する頂位位相の周波数依存が得られる。   On the other hand, the parameters (period Tj and top phase φj) input to the top phase transition calculation means 7 are analyzed in step S305, and the peak time relative to the representative time of the basic segment is determined from the correspondence between the frequency and the top phase. The frequency dependence of the phase is obtained.

これらの得られた解析結果は、ステップS306において所定の記録領域に、基本セグメントの代表時刻の属性として記録される。   These obtained analysis results are recorded in the predetermined recording area as attributes of the representative time of the basic segment in step S306.

次いでステップS308では、全ての基本セグメントに対応する記憶領域のデータが解析されたか否かが判定され、解析されていない記憶領域が残っている場合には、結合子Bを経てステップS301に移行して、次の記憶領域の解析が行われる。一方、ステップS308において、全ての基本セグメントに対応する記憶領域のデータが解析されている場合には、終了処理が行われる。   Next, in step S308, it is determined whether or not the data in the storage area corresponding to all the basic segments has been analyzed. If a storage area that has not been analyzed remains, the process proceeds to step S301 via the connector B. Thus, the next storage area is analyzed. On the other hand, if the data in the storage area corresponding to all the basic segments has been analyzed in step S308, an end process is performed.

次に以上に説明した本発明の解析装置の動作を具体例につき説明する。
解析する時系列データは、図10に示すもので、データは48時間201点の時系列データである。図から分かるように、24時間モードは、時刻24時においてその位相を反転させている。
Next, the operation of the analysis apparatus of the present invention described above will be described with reference to a specific example.
The time-series data to be analyzed is shown in FIG. 10, and the data is time-series data of 48 points and 201 points. As can be seen from the figure, in the 24-hour mode, the phase is inverted at 24:00.

まず図10に示される時系列データが解析装置1に入力されると、解析シーケンス決定手段2は上述したように図3、図4に示される処理過程を経て解析シーケンスを決定する。   First, when the time-series data shown in FIG. 10 is input to the analysis apparatus 1, the analysis sequence determination means 2 determines the analysis sequence through the processing steps shown in FIGS. 3 and 4 as described above.

この解析装置1では、演算処理の精度上、例えば最大データ点数が300点に設定されているとすると、入力された原時系列データのデータ点数は201点であり、原時系列データのデータ点数が最大データ点数以下であるため、図3のステップS3を経て、レイヤーは一層のみ設定され、このレイヤーに一つのセグメントが配置される。   In the analysis apparatus 1, if the maximum number of data points is set to 300, for example, for accuracy of arithmetic processing, the number of data points of the input original time series data is 201 points, and the number of data points of the original time series data is Is less than the maximum number of data points, and through step S3 in FIG. 3, only one layer is set, and one segment is arranged in this layer.

次いでステップS6において、原系列データの全期間データがセグメントに取り込まれる。次いでステップS7において、最大ラグ値(200点)までバーグの係数Pmの推移が計算される。図11が係数Pmの推移を示すものである。   Next, in step S6, the whole period data of the original series data is taken into the segment. Next, in step S7, the transition of the Burg coefficient Pm is calculated up to the maximum lag value (200 points). FIG. 11 shows the transition of the coefficient Pm.

次いでステップS8において係数Pmの挙動が解析される。まず、最初と最後の係数Pmの比が計算され、その結果、それが10桁を超えるために「周期性の強いデータである」と判断される。   Next, in step S8, the behavior of the coefficient Pm is analyzed. First, the ratio of the first coefficient Pm and the last coefficient Pm is calculated. As a result, since it exceeds 10 digits, it is determined that the data is “strongly periodic”.

次いで解析シーケンス決定手段2は、係数Pmの推移を解析し、通常、係数Pmは最初急激に減少したのちに最大ラグ値まで漸減するのに対して、入力された原時系列データでは、ラグ値3〜100(対応するデータ点数は4〜101点)の領域で殆ど係数Pmが減少せず、直後に急激に減少して、その後最大ラグ値ちかくまで再びプラトー領域を形成することから、101点を超える付近でデータ構造が変化していることを検出する。   Next, the analysis sequence determination means 2 analyzes the transition of the coefficient Pm. Normally, the coefficient Pm gradually decreases to the maximum lag value after first rapidly decreasing, whereas in the input original time series data, the lag value The coefficient Pm hardly decreases in the region of 3 to 100 (corresponding data points are 4 to 101 points), decreases rapidly immediately afterwards, and then forms a plateau region again until the maximum lag value, so 101 points Detect that the data structure has changed in the vicinity of.

従って解析シーケンス決定手段2は、ステップS11の処理に移行し、サブレイヤーを構成し、データ構造の変化している個所において2分割したセグメントを構成する。   Therefore, the analysis sequence determination means 2 moves to the process of step S11, constitutes a sublayer, and constitutes a segment divided into two at locations where the data structure is changed.

次いでステップS6に移行して、ステップS11において分割されたセグメントの夫々につき、順次ステップS8により、データ構造の均一性を評価する。   Next, the process proceeds to step S6, and the uniformity of the data structure is sequentially evaluated in step S8 for each of the segments divided in step S11.

尚、分割されたサブレイヤーのセグメントの境界にデータが位置しているため、このデータは隣接するセグメントに重複して取り込まれ、結果としてサブレイヤーの各セグメントのデータ点数は、いずれも101点となる。   In addition, since the data is located at the boundary of the segment of the divided sublayer, this data is duplicated and captured in the adjacent segment. As a result, the data score of each segment of the sublayer is 101 points. Become.

まず時間が早い方のセグメントデータについてのステップS8の評価において、係数Pmの推移を計算すると図12に示すように推移し、係数Pmの値はラグ値0から7までで14桁ほど減衰し、上述したようなプラトー領域での急激な減衰領域の存在を検出しない。従って解析シーケンス決定手段2は、ステップS9において、このセグメントを基本セグメントとして設定する。ステップS10からステップS6を経て、時間が遅い方のセグメントデータについても同様な評価がなされ、このセグメントについてもステップS9において基本セグメントとして設定する。   First, in the evaluation of step S8 for the segment data with the earlier time, the change of the coefficient Pm is calculated as shown in FIG. 12, and the value of the coefficient Pm is attenuated by 14 digits from the lag value 0 to 7, The presence of the abrupt attenuation region in the plateau region as described above is not detected. Therefore, the analysis sequence determination means 2 sets this segment as a basic segment in step S9. The same evaluation is performed for the segment data having a later time through steps S10 to S6, and this segment is also set as a basic segment in step S9.

次いで、ステップS10において評価が完了と判定され、ステップS12に移行して、ステップS9において基本セグメントとして設定された全てのセグメントに対応して、記憶手段に記憶領域が設定され、初期化がされて、解析シーケンスが完成する。尚、記憶領域の初期化において、それに対応する基本セグメントがステップS8において「極めて周期性が強い」と判断された場合には、記憶領域にその情報が書き込まれる。   Next, in step S10, it is determined that the evaluation is complete, the process proceeds to step S12, and a storage area is set in the storage means and initialized in correspondence with all the segments set as basic segments in step S9. The analysis sequence is completed. In the initialization of the storage area, when it is determined that the corresponding basic segment is “very periodic” in step S8, the information is written in the storage area.

図13は解析シーケンス決定手段2が決定したレイヤーとセグメントの構成を模式的に示すものであり、レイヤーは、時系列データの全期間に対応する一つのセグメント1が配置されるレイヤー0の下位に、サブレイヤー1が構成され、このサブレイヤー1の2つのセグメントが基本セグメント1、2として設定されている。そしてこれらの基本セグメント1、2に対応して記憶手段に記憶領域1、2が設定されている。   FIG. 13 schematically shows the structure of the layers and segments determined by the analysis sequence determination means 2, and the layers are located below layer 0 where one segment 1 corresponding to the entire period of the time-series data is arranged. Sublayer 1 is configured, and two segments of this sublayer 1 are set as basic segments 1 and 2. In correspondence with these basic segments 1 and 2, storage areas 1 and 2 are set in the storage means.

次いでデータ解析手段3は、図6の流れ図に示す処理過程により各セグメントの解析を行う。この実施例においては、まず最初にレイヤー0のセグメントについてセグメント解析が実行されるが、レイヤー0のセグメント1が含むサブレイヤーの2つの基本セグメント1、2はともに極めて周期性の強いデータであると判別されていることから、このレイヤー0のセグメントの解析は省略することができるが、以降の説明では、レイヤー0のセグメント1についても解析を行うものとしている。   Next, the data analysis means 3 analyzes each segment by the process shown in the flowchart of FIG. In this embodiment, segment analysis is first performed on the segment of layer 0, but the two basic segments 1 and 2 of the sublayer included in segment 1 of layer 0 are both extremely periodic data. Since it is determined, the analysis of the segment of layer 0 can be omitted. However, in the following description, the analysis of the segment 1 of layer 0 is also performed.

まずデータ解析手段3は、ステップS101においてセグメント1に原時系列データの対応するデータを取り込んでセグメントデータとする。この実施例においては、このセグメント1のデータは、原時系列データそのもので、201点のデータ点数を有している。   First, the data analysis means 3 takes in the data corresponding to the original time series data into the segment 1 in step S101 and sets it as segment data. In this embodiment, the data of segment 1 is original time series data itself and has 201 data points.

ここでステップS102において、最大エントロピー法のスペクトル密度(MEM-PSD)の計算を最小ラグ値から最大ラグ値まで行い、夫々のラグ値に対するバーグの係数Pmの推移を算出する。この実施例においては、同様の計算を解析シーケンス決定手段2において行って、図11に示されるような結果を得ているので、本発明の解析装置1において、実行された計算を適宜期間保持するように構成することにより、再計算を行う必要がなくなる。   Here, in step S102, the spectral density (MEM-PSD) of the maximum entropy method is calculated from the minimum lag value to the maximum lag value, and the transition of the Burg coefficient Pm with respect to each lag value is calculated. In this embodiment, the same calculation is performed in the analysis sequence determination means 2 to obtain a result as shown in FIG. 11, so that the executed calculation is appropriately held for a period in the analysis apparatus 1 of the present invention. Such a configuration eliminates the need for recalculation.

次いでステップS103において、図11に示される推移から特徴的な挙動を示すラグ値を複数選択する。図11において最大の特徴はラグ値2〜101のプラトー領域の存在で、周期性の強いデータなので、データ解析手段3は、自体に構成している知識ベース等を利用した選択手段により、小さめのラグ値を選択することとし、例えばラグ値2・50・101の3つのラグ値を選択し、ステップS104において、これらのラグ値に対応する3つのMEM-PSDを計算する。その結果は、図14に示すとおりであり、左から順にラグ値2・50・101での結果を示す。   Next, in step S103, a plurality of lag values indicating characteristic behavior are selected from the transition shown in FIG. In FIG. 11, the greatest feature is the presence of a plateau region with a lag value of 2 to 101, which is highly periodic data. Therefore, the data analysis means 3 is reduced by a selection means using a knowledge base or the like that is configured in itself. For example, three lag values of lag values 2, 50, and 101 are selected, and in step S104, three MEM-PSDs corresponding to these lag values are calculated. The results are as shown in FIG. 14, and the results with lag values of 2, 50, and 101 are shown in order from the left.

次いでステップS105では、主要ピークとしてラグ値2では周期の初期値24.66時間(パワー49.80)、ラグ値50では28.06時間(同49.76)、ラグ値101では2モードで34.48時間(同29.81)と18.63時間(同17.31)を抽出し、これを次の非線形最小自乗法による計算の初期値とする。   Next, in step S105, as the main peak, the initial value of the period is 24.66 hours (power 49.80) at lag value 2; 28.06 hours (49.76) at lag value 50; 34.48 hours (29.81) and 18.63 hours at lag value 101 in 2 modes. (31.31) is extracted and used as the initial value of the calculation by the following nonlinear least square method.

次いでステップS106において、上述した3組の初期値に対して非線形最小自乗法により、夫々の場合の最適当てはめ曲線と曲線パラメータの探索が行われる。この場合、非線形最小自乗法解析においては、初期値の周期の近傍に周期値を探索する領域をあらかじめ設定し、初期値が真の値の近傍にあること、およびその近傍で残差自乗和が唯一の極小値を持つことを期待して計算が行われる。   Next, in step S106, the optimum fitting curve and the curve parameter in each case are searched for by the nonlinear least square method with respect to the above three sets of initial values. In this case, in the non-linear least squares analysis, a region for searching for the period value is set in the vicinity of the period of the initial value in advance, the initial value is in the vicinity of the true value, and the residual sum of squares is in the vicinity. Calculations are performed in the hope of having only one local minimum.

即ち、ステップS106においては、探索過程を監視し、探索中に近傍領域から逸脱する場合や、複数の極小値をもつ場合には、初期値そのものが不適切であると判定して、その結果を使用しない。そこで、ラグ値2と50の初期値は不適切であると判定され、唯一、ラグ値101の初期値に対してのみ計算結果を使用するものとして、最適あてはめ曲線とその曲線パラメータが算出される。図15(a)は算出された最適あてはめ曲線であり、また(b)は原時系列データとの残差曲線を示すものである。   That is, in step S106, the search process is monitored, and when the departure from the neighboring region is made during the search or when there are a plurality of minimum values, it is determined that the initial value itself is inappropriate, and the result is obtained. do not use. Therefore, it is determined that the initial values of the lag values 2 and 50 are inappropriate, and the optimal fitting curve and its curve parameters are calculated only using the calculation result for the initial value of the lag value 101. . FIG. 15A shows the calculated optimum fitting curve, and FIG. 15B shows a residual curve with the original time series data.

次いでステップS107においては、当てはめ曲線のパラメータを、初期値と比較して一致度を評価して、ステップS106で算出した最適あてはめ曲線の妥当性が判定される。即ち、図16は、上記初期値のピーク周波数の逆数とパワーを、最終的に得られた曲線パラメータの周期・振幅とを比較したものである。尚、この場合、図中に示す一致度とは、上述したとおり、モードのパワー(振幅の自乗の1/2)をピークパワーで除した値としている。   Next, in step S107, the matching curve parameter is compared with an initial value to evaluate the degree of coincidence, and the validity of the optimum fitting curve calculated in step S106 is determined. That is, FIG. 16 compares the reciprocal of the peak frequency of the initial value and the power with the period and amplitude of the curve parameter finally obtained. In this case, the degree of coincidence shown in the figure is a value obtained by dividing the mode power (1/2 of the square of the amplitude) by the peak power, as described above.

図16から分かるように、一致度は36時間モードでは0.967、18時間モードでは0.803となる。18時間モードの一致度は余り高くないが、ステップS106において算出された唯一の最適あてはめ曲線とそのパラメータであるので、データ解析手段3は、その結果を、ステップS109、即ち、解析結果評価手段4による評価の処理過程に出力する。   As can be seen from FIG. 16, the degree of coincidence is 0.967 in the 36-hour mode and 0.803 in the 18-hour mode. Although the degree of coincidence in the 18-hour mode is not so high, since it is the only optimum fitting curve calculated in step S106 and its parameter, the data analysis means 3 gives the result to step S109, that is, the analysis result evaluation means 4 Output to the process of evaluation by.

まずステップS112においては、ステップS106〜S108を経て得られた最適あてはめ曲線が再構成され、そのデータ期間に対応する原時系列データとの差の演算を行い、残差曲線を求めると共に、当てはめ曲線の再現性を評価する諸量、ここでは標準偏差と残差パワーの時間依存が求められる。   First, in step S112, the optimum fitting curve obtained through steps S106 to S108 is reconstructed, the difference with the original time series data corresponding to the data period is calculated, a residual curve is obtained, and the fitting curve is obtained. The amount of evaluation of the reproducibility of the image, here, the time dependence of the standard deviation and the residual power is required.

図17は原時系列データ(点線)と最適あてはめ曲線(実線)とを比較したもの、また図18は残差曲線を、20個の区分領域毎に平均したものである。残差の標準偏差は0.836と大きく、また図16から、一見して当てはめが良好でないことが分かる。そして図18から、残差はゼロの回りに一様に分布しておらず、時間依存性が認められる。   FIG. 17 compares the original time series data (dotted line) and the optimum fitting curve (solid line), and FIG. 18 shows the average of the residual curve for each of the 20 segment areas. The standard deviation of the residual is as large as 0.836, and it can be seen from FIG. 16 that the fit is not good. And from FIG. 18, the residual is not uniformly distributed around zero, and time dependence is recognized.

このような標準偏差の値の大小や、残差の時間依存性等から、データ解析手段3は、ステップS113において、最適当てはめ曲線と、原時系列データの対応部分が十分に一致していないと判定し、ステップS115に移行する。即ち、それまでの解析対象であったレイヤー0のセグメント1のセグメントデータは、そのまま次のレイヤー1のセグメント1、2の解析対象データとして繰り越して設定される。   Due to the magnitude of the standard deviation value, the time dependency of the residual, and the like, the data analysis unit 3 determines that the optimum fitting curve and the corresponding portion of the original time series data do not sufficiently match in step S113. Determination is made and the process proceeds to step S115. That is, the segment data of segment 1 of layer 0, which has been the object of analysis up to that point, is carried forward as it is as analysis object data of segments 1 and 2 of the next layer 1.

尚、上述したとおり、原時系列データのデータ点数をバンチング処理により低減してセグメントデータを構成する場合には、下位のレイヤーのセグメントに設定するデータは、必ずしも上位のレイヤーのセグメントデータと同一でなくとも良い。   As described above, when the segment data is configured by reducing the number of data points of the original time series data by bunching processing, the data set for the segment of the lower layer is not necessarily the same as the segment data of the upper layer. Not necessary.

次いでデータ解析手段3は、ステップS109からステップS110を経て、ステップS101に移行し、次にサブレイヤー1の基本セグメント1、2の解析が順次行われる。   Next, the data analysis means 3 goes from step S109 to step S110 to step S101, and then the basic segments 1 and 2 of the sublayer 1 are sequentially analyzed.

まず基本セグメント1については、ステップS101においてセグメントデータとして原時系列データの1〜101点までのデータが取り込まれる。   First, for basic segment 1, data of 1 to 101 points of original time series data is fetched as segment data in step S101.

次いでステップS102における計算により、図12に示すような係数Pmの推移が得られる。尚、この場合には、数値演算精度のためにラグ値7までの推移が求められる。   Next, the transition of the coefficient Pm as shown in FIG. 12 is obtained by the calculation in step S102. In this case, the transition to the lag value 7 is required for the accuracy of numerical calculation.

次いでステップS103では、ラグ値として3と7の二つが決定され、ステップS104において決定されたラグ値でMEM-PSDが計算される。その結果は、図19に示すとおりであり、左から順にラグ値とラグ値7の結果である。   Next, in step S103, two of 3 and 7 are determined as lag values, and MEM-PSD is calculated with the lag value determined in step S104. The result is as shown in FIG. 19 and is a result of the lag value and the lag value 7 in order from the left.

次いでステップS105では、ラグ値2では初期周期値24.00時間(パワー49.66)を、ラグ値7では初期周期値24.00時間(同50.14)が抽出され、これらの二組の初期値を用いて、ステップS106において非線形最小自乗法により二本の最適あてはめ曲線と曲線パラメータが算出される。この場合には、いずれも周期24.00時間、振幅10.00、頂位位相6.00時が得られる。   Next, in step S105, an initial period value of 24.00 hours (power 49.66) is extracted with a lag value of 2, and an initial period value of 24.00 hours (50.14) is extracted with a lag value of 7, using these two sets of initial values, step S106. The two optimum fitting curves and curve parameters are calculated by the nonlinear least square method. In this case, a period of 24.00 hours, an amplitude of 10.00, and a top phase of 6.00 are obtained.

次いでステップS107では、上述した複数の曲線パラメータの組が比較されるのであるが、この実施例では、いずれのパラメータも一致し、且つ当てはめも良好であるので、その最適当てはめ曲線と、そのパラメータがステップS108を経てステップS109に入力される。   Next, in step S107, the plurality of curve parameter sets described above are compared. In this embodiment, since all the parameters match and the fit is good, the optimum fit curve and its parameters are It inputs into step S109 through step S108.

ステップS112において得られる残差の標準偏差は、10−10と十分に小さく、且つ、残差のパワー推移に時間依存がないため、ステップS113において、今度は、最適当てはめ曲線と、原時系列データの対応部分が十分に一致していると判定し、ステップS114に移行する。 Since the standard deviation of the residual obtained in step S112 is sufficiently small as 10 −10 and the power transition of the residual is not time-dependent, in step S113, this time, the optimum fitting curve and the original time series data Are determined to match sufficiently, and the process proceeds to step S114.

ステップS114においては、解析結果のパラメータを記憶領域1に保存する。尚、この実施例と異なり、下位に更にサブレイヤーがある場合には、残差が計算されて、それを下位のサブレイヤーに設定するべく保存がされる。   In step S114, the parameter of the analysis result is stored in the storage area 1. Unlike this embodiment, if there are further sublayers in the lower layer, the residual is calculated and saved to set it in the lower sublayer.

次いでステップS110を経て、ステップS101に移行して、次の基本セグメント2についても同様な解析処理が行われ、こうして、記憶領域1、2に、原時系列データを一般化三角多項式で記述し、且つ、以降の解析に必要な諸量の全てが蓄積される。   Subsequently, the process proceeds to step S101 through step S110, and the same analysis processing is performed for the next basic segment 2, and thus the original time series data is described in the storage areas 1 and 2 by a generalized trigonometric polynomial, In addition, all the quantities necessary for the subsequent analysis are accumulated.

そして記憶領域1、2に蓄積されている原時系列データの解析に必要な諸量は、上述したとおり、一括解析結果構成手段9aまたはセグメント解析結果構成手段9bにより処理されて、図2に示すような解析結果11を構成することができる。   Then, as described above, various quantities necessary for the analysis of the original time series data stored in the storage areas 1 and 2 are processed by the collective analysis result construction unit 9a or the segment analysis result construction unit 9b, as shown in FIG. Such an analysis result 11 can be configured.

一例として、一括解析結果構成手段9aにより利用されている場合の再構成スペクトル計算手段6による再構成スペクトルの算出の流れを説明する。
まず図8において、ステップS201では、記憶領域1と2からパラメータ(一般化三角多項式のパラメータ)を取り出される。この際、取り出されたパラメータは2つで、いずれも周期24時・振幅10・頂位位相6時である。
次いでステップS202で振幅が規格化される。この規格化は、2つのパラメータそれぞれについて、振幅の自乗=100を基本セグメント数(=2)で割って、その平方根(=√50)をあらたな振幅とすることで行われる。
次いでステップS203における孤立ピークのPSDの計算により、同じピーク周波数(=1/24時間)をもつ二つのピークスペクトルが得られる。この孤立ピークの計算は、あらかじめ三角関数のMEM-PSDを求めておき、その面積を各モードのパワーに一致させる規格化により実現する。図20は求めた余弦関数のMEM-PSDを示している。
このように本発明では、孤立ピーク列は、δ函数の原型を用いて全周波数帯に裾の広がる夫々一つのスペクトルピークを構成することにより、パラメータから得られる各周波数に対応する孤立ピーク群を構成するもので、こうして理論形式では有限離散値を扱うコンピュータで構成することができない線スペクトル列となる時系列データのスペクトルを、ピーク周波数から離れるに従って急減する連続関数、例えば余弦函数に微弱な雑音を加えた時系列をラグ2にて最大エントロピー法のスペクトル密度の計算を行って得られたスペクトルをδ函数の原型として利用して再構成することにより、コンピュータを利用して、理論と整合する原時系列データの再構成スペクトルを求めることができる。
一方、各記憶領域1、2から取り出された基本セグメント1、2の残差成分から全測定長にわたる残差曲線を求め、次いでステップS204において、残差のMEM-PSDが計算される。次いで、ステップS205において、孤立ピーク群のスペクトルと残差のMEM-PSDとが重畳されて、最終的に原時系列データの一般化三角多項式表現と整合する再構成スペクトルが得られる。
As an example, the flow of calculation of the reconstructed spectrum by the reconstructed spectrum calculating means 6 when used by the collective analysis result configuring means 9a will be described.
First, in FIG. 8, in step S201, parameters (generalized triangular polynomial parameters) are extracted from the storage areas 1 and 2. At this time, two parameters are taken out, each of which has a period of 24 o'clock, an amplitude of 10 and an apex phase of 6 o'clock.
Next, in step S202, the amplitude is normalized. This normalization is performed by dividing the square of amplitude = 100 by the number of basic segments (= 2) and setting the square root (= √50) to a new amplitude for each of the two parameters.
Next, two peak spectra having the same peak frequency (= 1/24 hours) are obtained by calculating the PSD of the isolated peak in step S203. The calculation of the isolated peak is realized by normalizing a trigonometric MEM-PSD in advance and matching the area with the power of each mode. FIG. 20 shows the obtained cosine function MEM-PSD.
As described above, in the present invention, the isolated peak sequence is formed by using one prototype of the δ function to form one spectral peak having a base extending over the entire frequency band, thereby obtaining an isolated peak group corresponding to each frequency obtained from the parameters. In this way, the spectrum of time series data, which is a line spectrum sequence that cannot be configured by a computer that handles finite discrete values in the theoretical form, is a continuous function that rapidly decreases as it goes away from the peak frequency, for example, noise that is weak to cosine function By using the computer to reconstruct the spectrum obtained by calculating the spectral density of the maximum entropy method at lag 2 using lag 2, and using the computer as a prototype, it is consistent with the theory. A reconstructed spectrum of the original time series data can be obtained.
On the other hand, a residual curve over the entire measurement length is obtained from the residual components of the basic segments 1 and 2 extracted from the storage areas 1 and 2, and then in step S204, the residual MEM-PSD is calculated. Next, in step S205, the isolated peak group spectrum and the residual MEM-PSD are superimposed to finally obtain a reconstructed spectrum that matches the generalized triangular polynomial representation of the original time series data.

以上に説明したように、本発明に係る解析装置は、実在の時系列データに対して、時間軸上での一般化三角多項式表現と周波数軸上での再構成スペクトル表現を機械的に計算する。このとき、時系列データ・一般化三角多項式表現・再構成スペクトル表現それぞれの間には、コンピュータ上に構築された数値演算処理システムの能力の制限の元で、理論上の整合性が完全に保証される。すなわち、任意の実データに対して時間軸上および周波数軸上のもっとも整合的で透徹した理解が機械的に得られる。   As described above, the analysis apparatus according to the present invention mechanically calculates the generalized trigonometric polynomial expression on the time axis and the reconstructed spectrum expression on the frequency axis for real time series data. . At this time, the theoretical consistency between the time series data, generalized trigonometric polynomial expression, and reconstructed spectrum expression is completely guaranteed under the limitations of the numerical processing system built on the computer. Is done. That is, the most consistent and transparent understanding on the time axis and the frequency axis can be mechanically obtained for arbitrary actual data.

また、本発明に係る解析装置では、何らの数値モデルも想定せず、時系列データのみを用いて高精度の解析を行え、しかもその解析は、通常のパーソナルコンピュータ程度の演算能力でも十分に実用的であるという効果があり、特に、解析対象の時系列データを、そのデータ点数やデータ構造に応じて適切にセグメント化して処理を行うことにより、解析する時系列データによらず、常に適切に高精度な解析を行えるという格別なる効果がある。   In addition, the analysis apparatus according to the present invention can perform high-precision analysis using only time-series data without assuming any numerical model, and the analysis is sufficiently practical even with a computation capability comparable to that of a normal personal computer. In particular, the time series data to be analyzed is appropriately segmented according to the number of data points and the data structure and processed, so that it is always appropriate regardless of the time series data to be analyzed. There is a special effect that high-precision analysis can be performed.

そして、本発明は、実在の時系列データ、即ち、ある限られた期間に観測されたある点数の有限長離散時系列のデータに加えて、例えば地層断面の距離に対する輝度変化等の、空間的に連続するデータの解析にも利用できるものである。   In addition to real time-series data, that is, finite-length discrete time-series data of a certain number of points observed in a certain limited period, the present invention provides spatial data such as a change in brightness with respect to the distance of the geological section. It can also be used for analysis of continuous data.

本発明に係る解析装置の実施の形態を模式的に表した全体構成の説明図本である。It is explanatory drawing of the whole structure which represented typically the embodiment of the analyzer which concerns on this invention. 本発明に係る解析装置から出力される解析結果を模式的に示すものである。The analysis result output from the analyzer which concerns on this invention is shown typically. 解析シーケンス決定手段における処理の流れを示す流れ図である。It is a flowchart which shows the flow of the process in an analysis sequence determination means. 解析シーケンス決定手段における処理の流れを示す流れ図である。It is a flowchart which shows the flow of the process in an analysis sequence determination means. 解析シーケンス決定手段により決定されたレイヤーとセグメントの構成例を模式的に示すものである。3 schematically shows an example of the structure of layers and segments determined by an analysis sequence determination unit. データ解析手段における各セグメントの解析処理の流れ図である。It is a flowchart of the analysis process of each segment in a data analysis means. 解析結果評価手段における各セグメントの解析処理の流れ図である。It is a flowchart of the analysis process of each segment in an analysis result evaluation means. 一括解析結果構成手段により利用されている場合の再構成スペクトル計算手段の動作を説明する模式的流れ図である。It is a typical flowchart explaining operation | movement of the reconstruction spectrum calculation means when it is utilized by the collective analysis result structure means. セグメント解析結果構成手段により利用されている場合の再構成スペクトル計算手段と頂位位相推移計算手段の動作を説明する模式的流れ図である。It is a typical flowchart explaining operation | movement of the reconstruction spectrum calculation means when used by the segment analysis result structure means, and a top phase transition calculation means. 解析する時系列データの一例を示す説明図である。It is explanatory drawing which shows an example of the time series data to analyze. バーグの係数Pmの推移を示す説明図である。It is explanatory drawing which shows transition of the coefficient Pm of Burg. サブレイヤーの時間が早いほうのセグメントデータについてのバーグの係数Pmの推移を示す説明図である。It is explanatory drawing which shows transition of the Berg coefficient Pm about the segment data whose sublayer time is earlier. 決定されたレイヤーとセグメントの構成を模式的に示す説明図である。It is explanatory drawing which shows typically the structure of the determined layer and segment. 3つのラグ値に対応して計算された3つのMEM-PSDの一部を示す説明図である。It is explanatory drawing which shows a part of three MEM-PSD calculated corresponding to three lag values. (a)は算出された最適あてはめ曲線、(b)は原時系列データとの残差曲線を示す説明図である。(A) is the calculated optimal fitting curve, (b) is explanatory drawing which shows a residual curve with original time series data. 初期値のピーク周波数の逆数とパワーを、最終的に得られた曲線パラメータの周期・振幅とを比較した説明図である。It is explanatory drawing which compared the reciprocal number and power of the peak frequency of an initial value with the period and amplitude of the curve parameter finally obtained. 原時系列データ(点線)と最適あてはめ曲線(実線)とを比較した説明図である。It is explanatory drawing which compared the original time series data (dotted line) and the optimal fitting curve (solid line). 残差曲線を、20個の区分領域毎に平均して示す説明図である。It is explanatory drawing which averages a residual curve for every 20 division area. 2つのラグ値に対応して計算された2つのMEM-PSDを示す説明図である。It is explanatory drawing which shows two MEM-PSD calculated corresponding to two lag values. δ函数の原型として利用する、余弦関数のMEM-PSDを示す説明図である。It is explanatory drawing which shows MEM-PSD of a cosine function utilized as a prototype of (delta) function.

符号の説明Explanation of symbols

1 解析装置
2 解析シーケンス決定手段
3 データ解析手段
4 解析結果評価手段
5 制御手段
6 再構成スペクトル計算手段
7 頂位位相推移計算手段
8 その他計算手段
9a 一括解析結果構成手段
9b セグメント解析結果構成手段
10 一括解析結果
11 セグメント解析結果
DESCRIPTION OF SYMBOLS 1 Analysis apparatus 2 Analysis sequence determination means 3 Data analysis means 4 Analysis result evaluation means 5 Control means 6 Reconstructed spectrum calculation means 7 Top phase transition calculation means 8 Other calculation means 9a Collective analysis result construction means 9b Segment analysis result construction means 10 Batch analysis result 11 Segment analysis result

Claims (20)

解析対象の時系列データを解析するシーケンスを決定する解析シーケンス決定手段と、解析シーケンスに従い、最大エントロピー法及び非線形最小自乗法によりデータを解析して一般化三角多項式のパラメータと残差を求めるデータ解析手段と、データ解析手段により求めた解析結果を評価し、条件に適合する場合に記憶手段に記憶する解析結果評価手段と、上記パラメータから得られるパワースペクトル密度と最大エントロピー法を用いて求める残差のパワースペクトル密度を合成して時系列データの再構成スペクトルを求める再構成スペクトル計算手段と、この計算手段を利用して、上記記憶手段から取り出した上記パラメータと残差により、解析対象の時系列データに対応する一般化三角多項式を再構成する解析結果構成手段とを備え、解析シーケンス決定手段は、解析対象の時系列データを、予め設定された最大データ点数を越えないようにセグメントに分割する分割処理過程と、各セグメントに対してデータ構造の均一性を評価する評価処理過程と、この評価に基づき、不均一のセグメントデータを均一の複数のセグメントに分割する分割処理過程と、分割された均一のセグメントの夫々を基本セグメントとして、それらに対して、記憶手段に記憶領域を設定する記憶領域設定処理過程を備えていることを特徴とする時系列データの解析装置。 Analysis sequence determination means for determining the sequence for analyzing the time series data to be analyzed, and data analysis for determining parameters and residuals of generalized trigonometric polynomials by analyzing the data by the maximum entropy method and nonlinear least square method according to the analysis sequence And an analysis result evaluation means for evaluating the analysis result obtained by the data analysis means and storing it in the storage means when the condition is met, and a residual obtained by using the power spectral density obtained from the above parameters and the maximum entropy method A reconstructed spectrum calculating means for obtaining a reconstructed spectrum of time series data by synthesizing the power spectral density of the data, and using this calculating means, the time series to be analyzed is calculated from the parameters and residuals extracted from the storing means. And an analysis result construction means for reconstructing a generalized trigonometric polynomial corresponding to the data The analysis sequence determination means includes a division process for dividing the time-series data to be analyzed into segments so as not to exceed a preset maximum number of data points, and an evaluation process for evaluating the uniformity of the data structure for each segment And a division process for dividing the non-uniform segment data into a plurality of uniform segments based on the evaluation, and each of the divided uniform segments as a basic segment, and a storage area in the storage means. A time-series data analysis apparatus comprising a storage area setting process for setting the time series data. セグメントは、解析対象の時系列データの全期間データに対応する最上位レイヤーのセグメントから、順次2分割されて構成される、下位のレイヤーの夫々に含まれる2の累乗のセグメントと、最下位のレイヤーにおいて、データ構造が変化するセグメントを、データ構造の変化している個所において分割して順次形成されるサブレイヤーの各セグメントとから構成されることを特徴とする請求項1に記載の時系列データの解析装置。 Segments are divided into two powers in the lower layer, each of which is composed of the uppermost layer segment corresponding to the whole period data of the time series data to be analyzed, and the lowermost layer. 2. The time series according to claim 1, wherein a segment whose data structure changes in a layer is composed of segments of sub-layers which are sequentially formed by dividing the segment where the data structure changes. Data analysis device. データ構造の均一性は、下式による最大ラグ値までの最大エントロピー法のスペクトル密度の計算におけるバーグの係数Pmの、ラグ値に対する推移により評価することを特徴とする請求項1に記載の時系列データの解析装置。
Figure 2010086398
但し、Bm(f)はラグ値mにおけるスペクトル密度、Δtはサンプリング間隔、Pmとγm(k)はバーグの係数である。
2. The time series according to claim 1, wherein the uniformity of the data structure is evaluated by a transition of the Burg coefficient Pm with respect to the lag value in the calculation of the spectral density of the maximum entropy method up to the maximum lag value by the following equation. Data analysis device.
Figure 2010086398
Where Bm (f) is the spectral density at the lag value m, Δt is the sampling interval, and Pm and γm (k) are Burg's coefficients.
解析シーケンス決定手段には、不等間隔の時系列データを等間隔化処理する等間隔化処理過程を設けたことを特徴とする請求項1に記載の時系列データの解析装置。 2. The time-series data analysis apparatus according to claim 1, wherein the analysis sequence determination means is provided with an equal-interval processing step for performing equal-interval processing on the time-series data with unequal intervals. データ解析手段は、解析対象の時系列データから取り出したセグメントデータに対して下式による最大ラグ値までの最大エントロピー法のスペクトル密度の計算におけるバーグの係数Pmの、ラグ値に対する推移を求める計算過程と、求めた推移から最大エントロピー法によるパワースペクトル密度の計算に用いるラグ値を決定するラグ値決定過程と、決定されたラグ値により上記パワースペクトル密度を求めるパワースペクトル密度計算過程と、求められたパワースペクトル密度から主要ピークの周波数と、そのパワーを抽出する抽出過程と、抽出された周波数とパワーとから非線形最小自乗法により当てはめ曲線のパラメータを求めるパラメータ導出過程と、求められた当てはめ曲線とセグメントデータとを比較して一致度を評価し、所定の一致度以上の場合には上記当てはめ曲線のパラメータをセグメントに対応する記憶手段に記憶して次の過程に移行し、所定の一致度に達しない場合には上記当てはめ曲線のパラメータを破棄して上記ラグ値を決定する過程に移行する評価過程とを備えていることを特徴とする請求項1に記載の時系列データの解析装置。
Figure 2010086398
但し、Bm(f)はラグ値mにおけるスペクトル密度、Δtはサンプリング間隔、Pmとγm(k)はバーグの係数である。
The data analysis means is a calculation process to determine the transition of the Burg coefficient Pm with respect to the lag value in the calculation of the spectral density of the maximum entropy method up to the maximum lag value by the following formula for the segment data extracted from the time series data to be analyzed And a lag value determination process for determining a lag value used for calculation of power spectral density by the maximum entropy method from the obtained transition, and a power spectrum density calculation process for determining the power spectral density based on the determined lag value. The frequency of the main peak from the power spectral density, the extraction process to extract the power, the parameter derivation process to obtain the parameters of the fitting curve by the nonlinear least square method from the extracted frequency and power, the obtained fitting curve and segment Compare the data and evaluate the degree of agreement If the degree of coincidence is equal to or higher than the degree of coincidence, the parameters of the fitting curve are stored in the storage means corresponding to the segment, and the process proceeds to the next process. If the degree of coincidence is not reached, the parameters of the fitting curve are discarded. The time-series data analysis device according to claim 1, further comprising an evaluation process that shifts to a process of determining a lag value.
Figure 2010086398
Where Bm (f) is the spectral density at the lag value m, Δt is the sampling interval, and Pm and γm (k) are Burg's coefficients.
データ解析手段におけるセグメントデータの解析は、最上位のレイヤーから最下位のレイヤーに向かって順次行うものとし、この際、上位のレイヤーのセグメントのセグメントデータは、セグメント当たりのデータ点数が予め設定された最大データ点数を越えないように、解析対象の時系列データのデータ点数をバンチング処理により低減してセグメントデータを構成する処理を行う構成とすると共に、各レイヤーの各セグメントに対応して一時記憶領域を構成し、上位側のセグメントに対して求められた多項式パラメータを下位の各レイヤーの各セグメントの一時記憶領域に記憶すると共に、上記多項式パラメータから構成される当てはめ曲線と、原時系列データの対応部分との差演算により求められる残差時系列データを次の下位レイヤーのセグメントデータとして設定する処理を行うことを特徴とする請求項5に記載の時系列データの解析装置。 The segment data analysis in the data analysis means is performed sequentially from the highest layer to the lowest layer. At this time, the segment data of the upper layer segment is preset with the number of data points per segment. In order not to exceed the maximum number of data points, the number of data points of the time-series data to be analyzed is reduced by bunching processing to form segment data, and a temporary storage area corresponding to each segment of each layer The polynomial parameters obtained for the upper segment are stored in the temporary storage area of each segment of each lower layer, and the fitting curve composed of the above polynomial parameters is associated with the original time series data. The residual time series data obtained by the difference calculation with the part is used as the next lower layer. Analyzer time series data according to claim 5, characterized in that performing the process of setting as the segment data. 解析結果評価手段は、セグメントデータに対してデータ解析手段により求められた当てはめ曲線と解析対象の時系列データの対応範囲を比較して残差曲線を求めてその解析を行う残差解析過程と、残差解析過程により解析された残差曲線と時系列データとを比較して一致度を評価し、所定の一致度以上の場合には当てはめ曲線のパラメータと残差を所定の記憶手段に記憶して次の過程に移行し、所定の一致度に達しない場合にはデータを破棄して、セグメントデータを次のレイヤーのセグメントに移行する評価過程とを備えていることを特徴とする請求項6に記載の時系列データの解析装置。 The analysis result evaluation means is a residual analysis process in which the corresponding curve obtained by the data analysis means for the segment data is compared with the corresponding range of the time series data to be analyzed to obtain a residual curve and perform analysis thereof, The residual curve analyzed by the residual analysis process is compared with the time series data to evaluate the degree of coincidence. If the degree of coincidence is equal to or higher than the predetermined coincidence, the parameters of the fitting curve and the residual are stored in a predetermined storage means. And an evaluation step of discarding the data when the predetermined degree of coincidence is not reached and shifting the segment data to the segment of the next layer. Analyzing device for time series data described in 1. 解析結果構成手段は、全ての記憶領域に記憶されている基本セグメントのパラメータと残差とから全データ領域を一括して再構成スペクトルを求めて記憶する一括解析結果構成手段と、各記憶領域に記憶されている基本セグメントのパラメータと残差とから、基本セグメント毎に再構成スペクトルを求めて記憶するセグメント解析結果構成手段とから構成すると共に、基本セグメント毎に頂位位相の周波数依存性を解析するための頂位位相推移計算手段を構成し、この頂位位相推移計算手段により計算した各基本セグメント毎の頂位位相の周波数依存をセグメント解析結果構成手段による再構成スペクトルと共に、基本セグメントの代表時刻の属性として記憶することを特徴とする請求項1に記載の時系列データの解析装置。 The analysis result configuration means includes collective analysis result configuration means for obtaining and storing a reconstructed spectrum in a batch from all the data areas from the basic segment parameters and residuals stored in all the storage areas, and each storage area. It consists of segment analysis result configuration means that calculates and stores the reconstruction spectrum for each basic segment from the stored basic segment parameters and residuals, and analyzes the frequency dependence of the top phase for each basic segment The top phase transition calculating means for performing the calculation, and the frequency dependence of the top phase for each basic segment calculated by the top phase transition calculating means together with the reconstructed spectrum by the segment analysis result constituting means and the representative of the basic segment The time-series data analyzing apparatus according to claim 1, wherein the time-series data analyzing apparatus is stored as a time attribute. 再構成スペクトル計算手段は、得られたパラメータからパワースペクトル密度を求める計算において、一般化三角多項式の夫々の項の夫々につき、δ函数の原型を用いて全周波数帯に裾の広がる夫々一つのスペクトルピークを構成することにより、パラメータから得られる各周波数に対応する孤立ピーク群を構成し、その重畳として時系列データの再構成スペクトルを求める構成とすることを特徴とする請求項1に記載の時系列データの解析装置。 The reconstruction spectrum calculation means calculates the power spectral density from the obtained parameters. For each term of the generalized trigonometric polynomial, each spectrum with a base spread over the entire frequency band using the prototype of the δ function. 2. The time according to claim 1, wherein an isolated peak group corresponding to each frequency obtained from a parameter is formed by configuring a peak, and a reconstructed spectrum of time series data is obtained as a superposition thereof. Series data analysis device. δ函数の原型として、余弦函数に微弱な雑音を加えた時系列をラグ2にて最大エントロピー法のスペクトル密度の計算を行って得られたスペクトルを利用することを特徴とする請求項9に記載の時系列データの解析装置。 10. The spectrum obtained by calculating the spectral density of the maximum entropy method using lag 2 from a time series obtained by adding weak noise to the cosine function is used as a prototype of the δ function. Time series data analysis device. 解析対象の時系列データを解析するシーケンスを決定する解析シーケンス決定手順と、解析シーケンスに従い、最大エントロピー法及び非線形最小自乗法によりデータを解析して一般化三角多項式のパラメータと残差を求めるデータ解析手順と、データ解析手順により求めた解析結果を評価し、条件に適合する場合に記憶手段に記憶する解析結果評価手順と、上記パラメータから得られるパワースペクトル密度と最大エントロピー法を用いて求める残差のパワースペクトル密度を合成して時系列データの再構成スペクトルを求める再構成スペクトル計算手順と、この計算手順を利用して、上記記憶手段から取り出した上記パラメータと残差により、解析対象の時系列データに対応する一般化三角多項式を構成する解析結果構成手順とを備え、解析シーケンス決定手順は、解析対象の時系列データを、予め設定された最大データ点数を越えないようにセグメントに分割する分割処理手順と、各セグメントに対してデータ構造の均一性を評価する評価処理手順と、この評価に基づき、不均一のセグメントデータを均一の複数のセグメントに分割する分割処理手順と、分割された均一のセグメントの夫々を基本セグメントとして、それらに対して、記憶手段に記憶領域を設定する記憶領域設定処理手順からなる各手順をコンピュータに実行させるための時系列データの解析プログラムを記録したコンピュータ読み取り可能な記録媒体。 Analytical sequence determination procedure to determine the sequence to analyze the time series data to be analyzed, and data analysis to find parameters and residuals of generalized trigonometric polynomials by analyzing data by maximum entropy method and nonlinear least square method according to analysis sequence The procedure, the analysis result obtained by the data analysis procedure, and the analysis result evaluation procedure stored in the storage means when the conditions are met, the power spectrum density obtained from the above parameters and the residual obtained using the maximum entropy method The reconstruction spectrum calculation procedure for obtaining the reconstruction spectrum of the time series data by synthesizing the power spectrum density of the time series, and the time series of the analysis target by using the calculation procedure and the parameters and residuals extracted from the storage means An analysis result composition procedure for constructing a generalized trigonometric polynomial corresponding to the data, The analysis sequence determination procedure consists of a division processing procedure that divides the time series data to be analyzed into segments so as not to exceed the preset maximum number of data points, and an evaluation process that evaluates the uniformity of the data structure for each segment A procedure, a division processing procedure for dividing the non-uniform segment data into a plurality of uniform segments based on this evaluation, and each of the divided uniform segments as a basic segment, and a storage area in the storage means The computer-readable recording medium which recorded the analysis program of the time series data for making a computer perform each procedure which consists of a storage area setting process procedure which sets up. セグメントは、解析対象の時系列データの全期間データに対応する、最上位レイヤーのセグメントから、順次2分割されて構成される、下位のレイヤーの夫々に含まれる2の累乗のセグメントと、最下位のレイヤーにおいて、データ構造が変化するセグメントを、データ構造の変化している個所において分割して順次形成されるサブレイヤーの各セグメントとから構成されることを特徴とする請求項11に記載の時系列データの解析プログラムを記録したコンピュータ読み取り可能な記録媒体。 The segment is composed of the segment of the highest layer corresponding to the whole period data of the time-series data to be analyzed, and is divided into two in order, the power of 2 included in each of the lower layers, and the lowest 12. The layer according to claim 11, wherein each segment of the data layer is composed of segments of sub-layers that are sequentially formed by dividing a segment whose data structure changes at a location where the data structure changes. A computer-readable recording medium on which a series data analysis program is recorded. データ構造の均一性は、下式による最大ラグ値までの最大エントロピー法のスペクトル密度の計算におけるバーグの係数Pmの、ラグ値に対する推移により評価することを特徴とする請求項11に記載の時系列データの解析プログラムを記録したコンピュータ読み取り可能な記録媒体。
Figure 2010086398
但し、Bm(f)はラグ値mにおけるスペクトル密度、Δtはサンプリング間隔、Pmとγm(k)はバーグの係数である。
12. The time series according to claim 11, wherein the uniformity of the data structure is evaluated by a transition of the Burg coefficient Pm with respect to the lag value in the calculation of the spectral density of the maximum entropy method up to the maximum lag value by the following equation. A computer-readable recording medium on which a data analysis program is recorded.
Figure 2010086398
Where Bm (f) is the spectral density at the lag value m, Δt is the sampling interval, and Pm and γm (k) are Burg's coefficients.
解析シーケンス決定手順には、不等間隔の時系列データを等間隔化処理する等間隔化処理過程を設けたことを特徴とする請求項11に記載の時系列データの解析プログラムを記録したコンピュータ読み取り可能な記録媒体。 12. The computer-readable recording of the time-series data analysis program according to claim 11, wherein the analysis sequence determination procedure includes an equal-interval processing step of performing equal-interval processing on the time-series data of unequal intervals. Possible recording media. データ解析手順は、解析対象の時系列データから取り出したセグメントデータに対して、下式による最大ラグ値までの最大エントロピー法のスペクトル密度の計算におけるバーグの係数Pmの、ラグ値に対する推移を求める計算過程と、求めた推移から最大エントロピー法によるパワースペクトル密度の計算に用いるラグ値を決定するラグ値決定過程と、決定されたラグ値により上記パワースペクトル密度を求めるパワースペクトル密度計算過程と、求められたパワースペクトル密度から主要ピークの周波数と、そのパワーを抽出する抽出過程と、抽出された周波数とパワーとから非線形最小自乗法により当てはめ曲線のパラメータを求めるパラメータ導出過程と、求められた当てはめ曲線とセグメントデータとを比較して一致度を評価し、所定の一致度以上の場合には上記当てはめ曲線のパラメータをセグメントに対応する記憶手段に記憶して次の過程に移行し、所定の一致度に達しない場合には上記当てはめ曲線のパラメータを破棄して上記ラグ値を決定する過程に移行する評価過程とから構成されることを特徴とする請求項11に記載の時系列データの解析プログラムを記録したコンピュータ読み取り可能な記録媒体。
Figure 2010086398
但し、Bm(f)はラグ値mにおけるスペクトル密度、Δtはサンプリング間隔、Pmとγm(k)はバーグの係数である。
The data analysis procedure calculates the transition of the Burg coefficient Pm with respect to the lag value in the calculation of the spectral density of the maximum entropy method up to the maximum lag value by the following formula for the segment data extracted from the time series data to be analyzed A lag value determining process for determining the lag value used for calculating the power spectral density by the maximum entropy method from the obtained transition, and a power spectral density calculating process for determining the power spectral density based on the determined lag value. The frequency of the main peak from the measured power spectral density and the extraction process for extracting the power, the parameter derivation process for obtaining the parameters of the fitting curve by the nonlinear least square method from the extracted frequency and power, and the obtained fitting curve Compare the segment data and evaluate the degree of match, If the degree of coincidence is equal to or higher than the above, the parameters of the fitting curve are stored in the storage means corresponding to the segment, and the process proceeds to the next process. If the predetermined degree of coincidence is not reached, the parameters of the fitting curve are discarded. The computer-readable recording medium recording the time-series data analysis program according to claim 11, comprising: an evaluation process that shifts to a process of determining the lag value.
Figure 2010086398
Where Bm (f) is the spectral density at the lag value m, Δt is the sampling interval, and Pm and γm (k) are Burg's coefficients.
データ解析手順におけるセグメントデータの解析は、最上位のレイヤーから最下位のレイヤーに向かって順次行うものとし、この際、上位のレイヤーのセグメントのセグメントデータは、セグメント当たりのデータ点数が予め設定された最大データ点数を越えないように、解析対象の時系列データのデータ点数をバンチング処理により低減してセグメントデータを構成する処理を行う構成とすると共に、各レイヤーの各セグメントに対応して一時記憶領域を構成し、上位側のセグメントに対して求められた多項式パラメータを下位の各レイヤーの各セグメントの一時記憶領域に記憶すると共に、上記多項式パラメータから構成される当てはめ曲線と、原時系列データの対応部分との差演算により求められる残差時系列データを次の下位レイヤーのセグメントデータとして設定する処理とから構成されることを特徴とする請求項15に記載の時系列データの解析プログラムを記録したコンピュータ読み取り可能な記録媒体。 The segment data analysis in the data analysis procedure is performed sequentially from the top layer to the bottom layer. At this time, the segment data of the upper layer segment is preset with the number of data points per segment. In order not to exceed the maximum number of data points, the number of data points of the time-series data to be analyzed is reduced by bunching processing to form segment data, and a temporary storage area corresponding to each segment of each layer The polynomial parameters obtained for the upper segment are stored in the temporary storage area of each segment of each lower layer, and the fitting curve composed of the above polynomial parameters is associated with the original time series data. The residual time series data obtained by the difference calculation with the part is used as the next lower layer. A computer-readable recording medium an analysis program of the time series data according to claim 15, characterized in that it is composed of a process of setting as the segment data. 解析結果評価手順は、セグメントデータに対してデータ解析手順により求められた当てはめ曲線と解析対象の時系列データの対応範囲を比較して残差曲線を求めてその解析を行う残差解析過程と、残差解析過程により解析された残差曲線と時系列データとを比較して一致度を評価し、所定の一致度以上の場合には当てはめ曲線のパラメータと残差を所定の記憶手段に記憶して次の過程に移行し、所定の一致度に達しない場合にはデータを破棄して、セグメントデータを次のレイヤーのセグメントに移行する評価過程とから構成されることを特徴とする請求項15に記載の時系列データの解析プログラムを記録したコンピュータ読み取り可能な記録媒体。 The analysis result evaluation procedure includes a residual analysis process in which a fitting curve obtained by the data analysis procedure for the segment data is compared with the corresponding range of the time series data to be analyzed to obtain a residual curve and analyze it. The residual curve analyzed by the residual analysis process is compared with the time series data to evaluate the degree of coincidence. If the degree of coincidence is equal to or higher than the predetermined coincidence, the parameters of the fitting curve and the residual are stored in a predetermined storage means. 16. The method according to claim 15, further comprising: an evaluation step of moving to the next step, discarding the data if the predetermined degree of coincidence is not reached, and moving the segment data to the segment of the next layer. A computer-readable recording medium on which the time-series data analysis program described in 1 is recorded. 解析結果構成手順は、全ての記憶領域に記憶されている基本セグメントのパラメータと残差とから全データ領域を一括して再構成スペクトルを求めて記憶する一括解析結果構成手順と、各記憶領域に記憶されている基本セグメントのパラメータと残差とから、基本セグメント毎に再構成スペクトルを求めて記憶するセグメント解析結果構成手順とから構成すると共に、基本セグメント毎に頂位位相の周波数依存性を解析するための頂位位相推移計算手順を構成し、この頂位位相推移計算手順により計算した各基本セグメント毎の頂位位相の周波数依存をセグメント解析結果構成手順による再構成スペクトルと共に、基本セグメントの代表時刻の属性として記憶する手順とから構成されることを特徴とする請求項11に記載の時系列データの解析プログラムを記録したコンピュータ読み取り可能な記録媒体。 The analysis result composition procedure includes a collective analysis result composition procedure for obtaining and storing a reconstructed spectrum all at once from the parameters and residuals of the basic segments stored in all the storage areas, and each storage area. From the stored basic segment parameters and residuals, it consists of a segment analysis result configuration procedure that calculates and stores the reconstruction spectrum for each basic segment, and analyzes the frequency dependence of the top phase for each basic segment The top phase transition calculation procedure for the basic segment is calculated, and the frequency dependence of the top phase for each basic segment calculated by this top phase transition calculation procedure is represented together with the reconstructed spectrum by the segment analysis result configuration procedure and the representative of the basic segment. The time-series data solution according to claim 11, wherein the time-series data solution is configured to store the time attribute as a procedure. A computer-readable recording medium a program. 再構成スペクトル計算手順は、得られたパラメータからパワースペクトル密度を求める計算において、一般化三角多項式の夫々の項の夫々につき、δ函数の原型を用いて全周波数帯に裾の広がる夫々一つのスペクトルピークを構成することにより、パラメータから得られる各周波数に対応する孤立ピーク群を構成し、その重畳として時系列データの再構成スペクトルを求める手順とすることを特徴とする請求項11に記載の時系列データの解析プログラムを記録したコンピュータ読み取り可能な記録媒体。 The reconstruction spectrum calculation procedure is to calculate the power spectral density from the obtained parameters. For each term of the generalized trigonometric polynomial, one spectrum that spreads in the whole frequency band using the prototype of δ function for each term. The time according to claim 11, wherein by forming a peak, an isolated peak group corresponding to each frequency obtained from a parameter is formed, and a reconstructed spectrum of time series data is obtained as a superposition thereof. A computer-readable recording medium on which a series data analysis program is recorded. δ函数の原型として、余弦函数に微弱な雑音を加えた時系列をラグ2にて最大エントロピー法のスペクトル密度の計算を行って得られたスペクトルを利用することを特徴とする請求項19に記載の時系列データの解析プログラムを記録したコンピュータ読み取り可能な記録媒体。 20. The spectrum obtained by calculating the spectral density of the maximum entropy method using lag 2 for a time series obtained by adding weak noise to the cosine function is used as a prototype of the δ function. A computer-readable recording medium on which a time series data analysis program is recorded.
JP2008256418A 2008-10-01 2008-10-01 Time series data analyzer Expired - Fee Related JP4711355B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008256418A JP4711355B2 (en) 2008-10-01 2008-10-01 Time series data analyzer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008256418A JP4711355B2 (en) 2008-10-01 2008-10-01 Time series data analyzer

Publications (2)

Publication Number Publication Date
JP2010086398A true JP2010086398A (en) 2010-04-15
JP4711355B2 JP4711355B2 (en) 2011-06-29

Family

ID=42250269

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008256418A Expired - Fee Related JP4711355B2 (en) 2008-10-01 2008-10-01 Time series data analyzer

Country Status (1)

Country Link
JP (1) JP4711355B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9509004B2 (en) 2013-03-21 2016-11-29 Toyota Jidosha Kabushiki Kaisha Fuel cell system and control method of fuel cell system
CN110530509A (en) * 2019-09-05 2019-12-03 西南交通大学 High-speed EMUs axle box main frequency of vibration prediction technique based on maximum entropy spectrum analysis
CN114254017A (en) * 2021-12-22 2022-03-29 河北省科学院应用数学研究所 Point switch power curve feature extraction application method based on time series

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160034421A1 (en) * 2014-08-01 2016-02-04 Infineon Technologies Ag Digital pre-distortion and post-distortion based on segmentwise piecewise polynomial approximation

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05216195A (en) * 1992-02-07 1993-08-27 Konica Corp Pigment image receiving material
JPH06149863A (en) * 1992-11-05 1994-05-31 Yukio Tanaka Time series data analyzer

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05216195A (en) * 1992-02-07 1993-08-27 Konica Corp Pigment image receiving material
JPH06149863A (en) * 1992-11-05 1994-05-31 Yukio Tanaka Time series data analyzer

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JPN6010073794, 三宅浩次監修, 生物リズムの構造 —MemCalcによる生物時系列データの解析—, 19920115, 初版, pp.19−39, 富士書院 *
JPN6010073796, 常磐野和男、外2名, 最大エントロピー法による時系列解析 —MemCalcの理論と実際—, 20020625, 第1刷, pp.79−99, 北海道大学図書刊行会 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9509004B2 (en) 2013-03-21 2016-11-29 Toyota Jidosha Kabushiki Kaisha Fuel cell system and control method of fuel cell system
CN110530509A (en) * 2019-09-05 2019-12-03 西南交通大学 High-speed EMUs axle box main frequency of vibration prediction technique based on maximum entropy spectrum analysis
CN114254017A (en) * 2021-12-22 2022-03-29 河北省科学院应用数学研究所 Point switch power curve feature extraction application method based on time series
CN114254017B (en) * 2021-12-22 2024-04-30 河北省科学院应用数学研究所 Point machine power curve characteristic extraction application method based on time sequence

Also Published As

Publication number Publication date
JP4711355B2 (en) 2011-06-29

Similar Documents

Publication Publication Date Title
Bayer et al. An iterative wavelet threshold for signal denoising
GB2547816B (en) Actually-measured marine environment data assimilation method based on sequence recursive filtering three-dimensional variation
US10496730B2 (en) Factor analysis device, factor analysis method, and factor analysis program
Laib et al. Long-range fluctuations and multifractality in connectivity density time series of a wind speed monitoring network
JP4711355B2 (en) Time series data analyzer
US7868886B2 (en) Statistical streaming
JP4711356B2 (en) Two-series time-series data analysis apparatus and computer-readable recording medium having recorded two-series time-series data analysis program
CN111474117B (en) Method and device for monitoring crop diseases
Glatthard et al. Optimal cold atom thermometry using adaptive bayesian strategies
CN108469633A (en) The computational methods and device of a kind of ground interval quality factors
CN116563718B (en) Remote sensing mapping-based carbon reserve estimation method
JP2017198620A (en) Abnormality diagnosis device and abnormality diagnosis method
CN105137176B (en) A kind of signal harmonic analysis method using rapid triangle formula Fourier transformation
CN117349751A (en) Loess landslide slip distance prediction method and system based on meta-learning and Bayesian optimization
CN104268896A (en) Hyper spectrum dimensionality reduction matching method and system based on spectrum sampling histogram
CN103076622B (en) A kind of production method of spectrum stabilization stochastic signal
Yao et al. A minimum deviation approach for improving the consistency of uncertain 2-tuple linguistic preference relations
JP6977970B2 (en) Time-series data analysis device and time-series data analysis program
CN104021434A (en) Method for forecasting sea wave significant wave height based on ERA-Interim
JP4743914B2 (en) Time series data analysis system and time series data analysis program
RU2595929C2 (en) Method and apparatus for compressing data depending on time signal
US10671624B2 (en) Parallel filtering of large time series of data for filters having recursive dependencies
JP6817243B2 (en) Spectrum processing equipment and methods
CN111738965A (en) Pulse signal sorting method, system, computer equipment and storage medium
CN116701949B (en) Training method of spatial point location monitoring model based on regional environment data

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101022

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20101105

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20101208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101227

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110225

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20110225

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110317

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110317

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees