JP2014211827A - Derivation device, derivation method and derivation program - Google Patents

Derivation device, derivation method and derivation program Download PDF

Info

Publication number
JP2014211827A
JP2014211827A JP2013088839A JP2013088839A JP2014211827A JP 2014211827 A JP2014211827 A JP 2014211827A JP 2013088839 A JP2013088839 A JP 2013088839A JP 2013088839 A JP2013088839 A JP 2013088839A JP 2014211827 A JP2014211827 A JP 2014211827A
Authority
JP
Japan
Prior art keywords
data
derivation
observation data
time
derived
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013088839A
Other languages
Japanese (ja)
Inventor
合原 一幸
Kazuyuki Aihara
一幸 合原
洛南 陳
Rakunan Chin
洛南 陳
歓飛 馬
Huan Fei Ma
歓飛 馬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Science and Technology Agency
Original Assignee
Japan Science and Technology Agency
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Science and Technology Agency filed Critical Japan Science and Technology Agency
Priority to JP2013088839A priority Critical patent/JP2014211827A/en
Priority to PCT/JP2014/061092 priority patent/WO2014171544A1/en
Publication of JP2014211827A publication Critical patent/JP2014211827A/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/08Computing arrangements based on specific mathematical models using chaos models or non-linear system models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Nonlinear Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Databases & Information Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Complex Calculations (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a derivation device, a derivation method and a derivation program for, on the basis of observation data of m points observed in time series for each of n-dimensional items related to would-be which changes with time, deriving time series data at a point of time not included in the observation data.SOLUTION: A derivation device 1 acquires the observation data of m points arranged in time series for each of n-dimensional items (S101), and accepts the designation of an item to be derived (S103), and derives a conversion map for searching, as mapping from a start region matrix consisting of n rows×m columns in which items are arranged so as to be aligned in a row direction and time series are arranged so as to be aligned in a column direction with the acquired observation data as elements, an end region matrix consisting of L rows×m columns in which the observation data of m+1-i (i is a natural number) points and the derivation data of i-1 points are arranged in a time sequential order in the i-th row with the observation data and derivation data of the designated item as elements (S105 to S108), and derives the derivation data by the derived conversion map (S109).

Description

本発明は、経時的に変化する事象に関するn次元の項目それぞれについて時系列で観測したm点の観測データに基づいて、前記観測データに含まれていない時点のデータを導出する導出装置、導出方法及び導出プログラムに関する。   The present invention relates to a derivation device and a derivation method for deriving data at a time point not included in the observation data based on observation data of m points observed in time series for each of n-dimensional items related to events that change over time. And a derivation program.

株価、為替、物価等の金融市場、気象、電力消費量、生命分子レベルの進展データ、複雑な疾患の進展等の経時的に変化する事象について、時系列の変化を予測することは、産業界だけでなく科学研究分野においても重要である。従来の時系列予測方法は、一般的に十分なサンプル数が存在することを前提として開発されている。代表的な時系列モデルとしては、ARモデル、MAモデル、ARMAモデルを例示することができる。また、Takensの埋め込み理論(非特許文献1)を応用してアトラクタの再構成を行うことで時系列予測を行う方法もある。このような時系列予測において、予測モデルを構築するためには、十分なサンプル数を含む長期的時系列データが必要となる。   Predicting time-series changes in time-varying events such as financial markets such as stock prices, exchange rates, prices, weather, electricity consumption, biomolecular progress data, and complicated disease progress It is important not only in scientific research. Conventional time series prediction methods are generally developed on the assumption that a sufficient number of samples exist. As a typical time series model, an AR model, an MA model, and an ARMA model can be exemplified. There is also a method of performing time series prediction by reconstructing an attractor by applying Takens' embedding theory (Non-Patent Document 1). In such time series prediction, in order to construct a prediction model, long-term time series data including a sufficient number of samples is required.

一方、近年では、データ測定技術がめざましい発展を遂げており、少ないサンプルから膨大な項目のデータを高速に得ることが容易となってきている。例えば、遺伝子研究に用いられるハイスループット・バイオデータ、即ち、マイクロアレイデータでは、数十個のサンプルから、1つのチップで何万個もの遺伝子プローブを同時に測定することが可能である。少ないサンプルから多くの項目のデータを観測することができる事象としては、様々な統計レポート、気象情報、金融市場情報、天体観測情報等の情報を例示することができる。   On the other hand, in recent years, data measurement technology has made remarkable progress, and it has become easy to obtain enormous items of data from a small number of samples at high speed. For example, in high-throughput biodata used for genetic research, that is, microarray data, it is possible to simultaneously measure tens of thousands of gene probes from one tens of samples on one chip. Examples of events that can observe data of many items from a small sample include various statistical reports, weather information, financial market information, astronomical observation information, and the like.

タケンス・エフ(Takens,F. )著,「動的システムと乱流(in Dynamical Systems and Turbulence),シュプリンガー・フェアラーク・ニューヨーク(Springer-Verlag New York),1981年,p.366−381Takens, F., “In Dynamical Systems and Turbulence, Springer-Verlag New York, 1981, pp. 366-381.

しかしながら、従来の時系列予測方法は、予測モデルを構築するために、十分長い長期的時系列データが必要であるにも関わらず、実際の系(システム)では、長期的時系列データを得ることが難しい場合も多いという問題がある。例えば、分子生物学の実験においては、各種の制約から、一般的に、数十点の時系列データしか得られず、長期的時系列データを得ることは難しい。また、市場における株式データの場合も、データ数は多く得られるが、条件依存度又は時変モデルのため、時系列データのうち予測に有用なのは直近のデータに限られるので、実質的には短期的なデータと等価である。   However, the conventional time-series prediction method obtains long-term time-series data in an actual system even though long-term time-series data that is sufficiently long is necessary to construct a prediction model. There is a problem that is often difficult. For example, in molecular biology experiments, due to various limitations, generally only a few tens of time series data can be obtained, and it is difficult to obtain long-term time series data. In addition, in the case of stock data in the market, a large number of data can be obtained, but because of the degree of condition dependence or time-varying model, only the most recent data is useful for forecasting because of time-dependent data. Is equivalent to typical data.

一方、多くの項目を有する短期的時系列データは、あまり時系列予測には用いられていない。その理由は、短期的時系列データは、事象の予測に用いるには、情報が不足していると考えられているからである。   On the other hand, short-term time-series data having many items is not often used for time-series prediction. The reason is that short-term time-series data is considered to lack information to be used for event prediction.

本発明は斯かる事情に鑑みてなされたものであり、多くの項目を有する高次元時系列データを事象の予測に用いるものである。本願発明者らは、短期的であっても多くの項目を有する高次元時系列データは、事象の様々な面を反映したデータであるため、各変数間の相互作用情報を豊富に含んでいるという観点から、事象に蓄積された動特性を反映していると考える。このような発想から、本願発明者らは、Takensの埋め込み理論を拡張して、高次元時系列データを長期的低次元の時系列データに変換する方法、即ち、Takensの埋め込み理論による変換の逆変換法を見つけ出した。この方法を用いることにより、高次元時系列データを長期的低次元の時系列データに変換することで、事象の一部の項目の動特性を予測することが可能となる。即ち、本発明は、このような発想を具現化したものであり、事象の観測データに基づいて、未知の時系列データを推測することが可能な導出装置、導出方法及び導出プログラムを提供することを目的とする。   The present invention has been made in view of such circumstances, and uses high-dimensional time-series data having many items for event prediction. The inventors of the present application have abundant interaction information between variables because high-dimensional time-series data having many items even in the short term reflects various aspects of the event. From this point of view, I think that it reflects the dynamic characteristics accumulated in the event. From such an idea, the present inventors extended the Takens embedding theory to convert high-dimensional time-series data into long-term low-dimensional time-series data, that is, the inverse of the conversion by Takens embedding theory. I found a conversion method. By using this method, it is possible to predict the dynamic characteristics of some items of an event by converting high-dimensional time-series data into long-term low-dimensional time-series data. That is, the present invention embodies such an idea, and provides a derivation device, a derivation method, and a derivation program capable of estimating unknown time-series data based on event observation data. With the goal.

上記目的を達成するために、本発明に係る導出装置は、経時的に変化する事象に関するn次元(nは2以上の整数)の項目それぞれについて時系列で観測して得られたm点(mは2以上の整数)の観測データに基づいて、前記観測データに含まれていない時点のデータを導出データとして導出する導出装置であって、n次元の項目それぞれについてのm点の観測データを取得する取得部と、導出する項目の指定を受け付ける項目受付手段と、前記取得部が取得した観測データを要素とし、項目が行方向に並び、時系列が列方向に並ぶように配置したn行×m列の始域行列を記録する記録部と、指定された項目の観測データ及び導出データを要素とし、i行目(iは自然数)にm+1−i点の観測データ及びi−1点の導出データを時系列順に配置したL行×m列(Lは2以上の整数)の終域行列を、前記始域行列からの写像とする変換マップを導出する手段と、導出した変換マップにより、前記記録部に記録した始域行列からの写像として前記終域行列を導出する手段と、導出した終域行列に含まれる導出データを出力する出力部とを備えることを特徴とする。   In order to achieve the above object, the deriving device according to the present invention provides m points (m) obtained by observing each item of n dimensions (n is an integer of 2 or more) in time series regarding events that change over time. Is a derivation device for deriving data at a time point not included in the observation data as derived data based on observation data of 2 or more), and obtaining m-point observation data for each n-dimensional item An acquisition unit that receives the designation of an item to be derived, and observation data acquired by the acquisition unit as elements, n rows arranged such that items are arranged in a row direction and time series are arranged in a column direction × A recording unit for recording an m-column start matrix, and observation data and derived data of a specified item as elements, and derivation of observation data of m + 1-i points and i-1 points in the i-th row (i is a natural number). Data in chronological order An L row × m column (L is an integer of 2 or more) placed end region matrix is recorded in the recording unit by means for deriving a conversion map that is a mapping from the start region matrix, and the derived conversion map. It is characterized by comprising means for deriving the end region matrix as a map from the start region matrix, and an output unit for outputting the derived data included in the derived end region matrix.

また、本発明に係る導出装置は、経時的に変化する事象に関するn次元(nは2以上の整数)の項目それぞれについて時系列に観測して得られたm点(mは2以上の整数)の観測データに基づいて、前記観測データに含まれていない時点のデータを導出データとして導出する導出装置であって、n次元の項目それぞれについてのm点の観測データを取得する取得部と、導出する項目の指定を受け付ける項目受付手段と、n個の係数及び観測データ並びに指定された項目についてのm+1−i点の観測データ(i=1,2,... ,L)及びi−1点の導出データに係る変数にて構成されるm+1−i個の数式を生成する数式生成手段と、生成した数式に基づいて、導出データを導出する導出手段と、導出した導出データを出力する出力部とを備えることを特徴とする。   In addition, the deriving device according to the present invention provides m points (m is an integer equal to or greater than 2) obtained by observing each of n-dimensional (n is an integer equal to or greater than 2) items relating to events that change over time. A deriving device for deriving, as derived data, data at a time point not included in the observation data based on the observed data, an acquisition unit for acquiring m-point observation data for each of n-dimensional items, and a deriving device Item accepting means for accepting designation of an item to be performed, n coefficients and observation data, and m + 1-i point observation data (i = 1, 2,..., L) and i-1 point for the designated item Formula generating means for generating m + 1-i formulas composed of variables related to the derived data, derivation means for deriving derived data based on the generated formulas, and an output unit for outputting the derived data And with It is characterized by that.

また、本発明に係る導出装置は、前記数式生成手段は、n個の係数及びn項目の観測データの積、並びに指定された項目の観測データ及び導出データに係る変数にて構成される線形性を有する数式をi個生成し、前記導出手段は、前記数式生成手段が生成した数式にて求められるn個の係数の値を用いて、前記変数に係る導出データを導出することを特徴とする。   In the derivation device according to the present invention, the mathematical expression generation means is a linearity composed of a product of n coefficients and n items of observation data, and variables relating to observation data and derivation data of specified items. I is generated, and the derivation means derives derived data related to the variable by using the values of n coefficients obtained from the mathematical expression generated by the mathematical expression generation means. .

また、本発明に係る導出装置は、非線形関数の指定及び指定された非線形関数の展開次数を受け付ける関数指定部と、前記数式生成手段は、前記関数指定部により指定された非線形関数及び展開次数に基づいて、i個の数式として、それぞれ観測データ及び導出データを変数とするn個の非線形関数を生成することを特徴とする。   Further, the derivation device according to the present invention includes a function designating unit that receives designation of a non-linear function and an expansion order of the designated non-linear function, and the mathematical expression generating means uses the non-linear function and the expansion order designated by the function designating unit. On the basis of this, n nonlinear functions are generated as i equations, each of which has observation data and derived data as variables.

また、本発明に係る導出装置は、前記導出データは、m番目の観測データより後のL−1点分のデータ、又は1番目の観測データより前のL−1点分のデータであることを特徴とする。   In the derivation device according to the present invention, the derivation data is data for L-1 points after the m-th observation data, or data for L-1 points before the first observation data. It is characterized by.

本発明に係る導出方法は、経時的に変化する事象に関するn次元(nは2以上の整数)の項目それぞれについて時系列に観測して得られたm点(mは2以上の整数)の観測データに基づいて、前記観測データに含まれていない時点のデータを導出データとして導出する導出装置を用いた導出方法であって、前記導出装置は、n次元の項目それぞれについてのm点の観測データを取得するステップと、導出する項目を決定するステップと、n個の係数及び観測データ並びに指定された項目についてのm+1−L点の観測データ(L=1,2,... ,i)及びL−1点の導出データに係る変数にて構成されるi個の数式を生成するステップと、生成した数式に基づいて、導出データを導出するステップとを実行することを特徴とする。   In the derivation method according to the present invention, observation of m points (m is an integer of 2 or more) obtained by observing each of n-dimensional (n is an integer of 2 or more) items in time series regarding events that change over time. A derivation method using a derivation device that derives data at a time point not included in the observation data as derivation data based on data, the derivation device comprising m points of observation data for each of n-dimensional items , Determining the item to be derived, n coefficients and observation data, and observation data (L = 1, 2,..., I) of m + 1-L points for the specified item and A step of generating i formulas composed of variables related to the derived data of L-1 points and a step of deriving derived data based on the generated formulas are performed.

本発明に係る導出プログラムは、コンピュータに、経時的に変化する事象に関するn次元(nは2以上の整数)の項目それぞれについて時系列に観測して得られたm点(mは2以上の整数)の観測データに基づいて、前記観測データに含まれていない時点のデータを導出データとして導出させる導出プログラムであって、コンピュータに、n次元の項目それぞれについてのm点の観測データを取得するステップと、導出する項目を決定するステップと、n個の係数及び観測データ並びに指定された項目についてのm+1−L点の観測データ(L=1,2,... ,i)及びL−1点の導出データに係る変数にて構成されるi個の数式を生成するステップと、生成した数式に基づいて、導出データを導出するステップとを実行させることを特徴とする。   The derivation program according to the present invention allows a computer to obtain m points (m is an integer greater than or equal to 2) obtained by observing each of n-dimensional items (n is an integer greater than or equal to 2) relating to an event that changes over time. ) Is a derivation program for deriving data at a time point not included in the observation data as derivation data, and the computer obtains m-point observation data for each of the n-dimensional items. Determining items to be derived, n coefficients and observation data, and m + 1-L point observation data (L = 1, 2,..., I) and L−1 points for the specified item. Generating i mathematical formulas composed of variables related to the derived data, and deriving derived data based on the generated mathematical formulas. The

上記特徴を有する導出装置、導出方法及び導出プログラムは、高次元の観測データから未知の導出データを導出することにより、指定された項目についての将来又は過去の未知のデータを推測することが可能である。   The derivation device, derivation method, and derivation program having the features described above can estimate future or past unknown data for a specified item by deriving unknown derived data from high-dimensional observation data. is there.

本発明によれば、経時的に変化する事象に関するn次元の項目それぞれについて時系列で観測して得られたm点の観測データに基づいて、未知の時点のデータを導出することができる。これにより、n次元の項目の観測データ相互の関係から未知の時点のデータを導出し、事象を推定することが可能である等、優れた効果を奏する。   According to the present invention, unknown point-in-time data can be derived based on m-point observation data obtained by observing each n-dimensional item related to an event that changes over time in time series. As a result, it is possible to derive data at an unknown time point from the relationship between the observation data of n-dimensional items, and to obtain an excellent effect such as being able to estimate an event.

Takensの埋め込み理論による動的システムの再構築を概念的に示す説明図である。It is explanatory drawing which shows notionally the reconstruction of the dynamic system by Takens embedding theory. 本発明に係る導出装置の構成例を示すブロック図である。It is a block diagram which shows the structural example of the derivation | leading-out apparatus based on this invention. 本発明に係る導出装置の線形性時系列データの導出処理の一例を示すフローチャートである。It is a flowchart which shows an example of the derivation | leading-out process of the linearity time series data of the derivation | leading-out apparatus based on this invention. 本発明に係る導出装置の非線形性時系列データの導出処理の一例を示すフローチャートである。It is a flowchart which shows an example of the derivation | leading-out process of the nonlinear time series data of the derivation | leading-out apparatus based on this invention. 本発明に係る導出装置が取得する観測データの一例を示す説明図である。It is explanatory drawing which shows an example of the observation data which the derivation device concerning the present invention acquires. 本発明に係る導出装置が出力する導出データの一例を示す説明図である。It is explanatory drawing which shows an example of the derivation data which the derivation | leading-out apparatus based on this invention outputs.

<時系列データの推測>
まず、本発明の前提として、時系列データについて説明する。経時的に変化する事象をn次元(nは2以上の整数)の項目を含む動的システム(系)と捉えた場合、動的システムは、n次元の状態ベクトルを示す下記の式(1)として表すことができる。
<Estimation of time series data>
First, time series data will be described as a premise of the present invention. When an event that changes over time is regarded as a dynamic system (system) including items of n dimensions (n is an integer of 2 or more), the dynamic system represents the following equation (1) indicating an n-dimensional state vector: Can be expressed as

x(t)=(x1 (t),x2 (t),... ,xn (t))T ∈Rn …式(1) x (t) = (x 1 (t), x 2 (t),..., x n (t)) T ∈ R n (1)

式(1)において、xj (t),(j=1,2,... ,n)は動的システムの状態変数、nは系の次元、そしてtは観測時刻等の時点をそれぞれ示している。また、Rn は、n次元のユークリッド空間を示している。状態変数xj (t)は経時的に変化する変数であり、連続システムの場合、状態変数の変化はdx(t)/dt=F(x(t))と表され、離散システムの場合、状態変数の変化はx(t+1)=F(x(t))と表される。 In Expression (1), x j (t), (j = 1, 2,..., N) are state variables of the dynamic system, n is the dimension of the system, and t is a time point such as an observation time. ing. R n represents an n-dimensional Euclidean space. The state variable x j (t) is a variable that changes with time. In the case of a continuous system, the change in the state variable is expressed as dx (t) / dt = F (x (t)). The change of the state variable is expressed as x (t + 1) = F (x (t)).

動的システムの構成、性質、外部からの影響等の要因が明確で数式化することができる場合、F(x)を直接求めることにより、系の動的特性(状態変数xj (t)(t=0→T)の値)を導出することができる。一方、動的システムの構成、性質、外部からの影響等の要因が不明確で数式化することができない場合、系の動的特性を導出することができない。そこで、過去の一定期間(t=t−τ,t−2τ,... ,t−kτ)(τは時間間隔)に観測された状態変数xj (t)の一部又は全部のデータに基づいて、特定の状態変数xs (t)の将来の一定期間(t=t+τ,t+2τ,... ,t+(L−1)τ)のデータを推測する動的システムにおける時系列データの推測が行われる。 When factors such as the structure, properties, and external influences of a dynamic system are clear and can be mathematically expressed, the dynamic characteristics of the system (state variable x j (t) ( The value of t = 0 → T)) can be derived. On the other hand, when factors such as the configuration, properties, and external influences of the dynamic system are unclear and cannot be mathematically expressed, the dynamic characteristics of the system cannot be derived. Therefore, a part or all of the data of the state variable x j (t) observed in the past fixed period (t = t−τ, t−2τ,..., T−kτ) (τ is a time interval) Based on the estimation of time series data in a dynamic system that estimates data of a specific state variable x s (t) for a certain period in the future (t = t + τ, t + 2τ,..., T + (L−1) τ) Is done.

また、動的システムの時系列データは、期間及び次元数に基づいて、長期的低次元時系列データ、短期的高次元時系列データ等の区分に分類することができる。長期的低次元時系列データとは、比較的少数の状態変数(例えば、x1 (t),x2 (t),x3 (t))について、比較的長い期間の多数の時点(例えば、t=t1 ,t2 ,... ,tk )におけるデータ([x1 (t1 ),x1 (t2 ),... x1 (tk )]T ,[x2 (t1 ),x2 (t2 ),... x2 (tk )]T ,[x3 (t1 ),x3 (t2 ),... x3 (tk )]T )である。短期的高次元時系列データとは、比較的多数の状態変数(例えば、x1 (t),x2 (t),... ,xn (t))について、比較的短い期間の少数の時点(例えば、t=t1 ,t2 ,... ,tm )(m≪n)におけるデータ([x1 (t1 ),x1 (t2 ),... x1 (tm )]T ,[x2 (t1 ),x2 (t2 ),... x2 (tm )]T ,... ,[xn (t1 ),xn (t2 ),... xn (tm )]T )である。 In addition, the time series data of the dynamic system can be classified into categories such as long-term low-dimensional time series data and short-term high-dimensional time series data based on the period and the number of dimensions. Long-term low-dimensional time-series data means that a relatively small number of state variables (eg, x 1 (t), x 2 (t), x 3 (t)) t = t 1 , t 2 ,..., t k ) ([x 1 (t 1 ), x 1 (t 2 ),... x 1 (t k )] T , [x 2 (t 1 ), x 2 (t 2 ), ... x 2 (t k )] T , [x 3 (t 1 ), x 3 (t 2 ), ... x 3 (t k )] T ) is there. Short-term high-dimensional time-series data means that a relatively small number of state variables (eg, x 1 (t), x 2 (t),..., X n (t)) Data ([x 1 (t 1 ), x 1 (t 2 ),... X 1 (t m ) at a time point (for example, t = t 1 , t 2 ,..., T m ) ( m << n ) )] T , [x 2 (t 1 ), x 2 (t 2 ), ... x 2 (t m )] T , ..., [x n (t 1 ), x n (t 2 ), ... it is a x n (t m)] T ).

従来の時系列データの予測は、過去に観測された長期的低次元時系列データを用いて、特定の状態変数についての将来の時系列データを推測する方法である。それに対して、本発明では、過去に観測された短期的高次元時系列データを用いて、特定の状態変数の将来の時系列データを推測することに適している。なお、時系列データの推測は、状態変数が観測された期間より後の将来の時系列データに限らず、状態変数が観測された期間より前の過去の時系列データについても行うことが可能である。即ち、既知の短期的高次元時系列データを、未知の時系列データを含む長期的低次元時系列データに変換することに適している。しかも、推測の対象となる状態変数を変更することにより、全ての状態変数について未知の時系列データを推測することも可能である。   Conventional prediction of time-series data is a method for estimating future time-series data for a specific state variable using long-term low-dimensional time-series data observed in the past. On the other hand, the present invention is suitable for estimating future time series data of a specific state variable using short-term high-dimensional time series data observed in the past. Note that time-series data can be estimated not only for future time-series data after the period when the state variable is observed, but also for past time-series data before the period when the state variable is observed. is there. That is, it is suitable for converting known short-term high-dimensional time-series data into long-term low-dimensional time-series data including unknown time-series data. Moreover, it is possible to estimate unknown time-series data for all the state variables by changing the state variables to be estimated.

<短期的高次元時系列データと長期的低次元時系列データとの関係>
次に短期的高次元時系列データと長期的低次元時系列データとの関係について説明する。図1は、Takensの埋め込み理論による動的システムの再構築を概念的に示す説明図である。Takensの埋め込み理論は、動的システムにおいて、長期的低次元時系列データから動的特性を再構築することが可能であることを示している。
<Relationship between short-term high-dimensional time-series data and long-term low-dimensional time-series data>
Next, the relationship between short-term high-dimensional time-series data and long-term low-dimensional time-series data will be described. FIG. 1 is an explanatory diagram conceptually showing reconstruction of a dynamic system based on Takens' embedding theory. Takens' embedding theory shows that in dynamic systems, it is possible to reconstruct dynamic properties from long-term low-dimensional time-series data.

図1(a)は、状態変数x1 ,x2 ,x3 からなる3次元の動的システムのアトラクタを概念的に示している。図1(a)に示す動的システムに対し、十分な長さを有する期間Tの間、3個の状態変数のうちのx1 を観測して得られた時系列データをy=x1 (t)として示したものが、図1(b)に示すグラフである。即ち、図1(b)は、3次元の動的システムを観測して得られた長期的低次元時系列データを示している。 FIG. 1A conceptually shows an attractor of a three-dimensional dynamic system composed of state variables x 1 , x 2 and x 3 . For the dynamic system shown in FIG. 1A, time series data obtained by observing x 1 of the three state variables during a period T having a sufficient length is expressed as y = x 1 ( What is shown as t) is the graph shown in FIG. That is, FIG. 1B shows long-term low-dimensional time series data obtained by observing a three-dimensional dynamic system.

図1(b)に示す観測された長期的低次元時系列データを基に、時間遅延量「τ」についての遅延埋め込みにより生成した期間「T−2τ」の時系列データを示したものが、図1(c)に示すグラフである。図1(c)は、z1 (t)=y(t)、z2 (t)=y(t+τ)及びz3 (t)=y(t+2τ)として示される3次元時系列データを示している。 Based on the observed long-term low-dimensional time-series data shown in FIG. 1B, the time-series data of the period “T-2τ” generated by delay embedding for the time delay amount “τ” is shown. It is a graph shown in FIG.1 (c). FIG. 1C shows three-dimensional time-series data represented as z 1 (t) = y (t), z 2 (t) = y (t + τ) and z 3 (t) = y (t + 2τ). Yes.

図1(c)に示した3次元時系列データ(z1 ,z2 ,z3 )からなる位相空間として、Pn=(z1 (tn ),z2 (tn ),z3 (tn ))として示される動的システムのアトラクタを再構築したものが図1(d)に示す概念図である。図1(d)は、3次元の時系列データz1 (tn ),z2 (tn ),z3 (tn )からなる位相空間において、Pn=(z1 (tn ),z2 (tn ),z3 (tn ))として示される動的システムのアトラクタを概念的に示している。図1(d)に示すアトラクタは、図1(a)に示すアトラクタと位相幾何学的に同相である。 As a phase space composed of the three-dimensional time series data (z 1 , z 2 , z 3 ) shown in FIG. 1C, Pn = (z 1 (t n ), z 2 (t n ), z 3 (t The conceptual diagram shown in FIG. 1 (d) is obtained by reconstructing the attractor of the dynamic system shown as n )). FIG. 1 (d) shows Pn = (z 1 (t n ), z in a phase space consisting of three-dimensional time series data z 1 (t n ), z 2 (t n ), z 3 (t n ). 2 (t n), z 3 (t n)) conceptually illustrates the attractor dynamic system shown as. The attractor shown in FIG. 1 (d) is topologically in phase with the attractor shown in FIG. 1 (a).

図1を用いて説明したようにTakensの埋め込み理論は、長期的低次元時系列データから短期的高次元時系列データを導出する方法を提供している。本願では、高次元の時系列データ、例えば短期的高次元時系列データを、長期的低次元時系列データに変換する変換マップを用いる方法を開示する。変換マップは、各変数間の相互作用情報を抽出し、更にその相互作用情報を時系列情報に変換することができるので、短期的高次元時系列データから長期的低次元時系列データを導出することが可能となる。このように、本願では、例えば、Takensの埋め込み理論を用いて行われた長期的低次元時系列データから短期的高次元時系列データへの変換の逆変換として、従来は実現されていなかった短期的高次元時系列データから長期的低次元時系列データへの変換をも可能とする方法を開示するものである。   As described with reference to FIG. 1, Takens' embedding theory provides a method for deriving short-term high-dimensional time-series data from long-term low-dimensional time-series data. The present application discloses a method using a conversion map for converting high-dimensional time-series data, for example, short-term high-dimensional time-series data into long-term low-dimensional time-series data. The transformation map can extract the interaction information between each variable, and further convert the interaction information into time-series information, so that long-term low-dimensional time-series data is derived from short-term high-dimensional time-series data. It becomes possible. Thus, in the present application, for example, as a reverse conversion of conversion from long-term low-dimensional time-series data to short-term high-dimensional time-series data performed using Takens embedding theory, short-term that has not been realized in the past Disclosed is a method that enables conversion from static high-dimensional time-series data to long-term low-dimensional time-series data.

<逆埋め込み理論(逆変換)の概要>
時系列データの変換に用いる変換マップΦについて説明する。ユークリッド空間Rn の開部分集合UにおけるフローF、ボックス次元がdである開部分集合Uのコンパクト部分集合A、及び整数L(L>2d)を規定し、時間間隔τ(τ>0)が適切な値をとるものとする。この場合、開部分集合Uにおけるほとんど全てのスムーズ関数y及び帰結遅延座標z=(y(x),y(FT (x)),... ,y(F(L-1)T(x)))T (x∈A)に対して、変換マップΦ:Rn →RL が存在する(下付添字のT 、(L-1)Tは、τ、(L-1) τを示す。)。このときΦ(x)=zは、一対一であり、コンパクト部分集合Aに含まれる滑らかな多様体の任意のコンパクト部分集合上でのはめ込みである。そして、変換マップΦは、コンパクト部分集合Aに含まれる状態xをフローFに沿って、将来の状態y(FiT(x)),(i=1,2,... ,L−1)を示すスカラー関数に変換することができる(下付添字のiTはi τを示す)。
<Outline of reverse embedding theory (inverse transformation)>
The conversion map Φ used for converting time series data will be described. The flow F in the open subset U of the Euclidean space R n , the compact subset A of the open subset U whose box dimension is d, and the integer L (L> 2d) are defined, and the time interval τ (τ> 0) is Appropriate values shall be taken. In this case, almost all smooth functions y and resulting delay coordinates z = (y (x), y (F T (x)),..., Y (F (L−1) T (x ))) For T (x∈A), there is a transformation map Φ: R nRL (subscripts T and (L-1) T denote τ and (L-1) τ) .) At this time, Φ (x) = z is one-to-one, and is an inset on an arbitrary compact subset of a smooth manifold included in the compact subset A. Then, the transformation map Φ shows the state x included in the compact subset A along the flow F and the future state y (F iT (x)), (i = 1, 2,..., L−1). (Subscript iT indicates i τ).

逆埋め込み理論に基づく短期的高次元時系列データから長期的低次元時系列データへの変換について詳述する。前述の式(1)を用いてn次元の状態ベクトルとして示した動的システムの系x(t)には、ボックス次元dのコンパクト部分集合Aで表されるアトラクタが存在する。また、状態変数xi (t)を用いた関数としてy(t)を規定する。ここでは、簡単にするために、y(t)=xi (t)とする。さらに、z1 (t)=y(t),z2 (t)=y(t+τ),... ,zL (t)=y(t+(L−1)τ)(τ:遅延定数)のようにy(t)の遅延埋め込みを行うことにより、下記式(2)として示される新たな系を構築することができる。 The conversion from short-term high-dimensional time-series data to long-term low-dimensional time-series data based on reverse embedding theory will be described in detail. In the system x (t) of the dynamic system shown as an n-dimensional state vector using the above equation (1), there is an attractor represented by a compact subset A of the box dimension d. Further, y (t) is defined as a function using the state variable x i (t). Here, for simplicity, y (t) = x i (t). Further, z 1 (t) = y (t), z 2 (t) = y (t + τ),..., Z L (t) = y (t + (L−1) τ) (τ: delay constant) By performing delay embedding of y (t) as in the following, a new system represented by the following formula (2) can be constructed.

z(t)=(z1 (t), z2 (t),... ,zL (t))T ∈RL ・・・式(2) z (t) = (z 1 (t), z 2 (t),..., z L (t)) T ∈ R L (2)

式(2)においてz(t)は再構築された系∈RL の状態変数を示し、Lは当該系の次元を示している。 Z (t) in Equation (2) shows a state variable of the system ∈R L reconstructed, L is shows the dimensions of the system.

非特許文献1として示したTakensの埋め込み理論及びSauer 、Yorke 、Casdagliのフラクタルアトラクタに対する一般化された埋め込み理論によると、L>2dの場合再構築された系z(t)のアトラクタは元の系x(t)と位相幾何学的に同相である。したがって、系x(t)のユークリッド空間Rn と系z(t)のユークリッド空間RL との間にマップΦ(Φ(x(t)))=z(t))が存在する。マップΦは、系x(t)を写像して系z(t)に変換する変換行列である。マップΦ下では、位相幾何学的に同相という観点から、一次元の時系列データy(t)は、x(t)のm点の時点のデータと同様のアトラクタ情報を保有している。したがって、当該マップΦによって、系x(t)∈Rn は系z(t)∈RL に変換される。即ち、マップΦは、始域x(t)∈Rn から終域z(t)∈RL への写像である。 According to Takens' embedding theory and the generalized embedding theory for Sauer, Yorke and Casdagli's fractal attractor shown as Non-Patent Document 1, the attractor of the reconstructed system z (t) is the original system when L> 2d. Topologically in phase with x (t). Therefore, a map Φ (Φ (x (t))) = z (t)) exists between the Euclidean space R n of the system x (t) and the Euclidean space R L of the system z (t). The map Φ is a transformation matrix that maps the system x (t) and transforms it into the system z (t). Under the map Φ, from the viewpoint of topologically in-phase, the one-dimensional time series data y (t) has the same attractor information as the data at the point m of x (t). Thus, by the map [Phi, system x (t) ∈R n are converted to the system z (t) ∈R L. That is, the map Φ is a mapping from the start region x (t) εR n to the end region z (t) εR L.

マップΦについて更に詳述する。時間間隔τでm点観測したn次元の時系列データを、状態変数x(t)∈Rn を用いてxj =x(t+(j−1)τ),(j=1,2,... ,m)で表すものとすると、マップΦは、Φ(x1 ,x2 ,... ,xm )又は下記の式(3)として得ることができる。 The map Φ will be further described in detail. The n-dimensional time series data observed at m points at time interval τ is expressed as x j = x (t + (j−1) τ), (j = 1, 2,...) Using state variable x (t) ∈R n . .., M), the map Φ can be obtained as Φ (x 1 , x 2 ,..., X m ) or the following equation (3).

上記式(3)において、xij=xi (t+(j−1)τ)、zij=zi (t+(j−1)τ)であり、zij=y(t+(i+j−2)τ)であることから、マップΦは、下記の式(4)に書き換えることができる。 In the above equation (3), x ij = x i (t + (j−1) τ), z ij = z i (t + (j−1) τ), and z ij = y (t + (i + j−2)) Since τ), the map Φ can be rewritten as the following equation (4).

Φ:X→Y ・・・式(4)   Φ: X → Y (4)

式(4)において、行列X及びYは下記の通りである。   In Equation (4), the matrices X and Y are as follows.

以上のように、マップΦによって、XがYに変換される。式(4)として示したように、Xは、n次元の状態変数x(t)のそれぞれのm点の時点での観測データからなる高次元行列である。また、Yは、形式上L×mの行列であるが、状態変数x(t)のうちのいずれか1つの状態変数y(t)の(m+L−1)個の時点のデータを、列ごとに時点を1つ前方へずらして配列した行列である。このように配列されたYは、状態変数y(t)として示される一次元の時系列データを複数集めたものとみなすこともできる。即ち、マップΦは、高次元時系列データXを一次元(低次元)時系列データYに変換する写像としての性質を有するということができる。   As described above, X is converted to Y by the map Φ. As shown in Expression (4), X is a high-dimensional matrix composed of observation data at the time of each m point of the n-dimensional state variable x (t). Y is a matrix of L × m in form, and the data at (m + L−1) time points of any one state variable y (t) of the state variables x (t) The matrix is arranged by shifting the time points forward by one. Y arranged in this way can be regarded as a collection of a plurality of one-dimensional time-series data indicated as the state variable y (t). That is, it can be said that the map Φ has a property as a map for converting the high-dimensional time-series data X into the one-dimensional (low-dimensional) time-series data Y.

状態変数y(t)は、状態変数x(t)として示される複数の次元(項目)の観測データのうちから選択された任意の一の次元(項目)について導出した長期間の一次元時系列データである。また、他の任意の次元(項目)の状態変数x(t)を選択し、新たな系z(t)を再構築することも可能である。従って、Xを複数のYに変換することが可能であり、理論的にはXに含まれる全ての状態変数x(t)について、一次元時系列データYを導出することが可能である。   The state variable y (t) is a long-term one-dimensional time series derived for any one dimension (item) selected from observation data of a plurality of dimensions (items) indicated as the state variable x (t). It is data. It is also possible to select a state variable x (t) of any other dimension (item) and reconstruct a new system z (t). Therefore, it is possible to convert X into a plurality of Ys, and theoretically, it is possible to derive the one-dimensional time series data Y for all the state variables x (t) included in X.

元の系についての観測データを示す状態変数x(t)の時系列的に観測して得られた点の数がm点の場合、変換された一次元時系列データy(t)に含まれる要素の個数は、(m+L−1)個となる。上述のようにL>2dの場合、再構築された系のアトラクタは元の系のアトラクタと位相幾何学的に同相である。このため状態変数x(t)に係る観測データの数より変換後の時系列データy(t)に含まれる要素の個数の方が多くなる。従って、マップΦにより、n個の状態変数についてm点分の時点で観測した得られた短期的高次元時系列データは、1個の状態変数についてm+L−1点分の時点における長期的低次元時系列データに変換することが可能であるということができる。本願では、このような変換を「逆埋め込み」と称する。   When the number of points obtained by time series observation of the state variable x (t) indicating the observation data for the original system is m, it is included in the converted one-dimensional time series data y (t). The number of elements is (m + L−1). As described above, when L> 2d, the attractor of the reconstructed system is topologically in phase with the attractor of the original system. For this reason, the number of elements included in the converted time-series data y (t) is larger than the number of observation data related to the state variable x (t). Accordingly, the obtained short-term high-dimensional time series data observed at the time of m points for the n state variables by the map Φ is the long-term low dimension at the time of m + L−1 points for one state variable. It can be said that it can be converted into time-series data. In the present application, such conversion is referred to as “reverse embedding”.

<マップΦの決定方法>
次に、マップΦの決定方法について説明する。上述の逆埋め込み理論による変換を行うためには、マップΦを決定しなければならない。マップΦの決定は、系x(t)∈Rn の各変数のm点の時点において観測された値xj =x(t+(j−1)τ),(j=1,2,... ,m)を用いて、Φ1 (xj )=yj ,(j=1,2,... ,m)及びΦi (xj )=Φi-1 (xj+1 ),(i=2,... ,L),(j=1,... ,m−1)という(m+(L−1)×(m−1))個の制約条件下で、Φ=(Φ1 ,Φ2 ,... ,ΦL T を導出することにより行われる。本願では、予測の精度を高めるために、系x(t)∈Rn の性質に応じて、マップΦが線形性を有する線形マップである場合と線形性を有しない非線形マップである場合とについて、それぞれのマップΦの決定方法について説明する。
<Determination method of map Φ>
Next, a method for determining the map Φ will be described. In order to perform the conversion based on the reverse embedding theory described above, the map Φ must be determined. The map Φ is determined by the values x j = x (t + (j−1) τ), (j = 1, 2,...) Observed at the point m of each variable of the system x (t) ∈R n. , M), Φ 1 (x j ) = y j , (j = 1, 2,..., M) and Φ i (x j ) = Φ i−1 (x j + 1 ), Under (m + (L−1) × (m−1)) constraint conditions (i = 2,..., L), (j = 1,..., M−1), Φ = ( Φ 1 , Φ 2 , ... , Φ L ) T. In the present application, in order to increase the accuracy of prediction, depending on the properties of the system x (t) εR n , the case where the map Φ is a linear map having linearity and the case of being a nonlinear map having no linearity A method for determining each map Φ will be described.

<線形マップΦの決定>
系x(t)∈Rn の変化に線形性がある場合、又は線形近似できる場合、変換マップΦとして線形性を有する線形マップΦを用いる。線形マップΦによる写像Φ(X)は、L行×n列の行列Aとして、下記の式(5)にて表現することができる。
<Determination of linear map Φ>
When the change of the system x (t) εR n has linearity or can be linearly approximated, the linear map Φ having linearity is used as the transformation map Φ. The mapping Φ (X) by the linear map Φ can be expressed by the following equation (5) as a matrix A of L rows × n columns.

Φ(X)=AX=Y ・・・式(5)   Φ (X) = AX = Y (5)

式(5)において、行列X及びYは、前述の式(4)として示した通りであり、行列Aは下記の通りである。   In the equation (5), the matrices X and Y are as shown as the above equation (4), and the matrix A is as follows.

Xは、各状態変数x(t)∈Rn のm点の時点で観測された観測データからなるn行×m列の行列である。Yは、x(t)のうちのいずれか1つの状態変数y(t)のm+L−1点分の時点のデータを一列ごとに時点を前方へ1つずらして配列したL行×m列の行列である。さらに、式(5)として示したAX=Yは、下記の式(6)として表すことができる。 X is a matrix of n rows × m columns composed of observation data observed at m points of each state variable x (t) ∈R n . Y is an L row × m column in which data of m + L−1 points of any one state variable y (t) in x (t) is arranged by shifting the time point forward by one for each column. It is a matrix. Furthermore, AX = Y shown as the equation (5) can be expressed as the following equation (6).

式(6)において、ai =(ai1,ai2,... ,ain),(i=1,2,... ,L)、xj =(x1j,x1j,... ,x1jT ,(j=1,2,... ,m)である。式(6)から、x1 ,x2 ,... ,xm について得られた観測データy1 ,y2 ,... ,ym に対して、m個の線形方程式ai ・xj =yj ,(j=1,2,... ,m)と、(m−1)×(L−1)個の線形方程式ai ・xj −ai-1 ・xj+1 =0,(i=2,3,... ,n、j=1,2,... ,m−1)を得ることができる。y(t)において、y1 ,y2 ,... ,ym が既知の観測データであり、ym+1 ,ym+2 ... ,yL+m-1 が推測の対象となる未知の時系列データである。従って、式(6)として示した式から、y(t)に含まれる未知の時系列データを算出することにより、x(t)から選択された状態変数y(t)の時点mより後の時系列データを算出することができる。即ち、選択された次元(項目)に係る状態変数x(t)の未知の時系列データを導出することが可能となり、導出した時系列データに基づいて観測対象の状態変化を推測することが可能となる。 In equation (6), a i = (a i1 , a i2 ,..., A in ), (i = 1, 2,..., L), x j = (x 1j , x 1j ,... , X 1j ) T , (j = 1, 2,..., M). From equation (6), x 1, x 2, ..., observations were obtained for x m data y 1, y 2, ..., with respect to y m, m pieces of linear equations a i · x j = Y j , (j = 1, 2,..., M) and (m−1) × (L−1) linear equations a i · x j −a i−1 · x j + 1 = 0, (i = 2, 3,..., N, j = 1, 2,..., M−1) can be obtained. In y (t), y 1, y 2, ..., y m are known observation data, y m + 1, y m + 2 ..., and the target of y L + m-1 is presumed This is unknown time-series data. Therefore, by calculating unknown time-series data included in y (t) from the equation shown as equation (6), the state variable y (t) selected from x (t) is later than time m. Time series data can be calculated. That is, it is possible to derive unknown time-series data of the state variable x (t) related to the selected dimension (item), and it is possible to estimate the state change of the observation target based on the derived time-series data. It becomes.

次に線形マップΦに基づく計算アルゴリズムについて説明する。先ず、観測された時系列データx1 ,x2 ,... ,xm を取得し、選択された項目に係る状態変数xs (t)に係る観測データに、時系列データを示す変数y1 ,y2 ,... ,ym を割り付ける。これらの時系列データから下記の式(7)に示す数式を生成し、生成した数式を用いたa1 についての一次方程式を解いて、a1 を求める(手順Sa1)。 Next, a calculation algorithm based on the linear map Φ will be described. First, the observed time series data x 1 , x 2 ,..., X m are acquired, and the variable y indicating the time series data is added to the observed data related to the state variable x s (t) related to the selected item. 1, y 2, ..., allocates y m. A mathematical formula shown in the following formula (7) is generated from these time series data, and a linear equation for a 1 using the generated mathematical formula is solved to obtain a 1 (procedure Sa1).

1 ・xj =yj ・・・式(7)
但し、j=1,2,... ,m
a 1 · x j = y j (7)
Where j = 1, 2,..., M

次に、i=2,3,... ,Lについて示した下記の式(8)に基づいて、ai についての一次方程式をi=2,3,... ,Lの順に生成し、生成した数式を用いたai についての一次方程式を解く手順を繰り返し行いai を求める(手順Sa2)。 Then, i = 2,3, ..., based on the equation (8) below shows the L, and the primary equation for a i i = 2,3, ..., generated in the order of L, The procedure for solving the linear equation for a i using the generated mathematical expression is repeated to obtain a i (procedure Sa2).

i ・xj =yi+j-1 ・・・式(8)
但し、j=1,2,... ,m−1
a i · x j = y i + j−1 Expression (8)
Where j = 1, 2,..., M−1.

式(7)及び(8)に基づき算出した係数ai ,(i=1,2,... ,L)を用いて、m以降の時点における時系列データym+i-1 を下記の式(9)により算出する(手順Sa3)。 Using the coefficients a i , (i = 1, 2,..., L) calculated based on the equations (7) and (8), the time series data y m + i−1 at the time after m is expressed as follows: Calculation is performed according to equation (9) (procedure Sa3).

m+i-1 =ai ・xm ・・・式(9) y m + i-1 = a i · x m (9)

式(9)により算出された時系列データym+i-1 が、推測すべき未知の時系列データである。 The time series data ym + i-1 calculated by the equation (9) is unknown time series data to be estimated.

このような線形マップΦに基づく計算アルゴリズムでは、n×L個の未知数に対して、(m−1)×L+1個の線形方程式が存在し、これらの線形方程式を解くために繰り返し演算が実施される。時系列データXとして、短期的高次元時系列データXを用いる場合、n≫mであり、n×L≫(m−1)×L+1である。通常、未知の変数の数が線形方程式の数よりも遙かに多い場合、解を求めることができない。本願では、元の系の次元が高く、しかも一般的にm点の時点におけるデータが系の漸近的アトラクタから観測されたものであるため、その次元dが低く、d≪nとなる系に適用することを前提としている。Lはdより若干大きい整数であるのでL≪nとなる。従って、n×L個の未知の変数には線形的に独立である変数が少ない状態となる。従って、一定の条件を満足すれば、解を求めることが可能である。   In such a calculation algorithm based on the linear map Φ, there are (m−1) × L + 1 linear equations for n × L unknowns, and iterative operations are performed to solve these linear equations. The When the short-term high-dimensional time-series data X is used as the time-series data X, n >> m and n × L >> (m−1) × L + 1. Usually, if the number of unknown variables is much larger than the number of linear equations, a solution cannot be found. In this application, since the dimension of the original system is high and the data at the point m is generally observed from the asymptotic attractor of the system, the dimension d is low and applied to a system where d << n. It is assumed that Since L is an integer slightly larger than d, L << n. Therefore, there are few variables that are linearly independent of n × L unknown variables. Therefore, a solution can be obtained if a certain condition is satisfied.

次に、解を求める条件について説明する。上述の式(8)は、下記の式(10)として表すことができる。   Next, conditions for obtaining a solution will be described. The above equation (8) can be expressed as the following equation (10).

i ・xj =yi+j-1 =ai-1 ・xj+1 ・・・式(10) a i · x j = y i + j -1 = a i -1 · x j +1 (10)

式(10)において、ai-1 には、決定すべきL個の変数が含まれている。線形方程式理論に基づき、係数行列のランクによって、線形方程式の解を求められるか否かが決まる。ここで、下記の式(11)に示すようにX~ (X~ は、Xの上方にチルダ、以降の説明において同じ。)を規定するものとする。 In equation (10), a i-1 includes L variables to be determined. Based on the theory of linear equations, the rank of the coefficient matrix determines whether or not the solution of the linear equations can be obtained. Here, as shown in the following formula (11), X ~ (X ~ is a tilde above X, the same in the following description) is defined.

上述の計算アルゴリズムにおいて、rank(X~ )>Lの場合、解を求めることができない。一方、rank(X~ )≦Lの場合、解を求めることが可能であり、特に、rank(X~ )=Lの場合、解を正確に求めることができる。当該条件を満足するように観測する時点の数mを適切な値に設定することにで、解を求めることが可能となり、特にm=L+1となるように設定することで、線形マップΦを正確に求めることが可能となる。   In the above calculation algorithm, when rank (X ~)> L, a solution cannot be obtained. On the other hand, when rank (X˜) ≦ L, a solution can be obtained. In particular, when rank (X˜) = L, the solution can be obtained accurately. It is possible to obtain a solution by setting the number m of observation time points to an appropriate value so as to satisfy the condition. In particular, by setting m = L + 1, the linear map Φ can be accurately set. It becomes possible to ask for.

<非線形マップΦの決定>
系x(t)∈Rn の変化に線形性が無く、また線形近似することができない程度に非線形性の強い系に対しては、上述の線形マップΦを用いても、高精度な予測を行うことは困難である。このような非線形性の強い系に対して対応することが可能な非線形マップΦを決定する方法について説明する。非線形マップΦの各要素は、下記の式(12)を用いて表される。
<Determination of nonlinear map Φ>
System x (t) ∈R n without linearity in a change in, and for the highly nonlinear system to the extent that they can not be linearly approximated, even using a linear map Φ described above, a highly accurate prediction It is difficult to do. A method of determining a nonlinear map Φ that can be applied to such a highly nonlinear system will be described. Each element of the nonlinear map Φ is expressed using the following equation (12).

式(12)において、gl (x),l=1,2,... ,kは、非線形マップΦにおける基底関数であり、ali,(l=1,2,... ,k、i=1,2,... ,L)は、それぞれの係数である。基底関数gl (x)としては、多次元方程式、三角関数、フーリエ級数に係る関数、ニューラルネットワークの近似関数、ファジー集合に係る関数、各種フラクタル関数等の様々な非線形関数を用いることができる。 In Expression (12), g l (x), l = 1, 2,..., K is a basis function in the nonlinear map Φ, and a li , (l = 1, 2,..., K, i = 1, 2,..., L) are the respective coefficients. As the basis function g l (x), various nonlinear functions such as a multidimensional equation, a trigonometric function, a function related to a Fourier series, an approximate function of a neural network, a function related to a fuzzy set, and various fractal functions can be used.

このような式(12)を用いることにより、前述の線形マップΦの求め方を応用して、非線形マップΦを求めることが可能となる。ただし、kの数は、観測する時点mの数と比べて遙かに多くなりがちであるため、式(12)に基づいて非線形マップΦを求めることが困難な場合も生じる。このような場合でも、非線形マップΦを求めることは可能である。本願では、非線形マップΦを求める方法として下記の方法を開示する。   By using the equation (12), the nonlinear map Φ can be obtained by applying the above-described method for obtaining the linear map Φ. However, since the number of k tends to be much larger than the number of observation points m, it may be difficult to obtain the nonlinear map Φ based on the equation (12). Even in such a case, it is possible to obtain the nonlinear map Φ. In the present application, the following method is disclosed as a method for obtaining the nonlinear map Φ.

非線形マップΦに基づく計算アルゴリズムについて説明する。先ず、観測された時系列データx1 ,x2 ,... ,xm を取得し、選択された項目に係る状態変数xs (t)に係る観測データに、時系列データを示す変数y1 ,y2 ,... ,ym を割り付ける。そして、基底関数gl (x),l=1,2,... ,k及びその展開次数kを選択する(手順Sb1)。 A calculation algorithm based on the nonlinear map Φ will be described. First, the observed time series data x 1 , x 2 ,..., X m are acquired, and the variable y indicating the time series data is added to the observed data related to the state variable x s (t) related to the selected item. 1, y 2, ..., allocates y m. Then, a basis function g l (x), l = 1, 2,..., K and its expansion order k are selected (step Sb1).

次に、Φi (xj )=x~ j T ・αi となるようにx~ j =[g1 (xj ),g2 (xj ),... ,g3 (xj ),]T (但し、j=1,2,... ,m)及びαi を構築する(手順Sb2)。 Next, x j = [g 1 (x j ), g 2 (x j ),..., G 3 (x j ) so that Φ i (x j ) = x˜j T · α i. ,] T (where j = 1, 2,..., M) and α i are constructed (procedure Sb2).

次に、圧縮センシング手法により下記の式(13)に示す数式を生成し、生成した数式を解いてα1 を求める(手順Sb3)。 Next, the mathematical formula shown in the following formula (13) is generated by the compression sensing technique, and α 1 is obtained by solving the generated mathematical formula (procedure Sb3).

x~ j T ・α1 =yj ・・・式(13)
但し、j=1,2,... ,m
x ~ j T · α 1 = y j Expression (13)
Where j = 1, 2,..., M

次に、i=2,3,... ,Lについて示した下記の式(14)に基づいて、αi についての数式をi=2,3,... ,Lの順に生成し、生成した数式を用いたαi についての数式を圧縮センシング手法により解く手順を繰り返し行いαi を求める(手順Sb4)。 Next, based on the following formula (14) shown for i = 2, 3,..., L, formulas for α i are generated in the order of i = 2, 3,. The procedure for solving the mathematical expression for α i using the above mathematical formula is repeated by the compression sensing technique to obtain α i (procedure Sb4).

x~ j T ・αi =yi+j-1 ・・・式(14)
但し、j=1,2,... ,m−1
x ~ j T · α i = y i + j-1 ··· formula (14)
Where j = 1, 2,..., M−1.

式(14)に基づき算出した係数αi を用いて、m以降の時点における時系列データym+i-1 を下記の式(15)により算出する(手順Sb5)。 Using the coefficient α i calculated based on the equation (14), time series data ym + i−1 at the time point after m is calculated by the following equation (15) (procedure Sb5).

m+i-1 =x~ m T ・αi ・・・式(15) y m + i-1 = x ~ m T · α i (15)

式(15)により算出された時系列データym+i-1 が、推測すべき未知の時系列データである。このようにして、非線形マップΦを求めることが可能となる。 The time series data ym + i-1 calculated by the equation (15) is unknown time series data to be estimated. In this way, the nonlinear map Φ can be obtained.

<導出装置>
以上詳述した未知の時系列データを推測する方法は、コンピュータを用いた導出装置として応用することにより、産業上利用可能な発明として具現化することができる。本発明に係る導出装置は、経時的に変化する事象に関するn次元(nは2以上の整数)の項目それぞれについて時系列で観測して得られたm点(mは2以上の整数)の観測データに基づいて、前記観測データに含まれていない時点のデータを導出データとして導出する。図2は、本発明に係る導出装置の構成例を示すブロック図である。図2に示す導出装置1は、パーソナルコンピュータ、サーバコンピュータ、それに接続されるクライアントコンピュータ、その他各種コンピュータ等のコンピュータを用いて実現される。導出装置1は、制御部10、記録部11、記憶部12、入力部13、出力部14、取得部15等の各種機構を備えている。
<Deriving device>
The method for estimating unknown time-series data described in detail above can be embodied as an industrially applicable invention by applying it as a derivation device using a computer. The derivation device according to the present invention observes m points (m is an integer equal to or greater than 2) obtained by observing each of n-dimensional (n is an integer equal to or greater than 2) items related to events that change over time. Based on the data, data at a time point not included in the observation data is derived as derived data. FIG. 2 is a block diagram illustrating a configuration example of the derivation device according to the present invention. The derivation device 1 shown in FIG. 2 is realized using a computer such as a personal computer, a server computer, a client computer connected thereto, and other various computers. The deriving device 1 includes various mechanisms such as a control unit 10, a recording unit 11, a storage unit 12, an input unit 13, an output unit 14, and an acquisition unit 15.

制御部10は、CPU(Central Processing Unit )等の回路を用いて構成され、検出装置1全体を制御する機構である。   The control unit 10 is configured using a circuit such as a CPU (Central Processing Unit), and is a mechanism that controls the entire detection apparatus 1.

記録部11は、HDD(Hard Disk Drive)等の磁気記録機構、SSD(Solid State Disk)等の不揮発性半導体記録機構等の不揮発性の補助記録機構である。記録部11には、本発明に係る導出プログラム11a等の各種プログラム及びデータが記録されている。   The recording unit 11 is a non-volatile auxiliary recording mechanism such as a magnetic recording mechanism such as an HDD (Hard Disk Drive) or a non-volatile semiconductor recording mechanism such as an SSD (Solid State Disk). In the recording unit 11, various programs and data such as the derivation program 11a according to the present invention are recorded.

記憶部12は、SDRAM(Synchronous Dynamic Random Access Memory)、SRAM(Static Random Access Memory)等の揮発性の主記憶機構である。   The storage unit 12 is a volatile main storage mechanism such as an SDRAM (Synchronous Dynamic Random Access Memory) or an SRAM (Static Random Access Memory).

入力部13は、キーボード、マウス等のハードウェア、及びドライバ等のソフトウェアを備える入力機構である。   The input unit 13 is an input mechanism including hardware such as a keyboard and a mouse, and software such as a driver.

出力部14は、モニタ、プリンタ等のハードウェア、及びドライバ等のソフトウェアを備える出力機構である。   The output unit 14 is an output mechanism including hardware such as a monitor and a printer, and software such as a driver.

取得部15は、外部から観測データ等のデータを取得するLANボード、各種メモリスロット、無線通信デバイス、画像読取用デバイス等のハードウェア、及びドライバ等のソフトウェアを備えるインターフェース機構である。なお、入力部13を、取得部15として使用することも可能である。   The acquisition unit 15 is an interface mechanism including a LAN board that acquires data such as observation data from the outside, various memory slots, wireless communication devices, hardware such as an image reading device, and software such as a driver. The input unit 13 can be used as the acquisition unit 15.

そして、記録部11に記録されている導出プログラム11aを、記録部12に記憶し、制御部10の制御に基づき実行することにより、コンピュータは、導出プログラム11aに係る各種手順を実行し、本発明の導出装置1として機能する。なお、便宜上、記録部11及び記憶部12として区別しているが、両者とも各種情報の記録という同様の機能を有するものであり、装置の仕様、運用形態等に応じていずれの機構に記録させるかは、適宜決定することが可能である。同様に制御部10が備えるレジスタを記録部11として用いても良い。   Then, by storing the derivation program 11a recorded in the recording unit 11 in the recording unit 12 and executing it based on the control of the control unit 10, the computer executes various procedures related to the derivation program 11a. Functions as a derivation device 1 for For the sake of convenience, the recording unit 11 and the storage unit 12 are distinguished from each other, but both have the same function of recording various types of information, and which mechanism is used for recording according to the specifications of the apparatus, the operation mode, and the like. Can be determined as appropriate. Similarly, a register provided in the control unit 10 may be used as the recording unit 11.

次に、本発明に係る導出装置1の処理について説明する。図3は、本発明に係る導出装置1の線形性時系列データの導出処理の一例を示すフローチャートである。導出装置1の制御部10は、取得部15により、n次元の項目それぞれについて時系列に並ぶm点の観測データを取得する(S101)。なお、観測データは、前述のように、取得部15又は入力部13にて取得するが、記録部11に予め観測データを記録しておき、記録部11からの観測データの読み取りをもって観測データの取得としても良い。また、観測データとしては、各種測定装置による測定より得られたデータ、株価等の経済上のデータの他、画像データ等の様々なデータを用いることが可能である。観測データとして画像データを用いる場合、例えば、画像を構成する各画素又は所定の領域を構成する複数の画素の代表値について、明度、又はR(Red)値、G(Green)値及びB(Blue)値の階調値を取得し、観測データとして用いることが可能である。画像データそのものは、外部からの入力を受け付けて取得しても良く、また画像読取機能を備えるスキャナ等の取得部15を用いて画像を読み取ることで取得しても良い。   Next, the process of the derivation device 1 according to the present invention will be described. FIG. 3 is a flowchart showing an example of the derivation process of the linearity time series data of the derivation device 1 according to the present invention. The control unit 10 of the derivation device 1 uses the acquisition unit 15 to acquire observation data of m points arranged in time series for each of the n-dimensional items (S101). As described above, the observation data is acquired by the acquisition unit 15 or the input unit 13. However, the observation data is recorded in the recording unit 11 in advance, and the observation data is read by reading the observation data from the recording unit 11. It is good as acquisition. As observation data, it is possible to use various data such as image data in addition to data obtained by measurement by various measuring devices and economic data such as stock prices. When image data is used as the observation data, for example, with respect to representative values of each pixel constituting the image or a plurality of pixels constituting a predetermined region, brightness, R (Red) value, G (Green) value, and B (Blue) ) The tone value of the value can be acquired and used as observation data. The image data itself may be acquired by receiving an input from the outside, or may be acquired by reading an image using an acquisition unit 15 such as a scanner having an image reading function.

制御部10は、取得した観測データを記録部11に記録する(S102)。記録部11には、取得部15が取得した観測データを要素とし、項目が行方向に並び、時系列が列方向に並ぶように配置したn行×m列の行列X(始域行列)が記録される。なお、記録部11への実際の記録形式は、必ずしも行列形式で記録する必要は無く、行列形式に配置可能なように行及び列を示すアドレス、又はそれに代替される識別符号が付されていれば良い。   The control unit 10 records the acquired observation data in the recording unit 11 (S102). The recording unit 11 includes an n-row × m-column matrix X (starting matrix) in which the observation data acquired by the acquisition unit 15 is an element, items are arranged in the row direction, and time series are arranged in the column direction. To be recorded. The actual recording format in the recording unit 11 does not necessarily have to be recorded in a matrix format, and an address indicating a row and a column, or an identification code substituted for it, is attached so that it can be arranged in the matrix format. It ’s fine.

読み取った観測データを記録後、操作者は、入力部13を操作して、推測の対象となる項目を、導出する項目として指定し、更に推測すべき時点の数Lを指定する。制御部10は、入力部13から導出する項目及び導出する時点数の指定を受け付ける(S103)。ステップS103では、観測データに係る複数の項目x(t)のうちから指定された項目xs (t)の指定を受け付ける。前述した特定の状態変数xs (t)の選択に対応する処理である。また、時点数の指定とは、予測の対象となる時点の数、即ち前述したLの値を受け付ける処理である。ステップS103の処理としては、予め設定されている項目及び時点数を読み取ることで指定の受け付けとしても良い。また、指定する項目は、複数であっても良く、更には、全項目を指定しても良い。 After recording the read observation data, the operator operates the input unit 13 to specify an item to be estimated as an item to be derived, and further specifies the number L of points to be estimated. The control unit 10 accepts designation of items to be derived from the input unit 13 and the number of time points to be derived (S103). In step S103, designation of an item x s (t) designated from among a plurality of items x (t) related to observation data is accepted. This process corresponds to the selection of the specific state variable x s (t) described above. The designation of the number of time points is a process of receiving the number of time points to be predicted, that is, the value of L described above. As the processing in step S103, the designation may be accepted by reading preset items and the number of points in time. Further, there may be a plurality of items to be specified, and all items may be specified.

制御部10は、観測データ及び導出データを変数に割り付ける(S104)。ステップS104において、観測データに対しては、変数y1 ,y2 ,... ,ym を割り付けて記録部11に記録する。また、ステップS102にて指定された時点の数Lに対応する時点m+1,m+2,... ,m+L−1に対応する変数ym+1 ,ym+2 ,... ,ym+L-1 を定義する。定義された変数ym+1 ,ym+2 ,... ,ym+L-1 は、導出データを割り付ける変数として記録部11に記録される。記録部11に記録される変数列y1 ,y2 ,... ,ym ,ym+1 ,ym+2 ,... ,ym+L-1 は、以降の処理により、1次元の行列Y(終域行列)として扱われる。 The control unit 10 assigns observation data and derived data to variables (S104). In step S104, for the observed data, variables y 1, y 2, ..., by assigning y m recorded in the recording unit 11. Also, variables ym + 1 , ym + 2 ,..., Ym + L corresponding to the time points m + 1, m + 2,..., M + L-1 corresponding to the number L of time points specified in step S102. Define -1 . The defined variables y m + 1 , y m + 2 ,..., Y m + L-1 are recorded in the recording unit 11 as variables to which the derived data is assigned. Variable column y 1, y 2 which are recorded in the recording unit 11, ..., y m, y m + 1, y m + 2, ..., y m + L-1 is the subsequent processing, 1 Treated as a dimensional matrix Y (final matrix).

制御部10は、変数に割り付けた観測データ及び導出データから、線形マップΦの1行目の要素a1 に係る数式を生成し(S105)、生成した数式に基づいて要素a1 を算出する(S106)。ステップS105〜106では、前述の線形マップΦの決定として説明した方法のうち、手順Sa1に対応する処理を実行する。 The control unit 10 generates a mathematical expression related to the element a 1 in the first row of the linear map Φ from the observation data and the derived data assigned to the variable (S105), and calculates the element a 1 based on the generated mathematical expression (S105). S106). In steps S105 to S106, processing corresponding to the procedure Sa1 is executed among the methods described as the determination of the linear map Φ described above.

制御部10は、ステップS106にて算出したa1 を元に、線形マップΦのi行目の要素ai に係る数式を逐次生成し(S107)、生成した数式に基づいて要素ai を逐次算出する(S108)。ステップS107〜S108では、前述の線形マップΦの決定として説明した処理のうち、手順Sa2に対応する処理を実行する。要素ai は、a2 ,a3 ,... ,の順で数式の生成及び演算を繰り返すことにより、即ち、ステップS107〜S108の処理を繰り返すことにより、順次算出される。 Based on a 1 calculated in step S106, the control unit 10 sequentially generates a mathematical formula related to the element a i in the i-th row of the linear map Φ (S107), and sequentially generates the element a i based on the generated mathematical formula. Calculate (S108). In steps S107 to S108, a process corresponding to the procedure Sa2 is executed among the processes described as the determination of the linear map Φ. The elements a i are sequentially calculated by repeating the generation and calculation of mathematical expressions in the order of a 2 , a 3 ,..., That is, by repeating the processes of steps S107 to S108.

制御部10は、算出したai を要素とする線形マップΦと、観測データxm とに基づく演算により、時系列データym+i-1 を導出する(S109)。ステップS109では、前述の線形マップΦの決定として説明した方法のうち、手順Sa3に対応する処理を実行する。 The control unit 10 derives time-series data y m + i-1 by calculation based on the linear map Φ having the calculated a i as an element and the observation data x m (S109). In step S109, the process corresponding to the procedure Sa3 is executed among the methods described as the determination of the linear map Φ.

制御部10は、ステップS103にて指定された項目全てについて時系列データの導出を行ったか否かを判定する(S110)。   The control unit 10 determines whether time-series data has been derived for all items specified in step S103 (S110).

ステップS110において、時系列データを導出していない項目があると判定した場合(S110:NO)、制御部10は、ステップS104に戻り、以降の処理を繰り返すことで、導出していない項目についての時系列データを導出する。   If it is determined in step S110 that there is an item for which time-series data has not been derived (S110: NO), the control unit 10 returns to step S104, and repeats the subsequent processing to determine the items that have not been derived. Deriving time series data.

ステップS110において、全ての項目について時系列データを導出したと判定した場合(S110:YES)、制御部10は、導出した各項目についての時系列データym+i-1 を出力部14から出力する(S111)。ステップS111における出力としては、モニタへの表示、プリンタからの印刷の他、外部の装置への送信、記録部11への記録等の様々な方法にて行われる。 If it is determined in step S110 that time series data has been derived for all items (S110: YES), the control unit 10 outputs time series data ym + i-1 for each derived item from the output unit 14. (S111). The output in step S111 is performed by various methods such as display on a monitor, printing from a printer, transmission to an external apparatus, recording on the recording unit 11, and the like.

以上のようにして、線形性時系列データの導出処理が実行される。   As described above, the derivation process of the linearity time series data is executed.

次に、非線形性の時系列データの導出処理について説明する。図4は、本発明に係る導出装置1の非線形性時系列データの導出処理の一例を示すフローチャートである。導出装置1の制御部10は、取得部15により、n次元の項目それぞれについてm点の観測データを取得し(S201)、取得した観測データを記録部11に記録する(S202)。   Next, a process for deriving nonlinear time-series data will be described. FIG. 4 is a flowchart showing an example of the derivation process of the nonlinear time series data of the derivation device 1 according to the present invention. The control unit 10 of the derivation device 1 acquires m-point observation data for each of the n-dimensional items by the acquisition unit 15 (S201), and records the acquired observation data in the recording unit 11 (S202).

読み取った観測データを記録後、操作者は、入力部13を操作して、推測の対象となる項目を、導出する項目として指定し、更に推測すべき時点の数Lを指定する。制御部10は、入力部13から導出する項目及び導出する時点数の指定を受け付ける(S203)。   After recording the read observation data, the operator operates the input unit 13 to specify an item to be estimated as an item to be derived, and further specifies the number L of points to be estimated. The control unit 10 accepts designation of items to be derived from the input unit 13 and the number of points to be derived (S203).

さらに、操作者は、入力部13を操作して、基底関数g1 (x)及び次数kの指定を受ける(S204)。ステップS204では、前述の非線形マップΦの決定として説明した方法のうち、手順Sb1に対応する処理を実行する。なお、ステップS204の処理としては、予め設定されている基底関数及び次数を読み取ることで指定の受け付けとしても良い。 Further, the operator operates the input unit 13 and receives designation of the basis function g 1 (x) and the order k (S204). In step S204, the process corresponding to the procedure Sb1 is executed among the methods described as the determination of the nonlinear map Φ. In addition, as a process of step S204, it is good also as designation | designated reception by reading the basis function and order set beforehand.

制御部10は、非線形マップΦi (xj )を構成する基底関数gi (x)の行列x~ j T 及び係数αi を構築する(S205)。ステップS205では、前述の非線形マップΦの決定として説明した方法のうち、手順Sb2に対応する処理を実行する。 Control unit 10 constructs a matrix x ~ j T and coefficients alpha i of the nonlinear map [Phi i basis functions constituting the (x j) g i (x ) (S205). In step S205, the process corresponding to the procedure Sb2 is executed among the methods described as the determination of the nonlinear map Φ.

制御部10は、観測データ及び導出データの変数を割り付ける(S206)。更に、制御部10は、変数に割り付けた観測データ及び導出データから、非線形マップΦの1行目の要素α1 に係る数式を生成し(S207)、生成した数式に基づいて要素α1 を算出する(S208)。ステップS207〜S208では、前述の非線形マップΦの決定として説明した方法のうち、手順Sb3に対応する処理を実行する。 The control unit 10 assigns observation data and derived data variables (S206). Further, the control unit 10 generates a mathematical formula related to the element α 1 in the first row of the nonlinear map Φ from the observation data and the derived data assigned to the variable (S207), and calculates the element α 1 based on the generated mathematical formula. (S208). In steps S207 to S208, processing corresponding to the procedure Sb3 is executed among the methods described as the determination of the nonlinear map Φ.

制御部10は、ステップS208にて算出したα1 を元に、非線形マップΦのi行目の要素αi に係る数式を逐次生成し(S209)、生成した数式に基づいて要素αi を逐次算出する(S210)。ステップS209〜S210では、前述の非線形マップΦの決定として説明した方法のうち、手順Sb4に対応する処理を実行する。要素αi は、α2 ,α3 ,... ,の順で数式の生成及び演算を繰り返すことにより、即ち、ステップS209〜S210の処理を繰り返すことにより、順次算出される。 Based on α 1 calculated in step S208, the control unit 10 sequentially generates mathematical expressions related to the element α i in the i-th row of the nonlinear map Φ (S209), and sequentially generates the elements α i based on the generated mathematical expressions. Calculate (S210). In steps S209 to S210, the process corresponding to the procedure Sb4 is executed among the methods described as the determination of the nonlinear map Φ. The element α i is sequentially calculated by repeating the generation and calculation of mathematical expressions in the order of α 2 , α 3 ,..., That is, by repeating the processing of steps S209 to S210.

制御部10は、算出したαi を要素とする非線形マップΦと、観測データxm とに基づく演算により、時系列データym+i-1 を導出する(S211)。ステップS211では、前述の非線形マップΦの決定として説明した方法のうち、手順Sb5に対応する処理を実行する。 The control unit 10 derives time-series data y m + i-1 by calculation based on the nonlinear map Φ having the calculated α i as an element and the observation data x m (S211). In step S211, the process corresponding to the procedure Sb5 is executed among the methods described as the determination of the nonlinear map Φ described above.

制御部10は、ステップS203にて指定された項目全てについて時系列データの導出を行ったか否かを判定する(S212)。   The control unit 10 determines whether time-series data has been derived for all items specified in step S203 (S212).

ステップS212において、時系列データを導出していない項目があると判定した場合(S212:NO)、制御部10は、ステップS206に戻り、以降の処理を繰り返すことで、導出していない項目についての時系列データを導出する。   In step S212, when it is determined that there is an item for which time-series data has not been derived (S212: NO), the control unit 10 returns to step S206, and repeats the subsequent processing to determine the items that have not been derived. Deriving time series data.

ステップS212において、全ての項目について時系列データを導出したと判定した場合(S212:YES)、制御部10は、導出した各項目についての時系列データym+i-1 を出力部14から出力する(S212)。 If it is determined in step S212 that time series data has been derived for all items (S212: YES), the control unit 10 outputs time series data ym + i-1 for each derived item from the output unit 14. (S212).

以上のようにして、非線形性時系列データの導出処理が実行される。   As described above, the process of deriving nonlinear time series data is executed.

<実際の動的システムへの適用例>
以上、詳述したように、本発明の導出装置1により、時系列データの導出処理として、未知の時系列データの推測を行うことができる。本発明の導出装置1にて実行される未知の時系列データの導出は、経時的に変換するn次元の項目を有する時系列データ、特に短期的高次元時系列データに基づいて、長期的低次元の時系列データの推測に有用である。その応用範囲は広く、株価、為替、物価等の金融市場、気象、電力消費量、生命分子レベルの進展データ、複雑な疾患の進展等の様々な分野に適用することができる。
<Example of application to an actual dynamic system>
As described above in detail, the deriving device 1 of the present invention can estimate unknown time-series data as the time-series data deriving process. The derivation of unknown time-series data executed by the derivation device 1 of the present invention is based on time-series data having n-dimensional items to be converted over time, particularly on the basis of short-term high-dimensional time-series data. Useful for estimating time-series data of dimensions. Its application range is wide, and it can be applied to various fields such as financial markets such as stock prices, exchange rates, prices, weather, power consumption, biomolecular level progress data, and complicated disease progress.

本発明を気象予測に適用する例について説明する。図5は、本発明に係る導出装置1が取得する観測データの一例を示す説明図である。図5は、気象衛星により太平洋南西部付近を撮像して得られた可視画像であり、台風が発生している状況を確認することができる。導出装置1は、図5に例示する可視画像から画素データを観測データとして取得する。取得する画素データは、可視画像を構成する全ての画素、画像中の特定の座標における画素、予め設定された領域毎の画素の代表値(例えば、平均値)等、適宜設定することができる。また画素データに用いる数値としては、モノクロ画像からは階調値、カラー画像からはR値、G値及びB値の各色成分における階調値等適宜設定することができる。   An example in which the present invention is applied to weather prediction will be described. FIG. 5 is an explanatory diagram showing an example of observation data acquired by the deriving device 1 according to the present invention. FIG. 5 is a visible image obtained by imaging the vicinity of the southwestern Pacific with a meteorological satellite, and it is possible to confirm a situation where a typhoon is generated. The deriving device 1 acquires pixel data as observation data from the visible image illustrated in FIG. The pixel data to be acquired can be set as appropriate, such as all pixels constituting the visible image, pixels at specific coordinates in the image, and representative values (for example, average values) of pixels for each preset region. The numerical values used for the pixel data can be set as appropriate, such as gradation values for monochrome images and gradation values for R, G, and B color components for color images.

今回は本発明に係る疑似試験として、図5に例示する可視画像に含まれる300点の座標位置に対応する画素のR値、G値及びB値それぞれについて256段階に分級された階調値を900点の観測データとして取得した。更に、図5に示す台風の渦の中心、所謂、台風の目の位置を示すX座標及びY座標を観測データとして取得した。即ち、気象衛星による可視画像を、902次元の状態変数を含む系として捉え、系に含まれる902項目の観測データを取得した。また、観測データを取得する同様の処理を、所定の時間間隔で撮像して得られた21点の可視画像に対して行った。このような方法により、経時的に変化する系(動的システム)から一定の時間間隔で21点の時点における多次元の観測データを取得した。そして、導出する項目として、台風の目の位置を示すX座標及びY座標を指定し、線形マップΦに基づき、観測データに係る時点より後の8点の時点について、指定したX座標及びY座標の値を導出し、出力した。   This time, as a pseudo test according to the present invention, gradation values classified into 256 levels for each of the R value, G value, and B value of the pixels corresponding to the coordinate positions of 300 points included in the visible image illustrated in FIG. Obtained as 900 points of observation data. Further, the X-coordinate and Y-coordinate indicating the center of the typhoon vortex shown in FIG. That is, a visible image from a meteorological satellite was regarded as a system including a 902-dimensional state variable, and 902 items of observation data included in the system were acquired. In addition, a similar process for acquiring observation data was performed on 21 visible images obtained by imaging at predetermined time intervals. By such a method, multi-dimensional observation data at 21 points in time was acquired from a system that changes over time (dynamic system) at regular time intervals. Then, as the items to be derived, the X coordinate and the Y coordinate indicating the position of the typhoon eye are specified, and the specified X coordinate and Y coordinate for the eight time points after the time point related to the observation data based on the linear map Φ. The value of was derived and output.

図6は、本発明に係る導出装置1が出力する導出データの一例を示す説明図である。図6では、台風の目の位置を示す座標を、21点の観測データ、8点の導出データ及び8点の実際のデータについて地図上に示した説明図である。地図上の位置を明確にすべく陸地については海岸線を示している。図中左下に示された陸地がルソン島等のフィリピン諸島であり、左上に示された陸地が台湾島である。また、図中「△」で示した点が観測データにより示される台風の目の実際の位置、「○」で示した点が導出データにより示される台風の目の推測位置、そして「◇」で示した点が導出データに対応する時点における実際の台風の目の実際の位置を示している。   FIG. 6 is an explanatory diagram showing an example of derived data output by the deriving device 1 according to the present invention. FIG. 6 is an explanatory diagram showing coordinates indicating the position of the typhoon eye on the map with respect to 21 points of observation data, 8 points of derived data, and 8 points of actual data. In order to clarify the position on the map, the coastline is shown for the land. The land shown in the lower left of the figure is the Philippine Islands such as Luzon, and the land shown in the upper left is Taiwan Island. In addition, the point indicated by “△” in the figure is the actual position of the typhoon eye indicated by the observation data, the point indicated by “◯” is the estimated position of the typhoon eye indicated by the derived data, and “◇” The indicated points indicate the actual positions of the actual typhoon eyes at the time corresponding to the derived data.

図6に示すように、21点の観測データから導出された8点の導出データにより示される台風の中心の位置の経時変化、即ち、台風の予測進路は、実際の進路と近似していることを確認することができる。現在の気象に係る数値予測では、各地点の各高度における温度、湿度、気圧、風向き等の気象データを元に台風の進路予測を行っている。これに対して本発明は、気象衛星による可視画像のみからでも台風の進路予測を行うことが可能であることを示している。実際に本発明を適用する際には、各種気象データを観測データとすることにより、更には、これらの気象データと可視画像、赤外画像等の画像データから得られるデータとを観測データとして併用することにより、更に正確な進路予測の実現を見込むことができる。   As shown in FIG. 6, the temporal change in the position of the typhoon center indicated by the eight derived data derived from the 21 observation data, that is, the predicted course of the typhoon approximates the actual course. Can be confirmed. In the current numerical prediction related to weather, the course of typhoon is predicted based on weather data such as temperature, humidity, atmospheric pressure, and wind direction at each altitude at each point. On the other hand, the present invention shows that it is possible to predict the course of a typhoon from only a visible image from a weather satellite. When actually applying the present invention, various meteorological data are used as observation data. Furthermore, these meteorological data and data obtained from image data such as visible images and infrared images are used in combination as observation data. By doing so, it is possible to expect a more accurate course prediction.

前記実施の形態では、本発明の無数に存在する実施例の一部を開示したに過ぎず、マップΦの概念を用いて時系列データを導出(推測)する様々な方法に適用することが可能である。また、マップΦを算出する演算手順についても上述した方法に限らず、様々な方法を適用することが可能である。例えば、マップΦの要素に係る数式の生成及び要素の算出は、行毎に逐次算出するのではなく、複数の要素を一度に算出するアルゴリズムを適用しても良い。   In the above embodiment, only a part of the infinite number of examples of the present invention is disclosed, and it can be applied to various methods for deriving (estimating) time series data using the concept of the map Φ. It is. The calculation procedure for calculating the map Φ is not limited to the method described above, and various methods can be applied. For example, an algorithm for calculating a plurality of elements at a time may be applied to the generation of mathematical formulas and the calculation of elements related to the elements of the map Φ instead of sequentially calculating each line.

1 導出装置
10 制御部
11 記録部
11a 導出プログラム
12 記憶部
13 入力部
14 出力部
15 取得部
DESCRIPTION OF SYMBOLS 1 Derivation apparatus 10 Control part 11 Recording part 11a Derivation program 12 Storage part 13 Input part 14 Output part 15 Acquisition part

Claims (7)

経時的に変化する事象に関するn次元(nは2以上の整数)の項目それぞれについて時系列で観測して得られたm点(mは2以上の整数)の観測データに基づいて、前記観測データに含まれていない時点のデータを導出データとして導出する導出装置であって、
n次元の項目それぞれについてのm点の観測データを取得する取得部と、
導出する項目の指定を受け付ける項目受付手段と、
前記取得部が取得した観測データを要素とし、項目が行方向に並び、時系列が列方向に並ぶように配置したn行×m列の始域行列を記録する記録部と、
指定された項目の観測データ及び導出データを要素とし、i行目(iは自然数)にm+1−i点の観測データ及びi−1点の導出データを時系列順に配置したL行×m列(Lは2以上の整数)の終域行列を、前記始域行列からの写像とする変換マップを導出する手段と、
導出した変換マップにより、前記記録部に記録した始域行列からの写像として前記終域行列を導出する手段と、
導出した終域行列に含まれる導出データを出力する出力部と
を備えることを特徴とする導出装置。
Based on the observation data of m points (m is an integer of 2 or more) obtained by observing each of n-dimensional items (n is an integer of 2 or more) in time series regarding events that change over time, the observation data A derivation device for deriving data at a time not included in
an acquisition unit for acquiring observation data of m points for each of n-dimensional items;
Item accepting means for accepting designation of an item to be derived;
A recording unit that records observation data acquired by the acquisition unit as an element, records an n-row × m-column start matrix arranged such that items are arranged in a row direction and a time series is arranged in a column direction;
L rows × m columns (with m + 1-i point observation data and i−1 point derivation data arranged in chronological order in the i-th row (i is a natural number) with the observation data and derivation data of the specified item as elements. Means for deriving a transformation map in which L is an integer of 2 or more) and a mapping from the start matrix;
Means for deriving the end-region matrix as a mapping from the start-region matrix recorded in the recording unit by the derived transformation map;
An derivation device comprising: an output unit that outputs derivation data included in the derived end-region matrix.
経時的に変化する事象に関するn次元(nは2以上の整数)の項目それぞれについて時系列に観測して得られたm点(mは2以上の整数)の観測データに基づいて、前記観測データに含まれていない時点のデータを導出データとして導出する導出装置であって、
n次元の項目それぞれについてのm点の観測データを取得する取得部と、
導出する項目の指定を受け付ける項目受付手段と、
n個の係数及び観測データ並びに指定された項目についてのm+1−i点の観測データ(i=1,2,... ,L)及びi−1点の導出データに係る変数にて構成されるm+1−i個の数式を生成する数式生成手段と、
生成した数式に基づいて、導出データを導出する導出手段と、
導出した導出データを出力する出力部と
を備えることを特徴とする導出装置。
Based on observation data of m points (m is an integer of 2 or more) obtained by observing each of n-dimensional items (n is an integer of 2 or more) in time series regarding events that change over time, the observation data A derivation device for deriving data at a time not included in
an acquisition unit for acquiring observation data of m points for each of n-dimensional items;
Item accepting means for accepting designation of an item to be derived;
Consists of n coefficients and observation data, and m + 1-i point observation data (i = 1, 2,..., L) for the specified item and i-1 point derived data. formula generating means for generating m + 1-i formulas;
Derivation means for deriving derived data based on the generated mathematical formula;
An derivation device comprising: an output unit that outputs the derived data.
請求項2に記載の導出装置であって、
前記数式生成手段は、n個の係数及びn項目の観測データの積、並びに指定された項目の観測データ及び導出データに係る変数にて構成される線形性を有する数式をi個生成し、
前記導出手段は、前記数式生成手段が生成した数式にて求められるn個の係数の値を用いて、前記変数に係る導出データを導出する
ことを特徴とする導出装置。
The derivation device according to claim 2, wherein
The mathematical expression generating means generates i mathematical expressions having linearity composed of a product of n coefficients and observation data of n items, and variables relating to observation data and derived data of designated items,
The derivation device, wherein the derivation unit derives the derivation data related to the variable using the values of n coefficients obtained from the mathematical formula generated by the mathematical formula generation unit.
請求項2に記載の導出装置であって、
非線形関数の指定及び指定された非線形関数の展開次数を受け付ける関数指定部と、
前記数式生成手段は、前記関数指定部により指定された非線形関数及び展開次数に基づいて、i個の数式として、それぞれ観測データ及び導出データを変数とするn個の非線形関数を生成することを特徴とする導出装置。
The derivation device according to claim 2, wherein
A function specification unit that receives the specification of the nonlinear function and the expansion order of the specified nonlinear function;
The mathematical expression generating means generates n nonlinear functions using the observation data and the derived data as variables, respectively, as i mathematical expressions based on the nonlinear function and the expansion order specified by the function specifying unit. A derivation device.
請求項1乃至請求項4のいずれか1項に記載の導出装置であって、
前記導出データは、m番目の観測データより後のL−1点分のデータ、又は1番目の観測データより前のL−1点分のデータであることを特徴とする導出装置。
The derivation device according to any one of claims 1 to 4, wherein
The derivation device, wherein the derivation data is data for L-1 points after the m-th observation data or data for L-1 points before the first observation data.
経時的に変化する事象に関するn次元(nは2以上の整数)の項目それぞれについて時系列に観測して得られたm点(mは2以上の整数)の観測データに基づいて、前記観測データに含まれていない時点のデータを導出データとして導出する導出装置を用いた導出方法であって、
前記導出装置は、
n次元の項目それぞれについてのm点の観測データを取得するステップと、
導出する項目を決定するステップと、
n個の係数及び観測データ並びに指定された項目についてのm+1−L点の観測データ(L=1,2,... ,i)及びL−1点の導出データに係る変数にて構成されるi個の数式を生成するステップと、
生成した数式に基づいて、導出データを導出するステップと
を実行することを特徴とする導出方法。
Based on observation data of m points (m is an integer of 2 or more) obtained by observing each of n-dimensional items (n is an integer of 2 or more) in time series regarding events that change over time, the observation data A derivation method using a derivation device for deriving data at a time not included in the derivation data,
The derivation device includes:
obtaining observation data at m points for each of the n-dimensional items;
Determining the item to derive;
n coefficients and observation data, and m + 1-L point observation data (L = 1, 2,..., i) for the specified item and L-1 point derived data variables. generating i mathematical expressions;
And a step of deriving derived data based on the generated mathematical formula.
コンピュータに、経時的に変化する事象に関するn次元(nは2以上の整数)の項目それぞれについて時系列に観測して得られたm点(mは2以上の整数)の観測データに基づいて、前記観測データに含まれていない時点のデータを導出データとして導出させる導出プログラムであって、
コンピュータに、
n次元の項目それぞれについてのm点の観測データを取得するステップと、
導出する項目を決定するステップと、
n個の係数及び観測データ並びに指定された項目についてのm+1−L点の観測データ(L=1,2,... ,i)及びL−1点の導出データに係る変数にて構成されるi個の数式を生成するステップと、
生成した数式に基づいて、導出データを導出するステップと
を実行させることを特徴とする導出プログラム。
Based on observation data of m points (m is an integer of 2 or more) obtained by observing the computer in time series for each item of n dimensions (n is an integer of 2 or more) related to events that change over time, A derivation program for deriving data at a time point not included in the observation data as derived data,
On the computer,
obtaining observation data at m points for each of the n-dimensional items;
Determining the item to derive;
n coefficients and observation data, and m + 1-L point observation data (L = 1, 2,..., i) for the specified item and L-1 point derived data variables. generating i mathematical expressions;
And a step of deriving derived data based on the generated mathematical formula.
JP2013088839A 2013-04-19 2013-04-19 Derivation device, derivation method and derivation program Pending JP2014211827A (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2013088839A JP2014211827A (en) 2013-04-19 2013-04-19 Derivation device, derivation method and derivation program
PCT/JP2014/061092 WO2014171544A1 (en) 2013-04-19 2014-04-18 Time series estimate derivation device, derivation method and derivation program.

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013088839A JP2014211827A (en) 2013-04-19 2013-04-19 Derivation device, derivation method and derivation program

Publications (1)

Publication Number Publication Date
JP2014211827A true JP2014211827A (en) 2014-11-13

Family

ID=51731478

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013088839A Pending JP2014211827A (en) 2013-04-19 2013-04-19 Derivation device, derivation method and derivation program

Country Status (2)

Country Link
JP (1) JP2014211827A (en)
WO (1) WO2014171544A1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020085494A (en) * 2018-11-16 2020-06-04 ヤフー株式会社 Information processor, information processing method, and information processing program
JP2022548719A (en) * 2019-09-17 2022-11-21 中国科学院分子細胞科学卓越創新中心 Anticipatory learning method and system for short-term time series forecasting

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7021732B2 (en) * 2018-03-09 2022-02-17 国立大学法人 東京大学 Time series forecasting device, time series forecasting method and program

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05120297A (en) * 1991-10-29 1993-05-18 Hitachi Ltd Index port folio constructing method
JPH0793288A (en) * 1993-04-20 1995-04-07 Kawasaki Steel Corp Method and device for processing signal

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020085494A (en) * 2018-11-16 2020-06-04 ヤフー株式会社 Information processor, information processing method, and information processing program
JP7036704B2 (en) 2018-11-16 2022-03-15 ヤフー株式会社 Information processing equipment, information processing methods, and information processing programs
JP2022548719A (en) * 2019-09-17 2022-11-21 中国科学院分子細胞科学卓越創新中心 Anticipatory learning method and system for short-term time series forecasting
JP7398761B2 (en) 2019-09-17 2023-12-15 中国科学院分子細胞科学卓越創新中心 Anticipatory learning method and system for short-term time series forecasting

Also Published As

Publication number Publication date
WO2014171544A1 (en) 2014-10-23

Similar Documents

Publication Publication Date Title
Nychka et al. A multiresolution Gaussian process model for the analysis of large spatial datasets
Guhaniyogi et al. Meta-kriging: Scalable Bayesian modeling and inference for massive spatial datasets
Mills Efficient statistical classification of satellite measurements
Stewart et al. Data assimilation with correlated observation errors: experiments with a 1-D shallow water model
Li et al. A three-dimensional variational data assimilation scheme for the regional ocean modeling system
Parker Whose probabilities? Predicting climate change with ensembles of models
Tandeo et al. Combining analog method and ensemble data assimilation: application to the Lorenz-63 chaotic system
CN104933745B (en) The relevance imaging method of raising image resolution ratio based on fractal interpolation
McDermott et al. A model‐based approach for analog spatio‐temporal dynamic forecasting
Solonen et al. Simulation-based optimal design using a response variance criterion
WO2014171544A1 (en) Time series estimate derivation device, derivation method and derivation program.
Isensee et al. Predicting spatio-temporal time series using dimension reduced local states
Feng et al. Comparison of nonlinear local Lyapunov vectors and bred vectors in estimating the spatial distribution of error growth
Lee et al. PICAR: An efficient extendable approach for fitting hierarchical spatial models
Mojiri et al. Comparison of predictions by kriging and spatial autoregressive models
Nath et al. Forecasting tropical cyclones with cascaded diffusion models
Michel Estimating deformations of random processes for correlation modelling in a limited area model
Malamos et al. Bilinear surface smoothing for spatial interpolation with optional incorporation of an explanatory variable. Part 2: Application to synthesized and rainfall data
Chen et al. Integration of D-InSAR technology and PSO-SVR algorithm for time series monitoring and dynamic prediction of coal mining subsidence
Wang et al. Edge-directed interpolation-based sub-pixel mapping
Xiao et al. A fast and accurate approach to the extraction of leaf midribs from point clouds
Gires et al. Blunt extension of discrete universal multifractal cascades: development and application to downscaling
Aminghafari et al. Nonstationary time series forecasting using wavelets and kernel smoothing
Amboni et al. The effect of species geographical distribution estimation methods on richness and phylogenetic diversity estimates
Muyskens et al. Partition-based nonstationary covariance estimation using the stochastic score approximation