JP6694124B1 - 時系列データの前処理プログラム及び前処理方法 - Google Patents

時系列データの前処理プログラム及び前処理方法 Download PDF

Info

Publication number
JP6694124B1
JP6694124B1 JP2020000020A JP2020000020A JP6694124B1 JP 6694124 B1 JP6694124 B1 JP 6694124B1 JP 2020000020 A JP2020000020 A JP 2020000020A JP 2020000020 A JP2020000020 A JP 2020000020A JP 6694124 B1 JP6694124 B1 JP 6694124B1
Authority
JP
Japan
Prior art keywords
series data
time
value
processing
noise removal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2020000020A
Other languages
English (en)
Other versions
JP2021018791A (ja
Inventor
調 荻野
調 荻野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Application granted granted Critical
Publication of JP6694124B1 publication Critical patent/JP6694124B1/ja
Publication of JP2021018791A publication Critical patent/JP2021018791A/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Complex Calculations (AREA)

Abstract

【課題】時系列データの平準化によらずにノイズを除去し、トレンドの滅殺を少なくする時系列データの前処理プログラム及び前処理方法を提供すること。【解決手段】過去の時刻tiにおける対象値がf(ti)(i=1,2,...)で表現される時系列データについて、f(ti)の値をg(ti)に変更し、将来値の予測をg(ti)の値に基づいて行うものとし、平均μ及び標準偏差σを計算し、μ−pσ≦f(ti)≦μ+pσである場合にg(ti)=μとするランダムノイズ除去処理2と、f(ti)≧μ+qσである場合にg(ti)=μ+qσとしf(ti)≦μ—qσである場合にg(ti)=μ—qσとするインパクトノイズ除去処理3とを含む時系列データの前処理プログラム、及びそれと同等の時系列データの前処理方法を提供する。【選択図】図1

Description

本発明は、過去の対象値の時系列データを用いて将来の予測値を求めるに先立ち、該時系列データのノイズを除去する時系列データの前処理プログラム及び前処理方法に関する。
株価、店舗の売上げ、その他の値(全てを包括して「対象値」と言う。)について、多くの過去の値(時系列データ)を利用して将来の値を予測することが行われている。ここで、時系列データには、将来の値を予測するためのトレンドが含まれているので、そのトレンドを抽出するような数学的手法(例えば、回帰分析、予測式のパラメータの最小2乗最適化)が用いられている。
ここで、時系列データにはトレンドとは無関係のノイズも含まれている。ノイズは、数学的手法の用いる数式を介して予測値の精度を低下させる。そこで、時系列データを事前処理してノイズを除去することが行われていた。例えば、特許文献1には、平方根変換処理、移動平均処理、階差変換処理等により非定常性を軽減させることが開示されている。
しかし、平方根変換処理、移動平均処理、階差変換処理等によって時系列データを平準化すると、ノイズのみならず、トレンドも滅殺されて(完全には除去されないが小さくなって)しまう。
特開平06−337852号公報
本発明は、時系列データの平準化によらずにノイズを除去し、トレンドの滅殺を少なくする時系列データの前処理プログラム及び前処理方法を提供することを課題とする。
課題を解決するには、いかなるノイズが存在するかの理解が必須である。対象値を特定しないので、ノイズを厳密に分析できるものではないが、株価及び店舗の売上においては、以下の2種類のノイズが主と考えられる。
偶発的な事象によって対象値を上下させるノイズ(ランダムノイズ):特定銘柄の株価であれば、当該銘柄(企業)の業績と関係なく市場動向として上昇傾向/下降傾向等が現れる。対象値のかかる変動は、将来の値の予測精度を低下させてしまう。
極めてまれな突発的な事象によって対象値を大きくノイズ(インパクトノイズ):特定銘柄の株価であれば、海外の戦争勃発等によって、急激な上昇/下降が現れる。対象値のかかる変動は、将来の値にも影響し得るが、大きく評価して予測すると、精度を低下させてしまう。
そこで、本発明は、時系列データの平準化によらずにランダムノイズ及びインパクトノイズを除去することを目的とする。
本発明の時系列データの前処理用コンピュータプログラムは、
過去の時刻tにおける対象値がf(t)(i=1,2,...)で表現される時系列データに基づいて将来の時刻Tにおける対象値f(T)を予測するために、f(t)の値をg(t)に変更する時系列データの前処理用コンピュータプログラムであって、
複数のf(t)の値の平均μ及び標準偏差σを計算する(f(t)の値にウエイトをつけて計算するものを含む)事前計算処理と、
μ−pσ≦f(t)≦μ+pσである場合にg(t)=μとするランダムノイズ除去処理を含み、
p≦3であり、
コンピュータに前記事前計算処理及び前記ランダムノイズ除去処理を実行させるためのものである。
これによれば、平均に対してpσ以下の変動をランダムノイズとして除去することができる。ここで、pの値は設計値として定めてよい。通常はp≒1と考えられるが、対称値に依存してp≦3の範囲での設計を認める。
本発明の時系列データの前処理用コンピュータプログラムは、
f(t)≧μ+qσである場合にg(t)=μ+qσとし、f(t)≦μ―qσである場合にg(t)=μ―qσとするインパクトノイズ除去処理を含み、
q≧1、かつ、q>pであり、
コンピュータに前記事前計算処理、前記ランダムノイズ除去処理及び前記インパクトノイズ除去処理を実行させるためのものである。
これによれば、平均に対してqσ以上の変動をインパクトノイズとして除去することができる。ここで、qの値は設計値として定めてよい。通常はq>3と考えられるが、対称値に依存してq≧1の範囲での設計を認める。また、q≦pであると、全ての対象値がランダムノイズ又はインパクトノイズの少なくとも一方を有することとなってしまうので、q>pとする。
本発明の時系列データの前処理用コンピュータプログラムは、
前記f(t)の値として、現実の値に季節調整が行われた値を用いることを特徴とする。
この特徴によれば、季節調整が行われた後の値に対してノイズの除去を行うことができる。ここで「季節調整」は、対象値に周期的な変動がある場合にその変動を除去する操作を言い、ビールは夏に売れるというように1年を周期とするものに限定されない。周期的な変動も予測に影響するので、その影響をなくすものである。
本発明の時系列データの前処理方法は、
本発明の時系列データの前処理用コンピュータプログラムを用いて、
過去の時刻tにおける対象値がf(t)(i=1,2,...)で表現される時系列データに基づいて将来の時刻Tにおける対象値f(T)を予測するために、f(t)の値をg(t)に変更することを特徴とする。
この特徴によれば、本発明の時系列データの前処理プログラムを活用した時系列データの前処理方法が提供される。
本発明によれば、時系列データの平準化によらずにノイズを除去し、トレンドの滅殺を少なくする時系列データの前処理プログラム及び前処理方法を提供することが可能となる。将来値の予測精度が向上する。
図1は、時系列データの前処理プログラムのフローチャートである。
以下、本発明の実施形態について図面を参照して詳細に説明する。
図1は、時系列データの前処理プログラムのフローチャートである。時系列データの前処理プログラムは、事前計算処理1、ランダムノイズ除去処理2及びインパクトノイズ除去処理3を備えている。
時系列データの前処理プログラムは、事前計算処理1、ランダムノイズ除去処理2及びインパクトノイズ除去処理3を含む各処理を、コンピュータに実行させるためのプログラムである。コンピュータは、CPUを用いて実行することができる。
時系列データの前処理プログラムは、時系列データf(t)を入力し、事前計算処理1、ランダムノイズ除去処理2及びインパクトノイズ除去処理3(前処理)を施した時系列データg(t)を出力する。
事前計算処理1は、時系列データの平均μ及び標準偏差σを計算する。平均μ及び標準偏差σは、
として、通常は定義される。事前計算処理1は、このとおりに平均μ及び標準偏差σを計算することができる。ここでtは、i番目のデータの取得時点であり、f(t)はi番目のデータの値である。
ここで、平均μ及び標準偏差σの計算において、時系列データにデータ毎のウエイトwを設けてもよい。I番目のデータのウエイトをwとし、
との計算を行うことが考えられる。wをiに依存しない固定値とすると、数3、4は、数1、2と同一である。
ウエイトは、各種の事情で設けることが考えられるが、将来値の予測に合わせることが好ましい。例えば、株価の予測で直近1年の対象値に基づいて予測するならば、tが現時点より1年以上前ならばw=0、1年未満前ならばw=1とする。また、現時点とtと差が大きいとwが小さくなるように例えばwをtの指数関数としてもよい。その他、各種のウエイトが可能である。
ランダムノイズ除去ステップ2は、μ−pσ≦f(t)≦μ+pσである場合にg(t)=μとする。すなわち、μとの差がpσ以下であるデータについては、大きな変動をもたらさないランダムノイズとして、全てをμとする。
ここで、pの値は設計事項として定めるが、大きな変動をもたらさないものであるので、p≦1とすることが一般的である。しかし、対象値の性質に対応してより大きなpとしてもよい。ただし、p>3とすることは、ほとんどのデータをランダムノイズとしてしまうので、好ましくない。
インパクトノイズ除去処理3は、f(t)≧μ+qσである場合にg(t)=μ+qσとし、f(t)≦μ―qσである場合にg(t)=μ―qσとする。すなわち、μからqσ以上離間したデータは、突発的な事象に基づくインパクトノイズであるとして、μとの差をqσに縮小する。
ここで、qの値は設計事項として定めるが、突発的な事象に基づく大きな変動のものであるので、q≧3とすることが一般的である。しかし、対象値の性質に対応してより小さなqとしてもよい。ただし、q<1とすることは、多くのデータをインパクトノイズとしてしまうので、好ましくない。また、ランダムノイズとインパクトノイズとは別種のものであるので、q>pとして峻別する。
ランダムノイズ除去処理2及びインパクトノイズ除去処理3は、いずれも、各々のデータの値のみに基づいて処理をしており、平準化を行っていない。このため、トレンドの滅殺が平準化を行う場合よりも減少する。
出願人は、p=1、q=4として、株価予測を行った。将来値の予測は、自己回帰和分移動平均等の標準的なものとした。株価の予測精度は、p=1、q=4として前処理を行ったものが、前処理を行わないものよりも、高精度であった。
ここまで、対象値f(t)は、測定された値をそのまま用いるものとしたが、測定された値に季節調整を行い、季節調整後の値をf(t)とすることもできる。上述のとおり、周期的な変動を調整するものであれば、「季節」の語から連想される1年周期のものでなくても「季節調整」とする。
季節調整後の値をf(t)とすることで、季節変動が将来値の予測に与える誤差をなくすことができる。この場合、季節調整→予測→季節逆調整の手順として、予測値を求める。
以上、時系列データの前処理用コンピュータプログラムについて説明した。
この時系列データの前処理用コンピュータプログラムを用いることで、時系列データの前処理方法が合わせて提供される。
時系列データの平準化によらずにノイズを除去しトレンドの滅殺を少なくする時系列データの前処理プログラム及び前処理方法であり、将来値の予測精度が向上する。多くの将来値予測者(例えば株式取引のコンサルタント、企業経営のコンサルタント)による利用が考えられる。
1 事前計算処理
2 ランダムノイズ除去処理
3 インパクトノイズ除去処理

Claims (4)

  1. 過去の時刻tにおける対象値がf(t)(i=1,2,...)で表現される時系列データに基づいて将来の時刻Tにおける対象値f(T)を予測するために、f(t)の値をg(t)に変更する時系列データの前処理用コンピュータプログラムであって、
    複数のf(t)の値の平均μ及び標準偏差σを計算する(f(t)の値にウエイトをつけて計算するものを含む)事前計算処理と、
    μ−pσ≦f(t)≦μ+pσである場合にg(t)=μとするランダムノイズ除去処理を含み、
    p≦3であり、
    コンピュータに前記事前計算処理及び前記ランダムノイズ除去処理を実行させるための、時系列データの前処理用コンピュータプログラム。
  2. f(t)≧μ+qσである場合にg(t)=μ+qσとし、f(t)≦μ―qσである場合にg(t)=μ―qσとするインパクトノイズ除去処理を含み、
    q≧1、かつ、q>pであり、
    コンピュータに前記事前計算処理、前記ランダムノイズ除去処理及び前記インパクトノイズ除去処理を実行させるための、請求項1に記載の時系列データの前処理用コンピュータプログラム。
  3. 前記f(t)の値として、現実の値に季節調整が行われた値を用いることを特徴とする、請求項1又は2に記載の時系列データの前処理用コンピュータプログラム。
  4. 請求項1〜3のいずれか1項に記載の時系列データの前処理用コンピュータプログラムを用いて、
    過去の時刻tにおける対象値がf(t)(i=1,2,...)で表現される時系列データに基づいて将来の時刻Tにおける対象値f(T)を予測するために、f(t)の値をg(t)に変更することを特徴とする、時系列データの前処理方法。
JP2020000020A 2019-07-22 2020-01-03 時系列データの前処理プログラム及び前処理方法 Expired - Fee Related JP6694124B1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019134640 2019-07-22
JP2019134640 2019-07-22

Publications (2)

Publication Number Publication Date
JP6694124B1 true JP6694124B1 (ja) 2020-05-13
JP2021018791A JP2021018791A (ja) 2021-02-15

Family

ID=70549843

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020000020A Expired - Fee Related JP6694124B1 (ja) 2019-07-22 2020-01-03 時系列データの前処理プログラム及び前処理方法

Country Status (1)

Country Link
JP (1) JP6694124B1 (ja)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5176206B2 (ja) * 2007-08-24 2013-04-03 新日鉄住金エンジニアリング株式会社 プロセスの状態類似事例検索方法及びプロセスの制御方法
JP6189191B2 (ja) * 2013-11-21 2017-08-30 Dmg森精機株式会社 表面形状測定装置および工作機械
JP6302045B2 (ja) * 2014-03-07 2018-03-28 フィールズ株式会社 動画処理方法、動画処理装置、及び動画処理プログラム
JP5935850B2 (ja) * 2014-09-19 2016-06-15 日新電機株式会社 部分放電診断装置
WO2018061842A1 (ja) * 2016-09-27 2018-04-05 東京エレクトロン株式会社 異常検知プログラム、異常検知方法および異常検知装置
JP6870993B2 (ja) * 2017-01-20 2021-05-12 キヤノンメディカルシステムズ株式会社 画像処理装置及びx線診断装置

Also Published As

Publication number Publication date
JP2021018791A (ja) 2021-02-15

Similar Documents

Publication Publication Date Title
Kolassa Combining exponential smoothing forecasts using Akaike weights
US11694124B2 (en) Artificial intelligence (AI) based predictions and recommendations for equipment
US20210174144A1 (en) Method and apparatus for obtaining training sample of first model based on second model
US20190114711A1 (en) Financial analysis system and method for unstructured text data
CN113312578B (zh) 一种数据指标的波动归因方法、装置、设备、及介质
JP2016099915A (ja) 与信審査用サーバと与信審査用システム及び与信審査用プログラム
Karaalp-Orhan Labour productivity, real wages and unemployment: An application of bounds test approach for Turkey
CN116307215A (zh) 一种电力系统的负荷预测方法、装置、设备及存储介质
Giannetti A framework for improving process robustness with quantification of uncertainties in Industry 4.0
JP6694124B1 (ja) 時系列データの前処理プログラム及び前処理方法
JP4299508B2 (ja) 製造プロセスにおける操業と品質の関連分析装置、関連分析方法及びコンピュータ読み取り可能な記憶媒体
US20160035026A1 (en) Online trading systems and methods
CN112308293A (zh) 违约概率预测方法及装置
JP2006350883A (ja) 知識データベースを利用した需要予測値自動判定システムおよびそれに用いられる需要予測値自動判定プログラム並びにそのプログラムが記録された記録媒体
CN116340777A (zh) 一种日志分类模型的训练方法、日志分类方法及装置
Ling et al. Maximum profit mining and its application in software development
JP7298286B2 (ja) モデル提供プログラム、モデル提供方法及びモデル提供装置
JP5826348B1 (ja) 予測装置、予測方法及びコンピュータプログラム
CN113743532B (zh) 异常检测方法、装置、设备及计算机存储介质
CN109409720B (zh) 基于大数据和深度学习的个性化审计方法和机器人系统
JP5826893B1 (ja) 変化点予測装置、変化点予測方法、及びコンピュータプログラム
Shang et al. Chance Constrained Model Predictive Control via Active Uncertainty Set Learning and Calibration
CN115146997A (zh) 基于电力数据的评估方法、装置、电子设备及存储介质
US20240020436A1 (en) Automated data quality monitoring and data governance using statistical models
Proietti et al. Spikes and memory in (Nord Pool) electricity price spot prices

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200108

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20200108

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20200110

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200115

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20200219

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20200217

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200326

R150 Certificate of patent or registration of utility model

Ref document number: 6694124

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees